Биографии Характеристики Анализ

Формула за математическа дисперсия. Дисперсия на дискретна случайна променлива

Нека изчислим вГОСПОЖИЦАEXCELдисперсия и стандартно отклонение на извадката. Ние също изчисляваме дисперсията на случайна променлива, ако е известно нейното разпределение.

Първо помислете дисперсия, тогава стандартно отклонение.

Дисперсия на извадката

Дисперсия на извадката (дисперсия на извадката,пробадисперсия) характеризира разпространението на стойностите в масива спрямо .

И трите формули са математически еквивалентни.

От първата формула се вижда, че дисперсия на извадкатае сумата от квадратите на отклоненията на всяка стойност в масива от средноразделено на размера на извадката минус 1.

дисперсия пробиизползва се функцията DISP(), бълг. името на VAR, т.е. ВАРИАНЦИЯ. От MS EXCEL 2010 се препоръчва използването на неговия аналог DISP.V() , англ. името ВАРС, т.е. Дисперсия на пробата. Освен това, започвайки от версията на MS EXCEL 2010, има функция DISP.G (), англ. VARP име, т.е. Популация VARIance, която изчислява дисперсияза население. Цялата разлика се свежда до знаменателя: вместо n-1 като DISP.V(), DISP.G() има само n в знаменателя. Преди MS EXCEL 2010 функцията VARP() се използваше за изчисляване на дисперсията на популацията.

Дисперсия на извадката
=КВАДРАТ(Проба)/(БРОЙ(Проба)-1)
=(SUMSQ(Извадка)-БРОЙ(Извадка)*СРЕДНО(Извадка)^2)/ (БРОЙ(Извадка)-1)- обичайната формула
=SUM((Пример -СРЕДНО(Пример))^2)/ (БРОЙ(Пример)-1) –

Дисперсия на извадкатае равно на 0 само ако всички стойности са равни една на друга и съответно са равни средна стойност. Обикновено колкото по-голяма е стойността дисперсия, толкова по-голямо е разпространението на стойностите в масива.

Дисперсия на извадкатае точкова оценка дисперсияразпределение на случайната променлива, от която проба. Относно строителството доверителни интервалипри оценяване дисперсияможе да се прочете в статията.

Дисперсия на случайна променлива

Да изчисля дисперсияслучайна променлива, трябва да я знаете.

За дисперсияслучайната променлива X често използва нотацията Var(X). дисперсияе равно на квадрата на отклонението от средната E(X): Var(X)=E[(X-E(X)) 2 ]

дисперсияизчислено по формулата:

където x i е стойността, която може да приеме случайната променлива, а μ е средната стойност (), p(x) е вероятността случайната променлива да приеме стойността x.

Ако случайната променлива има , тогава дисперсияизчислено по формулата:

Измерение дисперсиясъответства на квадрата на мерната единица на първоначалните стойности. Например, ако стойностите в извадката са измервания на теглото на частта (в kg), тогава размерът на дисперсията ще бъде kg 2 . Това може да бъде трудно за тълкуване, следователно, за характеризиране на разпространението на стойности, стойност, равна на корен квадратен от дисперсиястандартно отклонение.

Някои имоти дисперсия:

Var(X+a)=Var(X), където X е случайна променлива, а a е константа.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Това свойство на дисперсия се използва в статия за линейна регресия.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), където X и Y са случайни променливи, Cov(X;Y) е ковариацията на тези случайни променливи.

Ако случайните променливи са независими, тогава техните ковариацияе 0 и следователно Var(X+Y)=Var(X)+Var(Y). Това свойство на дисперсията се използва в изхода.

Нека покажем, че за независими величини Var(X-Y)=Var(X+Y). Наистина Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Това свойство на дисперсията се използва за начертаване.

Примерно стандартно отклонение

Примерно стандартно отклонениее мярка за това колко широко са разпръснати стойностите в извадката спрямо техните .

По дефиниция, стандартно отклонениее равно на корен квадратен от дисперсия:

Стандартно отклонениене взема предвид големината на стойностите в вземане на проби, а само степента на разпръскване на ценностите около тях средата. Нека вземем пример, за да илюстрираме това.

Нека изчислим стандартното отклонение за 2 проби: (1; 5; 9) и (1001; 1005; 1009). И в двата случая s=4. Очевидно е, че съотношението на стандартното отклонение към стойностите на масива е значително различно за пробите. За такива случаи използвайте Коефициентът на вариация(Coefficient of Variation, CV) - отношение стандартно отклонениедо средното аритметика, изразено като процент.

В MS EXCEL 2007 и по-стари версии за изчисление Примерно стандартно отклонениеизползва се функцията =STDEV(), бълг. името STDEV, т.е. стандартно отклонение. От MS EXCEL 2010 се препоръчва използването на неговия аналог = STDEV.B () , англ. име STDEV.S, т.е. Примерно стандартно отклонение.

Освен това, започвайки от версията на MS EXCEL 2010, има функция STDEV.G () , англ. име STDEV.P, т.е. Популация Стандартно отклонение, което изчислява стандартно отклонениеза население. Цялата разлика се свежда до знаменателя: вместо n-1 като STDEV.V(), STDEV.G() има само n в знаменателя.

Стандартно отклонениеможе също да се изчисли директно от формулите по-долу (вижте примерния файл)
=SQRT(SQUADROTIV(Проба)/(БРОЙ(Проба)-1))
=SQRT((SUMSQ(Проба)-БРОЙ(Проба)*СРЕДНО(Проба)^2)/(БРОЙ(Проба)-1))

Други мерки за дисперсия

Функцията SQUADRIVE() изчислява с umm на квадратни отклонения на стойностите от техните средата. Тази функция ще върне същия резултат като формулата =VAR.G( проба)*ПРОВЕРКА( проба) , където проба- препратка към диапазон, съдържащ масив от примерни стойности (). Изчисленията във функцията QUADROTIV() се правят по формулата:

Функцията SROOT() също е мярка за разсейването на набор от данни. Функцията SIROTL() изчислява средната стойност на абсолютните стойности на отклоненията на стойностите от средата. Тази функция ще върне същия резултат като формулата =SUMPRODUCT(ABS(Пример-СРЕДЕН(Пример)))/БРОЙ(Пример), където проба- препратка към диапазон, съдържащ масив от примерни стойности.

Изчисленията във функцията SROOTKL () се правят по формулата:

Диапазон на вариация (или диапазон на вариация) -е разликата между максималните и минималните стойности на функцията:

В нашия пример диапазонът на изменение на сменната продукция на работниците е: в първа бригада R=105-95=10 деца, във втора бригада R=125-75=50 деца. (5 пъти повече). Това предполага, че продукцията на 1-ва бригада е по-„стабилна“, но втората бригада има повече резерви за растеж на продукцията, т.к. ако всички работници достигнат максималната производителност за тази бригада, тя може да произведе 3 * 125 = 375 части, а в 1-ва бригада само 105 * 3 = 315 части.
Ако екстремните стойности на атрибута не са типични за популацията, тогава се използват квартилни или децилни диапазони. Квартилният диапазон RQ= Q3-Q1 обхваща 50% от населението, първият децилен диапазон RD1 = D9-D1 покрива 80% от данните, вторият децилен диапазон RD2= D8-D2 покрива 60%.
Недостатъкът на индикатора за диапазон на вариация е, че неговата стойност не отразява всички колебания на признака.
Най-простият обобщаващ показател, който отразява всички колебания на даден признак, е средно линейно отклонение, което е средноаритметичното на абсолютните отклонения на отделните опции от средната им стойност:

,
за групирани данни
,
където хi е стойността на атрибута в дискретна серия или средата на интервала в интервалното разпределение.
В горните формули разликите в числителя се вземат по модул, в противен случай, според свойството на средната аритметична стойност, числителят винаги ще бъде равен на нула. Следователно средното линейно отклонение рядко се използва в статистическата практика, само в случаите, когато сумирането на показателите без отчитане на знака има икономически смисъл. С негова помощ се анализират например съставът на служителите, рентабилността на производството, външнотърговският оборот.
Дисперсия на характеристикитее средният квадрат на отклоненията на варианта от средната им стойност:
проста вариация
,
претеглена дисперсия
.
Формулата за изчисляване на дисперсията може да бъде опростена:

По този начин дисперсията е равна на разликата между средната стойност на квадратите на варианта и квадрата на средната стойност на варианта на съвкупността:
.
Въпреки това, поради сумирането на квадратните отклонения, дисперсията дава изкривена представа за отклоненията, така че средната стойност се изчислява от нея. стандартно отклонение, което показва колко средно се отклоняват конкретните варианти на признака от средната им стойност. Изчислено чрез вземане на корен квадратен от дисперсията:
за негрупирани данни
,
за вариационната серия

Колкото по-малка е стойността на дисперсията и стандартното отклонение, толкова по-хомогенна е съвкупността, толкова по-надеждна (типична) ще бъде средната стойност.
Средното линейно и средно квадратично отклонение са наименувани числа, т.е. изразени са в мерни единици на характеристиката, еднакви са по съдържание и близки по стойност.
Препоръчително е да се изчислят абсолютните показатели за вариация с помощта на таблици.
Таблица 3 - Изчисляване на характеристиките на вариацията (на примера на периода на данните за смяната на продукцията на работните екипи)


Брой работници

Средата на интервала

Прогнозни стойности

Обща сума:

Средна производителност на смени на работниците:

Средно линейно отклонение:

Изходна дисперсия:

Стандартното отклонение на продукцията на отделните работници от средната продукция:
.

1 Изчисляване на дисперсията по метода на моментите

Изчисляването на отклоненията е свързано с тромави изчисления (особено ако средната стойност е изразена като голямо число с няколко знака след десетичната запетая). Изчисленията могат да бъдат опростени чрез използване на опростена формула и дисперсионни свойства.
Дисперсията има следните свойства:

  1. ако всички стойности на атрибута са намалени или увеличени с една и съща стойност A, тогава дисперсията няма да намалее от това:

,

, тогава или
Използвайки свойствата на дисперсията и първо намалявайки всички варианти на съвкупността със стойността A и след това разделяйки на стойността на интервала h, получаваме формула за изчисляване на дисперсията във вариационни серии с равни интервали начин на моменти:
,
където е дисперсията, изчислена по метода на моментите;
h е стойността на интервала на вариационната серия;
– нови (трансформирани) вариантни стойности;
A е постоянна стойност, която се използва като среда на интервала с най-висока честота; или вариантът с най-висока честота;
е квадратът на момента от първи ред;
е момент от втори ред.
Нека изчислим дисперсията по метода на моментите въз основа на данните за сменната продукция на работния екип.
Таблица 4 - Изчисляване на дисперсията по метода на моментите


Групи производствени работници, бр.

Брой работници

Средата на интервала

Прогнозни стойности

Процедура за изчисление:


  1. изчислете дисперсията:

2 Изчисляване на дисперсията на алтернативен признак

Сред знаците, изследвани от статистиката, има такива, които имат само две взаимно изключващи се значения. Това са алтернативни знаци. Дадени са им две количествени стойности, съответно: опции 1 и 0. Честотата на опции 1, която е означена с p, е делът на единиците, които имат тази характеристика. Разликата 1-p=q е честотата на опциите 0. Така,


xi

Средно аритметично на алтернативен признак
, тъй като p+q=1.

Дисперсия на характеристиките
, защото 1-p=q
По този начин дисперсията на алтернативен атрибут е равна на произведението от дела на единиците, които имат този атрибут, и дела на единиците, които нямат този атрибут.
Ако стойностите 1 и 0 са еднакво често срещани, т.е. p=q, дисперсията достига своя максимум pq=0,25.
Вариантната променлива се използва в извадкови проучвания, например качество на продукта.

3 Междугрупова дисперсия. Правило за добавяне на дисперсии

Дисперсията, за разлика от други характеристики на вариацията, е добавъчна величина. Тоест в съвкупността, която е разделена на групи според факторния критерий х , резултатна дисперсия гможе да се разложи на дисперсия във всяка група (вътре в групата) и дисперсия между групите (между групата). Тогава, наред с изследването на вариацията на признака в цялата популация като цяло, става възможно да се изследва вариацията във всяка група, както и между тези групи.

Обща дисперсияизмерва вариацията на черта привърху цялата съвкупност под влиянието на всички фактори, предизвикали тази вариация (отклонения). Тя е равна на средния квадрат на отклоненията на отделните стойности на признака приот общата средна стойност и може да се изчисли като проста или претеглена дисперсия.
Междугрупова дисперсияхарактеризира вариацията на ефективния признак при, породени от влиянието на знак-фактора хв основата на групирането. Той характеризира вариацията на груповите средни стойности и е равен на средния квадрат на отклоненията на груповите средни от общата средна стойност:
,
където е средноаритметичната стойност на i-та група;
– брой единици в i-та група (честота на i-та група);
е общата средна стойност на популацията.
Вътрешногрупова дисперсияотразява случайната вариация, т.е. тази част от вариацията, която е причинена от влиянието на неотчетени фактори и не зависи от фактора-атрибут, лежащ в основата на групирането. Характеризира вариацията на индивидуалните стойности спрямо груповите средни стойности, равна е на средния квадрат на отклоненията на индивидуалните стойности на чертата прив рамките на група от средната аритметична стойност на тази група (средна група) и се изчислява като проста или претеглена дисперсия за всяка група:
или ,
където е броят на единиците в групата.
Въз основа на вътрешногруповите дисперсии за всяка група е възможно да се определи общата средна стойност на дисперсиите в рамките на групата:
.
Връзката между трите дисперсии се нарича правила за добавяне на дисперсии, според която общата дисперсия е равна на сумата от междугруповата дисперсия и средната от вътрешногруповите дисперсии:

Пример. При изследване на влиянието на тарифната категория (квалификация) на работниците върху нивото на производителност на труда им бяха получени следните данни.
Таблица 5 - Разпределение на работниците по средночасова продукция.



п/п

Работници 4-та категория

Работници от 5-та категория

Тренирам
работник, бр.

Тренирам
работник, бр.

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

В този пример работниците са разделени на две групи според фактора х- квалификации, които се характеризират с техния ранг. Ефективният признак - производство - варира както под негово влияние (междугрупова вариация), така и поради други случайни фактори (вътрешногрупова вариация). Предизвикателството е да се измерят тези вариации, като се използват три вариации: обща, междугрупова и вътрегрупова. Емпиричният коефициент на детерминация показва съотношението на вариацията на получената характеристика припод влияние на факторен знак х. Останалата част от общата вариация припричинени от промени в други фактори.
В примера емпиричният коефициент на детерминация е:
или 66,7%,
Това означава, че 66,7% от изменението на производителността на труда на работниците се дължи на различията в квалификацията, а 33,3% се дължи на влиянието на други фактори.
Емпирична корелационна връзкапоказва плътността на връзката между групирането и ефективните характеристики. Изчислява се като корен квадратен от емпиричния коефициент на детерминация:

Емпиричното съотношение на корелация, както и , могат да приемат стойности от 0 до 1.
Ако няма връзка, тогава =0. В този случай =0, т.е. груповите средни са равни едно на друго и няма междугрупова вариация. Това означава, че групиращият признак - факторът не влияе върху формирането на общата вариация.
Ако връзката е функционална, тогава =1. В този случай дисперсията на груповите средни стойности е равна на общата дисперсия (), т.е. няма вътрешногрупова вариация. Това означава, че функцията за групиране напълно определя вариацията на получената характеристика, която се изследва.
Колкото стойността на корелационната връзка е по-близка до единица, толкова по-близо, по-близко до функционалната зависимост е връзката между признаците.
За качествена оценка на близостта на връзката между знаците се използват отношенията на Чадок.

В примера , което показва тясна връзка между производителността на работниците и тяхната квалификация.

Наред с изучаването на вариациите на признака в цялата популация като цяло, често е необходимо да се проследят количествените промени в признака в групите, на които е разделена популацията, както и между групите. Това изследване на вариация се постига чрез изчисляване и анализиране на различни видове вариация.
Разграничете общата, междугруповата и вътрешногруповата дисперсия.
Обща дисперсия σ 2измерва вариацията на даден признак в цялата популация под влиянието на всички фактори, които са причинили тази вариация, .

Междугруповата вариация (δ) характеризира систематичната вариация, т.е. разлики в величината на изследваната черта, възникващи под влиянието на фактора-белега, лежащ в основата на групирането. Изчислява се по формулата:
.

Дисперсия в рамките на групата (σ)отразява случайна вариация, т.е. част от вариацията, която възниква под въздействието на неотчетени фактори и не зависи от фактора на признака, който е в основата на групирането. Изчислява се по формулата:
.

Средна стойност на дисперсиите в рамките на групата: .

Съществува закон, свързващ 3 вида дисперсия. Общата дисперсия е равна на сумата от средната стойност на вътрешногруповите и междугруповите дисперсии: .
Това съотношение се нарича правило за добавяне на дисперсии.

В анализа широко се използва мярка, която е съотношението на дисперсията между групите в общата дисперсия. Носи името емпиричен коефициент на детерминация (η 2): .
Корен квадратен от емпиричния коефициент на детерминация се нарича емпирично съотношение на корелация (η):
.
Той характеризира влиянието на атрибута, лежащ в основата на групирането, върху вариацията на получения атрибут. Емпиричното съотношение на корелация варира от 0 до 1.
Ще покажем практическото му използване в следния пример (Таблица 1).

Пример #1. Таблица 1 - Производителност на труда на две групи работници от един от цеховете на НПО "Циклон"

Изчислете общите и груповите средни стойности и дисперсии:




Изходните данни за изчисляване на средната стойност на вътрешногруповата и междугруповата дисперсия са представени в табл. 2.
таблица 2
Изчисление и δ 2 за две групи работници.


Работнически групи
Брой работници, души Средно, дет./смяна. дисперсия

Преминал техническо обучение

5 95 42,0

Не е технически обучен

5 81 231,2

Всички работници

10 88 185,6
Нека изчислим резултатите. Средна стойност на вариациите в рамките на групата:
.
Междугрупова дисперсия

Общо отклонение:
По този начин емпиричното съотношение на корелация: .

Наред с изменението на количествените признаци може да се наблюдава и изменение на качествените признаци. Това изследване на вариацията се постига чрез изчисляване на следните видове вариации:

Вътрешногруповата вариация на дела се определя по формулата

където n i– броя на единиците в отделни групи.
Делът на изследвания признак в цялата популация, който се определя по формулата:
Трите вида дисперсии са свързани помежду си, както следва:
.

Това съотношение на дисперсии се нарича теорема за добавяне на дисперсията на дяла на характеристиките.

Теорията на вероятностите е специален клон на математиката, който се изучава само от студенти от висши учебни заведения. Обичате ли изчисления и формули? Не се ли страхувате от перспективите за запознаване с нормалното разпределение, ентропията на ансамбъла, математическото очакване и дисперсията на дискретна случайна променлива? Тогава тази тема ще бъде от голям интерес за вас. Нека се запознаем с някои от най-важните основни понятия на този раздел от науката.

Нека си припомним основите

Дори ако си спомняте най-простите концепции на теорията на вероятностите, не пренебрегвайте първите параграфи на статията. Факт е, че без ясно разбиране на основите, няма да можете да работите с формулите, разгледани по-долу.

И така, има някакво случайно събитие, някакъв експеримент. В резултат на извършените действия можем да получим няколко резултата – някои от тях са по-чести, други по-рядко срещани. Вероятността за събитие е съотношението на броя на действително получените резултати от един вид към общия брой възможни. Само като знаете класическата дефиниция на това понятие, можете да започнете да изучавате математическото очакване и дисперсията на непрекъснати случайни променливи.

Средно аритметично

Още в училище, в часовете по математика, сте започнали да работите със средно аритметично. Тази концепция се използва широко в теорията на вероятностите и следователно не може да бъде пренебрегната. Основното за нас в момента е, че ще го срещнем във формулите за математическото очакване и дисперсията на случайна величина.

Имаме поредица от числа и искаме да намерим средното аритметично. Всичко, което се изисква от нас, е да сумираме всичко налично и да разделим на броя на елементите в редицата. Нека имаме числа от 1 до 9. Сумата на елементите ще бъде 45 и ще разделим тази стойност на 9. Отговор: - 5.

дисперсия

От научна гледна точка дисперсията е средният квадрат на отклоненията на получените стойности на характеристиките от средната аритметична стойност. Единият се обозначава с главна латинска буква D. Какво е необходимо за изчисляването му? За всеки елемент от редицата изчисляваме разликата между наличното число и средното аритметично и го повдигаме на квадрат. Ще има точно толкова стойности, колкото могат да бъдат резултатите за събитието, което обмисляме. След това обобщаваме всичко получено и разделяме на броя на елементите в последователността. Ако имаме пет възможни резултата, тогава разделете на пет.

Дисперсията също има свойства, които трябва да запомните, за да я приложите при решаване на задачи. Например, ако случайната променлива се увеличи с X пъти, дисперсията се увеличава с X пъти квадрата (т.е. X*X). Той никога не е по-малък от нула и не зависи от изместване на стойности с еднаква стойност нагоре или надолу. Освен това, за независими опити, дисперсията на сумата е равна на сумата от дисперсиите.

Сега определено трябва да разгледаме примери за дисперсията на дискретна случайна променлива и математическото очакване.

Да кажем, че провеждаме 21 експеримента и получаваме 7 различни резултата. Наблюдавахме всеки от тях съответно 1,2,2,3,4,4 и 5 пъти. Каква ще бъде дисперсията?

Първо изчисляваме средното аритметично: сборът на елементите, разбира се, е 21. Разделяме го на 7, получавайки 3. Сега изваждаме 3 от всяко число в оригиналната последователност, поставяме на квадрат всяка стойност и събираме резултатите заедно . Оказва се 12. Сега остава да разделим числото на броя на елементите и, изглежда, това е всичко. Но има една уловка! Нека го обсъдим.

Зависимост от броя на експериментите

Оказва се, че при изчисляване на дисперсията знаменателят може да бъде едно от две числа: N или N-1. Тук N е броят на извършените експерименти или броят на елементите в последователността (което по същество е едно и също нещо). От какво зависи?

Ако броят на тестовете се измерва в стотици, тогава в знаменателя трябва да поставим N. Ако в единици, тогава N-1. Учените решиха да начертаят границата съвсем символично: днес тя минава по числото 30. Ако сме провели по-малко от 30 експеримента, тогава ще разделим количеството на N-1, а ако е повече, тогава на N.

Задача

Нека се върнем към нашия пример за решаване на проблема с дисперсията и очакването. Получихме междинно число 12, което трябваше да бъде разделено на N или N-1. Тъй като проведохме 21 експеримента, което е по-малко от 30, ще изберем втория вариант. Така че отговорът е: дисперсията е 12/2 = 2.

Очаквана стойност

Нека да преминем към втората концепция, която трябва да разгледаме в тази статия. Математическото очакване е резултат от събиране на всички възможни резултати, умножени по съответните вероятности. Важно е да се разбере, че получената стойност, както и резултатът от изчисляването на дисперсията, се получават само веднъж за цялата задача, без значение колко резултата разглежда.

Формулата за математическо очакване е доста проста: вземаме резултата, умножаваме го по неговата вероятност, добавяме същото за втория, третия резултат и т.н. Всичко, свързано с тази концепция, е лесно за изчисляване. Например сумата от математическите очаквания е равна на математическото очакване на сумата. Същото важи и за работата. Не всяка величина в теорията на вероятностите позволява извършването на такива прости операции. Нека вземем една задача и изчислим стойността на две понятия, които сме изучавали едновременно. Освен това бяхме разсеяни от теория - време е за практика.

Още един пример

Проведохме 50 опита и получихме 10 вида резултати - числа от 0 до 9 - появяващи се в различни проценти. Това са съответно: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Припомнете си, че за да получите вероятностите, трябва да разделите процентните стойности на 100. Така получаваме 0,02; 0,1 и т.н. Нека представим пример за решаване на задачата за дисперсията на случайна променлива и математическото очакване.

Изчисляваме средното аритметично по формулата, която помним от началното училище: 50/10 = 5.

Сега нека преведем вероятностите в броя на резултатите "на парчета", за да направим по-удобно броенето. Получаваме 1, 5, 2, 7, 1, 9, 3, 8, 5 и 9. От всяка получена стойност изваждаме средноаритметичното, след което всеки от получените резултати повдигаме на квадрат. Вижте как да направите това с първия елемент като пример: 1 - 5 = (-4). Освен това: (-4) * (-4) = 16. За други стойности направете тези операции сами. Ако сте направили всичко правилно, след като добавите всичко, получавате 90.

Нека продължим да изчисляваме дисперсията и средната стойност, като разделим 90 на N. Защо избираме N, а не N-1? Точно така, защото броят на извършените експерименти надхвърля 30. И така: 90/10 = 9. Получихме дисперсията. Ако получите различен номер, не се отчайвайте. Най-вероятно сте направили банална грешка в изчисленията. Проверете отново какво сте написали и със сигурност всичко ще си дойде на мястото.

И накрая, нека си припомним формулата за математическо очакване. Няма да даваме всички изчисления, а само ще напишем отговора, с който можете да проверите, след като изпълните всички необходими процедури. Очакваната стойност ще бъде 5,48. Припомняме само как да извършваме операции, като използваме примера на първите елементи: 0 * 0,02 + 1 * 0,1 ... и така нататък. Както можете да видите, ние просто умножаваме стойността на резултата по неговата вероятност.

отклонение

Друга концепция, тясно свързана с дисперсията и математическото очакване, е стандартното отклонение. Обозначава се или с латинските букви sd, или с гръцката малка буква "сигма". Тази концепция показва как средно стойностите се отклоняват от централната характеристика. За да намерите стойността му, трябва да изчислите корен квадратен от дисперсията.

Ако начертаете нормално разпределение и искате да видите отклонението на квадрат директно върху него, това може да стане на няколко стъпки. Вземете половината от изображението отляво или отдясно на режима (централна стойност), начертайте перпендикуляр на хоризонталната ос, така че площите на получените фигури да са равни. Стойността на сегмента между средата на разпределението и получената проекция върху хоризонталната ос ще бъде стандартното отклонение.

Софтуер

Както се вижда от описанията на формулите и представените примери, изчисляването на дисперсията и математическото очакване не е най-лесната процедура от аритметична гледна точка. За да не губите време, има смисъл да използвате програмата, използвана във висшето образование - тя се нарича "R". Той има функции, които ви позволяват да изчислявате стойности за много понятия от статистиката и теорията на вероятностите.

Например дефинирате вектор от стойности. Това става по следния начин: вектор<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Накрая

Дисперсията и математическото очакване са тези, без които е трудно да се изчисли нещо в бъдещето. В основния курс на лекциите в университетите те се разглеждат още в първите месеци на изучаване на предмета. Именно поради неразбирането на тези прости понятия и невъзможността да ги изчислят, много студенти веднага започват да изостават в програмата и по-късно получават слаби оценки в края на сесията, което ги лишава от стипендии.

Практикувайте поне една седмица по половин час на ден, като решавате задачи, подобни на представените в тази статия. След това, на всеки тест по теория на вероятностите, ще се справите с примери без странични съвети и измамни листове.

Основните обобщаващи показатели за вариация в статистиката са дисперсията и стандартното отклонение.

дисперсия то средноаритметично квадратни отклонения на всяка стойност на характеристиката от общата средна стойност. Дисперсията обикновено се нарича среден квадрат на отклоненията и се означава с  2 . В зависимост от първоначалните данни дисперсията може да се изчисли от средната аритметична, проста или претеглена:

 непретеглена (проста) дисперсия;

 претеглена дисперсия.

Стандартно отклонение е обобщаваща характеристика на абсолютните размери вариации черта в съвкупността. Изразява се в същите единици като знака (в метри, тонове, проценти, хектари и т.н.).

Стандартното отклонение е корен квадратен от дисперсията и се означава с :

 непретеглено стандартно отклонение;

 претеглено стандартно отклонение.

Стандартното отклонение е мярка за надеждността на средната стойност. Колкото по-малко е стандартното отклонение, толкова по-добре средното аритметично отразява цялата представена популация.

Изчисляването на стандартното отклонение се предшества от изчисляването на дисперсията.

Процедурата за изчисляване на претеглената дисперсия е следната:

1) определяне на средното аритметично претеглено:

2) изчислете отклоненията на опциите от средната стойност:

3) повдигнете на квадрат отклонението на всяка опция от средната стойност:

4) умножете отклоненията на квадрат по тегла (честоти):

5) обобщете получените произведения:

6) получената сума се разделя на сумата от теглата:

Пример 2.1

Изчислете среднопретеглената аритметична стойност:

Стойностите на отклоненията от средната стойност и техните квадрати са представени в таблицата. Нека дефинираме дисперсията:

Стандартното отклонение ще бъде равно на:

Ако изходните данни са представени като интервал серия за разпространение , тогава първо трябва да определите дискретната стойност на характеристиката и след това да приложите описания метод.

Пример 2.2

Нека покажем изчисляването на дисперсията за интервалната серия върху данните за разпределението на посевната площ на колективното стопанство по добив на пшеница.

Средната аритметична стойност е:

Нека изчислим дисперсията:

6.3. Изчисляване на дисперсията по формулата за индивидуални данни

Изчислителна техника дисперсия сложен и за големи стойности на опции и честоти може да бъде тромав. Изчисленията могат да бъдат опростени с помощта на дисперсионните свойства.

Дисперсията има следните свойства.

1. Намаляването или увеличаването на теглата (честотите) на променлива характеристика с определен брой пъти не променя дисперсията.

2. Намаляване или увеличаване на стойността на всяка характеристика със същата постоянна стойност НОдисперсията не се променя.

3. Намаляване или увеличаване на стойността на всяка характеристика с определен брой пъти ксъответно намалява или увеличава дисперсията в к 2 пъти стандартно отклонение  в кведнъж.

4. Дисперсията на признак спрямо произволна стойност винаги е по-голяма от дисперсията спрямо средната аритметична с квадрата на разликата между средната и произволната стойност:

Ако НО 0, тогава стигаме до следното равенство:

т.е. дисперсията на характеристика е равна на разликата между средния квадрат на стойностите на характеристиката и квадрата на средната стойност.

Всяко свойство може да се използва самостоятелно или в комбинация с други при изчисляване на дисперсията.

Процедурата за изчисляване на дисперсията е проста:

1) определям средноаритметично :

2) повдигнете на квадрат средното аритметично:

3) повдигнете на квадрат отклонението на всеки вариант на серията:

х аз 2 .

4) намерете сумата от квадратите на опциите:

5) разделете сумата от квадратите на опциите на техния брой, т.е. определете средния квадрат:

6) определете разликата между средния квадрат на характеристиката и квадрата на средната стойност:

Пример 3.1Имаме следните данни за производителността на работниците:

Нека направим следните изчисления: