Биографии Характеристики Анализ

Формула за изчисляване на дисперсията на дискретна случайна променлива. Математическо очакване и дисперсия на случайна променлива

Дисперсията в статистиката се определя като средна стойност стандартно отклонениеиндивидуални стойности на признака на квадрат от средноаритметичното. Често срещан начин за изчисляване на квадратните отклонения на опциите от средната стойност и след това осредняването им.

В икономическия и статистически анализ е обичайно да се оценява вариацията на характеристика, като се използва най-често стандартното отклонение, което е корен квадратен от дисперсията.

(3)

Той характеризира абсолютната флуктуация на стойностите на атрибута на променливата и се изразява в същите единици като вариантите. В статистиката често става необходимо да се сравняват вариациите на различни характеристики. За такива сравнения се използва относителен показател за вариация, коефициентът на вариация.

Дисперсионни свойства:

1) ако извадите произволно число от всички опции, тогава дисперсията няма да се промени;

2) ако всички стойности на варианта се разделят на някакво число b, тогава дисперсията ще намалее с b^2 пъти, т.е.

3) ако изчислите среден квадратотклонения от което и да е число с неравна средна аритметична стойност, тогава то ще бъде по-голямо от дисперсията. В този случай, чрез точно определена стойност на квадрат от разликата между средната стойност на поз.

Дисперсията може да се определи като разликата между средната стойност на квадрат и средната стойност на квадрат.

17. Групови и междугрупови вариации. Правило за добавяне на дисперсии

Ако статистическата съвкупност е разделена на групи или части според изследваната характеристика, тогава за такава популация, следните видоведисперсии: групови (частни), групови средни (частни) и междугрупови.

Обща дисперсия- отразява вариацията на даден признак поради всички условия и причини, действащи в дадена статистическа съвкупност.

Групова дисперсия- равно на средните квадратични отклонения индивидуални ценностихарактеристика в рамките на група от средната аритметична стойност на тази група, наречена групова средна стойност. В този случай средното за групата не съвпада с общото средно за цялата популация.

Груповата вариация отразява вариацията на черта само поради условията и причините, действащи в групата.

Средни групови дисперсии- се определя като средноаритметично претеглено на груповите дисперсии, като теглата са обемите на групите.

Междугрупова дисперсия- е равно на средния квадрат на отклоненията на груповите средни от общата средна стойност.

Междугруповата вариация характеризира вариацията на резултатния атрибут, дължаща се на групиращия атрибут.

Между разглежданите типове дисперсии има определена връзка: общата дисперсия е равна на сумата от средната група и междугрупова дисперсия.

Тази връзка се нарича правило за добавяне на дисперсии.

18. Динамичен ред и съставните му елементи. Видове динамични редове.

Серии в статистиката- това са цифрови данни, показващи дали дадено явление се променя във времето или пространството и дават възможност за статистическо съпоставяне на явленията както в процеса на тяхното развитие във времето, така и в различни формии видове процеси. Благодарение на това е възможно да се открие взаимната зависимост на явленията.

Процесът на развитие на движението на обществените явления във времето в статистиката обикновено се нарича динамика. За показване на динамиката се изграждат серии от динамики (хронологични, времеви), които са серии от променящи се във времето стойности на статистически показател (например брой осъдени над 10 години), разположени в хронологичен ред. Техните съставни елементи са числените стойности на даден показател и периодите или моментите от времето, за които се отнасят.

Най-важната характеристика на времевия ред- техният размер (обем, стойност) на това или онова явление, постигнато в определен период или в определен момент. Съответно, величината на членовете на серията от динамика е нейното ниво. Разграничетеначално, средно и крайно ниво на динамичния ред. Първо нивопоказва стойността на първия, крайният - стойността на последния член на серията. Средно нивопредставлява средния хронологичен вариационен диапазон и се изчислява в зависимост от това дали времевият ред е интервален или мигновен.

Друг важна характеристикадинамичен сериал- времето, изминало от първоначалното до последното наблюдение, или броя на тези наблюдения.

Има различни видове времеви редове, те могат да бъдат класифицирани според следните критерии.

1) В зависимост от начина на изразяване на нивата, сериите от динамика се разделят на серии от абсолютни и производни показатели (относителни и средни стойности).

2) В зависимост от това как нивата на реда изразяват състоянието на явлението в определени моменти от време (в началото на месеца, тримесечието, годината и т.н.) или неговата стойност за определени интервали от време (например за ден, месец, година и т.н.), разграничават съответно моментни и интервални серии от динамика. Моментните серии в аналитичната работа на правоприлагащите органи се използват сравнително рядко.

В теорията на статистиката динамиката се разграничава и по редица други класификационни признаци: в зависимост от разстоянието между нивата - с равноотдалечени нива и неравномерни във времето нива; в зависимост от наличието на основната тенденция на изследвания процес – стационарни и нестационарни. При анализиране времеви редовеидвам от следващи нивасериите са представени под формата на компоненти:

Y t \u003d TP + E (t)

където TR е детерминистичен компонент, който определя общата тенденция на промяна във времето или тенденция.

E(t) - случаен компонентпричинявайки колебания в нивото.

Очаквана стойности дисперсия – най-често използваните числови характеристики случайна величина. Те характеризират най-важните характеристики на разпределението: неговото положение и степен на дисперсия. В много проблеми на практиката пълно, изчерпателно описание на случайна променлива - законът за разпределение - или не може да бъде получено изобщо, или изобщо не е необходимо. В тези случаи те са ограничени до приблизително описание на случайна променлива с помощта на числени характеристики.

Математическото очакване често се нарича просто средна стойност на случайна променлива. Дисперсията на случайна променлива е характеристика на дисперсията, дисперсията на случайна променлива около нейното математическо очакване.

Математическо очакване на дискретна случайна променлива

Нека подходим към понятието математическо очакване, като първо изхождаме от механичната интерпретация на разпределението на дискретна случайна променлива. Нека единичната маса е разпределена между точките на оста x х1 , х 2 , ..., хн, и всяка материална точка има съответстваща й маса от стр1 , стр 2 , ..., стрн. Необходимо е да изберете една точка на оста x, характеризираща позицията на цялата система материални точки, като се вземат предвид техните маси. Естествено е да приемем за такава точка центъра на масата на системата от материални точки. Това е среднопретеглената стойност на случайната променлива х, в която абсцисата на всяка точка хазвлиза с "тежест", равна на съответната вероятност. Средната стойност на така получената случайна променлива хсе нарича неговото математическо очакване.

Математическото очакване на дискретна случайна променлива е сумата от продуктите на всичките й възможни стойности и вероятностите на тези стойности:

Пример 1Организира печеливша лотария. Има 1000 печалби, 400 от които са по 10 рубли всяка. 300 - 20 рубли всяка 200-100 рубли всеки. и 100 - 200 рубли всяка. Какво средният размерпечалби за човек, който закупи един билет?

Решение. Намираме средната печалба, ако обща сумапечалби, което е равно на 10 * 400 + 20 * 300 + 100 * 200 + 200 * 100 = 50 000 рубли, разделено на 1000 (общата сума на печалбите). Тогава получаваме 50000/1000 = 50 рубли. Но изразът за изчисляване на средната печалба може да бъде представен и в следната форма:

От друга страна, при тези условия размерът на печалбата е случайна променлива, която може да приеме стойности от 10, 20, 100 и 200 рубли. с вероятности, равни съответно на 0,4; 0,3; 0,2; 0,1. Следователно очакваната средна печалба е равно на суматапроизведенията на размера на печалбите по вероятността да бъдат получени.

Пример 2Издателят реши да публикува нова книга. Той ще продаде книгата за 280 рубли, от които 200 ще бъдат дадени на него, 50 на книжарницата и 30 на автора. Таблицата дава информация за разходите за издаване на книга и вероятността за продажба на определен брой копия от книгата.

Намерете очакваната печалба на издателя.

Решение. Случайната величина "печалба" е равна на разликата между приходите от продажбата и себестойността на разходите. Например, ако се продадат 500 копия от книга, тогава приходите от продажбата са 200 * 500 = 100 000, а разходите за публикуване са 225 000 рубли. Така издателят е изправен пред загуба от 125 000 рубли. Следната таблица обобщава очакваните стойности на случайната променлива - печалба:

Номерпечалба хаз Вероятност страз хаз страз
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Обща сума: 1,00 25000

Така получаваме математическото очакване на печалбата на издателя:

.

Пример 3Шанс за попадение с един изстрел стр= 0,2. Определете консумацията на черупки, които осигуряват математическото очакване на броя на ударите, равен на 5.

Решение. От същата формула за очакване, която използвахме досега, изразяваме х- консумация на черупки:

.

Пример 4Определете математическото очакване на случайна променлива хброй попадения с три изстрела, ако вероятността за попадение с всеки изстрел стр = 0,4 .

Съвет: намерете вероятността от стойностите на случайна променлива по Формула на Бернули .

Свойства на очакванията

Разгледайте свойствата на математическото очакване.

Имот 1.Математическото очакване на постоянна стойност е равно на тази константа:

Имот 2.Постоянният фактор може да бъде изваден от знака за очакване:

Имот 3.Математическото очакване на сумата (разликата) на случайните променливи е равно на сумата (разликата) на техните математически очаквания:

Имот 4.Математическото очакване на произведението на случайните променливи е равно на произведението на техните математически очаквания:

Имот 5.Ако всички стойности на случайната променлива хнамаляване (увеличаване) със същото число ОТ, тогава неговото математическо очакване ще намалее (увеличи) със същото число:

Когато не можете да се ограничите само до математическо очакване

В повечето случаи само математическото очакване не може да характеризира адекватно една случайна променлива.

Нека случайни променливи хи Yсе дават от следните закони на разпределение:

Значение х Вероятност
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Значение Y Вероятност
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Математическите очаквания на тези величини са еднакви – равни на нула:

Разпределението им обаче е различно. Случайна стойност хможе да приема само стойности, които са малко по-различни от математическото очакване и случайната променлива Yможе да приема стойности, които се отклоняват значително от математическото очакване. Подобен пример: средната заплата не дава възможност да се прецени специфично тегловисоко и ниско платени работници. С други думи, по математическото очакване не може да се прецени какви отклонения от него, поне средно, са възможни. За да направите това, трябва да намерите дисперсията на случайна променлива.

Дисперсия на дискретна случайна променлива

дисперсиядискретна случайна променлива хсе нарича математическо очакване на квадрата на неговото отклонение от математическото очакване:

Стандартното отклонение на случайна променлива хНаречен аритметична стойност корен квадратеннеговите разновидности:

.

Пример 5Изчисляване на дисперсии и стандартни отклонения на случайни променливи хи Y, чиито закони на разпределение са дадени в таблиците по-горе.

Решение. Математически очаквания на случайни променливи хи Y, както е намерено по-горе, са равни на нула. Според дисперсионната формула за д(х)=д(г)=0 получаваме:

След това стандартните отклонения на случайни променливи хи Yпредставляват

.

По този начин, със същите математически очаквания, дисперсията на случайната променлива хмного малък и случаен Y- значителен. Това е следствие от разликата в разпределението им.

Пример 6Инвеститорът има 4 алтернативни инвестиционни проекта. Таблицата обобщава данните за очакваната печалба в тези проекти със съответната вероятност.

Проект 1Проект 2Проект 3Проект 4
500, П=1 1000, П=0,5 500, П=0,5 500, П=0,5
0, П=0,5 1000, П=0,25 10500, П=0,25
0, П=0,25 9500, П=0,25

Намерете за всяка алтернатива математическото очакване, дисперсията и стандартното отклонение.

Решение. Нека покажем как се изчисляват тези количества за 3-тата алтернатива:

Таблицата обобщава намерените стойности за всички алтернативи.

Всички алтернативи имат едно и също математическо очакване. Това означава, че в дългосрочен план всички имат еднакъв доход. Стандартното отклонение може да се тълкува като мярка за риск – колкото по-голямо е то, толкова по-голям е рискът на инвестицията. Инвеститор, който не желае да поема голям риск, ще избере проект 1, защото има най-малко стандартно отклонение(0). Ако инвеститорът предпочита риск и висока доходност за кратък период, тогава той ще избере проекта с най-голямо стандартно отклонение - проект 4.

Свойства на дисперсия

Нека представим свойствата на дисперсията.

Имот 1.Дисперсията на постоянна стойност е нула:

Имот 2.Константният коефициент може да бъде изваден от дисперсионния знак чрез повдигане на квадрат:

.

Имот 3.Дисперсията на случайна променлива е равна на математическото очакване на квадрата на тази стойност, от което се изважда квадратът на математическото очакване на самата стойност:

,

където .

Имот 4.Дисперсията на сумата (разликата) на случайните променливи е равна на сумата (разликата) на техните дисперсии:

Пример 7Известно е, че дискретна случайна променлива хприема само две стойности: −3 и 7. Освен това е известно математическото очакване: д(х) = 4 . Намерете дисперсията на дискретна случайна променлива.

Решение. Означаваме с стрвероятността, с която една случайна променлива приема стойност х1 = −3 . Тогава вероятността на стойността х2 = 7 ще бъде 1 − стр. Нека изведем уравнението за математическото очакване:

д(х) = х 1 стр + х 2 (1 − стр) = −3стр + 7(1 − стр) = 4 ,

където получаваме вероятностите: стр= 0,3 и 1 − стр = 0,7 .

Законът за разпределение на случайна променлива:

х −3 7
стр 0,3 0,7

Изчисляваме дисперсията на тази случайна променлива, използвайки формулата от свойство 3 на дисперсията:

д(х) = 2,7 + 34,3 − 16 = 21 .

Намерете сами математическото очакване на случайна променлива и след това вижте решението

Пример 8Дискретна случайна променлива хприема само две стойности. Приема по-голямата стойност от 3 с вероятност 0,4. Освен това е известна дисперсията на случайната променлива д(х) = 6 . Намерете математическото очакване на случайна променлива.

Пример 9Една урна съдържа 6 бели и 4 черни топки. От урната се вземат 3 топки. Броят на белите топки сред изтеглените топки е дискретна случайна променлива х. Намерете математическото очакване и дисперсията на тази случайна променлива.

Решение. Случайна стойност хможе да приеме стойностите 0, 1, 2, 3. Съответните вероятности могат да бъдат изчислени от правило за умножение на вероятностите. Законът за разпределение на случайна променлива:

х 0 1 2 3
стр 1/30 3/10 1/2 1/6

Оттук и математическото очакване на тази случайна променлива:

М(х) = 3/10 + 1 + 1/2 = 1,8 .

Дисперсията на дадена случайна променлива е:

д(х) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Математическо очакване и дисперсия на непрекъсната случайна променлива

За непрекъсната случайна променлива механичната интерпретация на математическото очакване ще запази същото значение: центърът на масата за единица маса, разпределена непрекъснато по оста x с плътност f(х). За разлика от дискретна случайна променлива, за която аргументът на функцията хазпроменя рязко, за непрекъсната случайна променлива, аргументът се променя непрекъснато. Но математическото очакване на непрекъсната случайна променлива също е свързано с нейната средна стойност.

За да намерите математическото очакване и дисперсията на непрекъсната случайна променлива, трябва да намерите определени интеграли . Ако е дадена функция на плътност на непрекъсната случайна променлива, тогава тя влиза директно в интегранта. Ако е дадена функция на разпределение на вероятностите, тогава като я диференцирате, трябва да намерите функцията на плътност.

Средната аритметична стойност на всички възможни стойности на непрекъсната случайна променлива се нарича негова математическо очакване, означено с или .

Ако популацията е разделена на групи според изследваната характеристика, тогава за тази популация могат да се изчислят следните видове дисперсия: обща, групова (вътрешногрупова), групова средна (средна за вътрешногрупова), междугрупова.

Първоначално изчислява коефициента на детерминация, който показва коя част обща вариацияна изследвания признак е междугруповата вариация, т.е. поради групиране:

Емпиричното съотношение на корелация характеризира плътността на връзката между груповите (факторни) и ефективните признаци.

Емпиричното съотношение на корелация може да приема стойности от 0 до 1.

За да оцените близостта на връзката въз основа на емпиричното съотношение на корелация, можете да използвате отношенията на Chaddock:

Пример 4Има следните данни за изпълнението на работата от проектантски и проучвателни организации различни формиИмот:

Определете:

1) обща дисперсия;

2) групови дисперсии;

3) средната стойност на груповите дисперсии;

4) междугрупова дисперсия;

5) обща дисперсия въз основа на правилото за добавяне на дисперсии;


6) коефициент на детерминация и емпирична корелация.

Направете си изводите.

Решение:

1. Дефинирайте среден обемизвършване на работи на предприятия от две форми на собственост:

Изчислете общата дисперсия:

2. Определете груповите средни стойности:

милиона рубли;

милиони рубли.

Групови отклонения:

;

3. Изчислете средната стойност на груповите дисперсии:

4. Определете междугруповата дисперсия:

5. Изчислете общата дисперсия въз основа на правилото за добавяне на дисперсии:

6. Определете коефициента на детерминация:

.

Така обемът на работата, извършена от проектантските и проучвателните организации с 22% зависи от формата на собственост на предприятията.

Емпиричното съотношение на корелация се изчислява по формулата

.

Стойността на изчисления показател показва, че зависимостта на обема на работата от формата на собственост на предприятието е малка.

Пример 5В резултат на анкетата технологична дисциплинапроизводствените обекти получиха следните данни:

Определете коефициента на детерминация

дисперсияслучайна величина- мярка за дисперсията на дадено случайна величина, тоест нея отклоненияот математическото очакване. В статистиката нотацията (сигма на квадрат) често се използва за обозначаване на дисперсия. Корен квадратен от дисперсията се нарича стандартно отклонениеили стандартен спред. Стандартното отклонение се измерва в същите единици като самата случайна променлива, а дисперсията се измерва в квадратите на тази единица.

Въпреки че е много удобно да се използва само една стойност (като средна стойност или режим и медиана) за оценка на цялата извадка, този подход може лесно да доведе до неправилни заключения. Причината за тази ситуация не се крие в самата стойност, а във факта, че една стойност по никакъв начин не отразява разпространението на стойностите на данните.

Например в извадката:

средното е 5.

В самата извадка обаче няма елемент със стойност 5. Може да се наложи да знаете колко близо е всеки елемент от извадката до средната си стойност. Или, с други думи, трябва да знаете дисперсията на стойностите. Знаейки степента, до която данните са се променили, можете да интерпретирате по-добре означава, Медианаи мода. Степента на промяна в стойностите на извадката се определя чрез изчисляване на тяхната дисперсия и стандартно отклонение.



Дисперсията и квадратният корен от дисперсията, наречени стандартно отклонение, характеризират средното отклонение от средната стойност на извадката. Сред тези две количества най-висока стойностТо има стандартно отклонение. Тази стойност може да бъде представена като средното разстояние, на което елементите са от средния елемент на пробата.

Дисперсията е трудна за смислено тълкуване. Въпреки това квадратният корен от тази стойност е стандартното отклонение и се поддава добре на тълкуване.

Стандартното отклонение се изчислява, като първо се определи дисперсията и след това се изчисли квадратният корен от дисперсията.

Например за масива от данни, показан на фигурата, следните стойности:

Снимка 1

Тук средната стойност на квадратните разлики е 717,43. За да получите стандартното отклонение, остава само да вземете корен квадратен от това число.

Резултатът ще бъде приблизително 26,78.

Трябва да се помни, че стандартното отклонение се интерпретира като средното разстояние, на което са елементите от средната стойност на извадката.

Стандартното отклонение показва колко добре средната стойност описва цялата извадка.

Да приемем, че сте ръководител на производствения отдел за сглобяване на компютър. Тримесечният отчет казва, че продукцията за последното тримесечие е била 2500 компютъра. Лошо ли е или добро? Вие поискахте (или вече има тази колона в отчета) да се покаже стандартното отклонение за тези данни в отчета. Цифрата на стандартното отклонение, например, е 2000. За вас, като ръководител на отдела, става ясно, че производствената линия изисква по-добро управление(твърде големи отклонения в броя на сглобените компютри).

Да припомним: кога голям размерАко стандартното отклонение е твърде ниско, данните са широко разпръснати около средната стойност, а ако стандартното отклонение е ниско, те са групирани близо до средната стойност.

Четири статистически функции VARP(), VARP(), STDEV() и STDEV() са предназначени за изчисляване на дисперсията и стандартното отклонение на числа в диапазон от клетки. Преди да се изчисли дисперсията и стандартното отклонение на набор от данни, е необходимо да се определи дали данните представляват генералната съвкупност или извадка от население. В случай на извадка от генералната съвкупност трябва да се използват функциите VARP() и STDEV(), а в случай на генерална съвкупност трябва да се използват функциите VARP() и STDEV():

Население функция

VARP()

STDLONG()
проба

ВАРИ()

STDEV()

Дисперсията (както и стандартното отклонение), както отбелязахме, показва степента, в която стойностите, включени в набора от данни, са разпръснати около средното аритметично.

Малка стойност на дисперсията или стандартното отклонение показва, че всички данни са центрирани около средната аритметична стойност и голямо значениетези стойности - че данните са разпръснати в широк диапазон от стойности.

Дисперсията е доста трудна за смислено тълкуване (какво означава малка стойност, голяма стойност?). производителност Задачи 3ще ви позволи визуално, върху графика, да покажете значението на дисперсията за набор от данни.

Задачи

· Упражнение 1.

· 2.1. Дайте понятията: дисперсия и стандартно отклонение; тяхното символно обозначение статистическа обработкаданни.

· 2.2. Направете работен лист в съответствие с фигура 1 и направете необходимите изчисления.

· 2.3. Дайте основните формули, използвани при изчисленията

· 2.4. Обяснете всички обозначения ( , , )

· 2.5. обясни практическа стойностпонятията дисперсия и стандартно отклонение.

Задача 2.

1.1. Дайте понятията: генерална съвкупност и извадка; математическо очакване и средноаритметично на тяхното символно обозначение при статистическа обработка на данни.

1.2. В съответствие с фигура 2 направете работен лист и направете изчисления.

1.3. Дайте основните формули, използвани при изчисленията (за генералната съвкупност и извадката).

Фигура 2

1.4. Обяснете защо е възможно да се получат такива стойности на средните аритметични стойности в проби като 46.43 и 48.78 (вижте Приложението на файла). За заключение.

Задача 3.

Има две проби с различен набор от данни, но средната стойност за тях ще бъде една и съща:

Фигура 3

3.1. Направете работен лист в съответствие с фигура 3 и направете необходимите изчисления.

3.2. Дайте основните формули за изчисление.

3.3. Изградете графики в съответствие с фигури 4, 5.

3.4. Обяснете получените зависимости.

3.5. Извършете подобни изчисления за тези две проби.

Първоначална проба 11119999

Изберете стойностите на втората проба, така че средноаритметичната стойност за втората проба да е същата, например:

Изберете сами стойностите за втората проба. Подредете изчисленията и графиките като фигури 3, 4, 5. Покажете основните формули, използвани при изчисленията.

Направете съответните заключения.

Всички задачи трябва да бъдат представени под формата на доклад с всички необходими цифри, графики, формули и кратки обяснения.

Забележка: изграждането на графиките трябва да бъде обяснено с фигури и кратки обяснения.

Диапазон на вариация (или диапазон на вариация) -е разликата между максимума и минимални стойностизнак:

В нашия пример диапазонът на изменение на сменната продукция на работниците е: в първа бригада R=105-95=10 деца, във втора бригада R=125-75=50 деца. (5 пъти повече). Това предполага, че продукцията на 1-ва бригада е по-„стабилна“, но втората бригада има повече резерви за растеж на продукцията, т.к. ако всички работници достигнат максималната производителност за тази бригада, тя може да произведе 3 * 125 = 375 части, а в 1-ва бригада само 105 * 3 = 315 части.
Ако екстремни стойностичертите не са типични за популацията, тогава се използват квартилни или децилни диапазони. Квартилният диапазон RQ= Q3-Q1 обхваща 50% от населението, първият децилен диапазон RD1 = D9-D1 покрива 80% от данните, вторият децилен диапазон RD2= D8-D2 покрива 60%.
Недостатъкът на индикатора диапазон на вариацияе, но стойността му не отразява всички колебания на атрибута.
Най-простият обобщаващ показател, който отразява всички колебания на даден признак, е средно линейно отклонение, което е средноаритметичното на абсолютните отклонения на отделните опции от средната им стойност:

,
за групирани данни
,
където хi е стойността на характеристиката в дискретна серияили средата на интервал в интервално разпределение.
В горните формули разликите в числителя се вземат по модул, в противен случай, според свойството на средната аритметична стойност, числителят винаги ще бъде равен на нула. Следователно средното линейно отклонение в статистическата практика се използва рядко, само в случаите, когато сумирането на показатели без отчитане на знака има икономически смисъл. С негова помощ се анализират например съставът на служителите, рентабилността на производството, външнотърговският оборот.
Дисперсия на характеристикитее средният квадрат на отклоненията на варианта от средната им стойност:
проста вариация
,
претеглена дисперсия
.
Формулата за изчисляване на дисперсията може да бъде опростена:

По този начин дисперсията е равна на разликата между средната стойност на квадратите на варианта и квадрата на средната стойност на варианта на съвкупността:
.
Въпреки това, поради сумирането на квадратните отклонения, дисперсията дава изкривена представа за отклоненията, така че средната стойност се изчислява от нея. стандартно отклонение, което показва колко средно се отклоняват конкретните варианти на признака от средната им стойност. Изчислено чрез вземане на корен квадратен от дисперсията:
за негрупирани данни
,
за вариационната серия

как по-малка стойностдисперсия и стандартно отклонение, колкото по-хомогенна е популацията, толкова по-надеждна (типична) ще бъде средна стойност.
Линейна средна и средна стандартно отклонение- именувани числа, т.е. те са изразени в мерни единици на атрибута, са идентични по съдържание и близки по значение.
броя абсолютни показателипрепоръчват се вариации с помощта на таблици.
Таблица 3 - Изчисляване на характеристиките на вариацията (на примера на периода на данните за смяната на продукцията на работните екипи)


Брой работници

Средна точка на интервал,

Прогнозни стойности

Обща сума:

Средна производителност на смени на работниците:

Средно линейно отклонение:

Изходна дисперсия:

Стандартното отклонение на продукцията на отделните работници от средната продукция:
.

1 Изчисляване на дисперсията по метода на моментите

Изчисляването на отклоненията е свързано с тромави изчисления (особено ако се изрази средната стойност Голям бройс няколко знака след десетичната запетая). Изчисленията могат да бъдат опростени чрез използване на опростена формула и дисперсионни свойства.
Дисперсията има следните свойства:

  1. ако всички стойности на атрибута са намалени или увеличени с една и съща стойност A, тогава дисперсията няма да намалее от това:

,

, тогава или
Използвайки свойствата на дисперсията и първо намалявайки всички варианти на популацията със стойността A и след това разделяйки на стойността на интервала h, получаваме формула за изчисляване на дисперсията във вариационни серии с на равни интервали начин на моменти:
,
където е дисперсията, изчислена по метода на моментите;
h е стойността на интервала на вариационната серия;
– нови (трансформирани) вариантни стойности;
НО- постоянен, който се използва като среда на интервала с най-висока честота; или опция, която има най-висока честота;
е квадратът на момента от първи ред;
е момент от втори ред.
Нека изчислим дисперсията по метода на моментите въз основа на данните за сменната продукция на работния екип.
Таблица 4 - Изчисляване на дисперсията по метода на моментите


Групи производствени работници, бр.

Брой работници

Средата на интервала

Прогнозни стойности

Процедура за изчисление:


  1. изчислете дисперсията:

2 Изчисляване на дисперсията на алтернативен признак

Сред знаците, изследвани от статистиката, има такива, които имат само две взаимно изключващи се значения. Това са алтернативни знаци. Дават им се две количествени стойности: опции 1 и 0. Честотата на опции 1, която се обозначава с p, е делът на единиците, които имат дадена характеристика. Разликата 1-p=q е честотата на опциите 0. Така,


xi

Средно аритметично на алтернативен признак
, тъй като p+q=1.

Дисперсия на характеристиките
, защото 1-p=q
По този начин дисперсията на алтернативен атрибут е равна на произведението от дела на единиците, които имат този атрибут, и дела на единиците, които нямат този атрибут.
Ако стойностите 1 и 0 са еднакво често срещани, т.е. p=q, дисперсията достига своя максимум pq=0,25.
Дисперсията на алтернативната функция се използва в извадкови проучваниякато качеството на продукта.

3 Междугрупова дисперсия. Правило за добавяне на дисперсии

Дисперсията, за разлика от други характеристики на вариацията, е количество на добавката. Тоест в съвкупността, която е разделена на групи според факторния критерий х , резултатна дисперсия гможе да се разложи на дисперсия във всяка група (вътре в групата) и дисперсия между групите (между групата). Тогава, наред с изследването на вариацията на признака в цялата популация като цяло, става възможно да се изследва вариацията във всяка група, както и между тези групи.

Обща дисперсияизмерва вариацията на черта привърху цялата съвкупност под влиянието на всички фактори, предизвикали тази вариация (отклонения). Тя е равна на средния квадрат на отклоненията на отделните стойности на признака приот общата средна стойност и може да се изчисли като проста или претеглена дисперсия.
Междугрупова дисперсияхарактеризира вариацията на ефективния признак при, породени от влиянието на знак-фактора хв основата на групирането. Той характеризира вариацията на груповите средни стойности и е равен на средния квадрат на отклоненията на груповите средни от общата средна стойност:
,
където е средноаритметичната стойност на i-та група;
– брой единици в i-та група (честота на i-та група);
- общ средно население.
Вътрешногрупова дисперсияотразява случайната вариация, т.е. тази част от вариацията, която е причинена от влиянието на неотчетени фактори и не зависи от фактора-атрибут, лежащ в основата на групирането. Той характеризира вариацията индивидуални ценностиспрямо груповите средства, равни на средния квадрат на отклоненията на отделните стойности на атрибута прив рамките на група от средната аритметична стойност на тази група (средна група) и се изчислява като проста или претеглена дисперсия за всяка група:
или ,
където е броят на единиците в групата.
Въз основа на вътрешногруповите дисперсии за всяка група е възможно да се определи общата средна стойност на дисперсиите в рамките на групата:
.
Връзката между трите дисперсии се нарича правила за добавяне на дисперсии, според която общата дисперсия е равна на сумата от междугруповата дисперсия и средната от вътрешногруповите дисперсии:

Пример. При изследване на влиянието на тарифната категория (квалификация) на работниците върху нивото на производителност на труда им бяха получени следните данни.
Таблица 5 - Разпределение на работниците по средночасова продукция.



п/н

Работници 4-та категория

Работници от 5-та категория

Тренирам
работник, бр.

Тренирам
работник, бр.

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

AT този примерработниците се разделят на две групи по факторен критерий х- квалификации, които се характеризират с техния ранг. Ефективният признак - производство - варира както под негово влияние (междугрупова вариация), така и поради други случайни фактори (вътрешногрупова вариация). Предизвикателството е да се измерят тези вариации, като се използват три вариации: обща, междугрупова и вътрегрупова. Емпиричният коефициент на детерминация показва съотношението на вариацията на получената характеристика припод влияние на факторен знак х. Останалата част от общата вариация припричинени от промени в други фактори.
В примера емпиричният коефициент на детерминация е:
или 66,7%,
Това означава, че 66,7% от изменението на производителността на труда на работниците се дължи на различията в квалификацията, а 33,3% се дължи на влиянието на други фактори.
Емпирична корелационна връзкапоказва плътността на връзката между групирането и ефективните характеристики. Изчислява се като корен квадратен от емпиричния коефициент на детерминация:

Емпиричното съотношение на корелация, както и , могат да приемат стойности от 0 до 1.
Ако няма връзка, тогава =0. В този случай =0, т.е. груповите средни са равни едно на друго и няма междугрупова вариация. Това означава, че групиращият признак - факторът не влияе върху формирането на общата вариация.
Ако връзката е функционална, тогава =1. В този случай дисперсията на груповите средни стойности е обща дисперсия(), тоест няма вътрешногрупова вариация. Това означава, че функцията за групиране напълно определя вариацията на получената характеристика, която се изследва.
Колкото стойността на корелационната връзка е по-близка до единица, толкова по-близо, по-близко до функционалната зависимост е връзката между признаците.
За качествена оценка на близостта на връзката между знаците се използват отношенията на Чадок.

В примера , което сочи тясна връзкамежду производителността на работниците и тяхната квалификация.