Біографії Характеристики Аналіз

Розподіл прикладів пірсона. Перевірка гіпотези про нормальний розподіл генеральної сукупності за критерієм пірсона

Розглянемо застосування вMSEXCELкритерію хі-квадрат Пірсона для перевірки простих гіпотез

Після отримання експериментальних даних (тобто коли є якась вибірка) зазвичай проводиться вибір закону розподілу, що найбільш добре описує випадкову величину, представлену даною вибіркою. Перевірка того, наскільки добре експериментальні дані описуються вибраним теоретичним законом розподілу здійснюється з використанням критеріїв згоди. Нульовою гіпотезою, зазвичай виступає гіпотеза про рівність розподілу випадкової величинидеякому теоретичному закону.

Спочатку розглянемо застосування критерію згоди Пірсона Х 2 (хі-квадрат)щодо простих гіпотез (параметри теоретичного розподілу вважаються відомими). Потім - коли задається тільки форма розподілу, а параметри цього розподілу і значення статистики Х 2 оцінюються/розраховуються на підставі однієї і тієї ж вибірки.

Примітка: В англомовній літературі процедура застосування. критерію згоди Пірсона Х 2 має назву The chi-square goodness of fit test.

Нагадаємо процедуру перевірки гіпотез:

  • на основі вибіркиобчислюється значення статистики, яка відповідає типу гіпотези, що перевіряється. Наприклад, для використовується t-статистика(якщо невідомо);
  • за умови істинності нульової гіпотези, розподіл цієї статистикивідомо і може бути використане для обчислення ймовірностей (наприклад, для t-статистикице);
  • обчислене на основі вибіркизначення статистикипорівнюється з критичним для заданого значенням ();
  • нульову гіпотезувідкидають, якщо значення статистикибільше критичного (або якщо можливість отримати це значення статистики() менше рівня значущості, що є еквівалентним підходом.

Проведемо перевірку гіпотездля різних розподілів.

Дискретний випадок

Припустимо, що дві людини грають у кістки. Кожен гравець має свій набір кісток. Гравці по черзі кидають одразу по 3 кубики. Кожен раунд виграє той, хто викине за раз більше шісток. Результати записуються. В одного з гравців після 100 раундів виникла підозра, що кістки його суперника – несиметричні, тому що вони не мають сили. той часто виграє (часто викидає шістки). Він вирішив проаналізувати наскільки ймовірно така кількість наслідків противника.

Примітка: Т.к. кубиків 3, то зараз можна викинути 0; 1; 2 чи 3 шістки, тобто. випадкова величина може набувати 4 значення.

З теорії ймовірності нам відомо, що якщо кубики симетричні, то ймовірність випадання шісток підкоряється. Тому після 100 раундів частоти випадання шісток можуть бути обчислені за допомогою формули
=БИНОМ.РАСП(A7;3;1/6;БРЕХНЯ)*100

У формулі передбачається, що в осередку А7 міститься відповідна кількість шісток, що випали, в одному раунді.

Примітка: Розрахунки наведені в файл прикладу на аркуші Дискретне.

Для порівняння спостережених(Observed) та теоретичних частот(Expected) зручно користуватися.

При значному відхиленні спостеріганих частот від теоретичного розподілу, нульова гіпотеза про розподіл випадкової величини за теоретичним законом, має бути відхилена. Тобто, якщо гральні кубикисуперника несиметричні, то спостерігані частоти «суттєво відрізнятимуться» від біномного розподілу.

У нашому випадку на перший погляд частоти досить близькі і без обчислень важко зробити однозначний висновок. Застосуємо критерій згоди Пірсона Х 2щоб замість суб'єктивного висловлювання «суттєво відрізнятися», яке можна зробити на підставі порівняння гістограм, використовувати математично коректне затвердження

Використовуємо той факт, що в силу закону великих чисел спостерігається частота (Observed) зі зростанням обсягу вибірки n прагне ймовірності, відповідної теоретичному закону (у разі, біноміальному закону). У разі обсяг вибірки n дорівнює 100.

Введемо тестову статистику, Яку позначимо Х 2:

де O l - це спостерігається частота подій, що випадкова величина прийняла певні допустимі значення, E l – це відповідна теоретична частота (Expected). L – кількість значень, які може приймати випадкова величина (у разі дорівнює 4).

Як видно з формули, ця статистикає мірою близькості спостеріганих частот до теоретичних, тобто. за допомогою неї можна оцінити «відстань» між цими частотами. Якщо сума цих "відстаней" "занадто велика", то ці частоти "істотно відрізняються". Зрозуміло, якщо наш кубик симетричний (тобто. застосуємо біноміальний закон), то ймовірність того, що сума «відстаней» буде «надто велика» буде малою. Щоб обчислити цю можливість нам необхідно знати розподіл статистикиХ 2 ( статистикаХ 2 обчислена на основі випадкової вибіркитому вона є випадковою величиною і, отже, має своє розподіл ймовірностей).

Зі багатомірного аналога інтегральної теоремиМуавра-Лапласавідомо, що за n->∞ наша випадкова величина Х 2 асимптотично з L - 1 ступенями свободи.

Отже, якщо обчислене значення статистикиХ 2 (сума «відстаней» між частотами) буде більшою за якесь граничне значення, то у нас буде підстава відкинути нульову гіпотезу. Як і під час перевірки параметричних гіпотез, граничне значення задається через рівень значущості. Якщо ймовірність того, що статистика Х 2 прийме значення менше або дорівнює обчисленому ( p-значення), буде менше рівня значущості, то нульову гіпотезуможна відкинути.

У нашому випадку значення статистики дорівнює 22,757. Імовірність, що статистика Х 2 набуде значення більше або дорівнює 22,757 дуже мала (0,000045) і може бути обчислена за формулами
=ХІ2.РАСП.ПХ(22,757;4-1)або
=ХІ2.ТЕСТ(Observed; Expected)

Примітка: Функція ХІ2.ТЕСТ() спеціально створена для перевірки зв'язку між двома категоріальними змінними (див. ).

Ймовірність 0,000045 істотно менше, ніж звичайно. рівня значущості 0,05. Отже, гравець має всі підстави підозрювати свого супротивника в нечесності ( нульова гіпотезапро його чесність відкидається).

При застосуванні критерію Х 2необхідно стежити за тим, щоб обсяг вибірки n був досить великий, інакше буде неправомірна апроксимація розподілу статистики Х 2. Зазвичай вважається, що для цього достатньо, щоб спостерігані частоти (Observed) були більшими за 5. Якщо це не так, то малі частоти об'єднуються в одну або приєднуються до інших частот, причому об'єднаному значенню приписується сумарна ймовірність і, відповідно, зменшується число ступенів свободи Х 2 -розподілу.

Для того, щоб покращити якість застосування критерію Х 2(), необхідно зменшувати інтервали розбиття (збільшувати L і, відповідно, збільшувати кількість ступенів свободи), однак цьому перешкоджає обмеження на кількість спостережень, що потрапили в кожен інтервал (д.б.>5).

Безперервний випадок

Критерій згоди Пірсона Х 2 можна застосувати так само у випадку.

Розглянемо якусь вибірку, Що складається з 200 значень. Нульова гіпотезастверджує, що вибірказроблена з .

Примітка: Випадкові величини файл прикладу на аркуші Безперервнезгенеровані за допомогою формули =НОРМ.СТ.ОБР(СЛЧИС()). Тому нові значення вибіркигенеруються при кожному перерахунку листа.

Чи відповідає наявний набір даних можна візуально оцінити.

Як видно з діаграми, значення вибірки досить добре укладаються вздовж прямої. Однак, як і для перевірки гіпотезизастосуємо Критерій згоди Пірсона Х2.

Для цього розіб'ємо діапазон зміни випадкової величини на інтервали з кроком 0,5. Обчислимо спостережені та теоретичні частоти. Наблюденные частоти обчислимо з допомогою функції ЧАСТОТА() , а теоретичні – з допомогою функції НОРМ.СТ.РАСП() .

Примітка: Як і для дискретного випадкунеобхідно стежити, щоб вибіркабула досить велика, а інтервал потрапляло >5 значень.

Обчислимо статистику Х 2 та порівняємо її з критичним значенням для заданого рівня значущості(0,05). Т.к. ми розбили діапазон зміни випадкової величини на 10 інтервалів, число ступенів свободи дорівнює 9. Критичне значення можна обчислити за формулою
=ХІ2.ОБР.ПХ(0,05;9) або
= ХІ2.ОБР (1-0,05; 9)

На діаграмі вище видно, що значення статистики дорівнює 8,19, що значно вище критичного значеннянульова гіпотезане відкидається.

Нижче наведено , на якій вибірканабула малоймовірного значення і на підставі критерію згоди Пірсона Х 2нульова гіпотеза була відхилена (не дивлячись на те, що випадкові значеннябули згенеровані за допомогою формули =НОРМ.СТ.ОБР(СЛЧИС()), що забезпечує вибіркуз стандартного нормального розподілу).

Нульова гіпотезавідхилена, хоча візуально дані розташовуються досить близько до прямої лінії.

Як приклад також візьмемо вибіркуз U(-3; 3). У цьому випадку навіть з графіка очевидно, що нульова гіпотезамає бути відхилена.

Критерій згоди Пірсона Х 2також підтверджує, що нульова гіпотезамає бути відхилена.

ОпрКритерій перевірки гіпотези про передбачуваний закон невідомого розподілу називається критерієм згоди.

Є кілька критеріїв згоди: $ \ chi ^ 2 $ (хі-квадрат) К. Пірсона, Колмогорова, Смирнова та ін.

Зазвичай теоретичні та емпіричні частоти різняться. Випадок розбіжності то, можливо випадковим, отже пояснюється лише тим, що правильно обрана гіпотеза. Критерій Пірсона відповідає на поставлене питання, але як і будь-який критерій він нічого не доводить, а лише встановлює на прийнятому рівні значущості її згоду або незгоду з даними спостережень.

ОпрДосить малу ймовірність, коли він подію вважатимуться практично неможливим називають рівнем значимості.

Насправді зазвичай приймають рівні значимості, укладені між 0,01 і 0,05, $\alpha =0,05$ - це $5 ( \% ) $ рівень значимості.

Як критерій перевірки гіпотези приймемо величину \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \qquad (1) \ end(equation)

тут $n_i -$ емпіричні частоти, одержані з вибірки, $n_i" -$ теоретичні частоти, знайдені теоретичним шляхом.

Доведено, що при $n\to \infty $ закон розподілу випадкової величини ( 1 ) незалежно від того, за яким законом розподілено Генеральна сукупність, прагне закону $\chi ^2$ ( хі-квадрат ) з $k$ ступенями свободи.

ОпрЧисло ступенів свободи знаходять рівності $k=S-1-r$ де $S-$ число груп інтервалів, $r-$ число параметрів.

1) рівномірний розподіл: $ r = 2, k = S-3 $

2) нормальний розподіл: $r=2, k=S-3 $

3) показовий розподіл: $ r = 1, k = S-2 $.

Правило . Перевірка гіпотези за критерієм Пірсона.

  1. Для перевірки гіпотези обчислюють теоретичні частоти і знаходять $\chi _ (набл)
  2. За таблицею критичних точокрозподілу $\chi ^2$ за заданим рівнем значущості $\alpha $ і числу ступенів свободи $k$ знаходять $\chi _ (кр) ^2 (( \alpha ,k ))$.
  3. Якщо $ \ chi _ ( Набл ) ^ 2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

ЗауваженняДля контролю обчислень застосовують формулу $\chi ^2$ як $\chi _ ( набл ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Перевірка гіпотези про рівномірний розподіл

Функція щільності рівномірного розподілу величини $ X $ має вигляд $ f (x) = \ frac (1) (b-a) x \ in \ left [(a, b) \ right] $.

Для того, щоб при рівні значущості $ перевірити гіпотезу про те, що безперервна випадкова величина розподілена за рівномірним законом, потрібно:

1) Знайти по заданому емпіричному розподілу вибіркове середнє $ \ overline ( x_b ) $ і $ sigma _b = \ sqrt ( D_b ) $. Прийняти як оцінку параметрів $a$ і $b$ величини

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Знайти ймовірність потрапляння випадкової величини $X$ у часткові інтервали $(( x_i ,x_ ( i+1 ) ))$ за формулою $ P_i =P(( x_i

3) Знайти теоретичні (що вирівнюють) частоти за формулою $ n_i" = np_i $.

4) Прийнявши число ступенів свободи $k=S-3$ і рівень значущості $\alpha =0,05$ за таблицями $\chi ^2$ знайдемо $\chi _ (кр) ^2 $ за заданими $\alpha $ і $k$, $\chi _ (кр) ^2 ((\alpha, k))$.

5) За формулою $\chi _ ( набл ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ де $n_i -$ емпіричні частоти, знаходимо спостерігається значення $ \ chi _ (Набл) ^ 2 $.

6) Якщо $ \ chi _ ( Набл ) ^ 2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Перевіримо гіпотезу на прикладі.

1) $ \ overline x _b = 13,00 \, \, \ sigma _b = \ sqrt (D_b) = 6,51 $

2) $a = 13,00-sqrt 3 \ cdot 6,51 = 13,00-1,732 \ cdot 6,51 = 1,72468 $

$ b = 13,00 +1,732 \ cdot 6,51 = 24,27532 $

$ b-a = 24,27532-1,72468 = 22,55064 $

3) $ P_i = P (( x_i

$ P_2 = ((3

$ P_3 = ((7

$ P_4 = ((11

$ P_5 = ((15

$ P_6 = ((19

У рівномірному розподілі якщо однакова довжина інтервалу, $P_i -$ однакові.

4) Знайдемо $n_i" = np_i$.

5) Знайдемо $\sum ( \frac ((( n_i -n_i" ))^2 ) ( n_i" ) ) $ і знайдемо $\chi _ ( набл ) ^2 $.

Занесемо всі отримані значення таблицю

\begin(array) (|l|l|l|l|l|l|l|) (( n_i -n_i" ))^2 ) ( n_i" ) & Контроль~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4,43438& -3.43438& 11,7950& 2,659895& \\ \hline 2& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \line 3& 3& 4,43438& -1,43438& 2,05744& 3& 4 ,43438& -1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 5& 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,118 45117& 0,552765& 8,11838 \\ \hline & & & & & \sum = \chi _ ( набл ) ^2 =3,261119& \chi _ ( набл ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i " ) -n ) = 3,63985 \ \ \ hline \ end (array)

$ \ chi _ (кр) ^ 2 ((0,05,3)) = 7,8 $

$ \ chi _ ( Набл ) ^ 2<\chi _ { кр } ^2 =3,26<7,8$

Висновоквідкидати гіпотезу немає підстав.

Призначення критерію 2 - критерію Пірсона Критерій 2 застосовується у двох цілях: 1) для зіставлення емпіричного розподілу ознаки з теоретичним - рівномірним, нормальним або якимось іншим; 2) для зіставлення двох, трьох або більше емпіричних розподілів однієї й тієї ж ознаки. Опис критерію Критерій χ 2 відповідає питанням про те, чи однаковою частотою зустрічаються різні значення ознаки в емпіричному і теоретичному розподілах чи двох і більше емпіричних розподілах. Перевага методу полягає в тому, що він дозволяє зіставляти розподіл ознак, представлених у будь-якій шкалі, починаючи від шкали найменувань. У найпростішому випадку альтернативного розподілу "так - ні", "допустив шлюб - не допустив шлюбу", "вирішив завдання - не вирішив завдання" і т.п. ми вже можемо застосувати критерій 2 . Чим більше розбіжність між двома розподілами, тим більше емпіричне значення χ 2 . Автоматичний розрахунок χ 2 – критерію Пірсона Щоб зробити автоматичний розрахунок χ 2 – критерію Пірсона, необхідно виконати дії у два кроки: Крок 1. Вказати кількість емпіричних розподілів (від 1 до 10); Крок 2. Занести до таблиці емпіричні частоти; Крок 3. Отримати відповідь.

Перевагою критерію Пірсона є його універсальність: з його допомогою можна перевіряти гіпотези про різні закони розподілу.

1. Перевірка гіпотези про розподіл.

Нехай отримано вибірку досить великого обсягу пз великою кількістю різних значень варіант. Для зручності її обробки розділимо інтервал від найменшого до найбільшого значень варіант на sрівних частин і вважатимемо, що значення варіант, що потрапили в кожен інтервал, приблизно рівні числу, що задає середину інтервалу. Підрахувавши число варіантів, що потрапили в кожен інтервал, складемо так звану згруповану вибірку:

варіанти……….. х 1 х 2 … х s

частоти…………. п 1 п 2 … п s ,

де х i– значення середин інтервалів, а п i- Число варіант, що потрапили в i-і інтервал (емпіричні частоти).



За отриманими даними можна обчислити вибіркове середнє та вибіркове середнє квадратичне відхилення σ В. Перевіримо припущення, що генеральна сукупність розподілена за нормальним законом із параметрами M(X) = , D(X) = . Тоді можна знайти кількість чисел із вибірки обсягу п, що має опинитися у кожному інтервалі при цьому припущенні (тобто теоретичні частоти). Для цього за таблицею значень функції Лапласа знайдемо ймовірність влучення в i-і інтервал:

,

де а iі b i- Межі i-го інтервалу. Помноживши отримані ймовірності обсяг вибірки п, знайдемо теоретичні частоти: п i = n · p iНаша мета – порівняти емпіричні та теоретичні частоти, які, звичайно, відрізняються один від одного, і з'ясувати, чи є ці відмінності несуттєвими, що не спростовують гіпотезу про нормальний розподіл досліджуваної випадкової величини, або вони настільки великі, що суперечать цій гіпотезі. Для цього використовується критерій у вигляді випадкової величини

. (20.1)

Сенс її очевидний: додаються частини, які квадрати відхилень емпіричних частот від теоретичних складають від відповідних теоретичних частот. Можна довести, що незалежно від реального закону розподілу генеральної сукупності закон розподілу випадкової величини (20.1) при прагненні до закону розподілу (див. лекцію 12) з числом ступенів свободи k = s - 1 – r, де r- Число параметрів передбачуваного розподілу, оцінених за даними вибірки. Нормальний розподіл характеризується двома параметрами, тому k = s - 3. Для обраного критерію будується правостороння критична область, яка визначається умовою

(20.2)

де α - Рівень значимості. Отже, критична область задається нерівністю а сфера прийняття гіпотези - .

Отже, для перевірки нульової гіпотези Н 0: генеральна сукупність розподілена нормально - потрібно обчислити за вибіркою значення критерію:

, (20.1`)

а по таблиці критичних точок розподілу 2 знайти критичну точку , використовуючи відомі значення α і k = s - 3. Якщо - нульову гіпотезу приймають, за її відкидають.

2. Перевірка гіпотези про рівномірний розподіл.

При використанні критерію Пірсона для перевірки гіпотези про рівномірний розподіл генеральної сукупності з ймовірністю ймовірності

необхідно, обчисливши за наявною вибіркою значення, оцінити параметри аі bза формулами:

де а*і b*- оцінки аі b. Дійсно, для рівномірного розподілу М(Х) = , звідки можна отримати систему для визначення а*і b*: , Рішенням якої є вирази (20.3).

Потім, припускаючи, що , можна знайти теоретичні частоти за формулами

Тут s- Число інтервалів, на які розбита вибірка.

Значення критерію Пірсона, що спостерігається, обчислюється за формулою (20.1`), а критичне – за таблицею з урахуванням того, що число ступенів свободи k = s - 3. Після цього межі критичної галузі визначаються так само, як і для перевірки гіпотези про нормальний розподіл.

3. Перевірка гіпотези про показовий розподіл.

У цьому випадку, розбивши наявну вибірку на рівні по довжині інтервали, розглянемо послідовність варіантів, рівновіддалених один від одного (вважаємо, що всі варіанти, що потрапили в i- й інтервал, що приймають значення, що збігається з його серединою), і відповідних їм частот n i(число варіант вибірки, що потрапили в i- й інтервал). Обчислимо за цими даними та приймемо як оцінку параметра λ величину. Тоді теоретичні частоти обчислюються за формулою

Потім порівнюються спостерігане та критичне значення критерію Пірсона з урахуванням того, що число ступенів свободи k = s - 2.

Критерій згоди Пірсона:

Приклад 1. Використовуючи критерій Пірсона, за рівня значимості 0.05 перевірити, чи узгоджується гіпотеза про нормальному розподілі генеральної сукупності X з емпіричним розподілом вибірки обсягу n = 200.

Рішеннязнаходимо за допомогою калькулятора.

x iКількість, f ix i * f iНакопичена частота, S(x - x ср) * f(x - x ср) 2 * f(x - x ср) 3 * fЧастота, f i /n
5 15 75 15 114.45 873.25 -6662.92 0.075
7 26 182 41 146.38 824.12 -4639.79 0.13
9 25 225 66 90.75 329.42 -1195.8 0.13
11 30 330 96 48.9 79.71 -129.92 0.15
13 26 338 122 9.62 3.56 1.32 0.13
15 21 315 143 49.77 117.95 279.55 0.11
17 24 408 167 104.88 458.33 2002.88 0.12
19 20 380 187 127.4 811.54 5169.5 0.1
21 13 273 200 108.81 910.74 7622.89 0.065
200 2526 800.96 4408.62 2447.7 1

.
Середня виважена


Показники варіації.
.

R = X max - X min
R = 21 - 5 = 16
Дисперсія


Незміщена оцінка дисперсії


Середнє квадратичне відхилення.

Кожне значення ряду відрізняється від середнього значення 12.63 трохи більше, ніж 4.7
.

.
нормальному закону




n = 200, h = 2 (ширина інтервалу), σ = 4.7, x ср = 12.63

ix iu iφ in* i
1 5 -1.63 0,1057 9.01
2 7 -1.2 0,1942 16.55
3 9 -0.77 0,2943 25.07
4 11 -0.35 0,3752 31.97
5 13 0.0788 0,3977 33.88
6 15 0.5 0,3503 29.84
7 17 0.93 0,2565 21.85
8 19 1.36 0,1582 13.48
9 21 1.78 0,0804 6.85
in in* in i -n * i(n i -n * i) 2(n i -n * i) 2 / n * i
1 15 9.01 -5.99 35.94 3.99
2 26 16.55 -9.45 89.39 5.4
3 25 25.07 0.0734 0.00539 0.000215
4 30 31.97 1.97 3.86 0.12
5 26 33.88 7.88 62.14 1.83
6 21 29.84 8.84 78.22 2.62
7 24 21.85 -2.15 4.61 0.21
8 20 13.48 -6.52 42.53 3.16
9 13 6.85 -6.15 37.82 5.52
200 200 22.86



Її межу K kp = χ 2 (k-r-1;α) знаходимо за таблицями розподілу «хі-квадрат» і заданим значенням σ, k = 9, r=2 (параметри x cp та σ оцінені за вибіркою).
Kkp(0.05;6) = 12.59159; Kнабл = 22.86
Значення статистики Пірсона, що спостерігається, потрапляє в критичну область: Кнабл > Kkp, тому є підстави відкидати основну гіпотезу. Дані вибірки розподілені не за нормальним законом. Інакше кажучи, емпіричні і теоретичні частоти різняться значимо.

Приклад 2. Використовуючи критерій Пірсона, за рівня значимості 0.05 перевірити, чи узгоджується гіпотеза про нормальному розподілі генеральної сукупності X з емпіричним розподілом вибірки обсягу n = 200.
Рішення.
Таблиця до розрахунку показників.

x iКількість, f ix i * f iНакопичена частота, S(x - x ср) * f(x - x ср) 2 * f(x - x ср) 3 * fЧастота, f i /n
0.3 6 1.8 6 5.77 5.55 -5.34 0.03
0.5 9 4.5 15 6.86 5.23 -3.98 0.045
0.7 26 18.2 41 14.61 8.21 -4.62 0.13
0.9 25 22.5 66 9.05 3.28 -1.19 0.13
1.1 30 33 96 4.86 0.79 -0.13 0.15
1.3 26 33.8 122 0.99 0.0375 0.00143 0.13
1.5 21 31.5 143 5 1.19 0.28 0.11
1.7 24 40.8 167 10.51 4.6 2.02 0.12
1.9 20 38 187 12.76 8.14 5.19 0.1
2.1 8 16.8 195 6.7 5.62 4.71 0.04
2.3 5 11.5 200 5.19 5.39 5.59 0.025
200 252.4 82.3 48.03 2.54 1

Показники центру розподілу.
Середня виважена


Показники варіації.
Абсолютні показники варіації.
Розмах варіації - різниця між максимальним та мінімальним значеннями ознаки первинного ряду.
R = X max - X min
R = 2.3 - 0.3 = 2
Дисперсія- характеризує міру розкиду біля її середнього значення (заходи розсіювання, тобто відхилення від середнього).


Незміщена оцінка дисперсії- Заможна оцінка дисперсії.


Середнє квадратичне відхилення.

Кожне значення ряду відрізняється від середнього значення 1.26 трохи більше, ніж 0.49
Оцінка середньоквадратичного відхилення.

Перевірка гіпотез про вид розподілу.
1. Перевіримо гіпотезу про те, що Х розподілено за нормальному законуза допомогою критерію згоди Пірсона.

де n * i - теоретичні частоти:

Обчислимо теоретичні частоти, враховуючи, що:
n = 200, h = 0.2 (ширина інтервалу), σ = 0.49, x ср = 1.26

ix iu iφ in* i
1 0.3 -1.96 0,0573 4.68
2 0.5 -1.55 0,1182 9.65
3 0.7 -1.15 0,2059 16.81
4 0.9 -0.74 0,3034 24.76
5 1.1 -0.33 0,3765 30.73
6 1.3 0.0775 0,3977 32.46
7 1.5 0.49 0,3538 28.88
8 1.7 0.89 0,2661 21.72
9 1.9 1.3 0,1691 13.8
10 2.1 1.71 0,0909 7.42
11 2.3 2.12 0,0422 3.44

Порівняємо емпіричні та теоретичні частоти. Складемо розрахункову таблицю, з якої знайдемо значення критерію:

21.72 -2.28 5.2 0.24 9 20 13.8 -6.2 38.41 2.78 10 8 7.42 -0.58 0.34 0.0454 11 5 3.44 -1.56 2.42 0.7 ∑ 200 200 12.67

Визначимо межу критичної галузі. Оскільки статистика Пірсона вимірює різницю між емпіричним і теоретичним розподілами, чим більше її спостерігається значення K набл, тим більше аргумент проти основний гіпотези.
Тому критична область для цієї статистики завжди є правосторонньою: )