Біографії Характеристики Аналіз

Перевірка гіпотез щодо параметрів розподілу. Перевірка гіпотез щодо параметрів нормального розподілу

Зупинимося тепер на прикладах статистичних критеріїв, при цьому важливі критерії, що стосуються кореляційно-регресійного аналізу, будуть обговорюватися у відповідних розділах. Тут ми наведемо кілька прикладів статистичних критеріїв, призначених для перевірки простих статистичних гіпотез щодо числових параметрів аналізованих законів розподілу ймовірностей.

Загальна схема статистичної перевіркигіпотез :

  1. Формулюється основна H 1 та альтернативна H 1 гіпотези.
  2. Вибирається відповідний рівень значення a.
  3. Визначається обсяг вибірки n.
  4. Вибирається критерій K для перевірки H 0 .
  5. Будується критична область і сфера прийняття гіпотези (відповідно до обраної альтернативної гіпотезою).
  6. Обчислюється значення критерію K, що спостерігається набл(За даними вибірки).
  7. Приймається статистичне рішення(якщо K наблпотрапляє у сферу прийняття рішень, немає підстав відхиляти основну гіпотезу, тобто. вона приймається, якщо K наблпотрапляє у критичну область, то основна гіпотеза відкидається).

Критерії перевірки гіпотез про числових значенняхпараметрів нормального розподілунаведено у таблиці 3.

Таблиця 3.7

H 0 Припущення Статистика критерію H 1 Область прийняття рішення
a=a 0 s 2 відомо a¹ a 0
a>a 0
a<a 0
s 2 невідомо a¹ a 0
a>a 0
a<a 0
aневідомо

Перевірка статистичних гіпотез із використанням критеріїв значимості може бути проведена на основі довірчих інтервалів. Для всіх параметричних гіпотез Для всіх параметричних гіпотез область прийняття гіпотези H 0: q=q 0 лише на рівні значимості a збігається з довірчим інтерваломдля параметра q за довірчої ймовірності 1–a. У цьому односторонньому критерію значимості відповідає односторонній довірчий інтервал, а двосторонньому критерію значимості – двосторонній довірчий інтервал. Гіпотеза H 0 приймається якщо значення q 0 накривається відповідним довірчим інтервалом; інакше гіпотеза H 0 відкидається.



Якщо перевіряється гіпотеза H 0:q = q 0 то розглядається довірчий інтервал для різниці q 1 -q 2 . Гіпотеза приймається, якщо довірчий інтервал різниці параметрів q 1 –q 2 накриває нульові значення. Для перевірки гіпотези про рівність двох дисперсій H 0: будується довірчий інтервал для відношення дисперсій. У цьому випадку гіпотеза H 0 приймається, якщо довірчий інтервал накриває значення, що дорівнює одиниці.

Приклад 3.11.Стверджується, що кульки, виготовлені верстатом-автоматом, мають середній діаметр d 0 =10 мм. У вибірці з n=16 кульок середній діаметр виявився рівним мм. Перевірити нульову гіпотезу H 0: , вважаючи, що дисперсія відома і дорівнює s 2 =1 мм 2 . Вважати рівень значимості a = 0,05.

Рішення.Введемо статистичний критерій:

який за справедливості нульової гіпотези H 0 , має стандартний нормальний розподіл N(0; 1). Нехай альтернативна гіпотеза має вигляд H 1: , то критична область матиме двосторонній вигляд: (–¥;– Z крит)È( Z крит;+¥), де Z критвизначається за умови

,

Оскільки

не потрапляє в критичну область, немає підстав відхиляти нульову гіпотезу, тобто. що кульки, виготовлені верстатом-автоматом, мають середній діаметр 10 мм.

Це завдання можна вирішити і за допомогою довірчих інтервалів. Ми вже розбирали, що довірчий інтервал для нормальної випадкової величини при відомому s має вигляд

.

Оскільки t 0,95 = 1,96, то

Так як d 0 =10Î(9,84; 10,76), то гіпотеза H 0 приймається. â

Приклад 3.12.Аналізується дохід Xфірм у галузі, що має нормальний розподіл. Передбачається, що середній дохід у цій галузі становить не менше 1 млн. доларів. За вибіркою з 49 фірм отримані такі дані: млн. $ і s = 0,15 млн. $. Чи не суперечать ці результати висунутої гіпотези за рівня значущості a = 0,01?

Рішення.Сформулюємо основну та альтернативну гіпотези:

Для перевірки гіпотези H 0 будуємо критерій

.

Критична область буде лівосторонньою, тому

.

Оскільки T набл=–4,67<–2,404=T крит, то H 0 має бути відхилена на користь H 1 , що дає підставу вважати, що середній дохід у галузі менше, ніж 1 млн. $. â

Приклад 3.13.Точність роботи верстата-автомата, який заповнює пакети порошком, визначається збігом ваги пакетів. Дисперсія ваги не повинна перевищувати 25 г 2 . За вибіркою з 20 пакетів визначено дисперсію s 2 =30 г 2 . Визначте, чи потрібне термінове налагодження верстата на рівні значущості a=0,05.

Рішення.

Розрахуємо значення критерію, що спостерігається

.

Знайдемо критичне значення критерію

.

Так як , то немає підстав відхиляти основну гіпотезу H 0, тобто. Наявні дані не дають підстави вважати, що верстат вимагає термінового налагодження. â

3.5.3. Перевірка гіпотез щодо порівняння параметрів
генеральної сукупності

При аналізі багатьох економічних показників доводиться порівнювати дві генеральні сукупності. Наприклад, можна порівнювати рівні життя двох країнах за розміром доходу душу населення; можна порівнювати два варіанти інвестування за розмірами середніх дивідендів; якість знань студентів двох університетів – за середнім балом на комплексному тестовому іспиті. У цих випадках логічно провести порівняння за схемою аналізу рівності математичних очікувань двох генеральних сукупностей Xі Y.

Розглянемо дві випадкові величини X~N(a 1 ,s 1) та Y~ N(a 2, 2), кожна з яких підпорядковується нормальному закону розподілу. Нехай є дві незалежні вибірки з обсягами n 1 та n 2 із генеральних сукупностей Xі Y. Необхідно перевірити нульову гіпотезу H 0: M[ X]=M[ Y]. Нульова гіпотеза в наведеному формулюванні є складною, оскільки вона справедлива за будь-яких a=M[ X]=M[ Y], проте може бути зведена до простої, якщо розглядати різницю середніх, тобто. H 0: M[ X]–M[ Y]=0.

Щодо параметрів і можна виділити чотири варіанти припущень:

a) обидві дисперсії відомі та рівні між собою;

b) обидві дисперсії відомі, але нерівні між собою;

c) обидві дисперсії невідомі, але передбачається, що вони рівні між собою;

d) обидві дисперсії невідомі та їхня рівність не передбачається.

Критерії перевірки гіпотез про числові значення параметрів нормального розподілу наведені в таблиці 3.8. Зазначимо, що у таблиці 3.8 варіант a) розглядається як окремий випадок варіанта b). У разі невідомих дисперсій, рівність яких не передбачається, використовується аналог статистики варіанта b) із заміною невідомих дисперсій їх оцінками

У цій ситуації вказати точний розподіл запровадженої статистики важко. Відомо, однак, що цей розподіл близький до розподілу Стьюдента з числом ступенів свободи, що дорівнює

. (3.30)

Критерій перевірки влаштований так само, як і для варіанта c).

Таким чином, для вибору відповідної перевірочної статистики у разі, коли генеральні дисперсії невідомі, необхідно знати, яке припущення приймається. Насамперед потрібно вирішити, чи можна вважати невідомі генеральні дисперсії рівними чи ні. Для ухвалення рішення використовують F-Критерій Фішера (див. далі).

Таблиця 3.9

H 0 Припущення Статистика критерію H 1 Область прийняття рішення
a 1 =a 2 , відомі a 1 ¹ a 2
a 1 >a 2
a 1 <a 2
, невідомі, але рівні , де a 1 ¹ a 2
a 1 >a 2
a 1 <a 2

Найчастіше при порівнянні двох економічних показників першому плані виходить аналіз розкиду значень аналізованих випадкових величин. Наприклад, при вирішенні питання про інвестування в одну із двох галузей гостро стоїть проблема ризику вкладень. При порівнянні рівнів життя двох країнах середньодушові доходи можуть виявитися приблизно рівними. Зіставивши розкид у доходах, ми отримуємо точніше уявлення про них. Аналіз, аналогічний описаному вище, доцільно проводити шляхом порівняння дисперсій досліджуваних випадкових величин.

Нехай X~N(a 1 ,s 1) та Y~ N(a 2 ,s 2), причому їхнє середньо квадратичні відхилення s 1 і s 2 невідомі. Висувається гіпотеза про рівність дисперсій. Однак це гіпотеза в наведеному формулюванні є складною, тому замість цієї гіпотези розглядається інша, проста гіпотеза щодо дисперсій, тобто. .

Як критерій перевірки гіпотези H 0 приймають випадкову величину

визначається відношення більшої виправленої вибіркової дисперсії до меншої (). Якщо нульова гіпотеза H 0 вірна, то дана статистика має F-розподіл Фішера з n 1 = n 1 -1 і n 2 = n 2 -1 ступенями свободи. Різні випадки використання цього критерію Фішера наведено у таблиці 3.8.

Таблиця 3.8

H 0 Припущення Статистика критерію H 1 Область прийняття рішення
a 1 , a 2 невідомі , ()

Приклад 3.14.Компанія з виробництва цукрового піску має виробничі лінії для наповнення мішечків цукровим піском. кг. Використовуючи дані, зібрані протягом тривалого часу, керуючий оцінює генеральне стандартне відхилення маси мішечків, що поставляються з лінії А 0,02 кг(s 1) та з лінії B 0,04 кг(S 2). З лінії Aбуло взято випадкову вибірку обсягом n 1 = 10 мішечків і знайдено середню масу вмісту в мішечках. Подібна вибірка обсягом n 2 = 12 мішечків була взята з лінії Bі знайдено середню масу. Чи є якась підстава припускати, що дві виробничі лінії розвішують цукровий пісок по мішечках, середня маса яких відрізняється?

Рішення.Сформулюємо основну та альтернативну гіпотези, що відповідають умові задачі:

, .

Оскільки генеральні дисперсії (і) відомі, перевіримо суттєвість різниці між вибірковими середніми, використовуючи нормальний розподіл на рівні значущості a = 0,01. Обчислюємо значення критерію, що спостерігається

Оскільки критична область має двосторонній вигляд, то критичне значення критерію буде визначається за умови

,

Через війну отримуємо, що | Z набл|крит, тобто. немає підстав відхиляти нульову гіпотезу. Отже, можна вважати, що мішечки, наповнені цукром двох виробничих лініях, мають однакову середню масу. â

Приклад 3.15.Для дослідження якості масла були зроблені вибірки по 10 одиниць із кожної послідовної серії ( n 1 та n 2) та визначено частку води у відсотках xу кожній вибірці. У першій серії середній відсоток становив із виправленим середнім квадратичним відхиленням. Для другої серії середній відсоток води становив із середнім квадратичним відхиленням. Чи є підстави припускати на 5%-му рівні важливості, що дві серії олії мають різну масову частку води?

Рішення.Сформулюємо основну та альтернативну гіпотези, що відповідають умові задачі:

, .

Оскільки генеральні дисперсії ( і ) невідомі, слід попередньо перевірити про рівність генеральних дисперсій, тобто. перевіряємо нульову гіпотезу з відповідною альтернативною гіпотезою:

спостерігається значення критерію Фішера:

.

Тут вчено, що . Оскільки, відповідно до обраної альтернативної гіпотезою, критична область буде двосторонньою, то визначає критичне значення критерію Фішера:

В результаті отримуємо, що F наблкрит, тобто. немає підстав відхиляти нульову гіпотезу. Отже, можна вважати, що дві генеральні дисперсії рани одна одній.

Продовжимо тепер випробування гіпотез про рівність двох генеральних середніх. Для цього обчислимо спостерігається значення відповідного критерію Стьюдента:

.

Оскільки критична область також буде двосторонньою, то відповідне критичне значення критерію Стьюдента дорівнюватиме:

.

В результаті отримуємо, що T набл>T крит, тобто. нульова гіпотеза відхиляється. Отже, можна вважати, що дві серії проб мають різний вміст води (за масою). â

Додаток 1.
МЕТОД МОМЕНТІВ

Вище ми розглянули методи оцінки числових характеристикгенеральної сукупності, не прив'язуючись до будь-якої функції розподілу. Однак для повного опису генеральної сукупності слід знати її функцію розподілу. Якщо відомий вид функції розподілу, залишається оцінити лише її параметри. Для визначення використовуються різноманітні методи. Один з них - метод моментів, Що полягає в наступному. Визначаються вибіркові моменти (наприклад, математичне очікування, дисперсію) у кількості, що дорівнює кількості параметрів, що оцінюються, і прирівнюються відповідним теоретичним моментам розподілу, що є функціями від невідомих параметрів.

Приклад 3.16.Знайти методом моментів оцінки параметрів aта s нормального розподілу:

.

Рішення.Для відшукання двох параметрів необхідно мати два рівняння щодо цих параметрів. Наслідуючи метод моментів, прирівняємо, наприклад, початковий теоретичний момент 1-го порядку (математичне очікування): емпіричному моменту 1-го порядку (середньому значенню): , а також центральний теоретичний момент
2-го порядку (дисперсію): центральний момент 2-го порядку (виправленої вибіркової дисперсії): . В результаті одержуємо два рівняння:

з яких і знаходимо шукані оцінки. â

Приклад 3.17.Знайти методом моментів оцінку параметра l розподілу Пуассона:

,

де , l>0.

Рішення.Завдання вирішимо двома способами.

а) Порівняємо початкові моменти 1-го порядку, тобто. математичні очікування: Оскільки для розподілу Пуассона, то отримаємо

б) Порівняємо початкові моменти 2-го порядку. Для розподілу Пуассона тоді. Тоді

.

Оцінки різні. За змістом параметра розподілу Пуассона краще віддати перевагу першій оцінці.

Як бачимо, невизначеність вибору початкових моментів призводить до отримання різних оцінок однієї й тієї ж параметра. Однак метод моментів зазвичай призводить до заможних оцінок. Це означає, що з досить великих вибірках різницю між різними оцінками буде незначним. Недолік методу моментів у тому, що його оцінки (за рідкісним винятком) – неефективні. Тому метод моментів використовується практично тільки як перше наближення, ґрунтуючись на яких можна отримати більш ефективні оцінки. Популярність методу моментів у тому, що рівняння методу моментів у часто є досить простими та його рішення пов'язані з великими математичними труднощами. â

Додаток 2.
МЕТОД МАКСИМАЛЬНОЇ ПРАВДОПОДІБИ

Як ми бачили, різні методи оцінювання тих самих параметрів розподілу можуть давати різні результати. Коли є кілька шляхів до однієї мети, звичайно, хочеться вибрати найкращий. При певних обмеженнях таким методом є метод максимальної правдоподібності, що ґрунтується на оптимальному використанні наявної у вибірці інформації про параметри розподілу.

Нехай X 1 , X 2 , …, X nможливі результати незалежних спостережень випадкової величини X. Це означає, що X 1 , X 2 , …, X n- незалежні випадкові величини, причому закон розподілу будь-якої з них збігається із законом розподілу величини X. Припустимо, що вид розподілу величини Xзаданий, але невідомий параметр q яким визначається цей закон. Введемо функцію

де у разі вихідного безперервного розподілу інтерпретується як густина розподілу випадкової величини X i, а дискретному випадку - як ймовірність того, що випадкова величина X iнабуде значення x i. функцію від випадкових величин X i, що розглядається як функцію параметра q, називають функцією правдоподібності.

Оцінкою методу максимальної правдоподібності (ММП-оцінкою)параметра q називається таке значення , при якому функція правдоподібності досягає найбільшого можливого значення:

Відомо, що точка максимуму не зміниться, якщо замість L(q) використовувати ln L(q). Тоді, відповідно до необхідної умови екстремуму функції, отримаємо такі рівняння правдоподібності:

, (3.14)

знаходження оцінки параметра q.

Приклад 3.18.Знайти методом максимальної правдоподібності оцінки параметрів aта s нормального розподілу.

Рішення.Згідно з формулою (3.13), функція правдоподібності для нормального розподілу матиме вигляд

Логарифмуючи її, отримаємо

Знайдемо приватні похідні за aта s:

, .

Прирівнюючи приватні похідні нулю, отримаємо систему рівнянь:

З цих рівнянь знаходимо:

і .

Встановлено, що оцінка є заможною, незміщеною та ефективною оцінкою параметра a, а оцінка – заможною, зміщеною та асимптотично ефективною оцінкою параметра s 2 . â

Приклад 3.19.Знайти методом максимальної правдоподібності оцінку параметра розподілу Пуассона.

Рішення.Логарифмічна функція правдоподібності в даному випадку, побудована за вибіркою x 1 ,x 2 ,…,x n, матиме вигляд

Звідси після диференціювання з l отримуємо рівняння максимальної правдоподібності

.

.

Встановлено, що ця оцінка є заможною, незміщеною та ефективною оцінкою параметра l. â

Показано, що ММП-оцінки є заможними, асимптотично незміщеними, асимптотично нормальнимиі асимптотично ефективними. Все це зробило метод максимальної правдоподібності вельми популярним. Було відкрито, що для багатьох завдань різної статистичної природи ММП дає добрі результати. Єдина складність полягає у складності розв'язання рівнянь правдоподібності (3.14). Тому дуже тривалий час ММП застосовували лише для теоретичних розрахунків. Однак у час сучасні статистичні пакети для ЕОМ починають включати методи ММП, що спрощує практичне використання ММП.

Не слід думати, що ММП-оцінки будуть найкращими у всіх ситуаціях. По перше, їх хороші властивості виявляються часто лише за дуже великих обсягах вибірки (тобто є асимптотичними), отже за малих nз ними можуть конкурувати (і навіть перевершувати їх) інші способи. По-друге, і це, мабуть, головне «вузьке місце» даного підходу, для побудови ММП-оцінок та забезпечення їх добрих властивостей необхідно точне знання типу аналізованого закону розподілу f(x;q), що у більшості випадків виявляється практично нереальним. Часто буває так, що за певних, хоч і невеликих, відхилень реального розподілу від прийнятого розподілу f(x;q), оцінки можуть різко втрачати свої «хороші» властивості. У зв'язку з цим останніми роками розвиваються т.зв. робасні, або стійкі, методи оцінювання, що дозволяють знаходити оцінки, хоч і не є найкращими в рамках передбачуваного закону розподілу, але мають досить стійкі властивості при відхиленні реального закону від передбачуваного. І, по-третє, ММП-оцінки можуть бути навіть заможними, Якщо кількість оцінюваних за вибіркою параметрів велике (має той самий порядок, що і обсяг вибірки) і зростає зі збільшенням числа спостережень.

Додаток 3.
КРИТЕРІЇ УГОДИ

Часто функція розподілу випадкової величини буває заздалегідь невідомою, і виникає необхідність її визначення за емпіричними даними. У багатьох випадках з деяких додаткових міркувань можуть бути зроблені припущення про вид функції розподілу F(x). В економетриці часто використовують нормальний розподіл, проте в деяких випадках може виникнути питання законності використання нормального розподілу в тому чи іншому конкретному випадку. У разі потрібно використовувати статистичні критерії, які обгрунтовували той чи інший вибір розподілу.

Будь-яке припущення про вид розподілу називається статистичною гіпотезою і математично виражається співвідношенням ( F(xH 0 ), де H 0 – безліч функцій розподілу. Якщо безліч H 0 складається з одного елемента, то гіпотеза називається простою. При статистичній перевірці основної гіпотези H 0 формулюють також альтернативну гіпотезу ( F(xH 1 ), де H 1 - безліч функцій розподілу, що не перетинається з безліччю H 0 . Якщо H 1 – безліч всіх F(x), які не входять до H 0 , це безліч зазвичай взагалі згадують. Безліч H 0 та H 1 у кожному задачі визначаються логічними, фізичними та іншими умовами задачі.

Розглянемо випадок простої гіпотези ( F(x)=F теор(x)). Нехай X 1 , X 2 , …, X n- Випадкова вибірка випадкової величини Xі нехай – емпірична функція розподілу. Визначимо деякий невід'ємний захід Dвідхилення емпіричної функції розподілу від передбачуваної теоретичної функції розподілу F теор(x). Величину D=D{F(x),F теор(x)) можна визначити багатьма способами, відповідно до яких виходять різні критерії для перевірки цікавої для нас гіпотези: критерій хі-квадрат Пірсона, Колмогорова, омега-квадрат Мізеса, Смирновата інші.

Найбільш поширеним є критерій, введений К. Пірсоном, що призводить до розподілу з 2 ( з 2-критерій Пірсона ). Розглянемо цей критерій. Для цього розіб'ємо безліч значень випадкової величини Xна rінтервалів S 1 , S 2 , … ,S rбез загальних точок. Нехай p i- Імовірність того, що величина Xналежить інтервалу S i; n i- Кількість величин з числа спостережуваних X 2 , …, X n, що належать інтервалу S i. За міру Dвідхилення емпіричної функції розподілу від теоретичної F теор(x) приймають величину

. (3.32)

Величина c 2 випадкова і цікавить її розподіл у припущенні, що прийнята гіпотеза правильна, тобто. F(x)=F теор(x). Відповідь на це запитання дає теорема Пірсона:

Теорема. Якою б не була функція розподілу F теор (x) випадкової величини X, при n®¥ розподіл величини c 2 прагне c 2 –розподілу з (r–1) ступенями свободи.

Повністю певний гіпотетичний теоретичний розподіл трапляється практично досить рідко. Набагато частіше теоретичний розподіл F теор(x;q 1, ..., q k) містить деякі невідомі параметри q 1, ..., q k, Значення яких доводиться оцінювати за вибіркою. В результаті критерій Пірсона матиме вигляд

. (3.33)

Проте скористатися теоремою Пірсона у разі вже не можна, оскільки значення q 1, ..., q kневідомі. Якщо ж у наведеному вираженні величини q 1, ..., q kзамінити їх оцінками за вибіркою, то величини p i(q 1, ..., q k) вже будуть випадковими величинами, тому й у разі застосовувати теорему Пірсона не можна.

Відмітимо, що при n®¥ розподіл величини c 2 , якщо параметри q 1 ,…,q оцінюються за методом максимальної правдоподібності, є розподілом c 2 з (r–1-k) ступенями свободи(теорема Фішера). Таким чином, наявність оцінюваних за вибіркою параметрів (якщо оцінка проводиться за методом максимальної правдоподібності) не змінює характеру граничного розподілу величини c 2 а лише зменшує число ступенів свободи цього граничного розподілу настільки одиниць, яке число оцінюваних параметрів. У цьому полягає одна з переваг критерію Пірсона.

Зазначимо, що критерій Пірсона застосовується лише за досить великих вибірках ( n t50) і досить високі частоти ( n i³5). Якщо остання умова не виконується для будь-якого інтервалу варіаційного ряду, його об'єднують із сусіднім інтервалом, відповідно зменшуючи загальну кількість інтервалів.

Схема застосування критерію згоди Пірсонаперевірки гіпотези про передбачуваний закон невідомого розподілу:

1) Обчислюються параметри передбачуваного закону розподілу.

2) Обчислюються теоретичні частоти.

3) Обчислюють величину .

4) За обчисленим числом ступенів свободи n= r–1–k, де r- Число інтервалів вибірки, k- Число параметрів розподілу і за обраним рівнем значимості a по таблицях розподілу c 2 знаходять .

5) Якщо , то немає підстав відхиляти нульову гіпотезу, якщо – нульова гіпотеза відкидається.

Приклад 3.20.По розподілу, заданому таблицею (таб. 3.9), з'ясувати з допомогою критерію Пірсона чи можна лише на рівні значимості a=0,05 вважати, що генеральна сукупність має нормальне розподіл.

Рішення.У припущенні, що має місце нормальний розподіл, можна оцінити її два параметри

, .

ПЕРЕВІРКА СТАТИСТИЧНИХ ГІПОТЕЗ

Постановка задачі

У звичайній промові слово «гіпотеза» означає припущення. У статистиці - це припущення про вид закону розподілу («дана генеральна сукупність нормально розподілена»), про значення його параметрів («генеральне середнє дорівнює нулю»), про однорідність даних («ці дві вибірки вилучені з однієї генеральної сукупності»). Статистична перевірка гіпотези полягає у з'ясуванні того, чи узгоджуються результати спостережень (вибіркові дані) з нашим припущенням.

Результатом такої перевірки може бути негативна відповідь: вибіркові дані суперечать висловлену гіпотезу, тому від неї слід відмовитися. В іншому випадку ми отримуємо відповідь невід'ємна: вибіркові дані не суперечать гіпотезі, тому її можна прийняти як один з допустимих рішень (але не єдино вірного).

Статистична гіпотеза, яка перевіряється, називається Основний (нульовий) та позначається Гіпотеза, яка протиставляється основною, називається альтернативною (конкуруючою) та позначається Мета статистичної перевірки гіпотез: на підставі вибіркових даних прийняти рішення про справедливість основної гіпотези або відхилити на її користь альтернативну.

Оскільки перевірка здійснюється виходячи з вибірки, а чи не всієї генеральної сукупності, існує ймовірність, можливо, дуже мала, помилкового укладання.

Так, нульова гіпотеза може бути знехтувана, тоді як насправді в генеральній сукупності вона є справедливою. Таку помилку називають помилкою першого роду , А її ймовірність - рівнем значимості і позначають Можливо, що нульова гіпотеза приймається, тоді як у генеральній сукупності справедлива альтернативна гіпотеза. Таку помилку називають помилкою другого роду, та її ймовірність позначають (табл. 6.1).

Таблиця 6.1

Результати перевірки статистичної гіпотези

Перевірка статистичних гіпотез здійснюється з допомогою статистичного критерію . Статистичний критерій K- це правило (функція від результатів спостережень), що визначає міру розбіжності результатів спостережень із нульовою гіпотезою. Ймовірність називають потужністю критерію.

Під час перевірки статистичних гіпотез прийнято задавати заздалегідь рівень значущості (стандартні значення: 0.1, 0.05, 0.01, 0.001). Тоді з двох критеріїв, що характеризуються однією і тією самою ймовірністю вибирають той, якому відповідає менша помилка 2-го роду, тобто. велика потужність. Зменшити ймовірність обох помилок і водночас можна, збільшивши обсяг вибірки.

Значення критерію Kподіляються на дві частини: область допустимих значень (область прийняття гіпотези) та критичну область (Область прийняття гіпотези). Критична область складається з тих же значень критерію До, які малоймовірні за справедливості гіпотези . Якщо значення критерію K, Розраховане за вибірковими даними, потрапляє в критичну область, то гіпотеза відкидається на користь альтернативної або ми стверджуємо, що немає підстав відхиляти гіпотезу.

приклад.Для підготовки до заліку викладач сформулював 100 питань (генеральна сукупність) та вважає, що студенту можна поставити «зараховано», якщо той знає 60% питань (критерій). Викладач задає студенту 5 питань (вибірка з генеральної сукупності) та ставить «зараховано», якщо правильних відповідей не менше трьох. Гіпотеза: «студент курс засвоїв», а безліч - сфера прийняття цієї гіпотези. Критичною областю є безліч - правильних відповідей менше трьох, у разі основна гіпотеза відкидається на користь альтернативної «студент курс не засвоїв, знає менше 60 % питань».

Студент Авивчив 70 питань зі 100, але відповів правильно лише на два з п'яти, запропонованих викладачем, - залік не зданий. У цьому випадку викладач робить помилку першого роду.

Студент Бвивчив 50 питань зі 100, але йому пощастило, і він відповів правильно на 3 питання - залік зданий, але зроблено помилку другого роду.

Викладач може зменшити ймовірність цих помилок, збільшивши кількість запитань, що задаються на заліку.

Щоб збудувати критичну область, потрібно знати закон розподілу статистики Kза умови, що гіпотеза справедлива. Рівень значущості (імовірність значенню потрапити в критичну область) визначає «розмір» критичної області, а конкуруюча гіпотеза - «форму» критичної області. Наприклад, якщо перевіряється гіпотеза а як альтернатива - то критична область буде правосторонньою (рис. 6.1, а). При альтернативі критична область – лівостороння (рис. 6.1, б). При альтернативі критична область – двостороння (рис. 6.1, в). У всіх цих випадках при заданому рівні значимості заштрихована площа становить % від усієї площі під кривою густини розподілу статистики K.

Алгоритм перевірки статистичних гіпотез зводиться до такого:

1) сформулювати основну та альтернативну гіпотези;

2) вибрати рівень значущості;

3) відповідно до видом гіпотези вибрати статистичний критерій щодо її перевірки, тобто. випадкову величину K, розподіл якої відомий;

4) за таблицями розподілу випадкової величини Kзнайти межу критичної галузі (вид критичної області визначити за видом альтернативної гіпотези);

5) за вибірковими даними обчислити значення критерію, що спостерігається

6) прийняти статистичне рішення: якщо потрапляє в критичну область – відхилити гіпотезу на користь альтернативної; якщо потрапляє до області допустимих значень, немає підстав відхиляти основну гіпотезу.

Перевірка гіпотез щодо параметрів розподілу

Загальна схема перевірки гіпотез

Поняття та класифікація статистичних гіпотез

Статистичною гіпотезою називається припущення щодо виду невідомого розподілу або параметрів відомих розподілів випадкової величини, що спостерігається.

Раніше в 5.2 розглядалися приклади 1, 2, де обчислювалися вибіркові характеристики, було побудовано полігон або гістограма. Можна припустити, що ця випадкова величина розподілена за одним із відомих законів. Наступний етап: потрібно перевірити, що експериментальні дані відповідають висловленої гіпотезі та прийняти її. Цей етап називається перевіркою статистичної гіпотези. Алгоритм перевірки гіпотези називається вирішальним правилом. Так як гіпотеза висувалась на основі вибіркових даних, то гіпотеза матиме імовірнісний характер.

До основних завдань математичної статистики належать:

  1. Статистична перевірка гіпотез щодо параметрів розподілу. І тут передбачається, що закон розподілу випадкової величини встановлено. Нехай сукупність розподілена за нормальним законом. Висувається гіпотеза про математичне очікування у передбачуваному діапазоні.
  2. Статистична перевірка гіпотез закон розподілу випадкової величини. Гіпотези про вид розподілу висуваються за умов недостатньої інформації про вибірці.

Практично експериментальні дані при великій вибірці наближаються до закону. Висунувши таку гіпотезу, далі слід знайти довірчі інтервали параметрів цього розподілу. Перевірювана гіпотеза називається нульовою (основною), найбільш правдоподібною з якихось міркувань, і позначають її H 0. Поряд з основною гіпотезою розглядають альтернативну (конкуруючу) гіпотезу H 1, Що суперечить основний. Висунута нульова гіпотеза потребує подальшої перевірки.

При цьому можуть бути допущені помилки двох типів:

  1. Помилка першого роду – відкинуто правильну гіпотезу;
  2. Помилка другого роду – прийнято неправильну гіпотезу.

Для перевірки нульової гіпотези використовують спеціально підібрану випадкову величину, точне або наближене розподіл якої відомо, позначають її через Z, якщо вона розподілена нормально, T – згідно із законом Стьюдента, c 2 – згідно із законом «хі-квадрат». Дана спеціально підібрана випадкова величина називається статистичним критерієм або критерієм значущості, який надалі позначатиметься через Z. Статистичний критерій служить для перевірки нульової гіпотези.

Наприклад, якщо перевіряють гіпотезу про рівність дисперсій двох нормальних генеральних сукупностей, то критерієм приймають відношення виправлених вибіркових дисперсій. Для перевірки гіпотези за даними вибірок обчислюють приватні значення входять у критерій величин і набувають значення критерію. Спостерігається значенням критерію Z набл називають значення критерію, обчислене за вибірками. Наприклад, якщо за двома вибірками знайдено вибіркові дисперсії d 1 =27; d 2 =9, то значення критерію, що спостерігається, дорівнює відношенню більшої виправленої дисперсії до меншої: Завдання перевірки гіпотез можна сформулювати наступним чином.



1. Потрібно знайти випадкову величину Z, яку ще називають статистикою критерію, що відповідає двом основним вимогам:

б) Розподіл критерію відомий у припущенні, що нульова гіпотеза вірна.

2. Після пошуку чи вибору статистики перебуває критична область. На числової осі виділяється область, потрапляння у яку випадкової величини малоймовірно. Мінімальна ймовірність задається, як і довірчих інтервалах, малим числом – a, яке називають рівнем значимості. Імовірність припуститися помилки першого роду (імовірність відкинути правильну гіпотезу) дорівнює a – рівню значимості.

Критичною областюназивають сукупність значень критерію Z, у яких нульову гіпотезу відкидають. Областю прийняття гіпотез називають сукупність значень критерію Z, у яких нульову гіпотезу приймають.

Критичними точками(Межами) - z kp називають точки, що відокремлюють критичну область від області прийняття гіпотези.

Розрізняють три види критичної галузі:

  • правостороння, що визначається нерівністю Z > z kp > 0;
  • лівостороння, що визначається нерівністю Z< z kp < 0;
  • двостороння, що визначається нерівністю Z< -z кр; Z >z кр.

Зокрема, якщо критичні точки симетричні щодо нуля, то двостороння критична область визначається нерівністю ? Z прийме значення, що лежать у критичній області, дорівнювала прийнятому рівню значимості. В результаті одержують:

  • для правосторонньої критичної галузі:
P (Z> z kp) = a; (7.1)
  • для лівосторонньої критичної області P (Z< z kp) = a;
  • для двосторонньої симетричної області P (Z> z kp) = a/2.

Основний принцип статистичної перевірки гіпотез полягає в наступному:

  • Якщо значення критерію Z набл, обчислене за даними вибірки, належить критичній області, то гіпотезу відкидають.
  • Якщо значення, що спостерігається, не належить критичній ділянці, то немає підстав відкидати гіпотезу.

Для кожного критерію є відповідні таблиці, що дозволяють a знайти критичні точки z kp , що задовольняють вимоги (7.1).

лабораторна робота 2.

ПЕРЕВІРКА ГІПОТЕЗ ПРО ПАРАМЕТРИ НОРМАЛЬНО РОЗПОДІЛЕНОЇ ГЕНЕРАЛЬНОЇ СУКУПНОСТІ

1. Короткі теоретичні положення

1.1. Основні поняття.

Гіпотеза – будь-яке твердження, висловлене щодо невідомого закону розподілу генеральної сукупності чи числових характеристик цього закону розподілу.

Висунута гіпотеза називається нульовий . Альтернативна гіпотеза- гіпотеза, протилежна.

гіпотези перевіряються за допомогою статистичних методів, то гіпотези – статистичні.

Статистична гіпотеза - Це закон розподілу деякої випадкової величини. У реального життяці гіпотези можуть бути такими:

гіпотези про ефективність певних ліків;

гіпотези про зростання доходів населення;

Гіпотези про визначення витрат чи витрат тощо.

Основними типами гіпотез, які перевіряються статистичними методами, є:

1. Гіпотези про тип закону розподілу випадкової величини.

Нехай - вибірка значень випадкової величини. З урахуванням вибірки можна припустити, що функція розподілу випадкової величини має конкретне розподіл. Потрібно перевірити, чи наше припущення не суперечить досвідченим даним.

2. Гіпотези про однорідність двох чи кількох генеральних сукупностей чи числових характеристик.

Наприклад, за вибірками значень двох випадкових величин і можна висунути гіпотезу про однакові закони розподілу цих вибірок або про однакові значення середніх дисперсій.

Наприклад, можна перевірити однакову ефективність двох видів ліків чи однакову якість товарів двох різних виробників.

3. Гіпотези про числові значення параметрів досліджуваної генеральної сукупності.

Наприклад, припустимо, що математичне очікування певної випадкової величини дорівнює конкретному числу.

Наприклад, можна висунути гіпотезу про те, що ймовірність складання іспиту певним студентом дорівнює 3/4.

1.2. Загальна схема статистичного критерію.

Правило перевірки гіпотез називається статистичним критерієм.

Усі критерії будуються за такою схемою:

1. Висувається нульова гіпотеза та альтернативна їй гіпотеза.

2. Заздалегідь вибирається рівень значимості. Оскільки гіпотеза перевіряється на підставі конкретної кількості досвідчених даних, то рішення супроводжується певною ймовірністю помилкового висновку, тобто з ймовірністю гіпотеза може бути відкинута, хоча насправді вона справедлива, або, навпаки, з ймовірністю гіпотеза може бути прийнята, хоча насправді вона неправильна. Імовірності помилок мають бути маленькими і вибираються заздалегідь.

Імовірність помилкового відхилення гіпотези називається рівнем важливості статистичного критерію.

До стандартних значень належать інші.

Наприклад, означає, що в 5-ти випадках зі 100 ми відкидатимемо правильну гіпотезу, але 5 помилок зі 100 випадків - це небагато.

3. Будується деяка функція від результатів спостережень , Яка називається статистикою. Статистика сама є випадковою величиною і за певної гіпотези має певний закон розподілу.

4. З таблиць розподілу статистики знаходять критичні значення для гіпотези , тобто. два числа і , які всю числову вісь ділять на 3 частини:

1 частина називається областю неприпустимо малих значень.

3 частина – область неприпустимо великих значень.

Інтервал називається областю правдоподібних значень.

Потрібно, щоб ймовірності неприпустимо малих та великих значень були невеликими. Зазвичай їх беруть рівними, тобто.

і .

Постановка задачі щодо перевірки статистичної гіпотези

Статистична гіпотеза – будь-яке припущення про вид закону розподілу досліджуваної змінної або параметри відомого розподілу.

Так, наприклад, можна припустити (висунути гіпотезу), що змінна X, що вивчається, розподілена за нормальним законом. У цій гіпотезі мова йдепро вид передбачуваного закону розподілу. Досить типова і така ситуація: закон розподілу змінної, що вивчається, відомий, але невідомі параметри цього розподілу. Тоді природно висунути гіпотезу у тому, що невідомий параметр належить, наприклад, заданому інтервалу.

Таким чином, статистичні гіпотези поділяються на дві групи:

· гіпотези про вид закону розподілу;

· гіпотези про параметри відомого закону розподілу (параметричні гіпотези).

Висувається гіпотезу називають нульовою (основною) і позначають через . Поряд з висунутою гіпотезою розглядають і гіпотезу, що їй суперечить. Гіпотезу, яка суперечить нульовій, називають конкуруючою (альтернативною) та позначають через ( = ).

Висунута гіпотеза, як і будь-яке припущення, насправді може бути або вірною, або невірною; тому виникає потреба її перевірки.

Вихідним матеріалом для перевірки висунутої гіпотези є вибіркові дані (вибірка).

Завдання перевірки гіпотези описово полягає в наступному: на заданому рівні значущості потрібно встановити, чи висунута гіпотеза узгоджується з вибірковими даними або суперечить їм.

Рівень значимості – можливість зробити помилку першого роду ( " ступінь ризику " ), тобто. можливість помилково відкинути правильну гіпотезу. Рівень значущості призначається дослідником; найчастіше приймають рівним 0,05 (5%) або 0,01 (1%), що відповідає практично незначному ризику, і тим самим забезпечують високу надійність правильного рішеннязавдання.

Основні принципи та необхідні етапи перевірки статистичної гіпотези

Для перевірки висунутої гіпотези використовується статистичний критерій (дозволяє правило), згідно з яким на підставі даних вибірки приймається рішення зберегти або відкинути нульову гіпотезу.

В основі критерію лежить його статистика Z –спеціально підбирається для висунутої гіпотези випадкова величина, закон розподілу якої досить добре вивчений (є таблиця квантилей цього розподілу).

Позначимо через безліч усіх можливих значень статистики Z. Це безліч розбивається на два непересічних підмножини і :

, ,

де - Область допустимих значень статистики Z;


- Критична область статистики Z.

Точки, що відокремлюють від , називаються критичними точками статистики. Z. Питання побудови критичної галузі ми тут розглядати не будемо, відзначимо лише, що .

За вибірковими даними (вибірці) обчислюється значення статистики: .

Критерій (дозволяє правило) перевірки висунутої гіпотези полягає в наступному:

1. Якщо , то гіпотеза відкидається.

2. Якщо , то гіпотеза зберігається (тобто вона узгоджується з вибірковими даними).

Зауважимо, що відкидають гіпотезу рішучіше, ніж приймають. Приймають гіпотезу дуже обережно. Справа в тому, що у разі висунута гіпотеза ще не доведена (за даними однієї обмеженої вибірки). Насправді для більшої впевненості прийняття гіпотези повторюють експеримент, збільшивши обсяг вибірки, і ще раз перевіряють гіпотезу (можливо іншими способами).

Отже, необхідними етапами перевірки статистичної гіпотези є:

· Формування вибірки;

· Висунення гіпотез і;

· Призначення рівня значущості;

· Вибір відповідної статистики Zдля перевірки ;

· Обчислення за вибіркою спостерігається значення статистики;

· Визначення по таблиці критичних точокстатистики Zта побудова критичної галузі;

· Прийняття рішення згідно з критерієм перевірки гіпотези.

Перевірка гіпотези про розподіл генеральної сукупності. Критерій Колмогорова

Для змінної, що вивчається C висувається статистична гіпотеза: C має нормальний закон розподілу Вихідним матеріалом для перевірки є вибіркові дані (вибірка). На заданому рівні важливості потрібно встановити, чи узгоджується висунута гіпотеза з вибірковими даними чи суперечить їм.

Перевірка гіпотези нормальності за критерієм Колмогорова заснована на порівнянні між собою емпіричної функції розподілу, отриманої за даними вибірки обсягу, та гіпотетичної (теоретичної) функції розподілу нормального закону. Близькість між ними оцінюється статистикою Колмогорова.