Біографії Характеристики Аналіз

Довірчий інтервал. Довірча ймовірність

ДОВІРНІ ІНТЕРВАЛИ ДЛЯ ЧАСТОТ І ДОЛІЙ

© 2008 р.

Національний інститут громадського здоров'я, м. Осло, Норвегія

У статті описується та обговорюється розрахунок довірчих інтервалів для частот і часток за методами Вальда, Вілсона, Клоппера – Пірсона, за допомогою кутового перетворення та за методом Вальда з корекцією по Агресті – Коуллу. Викладений матеріал дає загальні відомості про способи розрахунку довірчих інтервалів для частот і часток і покликаний викликати інтерес читачів журналу не лише до використання довірчих інтервалів при поданні результатів власних досліджень, а й до прочитання спеціалізованої літератури перед початком роботи над майбутніми публікаціями.

Ключові слова: довірчий інтервал, частота, частка

В одній з попередніх публікацій коротко згадувалося опис якісних даних і повідомлялося, що їх інтервальна оцінка переважно точковою для опису частоти народження характеристики, що вивчається в генеральній сукупності . Справді, оскільки дослідження проводяться з використанням вибіркових даних, проекція результатів на генеральну сукупність має містити елемент неточності вибіркової оцінки. Довірчий інтервал є мірою точності параметра, що оцінюється. Цікаво, що у деяких книгах з основ статистики для медиків тема довірчих інтервалів для частот повністю ігнорується. У статті ми розглянемо кілька способів розрахунку довірчих інтервалів для частот, маючи на увазі такі характеристики вибірки, як безповторність і репрезентативність, і навіть незалежність спостережень друг від друга. Під частотою в цій статті розуміється не абсолютне число, що показує, скільки разів зустрічається в сукупності те чи інше значення, а відносна величина, що визначає частку учасників дослідження, у яких зустрічається ознака, що вивчається.

У біомедичних дослідженнях найчастіше використовуються 95% довірчі інтервали. Цей довірчий інтервал є область, у яку потрапляє справжнє значення частки 95 % випадків. Іншими словами, можна з 95% надійністю сказати, що справжнє значення частоти народження ознаки в генеральній сукупності перебуватиме в межах 95% довірчого інтервалу.

У більшості посібників зі статистики для дослідників від медицини повідомляється, що помилка частоти розраховується за допомогою формули

де p – частота народження ознаки у вибірці (величина від 0 до 1). У більшості вітчизняних наукових статей вказується значення частоти ознак ознаки у вибірці (р), а також її помилка (s) у вигляді p ± s. Доцільніше, проте, представляти 95% довірчий інтервал для частоти ознак ознаки в генеральній сукупності, який включатиме значення від

до.

У деяких посібниках рекомендується при малих вибірках замінювати значення 1,96 значення t для N – 1 ступенів свободи, де N – кількість спостережень у вибірці. Значення t знаходиться за таблицями для t-розподілу, що є практично у всіх посібниках зі статистики. Використання розподілу t для методу Вальда не дає видимих ​​переваг у порівнянні з іншими методами, розглянутими нижче, і тому деякими авторами не вітається.

Наведений вище метод розрахунку довірчих інтервалів для частот або часток носить ім'я Вальда на честь Авраама Вальда (Abraham Wald, 1902-1950), оскільки широке застосування його почалося після публікації Вальда і Вольфовіца в 1939 . Однак сам метод був запропонований П'єром Симоном Лапласом (1749-1827) ще 1812 року.

Метод Вальда дуже популярний, проте його застосування пов'язане із суттєвими проблемами. Метод не рекомендується при малих обсягах вибірок, а також у випадках, коли частота народження ознаки прагне до 0 або 1 (0 % або 100 %) і просто неможливо для частот 0 і 1. Крім того, апроксимація нормального розподілу, яка використовується при розрахунку помилки , «не працює» у випадках, коли n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Оскільки нова змінна має нормальний розподіл, нижня та верхня межі 95 % довірчого інтервалу для змінної φ дорівнюватимуть φ-1,96 і φ+1,96left">

Замість 1,96 для малих вибірок рекомендується підставляти значення t для N – 1 ступенів свободи. Даний метод не дає негативних значень і дозволяє точніше оцінити довірчі інтервали для частот, ніж метод Вальда. Крім того, він описаний у багатьох вітчизняних довідниках із медичної статистики, що, щоправда, не призвело до його широкого використання у медичних дослідженнях. Розрахунок довірчих інтервалів з використанням кутового перетворення не рекомендується за частот, що наближаються до 0 або 1 .

На цьому опис способів оцінки довірчих інтервалів у більшості книг з основ статистики для дослідників-медиків зазвичай закінчується, причому ця проблема характерна не тільки для вітчизняної, а й для зарубіжної літератури. Обидва методи ґрунтуються на центральній граничній теоремі, яка має на увазі наявність великої вибірки.

Зважаючи на недоліки оцінки довірчих інтервалів за допомогою вищезгаданих методів, Клоппер (Clopper) і Пірсон (Pearson) запропонували в 1934 спосіб розрахунку так званого точного довірчого інтервалу з урахуванням біномного розподілу досліджуваного ознаки . Цей метод доступний у багатьох онлайн-калькуляторах, проте довірчі інтервали, отримані таким чином, здебільшого надто широкі. У той самий час цей метод рекомендується застосовувати у випадках, коли необхідна консервативна оцінка. Ступінь консервативності методу збільшується зі зменшенням обсягу вибірки, особливо при N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

На думку багатьох статистиків, найбільш оптимальну оцінку довірчих інтервалів для частот здійснює метод Вілсона (Wilson), запропонований ще в 1927 році, але практично не використовується у вітчизняних біомедичних дослідженнях. Даний метод не тільки дозволяє оцінити довірчі інтервали як для дуже малих і дуже великих частот, але і застосовується для малого числа спостережень. У загальному вигляді довірчий інтервал за формулою Вілсон має вигляд від



де приймає значення 1,96 при розрахунку 95% довірчого інтервалу, N - кількість спостережень, а р - частота ознаки у вибірці. Цей метод доступний в онлайн-калькуляторах, тому його застосування не є проблематичним. і не рекомендують використовувати цей метод при n · p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Вважається, що крім методу Вілсон метод Вальда з корекцією по Агресті - Коуллу також дає оптимальну оцінку довірчого інтервалу для частот. Корекція по Агрести – Коуллу являє собою заміну у формулі Вальда частоти народження ознаки у вибірці (р) на р`, при розрахунку якої до чисельника додається 2, а до знаменника додається 4, тобто p` = (X + 2) / (N + 4), де Х - кількість учасників дослідження, у яких є ознака, що вивчається, а N - обсяг вибірки . Така модифікація призводить до результатів, дуже схожих на результати застосування формули Вілсона, за винятком випадків, коли частота події наближається до 0% або 100%, а вибірка мала. Крім вищезгаданих способів розрахунку довірчих інтервалів для частот були запропоновані поправки на безперервність як для методу Вальда, так і для методу Вілсона для малих вибірок, проте дослідження показали, що їхнє застосування недоцільно.

Розглянемо застосування вищеописаних методів розрахунку довірчих інтервалів на двох прикладах. У першому випадку ми вивчаємо велику вибірку, що складається з 1 000 випадково відібраних учасників дослідження, з яких 450 мають ознаку, що вивчається (це може бути фактор ризику, результат або будь-яка інша ознака), що становить частоту 0,45, або 45%. У другому випадку дослідження проводиться з використанням малої вибірки, припустимо, всього 20 осіб, причому ознака, що вивчається, є всього у 1 учасника дослідження (5%). Довірчі інтервали методом Вальда, методом Вальда з корекцією по Агрести – Коуллу, методом Вілсона розраховувалися з допомогою онлайн-калькулятора, розробленого Jeff Sauro (http://www. /wald. htm). Довірчі інтервали за методом Вілсона з поправкою на безперервність розраховувалися за допомогою калькулятора, запропонованого порталом Wassar Stats: http://faculty.vassar.edu/lowry/prop1.html. Розрахунки за допомогою кутового перетворення Фішера проводилися «вручну» з використанням критичного значення t для 19 та 999 ступенів свободи відповідно. Результати розрахунків представлені у таблиці для обох прикладів.

Довірчі інтервали, розраховані шістьма різними способами для двох прикладів, описаних у тексті

Спосіб розрахунку довірчого інтервалу

Р=0,0500, чи 5%

95% ДІ для X=450, N=1000, Р=0,4500, або 45%

–0,0455–0,2541

Вальда з корекцією по Агресті – Коуллу

<,0001–0,2541

Вілсона з корекцією на безперервність

«Точний метод» Клоппера – Пірсона

Кутове перетворення

<0,0001–0,1967

Як видно з таблиці, для першого прикладу довірчий інтервал, розрахований за «загальноприйнятим» методом Вальда входить у негативну область, для частот бути неспроможна. На жаль, подібні казуси нерідкі у вітчизняній літературі. Традиційний спосіб представлення даних у вигляді частоти та її помилки частково маскує цю проблему. Наприклад, якщо частота народження ознаки (у відсотках) представлена ​​як 2,1 ± 1,4, то це не настільки «ріже око», як 2,1 % (95 % ДІ: –0,7; 4,9), хоч і означає те саме. Метод Вальда з корекцією по Агресті - Коуллу і розрахунок за допомогою кутового перетворення дають нижню межу, що прагне нуля. Метод Вілсона з поправкою на безперервність і «точний метод» дають ширші довірчі інтервали ніж метод Вілсона. Для другого прикладу всі методи дають приблизно однакові довірчі інтервали (відмінності з'являються тільки в тисячних), що не дивно, так як частота події в цьому прикладі не сильно відрізняється від 50%, а обсяг вибірки досить великий.

Для читачів, що зацікавилися даною проблемою, можна порекомендувати роботи R. G. Newcombe та Brown, Cai та Dasgupta, в яких наводяться плюси та мінуси застосування 7 та 10 різних методів розрахунку довірчих інтервалів відповідно. З вітчизняних посібників рекомендується книга і , в якій, крім докладного опису теорії, представлені методи Вальда, Вілсона, а також спосіб розрахунку довірчих інтервалів з урахуванням біномного розподілу частот. Крім безкоштовних онлайн-калькуляторів (http://www. /wald. htm та http://faculty. vassar. edu/lowry/prop1.html) довірчі інтервали для частот (і не тільки!) можна розраховувати за допомогою програми CIA ( Confidence Intervals Analysis), яку можна завантажити з http://www. medschool. soton. ac. uk/cia/ .

У наступній статті будуть розглянуті одновимірні методи порівняння якісних даних.

Список літератури

Банержі А.Медична статистика зрозумілою мовою: вступний курс / А. Банержі. - М.: Практична медицина, 2007. - 287 с. Медична статистика/. - М.: Медичне інформаційне агентство, 2007. - 475 с. Гланц.Медико-біологічна статистика/С. Гланц. - М.: Практика, 1998. Типи даних, перевірка розподілу та описова статистика // Екологія людини – 2008. – № 1. – С. 52–58. Жіжин К. С. Медична статистика: навчальний посібник / . - Ростов н / Д: Фенікс, 2007. - 160 с. Прикладна медична статистика / . - СПб. : Фоліант, 2003. - 428 с. Лакін Г. Ф. Біометрія/. - М.: Вища школа, 1990. - 350 с. Медик В. А. Математична статистика у медицині / , . - М.: Фінанси та статистика, 2007. - 798 с. Математична статистика у клінічних дослідженнях / , . - М.: ГЕОТАР-МЕД, 2001. - 256 с. Юнкерів В. І. Медико-статистична обробка даних медичних досліджень / . - СПб. : ВмедА, 2002. - 266 с. Agresti A. Approximate is better than exact for interval estimation of binomial proportions / A. Agresti, B. Coull // American statistician. - 1998. - N 52. - С. 119-126. Altman D. Statistics with confidence // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. Brown L. D. Interval estimation for binomial proportion / L. D. Brown, T. T. Cai, A. Dasgupta // Statistical science. - 2001. - N 2. - P. 101-133. Clopper CJ.Використання confidence або fiducial limits ілюструється в випадку binomial / C. J. Clopper, E. S. Pearson / / Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. На конфіденційний період для binomial parameter / M. A. Garcia-Perez // Quality and quantity. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitive biostatistics // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R. G.Двоє-сиденних confidence intervals for single proportion: Comparison of Seven Methods / R. G. Newcombe // Statistics in Medicine. - 1998. - N. 17. - P. 857-872. Sauro J.Прийнятий монтаж швидких слів від невеликих випадків, використовуючи індивідуальні confidence intervals: comparisons and recomendations / J. Sauro, J. R. Lewis // Proceedings of human factors and ergonomics social annual meeting. - Orlando, FL, 2005. Wald A.Конфіденційні обмеження для постійного розповсюдження функцій // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105-118. Wilson E. B. Досвідчена інформація, право визнання, і статистична інформація / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

CONFIDENCE INTERVALS FOR PROPORTIONS

A. M. Grjibovski

National Institute of Public Health, Oslo, Norway

article presents several methods for calculations confidence intervals for binomial proportions, namely, Wald, Wilson, arcsine, Agresti-Coull and exact Clopper-Pearson methods. Уроки тільки загальні введення в проблему confidence interval estimation of binomial proportion and its aim is notly to stimulate the readers to used confidence intervals when presenting results of own empirical research, but also to encourage them to consult statistics books prior analysing own data and preparing manuscripts.

Key words: confidence interval, proportion

Контактна інформація:

старший радник Національного інституту громадського здоров'я, м. Осло, Норвегія

Розум полягає не лише у знанні, а й у вмінні докладати знання на ділі. (Арістотель)

Довірчі інтервали

Загальний огляд

Взявши вибірку з популяції, ми отримаємо точкову оцінку параметра, що цікавить нас, і обчислимо стандартну помилку для того, щоб вказати точність оцінки.

Однак, для більшості випадків стандартна помилка як така не є прийнятною. Набагато корисніше поєднати цей захід точності з інтервальної оцінкою для параметра популяції.

Це можна зробити, використовуючи знання про теоретичний розподіл ймовірності вибіркової статистики (параметра) для того, щоб обчислити довірчий інтервал (CI - Confidence Interval, ДІ - Довірчий інтервал) для параметра.

Взагалі, довірчий інтервал розширює оцінки обидві сторони деякою величиною, кратною стандартної помилки (даного параметра); два значення (довірчі межі), що визначають інтервал, зазвичай відокремлюють комою і укладають у дужки.

Довірчий інтервал для середнього

Використання нормального розподілу

Вибірковий середній має нормальний розподіл, якщо обсяг вибірки великий, тому можна застосувати знання про нормальний розподіл під час розгляду вибіркового середнього.

Зокрема, 95% розподілу вибіркових середніх перебуває у межах 1,96 стандартних відхилень (SD) середньої популяції.

Коли ми маємо лише одну вибірку, ми називаємо це стандартною помилкою середнього (SEM) і обчислюємо 95% довірчого інтервалу для середнього таким чином:

Якщо повторити цей експеримент кілька разів, то інтервал міститиме справжнє середнє популяції в 95% випадків.

Зазвичай це довірчий інтервал як, наприклад, інтервал значень, у якого з довірчою ймовірністю 95% перебуває справжнє середнє популяції (генеральне середнє).

Хоча це не цілком строго (середнє у популяції є фіксоване значення і тому не може мати ймовірність, віднесену до нього) таким чином інтерпретувати довірчий інтервал, але концептуально зручніше для розуміння.

Використання t-розподілу

Можна використовувати нормальний розподіл, якщо знати значення дисперсії у популяції. Крім того, коли обсяг вибірки невеликий, вибіркове середнє відповідає нормальному розподілу, якщо дані, що лежать в основі популяції, нормально розподілені.

Якщо дані, що лежать в основі популяції, розподілені ненормально та/або невідома генеральна дисперсія (дисперсія в популяції), середнє вибіркове підпорядковується t-розподілу Стьюдента.

Обчислюємо 95% довірчий інтервал для генерального середнього у популяції наступним чином:

Де - процентна точка (процентиль) t-розподіл Стьюдента з (n-1) ступенями свободи, яка дає двосторонню ймовірність 0,05.

Взагалі вона забезпечує ширший інтервал, ніж при використанні нормального розподілу, оскільки враховує додаткову невизначеність, яку вводять, оцінюючи стандартне відхилення популяції та/або через невеликий обсяг вибірки.

Коли обсяг вибірки великий (близько 100 і більше), різниця між двома розподілами ( t-Стьюдентата нормальним) незначна. Проте завжди використовують t-розподіл при обчисленні довірчих інтервалів, навіть якщо об'єм вибірки великий.

Зазвичай вказують 95% ДІ. Можна обчислити інші довірчі інтервали, наприклад, 99% ДІ для середнього.

Замість добутку стандартної помилки та табличного значення t-розподілу, який відповідає двосторонній ймовірності 0,05, множать її (стандартну помилку) на значення, яке відповідає двосторонній ймовірності 0,01. Це ширший довірчий інтервал, ніж у випадку 95%, оскільки він відображає збільшену довіру до того, що інтервал дійсно включає середню популяцію.

Довірчий інтервал для пропорції

Вибірковий розподіл пропорцій має біномний розподіл. Однак якщо обсяг вибірки nрозумно великий, тоді вибірковий розподіл пропорції приблизно нормально із середнім.

Оцінюємо вибірковим ставленням p=r/n(де r- кількість індивідуумів у вибірці з цікавими для нас характерними особливостями), і стандартна помилка оцінюється:

95% довірчий інтервал для пропорції оцінюється:

Якщо обсяг вибірки невеликий (зазвичай коли npабо n(1-p)менше 5 ), тоді необхідно використовувати біномне розподіл для того, щоб обчислити точні довірчі інтервали.

Зауважте, що якщо pвиражається у відсотках, то (1-p)замінюють на (100-p).

Інтерпретація довірчих інтервалів

При інтерпретації довірчого інтервалу нас цікавлять такі питання:

Наскільки широкий довірчий інтервал?

Широкий довірчий інтервал свідчить про те, що оцінка неточна; тонкий вказує на точну оцінку.

Ширина довірчого інтервалу залежить від розміру стандартної помилки, яка, своєю чергою, залежить від обсягу вибірки і під час розгляду числової змінної від мінливості даних дають ширші довірчі інтервали, ніж дослідження численного набору даних небагатьох змінних.

Чи включає ДІ якісь значення, що становлять особливий інтерес?

Можна перевірити, чи можливе значення для параметра популяції в межі довірчого інтервалу. Якщо так, то результати узгоджуються з цим можливим значенням. Якщо ні, то малоймовірно (для 95% довірчого інтервалу шанс майже 5%), що параметр має це значення.

Довірчий інтервал– граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде у цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається у файлі Word (див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладена величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції посаді Московської Північної митниці було взято як випадкової повторної вибірки 20 проб продукту «А». В результаті перевірки встановлено середню вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте з ймовірністю 0,683 межі середньої вологості продукту в усій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, дорівнювала 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0 ,99 інтервальну оцінку для математичного очікування цієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування абсолютної величини не більше, ніж на 2.

Класифікація довірчих інтервалів

По виду оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому відборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.
Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

У статистиці існує два види оцінок: точкові та інтервальні. Точкова оцінкає окремою вибірковою статистикою, яка використовується для оцінки параметра генеральної сукупності. Наприклад, вибіркове середнє - це точкова оцінка математичного очікування генеральної сукупності, а вибіркова дисперсія S 2- точкова оцінка дисперсії генеральної сукупності σ 2. було показано, що середнє вибіркове є незміщеною оцінкою математичного очікування генеральної сукупності. Вибіркове середнє називається незміщеним, оскільки середнє значення всіх вибіркових середніх (при тому самому обсязі вибірки n) дорівнює математичному очікуванню генеральної сукупності.

Для того щоб вибіркова дисперсія S 2стала незміщеною оцінкою дисперсії генеральної сукупності σ 2, знаменник вибіркової дисперсії слід покласти рівним n – 1 , а не n. Інакше висловлюючись, дисперсія генеральної сукупності є середнім значенням різноманітних вибіркових дисперсій.

Оцінюючи параметрів генеральної сукупності слід пам'ятати, що вибіркові статистики, такі як , залежить від конкретних вибірок. Щоб врахувати цей факт, для отримання інтервальної оцінкиматематичного очікування генеральної сукупності аналізують розподіл вибіркових середніх (докладніше див.). Побудований інтервал характеризується певним довірчим рівнем, який є ймовірністю того, що справжній параметр генеральної сукупності оцінений правильно. Аналогічні довірчі інтервали можна застосовувати для оцінки частки ознаки рта основної розподіленої маси генеральної сукупності.

Завантажити нотатку у форматі або , приклади у форматі

Побудова довірчого інтервалу для математичного очікування генеральної сукупності за відомого стандартного відхилення

Побудова довірчого інтервалу для частки ознаки у генеральній сукупності

У цьому розділі поняття довірчого інтервалу поширюється на дані категорій. Це дозволяє оцінити частку ознаки у генеральній сукупності рза допомогою вибіркової частки рS= Х/n. Як вказувалося, якщо величини nрі n(1 – р)перевищують число 5, біноміальний розподіл можна апроксимувати нормальним. Отже, для оцінки частки ознаки у генеральній сукупності рможна побудувати інтервал, довірчий рівень якого дорівнює (1 – α)х100%.


де pS- вибіркова частка ознаки, рівна Х/n, тобто. кількості успіхів, поділеному на обсяг вибірки, р- частка ознаки у генеральній сукупності, Z- критичне значення стандартизованого нормального розподілу, n- Обсяг вибірки.

приклад 3.Припустимо, що з інформаційної системи вилучено вибірку, що складається зі 100 накладних, заповнених протягом останнього місяця. Припустимо, що 10 із цих накладних складено з помилками. Таким чином, р= 10/100 = 0,1. Довірчого рівня 95% відповідає критичне значення Z = 1,96.

Таким чином, ймовірність того, що від 4,12% до 15,88% накладних містять помилки, дорівнює 95%.

Для заданого обсягу вибірки довірчий інтервал, що містить частку ознаки в генеральній сукупності, здається ширшим, ніж безперервної випадкової величини. Це тим, що вимірювання безперервної випадкової величини містять більше інформації, ніж вимірювання категорійних даних. Інакше висловлюючись, категорійні дані, які набувають лише два значення, містять недостатньо інформації з метою оцінки параметрів їх розподілу.

Уобчислення оцінок, вилучених із кінцевої генеральної сукупності

Оцінка математичного очікування.Поправочний коефіцієнт кінцевої генеральної сукупності ( fpc) використовувався зменшення стандартної помилки в раз. При обчисленні довірчих інтервалів для оцінок параметрів генеральної сукупності поправний коефіцієнт застосовується у ситуаціях, коли вибірки отримують без повернення. Таким чином, довірчий інтервал для математичного очікування, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

приклад 4.Щоб проілюструвати застосування поправочного коефіцієнта для кінцевої генеральної сукупності, повернемося до завдання про обчислення довірчого інтервалу для середньої суми накладних, розглянутої вище в прикладі 3. Припустимо, що за місяць у компанії виписуються 5000 накладних, причому = 110,27 дол., S= 28,95 дол., N = 5000, n = 100, α = 0,05, t 99 = 1,9842. За формулою (6) отримуємо:

Оцінка частки ознаки.При виборі без повернення довірчий інтервал для частки ознаки, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

Довірчі інтервали та етичні проблеми

При вибірковому дослідженні генеральної сукупності та формулюванні статистичних висновків часто виникають етичні проблеми. Основна з них – як узгоджуються довірчі інтервали та точкові оцінки вибіркових статистик. Публікація точкових оцінок без вказівки відповідних довірчих інтервалів (як правило, що мають 95% довірчий рівень) та обсягу вибірки, на основі яких вони отримані, може породити непорозуміння. Це може створити в користувача враження, що точкова оцінка - саме те, що йому необхідно, щоб передбачити властивості всієї генеральної сукупності. Таким чином, необхідно розуміти, що в будь-яких дослідженнях в основу повинні бути поставлені не точкові, а інтервальні оцінки. З іншого боку, особливу увагу слід приділяти правильному вибору обсягів вибірки.

Найчастіше об'єктами статистичних маніпуляцій стають результати соціологічних опитувань населення з тих чи інших політичних проблем. При цьому результати опитування виносять на перші сторінки газет, а помилку вибіркового дослідження та методологію статистичного аналізу друкують десь у середині. Щоб довести обґрунтованість одержаних точкових оцінок, необхідно вказувати обсяг вибірки, на основі якої вони отримані, межі довірчого інтервалу та його рівень значущості.

Наступна замітка

Використовуються матеріали книги Левін та ін. Статистика менеджерів. - М.: Вільямс, 2004. - с. 448–462

Центральна гранична теоремастверджує, що з досить великому обсязі вибірок вибірковий розподіл середніх можна апроксимувати нормальним розподілом. Це властивість залежить від виду розподілу генеральної сукупності.

"Катрен-Стиль" продовжує публікацію циклу Костянтина Кравчика про медичну статистику. У попередніх статтях автор стосувався пояснення таких понять, як і .

Костянтин Кравчик

Математик-аналітик. Спеціаліст у галузі статистичних досліджень у медицині та гуманітарних науках

Місто Москва

Дуже часто в статтях з клінічних досліджень можна зустріти загадкове словосполучення: «довірчий інтервал» (95% ДІ або 95% CI - confidence interval). Наприклад, у статті може бути написано: «Для оцінки значущості відмінностей використовували t-критерій Стьюдента з розрахунком 95% довірчого інтервалу».

Якого ж значення «95% довірчого інтервалу» і навіщо його розраховувати?

Що таке довірчий інтервал? - Це діапазон, в якому знаходяться справжні середні значення у генеральній сукупності. А що, бувають несправжні середні значення? У певному сенсі так, бувають. Ми пояснювали, що неможливо виміряти цікавий параметр у всій генеральній сукупності, тому дослідники задовольняються обмеженою вибіркою. У цій вибірці (наприклад, за масою тіла) є одне середнє значення (певна вага), за яким ми і судимо про середнє значення у всій генеральній сукупності. Однак навряд чи середня вага у вибірці (особливо невелика) збігається із середньою вагою в генеральній сукупності. Тому більш правильно розраховувати та користуватися діапазоном середніх значень генеральної сукупності.

Наприклад, уявимо, що 95% довірчий інтервал (95% ДІ) по гемоглобіну становить від 110 до 122 г/л. Це означає, що з ймовірністю 95% справжнє середнє значення по гемоглобіну в генеральній сукупності перебуватиме в межах від 110 до 122 г/л. Іншими словами, ми не знаємо середній показник гемоглобіну в генеральній сукупності, але можемо з 95% ймовірністю вказати діапазон значень для цієї ознаки.

Довірчий інтервал особливо доречний для різниці середніх значеннях між групами або, як це називають, у розмірі ефекту.

Припустимо, ми порівнювали ефективність двох препаратів заліза: давно присутнього на ринку і щойно зареєстрованого. Після курсу терапії оцінили концентрацію гемоглобіну в досліджуваних групах пацієнтів, і статистична програма нам визнала, що різниця між середніми значеннями двох груп з ймовірністю 95% знаходиться в діапазоні від 1,72 до 14,36 г/л (табл. 1).

Табл. 1. Критерій для незалежних вибірок
(порівнюються групи за рівнем гемоглобіну)

Трактувати це слід так: у частини пацієнтів генеральної сукупності, яка приймає новий препарат, гемоглобін буде вищим у середньому на 1,72–14,36 г/л, ніж у тих, хто приймав уже відомий препарат.

Іншими словами, в генеральній сукупності різниця в середніх значеннях по гемоглобіну у груп з 95% ймовірністю знаходиться в цих межах. Судити, багато це чи мало буде вже дослідник. Сенс всього цього в тому, що ми працюємо не з одним середнім значенням, а з діапазоном значень, отже, ми вірогідніше оцінюємо різницю за параметром між групами.

У статистичних пакетах, на розсуд дослідника, можна самостійно звужувати чи розширювати межі довірчого інтервалу. Знижуючи ймовірність довірчого інтервалу, ми звужуємо діапазон середніх. Наприклад, при 90% ДІ діапазон середніх (або різниці середніх) буде вже, ніж при 95%.

І навпаки, збільшення ймовірності до 99% розширює діапазон значень. При порівнянні груп нижня межа ДІ може перетнути нульову позначку. Наприклад, якщо ми розширили межі довірчого інтервалу до 99%, то межі інтервалу розташувалися від –1 до 16 г/л. Це означає, що в генеральній сукупності є групи, відмінність середніх між якими за ознакою, що вивчається, дорівнює 0 (М = 0).

З допомогою довірчого інтервалу можна перевіряти статистичні гіпотези. Якщо довірчий інтервал перетинає нульове значення, то нульова гіпотеза, яка передбачає, що групи не відрізняються за параметром, що вивчається, вірна. Приклад описаний вище, коли ми розширили межі до 99%. Десь у генеральній сукупності у нас знайшлися групи, які не відрізнялися.

95% довірчий інтервал різниці по гемоглобіну, (г/л)


На малюнку у вигляді лінії зображено 95% довірчий інтервал різниці середніх значень по гемоглобіну між двома групами. Лінія проходить нульову позначку, отже, має місце різниця між середніми значеннями, що дорівнює нулю, що підтверджує нульову гіпотезу про те, що групи не відрізняються. Діапазон різниці між групами лежить від -2 до 5 г/л. Це означає, що гемоглобін може знизитися на 2 г/л, так і підвищитися на 5 г/л.

Довірчий інтервал – дуже важливий показник. Завдяки йому можна подивитися, чи були відмінності в групах дійсно за рахунок різниці середніх або за рахунок великої вибірки, тому що при великій вибірці шанси знайти відмінності більше, ніж за малої.

Насправді це може виглядати так. Ми взяли вибірку в 1000 осіб, виміряли рівень гемоглобіну та виявили, що довірчий інтервал різниці середніх лежить від 1,2 до 1,5 г/л. Рівень статистичної значущості у своїй p

Ми бачимо, що концентрація гемоглобіну підвищилася, але практично непомітно, отже, статистична значимість з'явилася за рахунок обсягу вибірки.

Довірчий інтервал може бути вирахований як для середніх значень, але й пропорцій (і відносин ризиків). Наприклад, нас цікавить довірчий інтервал пропорцій пацієнтів, які досягли ремісії, приймаючи розроблені ліки. Припустимо, що 95% ДІ для пропорцій, тобто для частки таких пацієнтів, лежить в межах 0,60-0,80. Таким чином, ми можемо сказати, що наші ліки мають терапевтичний ефект від 60 до 80% випадків.