Биографии Характеристики Анализ

Доверителен интервал. Вероятност за доверие

ДОВЕРИТЕЛНИ ИНТЕРВАЛИ ЗА ЧЕСТОТИ И ЧАСТИ

© 2008

Национален институт по обществено здраве, Осло, Норвегия

Статията описва и обсъжда изчисляването на доверителните интервали за честоти и пропорции с помощта на методите на Wald, Wilson, Klopper-Pearson, използвайки ъгловата трансформация и метода на Wald с корекция на Agresti-Cowll. Представеният материал предоставя обща информация за методите за изчисляване на доверителни интервали за честоти и пропорции и има за цел да предизвика интереса на читателите на списанието не само към използването на доверителни интервали при представяне на резултатите от собствените си изследвания, но и към четене на специализирана литература, преди да започнат работа върху бъдещи публикации.

Ключови думи: доверителен интервал, честота, пропорция

В една от предишните публикации накратко беше споменато описанието на качествените данни и беше съобщено, че тяхната интервална оценка е за предпочитане пред точковата оценка за описание на честотата на поява на изследваната характеристика в общата популация. В действителност, тъй като проучванията се провеждат с използване на извадкови данни, проекцията на резултатите върху общата популация трябва да съдържа елемент на неточност в извадковата оценка. Доверителният интервал е мярка за точността на изчисления параметър. Интересно е, че в някои книги за основите на статистиката за лекари темата за доверителните интервали за честотите е напълно игнорирана. В тази статия ще разгледаме няколко начина за изчисляване на доверителни интервали за честотите, като се приемат характеристики на извадката като неповтаряне и представителност, както и независимостта на наблюденията едно от друго. Честотата в тази статия не се разбира като абсолютно число, показващо колко пъти тази или онази стойност се среща в съвкупността, а като относителна стойност, която определя дела на участниците в изследването, които имат изследваната черта.

В биомедицинските изследвания най-често се използват 95% доверителни интервали. Този доверителен интервал е областта, в която истинската пропорция попада в 95% от времето. С други думи, може да се каже с 95% сигурност, че истинската стойност на честотата на поява на черта в общата популация ще бъде в рамките на 95% доверителен интервал.

Повечето статистически учебници за медицински изследователи съобщават, че честотната грешка се изчислява с помощта на формулата

където p е честотата на поява на характеристиката в извадката (стойност от 0 до 1). В повечето вътрешни научни статии се посочва стойността на честотата на поява на характеристика в извадката (p), както и нейната грешка (и) под формата на p ± s. По-целесъобразно е обаче да се представи 95% доверителен интервал за честотата на срещане на даден признак в генералната популация, който да включва стойности от

преди.

В някои учебници за малки извадки се препоръчва стойността 1,96 да се замени със стойността на t за N - 1 степени на свобода, където N е броят на наблюденията в извадката. Стойността на t се намира в таблиците за t-разпределението, които са налични в почти всички учебници по статистика. Използването на разпределението на t за метода на Wald не осигурява видими предимства пред другите методи, обсъдени по-долу, и следователно не се приветства от някои автори.

Горният метод за изчисляване на доверителни интервали за честоти или фракции е кръстен на Ейбрахам Валд (Abraham Wald, 1902–1950), тъй като започва да се използва широко след публикацията на Валд и Волфовиц през 1939 г. Самият метод обаче е предложен от Пиер Симон Лаплас (1749–1827) още през 1812 г.

Методът на Wald е много популярен, но прилагането му е свързано със значителни проблеми. Методът не се препоръчва за малки размери на извадката, както и в случаите, когато честотата на поява на характеристика клони към 0 или 1 (0% или 100%) и просто не е възможна за честоти от 0 и 1. Освен това, апроксимацията на нормалното разпределение, която се използва при изчисляване на грешката, "не работи" в случаите, когато n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Тъй като новата променлива е нормално разпределена, долната и горната граница на 95% доверителен интервал за променлива φ ще бъдат φ-1,96 и φ+1,96 отляво">

Вместо 1,96 за малки проби се препоръчва да се замени стойността на t за N - 1 степени на свобода. Този метод не дава отрицателни стойности и ви позволява по-точно да оцените доверителните интервали за честотите от метода на Wald. В допълнение, той е описан в много местни справочници по медицинска статистика, което обаче не доведе до широкото му използване в медицинските изследвания. Изчисляването на доверителни интервали с помощта на ъглова трансформация не се препоръчва за честоти, близки до 0 или 1.

Това е мястото, където обикновено завършва описанието на методите за оценка на доверителните интервали в повечето книги за основите на статистиката за медицински изследователи и този проблем е типичен не само за местната, но и за чуждестранната литература. И двата метода се основават на централната гранична теорема, която предполага голяма извадка.

Като се имат предвид недостатъците на оценката на доверителните интервали с помощта на горните методи, Клопър (Clopper) и Пиърсън (Pearson) предлагат през 1934 г. метод за изчисляване на така наречения точен доверителен интервал, като се вземе предвид биномното разпределение на изследваната черта. Този метод е наличен в много онлайн калкулатори, но доверителните интервали, получени по този начин, в повечето случаи са твърде широки. В същото време този метод се препоръчва за използване в случаите, когато е необходима консервативна оценка. Степента на консервативност на метода се увеличава с намаляване на размера на извадката, особено за N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Според много статистици най-оптималната оценка на доверителните интервали за честотите се извършва по метода на Уилсън, предложен през 1927 г., но практически не се използва в домашните биомедицински изследвания. Този метод не само дава възможност да се оценят доверителните интервали както за много малки, така и за много високи честоти, но също така е приложим за малък брой наблюдения. Като цяло доверителният интервал според формулата на Уилсън има формата от



където приема стойност 1,96 при изчисляване на 95% доверителен интервал, N е броят на наблюденията и p е честотата на характеристиката в извадката. Този метод е наличен в онлайн калкулаторите, така че прилагането му не е проблематично. и не препоръчваме използването на този метод за n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

В допълнение към метода на Wilson се смята, че коригираният от Agresti-Caull метод на Wald осигурява оптимална оценка на доверителния интервал за честотите. Корекцията на Agresti-Coulle е замяна във формулата на Wald за честотата на срещане на признак в извадката (p) с p`, при изчисляването на което 2 се добавя към числителя, а 4 към знаменателя, т.е. , p` = (X + 2) / (N + 4), където X е броят на участниците в изследването, които имат изследваната черта, а N е размерът на извадката. Тази модификация дава резултати, много подобни на тези от формулата на Wilson, освен когато процентът на събитията се доближава до 0% или 100% и извадката е малка. В допълнение към горните методи за изчисляване на доверителни интервали за честотите са предложени корекции за непрекъснатост както за метода на Wald, така и за метода на Wilson за малки проби, но проучванията показват, че използването им е неподходящо.

Разгледайте приложението на горните методи за изчисляване на доверителни интервали, като използвате два примера. В първия случай изследваме голяма извадка от 1000 произволно избрани участници в изследването, от които 450 притежават чертата, която се изследва (независимо дали е рисков фактор, резултат или друга черта), която е честота 0,45, или 45%. Във втория случай изследването се провежда с помощта на малка извадка, да речем, само 20 души и само 1 участник в изследването (5%) има изследваната черта. Доверителните интервали за метода Wald, за метода Wald с корекция на Agresti-Coll, за метода Wilson бяха изчислени с помощта на онлайн калкулатор, разработен от Jeff Sauro (http://www./wald.htm). Доверителните интервали на Wilson с коригирана непрекъснатост бяха изчислени с помощта на калкулатора, предоставен от Wassar Stats: Уеб сайт за статистически изчисления (http://faculty.vassar.edu/lowry/prop1.html). Изчисленията с помощта на ъгловата трансформация на Fisher бяха извършени "ръчно", като се използва критичната стойност на t за 19 и 999 степени на свобода, съответно. Резултатите от изчисленията са представени в таблицата и за двата примера.

Доверителни интервали, изчислени по шест различни начина за двата примера, описани в текста

Метод за изчисляване на доверителния интервал

P=0,0500 или 5%

95% CI за X=450, N=1000, P=0,4500 или 45%

–0,0455–0,2541

Walda с корекция на Agresti-Coll

<,0001–0,2541

Wilson с корекция на непрекъснатостта

"Точният метод" на Klopper-Pearson

Ъглова трансформация

<0,0001–0,1967

Както може да се види от таблицата, за първия пример доверителният интервал, изчислен по "общоприетия" метод на Wald, отива в отрицателната област, което не може да бъде случаят с честотите. За съжаление подобни инциденти не са рядкост в руската литература. Традиционният начин за представяне на данните като честота и нейната грешка частично маскира този проблем. Например, ако честотата на поява на черта (в проценти) е представена като 2,1 ± 1,4, тогава това не е толкова „дразнещо“ като 2,1% (95% CI: –0,7; 4,9), въпреки че и означава същото. Методът на Wald с корекцията на Agresti-Coulle и изчислението, използващо ъгловата трансформация, дават долна граница, клоняща към нула. Методът на Wilson с корекция на непрекъснатостта и "точният метод" дават по-широки доверителни интервали от метода на Wilson. За втория пример всички методи дават приблизително еднакви доверителни интервали (разликите се появяват само в хилядни), което не е изненадващо, тъй като честотата на събитието в този пример не се различава много от 50%, а размерът на извадката е доста голям .

За читателите, които се интересуват от този проблем, можем да препоръчаме трудовете на R. G. Newcombe и Brown, Cai и Dasgupta, които дават предимствата и недостатъците на използването съответно на 7 и 10 различни метода за изчисляване на доверителните интервали. От местните ръководства се препоръчва книгата, в която освен подробно описание на теорията са представени методите на Уолд и Уилсън, както и метод за изчисляване на доверителни интервали, като се вземе предвид биномното разпределение на честотата. В допълнение към безплатните онлайн калкулатори (http://www./wald.htm и http://faculty.vassar.edu/lowry/prop1.html), доверителните интервали за честотите (и не само!) могат да бъдат изчислени с помощта на Програмата на CIA (анализ на доверителните интервали), която може да бъде изтеглена от http://www. медицинско училище. сотон. ак. uk/cia/.

Следващата статия ще разгледа едновариантни начини за сравняване на качествени данни.

Библиография

Банерджи А.Медицинска статистика на разбираем език: въвеждащ курс / А. Банержи. - М. : Практическа медицина, 2007. - 287 с. Медицинска статистика / . - М. : Агенция за медицинска информация, 2007. - 475 с. Гланц С.Медико-биологична статистика / S. Glants. - М. : Практика, 1998. Типове данни, проверка на разпространението и описателна статистика / // Екология на човека - 2008. - № 1. - С. 52–58. Жижин К.С.. Медицинска статистика: учебник / . - Ростов n / D: Phoenix, 2007. - 160 с. Приложна медицинска статистика / , . - Санкт Петербург. : Фолио, 2003. - 428 с. Лакин Г. Ф. Биометрични данни /. - М. : Висше училище, 1990. - 350 с. Медик В.А. Математическа статистика в медицината / , . - М. : Финанси и статистика, 2007. - 798 с. Математическа статистика в клиничните изследвания / , . - М. : ГЕОТАР-МЕД, 2001. - 256 с. Юнкеров В. И. Медико-статистическа обработка на данни от медицински изследвания /,. - Санкт Петербург. : ВмедА, 2002. - 266 с. Агрести А.Приблизителното е по-добро от точното за интервална оценка на биномни пропорции / A. Agresti, B. Coull // Американски статистик. - 1998. - N 52. - С. 119-126. Алтман Д.Статистика с увереност // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - Лондон: BMJ Books, 2000. - 240 с. Браун Л.Д.Интервална оценка за биномиална пропорция / L. D. Brown, T. T. Cai, A. Dasgupta // Статистическа наука. - 2001. - N 2. - С. 101-133. Clopper C.J.Използването на доверителни или фидуциални граници, илюстрирани в случая на бином / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - С. 404-413. Гарсия-Перес М. А. Относно доверителния интервал за биномиалния параметър / M. A. Garcia-Perez // Качество и количество. - 2005. - N 39. - С. 467-481. Мотулски Х.Интуитивна биостатистика // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Нюкомб Р.Г.Двустранни доверителни интервали за единичната пропорция: Сравнение на седем метода / R. G. Newcombe // Статистика в медицината. - 1998. - N. 17. - P. 857–872. Сауро Дж.Оценяване на нивата на завършване от малки проби с помощта на биномиални доверителни интервали: сравнения и препоръки / J. Sauro, J. R. Lewis // Сборник на годишната среща на обществото за човешки фактори и ергономия. – Орландо, Флорида, 2005 г. Уолд А.Доверителни граници за непрекъснати функции на разпределение // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - С. 105–118. Уилсън Е. Б. Вероятно заключение, законът за наследството и статистическо заключение / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - С. 209-212.

ДОВЕРИТЕЛНИ ИНТЕРВАЛИ ЗА ПРОПОРЦИИ

А. М. Гржибовски

Национален институт по обществено здраве, Осло, Норвегия

Статията представя няколко метода за изчисляване на доверителните интервали за биномни пропорции, а именно методите на Wald, Wilson, арксинус, Agresti-Coull и точни методи на Clopper-Pearson. Документът дава само общо въведение в проблема с оценката на доверителния интервал на биномна пропорция и целта му е не само да стимулира читателите да използват доверителни интервали, когато представят резултати от собствени емпирични изследователски интервали, но също така да ги насърчи да се консултират със статистически книги преди за анализиране на собствени данни и подготовка на ръкописи.

ключови думи: доверителен интервал, пропорция

Информация за връзка:

Старши съветник, Национален институт по обществено здраве, Осло, Норвегия

Умът е не само в знанието, но и в умението да прилагаме знанията на практика. (Аристотел)

Доверителни интервали

общ преглед

Вземайки извадка от популацията, ще получим точкова оценка на параметъра, който ни интересува, и ще изчислим стандартната грешка, за да покажем точността на оценката.

В повечето случаи обаче стандартната грешка като такава не е приемлива. Много по-полезно е тази мярка за точност да се комбинира с интервална оценка за параметъра на населението.

Това може да бъде направено чрез използване на знания за теоретичното разпределение на вероятностите на извадковата статистика (параметър), за да се изчисли доверителен интервал (CI - Доверителен интервал, CI - Доверителен интервал) за параметъра.

Като цяло, доверителният интервал разширява оценките в двете посоки с някои кратни на стандартната грешка (на даден параметър); двете стойности (доверителни граници), които определят интервала, обикновено се разделят със запетая и се затварят в скоби.

Доверителен интервал за средна стойност

Използване на нормалното разпределение

Средната стойност на извадката има нормално разпределение, ако размерът на извадката е голям, така че познаването на нормалното разпределение може да се приложи при разглеждане на средната стойност на извадката.

По-специално, 95% от разпределението на средните стойности на извадката е в рамките на 1,96 стандартни отклонения (SD) от средната стойност на популацията.

Когато имаме само една извадка, наричаме това стандартна грешка на средната стойност (SEM) и изчисляваме 95% доверителен интервал за средната стойност, както следва:

Ако този експеримент се повтори няколко пъти, тогава интервалът ще съдържа истинската средна популация 95% от времето.

Това обикновено е доверителен интервал, като диапазона от стойности, в рамките на който истинската средна стойност на съвкупността (обща средна стойност) лежи с 95% ниво на сигурност.

Въпреки че не е съвсем строго (средната популация е фиксирана стойност и следователно не може да има свързана с нея вероятност) да се тълкува доверителният интервал по този начин, концептуално е по-лесно за разбиране.

Използване T-разпространение

Можете да използвате нормалното разпределение, ако знаете стойността на дисперсията в популацията. Освен това, когато размерът на извадката е малък, средната стойност на извадката следва нормално разпределение, ако данните, които са в основата на популацията, са нормално разпределени.

Ако данните, които са в основата на популацията, не са нормално разпределени и/или общата дисперсия (популационната дисперсия) е неизвестна, средната стойност на извадката се подчинява t-разпределение на Стюдънт.

Изчислете 95% доверителен интервал за средната популация, както следва:

Къде - процентен пункт (персентил) T-Разпределение на студент с (n-1) степени на свобода, което дава двустранна вероятност от 0,05.

Като цяло той осигурява по-широк интервал, отколкото при използване на нормално разпределение, тъй като взема предвид допълнителната несигурност, която се въвежда чрез оценяване на стандартното отклонение на популацията и/или поради малкия размер на извадката.

Когато размерът на извадката е голям (от порядъка на 100 или повече), разликата между двете разпределения ( t-студенти нормално) е незначително. Въпреки това, винаги използвайте T-разпределение при изчисляване на доверителните интервали, дори ако размерът на извадката е голям.

Обикновено се посочва 95% CI. Други доверителни интервали могат да бъдат изчислени, като 99% CI за средната стойност.

Вместо произведение на стандартна грешка и таблична стойност T-разпределение, което съответства на двустранна вероятност от 0,05, умножете го (стандартна грешка) по стойност, която съответства на двустранна вероятност от 0,01. Това е по-широк доверителен интервал от случая с 95%, тъй като отразява повишената увереност, че интервалът наистина включва средната стойност на съвкупността.

Доверителен интервал за пропорцията

Извадковото разпределение на пропорциите има биномиално разпределение. Въпреки това, ако размерът на извадката нразумно голямо, тогава пропорционалното разпределение на извадката е приблизително нормално със средна стойност .

Оценка чрез съотношение на вземане на проби p=r/n(където r- броят на индивидите в извадката с характеристиките, които ни интересуват), и стандартната грешка се оценява:

95% доверителен интервал за пропорцията се изчислява:

Ако размерът на извадката е малък (обикновено когато npили n(1-p)по-малко 5 ), тогава трябва да се използва биномното разпределение, за да се изчислят точните доверителни интервали.

Имайте предвид, че ако стризразено като процент, тогава (1-p)заменен от (100p).

Тълкуване на доверителни интервали

Когато интерпретираме доверителния интервал, ние се интересуваме от следните въпроси:

Колко широк е доверителният интервал?

Широкият доверителен интервал показва, че оценката е неточна; тясна показва добра оценка.

Ширината на доверителния интервал зависи от размера на стандартната грешка, която от своя страна зависи от размера на извадката и, когато се разглежда числова променлива от променливостта на данните, дава по-широки доверителни интервали, отколкото изследванията на голям набор от данни от няколко променливи.

CI включва ли стойности от особен интерес?

Можете да проверите дали вероятната стойност за параметър на популацията попада в доверителен интервал. Ако да, тогава резултатите са в съответствие с тази вероятна стойност. Ако не, тогава е малко вероятно (за 95% доверителен интервал шансът е почти 5%) параметърът да има тази стойност.

Доверителен интервалса граничните стойности на статистическата величина, която с дадена доверителна вероятност γ ще бъде в този интервал с по-голям размер на извадката. Означава се като P(θ - ε . На практика вероятността за доверие γ се избира от стойностите γ = 0.9 , γ = 0.95 , γ = 0.99, достатъчно близки до единица.

Сервизно задание. Тази услуга определя:

  • доверителен интервал за общата средна стойност, доверителен интервал за дисперсията;
  • доверителен интервал за стандартното отклонение, доверителен интервал за общата фракция;
Полученото решение се записва във файл на Word (вижте примера). По-долу има видео инструкция за попълване на първоначалните данни.

Пример #1. В колективна ферма от общо стадо от 1000 овце 100 овце са подложени на селективно контролно стригане. В резултат на това е установен среден настриг на вълна от 4,2 кг на овца. Определете с вероятност от 0,99 стандартната грешка на пробата при определяне на средното срязване на вълна на овца и границите, в които се намира стойността на срязване, ако дисперсията е 2,5. Пробата не се повтаря.
Пример #2. От партидата внесени продукти на поста на Московската северна митница са взети 20 проби от продукт "А" по реда на случайно повторно вземане на проби. В резултат на проверката е установено средно съдържание на влага на продукт "А" в пробата, което се оказва 6% със стандартно отклонение от 1%.
Определете с вероятност от 0,683 границите на средното съдържание на влага в продукта в цялата партида внесени продукти.
Пример #3. Проучване на 36 студенти показа, че средният брой учебници, прочетени от тях за учебна година, се оказа 6. Ако приемем, че броят учебници, прочетени от студент за семестър, има нормален закон на разпределение със стандартно отклонение, равно на 6, намерете : A) с надеждност от 0,99 интервална оценка за математическото очакване на тази случайна променлива; Б) с каква вероятност може да се твърди, че средният брой учебници, прочетени от студент за семестър, изчислен за тази извадка, се отклонява от математическото очакване по абсолютна стойност с не повече от 2.

Класификация на доверителните интервали

По вида на параметъра, който се оценява:

По тип проба:

  1. Доверителен интервал за безкрайно вземане на проби;
  2. Доверителен интервал за крайната проба;
Вземането на проби се нарича повторно вземане на проби, ако избраният обект се върне към общата популация, преди да се избере следващият. Пробата се нарича неповтаряща се.ако избраният обект не бъде върнат в общата съвкупност. На практика обикновено се работи с неповтарящи се проби.

Изчисляване на средната извадкова грешка за случаен подбор

Несъответствието между стойностите на показателите, получени от извадката, и съответните параметри на генералната съвкупност се нарича грешка в представителността.
Обозначения на основните параметри на генералната и извадковата съвкупност.
Примерни формули за средна грешка
преизбираненеповтаряща се селекция
за средатаза споделянеза средатаза споделяне
Съотношението между границата на извадкова грешка (Δ), гарантирана с известна вероятност P(t),и средната грешка на извадката има формата: или Δ = t μ, където T– коефициент на доверителност, определен в зависимост от степента на вероятност P(t) съгласно таблицата на интегралната функция на Лаплас.

Формули за изчисляване на размера на извадката с подходящ метод на случаен подбор

В статистиката има два вида оценки: точкови и интервални. Точкова оценкае единична примерна статистика, която се използва за оценка на параметър на популацията. Например средната стойност на извадката е точкова оценка на средната стойност на популацията и дисперсията на извадката S2- точкова оценка на дисперсията на популацията σ2. беше показано, че средната стойност на извадката е безпристрастна оценка на очакванията на населението. Средната стойност на извадката се нарича безпристрастна, защото средната стойност на всички средни стойности на извадката (с еднакъв размер на извадката н) е равно на математическото очакване на генералната съвкупност.

За да може пробата да варира S2се превърна в безпристрастен оценител на дисперсията на популацията σ2, знаменателят на дисперсията на извадката трябва да бъде равен на н – 1 , но не н. С други думи, дисперсията на съвкупността е средната стойност на всички възможни дисперсии на извадката.

Когато се оценяват параметрите на популацията, трябва да се има предвид, че извадкови статистики като напр , зависят от конкретни проби. Да се ​​вземе предвид този факт, да се получи интервална оценкаматематическото очакване на генералната съвкупност анализира разпределението на извадковите средни стойности (за повече подробности вижте). Конструираният интервал се характеризира с определено ниво на достоверност, което е вероятността истинският параметър на генералната съвкупност да бъде оценен правилно. Подобни доверителни интервали могат да се използват за оценка на дела на характеристика Ри основната разпределена маса от общата съвкупност.

Изтеглете бележка в или формат, примери във формат

Конструиране на доверителен интервал за математическото очакване на генералната съвкупност с известно стандартно отклонение

Изграждане на доверителен интервал за съотношението на черта в общата популация

В този раздел концепцията за доверителен интервал е разширена до категорични данни. Това ви позволява да оцените дела на чертата в общата популация Рс примерен дял РС= X/н. Както споменахме, ако стойностите нРи н(1 - p)надвишава числото 5, биномното разпределение може да се апроксимира с нормалното. Следователно, за да се оцени делът на дадена черта в общата съвкупност Рвъзможно е да се конструира интервал, чието ниво на достоверност е равно на (1 - α)x100%.


където стрС- примерен дял на признака, равен на Х/н, т.е. броят на успехите, разделен на размера на извадката, Р- делът на признака в общата популация, Зе критичната стойност на стандартизираното нормално разпределение, н- размер на извадката.

Пример 3Да приемем, че от информационната система е извлечена извадка, състояща се от 100 фактури, попълнени през последния месец. Да приемем, че 10 от тези фактури са неправилни. По този начин, Р= 10/100 = 0,1. Нивото на достоверност от 95% съответства на критичната стойност Z = 1,96.

По този начин има 95% вероятност между 4,12% и 15,88% от фактурите да съдържат грешки.

За даден размер на извадката доверителният интервал, съдържащ съотношението на признака в общата популация, изглежда по-широк, отколкото за непрекъсната случайна променлива. Това е така, защото измерванията на непрекъсната случайна променлива съдържат повече информация, отколкото измерванията на категорични данни. С други думи, категоричните данни, които приемат само две стойности, не съдържат достатъчно информация за оценка на параметрите на тяхното разпределение.

ATизчисляване на оценки, извлечени от ограничена популация

Оценка на математическото очакване.Корекционен фактор за крайната популация ( fpc) се използва за намаляване на стандартната грешка с коефициент . При изчисляване на доверителните интервали за оценките на параметрите на популацията се прилага корекционен фактор в ситуации, при които се вземат проби без замяна. По този начин доверителният интервал за математическото очакване, имащ ниво на достоверност, равно на (1 - α)x100%, се изчислява по формулата:

Пример 4За да илюстрираме прилагането на корекционен коефициент за ограничена съвкупност, нека се върнем към проблема за изчисляване на доверителния интервал за средната сума на фактурите, обсъдени по-горе в Пример 3. Да предположим, че една компания издава 5000 фактури на месец и Х=110,27 USD, С= $28,95 н = 5000, н = 100, α = 0,05, t99 = 1,9842. По формула (6) получаваме:

Оценка на дела на характеристиката.Когато изберете без връщане, доверителният интервал за частта от характеристиката, която има ниво на достоверност, равно на (1 - α)x100%, се изчислява по формулата:

Доверителни интервали и етични проблеми

Когато се взема извадка от популация и се формулират статистически заключения, често възникват етични проблеми. Основният е как се съгласуват доверителните интервали и точковите оценки на извадковите статистики. Публикуването на приблизителни точки без уточняване на подходящите доверителни интервали (обикновено при 95% нива на доверителност) и размера на извадката, от който те са получени, може да бъде подвеждащо. Това може да създаде у потребителя впечатлението, че точковата оценка е точно това, от което се нуждае, за да предвиди свойствата на цялата популация. Следователно е необходимо да се разбере, че във всяко изследване на преден план трябва да се поставят не точкови, а интервални оценки. Освен това трябва да се обърне специално внимание на правилния избор на размери на пробите.

Най-често обект на статистически манипулации са резултатите от социологически проучвания на населението по различни политически въпроси. В същото време резултатите от проучването се публикуват на първите страници на вестниците, а грешката на извадката и методологията на статистическия анализ се отпечатват някъде по средата. За доказване на валидността на получените точкови оценки е необходимо да се посочи размерът на извадката, въз основа на която са получени, границите на доверителния интервал и нивото на неговата значимост.

Следваща бележка

Използвани са материали от книгата Левин и др.Статистика за мениджъри. - М.: Уилямс, 2004. - стр. 448–462

Централна гранична теоремазаявява, че при достатъчно голям размер на извадката, извадковото разпределение на средните стойности може да бъде приблизително с нормално разпределение. Това свойство не зависи от типа разпределение на населението.

"Катрен-Стил" продължава да публикува цикъл на Константин Кравчик за медицинската статистика. В две предишни статии авторът засегна обяснението на такива понятия като и.

Константин Кравчик

Математик-аналитик. Специалист в областта на статистическите изследвания в медицината и хуманитарните науки

град Москва

Много често в статии за клинични изпитвания можете да намерите мистериозна фраза: "доверителен интервал" (95% CI или 95% CI - доверителен интервал). Например в една статия може да се каже: „Използван е t-тестът на Стюдънт за оценка на значимостта на разликите с изчислен 95% доверителен интервал.“

Каква е стойността на "95% доверителен интервал" и защо да го изчисляваме?

Какво е доверителен интервал? - Това е диапазонът, в който попадат истинските средни стойности в популацията. И какво, има "неверни" средни стойности? В известен смисъл, да, те го правят. В ние обяснихме, че е невъзможно да се измери параметърът от интерес в цялата популация, така че изследователите се задоволяват с ограничена извадка. В тази извадка (например по телесно тегло) има една средна стойност (определено тегло), по която съдим за средната стойност в цялата генерална популация. Малко вероятно е обаче средното тегло в извадката (особено малката) да съвпадне със средното тегло в общата популация. Следователно е по-правилно да се изчисли и използва диапазонът от средни стойности на общата съвкупност.

Да предположим например, че 95% доверителен интервал (95% CI) за хемоглобина е между 110 и 122 g/L. Това означава, че с 95 % вероятност истинската средна стойност на хемоглобина в общата популация ще бъде в диапазона от 110 до 122 g/L. С други думи, ние не знаем средния хемоглобин в общата популация, но можем да посочим диапазона от стойности за тази характеристика с 95% вероятност.

Доверителните интервали са особено подходящи за разликата в средните стойности между групите или това, което се нарича размер на ефекта.

Да предположим, че сравним ефективността на два препарата с желязо: един, който е на пазара от дълго време, и един, който току-що е регистриран. След курса на терапията беше оценена концентрацията на хемоглобин в изследваните групи пациенти и статистическата програма изчисли за нас, че разликата между средните стойности на двете групи с вероятност от 95% е в диапазона от 1,72 до 14,36 g/l (Таблица 1).

Раздел. 1. Критерий за независими проби
(групите се сравняват по нивото на хемоглобина)

Това трябва да се тълкува по следния начин: при част от пациентите от общата популация, които приемат ново лекарство, хемоглобинът ще бъде по-висок средно с 1,72–14,36 g/l, отколкото при тези, които са приемали вече известно лекарство.

С други думи, в общата популация разликата в средните стойности на хемоглобина в групите с 95% вероятност е в тези граници. Изследователят ще прецени дали това е много или малко. Смисълът на всичко това е, че не работим с една средна стойност, а с диапазон от стойности, следователно по-надеждно оценяваме разликата в параметъра между групите.

В статистическите пакети, по преценка на изследователя, можете независимо да стесните или разширите границите на доверителния интервал. Като намаляваме вероятностите на доверителния интервал, ние стесняваме обхвата на средните стойности. Например, при 90% CI, обхватът на средните (или средните разлики) ще бъде по-тесен, отколкото при 95% CI.

Обратно, увеличаването на вероятността до 99% разширява диапазона от стойности. При сравняване на групи долната граница на CI може да премине нулевата граница. Например, ако разширим границите на доверителния интервал до 99 %, тогава границите на интервала варират от –1 до 16 g/L. Това означава, че в генералната съвкупност има групи, разликата между средните между които за изследвания признак е 0 (М=0).

Доверителните интервали могат да се използват за тестване на статистически хипотези. Ако доверителният интервал премине нулевата стойност, тогава нулевата хипотеза, която предполага, че групите не се различават по изследвания параметър, е вярна. По-горе е описан пример, когато разширихме границите до 99%. Някъде в общата популация открихме групи, които не се различават по никакъв начин.

95% доверителен интервал на разлика в хемоглобина, (g/l)


Фигурата показва 95% доверителен интервал на разликата в средния хемоглобин между двете групи като линия. Линията преминава нулевия знак, следователно има разлика между средните стойности, равна на нула, което потвърждава нулевата хипотеза, че групите не се различават. Разликата между групите варира от -2 до 5 g/l, което означава, че хемоглобинът може да се понижи с 2 g/l или да се повиши с 5 g/l.

Доверителният интервал е много важен показател. Благодарение на него можете да видите дали разликите в групите наистина се дължат на разликата в средните стойности или се дължат на голяма извадка, тъй като при голяма извадка шансовете за откриване на разлики са по-големи, отколкото при малка.

На практика може да изглежда така. Взехме проба от 1000 души, измерихме нивото на хемоглобина и установихме, че доверителният интервал за разликата в средните стойности е от 1,2 до 1,5 g/L. Нивото на статистическа значимост в този случай p

Виждаме, че концентрацията на хемоглобина се повишава, но почти незабележимо, следователно статистическата значимост се появява именно поради размера на извадката.

Доверителните интервали могат да бъдат изчислени не само за средни стойности, но и за пропорции (и рискови съотношения). Например, ние се интересуваме от доверителния интервал на пропорциите на пациентите, постигнали ремисия, докато приемат разработеното лекарство. Да приемем, че 95% CI за пропорциите, т.е. за дела на такива пациенти, е в диапазона 0,60–0,80. Така можем да кажем, че нашето лекарство има терапевтичен ефект в 60 до 80% от случаите.