Biografier Kjennetegn Analyse

Konfidensintervall. Tillitssannsynlighet

KONFIDENSINTERVALLER FOR FREKVENSER OG DELER

© 2008

Folkehelseinstituttet, Oslo, Norge

Artikkelen beskriver og diskuterer beregning av konfidensintervaller for frekvenser og proporsjoner ved bruk av Wald, Wilson, Klopper-Pearson metodene, ved bruk av vinkeltransformasjonen og Wald metoden med Agresti-Cowll korreksjon. Det presenterte materialet gir generell informasjon om metoder for å beregne konfidensintervaller for frekvenser og proporsjoner og er ment å vekke interessen hos tidsskriftets lesere ikke bare for å bruke konfidensintervaller når de presenterer resultatene av egen forskning, men også for å lese spesiallitteratur før oppstart. arbeid med fremtidige publikasjoner.

Nøkkelord: konfidensintervall, frekvens, proporsjon

I en av de tidligere publikasjonene ble beskrivelsen av kvalitative data kort nevnt, og det ble rapportert at deres intervallestimat er å foretrekke fremfor et punktestimat for å beskrive hyppigheten av forekomsten av den studerte egenskapen i den generelle befolkningen. Faktisk, siden studier er utført ved hjelp av utvalgsdata, må projeksjonen av resultatene på den generelle populasjonen inneholde et element av unøyaktighet i prøveestimatet. Konfidensintervallet er et mål på nøyaktigheten til den estimerte parameteren. Det er interessant at i noen bøker om det grunnleggende om statistikk for leger, blir temaet konfidensintervaller for frekvenser fullstendig ignorert. I denne artikkelen vil vi vurdere flere måter å beregne konfidensintervaller for frekvenser på, forutsatt utvalgsegenskaper som ikke-gjentakelse og representativitet, samt uavhengigheten av observasjoner fra hverandre. Frekvensen i denne artikkelen er ikke forstått som et absolutt tall som viser hvor mange ganger denne eller den verdien forekommer i aggregatet, men en relativ verdi som bestemmer andelen av studiedeltakere som har egenskapen som studeres.

I biomedisinsk forskning er 95 % konfidensintervaller mest brukt. Dette konfidensintervallet er regionen der den sanne andelen faller 95 % av tiden. Med andre ord kan det sies med 95 % sikkerhet at den sanne verdien av frekvensen av forekomst av en egenskap i den generelle befolkningen vil være innenfor 95 % konfidensintervallet.

De fleste statistiske lærebøker for medisinske forskere rapporterer at frekvensfeilen beregnes ved hjelp av formelen

hvor p er frekvensen av forekomsten av funksjonen i prøven (verdi fra 0 til 1). I de fleste innenlandske vitenskapelige artikler er verdien av frekvensen av forekomst av et trekk i prøven (p) angitt, så vel som dens feil(er) i form av p ± s. Det er imidlertid mer hensiktsmessig å presentere et 95 % konfidensintervall for frekvensen av forekomst av en egenskap i den generelle befolkningen, som vil inkludere verdier fra

før.

I noen lærebøker anbefales det for små utvalg å erstatte verdien 1,96 med verdien av t for N - 1 frihetsgrader, der N er antall observasjoner i utvalget. Verdien av t finnes i tabellene for t-fordelingen, som finnes i nesten alle lærebøker om statistikk. Bruken av distribusjonen av t for Wald-metoden gir ikke synlige fordeler i forhold til andre metoder diskutert nedenfor, og er derfor ikke velkommen av noen forfattere.

Metoden ovenfor for å beregne konfidensintervaller for frekvenser eller brøker er oppkalt etter Abraham Wald (Abraham Wald, 1902–1950), siden den begynte å bli mye brukt etter utgivelsen av Wald og Wolfowitz i 1939. Selve metoden ble imidlertid foreslått av Pierre Simon Laplace (1749–1827) så tidlig som i 1812.

Wald-metoden er veldig populær, men dens anvendelse er forbundet med betydelige problemer. Metoden anbefales ikke for små utvalgsstørrelser, så vel som i tilfeller der frekvensen av forekomst av en funksjon har en tendens til 0 eller 1 (0 % eller 100 %) og rett og slett ikke er mulig for frekvenser på 0 og 1. I tillegg, normalfordelingstilnærmingen, som brukes ved beregning av feilen, "virker ikke" i tilfeller der n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Siden den nye variabelen er normalfordelt, vil de nedre og øvre grensene for 95 % konfidensintervallet for variabel φ være φ-1,96 og φ+1,96venstre">

I stedet for 1,96 for små prøver, anbefales det å erstatte verdien av t med N - 1 frihetsgrader. Denne metoden gir ikke negative verdier og lar deg estimere konfidensintervallene for frekvenser mer nøyaktig enn Wald-metoden. I tillegg er den beskrevet i mange innenlandske oppslagsverk om medisinsk statistikk, som imidlertid ikke førte til utbredt bruk i medisinsk forskning. Beregning av konfidensintervaller ved hjelp av en vinkeltransformasjon anbefales ikke for frekvenser som nærmer seg 0 eller 1.

Det er her beskrivelsen av metoder for å estimere konfidensintervaller i de fleste bøker om grunnleggende statistikk for medisinske forskere slutter, og dette problemet er typisk ikke bare for innenlandsk, men også for utenlandsk litteratur. Begge metodene er basert på sentralgrensesetningen, som innebærer et stort utvalg.

Gitt manglene ved å estimere konfidensintervaller ved bruk av metodene ovenfor, foreslo Clopper (Clopper) og Pearson (Pearson) i 1934 en metode for å beregne det såkalte eksakte konfidensintervallet, med tanke på den binomiale fordelingen av den studerte egenskapen. Denne metoden er tilgjengelig i mange nettkalkulatorer, men konfidensintervallene som oppnås på denne måten er i de fleste tilfeller for brede. Samtidig anbefales denne metoden for bruk i tilfeller der det kreves et konservativt estimat. Graden av konservativitet av metoden øker ettersom prøvestørrelsen reduseres, spesielt for N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

I følge mange statistikere er det mest optimale estimatet av konfidensintervaller for frekvenser utført av Wilson-metoden, foreslått tilbake i 1927, men praktisk talt ikke brukt i innenlandsk biomedisinsk forskning. Denne metoden gjør det ikke bare mulig å estimere konfidensintervaller for både svært små og svært høye frekvenser, men er også anvendelig for et lite antall observasjoner. Generelt har konfidensintervallet i henhold til Wilson-formelen formen fra



der den tar verdien 1,96 ved beregning av 95 % konfidensintervall, N er antall observasjoner, og p er frekvensen til funksjonen i utvalget. Denne metoden er tilgjengelig i online kalkulatorer, så bruken er ikke problematisk. og anbefaler ikke å bruke denne metoden for n s< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

I tillegg til Wilson-metoden, antas den Agresti-Caull-korrigerte Wald-metoden også å gi et optimalt estimat av konfidensintervallet for frekvenser. Agresti-Coulle-korreksjonen er en erstatning i Wald-formelen for frekvensen av forekomst av en egenskap i prøven (p) med p`, når man beregner hvilken 2 som legges til telleren, og 4 som legges til nevneren, dvs. , p` = (X + 2) / (N + 4), hvor X er antall studiedeltakere som har egenskapen som studeres, og N er utvalgsstørrelsen. Denne modifikasjonen gir resultater som ligner veldig på Wilson-formelen, bortsett fra når hendelsesraten nærmer seg 0 % eller 100 % og prøven er liten. I tillegg til metodene ovenfor for å beregne konfidensintervaller for frekvenser, er det foreslått kontinuitetskorreksjoner for både Wald-metoden og Wilson-metoden for små prøver, men studier har vist at bruken er uhensiktsmessig.

Vurder bruken av metodene ovenfor for å beregne konfidensintervaller ved å bruke to eksempler. I det første tilfellet studerer vi et stort utvalg på 1000 tilfeldig utvalgte studiedeltakere, hvorav 450 har egenskapen som studeres (enten det er en risikofaktor, et utfall eller en hvilken som helst annen egenskap), som er en frekvens på 0,45, eller 45 %. I det andre tilfellet utføres studien med et lite utvalg, for eksempel bare 20 personer, og bare 1 deltaker i studien (5%) har egenskapen som studeres. Konfidensintervaller for Wald-metoden, for Wald-metoden med Agresti-Coll-korreksjon, for Wilson-metoden ble beregnet ved hjelp av en online kalkulator utviklet av Jeff Sauro (http://www./wald.htm). Kontinuitetskorrigerte Wilson-konfidensintervaller ble beregnet ved hjelp av kalkulatoren levert av Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Beregninger ved bruk av Fisher-vinkeltransformasjonen ble utført "manuelt" ved bruk av den kritiske verdien av t for henholdsvis 19 og 999 frihetsgrader. Beregningsresultatene er presentert i tabellen for begge eksemplene.

Konfidensintervaller beregnet på seks forskjellige måter for de to eksemplene beskrevet i teksten

Metode for beregning av konfidensintervall

P=0,0500, eller 5 %

95 % KI for X=450, N=1000, P=0,4500 eller 45 %

–0,0455–0,2541

Walda med Agresti-Coll korreksjon

<,0001–0,2541

Wilson med kontinuitetskorreksjon

Klopper-Pearsons "eksakte metode"

Vinkeltransformasjon

<0,0001–0,1967

Som det fremgår av tabellen, for det første eksemplet, går konfidensintervallet beregnet av den "generelt aksepterte" Wald-metoden inn i det negative området, noe som ikke kan være tilfellet for frekvenser. Dessverre er slike hendelser ikke uvanlige i russisk litteratur. Den tradisjonelle måten å representere data på som en frekvens og dens feil maskerer delvis dette problemet. For eksempel, hvis frekvensen av forekomst av en egenskap (i prosent) presenteres som 2,1 ± 1,4, så er ikke dette like "irriterende" som 2,1 % (95 % KI: –0,7; 4,9), selv om og betyr det samme. Wald-metoden med Agresti-Coulle-korreksjon og beregningen ved hjelp av vinkeltransformasjonen gir en nedre grense som tenderer mot null. Wilson-metoden med kontinuitetskorreksjon og «eksakt-metoden» gir bredere konfidensintervall enn Wilson-metoden. For det andre eksemplet gir alle metodene omtrent de samme konfidensintervallene (forskjeller vises bare i tusendeler), noe som ikke er overraskende, siden frekvensen av hendelsen i dette eksemplet ikke skiller seg mye fra 50 %, og prøvestørrelsen er ganske stor .

For lesere som er interessert i dette problemet, kan vi anbefale verkene til R. G. Newcombe og Brown, Cai og Dasgupta, som gir fordeler og ulemper ved å bruke henholdsvis 7 og 10 forskjellige metoder for å beregne konfidensintervaller. Fra innenlandske manualer anbefales boken og, der i tillegg til en detaljert beskrivelse av teorien presenteres Wald- og Wilson-metodene, samt en metode for å beregne konfidensintervaller, tatt i betraktning den binomiale frekvensfordelingen. I tillegg til gratis online kalkulatorer (http://www./wald.htm og http://faculty.vassar.edu/lowry/prop1.html), kan konfidensintervaller for frekvenser (og ikke bare!) beregnes ved å bruke CIA-program (Confidence Intervals Analysis), som kan lastes ned fra http://www. medskole. soton. ac. uk/cia/ .

Den neste artikkelen vil se på univariate måter å sammenligne kvalitative data på.

Bibliografi

Banerjee A. Medisinsk statistikk i klarspråk: et introduksjonskurs / A. Banerzhi. - M. : Praktisk medisin, 2007. - 287 s. Medisinsk statistikk / . - M. : Medical Information Agency, 2007. - 475 s. Glanz S. Mediko-biologisk statistikk / S. Glants. - M. : Praksis, 1998. Datatyper, distribusjonsverifisering og beskrivende statistikk / // Human Ecology - 2008. - Nr. 1. - S. 52–58. Zhizhin K.S.. Medisinsk statistikk: lærebok / . - Rostov n / D: Phoenix, 2007. - 160 s. Anvendt medisinsk statistikk / , . - St. Petersburg. : Folio, 2003. - 428 s. Lakin G. F. Biometri / . - M. : Videregående skole, 1990. - 350 s. Legen V.A. Matematisk statistikk i medisin / , . - M. : Finans og statistikk, 2007. - 798 s. Matematisk statistikk i klinisk forskning / , . - M. : GEOTAR-MED, 2001. - 256 s. Junkerov V. Og. Medisinsk-statistisk behandling av medisinske forskningsdata /,. - St. Petersburg. : VmedA, 2002. - 266 s. Agresti A. Omtrentlig er bedre enn eksakt for intervallestimering av binomiale proporsjoner / A. Agresti, B. Coull // Amerikansk statistiker. - 1998. - N 52. - S. 119-126. Altman D. Statistikk med selvtillit // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 s. Brown L.D. Intervallestimering for en binomial proporsjon / L. D. Brown, T. T. Cai, A. Dasgupta // Statistisk vitenskap. - 2001. - N 2. - S. 101-133. Clopper C.J. Bruken av tillits- eller tillitsgrenser illustrert i tilfelle av binomial / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - N 26. - S. 404-413. Garcia-Perez M.A. På konfidensintervallet for den binomiale parameteren / M. A. Garcia-Perez // Kvalitet og kvantitet. - 2005. - N 39. - S. 467-481. Motulsky H. Intuitiv biostatistikk // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 s. Newcombe R.G. Tosidige konfidensintervaller for enkeltandelen: Sammenligning av syv metoder / R. G. Newcombe // Statistics in Medicine. - 1998. - N. 17. - S. 857–872. Sauro J. Estimering av fullføringsrater fra små prøver ved bruk av binomiale konfidensintervaller: sammenligninger og anbefalinger / J. Sauro, J. R. Lewis // Proceedings of the human factors and ergonomics society årlige møte. – Orlando, FL, 2005. Wald A. Konfidensgrenser for kontinuerlige distribusjonsfunksjoner // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - S. 105–118. Wilson E.B. Sannsynlig slutning, arveloven og statistisk slutning / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - S. 209-212.

KONFIDENSINTERVALLER FOR PROPORTSJONER

EN. M. Grjibovski

Folkehelseinstituttet, Oslo, Norge

Artikkelen presenterer flere metoder for beregning av konfidensintervaller for binomiale proporsjoner, nemlig Wald, Wilson, arcsine, Agresti-Coull og eksakte Clopper-Pearson metoder. Artikkelen gir kun en generell introduksjon til problemet med konfidensintervallestimering av en binomial proporsjon, og målet er ikke bare å stimulere leserne til å bruke konfidensintervaller når de presenterer resultater fra egne empiriske forskningsintervaller, men også å oppmuntre dem til å konsultere statistikkbøker før til å analysere egne data og utarbeide manuskripter.

nøkkelord: konfidensintervall, proporsjon

Kontaktinformasjon:

Seniorrådgiver, Folkehelseinstituttet, Oslo, Norge

Sinnet er ikke bare i kunnskap, men også i evnen til å anvende kunnskap i praksis. (Aristoteles)

Konfidensintervaller

generell gjennomgang

Ved å ta et utvalg fra populasjonen vil vi få et punktestimat av parameteren som er av interesse for oss, og beregne standardfeilen for å indikere nøyaktigheten til estimatet.

For de fleste tilfeller er imidlertid standardfeilen som sådan ikke akseptabel. Det er mye mer nyttig å kombinere dette presisjonsmålet med et intervallestimat for populasjonsparameteren.

Dette kan gjøres ved å bruke kunnskap om den teoretiske sannsynlighetsfordelingen til utvalgsstatistikken (parameteren) for å beregne et konfidensintervall (CI - Confidence Interval, CI - Confidence Interval) for parameteren.

Generelt utvider konfidensintervallet estimatene i begge retninger med et eller annet multiplum av standardfeilen (av en gitt parameter); de to verdiene (konfidensgrensene) som definerer intervallet er vanligvis atskilt med komma og omsluttet av parentes.

Konfidensintervall for gjennomsnitt

Bruker normalfordelingen

Utvalgsgjennomsnittet har en normalfordeling dersom utvalgsstørrelsen er stor, så kunnskap om normalfordelingen kan brukes når man vurderer utvalgsgjennomsnittet.

Spesielt er 95 % av fordelingen av utvalgets gjennomsnitt innenfor 1,96 standardavvik (SD) av populasjonsgjennomsnittet.

Når vi bare har ett utvalg, kaller vi dette standardfeilen til gjennomsnittet (SEM) og beregner 95 % konfidensintervallet for gjennomsnittet som følger:

Hvis dette eksperimentet gjentas flere ganger, vil intervallet inneholde den sanne populasjonsgjennomsnittet 95 % av tiden.

Dette er vanligvis et konfidensintervall, for eksempel rekkevidden av verdier som det sanne populasjonsgjennomsnittet (generelt gjennomsnitt) ligger innenfor med et 95 % konfidensnivå.

Selv om det ikke er helt strengt (populasjonsgjennomsnittet er en fast verdi og kan derfor ikke ha en sannsynlighet knyttet til det) å tolke konfidensintervallet på denne måten, er det konseptuelt lettere å forstå.

Bruk t- fordeling

Du kan bruke normalfordelingen hvis du vet verdien av variansen i populasjonen. Dessuten, når utvalgsstørrelsen er liten, følger utvalgsgjennomsnittet en normalfordeling hvis dataene som ligger til grunn for populasjonen er normalfordelte.

Hvis dataene som ligger til grunn for populasjonen ikke er normalfordelte og/eller den generelle variansen (populasjonsvariansen) er ukjent, følger utvalgets gjennomsnitt Elevens t-fordeling.

Beregn 95 % konfidensintervall for populasjonsgjennomsnittet som følger:

Hvor - prosentpoeng (persentil) t- Elevfordeling med (n-1) frihetsgrader, som gir en tosidig sannsynlighet på 0,05.

Generelt gir det et bredere intervall enn ved bruk av normalfordeling, fordi det tar hensyn til den ekstra usikkerheten som introduseres ved å estimere populasjonsstandardavviket og/eller på grunn av den lille utvalgsstørrelsen.

Når prøvestørrelsen er stor (i størrelsesorden 100 eller mer), forskjellen mellom de to fordelingene ( t-student og normal) er ubetydelig. Bruk imidlertid alltid t- fordeling ved beregning av konfidensintervaller, selv om utvalgsstørrelsen er stor.

Vanligvis er 95 % CI indisert. Andre konfidensintervaller kan beregnes, for eksempel 99 % KI for gjennomsnittet.

I stedet for produkt av standardfeil og tabellverdi t- fordeling som tilsvarer en tosidet sannsynlighet på 0,05 multipliser den (standardfeil) med en verdi som tilsvarer en tosidet sannsynlighet på 0,01. Dette er et bredere konfidensintervall enn 95 %-tilfellet fordi det reflekterer økt tillit til at intervallet faktisk inkluderer populasjonsgjennomsnittet.

Konfidensintervall for proporsjoner

Prøvefordelingen av proporsjoner har en binomialfordeling. Men hvis prøvestørrelsen n rimelig stor, så er andelsutvalgsfordelingen tilnærmet normal med gjennomsnitt .

Estimat etter prøvetakingsforhold p=r/n(hvor r- antall individer i utvalget med egenskapene som er av interesse for oss), og standardfeilen er estimert:

Konfidensintervallet på 95 % for andelen er estimert:

Hvis prøvestørrelsen er liten (vanligvis når np eller n(1-p) mindre 5 ), så må binomialfordelingen brukes for å beregne de nøyaktige konfidensintervallene.

Merk at hvis s uttrykt i prosent, da (1-p) erstattet av (100p).

Tolkning av konfidensintervaller

Når vi tolker konfidensintervallet, er vi interessert i følgende spørsmål:

Hvor bredt er konfidensintervallet?

Et bredt konfidensintervall indikerer at estimatet er upresist; smal indikerer et fint anslag.

Bredden på konfidensintervallet avhenger av størrelsen på standardfeilen, som igjen avhenger av utvalgsstørrelsen og, når man vurderer en numerisk variabel fra variabiliteten til dataene, gir det bredere konfidensintervaller enn studier av et stort datasett av få variabler.

Inkluderer CI noen verdier av spesiell interesse?

Du kan sjekke om den sannsynlige verdien for en populasjonsparameter faller innenfor et konfidensintervall. Hvis ja, samsvarer resultatene med denne sannsynlige verdien. Hvis ikke, er det usannsynlig (for et 95 % konfidensintervall er sjansen nesten 5 %) at parameteren har denne verdien.

Konfidensintervall er grenseverdiene for den statistiske mengden, som, med en gitt konfidenssannsynlighet γ, vil være i dette intervallet med en større utvalgsstørrelse. Angitt som P(θ - ε . I praksis velges konfidenssannsynligheten γ fra verdiene γ = 0,9 , γ = 0,95 , γ = 0,99 tilstrekkelig nær enhet.

Tjenesteoppdrag. Denne tjenesten definerer:

  • konfidensintervall for det generelle gjennomsnittet, konfidensintervall for variansen;
  • konfidensintervall for standardavviket, konfidensintervall for den generelle brøken;
Den resulterende løsningen lagres i en Word-fil (se eksempel). Nedenfor er en videoinstruksjon om hvordan du fyller inn de første dataene.

Eksempel #1. På en kollektiv gård, av en samlet besetning på 1000 sauer, ble 100 sauer utsatt for selektiv kontrollklipping. Som et resultat ble det etablert en gjennomsnittlig ullskjær på 4,2 kg per sau. Bestem med en sannsynlighet på 0,99 standardfeilen til prøven ved bestemmelse av gjennomsnittlig ullskjær per sau og grensene for skjærverdien hvis variansen er 2,5. Prøven er ikke-repetitiv.
Eksempel #2. Fra partiet med importerte produkter ved posten til Moskva nordlige tollvesen ble det tatt 20 prøver av produkt "A" i rekkefølgen av tilfeldig ny prøvetaking. Som et resultat av kontrollen ble gjennomsnittlig fuktighetsinnhold av produktet "A" i prøven etablert, som viste seg å være 6% med et standardavvik på 1%.
Bestem med en sannsynlighet på 0,683 grensene for det gjennomsnittlige fuktighetsinnholdet i produktet i hele partiet av importerte produkter.
Eksempel #3. En undersøkelse av 36 studenter viste at gjennomsnittlig antall lærebøker lest av dem per studieår viste seg å være 6. Forutsatt at antall lærebøker lest av en student per semester har en normalfordelingslov med standardavvik lik 6, finn : A) med en reliabilitet på 0,99 intervallestimat for den matematiske forventningen til denne tilfeldige variabelen; B) med hvilken sannsynlighet kan det hevdes at gjennomsnittlig antall lærebøker lest av en student per semester, beregnet for dette utvalget, avviker fra den matematiske forventningen i absolutt verdi med ikke mer enn 2.

Klassifisering av konfidensintervaller

Etter typen parameter som evalueres:

Etter prøvetype:

  1. Konfidensintervall for uendelig sampling;
  2. Konfidensintervall for den endelige prøven;
Sampling kalles re-sampling, hvis det valgte objektet returneres til den generelle befolkningen før du velger det neste. Prøven kalles ikke-repetitiv. hvis det valgte objektet ikke returneres til den generelle befolkningen. I praksis forholder man seg vanligvis til ikke-gjentakende prøver.

Beregning av gjennomsnittlig prøvetakingsfeil for tilfeldig utvalg

Avviket mellom verdiene til indikatorer hentet fra utvalget og de tilsvarende parameterne for den generelle befolkningen kalles representativitetsfeil.
Betegnelser på hovedparametrene for den generelle og utvalgspopulasjonen.
Eksempel på gjennomsnittsfeilformler
gjenvalgikke-repeterende utvalg
for midtenfor delingfor midtenfor deling
Forholdet mellom prøvetakingsfeilgrensen (Δ) garantert med en viss sannsynlighet P(t), og den gjennomsnittlige prøvetakingsfeilen har formen: eller Δ = t μ, hvor t– konfidens koeffisient, bestemt avhengig av sannsynlighetsnivået P(t) i henhold til tabellen for den integrale Laplace-funksjonen.

Formler for å beregne prøvestørrelsen med en riktig tilfeldig utvalgsmetode

I statistikk er det to typer estimater: punkt og intervall. Poengvurdering er en enkelt utvalgsstatistikk som brukes til å estimere en populasjonsparameter. For eksempel gjennomsnittet for prøven er et punktestimat av populasjonsgjennomsnittet og utvalgsvariansen S2- punktestimat av populasjonsvariasjonen σ2. det ble vist at utvalgets gjennomsnitt er et objektivt estimat av populasjonsforventningen. Utvalgsgjennomsnittet kalles upartisk fordi gjennomsnittet av alle utvalgsmidler (med samme prøvestørrelse n) er lik den matematiske forventningen til den generelle befolkningen.

For utvalgets variasjon S2 ble en objektiv estimator av populasjonsvariansen σ2, bør nevneren for utvalgsvariansen settes lik n – 1 , men ikke n. Med andre ord er populasjonsvariansen gjennomsnittet av alle mulige utvalgsvariasjoner.

Ved estimering av populasjonsparametere bør man huske på at utvalgsstatistikk som f.eks , avhenger av spesifikke prøver. For å ta hensyn til dette faktum, for å få intervall estimering den matematiske forventningen til den generelle befolkningen analyserer fordelingen av utvalgsmidler (for flere detaljer, se). Det konstruerte intervallet er preget av et visst konfidensnivå, som er sannsynligheten for at den sanne parameteren til den generelle befolkningen er estimert riktig. Lignende konfidensintervaller kan brukes til å estimere andelen av en funksjon R og den viktigste distribuerte massen av den generelle befolkningen.

Last ned notat i eller format, eksempler i format

Konstruksjon av et konfidensintervall for den matematiske forventningen til den generelle befolkningen med et kjent standardavvik

Bygge et konfidensintervall for andelen av en egenskap i den generelle befolkningen

I denne delen utvides konseptet med et konfidensintervall til kategoriske data. Dette lar deg estimere andelen av egenskapen i den generelle befolkningen R med en prøveandel RS= X/n. Som nevnt, hvis verdiene nR og n(1 - p) over tallet 5, kan binomialfordelingen tilnærmes med normalen. Derfor å estimere andelen av en egenskap i den generelle befolkningen R det er mulig å konstruere et intervall hvis konfidensnivå er lik (1 - α)x100 %.


hvor sS- prøveandel av funksjonen, lik X/n, dvs. antall suksesser delt på prøvestørrelsen, R- andelen av egenskapen i den generelle befolkningen, Z er den kritiske verdien av den standardiserte normalfordelingen, n- prøvestørrelse.

Eksempel 3 La oss anta at det er hentet ut en prøve fra informasjonssystemet, bestående av 100 fakturaer utfylt i løpet av den siste måneden. La oss si at 10 av disse fakturaene er feil. På denne måten, R= 10/100 = 0,1. 95 % konfidensnivå tilsvarer den kritiske verdien Z = 1,96.

Dermed er det 95 % sjanse for at mellom 4,12 % og 15,88 % av fakturaene inneholder feil.

For en gitt utvalgsstørrelse ser konfidensintervallet som inneholder andelen av egenskapen i den generelle populasjonen ut til å være bredere enn for en kontinuerlig tilfeldig variabel. Dette er fordi målinger av en kontinuerlig tilfeldig variabel inneholder mer informasjon enn målinger av kategoriske data. Med andre ord, kategoriske data som bare tar to verdier inneholder utilstrekkelig informasjon til å estimere parametrene for deres distribusjon.

beregning av estimater hentet fra en begrenset populasjon

Estimering av matematisk forventning. Korreksjonsfaktor for den endelige populasjonen ( fpc) ble brukt for å redusere standardfeilen med en faktor på . Ved beregning av konfidensintervaller for estimater av populasjonsparametere benyttes en korreksjonsfaktor i situasjoner der utvalg trekkes uten erstatning. Dermed vil konfidensintervallet for den matematiske forventningen ha et konfidensnivå lik (1 - α)x100 %, beregnes med formelen:

Eksempel 4 For å illustrere bruken av en korreksjonsfaktor for en begrenset populasjon, la oss gå tilbake til problemet med å beregne konfidensintervallet for gjennomsnittlig antall fakturaer omtalt i eksempel 3 ovenfor. Anta at et selskap utsteder 5000 fakturaer per måned, og =110,27 USD, S= $28,95 N = 5000, n = 100, α = 0,05, t99 = 1,9842. I henhold til formel (6) får vi:

Estimering av andelen av funksjonen. Når du velger ingen retur, konfidensintervallet for andelen av funksjonen som har et konfidensnivå lik (1 - α)x100 %, beregnes med formelen:

Konfidensintervaller og etiske problemstillinger

Når man prøver en populasjon og formulerer statistiske slutninger, oppstår det ofte etiske problemer. Den viktigste er hvordan konfidensintervallene og punktestimatene for utvalgsstatistikk stemmer overens. Publisering av punktestimater uten å spesifisere passende konfidensintervaller (vanligvis ved 95 % konfidensnivå) og utvalgsstørrelsen de er utledet fra, kan være misvisende. Dette kan gi brukeren inntrykk av at et punktestimat er akkurat det han trenger for å forutsi egenskapene til hele populasjonen. Derfor er det nødvendig å forstå at i enhver forskning bør ikke punkt, men intervallestimater settes i forgrunnen. I tillegg bør spesiell oppmerksomhet rettes mot riktig valg av prøvestørrelser.

Oftest er gjenstandene for statistiske manipulasjoner resultatene av sosiologiske undersøkelser av befolkningen om forskjellige politiske spørsmål. Samtidig legges resultatene av undersøkelsen på forsiden av avisene, og prøvetakingsfeilen og metodikken for statistisk analyse trykkes et sted i midten. For å bevise gyldigheten av de oppnådde punktestimatene, er det nødvendig å indikere utvalgsstørrelsen de ble oppnådd på grunnlag av, grensene for konfidensintervallet og dets signifikansnivå.

Neste notat

Materiale fra boken Levin mfl. Statistikk for ledere benyttes. - M.: Williams, 2004. - s. 448–462

Sentral grensesetning sier at, gitt en tilstrekkelig stor utvalgsstørrelse, kan utvalgsfordelingen av gjennomsnitt tilnærmes ved en normalfordeling. Denne egenskapen er ikke avhengig av type befolkningsfordeling.

"Katren-Style" fortsetter å publisere en syklus av Konstantin Kravchik om medisinsk statistikk. I to tidligere artikler har forfatteren vært inne på forklaringen av slike begreper som og.

Konstantin Kravchik

Matematiker-analytiker. Spesialist innen statistisk forskning innen medisin og humaniora

Moskva by

Svært ofte i artikler om kliniske studier kan du finne en mystisk setning: "konfidensintervall" (95 % CI eller 95 % CI – konfidensintervall). For eksempel kan en artikkel si: "Studentens t-test ble brukt til å vurdere betydningen av forskjeller, med et 95 % konfidensintervall beregnet."

Hva er verdien av "95 % konfidensintervall" og hvorfor beregne det?

Hva er et konfidensintervall? – Dette er området der de sanne middelverdiene i befolkningen faller. Og hva, det er "usanne" gjennomsnitt? På en måte, ja, det gjør de. I forklarte vi at det er umulig å måle parameteren av interesse i hele populasjonen, så forskerne nøyer seg med et begrenset utvalg. I dette utvalget (for eksempel etter kroppsvekt) er det én gjennomsnittsverdi (en viss vekt), som vi bedømmer gjennomsnittsverdien etter i hele befolkningen generelt. Det er imidlertid lite sannsynlig at gjennomsnittsvekten i utvalget (spesielt en liten en) vil falle sammen med gjennomsnittsvekten i befolkningen generelt. Derfor er det mer riktig å beregne og bruke rekkevidden av gjennomsnittsverdier for den generelle befolkningen.

Anta for eksempel at 95 % konfidensintervall (95 % KI) for hemoglobin er mellom 110 og 122 g/L. Dette betyr at med 95 % sannsynlighet vil den sanne gjennomsnittsverdien for hemoglobin i den generelle befolkningen være i området fra 110 til 122 g/L. Med andre ord, vi kjenner ikke gjennomsnittlig hemoglobin i den generelle befolkningen, men vi kan indikere verdiområdet for denne funksjonen med 95% sannsynlighet.

Konfidensintervaller er spesielt relevante for forskjellen i middel mellom grupper, eller det som kalles effektstørrelsen.

Anta at vi sammenlignet effektiviteten til to jernpreparater: en som har vært på markedet lenge og en som nettopp er registrert. Etter behandlingsforløpet ble konsentrasjonen av hemoglobin i de studerte pasientgruppene vurdert, og det statistiske programmet beregnet for oss at forskjellen mellom gjennomsnittsverdiene til de to gruppene med en sannsynlighet på 95 % er i området fra 1,72 til 14,36 g/l (tabell 1).

Tab. 1. Kriterium for uavhengige utvalg
(gruppene sammenlignes etter hemoglobinnivå)

Dette skal tolkes slik: Hos en del av pasientene i den generelle befolkningen som tar et nytt legemiddel, vil hemoglobinet i gjennomsnitt være høyere med 1,72–14,36 g/l enn hos de som tok et allerede kjent legemiddel.

Med andre ord, i den generelle befolkningen er forskjellen i gjennomsnittsverdiene for hemoglobin i grupper med 95 % sannsynlighet innenfor disse grensene. Det vil være opp til forskeren å vurdere om dette er mye eller lite. Poenget med alt dette er at vi ikke jobber med én gjennomsnittsverdi, men med en rekke verdier, derfor estimerer vi mer pålitelig forskjellen i en parameter mellom grupper.

I statistiske pakker, etter forskerens skjønn, kan man uavhengig begrense eller utvide grensene for konfidensintervallet. Ved å senke sannsynlighetene for konfidensintervallet, begrenser vi middelområdet. For eksempel, ved 90 % KI, vil området for gjennomsnitt (eller gjennomsnittlige forskjeller) være smalere enn ved 95 % KI.

Omvendt, øker sannsynligheten til 99 % utvider verdiområdet. Ved sammenligning av grupper kan den nedre grensen for CI krysse nullmerket. For eksempel, hvis vi utvidet grensene for konfidensintervallet til 99 %, varierte grensene for intervallet fra –1 til 16 g/L. Dette betyr at i den generelle befolkningen er det grupper, hvor forskjellen mellom gjennomsnittene for den studerte egenskapen er 0 (M=0).

Konfidensintervaller kan brukes til å teste statistiske hypoteser. Hvis konfidensintervallet krysser nullverdien, er nullhypotesen, som antar at gruppene ikke er forskjellige i den studerte parameteren, sann. Et eksempel er beskrevet ovenfor, da vi utvidet grensene til 99 %. Et sted i den generelle befolkningen fant vi grupper som ikke var forskjellige på noen måte.

95 % konfidensintervall for forskjell i hemoglobin, (g/l)


Figuren viser 95 % konfidensintervall for gjennomsnittlig hemoglobinforskjell mellom de to gruppene som en linje. Linjen passerer nullmerket, derfor er det en forskjell mellom middelene lik null, noe som bekrefter nullhypotesen om at gruppene ikke er forskjellige. Forskjellen mellom gruppene varierer fra -2 til 5 g/l, noe som betyr at hemoglobin enten kan synke med 2 g/l eller øke med 5 g/l.

Konfidensintervallet er en svært viktig indikator. Takket være den kan du se om forskjellene i gruppene virkelig skyldtes forskjellen i gjennomsnittene eller på grunn av et stort utvalg, for med et stort utvalg er sjansen for å finne forskjeller større enn med et lite.

I praksis kan det se slik ut. Vi tok en prøve på 1000 personer, målte hemoglobinnivået og fant ut at konfidensintervallet for forskjellen i gjennomsnittet ligger fra 1,2 til 1,5 g/L. Nivået av statistisk signifikans i dette tilfellet s

Vi ser at hemoglobinkonsentrasjonen økte, men nesten umerkelig, derfor dukket den statistiske signifikansen opp nettopp på grunn av prøvestørrelsen.

Konfidensintervaller kan beregnes ikke bare for gjennomsnitt, men også for proporsjoner (og risikoforhold). For eksempel er vi interessert i konfidensintervallet for andelen pasienter som oppnådde remisjon mens de tok det utviklede stoffet. Anta at 95 % KI for proporsjonene, dvs. for andelen slike pasienter, er i området 0,60–0,80. Dermed kan vi si at medisinen vår har en terapeutisk effekt i 60 til 80 % av tilfellene.