Hvordan beregne utvalget for studien. Generell populasjon og prøvetakingsmetode

Formelen nedenfor for å beregne prøvestørrelse brukes i tilfeller der respondentene (respondentene) bare får ett spørsmål, som det kun er to mulige svar på. For eksempel "Ja" og "Nei"; "Jeg bruker" og "Jeg bruker ikke". Selvfølgelig, denne formelen kan kun brukes til enkel forskning. Hvis du trenger å bestemme prøvestørrelsen for mer enn storstilt forskning, for eksempel spørreskjemaer, så bør andre formler brukes.

En enkel formel for å beregne prøvestørrelse

hvor: n– prøvestørrelse;

z er det normaliserte avviket bestemt basert på det valgte konfidensnivået. Denne indikatoren karakteriserer muligheten, sannsynligheten for å få svar i et spesielt konfidensintervall. I praksis blir konfidensnivået ofte tatt som 95 % eller 99 %. Da vil z-verdiene være henholdsvis 1,96 og 2,58;

s– variasjon for utvalget, i andeler. I hovedsak er p sannsynligheten for at respondentene velger et eller annet svaralternativ. Anta at hvis vi tror at en fjerdedel av respondentene vil velge svaret "Ja", så vil p være lik 25 %, det vil si p = 0,25;

q= (1 - p);

e– tillatt feil, i brøker.

Eksempel på beregning av prøvestørrelse

Selskapet planlegger å sosiologisk forskning for å identifisere andelen røykere i befolkningen i byen. For å gjøre dette vil selskapets ansatte stille forbipasserende ett spørsmål: "Røyker du?". Mulige alternativer Dermed er det bare to svar: "Ja" og "Nei".

Prøvestørrelsen i dette tilfellet beregnes som følger. Konfidensnivået tas som 95 %, deretter det normaliserte avviket z = 1,96. Vi aksepterer variasjonen som 50 %, det vil si at vi betinget tror at halvparten av respondentene kan svare på spørsmålet om de røyker - "Ja". Deretter p=0,5. Herfra finner vi q = 1 – p = 1 – 0,5 = 0,5 . Akseptabel prøvetakingsfeil tas som 10 %, det vil si e = 0,1.

Vi erstatter disse dataene i formelen og beregner:

Får prøvestørrelsen n = 96 personer.

Omfanget av denne formelen

Ved gjennomføring enkel forskning når du trenger å få svar på bare ett enkelt spørsmål. I dette tilfellet er omfanget av svar, som regel, av en dikotom karakter. Det vil si at svar tilbys (eller underforstått) av typen "Ja" - "Nei", "Svart" - "Hvit", etc.

Funksjoner i denne formelen for å beregne prøvestørrelsen

Galyautdinov R.R.

Prøvestørrelsen må bestemmes før man starter de fleste kvantitative studier. Prøvestørrelsesbestemmelse er ikke nødvendig for kvalitativ forskning(Merk at dette refererer til formelt kvantitative metoder som innholdsanalyse; enkle beskrivende prosjekter er kvantitative.) Prøvestørrelsesberegningen kan ikke utføres før foreløpige pilotstudier (men slike studier utføres vanligvis før faktisk planlegging Vitenskapelig forskning). Hvis du er i tvil, sørg for å kontakte institusjonen som finansierer studien eller inkluderer den i sin forskningsplan - mangelen på data om utvalgsstørrelse er en av de mest vanlige årsaker nektet å godkjenne emnet

Hvorfor er utvalgsstørrelse viktig for en forsker?

Når man utfører studier som bestemmer prevalensen av en egenskap i en populasjon (for eksempel prevalensen av astma hos barn), er prøvestørrelsesberegninger nødvendig for å sikre at de resulterende estimatene har ønsket grad av nøyaktighet. For eksempel vil en sykdomsprevalens på 10 % oppnådd fra en prøvestørrelse på 20 ha et 95 % konfidensintervall på 1 % til 31 %, noe som verken er nøyaktig eller informativt. På den annen side vil en sykdomsprevalens på 10 % oppnådd fra et utvalg på 400 personer ha et 95 % konfidensintervall på 7 % til 13 %, noe som kan betraktes som et ganske nøyaktig resultat. estimering av prøvestørrelser unngår det første av disse to alternativene.

I studier utformet for å oppdage en effekt (f.eks. forskjell i effekt mellom to behandlinger, relativ risiko for sykdom med eller uten en risikofaktor), er prøvestørrelsesestimat viktig for å sikre at dersom det er klinisk eller biologisk viktig effekt finnes, så det en høy grad sannsynlighet vil bli oppdaget, med andre ord vil analysen gi statistisk signifikante resultater. Hvis prøvestørrelsen er liten, så selv om betydelige forskjeller mellom grupper vil det være umulig å bevise at de er et resultat av noe annet enn utvalgsvariabilitet.

Informasjon nødvendig for å beregne prøvestørrelse

Metoder for å estimere utvalgsstørrelse er beskrevet i en rekke lærebøker om statistikk, inkludert Altman, 1991; Bland, 2000; Armitage, Berry og Matthews, 2002. To bøker spesialiserer seg på å beskrive metoder for å estimere prøvestørrelser i ulike situasjoner. For kvalitative parametere bør arbeidet til Manchin et al. konsulteres. (1998), for kvalitet - Lemeshow et al. (1996). Begge bøkene inneholder tabeller for å beregne prøvestørrelser. Ved serieforsøk henvises det til Whitehead (1997) Selve prøvestørrelsesberegningene kan utføres ved hjelp av et av de mange dataprogrammene. For eksempel lar Stata-programmet deg analysere prøvestørrelsen som trengs for sammenligning av gjennomsnitt og proporsjoner, samt prevalensanalyse. Mye stor kvantitet alternativene tilbyr spesialiserte pakker som nQuery Advisor eller UnifyPow.

Prøvestørrelsesberegning avhenger av følgende faktorer, som må rapporteres til statistiker-konsulenten:

Variabler studert i studien, inkludert deres typer
Nødvendig forskningskraft
Nødvendig nivå Statistisk signifikant
Effektstørrelse som er klinisk relevant
Standardavvik for skalavariabler
Hvorvidt en ensidet eller tosidet signifikanstest vil bli brukt
Studiedesign er med andre ord studien:

tilfeldig kontrollert test
Cluster randomisert studie
Ekvivalensforskning
Ikke-randomisert intervensjonsstudie
observasjonsstudie
prevalensstudie
Studerer sensitiviteten og spesifisiteten til testen

Dette vil kreve å svare på en rekke tilleggsspørsmål:

Er parede data inkludert i studien?
Vil studien måle de samme variablene gjentatte ganger hos samme person?
Er gruppene som inngår i studien like store?
Er dataene hierarkisk?

Det bør tas i betraktning at ikke-randomiserte studier av forskjeller eller sammenhenger vanligvis krever en betydelig større utvalgsstørrelse for å ta hensyn til påvirkning av tredje variabler i analysen. Samtidig er forskeren interessert i den absolutte størrelsen på utvalget, og ikke prosentandelen det utgjør av populasjonen som helhet.

Hvilke statistiske termer brukes for å beskrive prøvestørrelsesplanleggingsprosessen

Null og alternative hypoteser

mange typer Statistisk analyse sikte på å sammenligne to typer behandling, prosedyrer eller pasientgrupper. Den numeriske verdien som oppsummerer forskjellene av interesse for forskeren kalles effekten. I andre studier kan effekten være en korrelasjonskoeffisient, oddsratio eller relativ risiko. Vi legger så frem null- og alternativhypotesene. Vanligvis sier nullhypotesen at det ikke er noen effekt (forskjeller mellom grupper er null, relativ risiko lik en, korrelasjonskoeffisienten er null), antyder den alternative hypotesen at det er en effekt.

Konfidenssannsynlighet (p-score)

P-verdien er sannsynligheten for å observere samme eller større effekt i en studie, gitt gyldigheten av nullhypotesen. Vanligvis uttrykt som en andel (f.eks. p=0,03)

Signifikansnivå

Signifikansnivået er terskelverdien for p-skåren som nullhypotesen må forkastes under og det konkluderes med at det er bevis på effekt. Typisk er signifikansnivået satt til en verdi på 5 % (signifikansnivået, til tross for den direkte sammenhengen med p-skåren, uttrykkes i prosent: et 5 % signifikansnivå tilsvarer p=0,05). Hvis den observerte verdien er mindre enn 5 %, er det en liten sjanse for at studien ville ha oppnådd slike resultater hvis det ikke var noen sann effekt. Derfor aksepteres hypotesen om tilstedeværelsen av effekten.

Et signifikansnivå på 5 % betyr også at det er nesten 5 % sjanse for å komme til at det er en effekt, mens det faktisk ikke er noen. Noen ganger er det mer hensiktsmessig å bruke et signifikansnivå på 1 %, spesielt hvis det er veldig viktig å unngå å konkludere med at en effekt eksisterer når den faktisk ikke gjør det.

Makt

Makt er sannsynligheten for at nullhypotesen vil bli tilstrekkelig avvist, med andre ord, når det faktisk er bevis på reelle forskjeller eller forhold. Det kan tenkes som "100 prosent minus sjansen for å gå glipp av den sanne effekten". Derfor, jo høyere kraft, desto mindre sannsynlig er det at den sanne effekten går glipp av. Strøm er vanligvis fastsatt til 80 %, 90 % eller 95 %. Effekten bør ikke være mindre enn 80 %. Hvis det er kritisk at studien ikke går glipp av en eksisterende effekt, bør man sikte på en kraft på 90 % eller mer.

Klinisk viktig effektstørrelse

Dette er de minste forskjellene mellom gruppemiddel eller prosentandeler av hendelser innenfor dem (oddsforhold nærmest enhetsrisiko) som fortsatt kan anses som biologisk eller klinisk signifikante. Utvalgsstørrelsen bør være slik at hvis slike forskjeller eksisterer, vil studien gi statistisk signifikante resultater.

En-hale eller to-hale signifikanstest

I en tosidet test er nullhypotesen at det ikke er noen forskjell, og den alternative hypotesen er at forskjeller mellom grupper kan gå i begge retninger. I en ensidig test definerer den alternative hypotesen den tiltenkte retningen for forskjellen, som at behandlingen er bedre enn placebo, og nullhypotesen inkluderer situasjoner der effekten av medikamentet og placebo er den samme og hvor medikamentet gir resultater. med et dårligere resultat enn placebo.

Hvis ikke alvorlige grunner for ikke å gjøre dette bør man bruke en tosidig hypotese. Forventningen om at forskjellene skal gå i en eller annen retning er ikke tilstrekkelig grunn til å bruke en ensidig test. Medisinske forskere blir ofte overrasket om resultatet ikke blir som forventet, svært ofte har et slikt funn andre konsekvenser enn ingen forskjell, og derfor må det beskrives tilstrekkelig. En ensidig test tillater ikke dette. For eksempler på situasjoner der en ensidig test kan være akseptabel, se Bland og Altman (1994).

Hvilke variabler bør tas i betraktning ved beregning av utvalgsstørrelsen

Beregningen av utvalgsstørrelsen bør baseres på analysen av hovedutfallsvariabelen i denne studien.

Dersom tilleggsvariabler inkluderes i studien, som også anses som viktige vitenskapelig betydning, bør prøvestørrelsen være slik at den tillater en adekvat analyse av disse variablene. For alt viktig vitenskapelig variabler bør utføres og beregningen av utvalgsstørrelsen presenteres.

Prosentandel av respons og overvåkingstapsregnskap

Den estimerte prøvestørrelsen indikerer antall pasienter i den siste gruppen som ble analysert ved slutten av studien. Derfor bør antallet individer som skal registreres i studien økes i henhold til forventet respons, tap av oppfølging, manglende overholdelse av protokollen og andre mulige årsaker til tap av forsøkspersoner. Forholdet mellom forventet antall deltakere og utvalgsstørrelsen som skal dannes bør beskrives tydelig.

Overholdelse av målene for studien og metoder for statistisk analyse

Tilstrekkeligheten av utvalgsstørrelsen bør også vurderes i henhold til formålet med studien. For eksempel, hvis målet med en studie er å vise at et nytt medikament er bedre enn et eksisterende, er det nødvendig å sikre at prøvestørrelsen gjør det mulig å oppdage klinisk signifikante forskjeller mellom de to behandlingene. Noen ganger er det imidlertid nødvendig å demonstrere at to legemidler er klinisk likeverdige. Denne typen studier blir ofte referert til som en ekvivalens eller "negativ" test. Spørsmål om prøvestørrelse for disse studiene er beskrevet i Pocock (1983). Prøvestørrelsen i studier rettet mot å demonstrere legemiddelekvivalens er større enn i studier som tar sikte på å identifisere forskjeller i effekt. Det er viktig å sikre at utvalgsstørrelsesberegninger er relatert til målene og målene for studien og er basert på data om den primære utfallsvariabelen.

Prøvestørrelser bør også være tilstrekkelige for analysemetodene som brukes i studien, da både prøvestørrelse og analyse avhenger av det valgte studiedesignet. Det er viktig å sikre at de tiltenkte analysemetodene og prøvestørrelsesberegningene er kompatible med hverandre.

Eksempler på beregning av prøvestørrelse.

Hvis den tiltenkte studien krever et enkelt frekvensestimat, en sammenligning av to gjennomsnitt eller en sammenligning av to frekvenser, er prøvestørrelsesberegningene (vanligvis) relativt enkle og presenteres derfor nedenfor. Vi anbefaler imidlertid at du alltid rådfører deg med en statistiker om beregninger av prøvestørrelse.

Estimering av én enkelt frekvens

Merk: Formelen nedenfor er basert på den såkalte. "tilnærmet normal distribusjon" og med mindre det er planlagt å lage et veldig stort utvalg, anbefales det ikke å estimere frekvenser nær 0 eller 1 (0: eller 100%. I slike tilfeller bør "eksakte" metoder brukes. Lignende situasjon kan observeres når man studerer sensitiviteten og spesifisiteten til en ny diagnostisk metode, der tilstedeværelsen av frekvenser nær 1 (100%) forventes. PÅ denne saken en statistiker bør konsulteres, eller i det minste spesialiserte dataprogrammer bør brukes.

Scenario: Bruk et spørreskjema via e-post for å vurdere forekomsten av luftveisproblemer hos pasienter med bronkial astma under medisinsk tilsyn. allmennpraksis(Thomas et al., 2001)

Nødvendig informasjon:

Primær utfallsvariabel = tilstedeværelse eller fravær av respirasjonssvikt
Estimert frekvens av brudd = 30 % (0,3)
Nødvendig 95 % konfidensintervallbredde = 10 % (dvs. +/-5 % eller 25 % til 35 %)

Formelen for å estimere prøvestørrelsen til en enkelt frekvens er:

n=15,4*p*(1-p)/W2

hvor n er den nødvendige prøvestørrelsen, p er forventet frekvens av resultatet (i dette tilfellet 0,3) og W er bredden på konfidensintervallet (i dette tilfellet 0,1)

Ved å erstatte verdiene i formelen får vi:

n=15,4*0,3*(1-0,3)/0,1 2 =324

"For å oppnå et +/-5 % konfidensintervall rundt et prevalensestimat på 30 %, ville det være nødvendig med et utvalg på 324 personer. Gitt en 70 % svarprosent på tilbudet om å delta i studien, vil 480 spørreskjemaer bli delt ut."

Sammenligning av to frekvenser

Scenario: En randomisert, placebokontrollert studie av effekten av kolonistimulerende faktor for å redusere risikoen for sepsis hos premature spedbarn er planlagt. En tidligere studie viste at forekomsten av sepsis hos disse barna er 50 % innen 2 uker etter fødselen, og forskerne mener at en reduksjon i denne frekvensen til 34 % vil være klinisk signifikant.

Nødvendig informasjon:

Primær utfallsvariabel = tilstedeværelse eller fravær av sepsis hos nyfødte 14 dager etter fødsel (behandling administreres inntil maksimalt 72 timer etter fødsel). Dette er en kvalitativ variabel representert ved frekvenser.
Signifikant forskjell = 16 % eller 0,16 (dvs. 50 %-34 %)
Signifikansnivå=5 %
Effekt=80 %
Test=tosidig

Formelen for å beregne prøvestørrelsen når du sammenligner to frekvenser er:

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

hvor n = prøvestørrelse for hver gruppe ( Generell størrelse dobbelt så mange prøver)

p 1 = første frekvens - i dette tilfellet 0,50

p 2 = andre frekvens - i dette tilfellet 0,34

p 1 - p 2 = klinisk signifikant forskjell, i dette tilfellet 0,16

Tabell over verdier for A og B
Signifikansnivå



Makt

Ved å erstatte verdiene i formelen får vi:

n= 2 *[(0,5*0,5+(0,34*0,66)]/ 2 =146

Dermed får vi antall observasjoner som kreves for å inkluderes i hver av gruppene. Total populasjon utvalget vil være dobbelt så stort, dvs. 292 barn

En beskrivelse av resultatene av prøvestørrelsesberegningen kan se slik ut:

"En prøve på 292 nyfødte (146 i behandlings- og placebogruppene) ville være tilstrekkelig til å oppdage en forskjell i sepsisfrekvens på 16 % med 80 % kraft ved 5 % konfidensnivå. 16 % forskjell tilsvarer forskjellen mellom 50 % sepsis rate på dag 14 i placebogruppen og 34 % i behandlingsgruppen."

Sammenligning av to gjennomsnitt

Merk: Beregningene nedenfor er kun gyldige når de to gruppene er like store.

Scenario: En randomisert kontrollert studie som sammenligner kortvarig psykologisk behandling versus konvensjonell behandling for å bekjempe suicidale tendenser hos pasienter innlagt på sykehus etter et selvmordsforsøk er planlagt. Selvmordstendenser måles ved hjelp av Beck-skalaen. Standardavviket for skårer på denne skalaen er 7,7 (data fra tidligere studier), og forskjeller på 5 poeng på Beck-skalaen anses som klinisk signifikante. Opptil en tredjedel av pasientene forventes å falle ut av behandlingsgruppen (Guthrie et al., 2001)

Nødvendig informasjon:

Primær utfallsvariabel = Beck Suicidity Scale. Kontinuerlig variabel beskrevet ved middel
Standardavvik=7,7 poeng
Klinisk signifikant effektstørrelse = 5 poeng
Signifikansnivå=5 %
Effekt=80 %
Test=tosidig

Formelen for å beregne prøvestørrelsen når du sammenligner to gjennomsnitt er som følger:

n= 2 *2*SD 2 /DIFF 2

hvor n = utvalgsstørrelse for hver gruppe (total utvalgsstørrelse er dobbelt så stor)

SD= standardavvik for den primære utfallsvariabelen, i dette tilfellet 7,7

DIFF=klinisk viktig effekt, i dette tilfellet 5.0

A - avhenger av signifikansnivået (se tabell) - i dette tilfellet 1,96

B - avhenger av effekt (se tabell) - i dette tilfellet 0,84

Tabell over verdier for A og B
Signifikansnivå



Makt

Erstatter nødvendige verdier inn i formelen får vi:

n= 2 *2*7,7 2 /5,0 2 = 38

Dermed får vi antall observasjoner som kreves for å inkluderes i hver av gruppene. Den totale prøvestørrelsen vil være dobbelt så stor, dvs. 76 personer.

En tilstrekkelig beskrivelse av prøvestørrelsesestimatet vil være som følger:

"For å oppdage en forskjell på 5 poeng på Beck Suicidal Tendency Scale på 5% signifikansnivå med 80% kraft, forutsatt et standardavvik på 7,7 poeng, ville det kreves 38 personer i intervensjons- og kontrollgruppen. Dette tallet ble økt til 60 i gruppen ( Total observasjoner 120), for å kompensere for tapet i observasjon, som vanligvis er omtrent en tredjedel av forsøkspersonene "

Eksempler på mangelfulle beskrivelser av estimerte utvalgsstørrelser som trengs

Eksempel 1

"Den forrige studien på dette området brukte et utvalg på 150 personer og oppnådde svært pålitelige resultater (p = 0,014), så et lignende antall pasienter er inkludert i denne studien."

Tidligere studier kan ha vært rett og slett «heldige» i den forstand at de signifikante resultatene de fant skyldes tilfeldig variasjon i utvalgets gjennomsnitt. Prøvestørrelsen må beregnes for denne studien- inkludert detaljer som studiekraft, signifikansnivå, hovedvariabel studert, klinisk signifikant effektstørrelse, standardavvik (for kvantitative variabler) og størrelsen på hver gruppe hvis det er flere grupper i studien

Eksempel 2

"Utvalgsstørrelsen ble ikke beregnet fordi det ikke var noen foreløpig informasjon for å estimere den"

Litteraturen bør gjennomgås nøye for å finne informasjonen som trengs for å beregne prøvestørrelsen. Hvis denne informasjonen ikke er tilgjengelig, kan en liten forundersøkelse organiseres for å samle inn denne informasjonen.

Hvis det ikke er informasjon om verdien standardavvik, kan prøvestørrelsesberegninger gis i mer generelt syn forskjeller som er klinisk effektive kan for eksempel ikke beskrives i absolutte verdier, men i enheter med standardavvik.

Men hvis det skrives et tilskuddsforslag for å finansiere en pilotstudie for å samle informasjon som er nødvendig for å beregne utvalgsstørrelsen til en påfølgende stor studie, blir ikke prøvestørrelsesberegningen utført i et slikt forslag.

"Klinikken mottar 50 pasienter med denne sykdommen i løpet av året. Omtrent 10 % av dem kan nekte å delta i studien. Derfor vil det innen to år være mulig å rekruttere et utvalg på 90 personer."

Selv om de fleste studier må balansere design med kraft, bør ikke prøvestørrelsen bestemmes utelukkende på grunnlag av antall pasienter tilgjengelig for studien.

I situasjoner der antall pasienter er en begrensende faktor i utvalgsstørrelsen, bør det likevel gjøres beregninger for å fastslå a) styrken til en studie med et gitt antall pasienter i forhold til klinisk viktige forskjeller, eller b) størrelsen på effekten. som kan bli funnet i en studie av en gitt størrelse (med tanke på dens kraft).

I tilfeller der det tilgjengelige antallet pasienter er for lite til å oppdage klinisk relevante forskjeller, kan det vurderes å forlenge varigheten av studien eller å gjennomføre en samarbeidende multisenterstudie med flere etterforskere.

Litteratur

Altman D.G. (1991) Praktisk statistikk for medisinsk forskning. Chapman og Hall, London.
Armitage P, Berry G, Matthews JNS. (2002) Statistical Methods in Medical Research, 4. utg. Blackwell, Oxford.
Bland JM og Altman DG. (1994). En- og tosidige betydningstester. British Medical Journal 309 248.
Bland M. (2000) An Introduction to Medical Statistics, 3. utg. Oxford University Press, Oxford.
Elashoff JD. (2000) Brukerveiledning for nQuery Advisor versjon 4.0 Los Angeles, CA.
Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001) Randomisert kontrollert forsøk med kort psykologisk intervensjon etter bevisst selvforgiftning. British Medical Journal 323, 135-138.
Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (1996) Tilstrekkelighet av utvalgsstørrelse i helsestudier. John Wiley & Sons, Chichester.
Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) Statistical Tables for the Design of Clinical Studies, Second Edition Blackwell, Oxford.
Pocock SJ. (1983) Clinical Trials: A Practical Approach. John Wiley og sønner, Chichester.
Thomas M, McKinley RK, Freeman E, Foy C. (2001) Prevalens av dysfunksjonell pust hos pasienter behandlet for astma i primærhelsetjenesten: tverrsnittsundersøkelse. British Medical Journal 322, 1098-1100.
Whitehead, J. (1997) The Design and Analysis of Sequential Clinical Trials, revidert andre. utg. Chichester, Wiley.

KALKULATORER

Befolkning

Det totale antallet observasjonsobjekter (mennesker, husholdninger, bedrifter, bosetninger etc.), som har et visst sett med egenskaper (kjønn, alder, inntekt, antall, omsetning, etc.), begrenset i rom og tid. Eksempler på befolkninger: - Alle innbyggere i Moskva (10,6 millioner mennesker i henhold til folketellingen for 2002) - Mannlige muskovitter (4,9 millioner mennesker i henhold til folketellingen for 2002) - Juridiske enheter Russland (2,2 millioner i begynnelsen av 2005) - Utsalgssteder som selger matvarer (20 tusen i begynnelsen av 2008), etc.

Utvalg (prøvepopulasjon)

En del av objektene fra populasjonen valgt ut for undersøkelse for å trekke en konklusjon om hele populasjonen. For at konklusjonen oppnådd ved å studere utvalget skal utvides til hele populasjonen, må utvalget ha egenskapen å være representativt.

Eksempel representativitet

Egenskapen til utvalget til å reflektere den generelle populasjonen korrekt. Det samme utvalget kan være representativt eller ikke representativt for ulike populasjoner Eksempel: - Et utvalg som utelukkende består av muskovitter som eier en bil representerer ikke hele befolkningen i Moskva. - Et utvalg av russiske foretak på opptil 100 personer representerer ikke alle foretak i Russland. - Et utvalg av muskovitter som gjør kjøp i markedet representerer ikke kjøpsatferden til alle muskovitter. Samtidig er disse prøvene (med forbehold om andre forhold) kan perfekt representere moskovitter - bileiere, små og mellomstore russiske bedrifter og kjøpere som handler i markedene, henholdsvis. Det er viktig å forstå at utvalgsrepresentativitet og prøvetakingsfeil er forskjellige fenomener. Representativitet, i motsetning til feilen, er ikke avhengig av utvalgsstørrelsen på noen måte Eksempel: Uansett hvor mye vi øker antallet intervjuede moskovitter-bileiere, vil vi ikke kunne representere alle muskovittene med dette utvalget.

Sampling feil (konfidensintervall)

Avvisning av resultater oppnådd vha selektiv observasjon fra de sanne dataene for den generelle befolkningen Det er to typer prøvetakingsfeil - statistiske og systematiske. Den statistiske feilen avhenger av prøvestørrelsen. Jo større prøvestørrelse, jo lavere er den Eksempel: For en enkel tilfeldig utvalg med en størrelse på 400 enheter er den maksimale statistiske feilen (med 95 % konfidenssannsynlighet) 5 %, for et utvalg på 600 enheter – 4 %, for et utvalg på 1100 enheter – 3 % fra ulike faktorer som har en permanent innvirkning på studien og fordreier resultatene av studien i en bestemt retning. aktivt bilde liv. Dette skjer på grunn av det faktum at det er mye vanskeligere å finne slike mennesker på et bestemt sted (for eksempel hjemme). 80%) I noen tilfeller, når de sanne fordelingene er kjent, systematisk feil kan utjevnes ved innføring av kvoter eller ny vekting av data, men i de fleste virkelige studier kan selv å vurdere det være ganske problematisk.

Prøvetyper

Prøver er delt inn i to typer:
- sannsynlighet
- usannsynlighet

1. Sannsynlighetsprøver
1.1 Tilfeldig utvalg (enkelt tilfeldig utvalg)
Et slikt utvalg antar homogeniteten til den generelle befolkningen, den samme sannsynligheten for tilgjengeligheten av alle elementer, tilstedeværelsen komplett liste alle elementer. Ved valg av elementer brukes som regel en tabell med tilfeldige tall.
1.2 Mekanisk (systematisk) prøvetaking
En slags tilfeldig prøve, sortert etter et eller annet attributt (alfabetisk rekkefølge, telefonnummer, fødselsdato osv.). Det første elementet velges tilfeldig, deretter velges hvert 'k'te element i trinn på 'n'. Størrelsen på den generelle befolkningen, mens - N=n*k
1.3 Stratifisert (sonert)
Det brukes i tilfelle heterogenitet i den generelle befolkningen. Befolkning delt inn i grupper (strata). I hvert stratum utføres seleksjonen tilfeldig eller mekanisk.
1.4 Seriell (nested eller gruppert) prøvetaking
På seriell prøvetaking seleksjonsenhetene er ikke selve objektene, men grupper (klynger eller reir). Grupper velges tilfeldig. Objekter innenfor grupper kartlegges over alt.

2. Utrolige prøver
Utvelgelsen i et slikt utvalg utføres ikke i henhold til tilfeldighetsprinsippene, men etter subjektive kriterier - tilgjengelighet, typiskhet, lik representasjon, etc.
2.1. Kvoteprøvetaking
Til å begynne med tildeles et visst antall grupper av objekter (for eksempel menn i alderen 20-30 år, 31-45 år og 46-60 år; personer med en inntekt på opptil 30 tusen rubler, med en inntekt på 30 til 60 år tusen rubler og med en inntekt på mer enn 60 tusen rubler ) For hver gruppe spesifiseres antall objekter som skal undersøkes. Antall objekter som skal falle inn i hver av gruppene settes, oftest, enten i forhold til den tidligere kjente andelen av gruppen i befolkningen generelt, eller likt for hver gruppe. Innenfor gruppene velges objekter tilfeldig. Kvoteprøver brukes ganske ofte i markedsundersøkelser.
2.2. Snøballmetoden
Prøven er konstruert som følger. Hver respondent, som starter med den første, blir bedt om å kontakte sine venner, kolleger, bekjente som passer til seleksjonsbetingelsene og kan delta i studien. Således, med unntak av det første trinnet, dannes utvalget med deltakelse av studieobjektene selv. Metoden brukes ofte når det er nødvendig å finne og intervjue vanskelig tilgjengelige grupper av respondenter (for eksempel respondenter med høy inntekt, respondenter som tilhører samme yrkesgruppe, respondenter som har noen lignende hobbyer/lidenskaper osv. )
2.3 Spontan prøvetaking
De mest tilgjengelige respondentene er spurt. Typiske eksempler spontane utvalg - undersøkelser i aviser/magasiner, spørreskjemaer gitt til respondenter for selvutfylling, de fleste internettundersøkelser. Størrelsen og sammensetningen av spontane prøver er ikke kjent på forhånd, og bestemmes av kun én parameter - aktiviteten til respondentene.
2.4 Eksempel på typiske tilfeller
Enheter av den generelle befolkningen velges som har en gjennomsnittlig (typisk) verdi av attributtet. Dette reiser problemet med å velge en funksjon og bestemme dens typiske verdi.

Kalkulator for feil og prøvestørrelse

(for en enkel tilfeldig prøve)

Forklaringer for feltene:

Tillitssannsynlighet
Sannsynligheten for at konfidensintervallet dekker det ukjente sann verdi parameter estimert fra prøvedata. I forskningspraksis brukes oftest 95 % konfidensnivå.

Sampling feil (konfidensintervall)
Et intervall beregnet fra utvalgsdata som med en gitt sannsynlighet (konfidens) dekker den ukjente sanne verdien av den estimerte fordelingsparameteren.

Funksjonsandel

Den forventede andelen av funksjonen som feilen beregnes for. Hvis det ikke er data om andelen av karakteristikken, er det nødvendig å bruke en verdi lik 50, hvor den maksimale feilen oppnås.

En av hovedkomponentene i en godt tilrettelagt studie er definisjonen av utvalget og hva som er et representativt utvalg. Det er som kakeeksemplet. Tross alt er det ikke nødvendig å spise hele desserten for å forstå smaken? En liten del er nok.

Så, kaken er befolkning (det vil si alle respondenter som kvalifiserer til undersøkelsen). Det kan uttrykkes territorielt, for eksempel bare innbyggere i Moskva-regionen. Kjønn - kun kvinner. Eller har aldersbegrensninger – russere er over 65 år.

Det er vanskelig å beregne folketallet: du må ha data fra folketellingen eller foreløpige vurderingsundersøkelser. Derfor er vanligvis den generelle befolkningen "estimert", og fra det resulterende antallet beregner de prøvetakingsramme eller prøvetaking.

Hva er et representativt utvalg?

Prøve er et veldefinert antall respondenter. Dens struktur bør sammenfalle så mye som mulig med strukturen til den generelle befolkningen når det gjelder hovedkarakteristikkene til utvalget.

For eksempel, hvis potensielle respondenter er hele befolkningen i Russland, hvor 54 % er kvinner og 46 % er menn, bør utvalget inneholde nøyaktig det samme prosentdel. Hvis parametrene samsvarer, kan prøven kalles representativ. Dette betyr at unøyaktigheter og feil i studien minimeres.

Prøvestørrelsen bestemmes under hensyntagen til kravene til nøyaktighet og økonomi. Disse kravene er omvendt proporsjonale med hverandre: jo større utvalgsstørrelsen er mer presist resultatet. Dessuten, jo høyere nøyaktighet, jo tilsvarende mer kostnader kreves for studien. Og omvendt, jo mindre utvalget er, jo mindre koster det, jo mindre nøyaktig og mer tilfeldig blir egenskapene til den generelle befolkningen reprodusert.

Derfor, for å beregne mengden valg, oppfant sosiologer en formel og opprettet spesiell kalkulator:

Tillitssannsynlighet og tillitsfeil

Hva betyr vilkårene " selvtillitsnivå"og" tillitsfeil"? Konfidensnivået er et mål på nøyaktigheten til målingene. Og tillitsfeilen er mulig feil forskningsresultater. For eksempel, med en generell befolkning på mer enn 500 00 personer (for eksempel bosatt i Novokuznetsk), vil utvalget være 384 personer med selvtillitsnivå 95 % og feil 5 % ELLER (med konfidensintervall 95±5 %).

Hva følger av dette? Når du utfører 100 studier med et slikt utvalg (384 personer), vil svarene som mottas i 95 prosent av tilfellene, i henhold til statistikkens lover, være innenfor ± 5 % av originalen. Og vi får representativ prøve med en minimumssannsynlighet for statistisk feil.

Etter at prøvestørrelsesberegningen er gjort, kan du se om det er nok respondenter i demoversjonen av spørreskjemapanelet. Du kan lære mer om hvordan du gjennomfører en panelundersøkelse.

Når du stiller spørsmålet "Hvor mange respondenter trenger jeg for en undersøkelse?", spør du egentlig: "Hvor stort må utvalget mitt være for å estimere populasjonen min nøyaktig?" Gitt kompleksiteten til disse konseptene, har vi delt ned prosessen i 5 trinn, noe som gjør det enkelt for deg å beregne din ideelle prøvestørrelse og sikre nøyaktigheten av undersøkelsesresultatene dine.

5 trinn for å sikre at utvalget ditt anslår populasjonen nøyaktig:

Trinn 1

Hva er din generelle befolkning?

Med begrepet "generell befolkning" mener vi hele gruppen mennesker du skal spørre om sin mening (utvalget vil bestå av medlemmer av denne populasjonen som faktisk vil delta i undersøkelsen).

For eksempel, hvis du ønsker å forstå hvordan du finner et marked for tannkrem i Frankrike, vil befolkningen din være befolkningen i Frankrike. Og hvis du prøver å finne ut hvor mange feriedager folk som jobber for et tannkremfirma ønsker å ha, er populasjonen din de ansatte i det selskapet.

Enten det er et land eller en bedrift, er etablering av en befolkning et viktig første skritt. Når du har bestemt deg for populasjonen, sett (omtrent) størrelsen. For eksempel har Frankrike rundt 65 millioner mennesker, men et tannkremfirma har sannsynligvis langt færre ansatte.

Fikk du riktig nummer? Ok, la oss gå videre...

Steg 2

Hva er den nødvendige nøyaktigheten?

Dette trinnet er en slags vurdering av hvor stor risiko du er villig til å ta angående muligheten for unøyaktige spørreundersøkelser på grunn av at du ikke kartlegger hele befolkningen. Derfor bør du svare på to spørsmål:

Hvor trygg må du være på at svarene du får gjenspeiler meningene til befolkningen generelt?
Dette er din feilmargin. Så la oss si at 90 % av prøven liker tyggegummi med druesmak. En feilmargin på 5 % legger til 5 % på hver side av det tallet, noe som betyr at faktisk 85–95 % av prøven liker tyggegummi med druesmak. 5 % er den mest brukte feilmarginen, men du kan sette den til mellom 1 % og 10 % avhengig av undersøkelsen. Det anbefales ikke å heve dette tallet over 10 %.
Hvor sikker må du være på at utvalget nøyaktig representerer populasjonen?

Dette er ditt tillitsnivå. Konfidensnivået er sannsynligheten for at utvalget er signifikant for de oppnådde resultatene. Beregningen gjøres vanligvis som følger. Hvis du tilfeldig valgte 30 flere utvalg fra denne populasjonen, hvor ofte ville resultatet for ett utvalg avvike signifikant fra resultatene for de andre 30 utvalgene? Et konfidensnivå på 95 % betyr at 95 % av tiden vil resultatene samsvare. 95 % er den mest brukte verdien, men du kan sette den til 90 % eller 99 % avhengig av avstemningen. Det anbefales ikke å senke konfidensnivået under 90 %.

Trinn 3

Hvilken prøvestørrelse trenger jeg?

I tabellen nedenfor velger du en omtrentlig målpopulasjonsstørrelse og en feilmargin for å bestemme antall fullførte intervjuer som kreves.

Nå som du har dine skritt 1 og skritt 2-verdier, bruk den praktiske tabellen nedenfor for å bestemme størrelsen på den nødvendige prøven...

Befolkning	Feilmargin			Tillitsnivå
Befolkning	10%	5%	1%	90%	95%	99%
100	50	80	99	74	80	88
500	81	218	476	176	218	286
1000	88	278	906	215	278	400
10 000	96	370	4900	264	370	623
100 000	96	383	8763	270	383	660
1 000 000+	97	384	9513	271	384	664

Merk. Dataene er kun gitt som en veiledning. Også for befolkninger over 1 million kan tallene avrundes til nærmeste hundre.

Trinn 4

Hvor responsive vil folk være?

Dessverre vil ikke alle du sender en spørreundersøkelse til motta svar.

Prosentandelen av personer som fyller ut undersøkelsesskjemaet de mottar, blir referert til som "svarprosenten". Å bestemme prosentandelen av respondentene til undersøkelsen din vil hjelpe deg med å bestemme totalt antall forekomster av undersøkelsen som må sendes ut for å motta nødvendig antall svar.

Prosentandelen av svar avhenger direkte av en rekke faktorer, for eksempel forhold til målgruppe, lengde og kompleksitet av undersøkelsen, insentiver som tilbys og emnet for undersøkelsen. For nettbaserte undersøkelser der det ikke tidligere er etablert et forhold til mottakere, prosentdel svarprosent på 20-30 % anses som svært høy. En mer konservativ og sannsynlig verdi er 10-14 %, hvis du ikke tidligere har gjennomført en undersøkelse i denne populasjonen.

Trinn 5

Så hvor mange personer bør du sende undersøkelsen til?

Dette er et enkelt trinn!

Bare del tallet du fikk i trinn 3 med tallet du fikk i trinn 4. Dette er det magiske tallet ditt.

Hvis du for eksempel vil at 100 kvinner som bruker sjampo skal fullføre en undersøkelse og du tror at 10 % av kvinnene du sender undersøkelsen til vil fullføre den, må du sende undersøkelsen til 1000 kvinner (100/10 %)!