Kako izračunati uzorak za studiju. Opća populacija i metoda uzorkovanja

Formula ispod za izračun veličina uzorka koristi se u slučajevima kada se ispitanicima (ispitanicima) postavlja samo jedno pitanje, na koje postoje samo dva moguća odgovora. Na primjer, "Da" i "Ne"; "Koristim" i "Ne koristim". Naravno, ovu formulu može se koristiti samo za jednostavno istraživanje. Ako trebate odrediti veličinu uzorka za više od istraživanja velikih razmjera, na primjer, upitnike, tada treba koristiti druge formule.

Jednostavna formula za izračunavanje veličine uzorka

gdje: n- veličina uzorka;

z je normalizirano odstupanje određeno na temelju odabrane razine pouzdanosti. Ovaj pokazatelj karakterizira mogućnost, vjerojatnost dobivanja odgovora u posebnom - intervalu povjerenja. U praksi se razina pouzdanosti često uzima kao 95% ili 99%. Tada će z vrijednosti biti 1,96 odnosno 2,58;

str– varijacija za uzorak, u udjelima. U biti, p je vjerojatnost da će ispitanici izabrati jednu ili drugu opciju odgovora. Pretpostavimo da ako vjerujemo da će četvrtina ispitanika izabrati odgovor "Da", tada će p biti jednak 25%, odnosno p = 0,25;

q= (1 – p);

e– dopuštena pogreška, u razlomcima.

Primjer izračuna veličine uzorka

Tvrtka planira sociološka istraživanja kako bi se utvrdio udio pušača u stanovništvu grada. Da bi to učinili, zaposlenici tvrtke postavljat će prolaznicima jedno pitanje: "Pušite li?". Moguće opcije Dakle, postoje samo dva odgovora: "Da" i "Ne".

Veličina uzorka u ovom slučaju izračunava se na sljedeći način. Razina pouzdanosti je uzeta kao 95%, zatim normalizirano odstupanje z = 1,96. Prihvaćamo varijaciju od 50%, odnosno uvjetno smatramo da polovica ispitanika može odgovoriti na pitanje puše li - “Da”. Zatim p=0,5. Odavde nalazimo q = 1 – p = 1 – 0,5 = 0,5 . Prihvatljiva greška uzorka je 10%, tj e = 0,1.

Zamjenjujemo ove podatke u formulu i izračunavamo:

Dobivanje veličine uzorka n = 96 osoba.

Opseg ove formule

Prilikom dirigiranja jednostavno istraživanje kada trebate dobiti odgovor na samo jedno jednostavno pitanje. U ovom slučaju, ljestvica odgovora je u pravilu dihotomne prirode. Odnosno, ponuđeni su (ili implicirani) odgovori tipa "Da" - "Ne", "Crno" - "Bijelo" itd.

Značajke ove formule za izračun veličine uzorka

Galyautdinov R.R.

Prije početka većine kvantitativnih studija potrebno je odrediti veličinu uzorka. Određivanje veličine uzorka nije potrebno za kvalitativno istraživanje(Imajte na umu da se ovo odnosi na formalno kvantitativne metode kao što je analiza sadržaja; jednostavni deskriptivni projekti su kvantitativni.) Izračun veličine uzorka ne može se provesti prije provođenja preliminarnih, pilot studija (međutim, takve se studije obično provode prije stvarnog planiranja znanstveno istraživanje). Ako ste u nedoumici, svakako kontaktirajte instituciju koja financira studiju ili je uključuje u svoj plan istraživanja - nedostatak podataka o veličini uzorka jedan je od najvećih uobičajeni uzroci odbijanje odobrenja teme

Zašto je veličina uzorka važna istraživaču?

Prilikom provođenja studija koje određuju prevalenciju neke karakteristike u populaciji (na primjer, prevalencija astme u djece), izračuni veličine uzorka su neophodni kako bi se osiguralo da rezultirajuće procjene imaju željeni stupanj točnosti. Na primjer, prevalencija bolesti od 10% dobivena iz veličine uzorka od 20 imala bi 95% interval pouzdanosti od 1% do 31%, što nije ni točno niti informativno. S druge strane, prevalencija bolesti od 10% dobivena na uzorku od 400 ljudi imala bi 95% interval pouzdanosti od 7% do 13%, što se može smatrati prilično točnim rezultatom. procjenom veličine uzorka izbjegava se prva od ove dvije opcije.

U studijama osmišljenim za otkrivanje učinka (npr. razlika u učinkovitosti između dva tretmana, relativni rizik od bolesti sa ili bez faktora rizika), procjena veličine uzorka je važna kako bi se osiguralo da klinički ili biološki važan učinak postoji, onda je visok stupanj vjerojatnost će biti otkrivena, drugim riječima, analiza će dati statistički značajne rezultate. Ako je veličina uzorka mala, čak i ako značajne razlike između skupina, bit će nemoguće dokazati da su rezultat nečeg drugog osim varijabilnosti uzorka.

Informacije potrebne za izračun veličine uzorka

Metode za procjenu veličine uzorka opisane su u nizu udžbenika o statistici, uključujući Altman, 1991.; Blag, 2000.; Armitage, Berry i Matthews, 2002. Dvije knjige specijalizirane su za opisivanje metoda za procjenu veličine uzorka u različite situacije. Za kvalitativne parametre potrebno je konzultirati rad Manchina i sur. (1998), za kvalitetu - Lemeshow et al. (1996). Obje knjige sadrže tablice koje pomažu u izračunavanju veličine uzorka. U slučaju serijskih pokusa treba se pozvati na Whitehead (1997.) Izračun stvarne veličine uzorka može se izvršiti pomoću jednog od mnogih računalnih programa. Na primjer, program Stata omogućuje analizu veličine uzorka potrebne za usporedbu srednjih vrijednosti i proporcija, kao i analizu prevalencije. Mnogo velika količina opcije nude specijalizirane pakete kao što su nQuery Advisor ili UnifyPow.

Izračun veličine uzorka ovisi o sljedeći čimbenici, što će biti potrebno prijaviti statističaru-konzultantu:

Varijable proučavane u studiji, uključujući njihove vrste
Potrebna istraživačka snaga
Potrebna razina statistička značajnost
Veličina učinka koja je klinički relevantna
Standardna devijacija za varijable skale
Hoće li se koristiti jednostrani ili dvostrani test značajnosti
Dizajn studije, drugim riječima, je studija:

nasumično kontrolirana proba pokus
Cluster randomized trial
Istraživanje ekvivalencije
Nerandomizirana intervencijska studija
promatračka studija
studija prevalencije
Proučavanje osjetljivosti i specifičnosti testa

Za to će biti potrebno odgovoriti na nekoliko pitanja dodatna pitanja:

Jesu li upareni podaci uključeni u studiju?
Hoće li studija više puta mjeriti iste varijable kod iste osobe?
Jesu li skupine uključene u studiju jednake veličine?
Jesu li podaci hijerarhijski?

Treba uzeti u obzir da nerandomizirane studije razlika ili odnosa obično zahtijevaju znatno veću veličinu uzorka kako bi se u analizi uzeo u obzir utjecaj trećih varijabli. Pritom, istraživača zanima apsolutna veličina uzorka, a ne postotak koji on čini od ukupne populacije.

Koji se statistički izrazi koriste za opisivanje procesa planiranja veličine uzorka

Nulta i alternativna hipoteza

mnoge vrste Statistička analiza usmjeren na usporedbu dva vrste liječenja, postupcima ili grupama pacijenata. Numerička vrijednost koja sažima razlike od interesa za istraživača naziva se učinak. U drugim studijama učinak može biti koeficijent korelacije, omjer izgleda ili relativni rizik. Zatim smo postavili nultu i alternativnu hipotezu. Obično nulta hipoteza kaže da nema učinka (razlike između skupina su nula, relativni rizik jednako jedan, koeficijent korelacije je nula), alternativna hipoteza sugerira da postoji učinak.

Vjerojatnost pouzdanosti (p-vrijednost)

P-vrijednost je vjerojatnost opažanja istog ili većeg učinka u studiji, s obzirom na valjanost nulte hipoteze. Obično se izražava kao udio (npr. p=0,03)

Razina značajnosti

Razina značajnosti je vrijednost praga za p-rezultat ispod kojeg se nulta hipoteza mora odbaciti i zaključuje se da postoji dokaz o učinku. Obično je razina značajnosti postavljena na vrijednost od 5% (Razina značajnosti, unatoč izravnom odnosu s p-rezultatom, izražava se u postotku: razina značajnosti od 5% ekvivalentna je p=0,05). Ako je promatrana vrijednost manja od 5%, tada postoji mala vjerojatnost da bi studija dobila takve rezultate da nije bilo pravog učinka. Stoga se prihvaća hipoteza o prisutnosti učinka.

Razina značajnosti od 5% također znači da postoji gotovo 5% šanse da se dođe do zaključka da postoji učinak, iako ga zapravo nema. Ponekad je prikladnije koristiti razinu značajnosti od 1%, osobito ako je vrlo važno izbjeći zaključak da učinak postoji, a zapravo ne postoji.

Vlast

Snaga je vjerojatnost da Nulta hipoteza bit će adekvatno odbijeni, drugim riječima, kada doista postoje dokazi o stvarnim razlikama ili odnosima. To se može smatrati "100 posto minus vjerojatnošću da se izostane pravi učinak". stoga, što je veća snaga, manja je vjerojatnost da će se pravi učinak propustiti. Snaga je obično fiksna na 80%, 90% ili 95%. Snaga ne smije biti manja od 80%. Ako je kritično da studija ne propusti postojeći učinak, treba ciljati na snagu od 90% ili više.

Klinički važna veličina učinka

To su najmanje razlike između srednjih vrijednosti skupine ili postotaka događaja unutar njih (omjeri izgleda najbliži jedinstvenom riziku) koje se još uvijek mogu smatrati biološki ili klinički značajnima. Veličina uzorka trebala bi biti takva da bi, ako takve razlike postoje, studija dala statistički značajne rezultate.

Jednostrani ili dvostrani test značajnosti

U dvostranom testu, nulta hipoteza je da nema razlike, a alternativna hipoteza je da razlike između grupa mogu ići u oba smjera. U jednostranom testu, alternativna hipoteza definira namjeravani smjer razlike, kao što je da je liječenje bolje od placeba, a nulta hipoteza uključuje situacije u kojima su učinak lijeka i placeba isti i gdje lijek rezultira u lošijem ishodu od placeba.

Ako ne ozbiljnih razloga da se to ne bi dogodilo, treba se koristiti dvostranom hipotezom. Očekivanje da će razlike ići u jednom ili drugom smjeru nije dovoljan razlog za korištenje jednostranog testa. Medicinski istraživači se često iznenade ako rezultat nije onakav kakav se očekivao, vrlo često takav nalaz ima druge posljedice osim da nema razlike, te ga stoga treba adekvatno opisati. Jednostrani test to ne dopušta. Za primjere situacija u kojima jednostrani test može biti prihvatljiv, vidi Bland i Altman (1994).

Koje varijable treba uzeti u obzir pri izračunavanju veličine uzorka

Izračun veličine uzorka trebao bi se temeljiti na analizi glavne varijable ishoda u ovoj studiji.

Ako su u studiju uključene dodatne varijable koje se također smatraju važnima znanstveni značaj, tada bi veličina uzorka trebala biti takva da omogućuje odgovarajuću analizu ovih varijabli. Za sve bitne znanstveno treba provesti varijable i prikazati izračun veličine uzorka.

Postotak odgovora i obračun gubitaka nadzora

Procijenjena veličina uzorka pokazuje broj pacijenata u konačnoj skupini analiziranoj na kraju studije. Stoga bi broj pojedinaca koji će biti uključeni u studiju trebao biti povećan u skladu s očekivanim odgovorom, gubitkom praćenja, nepoštivanjem protokola i drugim mogućim razlozima gubitka eksperimentalnih subjekata. Treba jasno opisati odnos između očekivanog broja sudionika i veličine uzorka koji treba formirati.

Usklađenost s ciljevima istraživanja i metodama statističke analize

Adekvatnost veličine uzorka također treba ocijeniti u skladu sa svrhom istraživanja. Na primjer, ako je cilj studije pokazati da je novi lijek bolji od postojećeg, potrebno je osigurati da veličina uzorka dopušta otkrivanje klinički značajnih razlika između dva načina liječenja. Međutim, ponekad je potrebno dokazati da su dva lijeka klinički ekvivalentna. Ova vrsta studije često se naziva testom ekvivalencije ili "negativnim" testom. Pitanja veličine uzorka za ove studije detaljno su opisana u Pocock (1983). Veličina uzorka u studijama kojima je cilj pokazati ekvivalentnost lijekova veća je nego u studijama kojima je cilj utvrditi razlike u učinkovitosti. Imperativ je osigurati da su izračuni veličine uzorka povezani s ciljevima studije i da se temelje na podacima o primarnoj varijabli ishoda.

Veličine uzorka također bi trebale biti primjerene metodama analize koje se koriste u studiji, jer i veličina uzorka i analiza ovise o odabranom dizajnu studije. Bitno je osigurati da su predviđene metode analize i izračuni veličine uzorka međusobno kompatibilni.

Primjeri izračuna veličine uzorka.

Ako namjeravana studija zahtijeva jednu procjenu učestalosti, usporedbu dviju srednjih vrijednosti ili usporedbu dviju učestalosti, izračuni veličine uzorka su (obično) relativno jednostavni i stoga su prikazani u nastavku. Međutim, preporučujemo da se uvijek posavjetujete sa statističarom o izračunu veličine uzorka.

Procjena jedne pojedinačne frekvencije

Napomena: Formula u nastavku temelji se na tzv. "približno normalna distribucija" i, osim ako se ne planira stvoriti vrlo velik uzorak, ne preporučuje se procjenjivati učestalosti blizu 0 ili 1 (0: ili 100%. U takvim slučajevima treba koristiti "egzaktne" metode. Slična situacija može se promatrati pri proučavanju osjetljivosti i specifičnosti nove dijagnostičke metode, gdje se očekuje prisutnost frekvencija blizu 1 (100%). NA ovaj slučaj potrebno je konzultirati statističara ili barem koristiti specijalizirane računalne programe.

Scenarij: Upitnikom poštom procijenite prevalenciju respiratornih problema u bolesnika s bronhalnom astmom pod liječničkim nadzorom. opće prakse(Thomas i sur., 2001.)

Obavezan podatak:

Primarna varijabla ishoda = prisutnost ili odsutnost respiratornog zatajenja
Procijenjena učestalost kršenja = 30% (0,3)
Potrebna širina intervala pouzdanosti od 95% = 10% (tj. +/-5% ili 25% do 35%)

Formula za procjenu veličine uzorka jedne frekvencije je:

n=15,4*p*(1-p)/W2

gdje je n potrebna veličina uzorka, p je očekivana učestalost rezultata (u ovom slučaju 0,3) i W je širina intervala pouzdanosti (u ovom slučaju 0,1)

Zamjenom vrijednosti u formulu dobivamo:

n=15,4*0,3*(1-0,3)/0,1 2 =324

"Da bi se dobio +/-5% interval pouzdanosti oko procjene prevalencije od 30%, bio bi potreban uzorak od 324 osobe. S obzirom na stopu odgovora od 70% na ponudu za sudjelovanje u studiji, bit će podijeljeno 480 upitnika"

Usporedba dviju frekvencija

Scenarij: Planirano je randomizirano, placebom kontrolirano ispitivanje učinkovitosti faktora stimulacije kolonija u smanjenju rizika od sepse u nedonoščadi. Prethodna studija pokazala je da je incidencija sepse u te djece 50% unutar 2 tjedna nakon rođenja, a istraživači vjeruju da bi smanjenje te učestalosti na 34% bilo klinički značajno.

Obavezan podatak:

Varijabla primarnog ishoda = prisutnost ili odsutnost sepse u novorođenčadi 14 dana nakon rođenja (liječenje primijenjeno do maksimalno 72 sata nakon rođenja). Ovo je kvalitativna varijabla predstavljena frekvencijama.
Značajna razlika = 16% ili 0,16 (tj. 50%-34%)
Razina značajnosti=5%
Snaga=80%
Test=dvostrano

Formula za izračunavanje veličine uzorka kada se uspoređuju dvije frekvencije je:

n= 2 *[(p 1 *(1-p 1)+(p 2 *(1-p 2)))]/ 2

gdje je n=veličina uzorka za svaku grupu ( ukupna veličina dvostruko više uzoraka)

p 1 = prva frekvencija - u ovom slučaju 0,50

p 2 = druga frekvencija - u ovom slučaju 0,34

p 1 -p 2 = klinički značajna razlika, u ovom slučaju 0,16

Tablica vrijednosti za A i B
Razina značajnosti



Vlast

Zamjenom vrijednosti u formulu dobivamo:

n= 2 *[(0,5*0,5+(0,34*0,66)]/ 2 =146

Tako dobivamo broj promatranja koji je potreban za uključivanje u svaku od skupina. Ukupno stanovništvo uzorak će biti dvostruko veći, tj. 292 djece

Opis rezultata izračuna veličine uzorka mogao bi izgledati ovako:

"Uzorak od 292 novorođenčadi (146 u liječenoj i placebo skupini) bio bi dovoljan za otkrivanje razlike u stopi sepse od 16% s 80% snage na razini pouzdanosti od 5%. 16% razlike jednako je razlici između 50% sepse stopa 14. dana u skupini koja je primala placebo i 34% u skupini koja je primala terapiju."

Usporedba dvaju prosjeka

Napomena: Izračuni u nastavku vrijede samo ako su dvije grupe iste veličine.

Scenarij: randomizirano kontrolirano ispitivanje koje uspoređuje kratkotrajno psihološko liječenje u odnosu na konvencionalno liječenje u borbi protiv suicidalnih tendencija kod pacijenata koji su hospitalizirani nakon planiranog pokušaja samoubojstva. Suicidalne tendencije mjere se pomoću Beckove ljestvice. Standardna devijacija za rezultate na ovoj ljestvici je 7,7 (podaci iz prethodnih studija), a razlike od 5 bodova na Beckovoj ljestvici smatraju se klinički značajnima. Očekuje se da će do trećina pacijenata ispasti iz terapijske skupine (Guthrie et al., 2001.)

Potrebne informacije:

Varijabla primarnog ishoda = Beckova ljestvica suicidalnosti. Kontinuirana varijabla opisana sredstvima
Standardna devijacija=7,7 bodova
Veličina klinički značajnog učinka = 5 bodova
Razina značajnosti=5%
Snaga=80%
Test=dvostrano

Formula za izračunavanje veličine uzorka kada se uspoređuju dvije srednje vrijednosti je sljedeća:

n= 2 *2*SD 2 /DIFF 2

gdje je n = veličina uzorka za svaku skupinu (ukupna veličina uzorka je dvostruko veća)

SD= standardna devijacija za varijablu primarnog ishoda, u ovom slučaju 7.7

DIFF=klinički važan učinak, u ovom slučaju 5,0

A - ovisi o razini značajnosti (vidi tablicu) - u ovom slučaju 1,96

B - ovisi o snazi (vidi tablicu) - u ovom slučaju 0,84

Tablica vrijednosti za A i B
Razina značajnosti



Vlast

Zamjena tražene vrijednosti u formulu dobivamo:

n= 2 *2*7,7 2 /5,0 2 =38

Tako dobivamo broj promatranja koji je potreban za uključivanje u svaku od skupina. Ukupna veličina uzorka bit će dvostruko veća, tj. 76 ljudi.

Adekvatan opis procjene veličine uzorka bio bi sljedeći:

"Da bi se otkrila razlika od 5 bodova na Beckovoj ljestvici sklonosti suicidu na razini značajnosti od 5% s 80% snage, uz pretpostavku standardne devijacije od 7,7 bodova, bilo bi potrebno 38 osoba u intervencijskoj i kontrolnoj skupini. Taj je broj povećan na 60 u grupi ( ukupno promatranja 120), kako bi se nadoknadio gubitak u promatranju, što je obično oko trećine ispitanika "

Primjeri neadekvatnih opisa potrebnih procijenjenih veličina uzorka

Primjer 1

"Prethodna studija na ovom području koristila je uzorak od 150 osoba i dobila je vrlo pouzdane rezultate (p=0,014), pa je sličan broj pacijenata uključen i u ovu studiju"

Prethodne studije možda su imale jednostavno "sreću" u smislu da su značajni rezultati koje su pronašli rezultat nasumične varijacije u srednjim vrijednostima uzorka. Potrebno je izračunati veličinu uzorka ovu studiju- uključujući pojedinosti kao što su snaga studije, razina značajnosti, glavna proučavana varijabla, veličina klinički značajnog učinka, standardna devijacija (za kvantitativne varijable) i veličina svake skupine ako postoji više grupa u studiji

Primjer 2

"Veličina uzorka nije izračunata jer nije bilo preliminarnih informacija za njegovu procjenu"

Literaturu treba pažljivo pregledati kako bi se pronašle informacije potrebne za izračun veličine uzorka. Ako ove informacije nisu dostupne, može se organizirati mala preliminarna studija za prikupljanje tih informacija.

Ako nema podataka o vrijednosti standardna devijacija, izračuni veličine uzorka mogu se dati u više opći pogled, na primjer, razlike koje su klinički učinkovite možda neće biti opisane u apsolutne vrijednosti, ali u jedinicama standardne devijacije.

Međutim, ako se prijedlog bespovratnih sredstava piše za financiranje pilot studije za prikupljanje informacija potrebnih za izračun veličine uzorka sljedeće velike studije, tada se izračun veličine uzorka ne provodi u takvom prijedlogu.

"Klinika prima 50 pacijenata s ovom bolešću tijekom godine. Oko 10% njih može odbiti sudjelovati u studiji. Stoga će u roku od dvije godine biti moguće regrutirati uzorak od 90 ljudi"

Iako većina studija mora uravnotežiti svoj dizajn i snagu, veličina uzorka ne bi se trebala određivati samo na temelju broja pacijenata dostupnih za studiju.

U situacijama u kojima je broj pacijenata ograničavajući čimbenik u veličini uzorka, izračune je ipak potrebno napraviti kako bi se utvrdila a) snaga studije s određenim brojem pacijenata u odnosu na klinički važne razlike, ili b) veličina učinka koji se mogu naći u studiji određene veličine (s obzirom na njegovu snagu).

U slučajevima kada je raspoloživi broj pacijenata premalen da bi se otkrile klinički značajne razlike, može se razmotriti produljenje trajanja studije ili provođenje kolaborativnog multicentričnog ispitivanja s više istraživača.

Književnost

Altman D.G. (1991) Praktična statistika za medicinska istraživanja. Chapman i Hall, London.
Armitage P, Berry G, Matthews JNS. (2002) Statističke metode u medicinskim istraživanjima, 4. izdanje. Blackwell, Oxford.
Bland JM i Altman DG. (1994). Jednostrani i dvostrani testovi značajnosti. British Medical Journal 309 248.
Bland M. (2000.) Uvod u medicinsku statistiku, 3. izd. Oxford University Press, Oxford.
Elashoff JD. (2000.) nQuery Advisor verzija 4.0 Korisnički vodič Los Angeles, CA.
Guthrie E, Kapur N, Mackway-Jones K, Chew-Graham C, Moorey J, Mendel E, Marino-Francis F, Sanderson S, Turpin C, Boddy G, Tomenson B. (2001.) Randomizirano kontrolirano ispitivanje kratke psihološke intervencije nakon namjerno samotrovanje. British Medical Journal 323, 135-138.
Lemeshow S, Hosmer DW, Klar J & Lwanga SK. (1996) Adekvatnost veličine uzorka u zdravstvenim studijama. John Wiley & Sons, Chichester.
Machin D, Campbell MJ, Fayers P, Pinol, A. (1998) Statističke tablice za dizajn kliničkih studija, Drugo izdanje Blackwell, Oxford.
Pocock SJ. (1983) Klinička ispitivanja: Praktični pristup. John Wiley i sinovi, Chichester.
Thomas M, McKinley RK, Freeman E, Foy C. (2001.) Prevalencija disfunkcionalnog disanja u bolesnika liječenih od astme u primarnoj zdravstvenoj zaštiti: pregled presjeka. British Medical Journal 322, 1098-1100.
Whitehead, J. (1997.) Dizajn i analiza sekvencijalnih kliničkih ispitivanja, revidirano 2. izd. Chichester, Wiley.

KALKULATORI

Populacija

Ukupan broj objekata promatranja (ljudi, kućanstva, poduzeća, naselja itd.), koji imaju određeni skup obilježja (spol, dob, prihod, brojnost, promet itd.), prostorno i vremenski ograničen. Primjeri populacija: - Svi stanovnici Moskve (10,6 milijuna ljudi prema popisu iz 2002.) - Muški Moskovljani (4,9 milijuna ljudi prema popisu iz 2002.) - Pravne osobe Rusija (2,2 milijuna početkom 2005.) - Maloprodajna mjesta za prodaju prehrambenih proizvoda (20 tisuća početkom 2008.), itd.

Uzorak (uzorak populacije)

Dio objekata iz populacije odabran za proučavanje kako bi se izveo zaključak o cjelokupnoj populaciji. Da bi se zaključak dobiven proučavanjem uzorka mogao proširiti na cjelokupnu populaciju, uzorak mora imati svojstvo reprezentativnosti.

Reprezentativnost uzorka

Svojstvo uzorka da ispravno odražava opću populaciju. Isti uzorak može ali ne mora biti reprezentativan za različite populacije. Primjer: - Uzorak koji se u potpunosti sastoji od Moskovljana koji posjeduju automobil ne predstavlja cjelokupno stanovništvo Moskve. - Uzorak ruskih poduzeća do 100 ljudi ne predstavlja sva poduzeća u Rusiji - Uzorak Moskovljana koji kupuju na tržištu ne predstavlja kupovno ponašanje svih Moskovljana. U isto vrijeme, ovi uzorci (podložni drugim uvjetima) može savršeno predstavljati Moskovljane - vlasnike automobila, mala i srednja ruska poduzeća i kupce koji kupuju na tržnicama. Važno je razumjeti da su reprezentativnost uzorka i pogreška uzorkovanja različite pojave. Reprezentativnost, za razliku od pogreške, ni na koji način ne ovisi o veličini uzorka Primjer: Koliko god povećavali broj anketiranih Moskovljana-vlasnika automobila, ovim uzorkom nećemo moći reprezentirati sve Moskovljane.

Pogreška uzorkovanja (interval pouzdanosti)

Odbijanje rezultata dobivenih uporabom selektivno promatranje iz pravih podataka opće populacije.Postoje dvije vrste greške uzorka – statistička i sustavna. Statistička pogreška ovisi o veličini uzorka. Što je uzorak veći, to je manji. Primjer: Za jednostavan nasumični uzorak s veličinom od 400 jedinica, maksimalna statistička pogreška (uz vjerojatnost pouzdanosti od 95%) je 5%, za uzorak od 600 jedinica - 4%, za uzorak od 1100 jedinica - 3% od razni faktori koji imaju trajan utjecaj na studiju i skreću rezultate studije u određenom smjeru. aktivna slikaživot. To se događa zbog činjenice da je mnogo teže pronaći takve ljude na bilo kojem određenom mjestu (na primjer, kod kuće).80%) U nekim slučajevima, kada su poznate prave distribucije, sustavna pogreška može se izravnati uvođenjem kvota ili ponovnim ponderiranjem podataka, ali u većini stvarnih studija čak i procjena može biti prilično problematična.

Vrste uzoraka

Uzorci su podijeljeni u dvije vrste:
- vjerojatnosni
- nevjerojatnost

1. Uzorci vjerojatnosti
1.1 Nasumično uzorkovanje (jednostavan slučajni odabir)
Takav uzorak pretpostavlja homogenost opće populacije, istu vjerojatnost dostupnosti svih elemenata, prisutnost kompletan popis svi elementi. Pri odabiru elemenata u pravilu se koristi tablica slučajnih brojeva.
1.2 Mehaničko (sustavno) uzorkovanje
Neka vrsta slučajnog uzorka, razvrstanog po nekom atributu (abecedni red, telefonski broj, datum rođenja itd.). Prvi element odabire se nasumično, zatim se odabire svaki 'k'ti element u koracima od 'n'. Veličina opće populacije, dok je - N=n*k
1.3 Stratificirani (zonski)
Koristi se u slučaju heterogenosti opće populacije. Populacija podijeljeni u skupine (stratume). U svakom stratumu odabir se provodi nasumično ili mehanički.
1.4 Serijsko (ugniježđeno ili grupirano) uzorkovanje
Na serijsko uzorkovanje jedinice selekcije nisu sami objekti, već skupine (klasteri ili gnijezda). Grupe se biraju nasumično. Objekti unutar grupa pregledani su posvuda.

2. Nevjerojatni uzorci
Odabir u takav uzorak ne provodi se prema načelima slučajnosti, već prema subjektivnim kriterijima - dostupnosti, tipičnosti, jednake zastupljenosti itd.
2.1. Kvotno uzorkovanje
U početku se dodjeljuje određeni broj skupina predmeta (na primjer, muškarci u dobi od 20-30 godina, 31-45 godina i 46-60 godina; osobe s prihodom do 30 tisuća rubalja, s prihodom od 30 do 60 tisuća rubalja i s prihodom većim od 60 tisuća rubalja ) Za svaku skupinu naveden je broj objekata koji će se istražiti. Broj objekata koji bi trebao spadati u svaku od skupina određuje se, najčešće, ili proporcionalno prethodno poznatom udjelu skupine u općoj populaciji, ili isti za svaku skupinu. Unutar grupa predmeti se odabiru nasumično. Kvotni uzorci često se koriste u marketinškim istraživanjima.
2.2. Metoda snježne grude
Uzorak je konstruiran na sljedeći način. Svaki ispitanik, počevši od prvog, zamoljen je da kontaktira svoje prijatelje, kolege, poznanike koji bi odgovarali uvjetima odabira i mogli sudjelovati u istraživanju. Dakle, s izuzetkom prvog koraka, uzorak se formira uz sudjelovanje samih objekata proučavanja. Metoda se često koristi kada je potrebno pronaći i intervjuirati teško dostupne skupine ispitanika (primjerice, ispitanici s visokim primanjima, ispitanici koji pripadaju istoj profesionalnoj skupini, ispitanici koji imaju neke slične hobije/strasti itd.). )
2.3 Spontano uzorkovanje
Anketiraju se najpristupačniji ispitanici. Tipični primjeri spontani uzorci - ankete u novinama/časopisima, upitnici koji se daju ispitanicima na samostalno popunjavanje, većina internetskih anketa. Veličina i sastav spontanih uzoraka nije unaprijed poznat, a određen je samo jednim parametrom - aktivnošću ispitanika.
2.4 Uzorak tipičnih slučajeva
Odabiru se jedinice opće populacije koje imaju prosječnu (tipičnu) vrijednost svojstva. To otvara problem odabira značajke i određivanja njezine tipične vrijednosti.

Kalkulator pogreške i veličine uzorka

(za jednostavan slučajni uzorak)

Objašnjenja za polja:

Vjerojatnost povjerenja
Vjerojatnost da interval pouzdanosti pokriva nepoznanicu prava vrijednost parametar procijenjen iz podataka uzorka. U istraživačkoj praksi najčešće se koristi razina pouzdanosti od 95%.

Pogreška uzorkovanja (interval pouzdanosti)
Interval izračunat iz podataka uzorka koji, uz zadanu vjerojatnost (pouzdanost), pokriva nepoznatu pravu vrijednost procijenjenog parametra distribucije.

Dio značajki

Očekivani udio značajke za koju se izračunava pogreška. Ako nema podataka o udjelu karakteristike, potrebno je koristiti vrijednost jednaku 50, pri kojoj se postiže najveća pogreška.

Jedna od glavnih komponenti dobro osmišljene studije je definicija uzorka i onoga što je reprezentativni uzorak. To je kao na primjeru torte. Uostalom, nije potrebno pojesti cijeli desert da biste razumjeli njegov okus? Dovoljan je mali dio.

Dakle, torta je populacija (odnosno svi ispitanici koji ispunjavaju uvjete za anketu). Može se izraziti teritorijalno, na primjer, samo stanovnici moskovske regije. Spol – samo žene. Ili imaju dobna ograničenja - Rusi su stariji od 65 godina.

Teško je izračunati broj stanovnika: potrebni su podaci iz popisa stanovništva ili preliminarne ankete. Stoga se obično “procjenjuje” opća populacija, a iz dobivenog broja izračunava okvir za uzorkovanje ili uzorkovanje.

Što je reprezentativni uzorak?

Uzorak je dobro definiran broj ispitanika. Njegova struktura treba što više odgovarati strukturi opće populacije u pogledu glavnih karakteristika selekcije.

Na primjer, ako su potencijalni ispitanici cijela populacija Rusije, gdje su 54% žene i 46% muškarci, tada bi uzorak trebao sadržavati potpuno isto postotak. Ako se parametri podudaraju, tada se uzorak može nazvati reprezentativnim. To znači da su netočnosti i pogreške u studiji svedene na minimum.

Veličina uzorka određena je uzimajući u obzir zahtjeve točnosti i ekonomičnosti. Ovi su zahtjevi obrnuto proporcionalni jedni drugima: što je veći uzorak, to točnije rezultat. Štoviše, što je veća točnost, to su odgovarajući troškovi potrebni za studiju. I obrnuto, što je uzorak manji, to manje košta, to su manje točna i nasumičnija svojstva opće populacije reproducirana.

Stoga, kako bi izračunali količinu izbora, sociolozi su izmislili formulu i stvorili poseban kalkulator:

Vjerojatnost povjerenja i pogreška povjerenja

Što znače uvjeti " razina povjerenja" i " pogreška povjerenja"? Razina pouzdanosti mjera je točnosti mjerenja. A pogreška povjerenja je moguća greška rezultate istraživanja. Na primjer, s općom populacijom od više od 500,00 ljudi (na primjer, koji žive u Novokuznjecku), uzorak će biti 384 osobe s razina povjerenja 95% i pogreške 5% ILI (sa interval pouzdanosti 95±5%).

Što iz ovoga slijedi? Prilikom provođenja 100 studija s takvim uzorkom (384 osobe), u 95 posto slučajeva dobiveni odgovori, prema zakonima statistike, bit će unutar ± 5% od izvornika. I dobit ćemo reprezentativni uzorak uz minimalnu vjerojatnost statističke pogreške.

Nakon što se izvrši izračun veličine uzorka, možete vidjeti ima li dovoljno ispitanika u demo verziji panela upitnika. Možete saznati više o tome kako provesti panel anketu.

Kada postavite pitanje "Koliko mi je ispitanika potrebno za anketu?", zapravo pitate "Koliki mora biti velik moj uzorak da bih točno procijenio svoju populaciju?" S obzirom na složenost ovih koncepata, rastavili smo proces u 5 koraka, što vam olakšava izračun idealne veličine uzorka i osigurava točnost rezultata vaše ankete.

5 koraka kako biste bili sigurni da vaš uzorak točno procjenjuje populaciju:

Korak 1

Koja je vaša opća populacija?

Pod pojmom "opća populacija" podrazumijevamo cijelu skupinu ljudi čije mišljenje ćete pitati (uzorak će se sastojati od pripadnika ove populacije koji će i sudjelovati u anketi).

Na primjer, ako želite razumjeti kako pronaći tržište za pastu za zube u Francuskoj, vaša populacija će biti ljudi Francuske. A ako pokušavate odrediti koliko bi dana godišnjeg odmora željeli imati ljudi koji rade za tvrtku pasta za zube, onda su vaša populacija zaposlenici te tvrtke.

Bilo da se radi o državi ili tvrtki, utvrđivanje populacije važan je prvi korak. Nakon što ste se odlučili za populaciju, postavite (približno) njenu veličinu. Na primjer, Francuska ima oko 65 milijuna ljudi, ali tvrtka koja proizvodi pastu za zube vjerojatno ima puno manje zaposlenika.

Jeste li dobili pravi broj? Dobro, onda idemo dalje...

Korak 2

Koja je potrebna točnost?

Ovaj korak je svojevrsna procjena koliko ste spremni preuzeti rizik u pogledu mogućnosti netočnih anketnih odgovora zbog činjenice da ne anketirate cjelokupnu populaciju. Stoga morate odgovoriti na dva pitanja:

Koliko morate biti sigurni da odgovori koje dobijete odražavaju mišljenja opće populacije?
Ovo je vaša granica pogreške. Dakle, recimo da 90% uzorka voli žvakaće gume s okusom grožđa. Margina pogreške od 5% dodaje 5% sa svake strane tog broja, što znači da zapravo 85-95% uzorka voli žvakaće gume s okusom grožđa. 5% je najčešće korištena margina pogreške, ali možete je postaviti između 1% i 10%, ovisno o anketi. Ne preporučuje se povećanje ove brojke iznad 10%.
Koliko morate biti sigurni da uzorak točno predstavlja populaciju?

Ovo je vaša razina povjerenja. Razina pouzdanosti je vjerojatnost da je uzorak značajan za dobivene rezultate. Izračun se obično vrši na sljedeći način. Ako ste nasumično odabrali još 30 uzoraka iz ove populacije, koliko često bi se vaš rezultat za jedan uzorak značajno razlikovao od rezultata za ostalih 30 uzoraka? Razina pouzdanosti od 95% znači da bi se rezultati podudarali u 95% slučajeva. 95% je najčešće korištena vrijednost, ali možete je postaviti na 90% ili 99%, ovisno o anketi. Ne preporučuje se snižavanje vrijednosti razine pouzdanosti ispod 90%.

3. korak

Koja veličina uzorka mi je potrebna?

U donjoj tablici odaberite približnu veličinu ciljane populacije i marginu pogreške za određivanje potrebnog broja obavljenih intervjua.

Sada kada imate vrijednosti koraka 1 i koraka 2, upotrijebite praktičnu tablicu u nastavku da odredite veličinu potrebnog uzorka...

Populacija	Granica pogreške			Razina povjerenja
Populacija	10%	5%	1%	90%	95%	99%
100	50	80	99	74	80	88
500	81	218	476	176	218	286
1000	88	278	906	215	278	400
10 000	96	370	4900	264	370	623
100 000	96	383	8763	270	383	660
1 000 000+	97	384	9513	271	384	664

Bilješka. Podaci su navedeni samo kao smjernice. Također, za populacije veće od milijun, brojke se mogu zaokružiti na najbližu stotinu.

Korak 4

Koliko će ljudi reagirati?

Nažalost, neće svi kojima pošaljete anketu dobiti odgovor.

Postotak ljudi koji ispune anketni obrazac koji dobiju naziva se "stopa odgovora". Određivanje postotka ispitanika u vašoj anketi pomoći će vam da odredite ukupni broj primjerci ankete koji se moraju poslati kako bi se dobio potreban broj odgovora.

Postotak odgovora izravno ovisi o nizu čimbenika, poput odnosa s ciljanu publiku, duljina i složenost ankete, ponuđeni poticaji i tema ankete. Za online ankete u kojima prethodno nije uspostavljen odnos s primateljima, postotak stope odgovora od 20-30% smatraju se vrlo visokima. Konzervativnija i vjerojatnija vrijednost je 10-14%, ako prethodno niste proveli anketu u ovoj populaciji.

Korak 5

Dakle, koliko ljudi trebate poslati anketu?

Ovo je lak korak!

Jednostavno podijelite broj koji ste dobili u koraku 3 s brojem koji ste dobili u koraku 4. Ovo je vaš čarobni broj.

Na primjer, ako želite da anketu ispuni 100 žena koje koriste šampon i mislite da će anketu ispuniti 10% žena kojima pošaljete anketu, trebate poslati anketu na 1000 žena (100/10%)!