Data innhentet som et resultat av analyse av utvalgspopulasjonen. Konseptet med prøveobservasjon, dets oppgaver

typer prøvetaking:

Riktig tilfeldig;

Mekanisk;

Typisk;

Seriell;

Kombinert.

Riktig tilfeldig prøvetaking består i å velge enheter fra den generelle befolkningen tilfeldig eller tilfeldig uten noen elementer av systematikk. Men før du gjør et tilfeldig utvalg, er det nødvendig å sørge for at alle enheter i den generelle befolkningen, uten unntak, har absolutt like sjanser for å bli inkludert i utvalget, det er ingen hull i listene eller listene, og ignorerer individuelle enheter, osv. Det bør også etableres klare grenser for befolkningen slik at det ikke er tvil om inkludering eller ikke-inkludering av enkeltenheter. Så for eksempel ved kartlegging av studenter er det nødvendig å angi om personer i akademisk permisjon, studenter ikke-statlige universiteter, militærskoler, etc.; Ved kartlegging av kommersielle virksomheter er det viktig å ta stilling til om man skal inkludere befolkning handlepaviljonger, kommersielle telt og andre lignende gjenstander. Riktig tilfeldig valg kan enten gjentas eller ikke-repeterende. For å lede demon omvalg Under trekningsprosessen returneres ikke de trukket lodd til den opprinnelige puljen og deltar ikke i videre utvelgelse. Ved bruk av tabeller tilfeldige tall repetisjonsfritt valg oppnås ved å hoppe over tall hvis de gjentas i den eller de valgte kolonnene.

Mekanisk prøvetaking brukes i tilfeller hvor befolkningen er ordnet på en eller annen måte, dvs. det er en viss sekvens i arrangementet av enheter (ansatte antall ansatte, velgerlister, telefonnumre respondenter, hus- og leilighetsnummer osv.).

Under mekanisk seleksjon kan den generelle populasjonen rangeres eller sorteres etter verdien av egenskapen som studeres eller korreleres med den, noe som vil øke representativiteten til utvalget. Men i dette tilfellet øker faren systematisk feil assosiert med en underestimering av verdiene til karakteristikken som studeres (hvis den første verdien er registrert fra hvert intervall) eller med en overestimering (hvis den første verdien er registrert fra hvert intervall siste verdi). Derfor er det tilrådelig å starte utvalget fra midten av det første intervallet

Typisk utvalg. Denne seleksjonsmetoden brukes i tilfeller der alle enheter i den generelle befolkningen kan deles inn i flere typiske grupper. Ved kartlegging av en befolkning kan slike grupper for eksempel være områder, sosiale, alder eller utdanningsgrupper, ved kartlegging av virksomheter - industri eller delbransje, eierform mv. Typisk utvalg innebærer å velge enheter fra hver typisk gruppe på en rent tilfeldig eller mekanisk måte. Siden utvalgspopulasjonen nødvendigvis inkluderer representanter for alle grupper i en eller annen andel, gjør skriving av den generelle populasjonen det mulig å eliminere påvirkningen intergruppe varians på gjennomsnittlig feil prøve, som i dette tilfellet kun bestemmes av variasjon innen gruppe.

Utvalget av enheter i en typisk prøve kan organiseres enten i forhold til volumet av typiske grupper, eller i forhold til differensieringen av karakteristikken mellom grupper.

Serievalg. Denne utvelgelsesmetoden er praktisk i tilfeller der befolkningsenheter er kombinert i små grupper eller serier. Slike serier kan betraktes som pakker med en viss mengde ferdige produkter, partier med varer, studentgrupper, brigader og andre foreninger. Essens seriell prøvetaking består i et rent tilfeldig eller mekanisk utvalg av serier, innenfor hvilke det foretas en kontinuerlig undersøkelse av enheter.

En av hovedkomponentene i en godt designet studie er å definere utvalget og hva et representativt utvalg er. Det er som kakeeksemplet. Tross alt, trenger du ikke spise hele desserten for å forstå smaken? En liten del er nok.

Så, kaken er befolkning (det vil si alle respondenter som er kvalifisert for undersøkelsen). Det kan uttrykkes geografisk, for eksempel bare innbyggere i Moskva-regionen. Kjønn - kun kvinner. Eller har aldersbegrensninger - russere over 65 år.

Å beregne folketallet er vanskelig: du må ha data fra folketellingen eller foreløpige vurderingsundersøkelser. Derfor er vanligvis den generelle befolkningen "estimert", og fra det resulterende antallet beregner de utvalgspopulasjon eller prøve.

Hva er et representativt utvalg?

Prøve– Dette er et klart definert antall respondenter. Dens struktur bør sammenfalle så mye som mulig med strukturen til den generelle befolkningen når det gjelder hovedkarakteristikkene ved utvalget.

For eksempel, hvis potensielle respondenter er hele befolkningen i Russland, hvor 54 % er kvinner og 46 % er menn, bør utvalget inneholde nøyaktig det samme prosentdel. Hvis parametrene er sammenfallende, kan prøven kalles representativ. Dette gjør at unøyaktigheter og feil i studien reduseres til et minimum.

Prøvestørrelsen bestemmes under hensyntagen til kravene til nøyaktighet og økonomi. Disse kravene er omvendt proporsjonale med hverandre: jo større utvalgsstørrelsen er mer presist resultatet. Dessuten, jo høyere nøyaktighet, desto større kostnader kreves det for å gjennomføre studien. Og omvendt, jo mindre utvalget er, jo mindre koster det, og jo mindre nøyaktig og mer tilfeldig blir egenskapene til den generelle befolkningen reprodusert.

Derfor, for å beregne volumet av valg, oppfant sosiologer en formel og opprettet spesiell kalkulator:

Tillitssannsynlighet Og tillitsfeil

Hva betyr vilkårene " tillitssannsynlighet"Og" tillitsfeil"? Konfidenssannsynlighet er en indikator på målenøyaktighet. Og tillitsfeilen er mulig feil forskningsresultater. For eksempel, med en befolkning på mer enn 500 00 personer (la oss si bor i Novokuznetsk), vil utvalget være 384 personer med tillitssannsynlighet 95 % og feilmargin 5 % ELLER (med et konfidensintervall på 95±5 %).

Hva følger av dette? Når man utfører 100 studier med et slikt utvalg (384 personer), vil svarene som er oppnådd, i henhold til statistikkens lover, i 95 prosent av tilfellene være innenfor ±5 % av det opprinnelige. Og vi får representativt utvalg med minimal sannsynlighet for statistisk feil.

Etter at prøvestørrelsen er beregnet, kan du se om det er tilstrekkelig antall respondenter i demoversjonen av Spørreskjemapanelet. Du kan finne ut mer om hvordan du gjennomfører en panelundersøkelse.

Forskning begynner vanligvis med en antagelse som krever bekreftelse ved hjelp av fakta. Denne antakelsen – en hypotese – er formulert i forhold til sammenhengen mellom fenomener eller egenskaper i et bestemt sett med objekter.

For å teste slike antakelser mot fakta, er det nødvendig å måle de tilsvarende egenskapene til deres bærere. Men det er umulig å måle angst hos alle kvinner og menn, akkurat som det er umulig å måle aggressivitet hos alle ungdom. Derfor, når du utfører forskning, er det begrenset til bare en relativt liten gruppe representanter for de relevante populasjonene av mennesker.

Befolkning— dette er hele settet av objekter som en forskningshypotese formuleres i forhold til.

For eksempel alle menn; eller alle kvinner; eller alle innbyggerne i en by. De generelle populasjonene som forskeren skal trekke konklusjoner til basert på resultatene av studien, kan være mer beskjedne i antall, for eksempel alle førsteklassinger på en gitt skole.

Dermed er den generelle befolkningen, selv om den ikke er uendelig i antall, men som regel utilgjengelig for kontinuerlig forskning, et sett med potensielle fag.

Utvalg eller utvalgspopulasjon er en gruppe objekter begrenset i antall (i psykologi - fag, respondenter), spesielt utvalgt fra den generelle befolkningen for å studere egenskapene. Følgelig kalles det å studere egenskapene til en generell populasjon ved å bruke en prøve prøvetakingsstudie. Nesten alt psykologisk forskning er samplet, og deres konklusjoner strekker seg til generelle populasjoner.

Etter at hypotesen er formulert og de tilsvarende populasjonene er identifisert, står forskeren derfor overfor problemet med å organisere utvalget. Utvalget bør være slik at generaliseringen av konklusjoner er berettiget utvalgsundersøkelse- generalisering, deres utvidelse til den generelle befolkningen. Hovedkriterier for gyldigheten av forskningskonklusjoner— disse er representativiteten til utvalget og den statistiske påliteligheten til de (empiriske) resultatene.

Representativiteten til utvalget- med andre ord, dens representativitet er utvalgets evne til å representere fenomenene som studeres ganske fullt ut - fra synspunktet om deres variasjon i den generelle befolkningen.

Sikkert, full oversikt Bare den generelle befolkningen kan gi informasjon om fenomenet som studeres, i hele dets rekkevidde og nyanser av variabilitet. Derfor er representativiteten alltid begrenset i den grad utvalget er begrenset. Og det er utvalgets representativitet som er hovedkriteriet for å bestemme grensene for generalisering av forskningsfunn. Det finnes imidlertid teknikker som gjør det mulig å oppnå en prøverepresentativitet som er tilstrekkelig for forskeren (disse teknikkene studeres i kurset "Eksperimentell psykologi").

Den første og hovedteknikken er et enkelt tilfeldig (randomisert) utvalg. Det innebærer å sikre slike forhold at hvert medlem av befolkningen har like muligheter som andre til å bli inkludert i utvalget. Tilfeldig utvalg sikrer muligheten for å komme mest inn i utvalget ulike representanter generell befolkning. I dette tilfellet tas det spesielle tiltak for å forhindre fremveksten av ethvert mønster under valg. Og dette lar oss håpe at eiendommen som studeres til slutt, i prøven, vil være representert, om ikke i alt, så i sitt maksimalt mulige mangfold.

Den andre måten å sikre representativitet på er stratifisert tilfeldig utvalg, eller seleksjon basert på egenskapene til den generelle befolkningen. Det innebærer en foreløpig fastsettelse av de egenskapene som kan påvirke variasjonen til eiendommen som studeres (dette kan være kjønn, inntektsnivå eller utdanning osv.). Deretter bestemmes prosentandelen av antall grupper (strata) som avviker i disse kvalitetene i den generelle befolkningen, og det sikres en identisk prosentandel av de tilsvarende gruppene i utvalget. Deretter velges emner inn i hver undergruppe av utvalget i henhold til prinsippet om enkelt tilfeldig utvalg.

Statistisk signifikans, eller statistisk signifikans, er resultatene av studien bestemt ved hjelp av statistiske slutningsmetoder.

Er vi sikret mot å gjøre feil når vi tar beslutninger, når vi trekker visse konklusjoner fra forskningsresultatene? Selvfølgelig ikke. Våre beslutninger er tross alt basert på forskningsresultater utvalgspopulasjon, samt til nivået på vårt psykologisk kunnskap. Vi er ikke helt immune mot feil. I statistikk anses slike feil som akseptable hvis de ikke forekommer oftere enn i ett tilfelle av 1000 (sannsynlighet for feil α = 0,001 eller tilhørende konfidenssannsynlighet for en korrekt konklusjon p = 0,999); i ett tilfelle av 100 (sannsynligheten for feil α = 0,01 eller den tilhørende konfidenssannsynligheten for en korrekt konklusjon p = 0,99) eller i fem tilfeller av 100 (sannsynligheten for feil α = 0,05 eller den tilhørende konfidenssannsynligheten for en korrekt konklusjonsutgang p=0,95). Nøyaktig på to siste nivåer og det er vanlig å ta avgjørelser innen psykologi.

Noen ganger når man snakker om statistisk signifikans, bruk begrepet "betydningsnivå" (betegnet som α). De numeriske verdiene til p og α utfyller hverandre opp til 1000 - fullt sett hendelser: enten gjorde vi den riktige konklusjonen, eller så tok vi feil. Disse nivåene er ikke beregnet, de er gitt. Nivået av betydning kan forstås som en slags "rød" linje, hvis skjæringspunkt vil tillate oss å snakke om denne hendelsen som ikke-tilfeldig. I hver god vitenskapelig rapport eller publikasjon bør konklusjonene som trekkes ledsages av en indikasjon på p- eller α-verdiene som konklusjonene ble trukket ved.

Statistiske slutningsmetoder dekkes i detalj i kurset " Matematisk statistikk" La oss nå bare merke oss at de presenterer visse krav til nummeret, eller prøvestørrelse.

Dessverre er det ingen strenge retningslinjer for forhåndsbestemmelse av den nødvendige prøvestørrelsen. Dessuten mottar forskeren vanligvis svaret på spørsmålet om nødvendig og tilstrekkelig antall for sent - bare etter å ha analysert dataene til et allerede undersøkt utvalg. Imidlertid kan de mest generelle anbefalingene formuleres:

1. Den største prøvestørrelsen kreves ved utvikling av en diagnostisk teknikk - fra 200 til 1000-2500 personer.

2. Hvis det er nødvendig å sammenligne 2 prøver, de totalt antall må være minst 50 personer; antall prøver som sammenlignes bør være omtrent det samme.

3. Hvis forholdet mellom noen egenskaper studeres, bør prøvestørrelsen være minst 30-35 personer.

4. Jo flere variasjon eiendom som studeres, desto større bør prøvestørrelsen være. Derfor kan variabilitet reduseres ved å øke utvalgets homogenitet, for eksempel etter kjønn, alder osv. Dette reduserer selvsagt muligheten til å generalisere konklusjoner.

Avhengige og uavhengige utvalg. En vanlig forskningssituasjon er når en egenskap av interesse for en forsker studeres på to eller flere prøver for videre sammenligning. Disse prøvene kan være i forskjellige proporsjoner, avhengig av prosedyren for deres organisasjon. Uavhengige prøver kjennetegnes ved at sannsynligheten for seleksjon av ethvert emne i ett utvalg ikke avhenger av utvalget av noen av emnene i et annet utvalg. Imot, avhengige prøver kjennetegnes ved at hvert emne fra ett utvalg blir matchet etter et bestemt kriterium av et emne fra et annet utvalg.

I generell sak avhengige utvalg involverer parvis utvalg av emner til sammenlignede prøver, og uavhengige prøver innebærer uavhengig utvalg av emner.

Det skal bemerkes at tilfeller av "delvis avhengige" (eller "delvis uavhengige") utvalg er uakseptable: dette krenker uforutsigbart deres representativitet.

Avslutningsvis bemerker vi at to paradigmer innen psykologisk forskning kan skilles.

Den såkalte R-metodikk innebærer studiet av variabiliteten til en viss egenskap (psykologisk) under påvirkning av en viss påvirkning, faktor eller annen egenskap. Et utvalg er et sett med emner.

En annen tilnærming Q-metodikk, innebærer studiet av variabiliteten til et subjekt (individ) under påvirkning av ulike stimuli (tilstander, situasjoner, etc.). Det tilsvarer situasjonen når prøven er et sett med stimuli.

Intervallestimering av hendelsessannsynlighet. Formler for beregning av prøvestørrelsen ved hjelp av en rent tilfeldig prøvetakingsmetode.

For å bestemme sannsynligheten for hendelser som interesserer oss, bruker vi en prøvetakingsmetode: vi gjennomfører n uavhengige eksperimenter, i hver av hvilke hendelse A kan forekomme (eller ikke forekomme) (sannsynlighet r forekomst av hendelse A i hvert eksperiment er konstant). Deretter den relative frekvensen p* av forekomster av hendelser EN i en serie av n prøver aksepteres som punktestimat for sannsynlighet s forekomst av en hendelse EN i en egen rettssak. I dette tilfellet kalles verdien p* prøveandel hendelsene EN, og p - generelle aksjer .

På grunn av følgen fra sentralen grensesetning(Moivre-Laplace teorem) den relative frekvensen til en hendelse med stor prøvestørrelse kan betraktes som normalfordelt med parametere M(p*)=p og

Derfor, for n>30 konfidensintervall for den generelle andelen kan konstrueres ved å bruke formlene:

hvor u cr er funnet fra tabellene til Laplace-funksjonen, tatt i betraktning den gitte konfidenssannsynligheten γ: 2Ф(u cr)=γ.

Med en liten prøvestørrelse n≤30, bestemmes den maksimale feilen ε fra elevfordelingstabellen:
hvor tcr =t(k; α) og antall frihetsgrader k=n-1 sannsynlighet α=1-γ (tosidig areal).

Formlene er gyldige hvis utvalget ble utført på en tilfeldig, gjentatt måte (den generelle populasjonen er uendelig), ellers er det nødvendig å foreta en justering for ikke-gjentakelse av utvalget (tabell).

Gjennomsnittlig prøvetakingsfeil for den generelle andelen

Befolkning	Uendelig	Endelig volum N
Type utvalg	Gjentatt	Gjentakelsesløs
Gjennomsnittlig prøvetakingsfeil

Formler for å beregne prøvestørrelsen ved hjelp av en rent tilfeldig prøvetakingsmetode

Valgmetode	Formler for å bestemme prøvestørrelse
	for gjennomsnittet	for deling
Gjentatt
Gjentakelsesløs

Generelle aksjeproblemer

Til spørsmålet "Dekker konfidensintervallet den gitte p0-verdien?" - du kan svare ved å krysse av statistisk hypotese Ho:p=po. Det antas at forsøkene utføres i henhold til Bernoulli-testskjemaet (uavhengig, sannsynlighet s forekomst av en hendelse EN er konstant). Etter volumprøve n bestemme den relative frekvensen p * for forekomst av hendelse A: hvor m- antall forekomster av hendelsen EN i en serie av n tester. For å teste hypotesen H 0 brukes statistikk som med tilstrekkelig stor utvalgsstørrelse har en standard normalfordeling(Tabell 1).
Tabell 1 - Hypoteser om den generelle andelen

Hypotese	H 0:p=p 0	H 0:p 1 = p 2
Forutsetninger	Bernoulli testkrets	Bernoulli testkrets
Eksempel på estimater
Statistikk K
Statistikkfordeling K		Standard normal N(0,1)

Eksempel nr. 1. Ved å bruke tilfeldig gjentatt prøvetaking gjennomførte firmaets ledelse en utvalgsundersøkelse av 900 av de ansatte. Blant respondentene var det 270 kvinner. Konstruer et konfidensintervall med en sannsynlighet på 0,95 som dekker den sanne andelen kvinner i hele teamet i selskapet.
Løsning. I henhold til betingelsen er utvalgets andel kvinner (relativ frekvens av kvinner blant alle respondentene). Siden utvalget gjentas og prøvestørrelsen er stor (n=900), bestemmes den maksimale prøvetakingsfeilen av formelen

Verdien av u cr er funnet fra tabellen til Laplace-funksjonen fra relasjonen 2Ф(u cr) = γ, dvs. Laplace-funksjonen (vedlegg 1) tar verdien 0,475 ved u cr =1,96. Derfor den marginale feilen og ønsket konfidensintervall
(p – ε, p + ε) = (0,3 – 0,18; 0,3 + 0,18) = (0,12; 0,48)
Så, med en sannsynlighet på 0,95, kan vi garantere at andelen kvinner i hele teamet i selskapet er i området fra 0,12 til 0,48.

Eksempel nr. 2. Eieren av parkeringsplassen anser dagen som "heldig" hvis parkeringsplassen er mer enn 80 % full. I løpet av året ble det gjennomført 40 inspeksjoner av parkeringsplassen, hvorav 24 var "vellykkede". Med en sannsynlighet på 0,98, finn et konfidensintervall for å estimere den sanne andelen "heldige" dager i løpet av året.
Løsning. Prøveandelen av "heldige" dager er
Ved å bruke tabellen til Laplace-funksjonen finner vi verdien av u cr for en gitt
tillitssannsynlighet
Ф(2,23) = 0,49, ucr = 2,33.
Med tanke på at utvalget ikke er gjentakende (dvs. to kontroller ble ikke utført på samme dag), finner vi marginal feil:
hvor n = 40, N = 365 (dager). Herfra
og konfidensintervall for den generelle andelen: (p – ε, p + ε) = (0,6 – 0,17; 0,6 + 0,17) = (0,43; 0,77)
Med en sannsynlighet på 0,98 kan vi forvente at andelen «heldige» dager i løpet av året ligger i området fra 0,43 til 0,77.

Eksempel nr. 3. Etter å ha sjekket 2500 produkter i partiet, fant de at 400 produkter var av høyeste karakter, men n–m var det ikke. Hvor mange produkter må kontrolleres for å fastslå med 95 % sikkerhet andelen av høyeste karakter med en nøyaktighet på 0,01?
Vi ser etter en løsning ved å bruke formelen for å bestemme prøvestørrelsen for omvalg.

Ф(t) = γ/2 = 0,95/2 = 0,475 og denne verdien i henhold til Laplace-tabellen tilsvarer t=1,96
Prøveandel w = 0,16; prøvetakingsfeil ε = 0,01

Eksempel nr. 4. Et parti med produkter aksepteres dersom sannsynligheten for at produktet vil overholde standarden er minst 0,97. Blant de tilfeldig utvalgte 200 produktene i den testede batchen, ble 193 funnet å oppfylle standarden. Er det mulig å akseptere partiet på signifikansnivået α=0,02?
Løsning. La oss formulere de viktigste og alternative hypotesene.
H 0:p=p 0 =0,97 - ukjent generell andel s lik angi verdi p 0 = 0,97. I forhold til betingelsen - sannsynligheten for at en del fra det inspiserte partiet vil overholde standarden er lik 0,97; de. Produktpartiet kan godtas.
H 1:p<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Observert statistisk verdi K(tabell) beregn for gitte verdier p 0 =0,97, n=200, m=193

Vi finner den kritiske verdien fra tabellen over Laplace-funksjonen fra likheten

I henhold til betingelsen er α = 0,02, derav F(Kcr) = 0,48 og Kcr = 2,05. Den kritiske regionen er venstresidig, dvs. er intervallet (-∞;-K kp)= (-∞;-2,05). Den observerte verdien K obs = -0,415 tilhører ikke det kritiske området, derfor er det på dette nivået av signifikans ingen grunn til å avvise hovedhypotesen. Du kan godta et parti med produkter.

Eksempel nr. 5. To fabrikker produserer samme type deler. For å vurdere kvaliteten ble det tatt prøver fra produktene fra disse fabrikkene og følgende resultater ble oppnådd. Blant de 200 utvalgte produktene fra det første anlegget var 20 defekte, og blant de 300 produktene fra det andre anlegget var 15 defekte.
Ved et signifikansnivå på 0,025, finn ut om det er en signifikant forskjell i kvaliteten på deler produsert av disse fabrikkene.

I henhold til betingelsen er α = 0,025, derav F(Kcr) = 0,4875 og Kcr = 2,24. Med et tosidig alternativ har utvalget av akseptable verdier formen (-2.24;2.24). Den observerte verdien K obs =2,15 faller innenfor dette intervallet, dvs. på dette nivået av betydning er det ingen grunn til å forkaste hovedhypotesen. Fabrikkene produserer produkter av samme kvalitet.

Prøve

Prøve eller utvalgspopulasjon- et sett med tilfeller (emner, objekter, hendelser, prøver), ved hjelp av en bestemt prosedyre, valgt fra den generelle befolkningen for å delta i studien.

Prøveegenskaper:

Kvalitative egenskaper ved utvalget - hvem velger vi akkurat og hvilke prøvetakingsmetoder vi bruker for dette.
Kvantitative egenskaper ved utvalget - hvor mange saker vi velger ut, med andre ord, utvalgsstørrelse.

Nødvendigheten av prøvetaking

Studieobjektet er svært omfattende. For eksempel er forbrukere av et globalt selskaps produkter representert av et stort antall geografisk spredte markeder.
Det er behov for å samle inn primærinformasjon.

Prøvestørrelse

Prøvestørrelse- antall tilfeller inkludert i utvalgspopulasjonen. Av statistiske grunner anbefales det at antall tilfeller er minst 30-35.

Avhengige og uavhengige utvalg

Når du sammenligner to (eller flere) prøver, er en viktig parameter deres avhengighet. Hvis et homomorft par kan etableres (det vil si når ett tilfelle fra prøve X tilsvarer ett og bare ett tilfelle fra prøve Y og omvendt) for hvert tilfelle i to prøver (og dette forholdet er viktig for egenskapen som måles i prøvene), kalles slike prøver avhengig. Eksempler på avhengige prøver:

tvillingpar,
to målinger av en egenskap før og etter eksperimentell eksponering,
ektemenn og koner
osv.

Hvis det ikke er et slikt forhold mellom prøvene, vurderes disse prøvene selvstendig, For eksempel:

Følgelig har avhengige utvalg alltid samme størrelse, mens størrelsen på uavhengige utvalg kan variere.

Sammenligning av prøver er gjort ved hjelp av ulike statistiske kriterier:

osv.

Representativitet

Utvalget kan anses som representativt eller ikke-representativt.

Eksempel på et ikke-representativt utvalg

En studie med forsøks- og kontrollgrupper, som er plassert under ulike forhold.
- Studer med eksperimentelle og kontrollgrupper ved å bruke en parvis seleksjonsstrategi
En studie som bruker bare én gruppe - en eksperimentell gruppe.
En studie som bruker en blandet (faktoriell) design - alle grupper er plassert under forskjellige forhold.

Eksempeltyper

Prøver er delt inn i to typer:

sannsynlighet
ikke-sannsynlighet

Sannsynlighetsprøver

Enkelt sannsynlighetsutvalg:
- Enkel resampling. Bruken av et slikt utvalg er basert på antakelsen om at hver respondent er like sannsynlig å bli inkludert i utvalget. Basert på listen over befolkningen generelt, er det satt sammen kort med respondentnummer. De legges i en kortstokk, stokkes og et kort tas ut tilfeldig, tallet skrives ned og returneres deretter. Deretter gjentas prosedyren så mange ganger som prøvestørrelsen vi trenger. Ulempe: repetisjon av utvalgsenheter.

Prosedyren for å konstruere en enkel tilfeldig prøve inkluderer følgende trinn:

1. det er nødvendig å få en fullstendig liste over medlemmer av befolkningen og nummerere denne listen. En slik liste, husker, kalles en samplingsramme;

2. bestemme forventet utvalgsstørrelse, det vil si forventet antall respondenter;

3. trekke ut så mange tall fra tilfeldig talltabellen som vi trenger prøveenheter. Dersom det skulle være 100 personer i utvalget, tas 100 tilfeldige tall fra tabellen. Disse tilfeldige tallene kan genereres av et dataprogram.

4. velg fra basislisten de observasjonene hvis tall tilsvarer de skrevne tilfeldige tallene

Enkel tilfeldig prøvetaking har åpenbare fordeler. Denne metoden er ekstremt enkel å forstå. Resultatene av studien kan generaliseres til befolkningen som studeres. De fleste tilnærminger til statistisk slutning innebærer å samle informasjon ved hjelp av et enkelt tilfeldig utvalg. Imidlertid har den enkle tilfeldige prøvetakingsmetoden minst fire signifikante begrensninger:

1. Det er ofte vanskelig å lage en samplingsramme som tillater enkel tilfeldig prøvetaking.

2. Enkelt tilfeldig utvalg kan resultere i en stor populasjon, eller en populasjon fordelt over et stort geografisk område, noe som øker tiden og kostnadene ved datainnsamling betydelig.

3. Resultatene av enkel tilfeldig prøvetaking er ofte preget av lav presisjon og større standardfeil enn resultatene av andre sannsynlighetsmetoder.

4. Som et resultat av bruk av SRS kan det dannes et ikke-representativt utvalg. Selv om prøver oppnådd ved enkel tilfeldig prøvetaking i gjennomsnitt representerer populasjonen tilstrekkelig, er noen av dem ekstremt feilrepresentative for populasjonen som studeres. Dette er spesielt sannsynlig når prøvestørrelsen er liten.

Enkel ikke-repeterende prøvetaking. Prosedyren for å konstruere en prøve er den samme, bare kortene med respondentnummer blir ikke returnert tilbake til kortstokken.

Systematisk sannsynlighetsutvalg. Det er en forenklet versjon av enkel sannsynlighetsprøvetaking. Basert på listen over den generelle befolkningen velges respondentene med et visst intervall (K). Verdien av K bestemmes tilfeldig. Det mest pålitelige resultatet oppnås med en homogen populasjon, ellers kan trinnstørrelsen og enkelte interne sykliske mønstre i prøven falle sammen (prøveblanding). Ulemper: det samme som i et enkelt sannsynlighetsutvalg.
Seriell (klynge) prøvetaking. Utvalgsenheter er statistiske serier (familie, skole, lag osv.). De valgte elementene er gjenstand for en fullstendig eksamen. Utvalget av statistiske enheter kan organiseres som tilfeldig eller systematisk utvalg. Ulempe: Mulighet for større homogenitet enn i befolkningen generelt.
Regional prøvetaking. Ved en heterogen populasjon anbefales det før bruk av sannsynlighetsprøvetaking med noen seleksjonsteknikk å dele populasjonen inn i homogene deler, et slikt utvalg kalles distriktsutvalg. Sonegrupper kan omfatte både naturformasjoner (for eksempel bydeler) og alle funksjoner som ligger til grunn for studien. Karakteristikken som delingen utføres på grunnlag av kalles karakteristikken for stratifisering og sonering.
Eksempel på "bekvemmelighet". Prosedyren for "bekvemmelig" prøvetaking består i å etablere kontakter med "praktiske" prøvetakingsenheter - en gruppe studenter, et idrettslag, venner og naboer. Hvis du ønsker å få informasjon om folks reaksjoner på et nytt konsept, er denne typen prøvetaking ganske rimelig. Bekvemmelighetsprøver brukes ofte til å forhåndsteste spørreskjemaer.

Ikke-sannsynlighetsprøver

Utvelgelse i et slikt utvalg utføres ikke i henhold til prinsippene om tilfeldighet, men i henhold til subjektive kriterier - tilgjengelighet, typiskhet, lik representasjon, etc.

Kvoteutvalg - utvalget er konstruert som en modell som gjengir strukturen til den generelle befolkningen i form av kvoter (proporsjoner) av egenskapene som studeres. Antall utvalgselementer med ulike kombinasjoner av studerte egenskaper bestemmes slik at det tilsvarer deres andel (andel) i befolkningen generelt. Så hvis for eksempel vår generelle befolkning består av 5000 mennesker, hvorav 2000 kvinner og 3000 menn, så vil vi i kvoteutvalget ha 20 kvinner og 30 menn, eller 200 kvinner og 300 menn. Kvoteutvalg er oftest basert på demografiske kriterier: kjønn, alder, region, inntekt, utdanning og andre. Ulemper: vanligvis er slike prøver ikke representative, fordi det er umulig å ta hensyn til flere sosiale parametere samtidig. Fordeler: lett tilgjengelig materiale.
Snøballmetoden. Prøven er konstruert som følger. Hver respondent, som starter med den første, blir bedt om kontaktinformasjon til venner, kolleger, bekjente som passer til utvelgelsesbetingelsene og kan delta i studien. Med unntak av det første trinnet dannes altså utvalget med deltakelse av forskningsobjektene selv. Metoden brukes ofte når det er nødvendig å finne og intervjue vanskelig tilgjengelige grupper av respondenter (for eksempel respondenter med høy inntekt, respondenter som tilhører samme yrkesgruppe, respondenter med lignende hobbyer/interesser osv.)
Spontan prøvetaking – prøvetaking av den såkalte «første personen du kommer over». Ofte brukt i TV- og radioavstemninger. Størrelsen og sammensetningen av spontane prøver er ikke kjent på forhånd, og bestemmes kun av én parameter – respondentenes aktivitet. Ulemper: det er umulig å fastslå hvilken populasjon respondentene representerer, og som et resultat er det umulig å fastslå representativitet.
Ruteundersøkelse – ofte brukt når studieenheten er familien. På kartet over lokaliteten der undersøkelsen skal gjennomføres er alle gater nummerert. Ved hjelp av en tabell (generator) av tilfeldige tall velges store tall. Hvert stort tall anses å bestå av 3 komponenter: gatenummer (2-3 første tall), husnummer, leilighetsnummer. For eksempel er nummeret 14832: 14 er gatenummeret på kartet, 8 er husnummeret, 32 er leilighetsnummeret.
Regional prøvetaking med utvalg av typiske objekter. Dersom det etter soneinndeling velges et typisk objekt fra hver gruppe, dvs. et objekt som er nær gjennomsnittet når det gjelder de fleste egenskapene som er studert i studien, et slikt utvalg kalles regionalisert med utvalg av typiske objekter.

6.Modal prøvetaking. 7. ekspertprøvetaking. 8. Heterogen prøve.

Gruppebyggingsstrategier

Utvelgelsen av grupper for deltakelse i et psykologisk eksperiment gjennomføres ved hjelp av ulike strategier for å sikre at intern og ekstern validitet opprettholdes i størst mulig grad.

Randomisering

Randomisering, eller tilfeldig utvalg, brukes til å lage enkle stikkprøver. Bruken av et slikt utvalg er basert på antakelsen om at det er like sannsynlig at hvert medlem av populasjonen blir inkludert i utvalget. For å lage en tilfeldig prøve på 100 universitetsstudenter, kan du for eksempel legge papirbiter med navnene på alle universitetsstudenter i en lue, og deretter ta 100 stykker papir ut av det - dette vil være et tilfeldig utvalg (Goodwin J ., s. 147).

Parvis valg

Parvis valg- en strategi for å konstruere prøvetakingsgrupper, der grupper av forsøkspersoner er satt sammen av forsøkspersoner som er likeverdige når det gjelder sekundære parametere som er signifikante for eksperimentet. Denne strategien er effektiv for eksperimenter som bruker eksperimentelle grupper og kontrollgrupper, med det beste alternativet å involvere tvillingpar (mono- og dizygotiske), da den lar deg lage...

Stratometrisk prøvetaking

Stratometrisk prøvetaking- randomisering med tildeling av strata (eller klynger). Med denne prøvemetoden deles den generelle befolkningen inn i grupper (strata) med visse egenskaper (kjønn, alder, politiske preferanser, utdanning, inntektsnivå osv.), og emner med tilsvarende egenskaper velges.

Omtrentlig modellering

Omtrentlig modellering- trekke begrensede utvalg og generalisere konklusjoner om dette utvalget til den bredere befolkningen. For eksempel, med deltakelse av 2. års universitetsstudenter i studien, gjelder dataene i denne studien for "personer i alderen 17 til 21 år". Tillateligheten av slike generaliseringer er ekstremt begrenset.

Tilnærmet modellering er dannelsen av en modell som, for en klart definert klasse av systemer (prosesser), beskriver dens oppførsel (eller ønskede fenomener) med akseptabel nøyaktighet.

Notater

Litteratur

Nasledov A.D. Matematiske metoder for psykologisk forskning. - St. Petersburg: Rech, 2004.

Ilyasov F. N. Representativitet av undersøkelsesresultater i markedsundersøkelser // Sosiologisk forskning. 2011. nr. 3. S. 112-116.

Se også

I noen typer studier er utvalget delt inn i grupper:
- eksperimentell
- kontroll
Kohort

Linker

Konseptet med prøvetaking. Hovedkarakteristika for prøven. Prøvetakingstyper

Wikimedia Foundation.

2010.:

Synonymer

Se hva "Utvalg" er i andre ordbøker: prøve - en gruppe forsøkspersoner som representerer en spesifikk populasjon og valgt ut for et eksperiment eller studie. Det motsatte konseptet er den generelle helheten. Et utvalg er en del av befolkningen generelt. Ordbok for en praktisk psykolog. M.: AST,... ...

Se hva "Utvalg" er i andre ordbøker: Flott psykologisk leksikon - utvalg En del av den generelle populasjonen av elementer som er dekket av observasjon (ofte kalles det en utvalgspopulasjon, og et utvalg er selve metoden for prøvetaking av observasjon). I matematisk statistikk er det akseptert... ...

- (prøve) 1. En liten mengde av et produkt, valgt for å representere hele kvantiteten. Se: salg pr. prøve. 2. En liten mengde varer gitt til potensielle kjøpere for å gi dem muligheten til å utføre det... ... Ordbok med forretningsvilkår

Prøve- en del av den generelle populasjonen av elementer som er dekket av observasjon (ofte kalles det en utvalgspopulasjon, og et utvalg er selve metoden for prøvetaking av observasjon). I matematisk statistikk er prinsippet om tilfeldig utvalg tatt i bruk; Dette … … Økonomisk og matematisk ordbok

- (utvalg) Et tilfeldig utvalg av en undergruppe av elementer fra hovedpopulasjonen, hvis egenskaper brukes til å evaluere hele populasjonen som helhet. Prøvemetoden brukes når det er for tidkrevende eller for dyrt å kartlegge hele befolkningen... Økonomisk ordbok

Cm … Ordbok for synonymer