Den generelle populasjonen er tilfeldig og naturlig utvalg. Generell populasjon og prøvetakingsmetode

Befolkning (på engelsk - befolkning) - helheten av alle objekter (enheter), som forskeren har til hensikt å trekke konklusjoner om når han studerer et spesifikt problem.

Den generelle befolkningen består av alle objekter som er gjenstand for studier. Sammensetningen av befolkningen generelt avhenger av målene for studien. Noen ganger er den generelle befolkningen hele befolkningen i en bestemt region (for eksempel når forholdet mellom potensielle velgere og en kandidat studeres), er det oftest satt flere kriterier som bestemmer studieobjektet. For eksempel menn i alderen 30-50 år som bruker et bestemt merke barberhøvel minst en gang i uken og har en inntekt på minst 100 dollar per familiemedlem.

Prøveeller prøvetakingsramme- et sett med saker (emner, objekter, hendelser, prøver), ved hjelp av en bestemt prosedyre, valgt fra den generelle befolkningen for deltakelse i studien.

Prøveegenskaper:

· Kvalitative egenskaper ved prøven - hvem velger vi nøyaktig og hvilke metoder for prøvekonstruksjon vi bruker for dette.

· Den kvantitative egenskapen til utvalget er hvor mange saker vi velger ut, med andre ord utvalgets størrelse.

Behov for prøvetaking

· Studieobjektet er veldig bredt. For eksempel er forbrukere av produktene til et globalt selskap et stort antall geografisk spredte markeder.

· Det er behov for å samle inn primærinformasjon.

Prøvestørrelse

Prøvestørrelse- antall saker inkludert i utvalget. Av statistiske grunner anbefales det at antall tilfeller er minst 30-35.

Avhengige og uavhengige utvalg

Når man sammenligner to (eller flere) prøver, er deres avhengighet en viktig parameter. Hvis det er mulig å etablere et homomorft par (det vil si når ett tilfelle fra prøve X tilsvarer ett og bare ett tilfelle fra prøve Y og omvendt) for hvert tilfelle i to prøver (og dette relasjonsgrunnlaget er viktig for egenskapen målt i prøvene), kalles slike prøver avhengig. Eksempler på avhengige valg:

· tvillingpar

· to målinger av en hvilken som helst funksjon før og etter eksperimentell eksponering,

· ektemenn og koner

· etc.

Hvis det ikke er et slikt forhold mellom prøvene, vurderes disse prøvene uavhengig, for eksempel:

· menn og kvinner,

· psykologer og matematikere.

Følgelig har avhengige utvalg alltid samme størrelse, mens størrelsen på uavhengige utvalg kan variere.

Prøver sammenlignes ved å bruke ulike statistiske kriterier:

· Elevens t-test

· Wilcoxon test

· Mann-Whitney U-test

· Kriterium for tegn

· og så videre.

Representativitet

Utvalget kan anses som representativt eller ikke-representativt.

Et eksempel på et ikke-representativt utvalg

I USA anses et av de mest kjente historiske eksemplene på ikke-representativ prøvetaking å være en hendelse som skjedde under presidentvalget i 1936. The Litrery Digest, som hadde forutsett hendelsene ved flere tidligere valg, feilvurderte sine spådommer ved å sende ut ti millioner prøvesedler til sine abonnenter, så vel som til personer valgt fra telefonbøkene i hele landet og personer fra bilregistreringslister. I 25 % av de returnerte stemmesedlene (nesten 2,5 millioner) ble stemmene fordelt som følger:

· 57% foretrakk den republikanske kandidaten Alf Landon

· 40 % valgte daværende demokratiske president Franklin Roosevelt

Som kjent vant Roosevelt selve valget med mer enn 60 % av stemmene. The Litreary Digests feil var denne: de ønsket å øke representativiteten til utvalget - fordi de visste at flertallet av abonnentene deres betraktet seg som republikanere - utvidet de utvalget med personer valgt fra telefonbøker og registreringslister. De tok imidlertid ikke hensyn til samtidens realiteter og rekrutterte faktisk enda flere republikanere: Under den store depresjonen var det stort sett middel- og overklassen (det vil si de fleste republikanere, ikke demokrater) som hadde råd til å eie telefoner og biler.

Typer plan for byggegrupper fra prøver

Det er flere hovedtyper av gruppebyggeplaner:

1. Studie med forsøks- og kontrollgrupper, som er plassert under ulike forhold.

2. Studer med eksperimentelle og kontrollgrupper ved å bruke en sammenkoblet seleksjonsstrategi

3. Studer med kun én gruppe - eksperimentell.

4. En studie som bruker en blandet (faktoriell) plan - alle grupper er plassert under forskjellige forhold.

Prøvetyper

Prøver er delt inn i to typer:

· sannsynlighet

· usannsynlighet

Sannsynlighetsprøver

1. Enkelt sannsynlighetsutvalg:

oEnkel resampling. Bruken av et slikt utvalg er basert på antakelsen om at hver respondent er like sannsynlig å bli inkludert i utvalget. Basert på listen over befolkningen generelt, er det satt sammen kort med antall respondenter. De legges i en kortstokk, stokkes, og et kort tas ut av dem tilfeldig, et tall skrives ned og returneres deretter. Videre gjentas prosedyren så mange ganger som prøvestørrelsen vi trenger. Minus: repetisjon av utvalgsenheter.

Prosedyren for å konstruere en enkel tilfeldig prøve inkluderer følgende trinn:

1. du må få en fullstendig liste over medlemmer av den generelle befolkningen og nummerere denne listen. En slik liste, husker, kalles samplingsrammen;

2. bestemme forventet utvalgsstørrelse, det vil si forventet antall respondenter;

3. trekke ut så mange tall fra tabellen med tilfeldige tall som vi trenger prøveenheter. Dersom utvalget skal omfatte 100 personer, tas 100 tilfeldige tall fra tabellen. Disse tilfeldige tallene kan genereres av et dataprogram.

4. velg fra basislisten de observasjonene hvis tall tilsvarer de skrevne tilfeldige tallene

· Et enkelt tilfeldig utvalg har åpenbare fordeler. Denne metoden er ekstremt enkel å forstå. Resultatene av studien kan utvides til studiepopulasjonen. De fleste tilnærminger til statistisk slutning innebærer å samle informasjon ved hjelp av et enkelt tilfeldig utvalg. Imidlertid har den enkle tilfeldige prøvetakingsmetoden minst fire signifikante begrensninger:

1. Det er ofte vanskelig å lage en utvalgsramme som vil tillate et enkelt tilfeldig utvalg.

2. Et enkelt tilfeldig utvalg kan resultere i en stor populasjon, eller en populasjon fordelt over et stort geografisk område, noe som øker tiden og kostnadene for datainnsamling betydelig.

3. Resultatene ved bruk av et enkelt tilfeldig utvalg er ofte preget av lav nøyaktighet og større standardfeil enn resultatene ved bruk av andre sannsynlige metoder.

4. Som et resultat av anvendelsen av SRS kan det dannes en ikke-representativ prøve. Selv om prøvene oppnådd ved enkelt tilfeldig utvalg i gjennomsnitt representerer den generelle befolkningen tilstrekkelig, representerer noen av dem ekstremt feil populasjonen som studeres. Sannsynligheten for dette er spesielt høy med liten utvalgsstørrelse.

· Enkel ikke-repeterende prøvetaking. Prosedyren for å konstruere prøven er den samme, bare kortene med numrene til respondentene blir ikke returnert tilbake til kortstokken.

1. Systematisk sannsynlighetsutvalg. Det er en forenklet versjon av et enkelt sannsynlighetsutvalg. Basert på listen over den generelle befolkningen velges respondentene med et visst intervall (K). Verdien av K bestemmes tilfeldig. Det mest pålitelige resultatet oppnås med en homogen generell populasjon, ellers kan trinnstørrelsen og enkelte interne sykliske mønstre i prøven falle sammen (prøveblanding). Ulemper: det samme som i et enkelt sannsynlighetsutvalg.

2. Seriell (nestet) prøvetaking. Utvalgsenhetene er statistiske serier (familie, skole, lag osv.). De utvalgte elementene blir gjenstand for løpende undersøkelse. Utvalget av statistiske enheter kan organiseres etter type tilfeldig eller systematisk utvalg. Ulemper: Mulighet for større homogenitet enn i befolkningen generelt.

3. Sonedelt prøve. Ved en heterogen populasjon anbefales det før bruk av sannsynlighetsprøvetaking med noen seleksjonsteknikk å dele populasjonen inn i homogene deler, et slikt utvalg kalles et soneutvalg. Sonegruppene kan være både naturformasjoner (for eksempel bydeler) og ethvert trekk som ligger til grunn for studien. Skiltet som inndelingen utføres på grunnlag av kalles tegnet for lagdeling og sonering.

4. "Praktisk" valg. Prosedyren for "bekvemmelig" prøvetaking består i å etablere kontakter med "praktiske" prøvetakingsenheter - med en gruppe elever, et idrettslag, med venner og naboer. Hvis det er nødvendig å få informasjon om folks reaksjoner på et nytt konsept, er et slikt utvalg ganske rimelig. "Bekvemmelig" prøvetaking brukes ofte til foreløpig testing av spørreskjemaer.

Utrolige prøver

Utvelgelsen i et slikt utvalg utføres ikke i henhold til tilfeldighetsprinsippene, men etter subjektive kriterier - tilgjengelighet, typiskhet, lik representasjon, etc.

1. Kvoteprøvetaking - utvalget er bygget som en modell som gjengir strukturen til den generelle befolkningen i form av kvoter (proporsjoner) av de studerte egenskapene. Antall utvalgselementer med ulik kombinasjon av egenskapene som studeres, bestemmes på en slik måte at det tilsvarer deres andel (andel) i befolkningen generelt. Så hvis vi for eksempel har en generell befolkning på 5000 personer, hvorav 2000 kvinner og 3000 menn, så vil vi i kvoteutvalget ha 20 kvinner og 30 menn, eller 200 kvinner og 300 menn. Kvoteutvalg er oftest basert på demografiske kriterier: kjønn, alder, region, inntekt, utdanning og andre. Ulemper: vanligvis er slike prøver ikke representative, fordi det er umulig å ta hensyn til flere sosiale parametere samtidig. Fordeler: lett tilgjengelig materiale.

2. Snøballmetoden. Prøven er konstruert som følger. Hver respondent, som starter med den første, blir bedt om å kontakte sine venner, kolleger, bekjente som passer til seleksjonsbetingelsene og kan delta i studien. Således, med unntak av det første trinnet, dannes utvalget med deltakelse av studieobjektene selv. Metoden brukes ofte når det er nødvendig å finne og intervjue vanskelig tilgjengelige grupper av respondenter (for eksempel respondenter med høy inntekt, respondenter som tilhører samme yrkesgruppe, respondenter som har noen lignende hobbyer/lidenskaper osv. )

3. Spontan prøvetaking - prøvetaking av den såkalte "førstekommeren". Ofte brukt i TV- og radioavstemninger. Størrelsen og sammensetningen av spontane prøver er ikke kjent på forhånd, og bestemmes av kun én parameter - aktiviteten til respondentene. Ulemper: det er umulig å fastslå hva slags generell befolkning respondentene representerer, og som et resultat er det umulig å fastslå representativitet.

4. Ruteundersøkelse - brukes ofte hvis studieenheten er familien. På kartet over tettstedet der undersøkelsen skal gjennomføres, er alle gater nummerert. Ved hjelp av en tabell (generator) av tilfeldige tall velges store tall. Hvert stort tall anses å bestå av 3 komponenter: gatenummer (2-3 første tall), husnummer, leilighetsnummer. For eksempel nummeret 14832: 14 er gatenummeret på kartet, 8 er husnummeret, 32 er leilighetsnummeret.

5. Sonedelt prøvetaking med utvalg av typiske objekter. Dersom det etter soneinndeling velges et typisk objekt fra hver gruppe, dvs. et objekt som nærmer seg gjennomsnittet når det gjelder de fleste av egenskapene som er studert i studien, kalles en slik prøve sonet med utvalg av typiske objekter.

Gruppebyggingsstrategier

Utvelgelsen av grupper for deres deltakelse i et psykologisk eksperiment utføres ved hjelp av ulike strategier, som er nødvendige for å sikre størst mulig samsvar med intern og ekstern validitet.

· Randomisering (tilfeldig utvalg)

· Parvis valg

· Stratometrisk utvalg

· Omtrentlig modellering

· Engasjerende ekte grupper

Randomisering, eller tilfeldig utvalg, brukes til å lage enkle stikkprøver. Bruken av et slikt utvalg er basert på antakelsen om at hvert medlem av populasjonen er like sannsynlig å bli inkludert i utvalget. For eksempel, for å lage et tilfeldig utvalg av 100 universitetsstudenter, kan du legge papirstykker med navnene på alle universitetsstudenter i en lue, og deretter ta 100 stykker papir ut av det - dette vil være tilfeldig utvalg (Goodwin J. , s. 147).

Parvis valg- en strategi for å konstruere utvalgsgrupper, der grupper av forsøkspersoner er satt sammen av emner som er likeverdige med tanke på sideparametere som er signifikante for eksperimentet. Denne strategien er effektiv for eksperimenter som bruker eksperimentelle grupper og kontrollgrupper med det beste alternativet - tiltrekke tvillingpar (mono- og dizygotiske), da den lar deg lage ...

Stratometrisk utvalg - randomisering med tildeling av strata (eller klynger). Med denne prøvemetoden deles den generelle befolkningen inn i grupper (strata) som har visse egenskaper (kjønn, alder, politiske preferanser, utdanning, inntektsnivå osv.), og fag med tilsvarende egenskaper velges.

Omtrentlig modellering - utarbeide begrensede utvalg og generalisere konklusjonene om dette utvalget til en bredere populasjon. For eksempel, når du deltar i en studie av studenter i det andre året på universitetet, utvides dataene til denne studien til "mennesker i alderen 17 til 21 år." Tillateligheten av slike generaliseringer er ekstremt begrenset.

Tilnærmet modellering er dannelsen av en modell som, for en klart definert klasse av systemer (prosesser), beskriver dens oppførsel (eller ønskede fenomener) med akseptabel nøyaktighet.

Et sett med homogene objekter blir ofte undersøkt i forhold til et eller annet trekk som kjennetegner dem, målt kvantitativt eller kvalitativt.

For eksempel, hvis det er et parti med deler, kan størrelsen på delen i henhold til GOST være et kvantitativt tegn, og standarden til delen kan være et kvalitetstegn.

Om nødvendig blir de kontrollert for samsvar med standarder, noen ganger tyr de til en fullstendig undersøkelse, men i praksis brukes dette sjelden. For eksempel, hvis den generelle befolkningen inneholder et stort antall objekter som studeres, er det praktisk talt umulig å gjennomføre en kontinuerlig undersøkelse. I dette tilfellet velges et visst antall objekter (elementer) fra hele populasjonen og de undersøkes. Dermed er det en generell og utvalgspopulasjon.

Det generelle navnet er totalen av alle objekter som er gjenstand for eksamen eller studier. Den generelle populasjonen inneholder som regel et begrenset antall elementer, men hvis den er for stor, antas det for å forenkle matematiske beregninger at hele populasjonen består av et utallig antall objekter.

Et utvalg eller utvalgspopulasjon er en del av de utvalgte elementene fra hele populasjonen. Prøvetaking kan gjentas eller ikke gjentas. I det første tilfellet returneres det til den generelle befolkningen, i det andre er det ikke. I praksis brukes ikke-repeterende tilfeldig utvalg oftere.

Populasjonen og utvalget må relateres til hverandre ved representativitet. Med andre ord, for at egenskapene til utvalgspopulasjonen trygt skal kunne bestemme egenskapene til hele populasjonen, er det nødvendig at elementene i utvalget representerer dem så nøyaktig som mulig. Utvalget skal med andre ord være representativt (representativt).

Et utvalg vil være mer eller mindre representativt dersom det trekkes tilfeldig fra et svært stort antall av hele populasjonen. Dette kan argumenteres på grunnlag av den såkalte loven om store tall. I dette tilfellet har alle elementer like stor sannsynlighet for å bli inkludert i utvalget.

Det finnes ulike valgmuligheter. Alle disse metodene kan i prinsippet deles inn i to alternativer:

Alternativ 1. Varer velges når populasjonen ikke er delt inn. Denne varianten inkluderer enkle tilfeldige gjentatte og ikke-gjentatte valg.
Alternativ 2. Den generelle befolkningen deles inn i deler og utvalget av elementer foretas. Disse inkluderer typiske, mekaniske og serielle valg.

Enkel tilfeldig - utvalg der elementer trekkes ut ett om gangen fra hele populasjonen tilfeldig.

Typisk er et utvalg der elementer ikke velges fra hele populasjonen, men fra alle dens "typiske" deler.

Mekanisk - dette er et slikt utvalg når hele populasjonen er delt inn i et antall grupper lik antall elementer som skal være i utvalget, og følgelig velges ett element fra hver gruppe. For eksempel, hvis det er nødvendig å velge 25% av delene laget av maskinen, velges hver fjerde del, og hvis det kreves 4% av delene, velges hver tjuefemte del, og så videre. Samtidig må det sies at noen ganger kan det hende at mekanisk utvalg ikke gir tilstrekkelig

Seriell - dette er et slikt utvalg der elementer velges fra hele befolkningen i "serier" utsatt for kontinuerlig forskning, og ikke en om gangen. For eksempel, når deler produseres av et stort antall automatiske maskiner, utføres en fullstendig undersøkelse kun i forhold til produktene til flere maskiner. Seriell seleksjon brukes hvis egenskapen som studeres har liten variasjon i ulike serier.

For å redusere feilen benyttes estimater av den generelle befolkningen ved hjelp av et utvalg. Dessuten kan selektiv kontroll være både ett- og flertrinns, noe som øker undersøkelsens pålitelighet.

I forrige seksjon var vi interessert i distribusjonen av en funksjon i et bestemt sett med elementer. Settet som kombinerer alle elementene som har denne funksjonen kalles det generelle. Hvis tegnet er menneskelig (nasjonalitet, utdanning, IQ-koeffisient, etc.), er den generelle befolkningen hele jordens befolkning. Dette er en veldig stor samling, det vil si at antallet elementer i samlingen n er stort. Antall elementer kalles volum av populasjonen. Samlinger kan være endelige eller uendelige. Den generelle befolkningen - alle mennesker, selv om de er veldig store, men selvfølgelig endelige. Den generelle befolkningen - alle stjernene, er sannsynligvis uendelig.

Hvis forskeren måler en kontinuerlig tilfeldig variabel X, kan hvert måleresultat betraktes som et element i en hypotetisk ubegrenset generell populasjon. I denne generelle populasjonen er et utallig antall resultater fordelt etter sannsynlighet under påvirkning av feil i instrumentene, uoppmerksomhet fra eksperimentatoren, tilfeldig interferens i selve fenomenet, etc.

Hvis vi utfører n gjentatte målinger av en tilfeldig variabel X, det vil si at vi får n spesifikke forskjellige numeriske verdier, kan dette resultatet av eksperimentet betraktes som et utvalg av størrelse n fra et hypotetisk generelt sett med resultater av enkeltmålinger.

Det er naturlig å anta at den faktiske verdien av den målte verdien er det aritmetiske gjennomsnittet av resultatene. Denne funksjonen til n målinger kalles en statistikk, og den er i seg selv en tilfeldig variabel som har en eller annen fordeling kalt samplingsfordelingen. Å bestemme prøvefordelingen til en bestemt statistikk er den viktigste oppgaven ved statistisk analyse. Det er klart at denne fordelingen avhenger av utvalgsstørrelsen n og fordelingen av tilfeldig variabel X i den hypotetiske generelle populasjonen. Utvalgsfordelingen til en statistikk er fordelingen av X q i et uendelig sett av alle mulige utvalg av størrelse n fra den opprinnelige populasjonen.

Det er også mulig å måle en diskret tilfeldig variabel.

La målingen av en tilfeldig variabel X være kastingen av en regulær homogen trekantet pyramide, på hvis flater tallene 1, 2, 3, 4 er skrevet. Den diskrete, tilfeldige variabelen X har en enkel enhetlig fordeling:

Eksperimentet kan utføres et ubegrenset antall ganger. En hypotetisk teoretisk populasjon er en uendelig populasjon der det er like andeler (0,25 hver) av fire forskjellige elementer, betegnet med tallene 1, 2, 3, 4. denne generelle populasjonen. Som et resultat av eksperimentet har vi n tall. Du kan introdusere noen funksjoner av disse mengdene, som kalles statistikk, de kan assosieres med visse parametere i den generelle fordelingen.

De viktigste numeriske egenskapene til fordelinger er sannsynlighetene P i, den matematiske forventningen M, variansen D. Statistikken for sannsynlighetene P i er de relative frekvensene, hvor n i er frekvensen til resultatet i (i=1,2, 3,4) i prøven. Den matematiske forventningen M tilsvarer statistikken

som kalles prøvegjennomsnittet. Prøveavvik

tilsvarer den generelle variansen D.

Den relative frekvensen av enhver hendelse (i=1,2,3,4) i en serie av n re-tester (eller i prøver av størrelse n fra den generelle befolkningen) vil ha en binomial fordeling.

Denne fordelingen har en forventning på 0,25 (avhenger ikke av n) og et standardavvik på (minker raskt når n øker). Fordelingen er en prøvefordeling av en statistikk, den relative frekvensen til et av de fire mulige utfallene av et enkelt pyramidekast i n gjenforsøk. Hvis vi valgte fra en uendelig, generell populasjon, der fire forskjellige elementer (i=1,2,3,4) har like andeler på 0,25, alle mulige utvalg av størrelse n (deres antall er også uendelig), så ville vi fått den såkalte matematiske prøvestørrelsen n. I denne prøven er hvert av elementene (i=1,2,3,4) fordelt i henhold til binomialloven.

La oss si at vi fullførte kastene av denne pyramiden, og nummer to falt ut 3 ganger (). Vi kan finne sannsynligheten for dette utfallet ved å bruke prøvefordelingen. Hun er likestilt

Resultatet vårt viste seg å være svært usannsynlig; i en serie på tjuefire flere kast skjer det omtrent én gang. I biologi anses et slikt resultat vanligvis som praktisk umulig. I dette tilfellet vil vi ha tvil: er pyramiden korrekt og homogen, er likhet sann i ett kast, er fordelingen og derfor prøvefordelingen korrekt.

For å løse tvilen er det nødvendig å kaste en gang til fire ganger. Hvis resultatet vises igjen, er sannsynligheten for to resultater med svært liten. Det er tydelig at vi har fått et nesten helt umulig resultat. Derfor er den opprinnelige fordelingen feil. Åpenbart, hvis det andre resultatet viser seg å være enda mer usannsynlig, så er det enda flere grunner til å håndtere denne "riktige" pyramiden. Hvis resultatet av det gjentatte eksperimentet er og, kan vi anta at pyramiden er riktig, og det første resultatet () er også riktig, men rett og slett usannsynlig.

Vi kunne ikke forholde oss til å kontrollere pyramidens korrekthet og homogenitet, men a priori anser pyramiden som korrekt og homogen, og derfor er prøvefordelingen korrekt. Deretter bør du finne ut hva som gir kunnskap om utvalgsfordelingen for studiet av befolkningen generelt. Men siden etableringen av en prøvefordeling er hovedoppgaven for statistisk forskning, kan en detaljert beskrivelse av pyramideforsøkene anses som berettiget.

Vi vil anta at prøvefordelingen er riktig. Deretter vil de eksperimentelle verdiene for den relative frekvensen i forskjellige serier av n kast av pyramiden grupperes rundt verdien 0,25, som er sentrum av prøvetakingsfordelingen og den nøyaktige verdien av den estimerte sannsynligheten. I dette tilfellet sies den relative frekvensen å være et objektivt estimat. Siden utvalgsvariansen har en tendens til null med økende n, vil de eksperimentelle verdiene for den relative frekvensen bli mer og tettere gruppert rundt den matematiske forventningen til utvalgsfordelingen med økende utvalgsstørrelse. Derfor er det et konsistent sannsynlighetsestimat.

Hvis pyramiden viste seg å være regelmessig og ikke-homogen, ville prøvefordelingene for forskjellige (i=1,2,3,4) ha forskjellige matematiske forventninger (forskjellige) og varianser.

Legg merke til at de binomiale prøvefordelingene som er oppnådd her for stor n () er godt tilnærmet av en normalfordeling med parametere og, noe som i stor grad forenkler beregningene.

La oss fortsette et tilfeldig eksperiment - å kaste en vanlig, ensartet, trekantet pyramide. Den tilfeldige variabelen X knyttet til denne opplevelsen har en fordeling. Den matematiske forventningen her er

La oss lage n kast, som tilsvarer et tilfeldig utvalg av størrelse n fra en hypotetisk, uendelig, generell populasjon som inneholder like andeler (0,25) av fire forskjellige elementer. Vi får n utvalgsverdier av den tilfeldige variabelen X (). Vi velger en statistikk som representerer utvalgets gjennomsnitt. Selve verdien er en tilfeldig variabel som har en viss fordeling, avhengig av utvalgsstørrelsen og fordelingen av den opprinnelige, tilfeldige variabelen X. Verdien er den gjennomsnittlige summen av n identiske, tilfeldige variabler (det vil si med samme fordeling). Det er klart det

Derfor er statistikken en objektiv estimator av den matematiske forventningen. Det er også et konsistent estimat, siden

Dermed har den teoretiske samplingsfordelingen samme matematiske forventning som den opprinnelige fordelingen, variansen reduseres med n ganger.

Husk at er lik

Et matematisk, abstrakt uendelig utvalg assosiert med et utvalg av størrelse n fra den generelle befolkningen og med den introduserte statistikken vil inneholde elementer i vårt tilfelle. For eksempel, hvis, vil det i det matematiske utvalget være elementer med statistikkverdier. Det vil være 13 elementer totalt Andelen ekstreme elementer i det matematiske utvalget vil være minimalt, siden resultatene og har like sannsynligheter. Blant de mange elementære resultatene av firedobbelt pyramidekasting er det bare en gunstig og. Når statistikken nærmer seg gjennomsnittet, vil sannsynlighetene øke. For eksempel vil verdien bli realisert med elementære utfall osv. Følgelig vil også andelen av element 1.5 i det matematiske utvalget øke.

Gjennomsnittsverdien vil ha størst sannsynlighet. Når n øker, vil forsøksresultatene gruppere seg tettere rundt middelverdien. Det faktum at gjennomsnittet av utvalgets gjennomsnitt er lik gjennomsnittet av den opprinnelige populasjonen, brukes ofte i statistikk.

Hvis vi utfører sannsynlighetsberegninger i utvalgsfordelingen c, så kan vi sørge for at selv med en så liten verdi på n, vil utvalgsfordelingen se ut som en normal. Den vil være symmetrisk, der verdien vil være median, modus og gjennomsnitt. Når n vokser, er den godt tilnærmet med den tilsvarende normalen selv om startfordelingen er rektangulær. Hvis den opprinnelige fordelingen er normal, er fordelingen en Students fordeling for enhver n.

For å estimere den generelle variansen er det nødvendig å velge en mer kompleks statistikk som gir et objektivt og konsistent estimat. I prøvefordelingen for S 2 er gjennomsnittet og variansen er. For store utvalgsstørrelser kan prøvefordelingen anses som normal. For liten n og en normal startfordeling vil utvalgsfordelingen for S 2 være h 2 _fordeling.

Ovenfor har vi forsøkt å presentere de første trinnene til en forsker som prøver å lage en enkel statistisk analyse av gjentatte eksperimenter med et vanlig ensartet trekantet prisme (tetraeder). I dette tilfellet kjenner vi den opprinnelige fordelingen. Det er i prinsippet mulig å teoretisk oppnå prøvefordelinger av den relative frekvensen, prøvegjennomsnittet og prøvevariansen avhengig av antall gjentatte eksperimenter n. For stor n vil alle disse utvalgsfordelingene nærme seg de tilsvarende normalfordelingene, siden de er fordelingslover for summer av uavhengige tilfeldige variabler (sentral grensesetning). Dermed vet vi de forventede resultatene.

Gjentatte eksperimenter eller prøver vil gi estimater av parametrene for prøvefordelingene. Vi argumenterte for at de eksperimentelle estimatene ville være korrekte. Vi utførte ikke disse eksperimentene og presenterte ikke engang resultatene av eksperimenter oppnådd av andre forskere. Det kan understrekes at ved bestemmelse av distribusjonslover brukes teoretiske metoder oftere enn direkte eksperimenter.

I matematisk statistikk skilles det mellom to grunnleggende begreper: den generelle befolkningen og utvalget.
En samling er et praktisk talt sett av noen gjenstander eller elementer som er av interesse for forskeren;
En egenskap til et aggregat er en reell eller imaginær kvalitet som er iboende i noen av alle dens elementer. Egenskapen kan være tilfeldig eller ikke-tilfeldig.
En populasjonsparameter er en egenskap som kan kvantifiseres som en konstant eller en variabel.
En enkel samling er preget av:
en egen eiendom (for eksempel: alle studenter i Russland);
en egen parameter i form av en konstant eller en variabel (Alle kvinnelige studenter);
et system med ikke-overlappende (inkompatible) egenskaper, for eksempel: Alle lærere og elever på skoler i Vladivostok.
Et komplekst sett er preget av:
et system med i det minste delvis kryssende egenskaper (Studenter ved de psykologiske og matematiske fakultetene ved Far Eastern State University som ble uteksaminert fra skolen med en gullmedalje);
et system med uavhengige og avhengige parametere i aggregatet; i en omfattende studie av personlighet.
Et sett kalles homogent eller homogent, alle egenskapene som er iboende i hvert av dets elementer;
Et heterogent eller heterogent sett er et sett hvis egenskaper er konsentrert i separate undergrupper av elementer.
En viktig parameter er volumet av befolkningen - antall elementer som danner den. Størrelsen på volumet avhenger av hvordan selve befolkningen er definert, og hvilke spørsmål vi er spesielt interessert i. Anta at vi er interessert i den emosjonelle tilstanden til en 1. års student i løpet av perioden for å bestå en bestemt eksamen i en økt. Da er befolkningen utslitt i løpet av en halvtime. Hvis vi er interessert i den emosjonelle tilstanden til alle 1.årsstudenter, vil totaliteten være mye større, og enda mer hvis vi tar den emosjonelle tilstanden til alle 1.årsstudenter ved et gitt universitet osv. Det er klart at aggregater av store volumer kun kan undersøkes selektivt.
Et utvalg er en viss del av befolkningen generelt, noe som studeres direkte.
Prøver er klassifisert etter representativitet, størrelse, prøvetakingsmetode og testdesign.
Representant - et utvalg som i tilstrekkelig grad gjenspeiler den generelle befolkningen i kvalitative og kvantitative termer. Utvalget må i tilstrekkelig grad reflektere befolkningen generelt, ellers vil ikke resultatene falle sammen med målene for studien.
Representativitet avhenger av volumet, jo større volum, jo mer representativt er utvalget. Etter valgmetode.
Tilfeldig - hvis elementene er valgt tilfeldig. Siden de fleste metoder for matematisk statistikk er basert på begrepet et tilfeldig utvalg, er det naturlig at utvalget må være tilfeldig.
Ikke-tilfeldig utvalg:
mekanisk seleksjon, når hele populasjonen er delt inn i så mange deler som det er planlagte enheter i utvalget, og så velges ett element fra hver del;
typisk utvalg - populasjonen er delt inn i homogene deler, og det lages et tilfeldig utvalg fra hver;
serieutvalg - populasjonen er delt inn i et stort antall serier av forskjellig størrelse, deretter lages et utvalg av en av en hvilken som helst serie;
kombinert utvalg - de vurderte utvalgstypene kombineres på forskjellige stadier.
I henhold til testskjemaet kan utvalg være uavhengige og avhengige. Prøvestørrelsen er delt inn i liten og stor. Små utvalg inkluderer prøver der antall elementer n 200 og gjennomsnittsutvalget tilfredsstiller betingelsen 30. Små prøver brukes i statistisk kontroll av kjente egenskaper til allerede studerte populasjoner.
Store prøver brukes til å sette ukjente egenskaper og populasjonsparametere.

Mer om emnet 1.3. Generell populasjon og utvalg:

7.2 Utvalg og populasjonskarakteristikker
1.6. Punkt- og intervallestimater av korrelasjonskoeffisienter for en normalfordelt generell populasjon

Befolkning- helheten av alle objekter (enheter) som forskeren har til hensikt å trekke konklusjoner om når han studerer et spesifikt problem. Den generelle befolkningen består av alle objekter som er gjenstand for studier. Sammensetningen av befolkningen generelt avhenger av målene for studien. Noen ganger er den generelle befolkningen hele befolkningen i en bestemt region (for eksempel når holdningen til potensielle velgere til en kandidat studeres), er det oftest satt flere kriterier som bestemmer studieobjektet. For eksempel kvinner i alderen 18-29 som bruker visse merker håndkrem minst en gang i uken og har en inntekt på minst $150 per familiemedlem.

Prøve- et sett med saker (emner, objekter, hendelser, prøver), ved hjelp av en bestemt prosedyre, valgt fra den generelle befolkningen for deltakelse i studien.

Prøvestørrelse;
Avhengige og uavhengige prøver;
Representativitet:
1. Et eksempel på et ikke-representativt utvalg;
Typer plan for byggegrupper fra prøver;
Gruppebyggingsstrategier:
1. Randomisering;
2. Parvis valg;
3. Stratometrisk utvalg;
4. Omtrentlig modellering.

Prøvestørrelse- antall saker inkludert i utvalget. Av statistiske grunner anbefales det at antall tilfeller er minst 30-35.

Avhengige og uavhengige utvalg

Når man sammenligner to (eller flere) prøver, er deres avhengighet en viktig parameter. Hvis det er mulig å etablere et homomorft par (det vil si når ett tilfelle fra prøve X tilsvarer ett og bare ett tilfelle fra prøve Y og omvendt) for hvert tilfelle i to prøver (og dette relasjonsgrunnlaget er viktig for funksjonen målt på prøvene), kalles slike prøver avhengige. Eksempler på avhengige prøver: tvillingpar, to målinger av en egenskap før og etter eksperimentell eksponering, ektemenn og koner, etc.

Hvis det ikke er et slikt forhold mellom prøvene, anses disse prøvene som uavhengige, for eksempel: menn og kvinner, psykologer og matematikere.

Følgelig har avhengige utvalg alltid samme størrelse, mens størrelsen på uavhengige utvalg kan variere.

Prøver sammenlignes ved å bruke ulike statistiske kriterier:

Elevens t-test;
Wilcoxon T-test;
U-test Mann-Whitney;
Kriterier for tegn osv.

Representativitet

Utvalget kan anses som representativt eller ikke-representativt.

Et eksempel på et ikke-representativt utvalg

I USA er et av de mest kjente historiske eksemplene på ikke-representativ prøvetaking presidentvalget i 1936. telefonbøker over hele landet, og personer på bilregistreringslister. I 25 % av de returnerte stemmesedlene (nesten 2,5 millioner) ble stemmene fordelt som følger:

57% foretrakk den republikanske kandidaten Alf Landon

40 % valgte daværende demokratiske president Franklin Roosevelt

Som kjent vant Roosevelt selve valget med mer enn 60 % av stemmene. The Litreary Digests feil var denne: de ønsket å øke representativiteten til utvalget - fordi de visste at flertallet av abonnentene deres betraktet seg som republikanere - utvidet de utvalget med personer valgt fra telefonbøker og registreringslister. De tok imidlertid ikke hensyn til realitetene i sin tid og rekrutterte faktisk enda flere republikanere: under den store depresjonen var det stort sett middel- og overklassen (det vil si flertallet av republikanerne, ikke demokratene) som hadde råd til å egne telefoner og biler.

Typer plan for byggegrupper fra prøver

Det er flere hovedtyper av gruppebyggeplaner:

Studer med eksperimentelle og kontrollgrupper, som er plassert under forskjellige forhold;
Studer med eksperimentelle og kontrollgrupper ved å bruke en sammenkoblet seleksjonsstrategi;
Studer med kun én gruppe - eksperimentell;
En studie som bruker en blandet (faktoriell) plan - alle grupper er plassert under forskjellige forhold.

Gruppebyggingsstrategier

Utvelgelsen av grupper for deres deltakelse i et psykologisk eksperiment utføres ved hjelp av ulike strategier som er nødvendige for å sikre høyest mulig samsvar med intern og ekstern validitet:

Randomisering (tilfeldig utvalg);
Parvis valg;
Stratometrisk utvalg;
Omtrentlig modellering;
Engasjere ekte grupper.

Randomisering

Randomisering, eller tilfeldig utvalg, brukes til å lage enkle tilfeldige utvalg. Bruken av et slikt utvalg er basert på antakelsen om at hvert medlem av populasjonen er like sannsynlig å bli inkludert i utvalget. For eksempel, for å lage et tilfeldig utvalg av 100 universitetsstudenter, kan du legge papirer med navnene på alle universitetsstudenter i en lue, og deretter ta 100 stykker papir ut av det - dette vil være tilfeldig utvalg

Parvis valg

Parvis seleksjon er en strategi for å konstruere utvalgsgrupper, der grupper av forsøkspersoner er bygd opp av emner som er likeverdige i sideparametere som er signifikante for eksperimentet. Denne strategien er effektiv for eksperimenter som bruker eksperimentelle grupper og kontrollgrupper med det beste alternativet - tiltrekke tvillingpar (mono- og dizygotiske), da den lar deg lage.

Stratometrisk utvalg

Stratometrisk seleksjon - randomisering med seleksjon av strata (eller klynger). Med denne prøvemetoden deles den generelle befolkningen inn i grupper (strata) som har visse egenskaper (kjønn, alder, politiske preferanser, utdanning, inntektsnivå osv.), og fag med tilsvarende egenskaper velges.

Omtrentlig modellering

Tilnærmet modellering - trekke opp begrensede utvalg og generalisere konklusjonene om dette utvalget til en større populasjon. For eksempel, når du deltar i en studie av studenter i det andre året på universitetet, utvides dataene til denne studien til "mennesker i alderen 17 til 21 år." Tillateligheten av slike generaliseringer er ekstremt begrenset.