Biograafiad Omadused Analüüs

Näidised ja nende saamise meetodid. Mis on esinduslik valim? Nõutav valimi suurus

Empiirilisi peetakse üheks peamiseks vahendiks sotsiaalsete suhete ja protsesside uurimisel. Need pakuvad usaldusväärset, täielikku ja esinduslikku teavet.

Tehnikate spetsiifilisus

Empiiriline annab fakte fikseerivate teadmiste hankimise. Nad aitavad kaasa asjaolude väljaselgitamisele ja üldistamisele uuritud suhetele, objektidele, nähtustele omaste sündmuste kaudse või otsese registreerimise kaudu. Empiirilised meetodid erinevad teoreetilistest selle poolest, et analüüsi objektiks on:

  1. Üksikisikute ja nende rühmade käitumine.
  2. Inimtegevuse saadused.
  3. Üksikisikute verbaalsed teod, nende hinnangud, vaated, arvamused.

Näidisuuringud

Empiiriline uuring on alati keskendunud objektiivse ja täpse teabe, kvantitatiivsete andmete hankimisele. Sellega seoses on selle läbiviimisel vaja tagada teabe esinduslikkus. Vastavalt sellele õige proovivõtukomplekt. See on See tähendab, et valik tuleb läbi viia nii, et kitsast grupist saadud andmed kajastaksid üldises vastajate massis toimuvaid trende. Näiteks 200-300 inimese küsitlemisel saab saadud andmeid ekstrapoleerida kogu linnaelanikkonnale. Valimikomplekti näitajad võimaldavad erinevalt läheneda sotsiaalmajanduslike protsesside uurimisele regioonis, riigis tervikuna.

Terminoloogia

Valimküsitlustega seotud probleemide paremaks mõistmiseks tuleb täpsustada mõningaid definitsioone. Vaatlusüksus on teabe otsene allikas. See võib olla üksikisik, rühm, dokument, organisatsioon jne. Üldine elanikkond on vaatlusühikute komplekt. Kõik need peaksid olema uuritava probleemi jaoks asjakohased. allub otsesele analüüsile. Uuring viiakse läbi vastavalt väljatöötatud teabe kogumise meetoditele. Selle osakaalu määramiseks kogu vastajate massiivist kasutage mõiste "proov". Selle omadust kajastada inimeste kogumassi võtmeparameetreid nimetatakse esinduslikkuseks. Mõnel juhul pole vasteid. Siis räägitakse esindusveast.

Esinduslikkuse tagamine

Sellega seotud küsimusi käsitletakse üksikasjalikult statistika raames. Probleemid on keerulised, sest ühest küljest räägime kvantitatiivse esituse pakkumisest, mis annab üldine elanikkond. See on tähendab eelkõige seda, et vastajate rühmad peaksid olema esindatud optimaalsel arvul. Kogus peab olema normaalse esituse jaoks piisav. Teisest küljest tähendab see ka kvalitatiivset esindatust. See eeldab teatud ainekompositsiooni, mis moodustab proovivõtukomplekt. See on tähendab, et näiteks esinduslikkusest ei saa rääkida, kui küsitletakse ainult mehi või ainult naisi, vanureid või noori. Uuring tuleks läbi viia kõigis esindatud rühmades.

Näidisomadus

Seda terminit käsitletakse kahes aspektis. Esiteks defineeritakse seda kui elementide kompleksi üldisest inimeste hulgast, kelle arvamust uuritakse - see on proovivõtukomplekt. See on samuti teatud nõutava esinduslikkusega vastajate kategooria loomise protsess. Praktikas on mitut tüüpi ja tüüpi valikut. Vaatleme neid.

Tüübid

Neid on kolm:

  1. spontaanne proovivõtukomplekt. See on vabatahtlikult valitud vastajate kogum. Ühtlasi on tagatud inimeste kogumassist üksuste sisenemise juurdepääsetavus konkreetsesse õpperühma. Praktikas kasutatakse spontaanset valikut üsna sageli. Näiteks uuringutes ajakirjanduses, posti teel. Sellel lähenemisviisil on aga märkimisväärne puudus. Kogu üldvalimi mahtu on võimatu kvalitatiivselt esindada. Seda tehnikat kasutatakse ökonoomsuse seisukohast. Mõnes uuringus on see valik ainuvõimalik.
  2. spontaanne proovivõtukomplekt. See onüks peamisi uuringus kasutatud meetodeid. Sellise valiku põhiprintsiip on anda igale vaatlusüksusele võimalus pääseda üldisest indiviidide massist kitsasse rühma. Selleks kasutatakse erinevaid meetodeid. Näiteks võib see olla loterii, mehaaniline valik, juhuslike numbrite tabel.
  3. Stratifitseeritud (kvoodi) valim. See põhineb vastajate kogumassi kvalitatiivse mudeli moodustamisel. Pärast seda viiakse läbi üksuste valimine valimipopulatsioonis. Näiteks tehakse seda vastavalt vanusele või soole, vastavalt rahvastikurühmadele jne.

Liigid

Seal on järgmised valikud:

Lisaks

Proovid võivad olla ka sõltuvad ja sõltumatud. Esimesel juhul avaldab eksperimendi protseduur ja tulemused, mis selle käigus saadakse ühele vastajate rühmale, teisele teatud mõju. Sellest tulenevalt ei näita sõltumatud valimid sellist mõju. Siinkohal tuleb aga märkida ühte olulist punkti. Vaikimisi loetakse sõltuvaks üks subjektide rühm, mille puhul psühholoogiline läbivaatus viidi läbi kaks korda (isegi kui see oli suunatud erinevate omaduste, tunnuste, märkide uurimisele).

Tõenäosuslikud valikud

Mõelge mõnda tüüpi näidistele:

  1. Juhuslik. See eeldab kogupopulatsiooni homogeensust, kõigi komponentide kättesaadavuse ühte tõenäosust, samuti täieliku elementide loendi olemasolu. Reeglina kasutatakse valikuprotsessis juhuslike numbritega tabelit.
  2. Mehaaniline. Selline juhuslik valim hõlmab järjestamist teatud atribuudi järgi. Näiteks telefoninumbri järgi, tähestikulises järjekorras, sünnikuupäeva järgi jne. Esimene komponent valitakse juhuslikult. Järgmisena valitakse iga k element sammuga n. Kogupopulatsiooni väärtus on N=k*n.
  3. Kihistunud. Seda valimit kasutatakse juhul, kui kogu populatsioon on heterogeenne. Viimane jaguneb kihtideks (rühmadeks). Igas neist tehakse valik mehaaniliselt või juhuslikult.
  4. Sari. Grupid valitakse juhuslikult. Nende sees uuritakse objekte kogu tee.

Uskumatud valikud

Need hõlmavad valimit mitte juhuslikkuse alusel, vaid subjektiivsetel alustel: tüüpilisus, juurdepääsetavus, võrdne esindatus jne. Selle kategooria valikud hõlmavad järgmist:

Nüanss

Esinduslikkuse tagamiseks on vaja täpset ja täielikku rahvastikuüksuste loendit. Vaatlusobjektid on reeglina üks inimene. Loendist valimine on kõige parem teha ühikute nummerdamise ja juhuslike numbritega tabeli abil. Kuid sageli kasutatakse ka kvaasijuhuslikku meetodit. See eeldab valikut iga n elemendi loendist.

Mõjutavad tegurid

Rahvastiku maht on selle ühikute arv. Ekspertide sõnul ei pea see olema suur. Kahtlemata on tulemus seda täpsem, mida suurem on vastajate arv. Samas ei taga suur maht alati edu. Näiteks juhtub see siis, kui vastajate koguarv on heterogeenne. Homogeenseks loetakse sellist komplekti, kus kontrollitav parameeter, näiteks kirjaoskuse tase, on jaotatud ühtlaselt, see tähendab, et puuduvad tühimikud ega kondenseerumine. Sel juhul piisab mitme inimese küsitlemisest. Küsitluse tulemuste põhjal on võimalik järeldada, et enamikul inimestest on kirjaoskus normaalne. Sellest järeldub, et teabe esinduslikkust ei mõjuta mitte kvantitatiivsed omadused, vaid populatsiooni kvalitatiivsed omadused - eelkõige selle homogeensuse tase.

Vead

Need esindavad valimi üldkogumi keskmiste parameetrite kõrvalekallet vastajate kogumassi väärtustest. Praktikas tehakse vead kindlaks sobitamise teel. Täiskasvanute küsitlemisel kasutatakse tavaliselt rahvaloenduste andmeid, statistilisi kirjeid ja varasemate uuringute tulemusi. Kontrollparameetriteks on tavaliselt populatsioonide (üld- ja valimi) keskmiste väärtuste võrdlemine, vastavalt sellele vea määramist ja selle hälbe vähendamist nimetatakse esinduslikkuse kontrolliks.

leiud

Näidisuuring on viis inimeste hoiakute ja käitumise kohta andmete kogumiseks spetsiaalselt valitud vastajarühmade küsitluse kaudu. Seda tehnikat peetakse usaldusväärseks ja ökonoomseks, kuigi see nõuab teatud tehnikat. Valim on aluseks. See toimib teatud osana inimeste kogumassist. Valik tehakse spetsiaalseid võtteid kasutades ja selle eesmärk on saada teavet kogu elanikkonna kohta. Viimast omakorda esindavad kõik võimalikud sotsiaalsed objektid või uuritav rühm. Tihti on rahvaarv nii suur, et iga selle liikme küsitluse läbiviimine oleks üsna kulukas ja tülikas. Seetõttu kasutatakse vähendatud mudelit. Valimisse kuuluvad kõik küsimustikud, keda nimetatakse vastajateks ja kes tegelikult on uurimisobjektiks. Lihtsamalt öeldes koosneb see paljudest inimestest, keda küsitletakse.

Järeldus

Küsitluse eesmärgid määravad kindlaks elanikkonna hulka kuuluvad konkreetsed kategooriad. Mis puudutab konkreetset osa inimeste kogumassist, siis selle moodustavad matemaatilisi arvutusi kasutades rühmadesse kuuluvad subjektid. Üksuste valikuks on vajalik algkogumi objekti kirjeldus. Pärast katsealuste arvu määramist määratakse vastuvõtt või rühmade moodustamise viis. Küsitluse tulemused võimaldavad meil kirjeldada uuritavat tunnust kõigi inimeste üldise massi esindajate suhtes. Nagu praktika näitab, tehakse peamiselt valikulisi, mitte pidevaid uuringuid.

Valimimeetodi teoorias on esinduslikkuse tagamiseks välja töötatud erinevad valikumeetodid ja valimi tüübid. Under valiku meetod mõista üldkogumi hulgast üksuste valimise protseduuri. Valimiseks on kaks meetodit: korduv ja mittekorduv. Kell kordas Valikuprotsessis tagastatakse iga juhuslikult valitud üksus pärast uurimist üldkogumisse ja võib järgneva valiku käigus uuesti valimisse sattuda. See valikumeetod on üles ehitatud “tagastatud palli” skeemi järgi: üldkogumi iga üksuse valimisse sattumise tõenäosus ei muutu sõltumata valitud üksuste arvust. Kell mittekorduv Iga juhuslikult valitud üksust pärast uurimist üldkogumisse ei tagastata. See valikumeetod on üles ehitatud “tagastamata palli” skeemi järgi: tõenäosus pääseda valimisse üldkogumi iga üksuse puhul suureneb valiku tegemisel.

Sõltuvalt valimipopulatsiooni moodustamise metoodikast eristatakse järgmisi peamisi: näidiste tüübid:

tegelikult juhuslik;

mehaaniline;

tüüpiline (kihistunud, tsoneeritud);

jada (pesastatud);

kombineeritud;

mitmeastmeline;

mitmefaasiline;

läbistavad.

Tegelik juhuslik valim on moodustatud rangelt kooskõlas teaduslike põhimõtete ja juhusliku valiku reeglitega. Õige juhusliku valimi saamiseks jagatakse üldkogum rangelt valimiüksusteks ning seejärel valitakse juhuslikus korduvas või mittekorduvas järjekorras piisav arv ühikuid.

Juhuslik järjekord on nagu loosimine. Praktikas kasutatakse seda kõige sagedamini juhuslike arvude spetsiaalsete tabelite kasutamisel. Kui näiteks 1587 ühikut sisaldavast populatsioonist tuleks valida 40 ühikut, siis tabelist valitakse 40 neljakohalist arvu, mis on väiksemad kui 1587.

Juhul, kui tegelik juhuslik valim on korraldatud korduvana, arvutatakse standardviga valemi (6.1) järgi. Mittekorduva proovivõtumeetodi korral on standardvea arvutamise valem järgmine:


kus 1- n/ N- üldkogumi valimisse mittekuuluvate üksuste osakaal. Kuna see osakaal on alati väiksem kui üks, on mittekorduva valiku viga, kui muud asjaolud on võrdsed, alati väiksem kui korduva valiku korral. Mittekorduvat valikut on lihtsam korraldada kui korduvat valikut ja seda kasutatakse palju sagedamini. Mittekorduva valimi võtmise standardvea väärtust saab aga määrata lihtsama valemi (5.1) abil. Selline asendus on võimalik, kui üldkogumi valimisse mittekuuluvate üksuste osakaal on suur ja seetõttu on väärtus ühele lähedane.

Valimi moodustamine rangelt juhusliku valiku reeglite järgi on praktiliselt väga keeruline ja mõnikord võimatu, kuna juhuslike arvude tabelite kasutamisel on vaja nummerdada kõik üldkogumi üksused. Üsna sageli on üldkogum nii suur, et sellist eeltööd on äärmiselt raske ja ebaotstarbekas teha, mistõttu praktikas kasutatakse teist tüüpi valimeid, millest igaüks ei ole rangelt juhuslik. Need on aga korraldatud nii, et oleks tagatud maksimaalne lähendus juhusliku valiku tingimustele.

Kui puhtalt mehaaniline proovivõtt kogu ühikute populatsioon tuleb esiteks esitada valikuühikute loeteluna, mis on koostatud uuritava tunnuse suhtes mingis neutraalses järjekorras, näiteks tähestikulises järjekorras. Seejärel jagatakse proovivõtuühikute loend nii paljudeks võrdseteks osadeks, kui on vaja ühikuid valida. Lisaks valitakse vastavalt eelnevalt kindlaksmääratud reeglile, mis ei ole seotud uuritava tunnuse varieerumisega, loendi igast osast üks ühik. Seda tüüpi valim ei pruugi alati anda juhuslikku valikut ja tulemuseks olev valim võib olla kallutatud. Seda seletatakse asjaoluga, et esiteks võib üldkogumi ühikute järjestamisel olla mittejuhusliku iseloomuga element. Teiseks võib valimi võtmine populatsiooni igast osast, kui päritolu on valesti kindlaks tehtud, põhjustada ka kallutamise vea. Mehhaanilist valimit on aga praktiliselt lihtsam korraldada kui korralikku juhuslikku ja seda tüüpi valimit kasutatakse kõige sagedamini valikuuringutes. Mehaanilise proovivõtu standardviga määratakse tegeliku juhusliku mittekorduva valimi võtmise valemiga (6.2).

Tüüpiline (tsoneeritud, kihistunud) valim on kaks eesmärki:

tagada üldkogumi vastavate tüüpiliste rühmade esindatus valimis vastavalt uurijat huvitavatele tunnustele;

suurendada valikuuringu tulemuste täpsust.

Tüüpilise valimi korral jagatakse üksuste üldkogum enne selle moodustamise algust tüüpilisteks rühmadeks. Sellisel juhul on väga oluline rühmitamisatribuudi õige valik. Valitud tüüpilised rühmad võivad sisaldada sama või erinevat arvu valikuühikuid. Esimesel juhul moodustatakse valimikogum igast rühmast ühesuguse valiku osakaaluga, teisel juhul proportsionaalse osakaaluga selle osakaaluga üldkogumis. Kui valim moodustatakse võrdse selektsiooni osakaaluga, on see sisuliselt võrdne mitmete korralikult juhuslike valimitega väiksematest populatsioonidest, millest igaüks on tüüpiline rühm. Igast rühmast valimine toimub juhuslikus (korduv või mittekorduv) või mehaanilises järjekorras. Tüüpilise valimiga, nii võrdse kui ka ebavõrdse valikuga, on võimalik kõrvaldada uuritava tunnuse rühmadevahelise variatsiooni mõju selle tulemuste täpsusele, kuna see tagab iga tüüpilise rühma kohustusliku esindatuse valimis. seatud. Valimi standardviga ei sõltu kogu dispersiooni suurusest? 2, ja rühmade dispersioonide keskmise väärtuse kohta?i 2 . Kuna rühmade dispersioonide keskmine on alati väiksem kui summaarne dispersioon, siis, kui muud asjaolud on võrdsed, on tüüpilise valimi standardviga väiksem kui juhusliku valimi enda standardviga.

Tüüpilise valimi standardvigade määramisel kasutatakse järgmisi valemeid:

Korduva valikuga

Mittekorduva valikumeetodiga:

on valimipopulatsiooni rühmade dispersioonide keskmine.

Jada (pesastatud) proovivõtt- see on valimi moodustamise tüüp, kui juhuslikult valitakse mitte uuritavad üksused, vaid üksuste rühmad (seeriad, pesad). Valitud seeria (pesade) piires vaadatakse läbi kõik üksused. Jadaproovide võtmist on praktiliselt lihtsam korraldada ja läbi viia kui üksikute üksuste valimist. Seda tüüpi valimi moodustamine ei taga aga esiteks iga seeria esindatust ja teiseks ei välista uuritava tunnuse seeriatevahelise variatsiooni mõju uuringutulemustele. Kui see erinevus on märkimisväärne, suurendab see juhuslikku esindusviga. Proovi tüübi valikul peab uurija seda asjaolu arvesse võtma. Jadaproovi võtmise standardviga määratakse valemitega:

Korduva valikumeetodiga -


kus on valimi üldkogumi seeriatevaheline dispersioon; r– valitud seeriate arv;

Mittekorduva valikumeetodiga -


kus R on seeriate arv üldkogumis.

Praktikas kasutatakse teatud valimi moodustamise meetodeid ja liike sõltuvalt valikuuringute eesmärgist ja eesmärkidest ning nende korraldamise ja läbiviimise võimalustest. Kõige sagedamini kasutatakse proovivõtumeetodite ja proovivõtuliikide kombinatsiooni. Selliseid proove nimetatakse kombineeritud. Kombineerimine on võimalik erinevates kombinatsioonides: mehaaniline ja jadavalim, tüüpiline ja mehaaniline, jada- ja tegelikult juhuslik jne. Kombineeritud valimit kasutatakse suurima esinduslikkuse tagamiseks madalaima tööjõu- ja rahakuluga uuringu korraldamisel ja läbiviimisel.

Kombineeritud valimi puhul koosneb valimi standardvea väärtus selle iga etapi vigadest ja seda saab määrata vastavate valimite vigade ruutude summa ruutjuurena. Seega, kui mehaanilist ja tüüpilist proovivõttu kasutati kombineeritud proovivõtuga, saab standardvea määrata valemiga


kus?1 ja? 2 on vastavalt mehaaniliste ja tüüpiliste näidiste standardvead.

Omapära mitmeastmeline valik seisneb selles, et valim moodustatakse järk-järgult, vastavalt valiku etappidele. Esimeses etapis valitakse esimese etapi ühikud eelnevalt kindlaksmääratud meetodi ja valikutüübi abil. Teises etapis valitakse igast valimisse kuuluvast esimese etapi ühikust teise etapi ühikud jne. Etappide arv võib olla rohkem kui kaks. Viimases etapis moodustatakse valim, mille üksuseid uuritakse. Näiteks leibkondade eelarvete valimuuringuks valitakse esimeses etapis riigi territoriaalsed subjektid, teises etapis valitud piirkondades ringkonnad, kolmandas etapis valitakse igas omavalitsuses ettevõtted või organisatsioonid. ja lõpuks, neljandas etapis, valitakse valitud ettevõtetes perekonnad.

Seega moodustatakse proovivõtukomplekt viimases etapis. Mitmeastmeline valim on paindlikum kui muud tüüpi, kuigi üldiselt annab see vähem täpseid tulemusi kui sama suurusega üheastmeline valim. Samas on sellel aga üks oluline eelis, milleks on see, et mitmeastmelise valiku puhul tuleb valimivõtu raam igas etapis ehitada ainult nende üksuste jaoks, mis on valimis, ja see on väga oluline, kuna sageli puudub valmis proovivõturaam.

Valimi võtmise standardviga mitmeastmelise valiku puhul erineva mahuga rühmadega määratakse valemiga


kus?1,?2,?3 , ... on standardvead erinevates etappides;

n1, n2, n3 , .. . on proovide arv vastavates valikuetappides.

Juhul, kui rühmad ei ole mahult samad, ei saa teoreetiliselt seda valemit kasutada. Kuid kui valiku koguproportsioon kõigil etappidel on konstantne, ei too selle valemi järgi arvutamine praktikas kaasa vea moonutamist.

Essents mitmefaasiline proovivõtt seisneb selles, et algselt moodustatud valimikomplekti põhjal moodustatakse alamvalim, sellest alamvalim, järgmine alamvalim jne. Algne valimikomplekt on esimene faas, sellest pärit alamvalim on teine ​​jne. on soovitatav kasutada mitmefaasilist proovivõttu juhtudel, kui:

erinevate tunnuste uurimiseks on vajalik ebavõrdne valimi suurus;

uuritavate märkide kõikumine ei ole sama ja nõutav täpsus on erinev;

kõigi esialgse valimi (esimese faasi) üksuste kohta tuleks koguda vähem üksikasjalikku teavet ja iga järgmise etapi ühikute kohta üksikasjalikumat teavet.

Mitmefaasilise diskreetimise üheks vaieldamatuks eeliseks on asjaolu, et esimeses faasis saadud teavet saab kasutada täiendava teabena järgmistes faasides, teise faasi teavet saab kasutada täiendava teabena järgmistes faasides jne. teabe kasutamine suurendab valikuuringu tulemuste täpsust.

Mitmefaasilise proovivõtu korraldamisel saab kasutada erinevate meetodite ja valikutüüpide kombinatsiooni (tüüpiline proovivõtt mehaanilise proovivõtuga jne). Mitmefaasilist valikut saab kombineerida mitmeastmelisega. Igas etapis võib proovivõtt olla mitmefaasiline.

Mitmefaasilise valimi standardviga arvutatakse iga faasi jaoks eraldi vastavalt valimismeetodi ja valimi tüübi valemitele, mille abil selle valim moodustati.

Läbivad valikud- need on kaks või enam sõltumatut valimit samast üldkogumist, mis on moodustatud sama meetodi ja tüübi järgi. Soovitatav on kasutada läbivaid valimeid, kui on vaja lühikese aja jooksul saada esialgsed valikuuringu tulemused. Läbivad valimid on tõhusad uuringutulemuste hindamiseks. Kui sõltumatutes valimites on tulemused samad, siis see näitab valikuuringu andmete usaldusväärsust. Läbivaid proove saab mõnikord kasutada erinevate teadlaste töö testimiseks, lastes igal teadlasel läbi viia erineva valikuuringu.

Läbivate proovide standardviga määratakse sama valemiga nagu tüüpiline proportsionaalne valim (5.3). Läbivad valimid nõuavad rohkem tööjõudu ja raha kui muud liigid, seega peab uurija seda valimuuringu kavandamisel arvestama.

Erinevate valikumeetodite ja proovivõtutüüpide piirvead määratakse valemiga? = t?, kus? on vastav standardviga.

Hästi läbimõeldud uuringu üks põhikomponente on valimi ja esindusliku valimi määratlemine. See on nagu koogi näide. Selle maitse mõistmiseks pole ju vaja tervet magustoitu ära süüa? Piisab väikesest osast.

Niisiis, kook on elanikkonnast (st kõik vastajad, kes kvalifitseeruvad küsitlusele). Seda saab väljendada territoriaalselt, näiteks ainult Moskva piirkonna elanikud. Sugu - ainult naised. Või on vanusepiirangud – venelased on üle 65 aasta vanad.

Rahvaarvu arvutamine on keeruline: teil peavad olema andmed rahvaloenduse või esialgsete hindamisuuringute andmetest. Seetõttu "hinnatakse" tavaliselt üldpopulatsiooni ja arvutatakse saadud arvu põhjal proovivõtu raam või proovide võtmine.

Mis on esinduslik valim?

Näidis on täpselt määratletud vastajate arv. Selle struktuur peaks valiku põhiomaduste poolest võimalikult palju ühtima üldpopulatsiooni struktuuriga.

Näiteks kui potentsiaalseteks vastajateks on kogu Venemaa elanikkond, kus 54% on naised ja 46% mehed, siis peaks valim sisaldama täpselt sama protsenti. Kui parameetrid ühtivad, võib valimit nimetada esinduslikuks. See tähendab, et ebatäpsused ja vead uuringus on viidud miinimumini.

Valimi suurus määratakse täpsuse ja ökonoomsuse nõudeid arvestades. Need nõuded on üksteisega pöördvõrdelised: mida suurem on valimi suurus, seda täpsem on tulemus. Veelgi enam, mida suurem on täpsus, seda rohkem on uuringu jaoks vaja ka kulutusi. Ja vastupidi, mida väiksem on valim, seda vähem see maksab, seda ebatäpsemalt ja juhuslikumalt reprodutseeritakse üldkogumi omadused.

Seetõttu leiutasid sotsioloogid valiku hulga arvutamiseks valemi ja lõid spetsiaalne kalkulaator:

Usalduse tõenäosus ja usaldusviga

Mida tähendavad tingimused " usalduse tase" ja " usaldusviga"? Usaldusväärsuse tase on mõõtmiste täpsuse mõõt. Usaldusviga on võimalik viga uuringu tulemustes. Näiteks üldpopulatsiooniga üle 500 00 inimese (elavad näiteks Novokuznetskis) on valimis 384 inimest usaldustasemega 95% ja veaga 5% VÕI (usaldusvahemikuga 95 ± 5%).

Mis sellest järeldub? Sellise valimiga (384 inimest) 100 uuringut tehes jäävad 95 protsendil juhtudest saadud vastused statistika seaduspärasuste järgi ± 5% piiresse esialgsest. Ja me saame representatiivse valimi minimaalse statistilise vea tõenäosusega.

Kui valimi suuruse arvutamine on tehtud, näete küsimustiku paneeli demoversioonis, kas vastajaid on piisavalt. Saate lisateavet paneelküsitluse läbiviimise kohta.

Plaan:

1. Matemaatilise statistika probleemid.

2. Näidiste tüübid.

3. Valikumeetodid.

4. Valimi statistiline jaotus.

5. Empiiriline jaotusfunktsioon.

6. Hulknurk ja histogramm.

7. Variatsioonirea numbrilised karakteristikud.

8. Jaotusparameetrite statistilised hinnangud.

9. Jaotusparameetrite intervallhinnangud.

1. Matemaatilise statistika ülesanded ja meetodid

Matemaatika statistika on matemaatika haru, mis on pühendatud statistiliste vaatlusandmete kogumise, analüüsimise ja töötlemise meetoditele teaduslikel ja praktilistel eesmärkidel.

Olgu nõutud homogeensete objektide komplekti uurimine mõne neid objekte iseloomustava kvalitatiivse või kvantitatiivse tunnuse suhtes. Näiteks kui osade partii on olemas, võib osa standard olla kvalitatiivse märgina ja osa kontrollitud suurus võib olla kvantitatiivne.

Mõnikord viiakse läbi pidev uuring, s.o. uurige iga objekti soovitud tunnuse suhtes. Praktikas kasutatakse kõikehõlmavat uuringut harva. Näiteks kui populatsioonis on väga palju objekte, siis on pideva uuringu läbiviimine füüsiliselt võimatu. Kui objekti mõõdistamine on seotud selle hävimisega või nõuab suuri materiaalseid kulutusi, siis pole täielikku uuringut mõtet teha. Sellistel juhtudel valitakse kogu populatsioonist juhuslikult piiratud arv objekte (proovikomplekt) ja neid uuritakse.

Matemaatilise statistika põhiülesanne on kogu populatsiooni uurimine näidisandmete põhjal olenevalt eesmärgist, s.o. populatsiooni tõenäosuslike omaduste uurimine: jaotusseadus, arvtunnused jne. juhtimisotsuste tegemiseks ebakindluse tingimustes.

2. Näidiste tüübid

Rahvaarv on objektide kogum, millest proov tehakse.

Valimi populatsioon (valim) on juhuslikult valitud objektide kogum.

Rahvastiku suurus on selles kogus olevate objektide arv. Tähistatakse üldrahvastiku mahtu N, valikuline - n.

Näide:

Kui 1000 osast valitakse uurimiseks 100 osa, siis üldkogumi maht N = 1000 ja valimi suurus n = 100.

Valimit saab teha kahel viisil: pärast objekti valimist ja selle üle vaatlemist saab selle üldkogumisse tagastada või mitte tagastada. See. Proovid jagunevad korduvateks ja mittekorduvateks.

Korduvhelistas proovide võtmine, kus valitud objekt (enne järgmise valimist) tagastatakse üldkogumisse.

Mittekorduvhelistas proovide võtmine, mille puhul valitud objekti üldkogumisse ei tagastata.

Praktikas kasutatakse tavaliselt mittekorduvat juhuslikku valikut.

Et valimi andmed saaksid piisava kindlusega otsustada huvipakkuva tunnuse kohta üldkogumis, on vajalik, et valimi objektid seda õigesti esindaksid. Valim peab õigesti esindama üldkogumi proportsioone. Näidis peab olema esindaja (esindaja).

Suurte arvude seaduse alusel võib väita, et valim on representatiivne, kui see tehakse juhuslikult.

Kui üldkogumi suurus on piisavalt suur ja valim moodustab sellest populatsioonist vaid ebaolulise osa, siis korduvate ja mittekordavate valimite vaheline erinevus kustutatakse; piiraval juhul, kui arvestada lõpmatu üldkogumiga ja valimi suurus on piiratud, kaob see erinevus.

Näide:

Ameerika ajakirjas Literary Review uuriti statistiliste meetoditega 1936. aastal eelseisvate USA presidendivalimiste tulemuste prognooside kohta. Sellele ametikohale kandideerisid F.D. Roosevelt ja A. M. Landon. Uuritud ameeriklaste üldrahvastiku allikaks võeti telefoniabonentide teatmeteosed. Nendest valiti juhuslikult välja 4 miljonit aadressi, millele ajakirja toimetus saatis postkaardid, milles palus avaldada oma suhtumist presidendikandidaatidesse. Pärast küsitluse tulemuste töötlemist avaldas ajakiri sotsioloogilise prognoosi, et Landon võidab eelseisvad valimised suure ülekaaluga. Ja ... ma eksisin: Roosevelt võitis.
Seda näidet võib vaadelda kui mitteesindusliku valimi näidet. Fakt on see, et kahekümnenda sajandi esimesel poolel oli USA-s telefone ainult jõukal osa elanikkonnast, kes toetas Landoni seisukohti.

3. Valikumeetodid

Praktikas kasutatakse erinevaid valikumeetodeid, mida saab jagada kahte tüüpi:

1. Valimine ei nõua üldkogumi jagamist osadeks (a) lihtne juhuslik, ei kordu; b) lihtne juhuslik kordus).

2. Valik, milles üldkogum jagatakse osadeks. (a) tüüpiline valik; b) mehaaniline valik; sisse) sari valik).

Lihtne juhuslik helista sellele valik, milles objektid eraldatakse ükshaaval kogu üldkogumikust (juhuslikult).

Tüüpilinehelistas valik, kus objektid ei ole valitud mitte kogu üldpopulatsioonist, vaid igast selle "tüüpilisest" osast. Näiteks kui detail on valmistatud mitmel masinal, siis ei tehta valik mitte kõigi masinate toodetud detailide kogu komplekti, vaid iga masina toodete järgi eraldi. Sellist valikut kasutatakse siis, kui uuritav tunnus kõigub märgatavalt üldpopulatsiooni erinevates "tüüpilistes" osades.

Mehaanilinehelistas valik, milles üldkogum jagatakse "mehaaniliselt" nii mitmeks rühmaks, kui palju on valimisse kaasatavaid objekte, ja igast rühmast valitakse üks objekt. Näiteks kui on vaja valida 20% masina valmistatud detailidest, siis valitakse iga 5. osa; kui on vaja valida 5% osadest - iga 20 jne. Mõnikord ei pruugi selline valik tagada esinduslikku valimit (kui valitakse iga 20. pöörlev rull ja lõikur vahetatakse kohe pärast valikut, siis valitakse kõik nüri lõikuritega treitud rullid).

Sarihelistas valik, milles ei valita üldkogumikust objekte ükshaaval, vaid “seeriatena”, mida pidevalt uuritakse. Näiteks kui tooteid valmistab suur grupp automaate, siis ainult mõne masina tooteid kontrollitakse pidevalt.

Praktikas kasutatakse sageli kombineeritud valikut, milles kombineeritakse ülaltoodud meetodeid.

4. Valimi statistiline jaotus

Võetakse valim üldkogumist ja väärtus x 1-vaadatud üks kord, x 2 -n 2 korda, ... x k - n k korda. n= n 1 +n 2 +...+n k on valimi suurus. Vaadeldud väärtusedhelistas valikuid ja jada on tõusvas järjekorras kirjutatud variant - variatsiooniline seeria. Vaatluste arvhelistas sagedused (absoluutsagedused) ja nende seos valimi suurusega- suhtelised sagedused või statistilised tõenäosused.

Kui valikute arv on suur või valim moodustatakse pidevast üldkogumist, siis variatsioonirea koostatakse mitte üksikute punktiväärtuste, vaid üldkogumi väärtuste intervallide järgi. Sellist sarja nimetatakse intervall. Intervallide pikkused peavad olema võrdsed.

Valimi statistiline jaotus nimetatakse valikute ja nende vastavate sageduste või suhteliste sageduste loendiks.

Statistilise jaotuse saab määrata ka intervallide ja nende vastavate sageduste jadana (sellesse väärtuste intervalli kuuluvate sageduste summa)

Sageduste punktivariatsiooni seeriat saab esitada tabelina:

x i
x 1
x2

x k
n i
n 1
n 2

nk

Samamoodi võib kujutada suhteliste sageduste punktivariatsioonirida.

Ja:

Näide:

Mõne teksti X tähtede arv osutus võrdseks 1000. Esimene täht oli "i", teine ​​- täht "i", kolmas - täht "a", neljas - "u". Siis tulid tähed "o", "e", "y", "e", "s".

Paneme kirja kohad, mille nad tähestikus asuvad, meil on vastavalt: 33, 10, 1, 32, 16, 6, 21, 31, 29.

Pärast nende numbrite järjestamist kasvavas järjekorras saame variatsiooniseeria: 1, 6, 10, 16, 21, 29, 31, 32, 33.

Tähtede ilmumise sagedused tekstis: "a" - 75, "e" -87, "i" - 75, "o" - 110, "y" - 25, "s" - 8, "e" - 3, "yu" - 7," I "- 22.

Koostame sageduste punktivariatsioonirea:

Näide:

Määratud helitugevuse diskreetimissageduse jaotus n = 20.

Koostage suhteliste sageduste punktivariatsiooni seeria.

x i

2

6

12

n i

3

10

7

Otsus:

Leidke suhtelised sagedused:


x i

2

6

12

w i

0,15

0,5

0,35

Intervalljaotuse koostamisel kehtivad reeglid intervallide arvu või iga intervalli suuruse valimiseks. Siin on kriteeriumiks optimaalne suhe: intervallide arvu suurenemisega paraneb esinduslikkus, kuid suureneb andmete hulk ja nende töötlemise aeg. Erinevus x max - x min suurima ja väikseima väärtuse vahel nimetatakse varianti suures plaanis proovid.

Intervallide arvu loendamiseks k tavaliselt rakendage Sturgessi empiirilist valemit (see tähendab ümardamist lähima sobiva täisarvuni): k = 1 + 3,322 log n .

Vastavalt sellele iga intervalli väärtus h saab arvutada valemi abil:

5. Empiiriline jaotusfunktsioon

Mõelge mõnele valimile üldkogumikust. Olgu teada kvantitatiivse tunnuse X sageduste statistiline jaotus Tutvustame tähistust: n xon nende vaatluste arv, mille puhul täheldati x-st väiksemat tunnuse väärtust; n on vaatluste koguarv (valimi suurus). Suhteline sündmuste sagedus X<х равна n x /n . Kui x muutub, siis muutub ka suhteline sagedus, s.t. suhteline sagedusn x /non x-i funktsioon. Sest see leitakse empiiriliselt, seda nimetatakse empiiriliseks.

Empiiriline jaotusfunktsioon (valimi jaotusfunktsioon) helistage funktsioonile, mis määrab iga x jaoks sündmuse X suhtelise sageduse<х.


kus on valikute arv väiksem kui x,

n - valimi suurus.

Erinevalt valimi empiirilisest jaotusfunktsioonist nimetatakse üldkogumi jaotusfunktsiooni F(x). teoreetiline jaotusfunktsioon.

Empiirilise ja teoreetilise jaotusfunktsiooni erinevus seisneb selles, et teoreetiline funktsioon F (x) määrab sündmuse X tõenäosuse F*(x) kaldub tõenäosusega selle sündmuse tõenäosusele F (x). See tähendab, et suurte n F*(x) ja F(x) erinevad üksteisest vähe.

See. üldkogumi teoreetilise (integraalse) jaotusfunktsiooni ligikaudseks esitamiseks on soovitatav kasutada valimi empiirilist jaotusfunktsiooni.

F*(x) omab kõiki omadusi F(x).

1. Väärtused F*(x) kuuluvad intervalli.

2. F*(x) on mittekahanev funktsioon.

3. Kui on väikseim variant, siis F*(x) = 0, x juures < x1; kui x k on suurim variant, siis F*(x) = 1, kui x > x k .

Need. F*(x) kasutatakse F(x) hindamiseks.

Kui valim on antud variatsioonireaga, on empiirilise funktsiooni vorm:

Empiirilise funktsiooni graafikut nimetatakse kumulatiivseks.

Näide:

Joonistage empiiriline funktsioon antud valimijaotuse kohale.


Otsus:

Valimi suurus n = 12 + 18 +30 = 60. Väikseim variant on 2, s.o. x juures < 2. Sündmus X<6, (x 1 = 2) наблюдалось 12 раз, т.е. F*(x)=12/60=0,2 kell 2 < x < 6. Sündmus X<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < x < 10. Sest x=10 on siis suurim valik F*(x) = 1 x>10 juures. Soovitaval empiirilisel funktsioonil on vorm:

Kumuleeri:


Kumulaat võimaldab mõista graafiliselt esitatud teavet, näiteks vastata küsimustele: „Määrake nende vaatluste arv, mille puhul atribuudi väärtus oli väiksem kui 6 või mitte vähem kui 6. F*(6) = 0,2 » Siis on nende vaatluste arv, mille puhul vaadeldava tunnuse väärtus oli väiksem kui 6, 0,2* n \u003d 0,2 * 60 \u003d 12. Vaatluste arv, mille puhul vaadeldava tunnuse väärtus ei olnud väiksem kui 6, on (1-0,2) * n = 0,8 * 60 \u003d 48.

Kui on antud intervallide variatsiooniseeria, siis empiirilise jaotusfunktsiooni koostamiseks leitakse intervallide keskpunktid ja neist saadakse sarnaselt punktivariatsioonireaga empiiriline jaotusfunktsioon.

6. Hulknurk ja histogramm

Selguse huvides on koostatud erinevad statistilise jaotuse graafikud: polünoom ja histogrammid

sageduse hulknurk- see on katkendjoon, mille lõigud ühendavad punkte ( x 1 ;n 1 ), ( x 2 ;n 2 ),…, ( x k ; n k ), kus on valikud, on neile vastavad sagedused.

Suhteliste sageduste hulknurk - see on katkendjoon, mille lõigud ühendavad punkte ( x 1 ;w 1 ), (x 2 ;w 2 ),…, ( x k ;w k ), kus x i on valikud, w i on neile vastavad suhtelised sagedused.

Näide:

Joonistage suhtelise sageduse polünoom antud valimijaotuse kohal:

Otsus:

Pideva tunnuse puhul on soovitav koostada histogramm, mille puhul jaotatakse tunnuse kõiki vaadeldud väärtusi sisaldav intervall mitmeks osaintervalliks pikkusega h ja iga osaintervalli kohta leitakse n i. - i-ndasse intervalli kuuluvate variantide sageduste summa. (Näiteks inimese pikkuse või kaalu mõõtmisel on tegu pideva märgiga).

Sageduse histogramm- see on astmeline kujund, mis koosneb ristkülikutest, mille alused on osalised pikkusega h intervallid ja kõrgused on võrdsed suhtega (sagedustihedus).

Ruut i-s osaristkülik võrdub i-nda intervalli variandi sageduste summaga, s.o. sagedushistogrammi pindala on võrdne kõigi sageduste summaga, st. näidissuurus.

Näide:

Antakse elektrivõrgu pinge muutumise tulemused (voltides). Koostage variatsiooniseeria, koostage hulknurk ja sagedushistogramm, kui pinge väärtused on järgmised: 227, 215, 230, 232, 223, 220, 228, 222, 221, 226, 226, 215, 218, 222 216, 220, 225, 212, 217, 220.

Otsus:

Loome rea variatsioone. Meil on n = 20, x min = 212, x max = 232.

Kasutame intervallide arvu arvutamiseks Sturgessi valemit.

Sageduste intervallide variatsiooniseeria on järgmine:


Sagedus Tihedus

212-21 6

0,75

21 6-22 0

0,75

220-224

1,75

224-228

228-232

0,75

Koostame sageduste histogrammi:

Koostame sageduste hulknurga, leides esmalt intervallide keskpunktid:


Suhteliste sageduste histogramm nimetada astmelist kujundit, mis koosneb ristkülikutest, mille alused on osalised pikkusega h intervallid ja kõrgused on võrdsed suhtega w i/h (suhteline sagedustihedus).

Ruut I-s osaline ristkülik võrdub i-ndasse intervalli langenud variandi suhtelise sagedusega. Need. suhteliste sageduste histogrammi pindala on võrdne kõigi suhteliste sageduste summaga, st. üksus.

7. Variatsioonirea numbrilised karakteristikud

Mõelge üld- ja näidispopulatsioonide põhiomadustele.

Üldine sekundaarne nimetatakse üldkogumi tunnuse väärtuste aritmeetiliseks keskmiseks.

Erinevate väärtuste jaoks x 1 , x 2 , x 3 , …, x n . N-mahu üldpopulatsiooni märk on meil:

Kui atribuudi väärtustel on vastavad sagedused N 1 +N 2 +…+N k =N , siis


näidis keskmine nimetatakse valimi üldkogumi tunnuse väärtuste aritmeetiliseks keskmiseks.

Kui atribuudi väärtustel on vastavad sagedused n 1 +n 2 +…+n k = n, siis


Näide:

Arvutage valimi valimi keskmine: x 1 = 51,12; x 2 = 51,07 x 3 = 52,95; x 4 = 52,93, x 5 = 51,1, x 6 = 52,98; x 7 \u003d 52,29; x 8 \u003d 51,23; x 9 \u003d 51,07; x10 = 51,04.

Otsus:

Üldine dispersioon nimetatakse üldpopulatsiooni tunnuse X väärtuste ruutude kõrvalekallete aritmeetiliseks keskmiseks üldkeskmisest.

N ruumala populatsiooni märgi erinevate väärtuste x 1 , x 2 , x 3 , …, x N jaoks on meil:

Kui atribuudi väärtustel on vastavad sagedused N 1 +N 2 +…+N k =N , siis

Üldine standardhälve (standard) nimetatakse ülddispersiooni ruutjuureks

Valimi dispersioon nimetatakse tunnuse vaadeldud väärtuste keskväärtusest kõrvalekallete ruudu aritmeetiliseks keskmiseks.

Mahu n valimipopulatsiooni märgi erinevate väärtuste x 1 , x 2 , x 3 , ..., x n jaoks on meil:


Kui atribuudi väärtustel on vastavad sagedused n 1 +n 2 +…+n k = n, siis


Proovi standardhälve (standard) nimetatakse valimi dispersiooni ruutjuureks.


Näide:

Valimikomplekti annab jaotustabel. Leidke valimi dispersioon.


Otsus:

Teoreem: Dispersioon on võrdne tunnuste väärtuste ruutude keskmise ja kogukeskmise ruudu vahega.

Näide:

Leidke selle jaotuse dispersioon.



Otsus:

8. Jaotusparameetrite statistilised hinnangud

Olgu üldkogumit uuritud mõne valimiga. Sel juhul on võimalik saada ainult ligikaudne tundmatu parameetri Q väärtus, mis toimib selle hinnanguna. On ilmne, et hinnangud võivad valimiti erineda.

Statistiline hindamineK* teoreetilise jaotuse tundmatut parameetrit nimetatakse funktsiooniks f, mis sõltub valimi vaadeldud väärtustest. Valimi tundmatute parameetrite statistilise hindamise ülesanne on koostada statistiliste vaatluste olemasolevate andmete põhjal selline funktsioon, mis annaks nende parameetrite tegelike, uurijale tundmatute väärtuste kõige täpsemad ligikaudsed väärtused.

Statistilised hinnangud jagunevad punktideks ja intervallideks, olenevalt nende esitamise viisist (arv või intervall).

Punkthinnangut nimetatakse statistiliseks hinnanguks. parameetri Q ühe väärtusega määratud teoreetilise jaotuse parameeter Q *=f (x 1 , x 2 , ..., x n), kusx 1, x 2, ...,xn- teatud valimi kvantitatiivse tunnuse X empiiriliste vaatluste tulemused.

Sellised erinevatest valimitest saadud parameetrite hinnangud erinevad enamasti üksteisest. Absoluutset erinevust /Q *-Q / nimetatakse valimi võtmise viga (hinnang).

Selleks, et statistilised hinnangud annaksid hinnanguliste parameetrite kohta usaldusväärseid tulemusi, peavad need olema erapooletud, tõhusad ja järjepidevad.

Punktide hinnang, mille matemaatiline ootus on võrdne (mitte võrdne) hinnangulise parameetriga, kutsutakse nihutamata (nihutatud). M(Q*)=Q.

Erinevus M( Q *)-Q nimetatakse eelarvamus või süstemaatiline viga. Erapooletute hinnangute korral on süstemaatiline viga 0.

tõhus hindamine Q *, mis antud valimi suuruse n korral on väikseima võimaliku dispersiooniga: D min(n = konst ). Efektiivsel hindajal on võrreldes teiste erapooletute ja järjepidevate hinnangutega väikseim erinevus.

Jõukasnimetatakse selliseks statistikaks hindamine Q *, mis n jaokskaldub tõenäoliselt hinnangulisele parameetrile K , st. koos valimi suuruse suurenemisega n hinnang kaldub tõenäoliselt parameetri tegelikule väärtusele K.

Järjepidevuse nõue on kooskõlas suurte arvude seadusega: mida rohkem esialgset teavet uuritava objekti kohta, seda täpsem on tulemus. Kui valimi suurus on väike, võib parameetri punkthinnang põhjustada tõsiseid vigu.

Ükskõik milline näidis (mahtn) võib pidada tellitud komplektiksx 1, x 2, ...,xn sõltumatud identselt jaotatud juhuslikud muutujad.

Proovivahendid erinevate mahuproovide jaoks n samast populatsioonist on erinev. See tähendab, et valimi keskmist võib pidada juhuslikuks muutujaks, mis tähendab, et saame rääkida valimi keskmise jaotusest ja selle arvulistest karakteristikutest.

Valimi keskmine vastab kõigile statistiliste hinnangute nõuetele, s.o. annab erapooletu, tõhusa ja järjepideva hinnangu elanikkonna keskmisele.

Seda saab tõestada. Seega on valimi dispersioon üldise dispersiooni kallutatud hinnang, mis annab sellele alahinnatud väärtuse. See tähendab, et väikese valimi korral annab see süstemaatilise vea. Erapooletu ja järjekindla hinnangu saamiseks piisab koguse võtmisest, mida nimetatakse korrigeeritud dispersiooniks. st.

Praktikas kasutatakse üldise dispersiooni hindamiseks korrigeeritud dispersiooni, kui n < 30. Muudel juhtudel ( n >30) kõrvalekalle vaevalt märgatav. Seega suurte väärtuste puhul n kallutatuse viga võib tähelepanuta jätta.

Võib ka tõestada, et suhteline sagedusn i / n on erapooletu ja järjepidev tõenäosushinnang P(X=x i ). Empiiriline jaotusfunktsioon F*(x ) on teoreetilise jaotusfunktsiooni erapooletu ja järjepidev hinnang F(x)=P(X< x ).

Näide:

Leidke näidistabelist keskmise ja dispersiooni erapooletud hinnangud.

x i
n i

Otsus:

Proovi suurus n=20.

Matemaatilise ootuse erapooletu hinnang on valimi keskmine.


Dispersiooni erapooletu hinnangu arvutamiseks leiame esmalt valimi dispersiooni:

Nüüd leiame erapooletu hinnangu:

9. Jaotusparameetrite intervallhinnangud

Intervall on statistiline hinnang, mille määravad kaks arvväärtust - uuritava intervalli lõpp.

Number> 0, kus | Q - Q*|< , iseloomustab intervallhinnangu täpsust.

Usaldusväärnehelistas intervall , mis etteantud tõenäosusegahõlmab tundmatut parameetri väärtust K . Usaldusvahemiku täiendamine kõigi võimalike parameetriväärtuste komplektiga K helistas kriitiline piirkond. Kui kriitiline piirkond asub ainult ühel pool usaldusvahemikku, siis kutsutakse usaldusvahemikku ühepoolne: vasakpoolne, kui kriitiline piirkond eksisteerib ainult vasakul ja paremakäeline välja arvatud juhul, kui paremal. Vastasel juhul nimetatakse usaldusvahemikku kahepoolsed.

usaldusväärsus ehk usaldustase, Q hinnangud (kasutades Q *) nimeta tõenäosus, millega on täidetud järgmine võrratus: | Q - Q*|< .

Kõige sagedamini määratakse usaldustõenäosus ette (0,95; 0,99; 0,999) ja sellele seatakse nõue, et see peab olema ühele lähedane.

Tõenäosushelistas vea tõenäosus või olulisuse tase.

Laske | Q - Q*|< , siis. See tähendab, et suure tõenäosusegavõib väita, et parameetri tegelik väärtus K kuulub intervalli. Mida väiksem on kõrvalekalle, seda täpsem on hinnang.

Usaldusvahemiku piirid (lõpud) nimetatakse usalduspiirid või kriitilised piirid.

Usaldusvahemiku piiride väärtused sõltuvad parameetri jaotusseadusest Q*.

Hälbe väärtusnimetatakse poole usaldusvahemiku laiusest hindamise täpsus.

Usaldusvahemike konstrueerimise meetodid töötas esmakordselt välja Ameerika statistik Y. Neumann. Hinnangu täpsus, usalduse tõenäosus ja valimi suurus n omavahel seotud. Seetõttu, teades kahe koguse konkreetseid väärtusi, saate alati arvutada kolmanda.

Usaldusvahemiku leidmine normaaljaotuse matemaatilise ootuse hindamiseks, kui standardhälve on teada.

Tehke valim üldkogumikust, järgides normaaljaotuse seadust. Olgu üldine standardhälve teada, kuid teoreetilise jaotuse matemaatiline ootus pole teada a ().

Kehtib järgmine valem:

Need. vastavalt määratud hälbe väärtuseleon võimalik leida, millise tõenäosusega kuulub intervalli tundmatu üldkeskmine. Ja vastupidi. Valemist on näha, et valimi suuruse suurenemise ja usaldustõenäosuse fikseeritud väärtuse korral muutub väärtus- väheneb, s.o. hinnangu täpsus suureneb. Usaldusväärsuse (usaldustõenäosuse) suurenemisega väärtus-tõuseb, s.o. hinnangu täpsus väheneb.

Näide:

Testide tulemusena saadi järgmised väärtused -25, 34, -20, 10, 21. On teada, et need järgivad normaaljaotuse seadust standardhälbega 2. Leidke hinnang a * jaoks matemaatiline ootus a. Joonistage selle jaoks 90% usaldusvahemik.

Otsus:

Leiame erapooletu hinnangu

Siis


A usaldusintervall on kujul: 4–1,47< a< 4+ 1,47 или 2,53 < a < 5, 47

Usaldusvahemiku leidmine normaaljaotuse matemaatilise ootuse hindamiseks, kui standardhälve on teadmata.

Olgu teada, et üldkogumile kehtib normaaljaotuse seadus, kus a ja. Usaldusvahemiku katmise täpsus ja usaldusväärsusparameetri a tegelik väärtus arvutatakse sel juhul järgmise valemiga:

, kus n on valimi suurus, , - Studenti koefitsient (see tuleb leida etteantud väärtustest n ja tabelist "Studentide jaotuse kriitilised punktid").

Näide:

Testide tulemusena saadi järgmised väärtused -35, -32, -26, -35, -30, -17. On teada, et nad järgivad normaaljaotuse seadust. Leidke üldkogumi keskmise a usaldusvahemik usaldustasemega 0,9.

Otsus:

Leiame erapooletu hinnangu.

Otsime üles.

Siis

Usaldusvahemik võtab kuju(-29,2 - 5,62; -29,2 + 5,62) või (-34,82; -23,58).

Normaaljaotuse dispersiooni ja standardhälbe usaldusvahemiku leidmine

Olgu mingist tavaseaduse kohaselt jaotatud üldisest väärtuste komplektist võetud juhuslik ruumalavalimn < 30, mille puhul arvutatakse valimi dispersioon: kallutatudja parandatud s 2. Seejärel leidke antud usaldusväärsusega intervallhinnangudüldiseks hajutamiseksDüldine standardhälvekasutatakse järgmisi valemeid.


või,

Väärtused- leidke kriitiliste punktide väärtuste tabeli abilPearsoni jaotused.

Dispersiooni usaldusvahemik leitakse nende ebavõrdsuste põhjal, ruudustades kõik võrratuse osad.

Näide:

Kontrolliti 15 poldi kvaliteeti. Eeldusel, et nende valmistamise viga allub normaaljaotuse seadusele ja valimi standardhälbelevõrdne 5 mm, määrake usaldusväärselttundmatu parameetri usaldusvahemik

Intervalli piirid esitame topeltvõrratusena:

Dispersiooni kahepoolse usaldusvahemiku otsad saab määrata ilma aritmeetilisi tehteid tegemata antud usaldustaseme ja valimi suuruse jaoks, kasutades vastavat tabelit (Usaldusvahemike piirid dispersioonile sõltuvalt vabadusastmete arvust ja usaldusväärsusest ). Selleks korrutatakse tabelist saadud intervalli otsad korrigeeritud dispersiooniga s 2.

Näide:

Lahendame eelmise probleemi teistmoodi.

Otsus:

Leiame parandatud dispersiooni:

Vastavalt tabelile "Usaldusvahemike piirid dispersioonile sõltuvalt vabadusastmete arvust ja usaldusväärsusest" leiame dispersiooni usaldusvahemiku piiridk=14 ja: alumine piir 0,513 ja ülemine piir 2,354.

Korrutage saadud piirid arvugas 2 ja eraldage juur (kuna me vajame usaldusvahemikku mitte dispersiooni, vaid standardhälbe jaoks).

Nagu näidetest näha, sõltub usaldusvahemiku väärtus selle konstrueerimise meetodist ja annab lähedased, kuid erinevad tulemused.

Piisavalt suurte proovide puhul (n>30) üldise standardhälbe usaldusvahemiku piirid saab määrata valemiga: - mingi number, mis on tabelina toodud ja toodud vastavas viitetabelis.

kui 1- q<1, то формула имеет вид:

Näide:

Lahendame eelmise ülesande kolmandal viisil.

Otsus:

Varem leituds= 5,17. q(0,95; 15) = 0,46 - leiame tabeli järgi.

Seejärel:

Valikuline vaatlus kehtib pideva vaatluse rakendamisel füüsiliselt võimatu suure andmemahu tõttu või majanduslikult ebaotstarbekas. Füüsiline võimatus ilmneb näiteks reisijatevoogude, turuhindade, pereeelarvete uurimisel. Majanduslik ebaotstarbekus ilmneb nende hävitamisega seotud kaupade kvaliteedi hindamisel, näiteks maitsmisel, telliste tugevuse kontrollimisel jne.

Vaatluseks valitud statistilised ühikud on proovivõtu raam või proovide võtmine ja kogu nende massiiv - üldine elanikkond(GS). Kus ühikute arv valimis määrama n ja kogu HS-is - N. Suhtumine n/n helistas suhteline suurus või näidisosa.

Proovivõtutulemuste kvaliteet sõltub valimi esinduslikkus st selle kohta, kui esinduslik see HS-is on. Valimi esinduslikkuse tagamiseks on vaja jälgida ühikute juhusliku valiku põhimõte, mis eeldab, et HS-ühiku valimisse kaasamist ei saa mõjutada ükski muu tegur peale juhuse.

Olemas 4 juhusliku valiku võimalust prooviks:

  1. Tegelikult juhuslikult valik ehk "lotomeetod", kui statistilistele väärtustele omistatakse seerianumbrid, mis kantakse teatud objektidele (näiteks vaadid), mis seejärel segatakse mingis konteineris (näiteks kotis) ja valitakse juhuslikult. Praktikas kasutatakse seda meetodit juhuslike arvude generaatori või juhuslike arvude matemaatiliste tabelite abil.
  2. Mehaaniline valik, mille järgi iga ( N/n)-nda üldkogumi väärtus. Näiteks kui see sisaldab 100 000 väärtust ja soovite valida 1000, siis iga 100 000 / 1000 = 100. väärtus langeb valimisse. Veelgi enam, kui neid ei järjestata, valitakse esimene saja hulgast juhuslikult ja ülejäänute arv on saja võrra suurem. Näiteks kui üksus number 19 oli esimene, siis number 119 peaks olema järgmine, siis number 219, siis number 319 ja nii edasi. Kui rahvastikuüksused on järjestatud, valitakse kõigepealt #50, seejärel #150, seejärel #250 jne.
  3. Väärtused valitakse heterogeensest andmemassiivist kihistunud(kihistatud) meetod, kui üldpopulatsioon on eelnevalt jagatud homogeenseteks rühmadeks, millele rakendatakse juhuslikku või mehaanilist valikut.
  4. Spetsiaalne proovivõtumeetod on sari valik, mille puhul ei valita juhuslikult või mehaaniliselt mitte üksikuid suurusi, vaid nende seeriaid (jadad mingist arvust mõneni järjest), mille raames teostatakse pidevat vaatlust.

Proovivaatluste kvaliteet sõltub ka sellest proovivõtu tüüp: kordas või mittekorduv.
Kell uuesti valik valimisse sattunud statistilised väärtused või nende seeriad tagastatakse pärast kasutamist üldkogumisse, kus on võimalus pääseda uude valimisse. Samal ajal on kõigil üldkogumi väärtustel sama tõenäosus valimisse kaasata.
Mittekorduv valik tähendab, et valimisse kaasatud statistilisi väärtusi või nende seeriaid ei tagastata pärast kasutamist üldkogumisse ja seetõttu suureneb tõenäosus järgmisse valimisse sattuda viimase ülejäänud väärtuste puhul.

Mittekorduv proovide võtmine annab täpsemad tulemused, seetõttu kasutatakse seda sagedamini. Kuid on olukordi, kus seda ei saa rakendada (reisijatevoogude, tarbijanõudluse jms uuring) ja siis tehakse kordusvalik.

Valimi vead

Valimikomplekti saab moodustada statistiliste väärtuste kvantitatiivse märgi alusel, samuti alternatiivsel või atributiivsel alusel. Esimesel juhul on valimit üldistavaks tunnuseks väärtus, mida tähistab , ja teises - näidisosa kogused, tähistatud w. Üldpopulatsioonis vastavalt: üldine keskmine ja üldaktsia lk.

Erinevused - ja WR helistas proovivõtu viga, mis on jagatud registreerimisviga ja esindusviga. Valimivea esimene osa tuleneb ebaõigest või ebatäpsest teabest, mis on tingitud probleemi olemuse valesti mõistmisest, registripidaja hoolimatusest ankeetide, vormide jms täitmisel. Seda on üsna lihtne tuvastada ja parandada. Vea teine ​​osa tuleneb juhusliku valiku põhimõtte pidevast või spontaansest mittejärgimisest. Seda on raske tuvastada ja kõrvaldada, see on palju suurem kui esimene ja seetõttu pööratakse sellele põhitähelepanu.

Valimivea väärtus võib sama üldkogumi erinevate valimite puhul olla erinev, mistõttu statistikas määratakse see keskmine viga uuesti valimi võtmisel ja mittevalimimisel vastavalt valemitele:

Korduv;

- mittekorduv;

Kus Dv on valimi dispersioon.

Näiteks 1000 töötajaga tehases. Töötajate keskmise tööstaaži määramiseks viidi läbi 5% juhuslik mittekorduv valim. Valimivaatluse tulemused on toodud järgmise tabeli kahes esimeses veerus:

X , aastat
(töökogemus)

f , pers.
(valimis olevate töötajate arv)

X ja

X ja f

3. veerus on määratletud X-intervalli keskpunktid (pool intervalli alumise ja ülemise piiri summast) ning 4. veerus X ja f korrutised, et leida kaalutud aritmeetika abil valimi keskmine. keskmine valem:

143,0/50 = 2,86 (aastad).

Arvutage kaalutud valimi dispersioon:
= 105,520/50 = 2,110.

Nüüd leiame keskmise mitte kordustestimise vea:
= 0,200 (aastat).

Keskmiste valimivigade valemitest on näha, et mittekorduva valimi korral on viga väiksem ja nagu tõenäosusteoorias on tõestatud, esineb see tõenäosusega 0,683 (ehk kui võtta ühest üldisest 1000 valimit populatsioonist, siis 683 puhul neist ei ületa viga keskmist valimiviga ). See tõenäosus (0,683) ei ole suur, mistõttu on sellest vähe kasu praktilistes arvutustes, kus on vaja suuremat tõenäosust. Valimivea määramiseks suurema tõenäosusega kui 0,683 arvutage marginaalne valimiviga:

Kus t– usalduskoefitsient, olenevalt valimi piirvea määramise tõenäosusest.

Usaldusteguri väärtused t arvutatakse erinevate tõenäosuste jaoks ja on saadaval spetsiaalsetes tabelites (Laplace'i integraal), millest statistikas kasutatakse laialdaselt järgmisi kombinatsioone:

Tõenäosus 0,683 0,866 0,950 0,954 0,988 0,990 0,997 0,999
t 1 1,5 1,96 2 2,5 2,58 3 3,5

Arvestades konkreetse tõenäosuse taseme, valitakse tabelist sellele vastav väärtus t ja määrake valimi võtmise piirviga valemiga.
Sel juhul = 0,95 ja t= 1,96, see tähendab, et nad usuvad, et tõenäosusega 95%, on valimi võtmise piirviga 1,96 korda suurem kui keskmine. Seda tõenäosust (0,95) võetakse arvesse standard ja seda kasutatakse arvutustes vaikimisi.

Meie defineerime valimi võtmise piirvea standardse 95% tõenäosusega (alates võtmisest t= 1,96 95% tõenäosusega): = 1,96*0,200 = 0,392 (aastad).

Pärast piirvea arvutamist leitakse üldpopulatsiooni üldistava tunnuse usaldusvahemik. Sellisel intervallil üldkeskmise jaoks on vorm
See tähendab, et kogu tehase töötajate keskmine tööstaaž jääb vahemikku 2468–3252 aastat.

Valimi suuruse määramine

Selektiivse vaatluse programmi väljatöötamisel antakse mõnikord neile piirvea konkreetne väärtus tõenäosuse tasemega. Minimaalne valimi suurus, mis tagab antud täpsuse, jääb teadmata. Selle saab olenevalt valimi tüübist saada keskmise ja piirvea valemitest. Seega, asendades selle valimi suuruse suhtes ja lahendades selle, saame järgmised valemid:
uuesti proovivõtuks n =
uuesti proovivõtu puudumiseks n = .

Lisaks peab kvantitatiivsete tunnustega statistiliste väärtuste puhul teadma ka valimi dispersiooni, kuid arvutuste alguseks pole seegi teada. Seetõttu on see aktsepteeritud umbesüks järgmistest viise(prioriteedi järjekorras):

Mittearvuliste tunnuste uurimisel aktsepteeritakse seda isegi siis, kui proovifraktsiooni kohta pole ligikaudset teavet w= 0,5, mis vastavalt osa dispersiooni valemile vastab proovi dispersioonile maksimaalses suuruses Dv = 0,5*(1-0,5) = 0,25.