Valimi keskmine ruutviga on suurem kui. Keskmise ruudu valimi standardvea selgitus

Keskmine näidisviga näitab, kui palju parameeter keskmiselt hälbib proovivõtu raam vastavast üldparameetrist. Kui arvutada kõigi võimalike valimite vigade keskmine teatud liiki antud maht ( n) eraldatud samast üldpopulatsioonist, siis saame nende üldistava karakteristiku - keskmine diskreetimisviga ().

Selektiivse vaatluse teoorias on määramise valemid, mis on individuaalsed erinevaid viise valik (korduv ja mittekorduv), kasutatud valimite tüübid ja hinnanguliste statistiliste näitajate liigid.

Näiteks kui kasutatakse korduvat juhuslikku valimit, määratletakse see järgmiselt:

tunnuse keskmise väärtuse hindamisel;

Kui märk on alternatiivne, ja osakaal on hinnanguline.

Mittekorduva juhusliku valiku korral valemeid muudetakse (1 - n/N):

- atribuudi keskmise väärtuse jaoks;

- aktsia eest.

Just sellise veaväärtuse saamise tõenäosus on alati 0,683. Praktikas eelistatakse andmeid hankida suurema tõenäosusega, kuid see toob kaasa valimivea suuruse suurenemise.

Valimimise piirviga () võrdub t-ga keskmiste valimivigade arvuga (valimise teoorias on tavaks nimetada koefitsienti t usalduskoefitsiendiks):

Kui diskreetimise viga kahekordistada (t = 2), siis on palju suurem tõenäosus, et see ei ületa teatud piiri (meie puhul kahekordse keskmine viga) - 0,954. Kui me võtame t = 3, siis usalduse tase saab olema 0,997 - praktiliselt kindlus.

Tase piirviga proovide võtmine sõltub järgmistest teguritest:

üldkogumi ühikute varieeruvuse määr;
näidissuurus;
valitud valikuskeemid (mittekorduv valik annab väiksema veaväärtuse);
usalduse tase.

Kui valimi suurus on suurem kui 30, siis määratakse t väärtus normaaljaotuse tabelist, kui vähem - Studenti jaotustabelist.

Siin on mõned usalduskoefitsiendi väärtused normaaljaotuse tabelist.

Atribuudi keskmise väärtuse ja üldkogumi osakaalu usaldusvahemik määratakse järgmiselt:

Seega koosneb üldkeskmise ja osakaalu piiride määratlemine järgmistest sammudest:

Proovivõtu vead aadressil erinevat tüüpi valik

Tegelikult juhuslik ja mehaaniline proovivõtt. Tegeliku juhusliku ja mehaanilise valimi keskmine viga leitakse tabelis toodud valemite abil. 11.3.

Näide 11.2. Varade tasuvuse taseme uurimiseks viidi läbi valikuuringu, milles osales 90 ettevõtet 225-st. uuesti proovivõtt, mille tulemusena saadi tabelis esitatud andmed.

Selles näites on meil 40% valim (90: 225 = 0,4 või 40%). Määrame selle piirvea ja tunnuse keskmise väärtuse piirid üldkogumis algoritmi sammude abil:

Valimiküsitluse tulemuste põhjal arvutame välja valimikogumi keskmise väärtuse ja dispersiooni:

Tabel 11.5.

Vaatlustulemused			Hinnangulised väärtused
varade tootlus, rub., x i	ettevõtete arv, f i	intervalli keskel, x i \xb4	x i \xb4 f i	x i \xb4 2 f i
Kuni 1.4	13	1,3	16,9	21,97
1,4-1,6	15	1,5	22,5	33,75
1,6-1,8	17	1,7	28,9	49,13
1,8-2,0	15	1,9	28,5	54,15
2,0-2,2	16	2,1	33,6	70,56
2.2 ja uuemad	14	2,3	32,2	74,06
Kokku	90	-	162,6	303,62

Näidiskeskmine

Uuritava tunnuse näidisvariatsioon

Meie andmete jaoks defineerime valimi piirvea, näiteks tõenäosusega 0,954. Normaaljaotusfunktsiooni tõenäosusväärtuste tabeli järgi (vt selle väljavõtet lisas 1) leiame tõenäosusele 0,954 vastava usalduskoefitsiendi t väärtuse. Tõenäosusega 0,954 on koefitsient t 2.

Seega 954 juhul 1000-st ei ületa varade keskmine tootlus 1,88 rubla. ja mitte vähem kui 1,74 rubla.

Ülalpool kasutati korduvat juhusliku valiku skeemi. Vaatame, kas küsitluse tulemused muutuvad, kui eeldame, et valik viidi läbi mittekorduva valiku skeemi järgi. Sel juhul arvutatakse keskmine viga valemi abil

Siis tõenäosusega 0,954 on valimi võtmise piirviga:

Mittekorduva juhusliku valiku korral on tunnuse keskmise väärtuse usalduspiiridel järgmised väärtused:

Võrreldes kahe valikuskeemi tulemusi, võime järeldada, et mittekorduva juhusliku valimi kasutamine annab täpsemad tulemused võrreldes sama usaldusnivooga korduva valiku kasutamisega. Samal ajal, mida suurem on valimi suurus, seda olulisem on keskmiste väärtuste piirid ühelt valikuskeemilt teisele liikumisel kitsamaks muuta.

Näite kohaselt määrame kindlaks nende ettevõtete osakaalu piirid, mille varade tootlus ei ületa 2,0 rubla üldkogumis:

Arvutame valimisageduse.

Valimi ettevõtete arv, mille varade tootlus ei ületa 2,0 rubla, on 60 ühikut. Siis

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

arvutada osakaalu dispersioon valimikogumis

keskmine proovivõtuviga kasutamisel uuesti skeemitada valik saab olema

Kui eeldada, et kasutati mittekorduvat valikuskeemi, siis keskmine valimiviga, võttes arvesse üldkogumi lõplikkuse korrektsiooni, on

määrame usalduse tõenäosuse ja määrame valimi võtmise piirvea.

Tõenäosuse väärtusega P = 0,997 saame normaaljaotuse tabeli järgi usalduskoefitsiendi väärtuse t = 3 (vt selle väljavõtet lisas 1):

Seega võib tõenäosusega 0,997 väita, et mitte rohkem kui 2,0 rubla varade tootlusega ettevõtete osakaal üldkogumis on vähemalt 54,7% ja mitte rohkem kui 78,7%.

Tüüpiline näidis. Tüüpilise näidisega elanikkonnast objektid on jagatud k rühma, siis

N 1 + N 2 + ... + N i + ... + N k = N.

Igast tüüpilisest rühmast eraldatud ühikute maht sõltub valitud valikumeetodist; neid kokku moodustab vajaliku valimi suuruse

n 1 + n 2 + … + n i + … + n k = n.

Tüüpilise rühma sees valiku korraldamiseks on kaks võimalust: proportsionaalne tüüpiliste rühmade mahuga ja proportsionaalne atribuudi väärtuste kõikumise astmega vaatlusühikutes rühmades. Kaaluge neist esimest kui kõige sagedamini kasutatavat.

Tüüpiliste rühmade suurusega proportsionaalne valik eeldab, et igaüks neist valitakse järgmine number rahvastiku ühikud:

n = n i N i /N

kus n i on i-nda tüüpilise rühma proovi ekstraheeritavate ühikute arv;

n on valimi kogumaht;

N i - i-nda tüüpilise rühma moodustanud üldkogumi üksuste arv;

N on ühikute koguarv üldkogumis.

Rühmasisesed ühikud valitakse juhusliku või mehaanilise valimi vormis.

Valemid keskmise ja osakaalu keskmise valimivea hindamiseks on esitatud tabelis. 11.6.

Siin on tüüpiliste rühmade rühmade erinevuste keskmine.

Näide 11.3. Ühes Moskva ülikoolis viidi läbi üliõpilaste valikuline küsitlus, et selgitada välja ülikooli raamatukogu ühe üliõpilase keskmise külastatavuse näitaja semestris. Selleks kasutati 5% mittekordavat tüüpilist valimit, mille tüüpilised rühmad vastavad kursuse numbrile. Valides proportsionaalselt tüüpiliste rühmade mahuga, saadi järgmised andmed:

Tabel 11.7.

Kursuse number	Üliõpilasi kokku, isikuid, N i	Selektiivse vaatluse tulemusena uuriti inimesi, n i	Keskmine raamatukogukülastuste arv üliõpilase kohta semestris, x i	Grupisisese valimi dispersioon,
1	650	33	11	6
2	610	31	8	15
3	580	29	5	18
4	360	18	6	24
5	350	17	10	12
Kokku	2 550	128	8	-

Igal kursusel eksamineeritavate üliõpilaste arv arvutatakse järgmiselt:

Sarnane teiste rühmade jaoks:

Valimi keskmiste väärtuste jaotusel on alati normaaljaotuse seadus (või läheneb sellele), kui n > 100, olenemata üldkogumi jaotuse olemusest. Väikeste valimite puhul kehtib aga erinev jaotusseadus - Studenti jaotus. Sel juhul leitakse usalduskoefitsient Studenti t-jaotuse tabeli järgi, olenevalt usalduse tõenäosuse P väärtusest ja valimi suurusest n. Lisas 1 on toodud fragment Studenti t-jaotuse tabelist, mis on esitatud sõltuvusena valimi suuruse usalduse tõenäosuse ja usalduskoefitsiendi t.

Näide 11.4. Oletame, et kaheksa akadeemia üliõpilase valimküsitlus näitas, et ettevalmistamisel kontrolli töö statistika järgi veetsid nad järgmise arvu tunde: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6.6.

Näide 11.5. Arvutame, kui palju 507-st tööstusettevõtted maksuametis tuleks kontrollida maksurikkumistega ettevõtete osakaalu tõenäosusega 0,997. Eelmise sarnase uuringu järgi oli standardhälbe väärtus 0,15; valimivea suurus ei tohi olla suurem kui 0,05.

Korduva juhusliku valiku kasutamisel kontrollige

Mittekorduva juhusliku valiku korral on vaja kontrollida

Nagu näete, võimaldab mittekorduva valimi kasutamine uuringut läbi viia palju vähem objektid.

Näide 11.6. Plaanis on küsitlus palgad tööstuse ettevõtetes juhusliku mittekorduva valiku meetodil. Kui suur peaks olema valim, kui uuringu ajal oli tööstusharu hõivatute arv 100 000 inimest? Valimi võtmise piirviga ei tohiks ületada 100 rubla. tõenäosusega 0,954. Tööstuse varasematest palkade uuringutest on teada, et keskmine standardhälve on 500 rubla.

Seetõttu on probleemi lahendamiseks vaja valimisse kaasata vähemalt 100 inimest.

Valimist saadud näitajate väärtuste ja üldkogumi vastavate parameetrite lahknevust nimetatakse esindusviga. Eristada süstemaatilist ja juhuslikud vead proovid.

Juhuslikud vead pole piisavalt selgitatud ühtne esitusüldkogumi eri kategooriate üksuste valimikomplektis.

Süstemaatilised vead võib olla seotud valikureeglite või valimi rakendamise tingimuste rikkumisega.

Seega ehitati leibkondade eelarvete mõõdistamisel valimiraam enam kui 40 aastaks territoriaal-valdkondliku valiku põhimõtte alusel, mis tulenes eelarveuuringu põhieesmärgist - iseloomustada töötajate, töötajate elatustaset. ja kolhoosnikud. Valim jaotati RSFSRi majanduse piirkondade ja sektorite vahel proportsionaalselt kogu tugevus tööl; tööstusharu valimi koostamiseks kasutati tüüpilist valimit koos rühmadesisese üksuste mehaanilise valikuga.

Peamiseks valikukriteeriumiks oli keskmine kuupalk. Valikupõhimõte tagas erineva palgatasemega töötajate proportsionaalse esindatuse.

Uue tulekuga sotsiaalsed rühmad(ettevõtjad, põllumehed, töötud), ei rikutud valimi esinduslikkust mitte ainult erinevuste tõttu üldkogumi struktuuriga, vaid ka süstemaatilise vea tõttu, mis tekkis valimi moodustava üksuse (töötaja) ja valimi moodustava üksuse (töötaja) mittevastavuse tõttu. vaatlusüksus (leibkond). Ka leibkond, kus on rohkem kui üks töötav pereliige, valiti tõenäolisemalt kui ühe töötajaga leibkond. Valitud üksuste hulgast (pensionäride leibkonnad, füüsilisest isikust ettevõtjate leibkonnad jne) jäid uuritud sektorites mittetöötavad pered. Saadud tulemuste täpsust (usaldusvahemike piirid, valimivead) oli raske hinnata, kuna valimi koostamisel ei kasutatud tõenäosusmudeleid.

Aastatel 1996–1997 võeti põhimõtteliselt kasutusele uus lähenemine leibkondade valimi võtmisele. Selle läbiviimisel võeti aluseks 1994. aasta rahvastiku mikroloenduse andmed, mille üldkogumi moodustasid valikus kõik leibkonnatüübid, välja arvatud kollektiivleibkonnad. Ja valimikomplekti hakati korraldama, võttes arvesse leibkondade koosseisu ja tüüpide esinduslikkust iga Vene Föderatsiooni subjekti piires.

Valiminäitajate esinduslikkuse vigade mõõtmine põhineb eeldusel, et nende jaotus lõpmatus on juhuslik. suured numbrid proovid.

Üldkarakteristikust aimu saamiseks kasutatakse näidisnäitaja usaldusväärsuse kvantifitseerimist. Seda tehakse kas näidisnäitaja alusel, võttes arvesse selle juhuslikku viga, või teatud hüpoteesi alusel (väärtuse kohta keskmine dispersioon, leviku olemus, seos) seoses üldpopulatsiooni omadustega.

Hüpoteesi kontrollimiseks hinnatakse empiiriliste andmete kooskõla hüpoteetiliste andmetega.

Juhusliku esindusvea suurus sõltub:

1) valimi suuruse kohta;
2) uuritava tunnuse varieeruvuse määr üldpopulatsioonis;
3) aktsepteeritud valimi üldkogumi moodustamise meetod.

Esinevad keskmised (standardsed) ja marginaalsed valimivead.

Keskmine viga iseloomustab valiminäitajate kõrvalekallete mõõtu üldkogumi sarnastest näitajatest.

piirviga on tavaks arvestada maksimaalse võimaliku lahknevusega valimi ja üldtunnuste vahel, s.o. maksimaalne viga selle esinemise antud tõenäosuse kohta.

Valimikogumi järgi on võimalik hinnata erinevaid üldkogumi näitajaid (parameetreid). Kõige sagedamini kasutatavad hinded on:

– üldine keskmise suurusega uuritavast tunnusest (mitme väärtusega kvantitatiivne tunnus);
– üldaktsia (alternatiivmärgi puhul).

Valimimeetodi rakendamise põhiprintsiibiks on tagada kõigile üldkogumi üksustele võrdne võimalus saada valimiskogumisse. Selle lähenemisviisi puhul järgitakse juhusliku objektiivse valiku nõuet ja seetõttu määrab valimivea peamiselt selle suurus ( P ). Viimase suurenemisega keskmise vea väärtus väheneb, valimi üldkogumi tunnused lähenevad üldkogumi tunnustele.

Sama arvu proovivõtukomplektidega ja muuga võrdsed tingimused valimi võtmise viga on väiksem nende goil, kes valitakse üldpopulatsioonist, kus uuritud tunnus on väiksema variatsiooniga. Tunnuse variatsiooni vähenemine tähendab dispersiooni väärtuse vähenemist (kvantitatiivse tunnuse või alternatiivse tunnuse puhul).

Valimivea suuruse sõltuvus valimi üldkogumi moodustamise meetoditest määratakse keskmise valimivea valemitega (tabel 5.2).

Täiendame tabeli näitajaid. 5.2 koos järgmiste selgitustega.

Valimi dispersioon on veidi väiksem kui üldine dispersioon. matemaatiline statistika tõestas seda

Tabel 5.2

Valimi keskmise vea mri arvutamise valemid erinevaid viise valik

Proovi tüüp
	korrati jaoks	jaoks kordamatu

Tegelikult juhuslik (lihtne)
Sari (võrdne
Tüüpiline (proportsionaalselt rühmade suurusega)

Kui valim on suur (st. P piisavalt suur), siis läheneb suhe ühtsusele ja valimi dispersioon langeb praktiliselt kokku üldisega.

Valimit peetakse tingimusteta suureks, kui n> 100 ja tingimusteta väike kl P < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

Neid saab arvutada järgmiste valemite abil:

kus on keskmine i seeria; on kogu valimi üldine keskmine;

kus on teatud kategooria ühikute osakaal i seeria; - selle kategooria üksuste osakaal kogu valimis; r- valitud episoodide arv.

4. Määrata tüüpvalimi keskmine viga ühikute valimisel proportsionaalselt iga rühma suurusega grupisisesed dispersioonid(– kvantitatiivse tunnuse jaoks, alternatiivse tunnuse jaoks). Vastavalt dispersioonide liitmise reeglile on grupisiseste dispersioonide keskmise väärtus väiksem kui väärtus kogu dispersioon. Keskmine väärtus võimalik viga tüüpiline valim on väiksem kui lihtsa õige juhusliku valimi võtmise viga.

Sageli kasutatakse kombineeritud valikut: üksuste individuaalne valik kombineeritakse rühmavalikuga, tüüpiline valik kombineeritakse seeriavalikuga. Mis tahes valikumeetodi puhul võib teatud tõenäosusega väita, et valimi keskmise (või osakaalu) kõrvalekalle üldkeskmisest (või osakaalust) ei ületa teatud väärtust, mida nn. piirviga proovid.

Suhe diskreetimisvea piiri (∆) vahel on teatud tõenäosusega garanteeritud F(t), ja keskmine diskreetimisviga on kujul: või , kus t – usalduskoefitsient, määratakse sõltuvalt tõenäosuse tasemest F(t).

Funktsiooni väärtused F(t) ja t määratakse spetsiaalselt koostatud matemaatiliste tabelite alusel. Siin on mõned kõige sagedamini kasutatavad:


t

Seega vastab valimi võtmise piirviga teatud tõenäosusega küsimusele valimi täpsusest, mille väärtus sõltub usalduskoefitsiendi väärtusest t. Jah, kl t = 1 tõenäosus F(t ) valimi tunnuste kõrvalekalle üldistest ühe keskmise vea võrra on 0,683. Järelikult annab igast 1000 valimist keskmiselt 683 üldistatud näitajat (keskmine, osakaal), mis erineb üldistest mitte rohkem kui ühe keskmise vea võrra. Kell t = 2 tõenäosus F(t) on võrdne 0,954, mis tähendab, et igast 1000 proovist annab 954 üldnäitajaid, mis erinevad üldistest mitte rohkem kui kahekordse keskmise valimi vea võrra jne.

Sama hästi kui absoluutväärtus valimi piirviga arvutatakse ja suhteline viga, mis on määratletud kui protsenti valimi võtmise piirviga valimi üldkogumi vastava karakteristiku suhtes:

Praktikas on tavaks seada ∆ väärtus reeglina 10% piiresse atribuudi eeldatavast keskmisest tasemest.

Keskmiste ja marginaalsete valimivigade arvutamine võimaldab teil määrata piirid, mille piires on üldkogumi omadused:

Piire, milles teatud tõenäosusastmega üldkogumis uuritava näitaja tundmatu väärtus sisaldub, nimetatakse usaldusvahemik, ja tõenäosus F(t) – usalduse tõenäosus. Mida suurem on ∆ väärtus, seda suurem on väärtus usaldusvahemik ja seega madalam hinnangu täpsus.

Mõelge järgmisele näitele. Pangas hoiuse keskmise suuruse määramiseks valiti korduva juhusliku valimi meetodil 200 hoiustajate välisvaluutakontot. Selle tulemusena leiti, et keskmine suurus deposiit - 60 tuhat rubla, dispersioon oli 32. Samal ajal osutus nõudmisel 40 kontot. Tõenäosusega 0,954 on vaja määrata piirid, mille piires paiknevad pangas välisvaluutakontode keskmine hoiuse summa ja nõudmiseni kontode osakaal.

Arvutage uuesti valimise valemi abil valimi keskmise keskmine viga

Valimi keskmise piirviga tõenäosusega 0,954 on

Järelikult on keskmine hoius välisvaluutas pangakontodel tuhande rubla piires:

Tõenäosusega 0,954 võib väita, et keskmine hoius välisvaluuta pangakontodel jääb vahemikku 59 200–60 800 rubla.

Määrame nõudmiseni hoiuste osakaalu valimikogumis:

Näidisjagamise keskmine viga

Aktsia piirviga tõenäosusega 0,954 saab olema

Seega on nõudluskontode osakaal üldkogukonnas sees w :

Tõenäosusega 0,954 võib väita, et nõudluskontode osatähtsus panga välisvaluutakontode koguarvust jääb vahemikku 14,4–25,6%.

Kell juhtumiuuringud oluline on luua optimaalne suhe saadud tulemuste usaldusväärsuse mõõdiku ja vastuvõetava valimivea suuruse vahel. Sellega seoses tekib valimivaatluse korraldamisel küsimus antud tõenäosusega tulemuste nõutava täpsuse saamiseks vajaliku valimi suuruse määramisega. Nõutava valimi suuruse arvutamine toimub valimi piirvea valemite alusel vastavalt valiku tüübile ja meetodile (tabel 5.3).

Tabel 5.3

Valemid valimi suuruse arvutamiseks õige juhusliku valiku meetodiga

Jätkame näitega, mis esitab pangahoiustajate isiklike kontode valikuuringu tulemused.

On vaja kindlaks määrata, kui palju kontosid tuleb uurida, et tõenäosusega 0,977 ei ületaks keskmise hoiuse suuruse määramise viga 1,5 tuhat rubla. Avaldame ümbervalimise piirvea valemist valimi suuruse näitaja:

Nõutava valimi suuruse määramisel ülaltoodud valemite abil on σ2 väärtuste leidmine ja jah keeruline, kuna neid väärtusi saab saada alles pärast valimiuuringut. Sellega seoses asendatakse nende näitajate tegelike väärtuste asemel ligikaudsed näitajad, mida saab määrata mis tahes katse põhjal. näidisvaatlused või varasematest analüütilistest küsitlustest.

Juhtudel, kui statistik teab uuritavate tunnuste keskmist väärtust (näiteks juhiste, seadusandlike aktide vms põhjal) või piirmäärasid, milles see näitaja varieerub, saab ligikaudsete valemite abil rakendada järgmist arvutust:

ja korrutis w(1 – w) tuleks asendada väärtusega 0,25 (w = 0,5).

Et saada rohkem täpne tulemus, võtke nende näitajate maksimaalne võimalik väärtus. Kui tunnuse jaotus üldpopulatsioonis järgib tavaline seadus, siis variatsioonivahemik on ligikaudu võrdne 6σ ( äärmuslikud väärtused eraldatud mõlemas suunas keskmisest 3σ kaugusel). Seega , aga kui jaotus on ilmselgelt asümmeetriline, siis .

Igat tüüpi proovide puhul hakatakse selle mahtu arvutama uuesti proovivõtu valemi järgi

Kui arvutuse tulemusena on valiku osa ( n ) ületab 5%, siis tehakse arvutus mittekorduva valiku valemi järgi.

Tüüpilise valimi jaoks on vaja valimiskogumi kogumaht valitud ühikutüüpide vahel jagada. Iga rühma vaatluste arvu arvutamine sõltub eelnevalt nimetatust organisatsioonilised vormid tüüpiline näidis.

Tüüpilises üksuste valikus, mis on ebaproportsionaalselt rühmade arvuga, jagatakse valitud üksuste koguarv rühmade arvuga, saadud väärtus annab valiku arvu igast tüüpilisest rühmast:

kus k on tuvastatud tüüpiliste rühmade arv.

Ühikute valimisel proportsionaalselt tüüpiliste rühmade arvuga määratakse iga rühma vaatluste arv valemiga

kust on pärit valimi suurus i -th rühm; - helitugevus i - rühm.

Valimisel, võttes arvesse tunnuse varieerumist, peaks iga rühma valimi protsent olema proportsionaalne selle rühma standardhälbega (). Arvu () arvutamine toimub vastavalt valemitele

Seeriavalikul määratakse vajalik arv valitud seeriaid samamoodi nagu õige juhusliku valiku korral:

Ümbervalimine

Mittekorduv valik

Sel juhul saab dispersioonid ja valimivead arvutada tunnuse keskmise väärtuse või osakaalu jaoks.

Selektiivse vaatluse kasutamisel on selle tulemuste karakteristikud võimalikud selektiivnäitajate saadud veapiiride võrdluse alusel lubatava vea väärtusega.

Sellega seoses tekib probleem tõenäosuse määramisel, et diskreetimisviga ei ületa lubatud viga. Selle ülesande lahendus taandatakse arvutuseks, mis põhineb suuruse valimi võtmise piirvea valemil t.

Jätkates pangaklientide isiklike kontode valikuuringu näite käsitlemist, leiame tõenäosuse, millega saab väita, et keskmise hoiuse suuruse määramise viga ei ületa 785 rubla:

vastav usaldusnivoo on 0,95.

Praegu hõlmab proovivõtu praktika statistilised tähelepanekud läbi viidud:

- Rosstati kehad;
– muud ministeeriumid ja osakonnad (näiteks ettevõtete seire Venemaa Panga süsteemis).

Tuntud üldistus kogemustest väikeettevõtete, elanikkonna ja majapidamiste valikuuringute korraldamisel on toodud Statistika metoodilistes sätetes. Nad annavad rohkem lai mõiste näidisvaatlus kui eespool käsitletud (tabel 5.4).

Statistilises praktikas kasutatakse kõiki nelja tüüpi valimeid, mis on esitatud tabelis. 5.4. Tavaliselt eelistatakse aga eelpool kirjeldatud tõenäosuslikke (juhuslikke) valimeid, mis on kõige objektiivsemad, kuna nende abil saab hinnata valimi enda andmete põhjal saadud tulemuste täpsust.

Tabel 5.4

Näidiste tüübid

Proovides kvaasijuhuslik tüüp tõenäosuslikku valikut eeldatakse selle alusel, et valimit arvestav ekspert peab seda vastuvõetavaks. Näide kvaasijuhusliku valimi kasutamisest statistikapraktikas on „Väikeettevõtete valim uuring uurimiseks sotsiaalsed protsessid väikeettevõtluses", mis viidi läbi 1996. aastal mõnes Venemaa piirkonnas. Vaatlusüksused (väikeettevõtted) valiti asjatundlikult, võttes arvesse majandussektorite esindatust juba moodustatud väikeettevõtete finants- ja majandustegevuse uuringu valimis. (vorm "Teave väikeettevõtte finants- ja majandustegevuse põhinäitajate kohta") Valimiandmete summeerimisel eeldati, et valim moodustati lihtsa juhusliku valiku meetodil.

otsene eksperthinnangu kasutamine See on kõige rohkem üldine meetodüksuste tahtlik kaasamine valimisse. Sellise valikumeetodi näide on monograafiline meetod, mis hõlmab teabe hankimist vaid ühest vaatlusüksusest, mis on uuringu korraldaja – eksperdi sõnul tüüpiline.

Näidised põhinevad suunavalik, rakendatakse objektiivse protseduuri abil, kuid ilma tõenäosusmehhanismi kasutamata. Laialt on tuntud põhimassiivi meetod, mille puhul valim sisaldab suurimaid (olulisi) vaatlusühikuid, mis annavad põhilise panuse indikaatorisse nt. koguväärtus funktsioon, mis esindab uuringu peamist eesmärki.

Statistikapraktikas kasutatakse seda sageli kombineeritud statistilise vaatluse meetod. Pideva ja selektiivse vaatlusmeetodi kombinatsioonil on kaks aspekti:

vaheldumine ajas;
nende samaaegne kasutamine (osa elanikkonnast jälgitakse pidevalt ja osa - valikuliselt).

vaheldumine uuritava üldkogumi koosseisu selgitamiseks on vajalik perioodiline proovide võtmine suhteliselt harva esinevate pidevate küsitluste või loendustega. Seda teavet kasutatakse seejärel kui statistiline alus valikuline vaatlus. Näiteks võib tuua rahvaloendused ja nende vahele jäävate leibkondade valikuuringud.

AT sel juhul vajalikud on järgmised ülesanded:

– pideva vaatluse tunnuste koosseisu määramine, mis tagavad valimi organiseerituse;
– vaheldumise perioodide põhjendamine, s.o. kui pidevad andmed ei ole enam asjakohased ja nende uuendamine on vajalik.

Samaaegne kasutamine ühe pidev- ja valimivaatluste uuringu raames on tingitud statistilises praktikas esinevast populatsioonide heterogeensusest. See kehtib eriti ettevõtete kogumi majandustegevuse uuringute kohta, mida iseloomustavad uuritud tunnuste kaldus jaotused, kui teatud arvu üksuste tunnused erinevad suuresti enamikust väärtustest. Sel juhul vaadeldakse selliseid üksusi pidevalt ja teist osa populatsioonist vaadeldakse valikuliselt.

Selle vaatluste korraldamise peamised ülesanded on järgmised:

– nende optimaalse proportsiooni kehtestamine;
– tulemuste täpsuse hindamise meetodite väljatöötamine.

Tüüpiline näide, mis illustreerib rakenduse seda aspekti kombineeritud meetod, on an üldpõhimõte ettevõtete üldkogumi uuringute läbiviimine, mille kohaselt toimuvad suurte ja keskmise suurusega ettevõtete üldkogumi küsitlused peamiselt pidevmeetodil ning väikeettevõtete populatsiooni uuringud valimimeetodil.

Valimi metoodika edasiarendus toimub nii koos pideva vaatluse korraldamisega kui ka spetsiaalsete uuringute korraldamise kaudu, mille läbiviimise tingib vajadus hankida Lisainformatsioon konkreetsete probleemide lahendamiseks. Seega on elanikkonna tingimuste ja elatustaseme uuringute korraldamine ette nähtud kahes aspektis:

- kohustuslikud komponendid;
– lisamoodulid sees integreeritud süsteem näitajad.

Kohustuslikud komponendid võivad olla iga-aastased sissetulekute, kulude ja tarbimise uuringud (sarnaselt leibkondade eelarve uuringutele), mis sisaldavad ka elanikkonna elutingimuste põhinäitajaid. Igal aastal tuleb eriplaneeringu kohaselt kohustuslikke komponente täiendada ühekordsete elanike elutingimuste uuringutega (moodulitega), mille eesmärk on süvaõpeükskõik milline valitud sotsiaalne teema nendest koguarv(nt majapidamisvara, tervishoid, toitumine, haridus, töötingimused, eluase, vaba aeg, sotsiaalne mobiilsus, ohutus jne) erineva sagedusega, mis on määratud indikaatorite vajaduse ja ressursivõimaluste järgi.

Valimivea mõiste ja arvutamine.

Valikulise vaatluse ülesandeks on anda õigeid ettekujutusi kogu üldkogumi koondnäitajate kohta, lähtudes nende mõnest vaatlusalusest osast. Nimetatakse valimi osakaalu ja valimi keskmise võimalikku kõrvalekallet osakaalust ja keskmisest üldkogumis proovivõtu viga või esindusviga. Mida suurem on selle vea väärtus, seda rohkem erinevad valimi vaatluse näitajad üldkogumi näitajatest.

Erinev:

valimi võtmise vead;

Registreerimisvead.

Registreerimisvead ilmnevad siis, kui fakt on vaatluse käigus valesti kindlaks tehtud. Need on iseloomulikud nii pidevale vaatlusele kui ka valikulisele vaatlusele, kuid valikulises vaatluses on neid vähem.

Vea olemus on järgmine:

Tendentiivne – tahtlik, s.t. valiti välja populatsiooni parimad või halvimad üksused. Sel juhul kaotavad vaatlused oma tähenduse;

Juhuslik – valikulise vaatluse peamine korralduslik põhimõte on vältida tahtlikku valikut, s.o. tagama juhusliku valiku põhimõtte range järgimise.

Üldreegel juhuslik valik on: üldkogumi üksikutel üksustel peavad olema täpselt samad tingimused ja võimalused sattuda valimisse kuuluvate üksuste hulka. See iseloomustab valimitulemuse sõltumatust vaatleja tahtest. Vaatleja tahe tekitab tendentslikke vigu. Juhusliku valiku diskreetimisviga on juhuslik tegelane. See iseloomustab üldtunnuste kõrvalekalde suurust näidisomadustest.

Tulenevalt asjaolust, et tunnused uuritavas populatsioonis on erinevad, ei pruugi valimis olevate üksuste koosseis ühtida kogu üldkogumi üksuste koosseisuga. See tähendab et R ja ei sobi kokku W ja . Võimalik lahknevus nende omaduste vahel määratakse valimi võtmise veaga, mis määratakse järgmise valemiga:

kus - üldine dispersioon.

kus on valimi dispersioon.

See näitab, kust üldine dispersioon erineb valimi dispersioonõigel ajal.

On korduv ja mittekorduv valik. Uuesti valiku olemus seisneb selles, et iga valimis üksus naaseb pärast vaatlust üldkogumisse ja seda saab uuesti uurida. Uuesti valimimisel arvutatakse keskmine valimiviga:

Alternatiivse atribuudi osakaalu indikaatori puhul määratakse valimi dispersioon järgmise valemiga:

Praktikas kasutatakse kordusvalikut harva. Kell ümbervalimiseta, rahvastiku suurus N väheneb valimi võtmise ajal, on kvantitatiivse atribuudi keskmise valimivea valem järgmine:

, siis

Üks võimalikest väärtustest, milles uuritava tunnuse osakaal võib olla, on võrdne:

kus on alternatiivse tunnuse diskreetimisviga.

Näide.

Kell valikuuringu 10% valmistoodete partii toodetest ilma ümbervalimiseta meetodil said proovide niiskusesisalduse kohta järgmised andmed.

Määrake keskmine niiskuse %, dispersioon, standardhälve tõenäosusega 0,954 võimalikud piirid, milles ootame vt. % niiskust kõigist valmistoodetest, tõenäosusega 0,987 võimalikku piiri erikaal standardtooted eeldusel, et mittestandardne partii sisaldab tooteid niiskusesisaldusega kuni 13 ja üle 19%.

Vaid teatud tõenäosusega saab väita, et valimi osakaalu üldine osakaal ja valimi keskmise üldine keskmine hälbivad tüks kord.

Statistikas nimetatakse neid kõrvalekaldeid marginaalsed valimivead ja on märgitud.

Kohtuotsuse tõenäosust saab suurendada või vähendada tüks kord. Tõenäosusega 0,683, 0,954, 0,987, siis määratakse üldkogumi näitajad valimi näitajatega.

Nagu me juba teame, on representatiivsus valimi üldkogumi omadus esindada üldkogumi omadust. Kui vastet pole, räägitakse representatiivsusveast – valimi statistilise struktuuri hälbe mõõtmisest vastava üldkogumi struktuurist. Oletame, et pensionäride keskmine kuusissetulek kogu elanikkonnast on 2 tuhat rubla ja valimis 6 tuhat rubla. See tähendab, et sotsioloog küsitles ainult pensionäride jõukamat osa ja tema uuringusse puges esindusviga. Teisisõnu, esindusviga on lahknevus kahe komplekti vahel - üldise, millele on suunatud sotsioloogi teoreetiline huvi ja idee omadustest, mida ta lõpuks soovib saada, ja valikulise. , millele on suunatud sotsioloogi praktiline huvi, mis toimib nii uurimisobjektina kui ka üldrahvastiku kohta teabe hankimise vahendina.

Kodumaisest kirjandusest võib koos terminiga "esindusviga" leida veel ühe - "valimiviga". Mõnikord kasutatakse neid vaheldumisi ja mõnikord kasutatakse kvantitatiivselt täpsema mõistena "representatiivsusviga" asemel "valimiviga".

Valimiviga on valimi üldkogumi keskmiste tunnuste kõrvalekalle üldkogumi keskmistest tunnustest.

Praktikas määratakse valimi viga kindlaks üldkogumi teadaolevate tunnuste ja valimi keskmiste võrdlemise teel. Sotsioloogias kasutatakse täiskasvanud elanikkonna küsitlustes kõige sagedamini rahvaloenduste andmeid, jooksvaid statistilisi andmeid ja varasemate uuringute tulemusi. Kontrolliparameetritena kasutatakse tavaliselt sotsiaaldemograafilisi tunnuseid. Üld- ja valimikogumite keskmiste võrdlust, selle alusel valimivea määramist ja selle vähendamist nimetatakse esinduslikkuse kontrolliks. Kuna uuringu lõpus saab teha võrdluse enda ja teiste inimeste andmetega, siis nimetatakse seda kontrollimeetodit tagantjärele, s.o. teostatakse pärast kogemust.

Gallupi küsitlustes kontrollivad esinduslikkust rahvaloendustel kättesaadavad andmed rahvastiku soo, vanuse, hariduse, sissetuleku, elukutse, rassi, elukoha, suuruse järgi. paikkond. Ülevenemaaline uurimiskeskus avalik arvamus(VTsIOM) kasutab sellistel eesmärkidel selliseid näitajaid nagu sugu, vanus, haridus, asula tüüp, perekonnaseis, töövaldkond, vastaja ametlik staatus, mis on laenatud Vene Föderatsiooni riiklikult statistikakomiteelt. Mõlemal juhul on populatsioon teada. Valimiviga ei saa tuvastada, kui valimi ja üldkogumi muutuja väärtused on teadmata.

Andmeanalüüsi käigus tagavad VTsIOM-i spetsialistid proovi põhjaliku remondi, et minimeerida analüüsi käigus tekkinud kõrvalekaldeid. välitööd. Eriti tugevaid nihkeid täheldatakse soo ja vanuse osas. Seda seletatakse sellega, et naised ja inimesed, kellel kõrgharidus veeta rohkem aega kodus ja saada intervjueerijaga kergemini kontakti; on meeste ja „harimatute“ inimestega võrreldes kergesti ligipääsetav rühm35.

Valimi viga on tingitud kahest tegurist: valimi moodustamise meetodist ja valimi suurusest.

Valimivead jagunevad kahte tüüpi – juhuslikud ja süstemaatilised. Juhuslik viga on tõenäosus, et valimi keskmine ületab (või ei ületa). määratud intervall. Juhuslikud vead hõlmavad statistilisi vigu, mis on omased valimimeetodile endale. Need vähenevad, kui valimi suurus suureneb.

Teist tüüpi diskreetimisviga on süstemaatiline viga. Kui sotsioloog otsustas välja selgitada kõigi linnaelanike arvamuse toimuva kohta kohalikud omavalitsused autoriteedid sotsiaalpoliitikas ning küsitleti vaid neid, kellel on telefon, siis on valimis sihilik kallutatus jõukate kihtide kasuks, s.t. süstemaatiline viga.

Seega on süstemaatilised vead uurija enda tegevuse tulemus. Need on kõige ohtlikumad, kuna need põhjustavad uuringu tulemustes üsna olulisi kõrvalekaldeid. Süstemaatilisi vigu peetakse juhuslikest hullemaks ka seetõttu, et neid ei saa kontrollida ja mõõta.

Need tekivad siis, kui näiteks: 1) valim ei vasta uuringu eesmärkidele (sotsioloog otsustas uurida ainult töötavaid pensionäre, kuid küsitles kõiki järjest); 2) valitseb teadmatus üldrahvastiku olemusest (sotsioloog arvas, et 70% kõigist pensionäridest ei tööta, kuid selgus, et ainult 10% ei tööta); 3) valitakse ainult üldrahvastiku "võitvad" elemendid (näiteks ainult jõukad pensionärid).

Tähelepanu! Erinevalt juhuslikest vigadest ei vähene süstemaatilised vead valimi suuruse suurenedes.

Võttes kokku kõik süstemaatiliste vigade esinemise juhtumid, koostasid metoodikud nendest registri. Nad usuvad, et kontrollimatute eelarvamuste allikas valimi vaatluste jaotamisel võib olla järgmised tegurid:
♦ läbiviimise metoodilised ja metoodilised reeglid sotsioloogilised uuringud;
♦ valiti ebaadekvaatsed proovivõtumeetodid, andmekogumis- ja arvutusmeetodid;
♦ nõutavad vaatlusühikud asendati muude, paremini ligipääsetavatega;
♦ Täheldati valimi üldkogumi mittetäielikku katmist (ankeetide nappus, küsimustike puudulik täitmine, vaatlusüksuste ligipääsmatus).

Sotsioloogid teevad tahtlikke vigu harva. Enamasti tekivad vead seetõttu, et sotsioloog ei ole hästi kursis üldrahvastiku struktuuriga: inimeste jaotus vanuse, elukutse, sissetulekute jms järgi.

Süstemaatilisi vigu on lihtsam ennetada (võrreldes juhuslikega), kuid neid on väga raske kõrvaldada. Kõige parem on ennetada süstemaatilisi vigu, aimates nende allikaid täpselt ette – juba uuringu alguses.

Siin on mõned viisid valimi koostamise vigade vältimiseks.
♦ üldkogumi igal üksusel peab olema võrdne tõenäosus valimisse sattuda;
♦ on soovitav valida homogeensete populatsioonide hulgast;
♦ vajadus teada üldpopulatsiooni tunnuseid;
♦ Valimi koostamisel tuleks arvesse võtta juhuslikke ja süstemaatilisi vigu.

Kui valim (või lihtsalt valim) on õigesti koostatud, saab sotsioloog usaldusväärseid tulemusi, mis iseloomustavad kogu populatsiooni. Kui see on valesti koostatud, siis valimi koostamise etapis tekkinud viga korrutatakse igas järgnevas sotsioloogilise uuringu etapis ja jõuab lõpuks väärtuseni, mis kaalub üles uuringu väärtuse. Väidetavalt teevad sellised uuringud rohkem kahju kui kasu.

Sellised vead võivad ilmneda ainult valimipopulatsiooni korral. Vea tõenäosuse vältimiseks või vähendamiseks on kõige lihtsam viis suurendada valimi suurusi (ideaaljuhul kuni üldkogumi suuruseni: kui mõlemad populatsioonid ühtivad, kaob valimi viga üldse). Majanduslikult on see meetod võimatu. On veel üks võimalus – parandada matemaatilised meetodid proovide võtmine. Neid rakendatakse praktikas. See on esimene kanal matemaatika sotsioloogiasse tungimiseks. Teine kanal - matemaatiline töötlemine andmeid.

Eriti oluline küsimus vead muutuvad turundusuuringutes, kus kasutatakse mitte väga suuri valimeid. Tavaliselt on neid mitusada, harvem - tuhat vastajat. Siin on valimi arvutamise lähtepunktiks valimi üldkogumi suuruse määramise küsimus. Valimi suurus sõltub kahest tegurist: 1) teabe kogumise maksumus ja 2) püüdlus teatud taseme poole statistiline kehtivus tulemusi, mida uurija loodab saada. Muidugi saavad ka statistikas ja sotsioloogias kogenud inimesed intuitiivselt aru, et mida suurem on valimi suurus, s.t. mida lähemal on need üldpopulatsiooni kui terviku suurusele, seda usaldusväärsemad ja usaldusväärsemad on saadud andmed. Siiski oleme juba eespool rääkinud täielike uuringute praktilisest võimatusest juhtudel, kui neid tehakse objektidel, mille arv ületab kümneid, sadu tuhandeid ja isegi miljoneid. On selge, et teabe kogumise maksumus (sh tööriistade paljundamise eest tasumine, ankeetide, valdkonnajuhtide ja arvutisisestusoperaatorite töö) sõltub summast, mida klient on valmis eraldama, ja sõltub vähe uurijatest. Mis puudutab teist tegurit, siis peatume sellel veidi üksikasjalikumalt.

Seega, mida suurem on valimi suurus, seda väiksem on võimalik viga. Kuigi tuleb märkida, et kui soovite täpsust kahekordistada, peate valimit suurendama mitte kahe, vaid neli korda. Näiteks teha kaks korda rohkem täpne hinnang 400 inimese küsitlemisel saadud andmete põhjal peate küsitlema mitte 800, vaid 1600 inimest. Siiski on ebatõenäoline, et turundusuuringud vajavad 100% täpsust. Kui õlletootjal on vaja välja selgitada, milline osa õlletarbijatest eelistab pigem tema kaubamärki kui konkurendi kaubamärki – 60% või 40%, siis erinevus 57%, 60 või 63% vahel tema plaane ei mõjuta.

Valimiviga võib sõltuda mitte ainult selle suurusest, vaid ka uuritava üldpopulatsiooni üksikute üksuste erinevuste määrast. Näiteks kui me tahame teada, kui palju õlut tarbitakse, siis leiame, et meie rahvastiku tarbimismäärad erinevaid inimesi erinevad oluliselt (heterogeenne üldpopulatsioon). Teisel juhul uurime leiva tarbimist ja leiame selle erinevad inimesed see erineb palju vähem oluliselt (homogeenne populatsioon). Mida suurem on erinevus (või heterogeensus) populatsiooni sees, seda suurem on võimaliku valimivea hulk. See seaduspärasus ainult kinnitab seda, mis lihtne terve mõistus. Seega, nagu V. Yadov õigesti märgib, „sõltub valimi suurus (maht) uuritavate objektide homogeensuse või heterogeensuse tasemest. Mida homogeensemad need on, seda väiksem arv võib anda statistiliselt usaldusväärseid järeldusi.

Valimi suuruse määramine sõltub ka lubatava statistilise vea usaldusvahemiku tasemest. Siin peame silmas nn juhuslikke vigu, mis on seotud mis tahes statistiliste vigade olemusega. IN JA. Paniotto annab järgmised arvutused esinduslik valim 5% vea eeldusel:
See tähendab, et kui küsitledes näiteks 400 inimest linnaosa linnas, kus täiskasvanud maksejõuline elanikkond on 100 tuhat inimest, leidsite, et 33% küsitletud ostjatest eelistab kohaliku lihakombinaadi toodangut, siis 95. % tõenäosusega võib öelda, et 33+5% (s.o 28-38%) selle linna elanikest on nende toodete püsiostjad.

Võite kasutada ka Gallupi arvutusi valimi suuruse ja valimi vea suhte hindamiseks.