Biograafiad Omadused Analüüs

Valimi võtmise piirvea tase. Keskmiste ja marginaalsete valimivigade arvutamine erinevat tüüpi valiku jaoks

Rahvaarv- ühikute kogum, millel on massi iseloom, tüüpilisus, kvalitatiivne ühtsus ja varieeruvus.

Statistiline üldkogum koosneb materiaalselt eksisteerivatest objektidest (Töötajad, ettevõtted, riigid, piirkonnad), on objekt.

Rahvaarvu ühik– statistilise üldkogumi iga konkreetne ühik.

Sama statistiline populatsioon võib olla homogeenne ühe tunnuse ja heterogeenne teise tunnuse osas.

Kvalitatiivne ühtsus- populatsiooni kõigi üksuste sarnasus mis tahes tunnuse osas ja erinevus kõigi ülejäänute puhul.

Statistilises üldkogumis on erinevused ühe üldkogumi üksuse ja teise vahel sagedamini kvantitatiivset laadi. Populatsiooni erinevate üksuste atribuudi väärtuste kvantitatiivseid muutusi nimetatakse variatsiooniks.

Funktsiooni variatsioon- märgi kvantitatiivne muutus (kvantitatiivse märgi puhul) üleminekul ühelt rahvastikuüksuselt teisele.

märk- see on ühikute, objektide ja nähtuste omadus, iseloomulik tunnus või muu tunnus, mida saab jälgida või mõõta. Märgid jagunevad kvantitatiivseteks ja kvalitatiivseteks. Tunnuse väärtuse mitmekesisust ja muutlikkust üldkogumi üksikutes ühikutes nimetatakse variatsioon.

Atributiivsed (kvalitatiivsed) tunnused ei ole kvantifitseeritavad (rahvastiku koosseis soo järgi). Kvantitatiivsetel tunnustel on numbriline avaldis (populatsiooni koosseis vanuse järgi).

Näitaja- see on üksuste või agregaatide kui terviku mis tahes omaduse üldistav kvantitatiivselt kvalitatiivne tunnus konkreetsetes aja ja koha tingimustes.

Tulemuskaart on näitajate kogum, mis kajastab uuritavat nähtust igakülgselt.

Näiteks kaaluge palka:
  • Märk – palk
  • Statistiline rahvastik – kõik töötajad
  • Rahvastiku ühikuks on iga töötaja
  • Kvalitatiivne homogeensus – kogunenud palk
  • Funktsiooni variatsioon – numbrite jada

Üldkogum ja valim sellest

Aluseks on ühe või mitme tunnuse mõõtmise tulemusena saadud andmete kogum. Tegelikult vaadeldud objektide kogum, mida statistiliselt esindab juhusliku suuruse vaatluste seeria, on proovide võtmine ja hüpoteetiliselt olemasolev (mõeldud) - üldine elanikkond. Üldkogum võib olla piiratud (vaatluste arv N = konst) või lõpmatu ( N = ∞) ja üldkogumi valim on alati piiratud arvu vaatluste tulemus. Valimi moodustavate vaatluste arvu nimetatakse näidissuurus. Kui valimi suurus on piisavalt suur n→∞) valim võetakse arvesse suur, muidu nimetatakse seda prooviks piiratud maht. Näidis võetakse arvesse väike, kui ühemõõtmelise juhusliku suuruse mõõtmisel ei ületa valimi suurus 30 ( n<= 30 ) ja kui mõõta samaaegselt mitut ( k) tunnused mitmemõõtmelises ruumisuhtes n juurde k vähem kui 10 (n/k< 10) . Näidisvormid variatsiooni seeria kui selle liikmed on tellimuste statistika st juhusliku suuruse valimi väärtused X on järjestatud kasvavas järjekorras (järjestatud), kutsutakse atribuudi väärtused valikuid.

Näide. Peaaegu sama juhuslikult valitud objektide kogumit - ühe Moskva halduspiirkonna kommertspangad - võib vaadelda valimina kõigi selle piirkonna kommertspankade üldkogumist ja valimina kõigi Moskva kommertspankade üldkogumi hulgast. , samuti näidis riigi kommertspankadest jne.

Põhilised proovivõtumeetodid

Statistiliste järelduste usaldusväärsus ja tulemuste mõtestatud tõlgendamine sõltub sellest esinduslikkus proovid, st. üldkogumi omaduste esituse täielikkus ja adekvaatsus, mille suhtes võib seda valimit pidada esinduslikuks. Rahvastiku statistiliste omaduste uurimist saab korraldada kahel viisil: kasutades pidev ja katkendlik. Pidev vaatlus sisaldab kõigi läbivaatust ühikut uurinud agregaadid, a mittepidev (selektiivne) vaatlus- ainult osad sellest.

Proovivõtu korraldamiseks on viis peamist viisi:

1. lihtne juhuslik valik, kus objektid valitakse juhuslikult objektide üldkogumist (näiteks tabeli või juhuslike arvude generaatori abil) ja iga võimaliku valimi tõenäosus on võrdne. Selliseid proove nimetatakse tegelikult juhuslik;

2. lihtne valik tavalise protseduuriga tehakse mehaanilise komponendi abil (näiteks kuupäevad, nädalapäevad, korterite numbrid, tähestiku tähed jne) ning sel viisil saadud näidised nn. mehaanilised;

3. kihistunud valik seisneb selles, et mahu üldkogum jagatakse mahu alamhulkadeks või kihtideks (kihtideks), nii et . Kihid on statistiliste tunnuste poolest homogeensed objektid (näiteks rahvastik jaguneb kihtideks vanuserühma või ühiskonnaklassi järgi; ettevõtted tegevusalade järgi). Sel juhul kutsutakse proovid kihistunud(muidu, kihistunud, tüüpiline, tsoneeritud);

4. meetodid sari moodustamiseks kasutatakse valikut sari või pesastatud proovid. Need on mugavad, kui on vaja korraga uurida "plokki" või objektide seeriat (näiteks kaubasaadetist, teatud seeria tooteid või elanikkonda riigi territoriaal-haldusjaotuses). Seeriate valiku võib teha juhuslikult või mehaaniliselt. Samal ajal viiakse läbi teatud kaubapartii või kogu territoriaalüksuse (elamu või kvartal) pidev mõõdistamine;

5. kombineeritud(astmeline) valik võib kombineerida mitut valikumeetodit korraga (näiteks kihiline ja juhuslik või juhuslik ja mehaaniline); sellist näidist nimetatakse kombineeritud.

Valiku tüübid

Kõrval meelt on individuaalne, rühma- ja kombineeritud valik. Kell individuaalne valik valimikomplekti valitakse üldkogumi üksikud üksused, koos rühma valik on kvalitatiivselt homogeensed ühikute rühmad (jadad) ja kombineeritud valik hõlmab esimese ja teise tüübi kombinatsiooni.

Kõrval meetod valik eristada korduv ja mittekorduv näidis.

Kordamatu nimetatakse valikuks, mille puhul valimisse sattunud üksus ei naase algsesse üldkogumisse ega osale edasises valikus; samas kui üldrahvastiku ühikute arv N valikuprotsessi ajal vähendatud. Kell kordas valik tabatud valimis tagastatakse üksus pärast registreerimist üldkogumisse ja seega säilib võrdne võimalus koos teiste üksustega kasutada edasises valikumenetluses; samas kui üldrahvastiku ühikute arv N jääb muutumatuks (sotsiaal-majanduslikes uuringutes kasutatakse meetodit harva). Samas suure N (N → ∞) valemid kordumatu valik on lähedal omadele kordas valikut ja viimaseid kasutatakse peaaegu sagedamini ( N = konst).

Üld- ja valimikogumi parameetrite põhiomadused

Uuringu statistiliste järelduste aluseks on juhusliku suuruse jaotus, samas kui vaadeldavad väärtused (x 1, x 2, ..., x n) nimetatakse juhusliku suuruse realisatsiooniks X(n on valimi suurus). Juhusliku suuruse jaotus üldkogumis on teoreetiline, oma olemuselt ideaalne ja selle valimi analoog on empiiriline levitamine. Mõned teoreetilised jaotused on antud analüütiliselt, s.t. neid valikuid määrake jaotusfunktsiooni väärtus juhusliku suuruse võimalike väärtuste ruumi igas punktis. Seetõttu on valimi jaotusfunktsiooni määramine keeruline ja mõnikord võimatu valikuid Hinnatakse empiiriliste andmete põhjal ja seejärel asendatakse need teoreetilist jaotust kirjeldava analüütilise avaldisega. Sel juhul eeldatakse (või hüpotees) jaotuse tüübi kohta võib olla nii statistiliselt õige kui ka ekslik. Kuid igal juhul iseloomustab valimi põhjal rekonstrueeritud empiiriline jaotus tõest vaid ligikaudselt. Kõige olulisemad jaotusparameetrid on oodatud väärtus ja dispersioon.

Oma olemuselt on distributsioonid pidev ja diskreetne. Tuntuim pidev jaotus on normaalne. Parameetrite selektiivsed analoogid ja selle jaoks on: keskmine väärtus ja empiiriline dispersioon. Sotsiaal-majanduslikes uuringutes diskreetsete hulgas on kõige sagedamini kasutatav alternatiivne (dihhotoomne) levitamine. Selle jaotuse ootusparameeter väljendab suhtelist väärtust (või jagada) üldkogumi üksused, millel on uuritav tunnus (seda tähistab täht ); rahvastiku osakaalu, kellel seda tunnust ei ole, tähistatakse tähega q (q = 1 - p). Alternatiivse jaotuse dispersioonil on ka empiiriline analoog.

Olenevalt jaotuse tüübist ja populatsiooniüksuste valimise meetodist arvutatakse jaotusparameetrite karakteristikud erinevalt. Peamised teoreetiliste ja empiiriliste jaotuste jaoks on toodud tabelis. üks.

Näidisjaotus k n on valimi üldkogumi üksuste arvu ja üldkogumi ühikute arvu suhe:

k n = n/N.

Näidisosa w on ühikute suhe, millel on uuritav tunnus x valimi suuruse järgi n:

w = n n / n.

Näide. 1000 ühikut sisaldavas kaubapartiis, 5% prooviga proovi murdosa k n absoluutväärtuses on 50 ühikut. (n = N*0,05); kui selles proovis leitakse 2 defektset toodet, siis proovifraktsioon w on 0,04 (w = 2/50 = 0,04 või 4%).

Kuna valimipopulatsioon erineb üldkogumist, on neid valimi võtmise vead.

Tabel 1. Üld- ja valimipopulatsioonide peamised parameetrid

Valimi vead

Mis tahes (tahke ja valikuline) vigu võib esineda kahte tüüpi: registreerimine ja representatiivsus. Vead registreerimine võib olla juhuslik ja süstemaatiline iseloomu. Juhuslik vead koosnevad paljudest erinevatest kontrollimatutest põhjustest, on oma olemuselt tahtmatud ja tavaliselt tasakaalustavad üksteist koos (näiteks ruumi temperatuurikõikumistest tingitud muutused mõõteriistade näitudes).

Süstemaatiline vead on kallutatud, kuna rikuvad valimisse kuuluvate objektide valimise reegleid (näiteks mõõtmiste kõrvalekalded mõõteseadme seadistuste muutmisel).

Näide. Elanikkonna sotsiaalse staatuse hindamiseks linnas on kavas uurida 25% peredest. Kui aga iga neljanda korteri valikul lähtutakse selle arvust, siis on oht, et valitakse kõik ainult ühte tüüpi korterid (näiteks ühetoalised), mis toob kaasa süstemaatilise vea ja moonutab tulemusi; eelistatum on korteri numbri valik loosi teel, kuna viga on juhuslik.

Esindusvead ainult valikulisele vaatlusele omaselt ei saa neid vältida ja need tekivad seetõttu, et valim ei taasta täielikult üldist. Valimist saadud näitajate väärtused erinevad üldkogumi (või pideva vaatluse käigus saadud) samade väärtuste näitajatest.

Valimi võtmise viga on erinevus üldkogumi parameetri väärtuse ja selle valimi väärtuse vahel. Kvantitatiivse atribuudi keskmise väärtuse puhul on see võrdne: , ja osa (alternatiivne atribuut) puhul - .

Valimivead on omased ainult valimi vaatlustele. Mida suuremad on need vead, seda rohkem erineb empiiriline jaotus teoreetilisest. Empiirilise jaotuse parameetrid ja on juhuslikud muutujad, seetõttu on valimivead ka juhuslikud suurused, need võivad erinevate valimite jaoks võtta erinevaid väärtusi ja seetõttu on tavaks arvutada keskmine viga.

Keskmine proovivõtu viga on väärtus, mis väljendab valimi keskmise standardhälvet matemaatilisest ootusest. See väärtus sõltub juhusliku valiku põhimõttest lähtudes eelkõige valimi suurusest ja tunnuse variatsiooniastmest: mida suurem ja väiksem on tunnuse variatsioon (seega väärtus ), seda väiksem on tunnuse väärtus. keskmine valimi võtmise viga. Üld- ja valimipopulatsioonide dispersioonide suhet väljendatakse järgmise valemiga:

need. piisavalt suur, võime eeldada, et . Keskmine valimiviga näitab valimi üldkogumi parameetri võimalikke kõrvalekaldeid üldkogumi parameetrist. Tabelis. 2 näitab avaldisi keskmise valimivea arvutamiseks erinevate vaatluste korraldamise meetodite jaoks.

Tabel 2. Valimi keskmise ja osakaalu keskmine viga (m) eri tüüpi proovide puhul

kus on pideva tunnuse rühmasisese valimi dispersioonide keskmine;

Osaluse grupisiseste hajumiste keskmine;

— valitud seeriate arv, — seeriate koguarv;

,

kus on th seeria keskmine;

– pideva tunnuse üldkeskmine kogu valimi kohta;

,

kus on tunnuse osakaal th seerias;

— tunnuse osakaal kogu valimis.

Keskmise vea suurust saab aga hinnata vaid teatud tõenäosusega Р (Р ≤ 1). Ljapunov A.M. tõestas, et valimi keskmiste jaotus ja seega ka nende kõrvalekalded üldkeskmisest piisavalt suure arvu korral järgivad ligikaudu normaaljaotuse seadust eeldusel, et üldkogumil on lõplik keskmine ja piiratud dispersioon.

Matemaatiliselt väljendatakse seda keskmist väljendavat väidet järgmiselt:

ja murdosa jaoks on avaldis (1) järgmisel kujul:

kus - seal on marginaalne valimiviga, mis on keskmise valimivea kordne , ja kordsustegur on Studenti kriteerium ("usaldusfaktor"), mille pakkus välja W.S. Gosset (pseudonüüm "Õpilane"); erinevate valimisuuruste väärtused salvestatakse spetsiaalsesse tabelisse.

Funktsiooni Ф(t) väärtused mõne t väärtuse korral on järgmised:

Seetõttu võib avaldist (3) lugeda järgmiselt: tõenäosusega P = 0,683 (68,3%) võib väita, et erinevus valimi ja üldkeskmise vahel ei ületa üht keskmise vea väärtust m(t=1), tõenäosusega P = 0,954 (95,4%)— et see ei ületaks kahe keskmise vea väärtust m (t = 2) , tõenäosusega P = 0,997 (99,7%)- ei ületa kolme väärtust m (t = 3). Seega määrab tõenäosus, et see erinevus ületab kolmekordse keskmise vea väärtuse veatase ja ei ole rohkem kui 0,3% .

Tabelis. 3 näitab valimi piirvea arvutamise valemeid.

Tabel 3. Valimi võtmise piirviga (D) keskmise ja osakaalu (p) jaoks erinevate valimivaatluste puhul

Proovitulemuste laiendamine elanikkonnale

Valimivaatluse lõppeesmärk on iseloomustada üldkogumit. Väikeste valimite korral võivad parameetrite ( ja ) empiirilised hinnangud nende tegelikest väärtustest ( ja ) oluliselt erineda. Seetõttu on vaja kindlaks määrata piirid, mille sees asuvad parameetrite ( ja ) näidisväärtuste tegelikud väärtused ( ja ).

Usaldusvahemik mõne üldpopulatsiooni parameetri θ väärtust nimetatakse selle parameetri juhuslikuks väärtuste vahemikuks, mis tõenäosusega on lähedane 1 ( usaldusväärsus) sisaldab selle parameetri tegelikku väärtust.

piirviga proovid Δ võimaldab määrata üldrahvastiku ja nende omaduste piirväärtusi usaldusvahemikud, mis on võrdsed:

Alumine joon usaldusvahemik saadud lahutamise teel piirviga valimi keskmisest (osalus) ja ülemisest selle lisamisega.

Usaldusvahemik keskmise jaoks kasutab see valimi võtmise piirviga ja antud usaldusnivoo jaoks määratakse valemiga:

See tähendab, et etteantud tõenäosusega R, mida nimetatakse usaldustasemeks ja mis on üheselt määratud väärtusega t, võib väita, et keskmise tegelik väärtus on vahemikus alates , ja aktsia tegelik väärtus jääb vahemikku

Kolme standardse usaldustaseme usaldusvahemiku arvutamisel P = 95%, P = 99% ja P = 99,9% väärtuse valib . Rakendused sõltuvalt vabadusastmete arvust. Kui valimi suurus on piisavalt suur, siis nendele tõenäosustele vastavad väärtused t on võrdsed: 1,96, 2,58 ja 3,29 . Seega võimaldab valimi võtmise piirviga määrata üldkogumi tunnuste piirväärtused ja nende usaldusvahemikud:

Selektiivse vaatluse tulemuste jaotamisel kogu elanikkonnale sotsiaal-majanduslikes uuringutes on oma eripärad, kuna see nõuab kõigi selle tüüpide ja rühmade esinduslikkuse täielikkust. Sellise jaotuse võimalikkuse aluseks on arvutus suhteline viga:

kus Δ % - suhteline valimi piirviga; , .

Valimivaatluse laiendamiseks populatsioonile on kaks peamist meetodit: otsene teisendamine ja koefitsientide meetod.

Essents otsene teisendamine on valimi keskmise!!\overline(x) korrutamine üldkogumi suurusega .

Näide. Olgu valimimeetodil linna keskmine mudilaste arv ja ole inimene. Kui linnas on 1000 noort peret, siis saadakse munitsipaallasteaias vajalik kohtade arv korrutades selle keskmise üldrahvastiku suurusega N = 1000, s.o. saab olema 1200 kohta.

Koefitsientide meetod soovitav kasutada juhul, kui teostatakse valikulist vaatlust pideva vaatluse andmete täpsustamiseks.

Seda tehes kasutatakse valemit:

kus kõik muutujad on üldkogumi suurus:

Nõutav valimi suurus

Tabel 4. Nõutav valimi suurus (n) erinevat tüüpi valimi moodustavate organisatsioonide jaoks

Valimiuuringu kavandamisel lubatud valimivea ettemääratud väärtusega on vaja õigesti hinnata näidissuurus. Selle summa saab määrata selektiivse vaatluse käigus lubatud vea põhjal etteantud tõenäosuse alusel, mis tagab vastuvõetava veataseme (võttes arvesse vaatluse korraldamise viisi). Valemid nõutava valimi suuruse n määramiseks on kergesti leitavad otse valimi piirvea valemitest. Niisiis, piirvea avaldisest:

valimi suurus määratakse otse n:

See valem näitab seda kahaneva marginaalse valimivea korral Δ suurendab oluliselt nõutavat valimi suurust, mis on võrdeline Studenti t-testi dispersiooni ja ruuduga.

Vaatluse korraldamise konkreetse meetodi jaoks arvutatakse nõutav valimi suurus tabelis toodud valemite järgi. 9.4.

Praktilised arvutusnäited

Näide 1. Pideva kvantitatiivse karakteristiku keskmise väärtuse ja usaldusvahemiku arvutamine.

Pangas võlausaldajatega arveldamise kiiruse hindamiseks valiti juhuslikult 10 maksedokumenti. Nende väärtused osutusid võrdseks (päevades): 10; 3; viisteist; viisteist; 22; 7; kaheksa; üks; üheksateist; 20.

Tõenäosusega nõutav P = 0,954 määrata piirviga Δ valimi keskmine ja keskmise arvutusaja usalduspiirid.

Otsus. Keskmine väärtus arvutatakse tabeli valemiga. 9.1 valimi üldkogumi jaoks

Dispersioon arvutatakse tabelis toodud valemi järgi. 9.1.

Päeva keskmine ruutviga.

Keskmise viga arvutatakse järgmise valemi abil:

need. keskmine väärtus on x ± m = 12,0 ± 2,3 päeva.

Keskmise usaldusväärsus oli

Piiranguv viga arvutatakse tabelist toodud valemiga. 9.3 ümbervalimiseks, kuna populatsiooni suurus on teadmata, ja jaoks P = 0,954 usalduse tase.

Seega on keskmine väärtus `x ± D = `x ± 2m = 12,0 ± 4,6, s.o. selle tegelik väärtus jääb vahemikku 7,4–16,6 päeva.

Üliõpilaslaua kasutamine. Rakendus võimaldab järeldada, et n = 10 - 1 = 9 vabadusastme korral on saadud väärtus usaldusväärne olulisuse tasemega a £ 0,001, s.o. saadud keskmine väärtus erineb oluliselt 0-st.

Näide 2. Tõenäosuse hinnang (üldosa) r.

Mehaanilise valimimeetodiga 1000 pere sotsiaalse staatuse küsitlemisel selgus, et madala sissetulekuga perede osakaal oli w = 0,3 (30%)(proov oli 2% , st. n/N = 0,02). Nõutav usaldustasemega p = 0,997 määrake näitaja R madala sissetulekuga pered kogu piirkonnas.

Otsus. Esitatud funktsiooni väärtuste järgi Ф(t) leida antud usaldustaseme jaoks P = 0,997 tähenduses t = 3(vt valem 3). Piirosaku viga w määrake tabelist toodud valemiga. 9.3 mittekorduva proovivõtu korral (mehaaniline proovivõtt on alati mittekorduv):

Suhtelise proovivõtu vea piiramine % saab:

Madala sissetulekuga perede tõenäosus (üldine osakaal) piirkonnas on p=w±Δw, ja usalduspiirid p arvutatakse kahekordse ebavõrdsuse põhjal:

w — Δw ≤ p ≤ w — Δw, st. p tegelik väärtus asub:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

Seega võib tõenäosusega 0,997 väita, et madala sissetulekuga perede osakaal kõigi piirkonna perede seas jääb vahemikku 28,6% kuni 31,4%.

Näide 3 Intervallide seeriaga määratud diskreetse tunnuse keskmise väärtuse ja usaldusintervalli arvutamine.

Tabelis. 5. Määratakse tellimuste koostamise taotluste jaotus vastavalt nende elluviimise ajastusele ettevõtte poolt.

Tabel 5. Vaatluste jaotus esinemisaja järgi

Otsus. Keskmine tellimuse täitmise aeg arvutatakse järgmise valemiga:

Keskmine aeg on:

= (3 * 20 + 9 * 80 + 24 * 60 + 48 * 20 + 72 * 20) / 200 = 23,1 kuud

Sama vastuse saame, kui kasutame p i andmeid tabeli eelviimasest veerust. 9.5 kasutades valemit:

Pange tähele, et viimase astme intervalli keskpunkt leitakse, täiendades seda kunstlikult eelmise astme intervalli laiusega, mis on võrdne 60–36 = 24 kuud.

Dispersioon arvutatakse valemiga

kus x i- intervallide seeria keskpaik.

Seetõttu!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) ja standardviga on .

Keskmise viga arvutatakse kuude valemiga, s.o. keskmine on!!\overline(x) ± m = 23,1 ± 13,4.

Piiranguv viga arvutatakse tabelist toodud valemiga. 9.3 uuesti valimiseks, kuna populatsiooni suurus on teadmata, usaldusnivoo 0,954 korral:

Nii et keskmine on:

need. selle tegelik väärtus jääb vahemikku 0 kuni 50 kuud.

Näide 4 Kommertspangas ettevõtte N = 500 ettevõtte võlausaldajatega arveldamise kiiruse määramiseks on vaja läbi viia selektiivne uuring juhusliku mittekorduva valiku meetodil. Määrata nõutav valimi suurus n nii, et tõenäosusega P = 0,954 ei ületaks valimi keskmise viga 3 päeva, kui katsehinnangud näitasid, et standardhälve s oli 10 päeva.

Otsus. Vajalike uuringute arvu n määramiseks kasutame mittekorduva valiku valemit tabelist. 9.4:

Selles määratakse t väärtus usaldustasemele P = 0,954. See on võrdne 2-ga. Keskmine ruutväärtus s = 10, populatsiooni suurus N = 500 ja keskmise piirviga Δ x = 3. Asendades need väärtused valemisse, saame:

need. piisab, kui teha valim 41 ettevõttest, et hinnata vajalikku parameetrit - võlausaldajatega arveldamise kiirust.

Nimetatakse lahknevusi statistilise vaatluse käigus leitud mis tahes näitaja väärtuse ja selle tegeliku suuruse vahel vaatlusvead . Sõltuvalt esinemise põhjustest eristatakse registreerimisvigu ja esindusvigu.

Registreerimisvead tekkida vaatluse või küsitluse käigus ebaõige fakti leidmise või eksliku salvestuse tulemusena. Need on juhuslikud või süstemaatilised. Juhuslikke registreerimisvigu võivad oma vastustes teha nii intervjueeritavad kui ka registripidajad. Süstemaatilised vead võivad olla nii tahtlikud kui ka tahtmatud. Tahtlik – asjade tegeliku seisu teadlik, tendentslik moonutamine. Tahtmatud on põhjustatud erinevatest juhuslikest põhjustest (hooletus, tähelepanematus).

Esindusvead (representatiivsus) tekivad mittetäieliku küsitluse tulemusena ja kui küsitluspopulatsioon ei taastoo täielikult üldkogumit. Need võivad olla juhuslikud või süstemaatilised. Juhuslikud esindusvead on kõrvalekalded, mis tekivad mittepideva vaatluse käigus, kuna valitud vaatlusüksuste kogum (valim) ei taastoo täielikult kogu populatsiooni tervikuna. Esinduslikkuse eelarvamused on kõrvalekalded, mis tulenevad ühikute juhusliku valiku põhimõtete rikkumisest. Representatiivsusvead on valimivaatlusele orgaaniliselt omased ja tulenevad sellest, et valimipopulatsioon ei taastoo täielikult üldkogumit. Representatiivsusvigu vältida on võimatu, kuid suurte arvude seaduse piirteoreemide kasutamisel põhinevaid tõenäosusteooria meetodeid kasutades saab need vead taandada miinimumväärtusteni, mille piirid on seatud piisavalt suure täpsusega.

Valimivead – valimi ja üldkogumi tunnuste erinevus. Keskmise väärtuse puhul määratakse viga valemiga

kus

Väärtus
helistas piirviga proovid.

Valimi võtmise piirviga on juhuslik väärtus. Suurte arvude seaduse piirteoreemid on pühendatud juhuslike valimivigade mustrite uurimisele. Need mustrid on kõige põhjalikumalt avalikustatud P. L. Tšebõševi ja A. M. Ljapunovi teoreemides.

P. L. Tšebõševi teoreem vaadeldava meetodi suhtes võib selle sõnastada järgmiselt: piisavalt suure arvu sõltumatute vaatluste korral on võimalik ühtsuslähedase tõenäosusega (st peaaegu kindlalt) väita, et valimi kõrvalekalle tähendab üldine jääb meelevaldselt väikeseks. P. L. Tšebõševi teoreem tõestab, et vea väärtus ei tohiks ületada . Omakorda väärtus , mis väljendab valimi keskmise standardhälvet üldkeskmisest, sõltub tunnuse kõikumisest üldpopulatsioonis ja valitud ühikute arv n. Seda sõltuvust väljendatakse valemiga

, (7.2)

kus oleneb ka proovivõtumeetodist.

väärtust =helistas keskmine proovivõtuviga. Selles väljendis on üldine dispersioon, n on valimi suurus.

Vaatleme, kuidas valitud ühikute arv mõjutab keskmise vea väärtust n. Loogiliselt on lihtne kontrollida, et suure hulga ühikute valimisel on lahknevused keskmiste vahel väiksemad, st keskmise valimivea ja valitud ühikute arvu vahel on pöördvõrdeline seos. Sel juhul ei moodustu siin mitte lihtsalt pöördvõrdeline matemaatiline sõltuvus, vaid selline sõltuvus, mis näitab, et keskmiste lahknevuse ruut on pöördvõrdeline valitud ühikute arvuga.

Märgi muutlikkuse suurenemine toob kaasa standardhälbe suurenemise ja sellest tulenevalt ka vigade suurenemise. Kui eeldame, et kõik ühikud on ühesuguse tunnuse väärtusega, siis standardhälve muutub nulliks ja ka diskreetimisviga kaob. Siis pole vaja proovivõttu rakendada. Siiski tuleb meeles pidada, et tunnuse varieeruvuse suurus üldpopulatsioonis on teadmata, kuna selles sisalduvate ühikute suurused pole teada. Valimipopulatsioonis on võimalik arvutada ainult tunnuse varieeruvust. Üld- ja valimipopulatsiooni dispersioonide suhet väljendatakse valemiga

Alates väärtusest piisavalt suureks n on ühtsusele lähedane, võime ligikaudselt eeldada, et valimi dispersioon on võrdne üldise dispersiooniga, s.o.

Sellest tulenevalt näitab keskmine valimiviga, millised on võimalikud valimi üldkogumi tunnuste kõrvalekalded üldkogumi vastavatest tunnustest. Selle vea suurust saab aga hinnata teatud tõenäosusega. Kordaja näitab tõenäosuse väärtust

A. M. Ljapunovi teoreem . A. M. Ljapunov tõestas, et valimi keskmiste jaotus (seega ka nende kõrvalekalded üldkeskmisest) on piisavalt suure arvu sõltumatute vaatluste korral ligikaudu normaalne, eeldusel, et üldkogumil on lõplik keskmine ja piiratud dispersioon.

Matemaatiliselt Ljapunovi teoreem võib kirjutada nii:

(7.3)

kus
, (7.4)

kus
on matemaatiline konstant;

marginaalne valimiviga , mis võimaldab välja selgitada, millistes piirides jääb üldkeskmise väärtus.

Selle integraali väärtused usalduskoefitsiendi erinevate väärtuste jaoks t arvutatakse ja on toodud spetsiaalsetes matemaatilistes tabelites. Eelkõige siis, kui:

Niivõrd kui t näitab lahknevuse tõenäosust
, ehk tõenäosus, kui palju erineb üldkeskmine valimi keskmisest, siis saab seda lugeda järgmiselt: tõenäosusega 0,683 võib väita, et valimi ja üldkeskmise erinevus ei ületa ühte väärtust keskmisest valimiveast. Teisisõnu, 68,3% juhtudest ei lähe esindusviga kaugemale
Tõenäosusega 0,954 võib väita, et esindusviga ei ületa
(st 95% juhtudest). Tõenäosusega 0,997 ehk üsna ühele lähedaselt võib eeldada, et valimi ja üldkeskmise vahe ei ületa kolmekordset valimi keskmist viga jne.

Loogiliselt võttes tundub seos siin üsna selge: mida suuremad piirid on võimalik viga lubatud, seda tõenäolisem on selle suurust hinnata.

Tunnuse valimi keskmise väärtuse tundmine
ja marginaalne valimiviga
, on võimalik määrata piirid (limiidid), mis sisaldavad üldkeskmist

1 . Iseseisev valim - see meetod keskendub üldkogumi üksuste valimi võtmisele ilma osadeks või rühmadeks jaotamata. Samas kasutatakse valimi moodustamise põhiprintsiibi järgimiseks – üldkogumi kõikidele üksustele võrdsed võimalused olla valitud – ühikute juhusliku loosimise (loterii) teel eraldamise skeemi või juhuslike arvude tabelit. Võimalik on korduv ja mittekorduv ühikute valik

Õige juhusliku valimi keskmine viga on valimi keskmise võimalike väärtuste standardhälve üldkeskmisest. Juhusliku valiku meetodi keskmised valimivead on toodud tabelis. 7.2.

Tabel 7.2

Keskmine diskreetimisviga μ

Valides

kordas

mittekorduv

Keskmise jaoks

Tabelis kasutatakse järgmisi nimetusi:

on valimi dispersioon;

- näidissuurus;

- üldrahvastiku suurus;

on nende üksuste valimi osakaal, millel on uuritav tunnus;

- uuritava tunnusega ühikute arv;

- näidissuurus.

Täpsuse suurendamiseks kordaja asemel võta kordaja
, kuid suure hulgaga N erinevus nende väljendite vahel ei oma praktilist tähtsust.

Õige juhusliku valimi piirviga
arvutatakse valemiga

, (7.6)

kus t – usalduskoefitsient sõltub tõenäosuse väärtusest.

Näide. Uurides sadat partiist juhuslikult valitud tootenäidist, osutus 20 ebastandardseks. Tõenäosusega 0,954 määrake piirid, milles on mittestandardsete toodete osakaal partiis.

Otsus. Arvutage kogu osa ( R):
.

Mittestandardsete toodete osakaal:
.

Proovifraktsiooni piirviga tõenäosusega 0,954 arvutatakse valemiga (7.6), kasutades tabelis toodud valemit. 7.2 jagamiseks:

Tõenäosusega 0,954 võib väita, et mittestandardsete toodete osakaal kaubapartiis jääb 12% piiresse ≤ P≤ 28 %.

Valimivaatluse kujundamise praktikas tekib vajadus määrata valimi suurus, mis on vajalik teatud täpsuse tagamiseks üldkeskmiste arvutamisel. Sel juhul on antud valiku piirviga ja selle tõenäosus. Valemist
ja keskmiste valimivigade valemid, määratakse nõutav valimi suurus. Valimi suuruse määramise valemid ( n) sõltuvad valikumeetodist. Valimi suuruse arvutamine tegeliku juhusliku valimi jaoks on toodud tabelis. 7.3.

Tabel 7.3

Mõeldud valik

keskmise jaoks

Korduv

mittekorduv

2 . Mehaaniline proovivõtt - selle meetodi puhul lähtuvad nad üldpopulatsioonis objektide paiknemise mõningate tunnuste, nende järjestuse (nimekirja, numbri, tähestiku järgi) arvestamisest. Mehaaniline proovide võtmine toimub üldpopulatsiooni üksikute objektide valimisel teatud intervalliga (iga 10. või 20. järel). Intervall arvutatakse suhtena , kus n- näidissuurus, N- üldrahvastiku suurus. Seega, kui 500 000 ühiku suurusest populatsioonist peaks saama 2% valimi, st valima 10 000 ühikut, siis on valiku osakaal
Osakute valik toimub vastavalt kehtestatud proportsioonile korrapäraste ajavahemike järel. Kui objektide asukoht üldkogumis on juhuslik, siis mehaaniline valim on sisult sarnane juhusliku valikuga. Mehaanilise valiku puhul kasutatakse ainult mittekorduvat proovivõttu.

Keskmine viga ja valimi suurus mehaanilisel valikul arvutatakse õige juhusliku valimi valemite järgi (vt tabelid 7.2 ja 7.3).

3 . Tüüpiline näidis , mille juures üldpopulatsioon jaguneb mõne olulise tunnuse järgi tüüpilisteks rühmadeks; ühikute valik tehakse tüüpiliste rühmade järgi. Selle valikumeetodiga jagatakse üldpopulatsioon mõnes mõttes homogeenseteks rühmadeks, millel on oma eripärad, ning küsimus taandatakse igast rühmast valimi suuruse määramisele. Võib olla ühtne proovide võtmine - selle meetodiga valitakse igast tüüpilisest rühmast sama arv ühikuid
Selline lähenemine on õigustatud ainult siis, kui algsete tüüpiliste rühmade suurused on võrdsed. Tüüpilises valikus jagatakse rühmade suurusega ebaproportsionaalselt valitud üksuste koguarv tüüpiliste rühmade arvuga, saadud väärtus annab valiku arvu igast tüüpilisest rühmast.

Täpsem valikuvorm on proportsionaalne valim . Sellist proovivõtuskeemi nimetatakse proportsionaalseks, kui üldkogumi igast tüüpilisest rühmast võetud proovide arv on võrdeline arvude, dispersioonide (või kombineeritud ja arvude ning dispersioonidega). Tinglikult määrame valimi suuruse 100 ühikut ja valime ühikud rühmadest:

proportsionaalselt nende üldrahvastiku suurusega (Tabel 7.4). Tabel näitab:

N i on tüüpilise rühma suurus;

d j- jaga ( N ma / N);

N- üldrahvastiku suurus;

n i– arvutatakse tüüpilise rühma valimi suurus:

, (7.7)

n on üldkogumi valimi suurus.

Tabel 7.4

N i

d j

n i

võrdeline standardhälbega (Tabel 7.5).

siin  i– tüüpiliste rühmade standardhälve;

n i – tüüpilise rühma valimi suurus arvutatakse valemiga

(7.8)

Tabel 7.5

N i

n i

kombineeritud (Tabel 7.6).

Valimi suurus arvutatakse valemiga

. (7.9)

Tabel 7.6

i N i

Tüüpilise valimi läbiviimisel tehakse igast rühmast otsevalik juhusliku valiku teel.

Keskmised valimivead arvutatakse tabelis toodud valemite abil. 7.7 sõltuvalt tüüpiliste rühmade hulgast valimise meetodist.

Tabel 7.7

Valikumeetod

Korduv

mittekorduv

keskmise jaoks

jagamiseks

keskmise jaoks

jagamiseks

Ebaproportsionaalne rühma suurusega

Proportsionaalne rühma suurusega

Proportsionaalne kõikumine rühmades (on kõige kasulikum)

siin
on tüüpiliste rühmade grupisiseste dispersioonide keskmine;

on üksuste osakaal, millel on uuritav tunnus;

on osa rühmasiseste erinevuste keskmine;

on standardhälve valimis i-th tüüpiline rühm;

on tüüpilise rühma valimi suurus;

on kogu valimi suurus;

on tüüpilise rühma maht;

- üldrahvastiku maht.

Iga tüüpilise rühma valimi suurus peaks olema proportsionaalne selle rühma standardhälbega.
.Arvu arvutamine
toodetud vastavalt tabelis toodud valemitele. 7.8.

Tabel 7.8

4 . seeriaproovide võtmine - kasulik juhtudel, kui üldkogumi üksused on rühmitatud väikestesse rühmadesse või seeriatesse. Jadavalimiga jagatakse üldkogum ühesuurusteks rühmadeks – seeriateks. Seeriad valitakse näidiskomplekti. Jadavalimi võtmise olemus seisneb seeriate juhuslikus või mehaanilises valikus, mille raames viiakse läbi pidev ühikute uuring. Võrdsete seeriatega jadavalimi keskmine viga sõltub ainult rühmadevahelise dispersiooni väärtusest. Keskmised vead on kokku võetud tabelis. 7.9.

Tabel 7.9

Sarja valiku meetod

keskmise jaoks

jagamiseks

Korduv

mittekorduv

Siin R on seeriate arv üldkogumis;

r– valitud seeriate arv;

– vahendite seeriate (rühmadevaheline) dispersioon;

– aktsia seeriatevaheline (gruppidevaheline) dispersioon.

Seeriavaliku puhul määratakse valitud seeriate vajalik arv samamoodi nagu õige juhusliku valiku meetodi puhul.

Seerianäidiste arvu arvutamine toimub tabelis toodud valemite järgi. 7.10.

Tabel 7.10

Näide. Tehase masinatsehhis töötab kümnes meeskonnas 100 töölist. Töötajate kvalifikatsiooni uurimiseks koostati 20%-line mittekorduv jadavalim, mis hõlmas kahte meeskonda. Saadi järgmine küsitletud töötajate jaotus kategooriate kaupa:

Tööliste auastmed brigaadis 1

Tööliste auastmed brigaadis 2

Tööliste auastmed brigaadis 1

Tööliste auastmed brigaadis 2

Tõenäosusega 0,997 on vaja määrata piirid, milles masinatöökoja töötajate keskmine kategooria asub.

Otsus. Määratleme meeskondade valimi keskmised ja üldkeskmise rühma keskmiste kaalutud keskmisena:

Määrame seeriatevahelise dispersiooni valemitega (5.25):

Arvutame keskmise valimivea tabelis toodud valemi abil. 7.9:

Arvutame valimi piirvea tõenäosusega 0,997:

Tõenäosusega 0,997 võib väita, et masinatöökoja töötajate keskmine auaste jääb

Valiminäitajate usaldusväärsuse iseloomustamiseks eristatakse keskmisi ja piirvigu, mis on iseloomulikud ainult valimivaatlustele. Need näitajad peegeldavad erinevust valimi ja vastavate üldnäitajate vahel.

Näidise keskmine viga määratakse eelkõige valimi suuruse järgi ja see sõltub uuritava tunnuse struktuurist ja variatsiooniastmest.

Keskmise valimivea tähendus on järgmine. Valimi murdosa (w) ja valimi keskmise () arvutatud väärtused on oma olemuselt juhuslikud suurused. Need võivad omandada erinevaid väärtusi olenevalt sellest, millised üldkogumi konkreetsed üksused valimisse kuuluvad. Näiteks kui ettevõtte töötajate keskmise vanuse määramisel on ühes valimis rohkem noori ja teises vanemaid töötajaid, siis on valimi keskmised ja valimi vead erinevad. Keskmine proovivõtu viga määratakse järgmise valemiga:

(27) või – resampling. (28)

kus: μ on keskmine diskreetimisviga;

σ on tunnuse standardhälve üldpopulatsioonis;

n on valimi suurus.

Veaväärtus μ näitab, kuidas valimiga määratud tunnuse keskmine väärtus erineb tunnuse tegelikust väärtusest üldkogumis.

Valemist järeldub, et valimiviga on otseselt võrdeline standardhälbega ja pöördvõrdeline valimi ühikute arvu ruutjuurega. See tähendab näiteks seda, et mida suurem on mingi tunnuse väärtuste levik üldkogumis ehk mida suurem on dispersioon, seda suurem peaks olema valimi suurus, kui tahame usaldada valimuuringu tulemusi. . Ja vastupidi, väikese dispersiooniga saab piirduda väikese arvu valimipopulatsioonidega. Proovivõtu viga jääb siis vastuvõetavatesse piiridesse.

Kuna mittekorduva valiku korral üldkogumi N suurus valimi moodustamise ajal väheneb, on keskmise valimi vea arvutamise valemis lisatud lisategur.

(üks- ). Keskmise valimivea valem on järgmine:

Keskmine viga on mittekorduva valimi puhul väiksem, mis teeb selle laialdasema kasutuse.

Praktilised järeldused nõuavad üldpopulatsiooni iseloomustamist valimitulemuste põhjal. Valimi keskmisi ja proportsioone rakendatakse üldkogumile, arvestades nende võimaliku vea piiri ja seda garanteeriva tõenäosuse tasemega. Arvestades teatud tõenäosuse taset, valitakse normaliseeritud hälbe väärtus ja määratakse valimi võtmise piirviga.

Hinnangu X usaldusväärsus (usaldustõenäosus) X võrra* nimetatakse tõenäosuseks γ , millega ebavõrdsus


׀Х-Х*׀< δ, (30)

kus δ on valimimise piirviga, mis iseloomustab selle intervalli laiust, milles leitakse üldkogumi uuritava parameetri väärtus tõenäosusega γ.

Usaldusväärne nimeta intervall (X* - δ; X* + δ), mis katab uuritavat parameetrit X (st parameetri X väärtus on selle intervalli sees) antud usaldusväärsusega γ.

Tavaliselt määratakse hinnangu usaldusväärsus ette ja ühele lähedane arv võetakse γ: 0,95; 0,99 või 0,999.

Piiranguv viga δ on seotud keskmise veaga μ järgmiselt: , (31)

kus: t on tõenäosusest P sõltuv usaldustegur, millega saab väita, et piirviga δ ei ületa t-kordset keskmist viga μ (seda nimetatakse ka Studenti jaotuse kriitilisteks punktideks või kvantilideks).

Nagu suhtarvust järeldub, on piirviga otseselt võrdeline keskmise valimivea ja usalduskoefitsiendiga, mis sõltub antud hinnangu usaldusväärsuse tasemest.

Keskmise valimivea ning piir- ja keskmiste vigade suhte valemist saame:

Võttes arvesse usalduse tõenäosust, saab see valem sellise kuju.

Keskmine valimiviga näitab, kui palju valimi üldkogumi parameeter keskmiselt erineb üldkogumi vastavast parameetrist. Kui arvutame antud mahu teatud tüüpi kõigi võimalike valimite vigade keskmise ( n) eraldatud samast üldpopulatsioonist, siis saame nende üldistava karakteristiku - keskmine diskreetimisviga ().

Selektiivse vaatluse teoorias on tuletatud valemid, mis on erinevate valikumeetodite (korduv ja mittekorduv), kasutatavate valimitüüpide ja hinnanguliste statistiliste näitajate tüüpide jaoks individuaalsed.

Näiteks kui kasutatakse korduvat juhuslikku valimit, määratletakse see järgmiselt:

tunnuse keskmise väärtuse hindamisel;

Kui märk on alternatiivne, ja osakaal on hinnanguline.

Mittekorduva juhusliku valiku korral valemeid muudetakse (1 - n/N):

- atribuudi keskmise väärtuse jaoks;

- aktsia eest.

Just sellise veaväärtuse saamise tõenäosus on alati 0,683. Praktikas eelistatakse andmeid hankida suurema tõenäosusega, kuid see toob kaasa valimivea suuruse suurenemise.

Valimimise piirviga () võrdub t-ga keskmiste valimivigade arvuga (valimise teoorias on tavaks nimetada koefitsienti t usalduskoefitsiendiks):

Kui diskreetimisviga kahekordistada (t = 2), siis saame palju suurema tõenäosuse, et see ei ületa teatud piiri (meie puhul kahekordne keskmine viga) - 0,954. Kui võtame t \u003d 3, siis on usaldusnivoo 0,997 - praktiliselt kindlus.

Valimi võtmise piirvea tase sõltub järgmistest teguritest:

  • üldkogumi ühikute varieeruvuse määr;
  • näidissuurus;
  • valitud valikuskeemid (mittekorduv valik annab väiksema veaväärtuse);
  • usalduse tase.

Kui valimi suurus on suurem kui 30, siis määratakse t väärtus normaaljaotuse tabelist, kui vähem - Studenti jaotustabelist.

Siin on mõned usalduskoefitsiendi väärtused normaaljaotuse tabelist.

Atribuudi keskmise väärtuse ja üldkogumi osakaalu usaldusvahemik määratakse järgmiselt:

Seega koosneb üldkeskmise ja osakaalu piiride määratlemine järgmistest sammudest:

Valimivead erinevat tüüpi valiku puhul

  1. Tegelikult juhuslik ja mehaaniline proovivõtt. Tegeliku juhusliku ja mehaanilise valimi keskmine viga leitakse tabelis toodud valemite abil. 11.3.

Näide 11.2. Varade tootluse taseme uurimiseks viidi juhusliku kordusvalimi meetodil läbi 90 ettevõtte 225-st valikuuringu, mille tulemusena saadi tabelis toodud andmed.

Selles näites on meil 40% valim (90: 225 = 0,4 või 40%). Määrame selle piirvea ja tunnuse keskmise väärtuse piirid üldkogumis algoritmi sammude abil:

  1. Valimiküsitluse tulemuste põhjal arvutame välja valimikogumi keskmise väärtuse ja dispersiooni:
Tabel 11.5.
Vaatlustulemused Hinnangulised väärtused
varade tootlus, rub., x i ettevõtete arv, f i intervalli keskel, x i \xb4 x i \xb4 f i x i \xb4 2 f i
Kuni 1.4 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2.2 ja uuemad 14 2,3 32,2 74,06
Kokku 90 - 162,6 303,62

Näidiskeskmine

Uuritava tunnuse näidisvariatsioon

Meie andmete jaoks defineerime valimi piirvea, näiteks tõenäosusega 0,954. Normaaljaotusfunktsiooni tõenäosusväärtuste tabeli järgi (vt selle väljavõtet lisas 1) leiame tõenäosusele 0,954 vastava usalduskoefitsiendi t väärtuse. Tõenäosusega 0,954 on koefitsient t 2.

Seega 954 juhul 1000-st ei ületa varade keskmine tootlus 1,88 rubla. ja mitte vähem kui 1,74 rubla.

Ülalpool kasutati korduvat juhusliku valiku skeemi. Vaatame, kas küsitluse tulemused muutuvad, kui eeldame, et valik viidi läbi mittekorduva valiku skeemi järgi. Sel juhul arvutatakse keskmine viga valemi abil

Siis tõenäosusega 0,954 on valimi võtmise piirviga:

Mittekorduva juhusliku valiku korral on tunnuse keskmise väärtuse usalduspiiridel järgmised väärtused:

Võrreldes kahe valikuskeemi tulemusi, võime järeldada, et mittekorduva juhusliku valimi kasutamine annab täpsemad tulemused võrreldes sama usaldusnivooga korduva valiku kasutamisega. Samal ajal, mida suurem on valimi suurus, seda olulisem on keskmiste väärtuste piirid ühelt valikuskeemilt teisele liikumisel kitsamaks muuta.

Näite kohaselt määrame kindlaks nende ettevõtete osakaalu piirid, mille varade tootlus ei ületa 2,0 rubla üldkogumis:

  1. Arvutame valimisageduse.

Valimi ettevõtete arv, mille varade tootlus ei ületa 2,0 rubla, on 60 ühikut. Siis

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

  1. arvutada osakaalu dispersioon valimikogumis
  1. keskmine valimiviga korduva valikuskeemi kasutamisel on

Kui eeldada, et kasutati mittekorduvat valikuskeemi, siis keskmine valimiviga, võttes arvesse üldkogumi lõplikkuse korrektsiooni, on

  1. määrame usalduse tõenäosuse ja määrame valimi võtmise piirvea.

Tõenäosuse väärtusega P = 0,997 saame normaaljaotuse tabeli järgi usalduskoefitsiendi väärtuse t = 3 (vt selle väljavõtet lisas 1):

Seega võib tõenäosusega 0,997 väita, et ettevõtete osatähtsus, mille varade tulusus ei ületa 2,0 rubla, on üldkogumis vähemalt 54,7% ja mitte rohkem kui 78,7%.

  1. Tüüpiline näidis. Tüüpilise valimi korral jagatakse objektide üldkogum k rühma, siis

N 1 + N 2 + ... + N i + ... + N k = N.

Igast tüüpilisest rühmast eraldatud ühikute maht sõltub valitud valikumeetodist; nende koguarv moodustab nõutava valimi suuruse

n 1 + n 2 + … + n i + … + n k = n.

Tüüpilise rühma sees valiku korraldamiseks on kaks võimalust: proportsionaalne tüüpiliste rühmade mahuga ja proportsionaalne atribuudi väärtuste kõikumise astmega vaatlusühikutes rühmades. Kaaluge neist esimest kui kõige sagedamini kasutatavat.

Tüüpiliste rühmade suurusega proportsionaalne valik eeldab, et igas neist valitakse järgmine arv populatsiooniühikuid:

n = n i N i /N

kus n i on i-nda tüüpilise rühma proovi ekstraheeritavate ühikute arv;

n on valimi kogumaht;

N i - i-nda tüüpilise rühma moodustanud üldkogumi üksuste arv;

N on ühikute koguarv üldkogumis.

Rühmasisesed ühikud valitakse juhusliku või mehaanilise valimi vormis.

Valemid keskmise ja osakaalu keskmise valimivea hindamiseks on esitatud tabelis. 11.6.

Siin on tüüpiliste rühmade rühmade erinevuste keskmine.

Näide 11.3. Ühes Moskva ülikoolis viidi läbi üliõpilaste valikuuring, et määrata ülikooli raamatukogu ühe üliõpilase keskmise külastatavuse näitaja semestris. Selleks kasutati 5% mittekordavat tüüpilist valimit, mille tüüpilised rühmad vastavad kursuse numbrile. Valides proportsionaalselt tüüpiliste rühmade mahuga, saadi järgmised andmed:

Tabel 11.7.
Kursuse number Üliõpilasi kokku, inimesi, N i Selektiivse vaatluse tulemusena uuriti inimesi, n i Keskmine raamatukogukülastuste arv üliõpilase kohta semestris, x i Grupisisese valimi dispersioon,
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
Kokku 2 550 128 8 -

Igal kursusel eksamineeritavate üliõpilaste arv arvutatakse järgmiselt:

Sarnane teiste rühmade jaoks:

n 2 \u003d 31 (inimesed);

n 3 \u003d 29 (inimesed);

Valimi keskmiste väärtuste jaotusel on alati normaaljaotuse seadus (või läheneb sellele), kui n > 100, olenemata üldkogumi jaotuse olemusest. Väikeste valimite puhul kehtib aga erinev jaotusseadus - Studenti jaotus. Sel juhul leitakse usalduskoefitsient Studenti t-jaotuse tabeli järgi, olenevalt usalduse tõenäosuse P väärtusest ja valimi suurusest n. Lisas 1 on toodud fragment Studenti t-jaotuse tabelist, mis on esitatud sõltuvusena valimi suuruse usalduse tõenäosuse ja usalduskoefitsiendi t.

Näide 11.4. Oletame, et kaheksa akadeemia üliõpilase valimküsitlus näitas, et nad kulutasid statistika testiks valmistumiseks järgmise arvu tunde: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6.6.

Hindame valimi keskmist kulutatud aega ja koostame üldkogumi atribuudi keskmise väärtuse usaldusvahemiku, võttes usalduse tõenäosuseks 0,95.

See tähendab, et tõenäosusega 0,95 võib väita, et õpilase testiks valmistumisele kuluv aeg jääb vahemikku 6,9–8,5 tundi.

11.2.2. Valimi suuruse määramine

Enne otsevalimi moodustamist otsustatakse alati küsimus, mitu ühikut uuritavast populatsioonist tuleks uuringusse valida. Valimi suuruse määramise valemid tuletatakse valimi piirvigade valemitest vastavalt järgmistele eeldustele (tabel 11.7):

  1. kavandatava proovi tüüp;
  2. valikumeetod (korduv või mittekorduv);
  3. hinnangulise parameetri valik (objekti või osa keskmine väärtus).

Lisaks on vaja eelnevalt kindlaks määrata teabe tarbijale sobiv usaldustõenäosuse väärtus ja lubatava valimi piirvea suurus.

Märkus: tabelis toodud valemite kasutamisel on soovitatav saadud valimi suurus ümardada ülespoole, et anda täpsusvaru.

Näide 11.5. Arvutagem välja, mitut 507 tööstusettevõttest peaks maksuinspektsioon kontrollima, et määrata maksurikkumistega ettevõtete osakaalu tõenäosusega 0,997. Eelmise sarnase uuringu järgi oli standardhälbe väärtus 0,15; valimivea suurus ei tohi olla suurem kui 0,05.

Korduva juhusliku valiku kasutamisel kontrollige

Mittekorduva juhusliku valiku korral on vaja kontrollida

Nagu näete, võimaldab mittekorduva proovivõtu kasutamine uurida palju väiksemat arvu objekte.

Näide 11.6. Tööstusharu ettevõtetes on kavas läbi viia palgauuring juhusliku mittekorduva valiku meetodil. Kui suur peaks olema valim, kui uuringu ajal oli tööstusharu hõivatute arv 100 000 inimest? Valimi võtmise piirviga ei tohiks ületada 100 rubla. tõenäosusega 0,954. Tööstuse varasemate palkade uuringute tulemuste põhjal on teada, et standardhälve on 500 rubla.

Seetõttu on probleemi lahendamiseks vaja valimisse kaasata vähemalt 100 inimest.

Keskmine proovivõtu viga

Valimikomplekti saab moodustada statistiliste väärtuste kvantitatiivse märgi alusel, samuti alternatiivsel või atributiivsel alusel. Esimesel juhul on valimit üldistavaks tunnuseks näidis keskmine märgitud kogus , ja teises - näidisosa kogused, tähistatud w.Üldpopulatsioonis vastavalt: üldine keskmine ja jõe üldine osa.

Erinevused -- ja W -- lk helistas proovivõtu viga, mis jaguneb registreerimisveaks ja esindusveaks. Valimivea esimene osa tekib ebaõige või ebatäpse teabe tõttu, mis on tingitud probleemi olemuse valesti mõistmisest, registripidaja hoolimatusest ankeetide, vormide jms täitmisel. Seda on üsna lihtne tuvastada ja parandada. Vea teine ​​osa tuleneb juhusliku valiku põhimõtte pidevast või spontaansest mittejärgimisest. Seda on raske tuvastada ja kõrvaldada, see on palju suurem kui esimene ja seetõttu pööratakse sellele põhitähelepanu.

Valimivea väärtus sõltub viimase struktuurist. Näiteks kui teaduskonna üliõpilaste keskmise hindepunkti määramisel arvatakse ühte valimisse rohkem suurepäraseid tudengeid ja teises rohkem kaotajaid, siis on valimi keskmised hinded ja valimivead erinevad.

Seetõttu määratakse statistikas korduva ja mittekorduva valimi keskmine viga selle spetsiifilise standardhälbe kujul vastavalt valemitele

= - korduv; (1,35)

= - mittekorduv; (1,36)

kus Dv on valimi dispersioon, mis määratakse statistiliste väärtuste kvantitatiivse märgiga 2. peatüki tavaliste valemite kohaselt.

Alternatiivse või omistava märgi korral määratakse valimi dispersioon valemiga

Dv \u003d w (1-w). (1.37)

Valemitest (1.35) ja (1.36) on näha, et mittekorduva valimi puhul on keskmine viga väiksem, mis määrab selle laiema kasutusala.

Valimi võtmise piirviga

Arvestades, et valikuuringu põhjal on võimatu täpselt hinnata üldkogumi uuritavat parameetrit (näiteks keskväärtust), tuleb leida piirid, milles see asub. Konkreetses proovis võib erinevus olla suurem, väiksem või võrdne. Igal kõrvalekaldumisel on teatud tõenäosus. Valimküsitluses on tegelik väärtus üldkogumis teadmata. Teades keskmist valimiviga, on teatud tõenäosusega võimalik hinnata valimi keskmise hälvet üldisest ja määrata kindlaks piirid, mille piires uuritav parameeter (antud juhul keskmine väärtus) üldkogumis paikneb. . Valimikarakteristiku kõrvalekallet üldisest nimetatakse marginaalne valimiviga. See on määratletud kui murdosa keskmisest veast antud tõenäosusega, s.o.

= t, (1.38)

kus t - usalduse tegur, olenevalt valimi võtmise piirvea määramise tõenäosusest.

Teatud valimivea esinemise tõenäosus leitakse tõenäosusteooria teoreemide abil. P. L. Tšebõševi teoreemi järgi piisavalt suure valimi ja piiratud populatsiooni dispersiooni korral on tõenäosus, et valimi keskmise ja üldkeskmise erinevus on suvaliselt väike, ligi üks:

A. M. Ljapunov tõestas seda olenemata üldkogumi jaotuse iseloomust läheneb valimi suuruse suurenemisega ühe või teise valimi keskmise väärtuse esinemise tõenäosusjaotus normaaljaotusele. See on nn keskpiiri teoreem. Seetõttu on valimi keskmise kõrvalekaldumise tõenäosus üldkeskmisest, s.o. antud piirava vea esinemise tõenäosus järgib samuti määratud seadust ja on leitav funktsioonina t kasutades Laplace'i tõenäosusintegraali:

kus on valimi keskmise normaliseeritud hälve üldkeskmisest.

Laplace'i integraali väärtused erinevatele t arvutatud ja saadaval spetsiaalsetes tabelites, mille kombinatsiooni kasutatakse statistikas laialdaselt:

Tõenäosus

Arvestades teatud tõenäosuse taset, valige normaliseeritud hälbe väärtus t ja määrake valimi võtmise piirviga valemiga (1.38)

Sel juhul = 0,95 ja t= 1,96, s.o. arvestage, et tõenäosusega 95% on valimi võtmise piirviga kaks korda suurem. Seetõttu on statistikas väärtus t mõnikord viidatud piirvea kordustegur keskmise suhtes.

Peale piirvea arvutamist leitakse üldkogumi üldistava tunnuse usaldusvahemik. Sellisel intervallil üldkeskmise jaoks on vorm

(-) (+), (1.39)

ja samamoodi üldaktsia puhul

(w-)p(w+). (1.40)

Järelikult ei määrata selektiivse vaatluse käigus mitte üht täpset üldkogumi üldistava tunnuse väärtust, vaid ainult selle usaldusvahemikku antud tõenäosustasemega. Ja see on statistika valimimeetodi tõsine puudus.

Valimi suuruse määramine

Selektiivse vaatluse programmi väljatöötamisel antakse mõnikord neile piirvea konkreetne väärtus tõenäosuse tasemega. Minimaalne valimi suurus, mis tagab antud täpsuse, jääb teadmata. Selle saab olenevalt valimi tüübist saada keskmise ja piirvea valemitest. Niisiis, asendades valemid esmalt (1.35) ja seejärel (1.36) valemiga (1.38) ja lahendades selle valimi suuruse suhtes, saame järgmised valemid

uuesti proovivõtuks

uuesti proovivõtu puudumiseks

Lisaks peab kvantitatiivsete tunnustega statistiliste väärtuste puhul teadma ka valimi dispersiooni, kuid arvutuste alguseks pole seegi teada. Seetõttu võetakse seda ligikaudu ühel järgmistest viisidest:

võetud varasematest proovivaatlustest;

vastavalt reeglile, et variatsioonivahemik sobib umbes kuue standardhälbega (R/ = 6 või R/ = 6; siit D = R 2 /36);

Vastavalt “kolme sigma” reeglile, mille kohaselt mahub keskmisesse väärtusse ligikaudu kolm standardhälvet (/ \u003d 3; seega \u003d / 3 või D = 2 /9).

Mittearvuliste tunnuste uurimisel aktsepteeritakse seda isegi siis, kui proovifraktsiooni kohta pole ligikaudset teavet w= 0,5, mis valemi (1,37) järgi vastab valimi dispersioonile summas Dv = 0,5(1-0,5) = 0,25.