Biograafiad Tehnilised andmed Analüüs

Valimi piirvea arvutamiseks peate kohandama. Usaldusvalem üldkeskmise hindamisel

Proovivõtu viga- see on objektiivselt tekkiv lahknevus valimi ja üldkogumi omaduste vahel. See sõltub mitmest tegurist: uuritava tunnuse varieerumisastmest, valimi suurusest, valimis üksuste valimise meetodist, uurimistulemuse aktsepteeritud usaldusväärsuse tasemest.

Valimi esinduslikkuse jaoks on oluline tagada valiku juhuslikkus, et kõik üldkogumi objektid oleksid võrdse tõenäosusega valimisse sattuda. Valimi esinduslikkuse tagamiseks kasutatakse järgmisi valikumeetodeid:

· õige juhuslik(lihtne juhuslik) valim (esimene juhuslik objekt valitakse järjestikku);

· mehaanilised(süstemaatiline) proovide võtmine;

· tüüpiline(kihistunud, stratifitseeritud) valim (objektid valitakse proportsionaalselt eri tüüpi objektide esindatusega üldkogumis);

· sari(pesastatud) näidis.

Valimikomplekti kuuluvate ühikute valik võib olla korduv või mittekorduv. Kell uuesti valik proovi üksus läbib läbivaatuse, s.o. registreerib selle tunnuste väärtused, tagastatakse üldkogumile ja osaleb koos teiste üksustega edasises valikumenetluses. Kell ümbervalimiseta valimisse kuuluv üksus kontrollitakse ega osale edasises valikumenetluses

Valikuline vaatlus on alati seotud veaga, kuna valitud ühikute arv ei ole võrdne algse (üldise) populatsiooniga. Juhusliku valimi võtmise vead on tingitud juhuslike tegurite mõjust, mis ei sisalda ühtki järjepidevuse elementi arvutatud valimi karakteristikute mõju suunas. Isegi kõigi valimipopulatsiooni moodustamise põhimõtete range järgimisel on valimi- ja üldomadused mõnevõrra erinevad. Seetõttu tuleb tekkivaid juhuslikke vigu statistiliselt hinnata ja võtta arvesse valimivaatluse tulemuste laiendamisel kogu populatsioonile. Selliste vigade hindamine on valikulise vaatluse teoorias lahendatud põhiprobleem. Pöördülesanne on määrata selline minimaalne nõutav valimipopulatsiooni arv, milles viga ei ületa etteantud väärtust. Selle jaotise materjal on suunatud nende probleemide lahendamise oskuste arendamisele.

Iseseisev valim. Selle olemus seisneb üksuste valimises üldpopulatsioonist kui tervikust, jagamata seda rühmadeks, alarühmadeks või üksikute üksuste jadaks. Sel juhul valitakse ühikud juhuslikus järjekorras, mis ei sõltu ei ühikute järjestusest agregaadis ega nende omaduste väärtustest.

Pärast valikut, kasutades ühte juhuslikkuse printsiipi rakendavatest algoritmidest või tuginedes juhuslike arvude tabelile, määratakse üldtunnuste piirid. Selleks arvutatakse välja keskmised ja piirvead.

Korduva juhusliku valimi keskmine viga määratakse valemiga

kus σ on uuritava tunnuse standardhälve;

n on valimi üldkogumi maht (ühikute arv).

Valimi võtmise piirviga seostatakse antud tõenäosuse tasemega. Allpool toodud ülesannete lahendamisel on nõutav tõenäosus 0,954 (t = 2) või 0,997 (t = 3). Võttes arvesse valitud tõenäosuse taset ja sellele vastavat t väärtust, on valimi võtmise piirviga:

Siis võib väita, et antud tõenäosuse korral jääb üldine keskmine järgmistesse piiridesse:

Piiride määratlemisel üldine aktsia keskmise valimivea arvutamisel kasutatakse alternatiivse atribuudi dispersiooni, mis arvutatakse järgmise valemiga:

kus w on valimi osakaal, st nende üksuste osakaal, millel on uuritava tunnuse teatud variant või variandid.

Üksikülesannete lahendamisel tuleb arvestada, et alternatiivse tunnuse tundmatu dispersiooni korral saate kasutada selle maksimaalset võimalikku väärtust, mis on võrdne 0,25-ga.

Näide. alusel läbi viidud tööd otsiva töötu elanikkonna valikuuringu tulemusena isejuhuslik uuesti valimine sai tabelis näidatud andmed. 1.14.

Tabel 1.14

Töötu elanikkonna valikuuringu tulemused

Tõenäosusega 0,954 määrake piirid:

a) töötute keskmine vanus;

b) alla 25-aastaste isikute osatähtsus (osakaal) kogu töötutest.

Otsus. Keskmise valimivea määramiseks on vaja ennekõike määrata uuritava tunnuse valimi keskmine ja dispersioon. Selleks on käsitsi arvutamise meetodil soovitatav koostada tabel 1.15.

Tabel 1.15

Töötu elanikkonna keskmise vanuse ja hajuvuse arvutamine

Tabeli andmete põhjal arvutatakse vajalikud näitajad:

näidis keskmine:

;

dispersioon:

standardhälve:

.

Keskmine proovivõtu viga on:

aasta.

Määrame tõenäosusega 0,954 ( t= 2) valimi võtmise piirviga:

aasta.

Määrake üldkeskmise piirid: (41,2 - 1,6) (41,2 + 1,6) või:

Seega saame läbiviidud valikuuringu põhjal tõenäosusega 0,954 järeldada, et tööd otsiva töötu elanikkonna keskmine vanus jääb vahemikku 40–43 aastat.

Selle näite punktis "b" esitatud küsimusele vastamiseks määrame näidisandmete abil alla 25-aastaste inimeste osakaalu ja arvutame osakaalu hajumise:

Arvutage keskmine diskreetimisviga:

Valimi võtmise piirviga antud tõenäosusega on:

Määratleme üldaktsia piirid:

Seetõttu võib tõenäosusega 0,954 väita, et alla 25-aastaste osakaal töötute koguarvust jääb vahemikku 3,9–1,9%.

Keskmise vea arvutamisel tegelikult juhuslik mittekorduv valimi võtmisel on vaja arvesse võtta valiku mittekordumise korrigeerimist:

kus N on üldkogumi maht (ühikute arv) /

Isejuhusliku kordusproovi võtmise nõutav kogus määratakse järgmise valemiga:

Kui valik on mittekorduv, on valem järgmine:

Nende valemite abil saadud tulemus ümardatakse alati ülespoole lähima täisarvuni.

Näide. 2 cm piirveaga esimese klassi õpilaste keskmise pikkuse piiride määramiseks tuleb määrata, kui palju õpilasi linnaosa koolide esimestes klassides tuleb juhusliku mittekorduva valimi järjekorras valida. tõenäosusega 0,997.samasuguse küsitluse tulemuste järgi teises ringkonnas oli see 24.

Otsus. Nõutav valimi suurus tõenäosuse tasemel 0,997 ( t= 3) on:

Seega on etteantud täpsusega esimese klassi õpilaste keskmise pikkuse andmete saamiseks vaja uurida 52 koolilast.

Mehaaniline proovivõtt. See valim koosneb üksuste valimisest üldkogumi üksuste üldnimekirjast korrapäraste ajavahemike järel vastavalt kehtestatud valikuprotsendile. Ülesannete lahendamisel mehaanilise valimi keskmise vea ja selle vajaliku arvu määramiseks tuleks kasutada ülaltoodud valemeid, mida kasutatakse juhuslikus mittekorduvas valikus.

Seega valitakse 2% valimiga iga 50. ühik (1:0,02), 5% valimiga iga 20. ühik (1:0,05) jne.

Seega, vastavalt aktsepteeritud valiku proportsioonile, jagatakse üldpopulatsioon justkui mehaaniliselt võrdseteks rühmadeks. Igast valimisrühmast valitakse ainult üks üksus.

Mehaanilise proovivõtu oluline tunnus on see, et valimipopulatsiooni saab moodustada ilma loetlemist kasutamata. Praktikas kasutatakse sageli rahvastikuühikute tegelikku paigutust. Näiteks valmistoodete konveierilt või tootmisliinilt väljastamise järjekord, kaubapartii ühikute paigutamise järjekord ladustamisel, transportimisel, müügil jne.

Tüüpiline näidis. Seda valimit kasutatakse siis, kui üldkogumi üksused ühendatakse mitmeks suureks tüüpiliseks rühmaks. Valimisse kuuluvate üksuste valik toimub nende rühmade sees proportsionaalselt nende suurusega, kasutades õiget juhuslikku või mehaanilist valimit (vajaliku teabe olemasolul saab valiku teha ka proportsionaalselt tunnuse varieerumisega uuritakse rühmades).

Tüüpilist valimit kasutatakse tavaliselt keerukate statistiliste populatsioonide uurimisel. Näiteks kaubandustöötajate tööviljakuse valikuuringus, mis koosneb kvalifikatsiooni järgi eraldi rühmadest.

Tüüpilise valimi oluline omadus on see, et see annab täpsemaid tulemusi võrreldes teiste valimipopulatsiooni ühikute valimise meetoditega.

Tüüpilise valimi keskmine viga määratakse valemitega:

(uuesti valik);

(mittekorduv valik),

kus on rühmasiseste dispersioonide keskmine.

Näide. Piirkonna kolme piirkonna elanike sissetulekute uurimiseks moodustati 2% valim, mis on proportsionaalne nende piirkondade elanike arvuga. Saadud tulemused on esitatud tabelis. 16.

Tabel 16

Leibkonna sissetulekute valikuuringu tulemused

Vajalik on määrata piirkonna kui terviku elanikkonna keskmise sissetuleku piirid elaniku kohta tõenäosustasemel 0,997.

Otsus. Arvutage rühmasiseste dispersioonide keskmine:

kus N i- helitugevus i-ja rühmad;

n, - valimi suurus /-rühmast.

seeriaproovide võtmine. Seda valimit kasutatakse siis, kui uuritava üldkogumi üksused on rühmitatud väikesteks võrdse suurusega rühmadeks või seeriateks. Valiku ühikuks on sel juhul seeria. Seeriad valitakse õige juhusliku või mehaanilise valimi abil ning valitud seeria sees vaadatakse läbi kõik üksused ilma eranditeta.

Jadavalimi keskmise vea arvutamine põhineb rühmadevahelisel dispersioonil:

(uuesti valik);

(mittekorduv valik),

kus x i- valitud arv i- seeria;

R on episoodide koguarv.

Võrdsete rühmade rühmadevaheline dispersioon arvutatakse järgmiselt:

kus x i- keskmine i-seeria;

X on kogu valimi üldine keskmine.

Näide. Komponentide kvaliteedi kontrollimiseks tootepartiist, mis oli pakitud 50 karpi, igas 20 toodet, tehti 10% seeriaproov. Valimisse kaasatud kastide puhul oli toote parameetrite keskmine hälve normist vastavalt 9 mm, 11, 12, 8 ja 14 mm. Tõenäosusega 0,954 määrake kogu partii kui terviku parameetrite keskmine hälve.

Otsus. Näidis tähendab:

mm.

Rühmadevahelise dispersiooni väärtus:

Arvestades kindlaksmääratud tõenäosust R = 0,954 (t= 2) valimi võtmise piirviga on:

mm.

Tehtud arvutused võimaldavad järeldada, et kõigi toodete parameetrite keskmine kõrvalekalle normist on järgmistes piirides:

Järgmisi valemeid kasutatakse antud piirvea korral seeriaproovi nõutava mahu määramiseks:

(uuesti valik);

(mittekorduv valik).

Valimivea mõiste ja arvutamine.

Valikulise vaatluse ülesanne on anda õigeid ettekujutusi kogu üldkogumi koondnäitajate kohta, lähtudes nende mõnest vaatlusalusest osast. Valimi osakaalu ja valimi keskmise võimalikku kõrvalekallet üldkogumi osakaalust ja keskmisest nimetatakse proovivõtu viga või esindusviga. Mida suurem on selle vea väärtus, seda enam erinevad valimi vaatluse näitajad üldkogumi näitajatest.

Erinev:

valimi võtmise vead;

Registreerimisvead.

Registreerimisvead ilmnevad siis, kui fakt on vaatluse käigus valesti kindlaks tehtud. Need on iseloomulikud nii pidevale vaatlusele kui ka valikulisele vaatlusele, kuid valikulises vaatluses on neid vähem.

Vea olemus on järgmine:

Tendentiivne – tahtlik, s.t. valiti välja populatsiooni parimad või halvimad üksused. Sel juhul kaotavad vaatlused oma tähenduse;

Juhuslik – valikulise vaatluse peamine korralduslik põhimõte on vältida tahtlikku valikut, s.o. tagama juhusliku valiku põhimõtte range järgimise.

Juhusliku valiku üldreegel on: üldkogumi üksikutel üksustel peavad olema täpselt samad tingimused ja võimalused sattuda valimisse kuuluvate üksuste hulka. See iseloomustab valimi tulemuse sõltumatust vaatleja tahtest. Vaatleja tahe tekitab tendentslikke vigu. Juhusliku valiku valimiviga on juhuslik. See iseloomustab üldtunnuste kõrvalekalde suurust näidisomadustest.

Tulenevalt asjaolust, et tunnused uuritavas populatsioonis on erinevad, ei pruugi valimis olevate üksuste koosseis ühtida kogu üldkogumi üksuste koosseisuga. See tähendab et R ja ei sobi kokku W ja . Nende omaduste võimaliku lahknevuse määrab valimi võtmise viga, mis määratakse järgmise valemiga:

kus on üldine dispersioon.

kus on valimi dispersioon.

See näitab, kus üldine dispersioon erineb valimi dispersioonist ajaliselt.

On korduv ja mittekorduv valik. Uuesti valiku olemus seisneb selles, et iga valimi üksus naaseb pärast vaatlust üldkogumisse ja seda saab uuesti uurida. Uuesti valimimisel arvutatakse keskmine valimiviga:

Alternatiivse atribuudi osakaalu näitaja jaoks määratakse valimi dispersioon järgmise valemiga:

Praktikas kasutatakse kordusvalikut harva. Mittekorduva valiku korral üldpopulatsiooni suurus N väheneb valimi võtmise ajal, on kvantitatiivse atribuudi keskmise valimivea valem järgmine:



, siis

Üks võimalikest väärtustest, milles uuritava tunnuse osakaal võib olla, on võrdne:

kus on alternatiivse tunnuse diskreetimisviga.

Näide.

Valmistoodete partii 10% toodete valikuuringul meetodi järgi ilma kordusvalikuta saadi järgmised andmed proovide niiskusesisalduse kohta.

Määrake keskmine niiskus %, dispersioon, standardhälve, tõenäosusega 0,954, võimalikud piirid, milles keskmist oodatakse. % niiskusesisaldus kõigist valmistoodetest, tõenäosusega 0,987, standardtoodete erikaalu võimalikud piirid eeldusel, et tooted niiskusesisaldusega kuni 13 ja üle 19% kuuluvad mittestandardsesse partii.

Vaid teatud tõenäosusega saab väita, et valimi osakaalu üldine osakaal ja valimi keskmise üldine keskmine hälbivad tüks kord.

Statistikas nimetatakse neid kõrvalekaldeid marginaalsed valimivead ja on märgitud.

Kohtuotsuse tõenäosust saab suurendada või vähendada tüks kord. Tõenäosusega 0,683, 0,954, 0,987, siis määravad üldkogumi näitajad valimi näitajad.

Valikuline vaatlus

Selektiivse vaatluse mõiste

Valimimeetodit kasutatakse siis, kui pideva vaatluse kasutamine on tohutu andmehulga tõttu füüsiliselt võimatu või majanduslikult otstarbekas. Füüsiline võimatus tekib näiteks reisijatevoogude, turuhindade, pereeelarvete uurimisel. Majanduslik ebaotstarbekus ilmneb nende hävitamisega seotud kaupade kvaliteedi hindamisel. Näiteks maitsmine, telliste tugevuse katsetamine jne. Selektiivset vaatlust kasutatakse ka pideva vaatluse tulemuste kontrollimiseks.

Vaatluseks valitud statistilised ühikud on valikuline agregaat või näidis, ja kogu massiiv - üldine komplekt (GS). Valimis olevate ühikute arv on märgitud P, kogu HS-is N. Suhtumine n/n nimetatakse suhteliseks suuruseks või näidisosa.

Proovivõtu tulemuste kvaliteet sõltub esinduslikkus proovid, st. selle kohta, kui esinduslik see HS-is on. Valimi esinduslikkuse tagamiseks on vaja järgida ühikute juhusliku valiku põhimõtet, mis eeldab, et HS ühiku valimisse sattumist ei saa mõjutada ükski muu tegur kui juhus.

Proovivõtumeetodid

1. Tegelikult juhuslikult valik: kõik HS-i ühikud on nummerdatud ja loositud numbrid vastavad valimis olevatele ühikutele, kusjuures numbrite arv on võrdne kavandatud valimi suurusega. Praktikas kasutatakse loosimise asemel juhuslike arvude generaatoreid. See valikumeetod võib olla kordas(kui iga valimisse valitud üksus tagastatakse pärast vaatlust HS-i ja seda saab uuesti uurida) ja kordumatu(kui HS-is uuritud üksusi ei tagastata ja neid ei saa uuesti mõõta). Korduva valiku korral jääb HS iga ühiku valimisse sattumise tõenäosus muutumatuks ja mittekorduva valiku korral see muutub (suureneb), kuid HS-i jäänute jaoks pärast mitme ühiku valimist sealt jääb tõenäosus. valimisse sattumine on sama.



2. Mehaaniline valik: populatsiooniühikud valitakse konstantse sammuga N/a. Seega, kui see sisaldab üldkogumit 100 tuhat ühikut ja on vaja valida 1000 ühikut, siis iga sajas ühik langeb valimisse.

3. kihistunud(kihistatud) selektsioon viiakse läbi heterogeensest üldpopulatsioonist, kui see jagatakse esmalt homogeenseteks rühmadeks, misjärel valitakse igast rühmast üksused valimipopulatsiooni juhuslikult või mehaaniliselt proportsionaalselt nende arvuga üldkogumis.

4. Sari(pesastatud) valik: juhuslikult või mehaaniliselt ei valita üksikuid üksusi, vaid teatud seeriaid (pesasid), mille raames teostatakse pidevat vaatlust.

Keskmine proovivõtu viga

Pärast valimisse vajaliku arvu ühikute valimist ja vaatlusprogrammis ette nähtud nende üksuste tunnuste registreerimist jätkatakse üldistavate näitajate arvutamisega. Need hõlmavad uuritava tunnuse keskmist väärtust ja ühikute osakaalu, millel on selle tunnuse väärtus. Kui aga HS teeb mitu proovi, määrates nende üldistavaid karakteristikuid, siis saab kindlaks teha, et nende väärtused on erinevad, lisaks erinevad need tegelikust väärtusest HS-is, kui see määratakse pideva vaatluse abil. . Teisisõnu, näidisandmete põhjal arvutatud üldistavad karakteristikud erinevad nende tegelikest väärtustest HS-is, seega tutvustame järgmisi sümboleid (tabel 8).

Tabel 8. Konventsioonid

Valimi ja üldkogumi üldistavate tunnuste väärtuse erinevust nimetatakse proovivõtu viga, mis jaguneb vigadeks registreerimine ja viga esinduslikkus. Esimene tuleneb ebaõigest või ebatäpsest teabest, mis on tingitud probleemi olemuse valesti mõistmisest, registripidaja hoolimatusest ankeetide, vormide jms täitmisel. Seda on üsna lihtne tuvastada ja parandada. Teine tuleneb valimisse kuuluvate üksuste juhusliku valiku põhimõtte mittejärgimisest. Seda on raskem tuvastada ja kõrvaldada, see on palju suurem kui esimene ja seetõttu on selle mõõtmine valikulise vaatluse peamine ülesanne.

Valimivea mõõtmiseks määratakse selle keskmine viga korduva valiku korral valemiga (39) ja mittekorduva valimi võtmise korral valemiga (40):

= ;(39) = . (40)

Valemitest (39) ja (40) on näha, et mittekorduva valimi puhul on keskmine viga väiksem, mis määrab selle laiema kasutusala.

Valimikogumi näitajate ja üldkogumi soovitud näitajate (parameetrite) vahel esineb reeglina mõningaid lahkarvamusi, mida nn. proovivõtu vead. Valimi koguviga koosneb kahte tüüpi vigadest: registreerimisvead ja representatiivsusvead.

Registreerimisvead on igale statistilisele vaatlusele omased ja nende ilmnemise põhjuseks võib olla registripidaja tähelepanematus, ebatäpsed arvutused, mõõtevahendite ebatäiuslikkus jne.

Esindusvead on omased ainult valimivaatlusele ja tulenevad selle olemusest, sest ükskõik kui hoolikalt ja korrektselt üksuste valimist ei tehta, erinevad valimi üldkogumi keskmised ja suhtelised näitajad alati teatud määral vastavatest näitajatest. elanikkonnast.

Eristada süstemaatilisi ja juhuslikke esindusvigu. Süstemaatilised representatiivsusvead on ebatäpsused, mis tekivad valimikogumi üksuste valiku tingimuste mittejärgimise tagajärjel, mis ei anna üldkogumi igale üksusele võrdset võimalust valimisse pääseda. Juhuslikud esindusvead on vead, mis tulenevad sellest, et valim ei taasta täpselt üldkogumi tunnuseid (keskmist, osakaalu, dispersiooni jne) küsitluse katkendlikkuse tõttu.

Juhusliku valiku põhimõttest lähtudes sõltub valimi vea suurus eelkõige valimi suurusest. Mida suurem on valimi suurus, ceteris paribus, seda väiksem on valimi võtmise viga. Suure valimimahu korral avaldub selgemalt suurte arvude seaduse toimimine, mille kohaselt: ühele meelevaldselt lähedase tõenäosusega võib väita, et piisavalt suure valimi suuruse ja piiratud dispersiooni korral on valimi tunnused ( keskmine osakaal) erineb meelevaldselt vähe vastavatest üldtunnustest .

Valimivea suurus on samuti otseselt seotud uuritava tunnuse variatsiooniastmega ning variatsiooniastet, nagu eespool märgitud, iseloomustab statistikas dispersiooni suurus (hajuvus): mida väiksem on dispersioon, mida väiksem on valimi viga, seda usaldusväärsemad on statistilised järeldused. Seetõttu tuvastatakse praktikas dispersioon valimiveaga.

Kuna üldkogumi parameeter on soovitud väärtus ja see on teadmata, siis tuleb keskenduda mitte konkreetsele veale, vaid kõigi võimalike valimite keskmisele.

Kui üldkogumist valitakse mitu valimikomplekti, annab iga tulemuseks olev valim konkreetse vea erineva väärtuse.

RMS /ja arvutatakse konkreetsete vigade (;) kõigi võimalike väärtuste põhjal:

kus * ja - näidis tähendab; x - üldine keskmine;)] - proovide arv є1 \u003d ~ si - x.

Valimi keskmiste standardhälvet üldkeskmisest nimetatakse keskmise valimi veaks.

Valimivea suuruse sõltuvus selle arvust ja tunnuse varieeruvuse astmest väljendub keskmise valimivea /u valemis.

Keskmise vea ruut (valimi keskväärtuste dispersioon) on otseselt võrdeline dispersiooniga sada ja pöördvõrdeline valimi suurusega n:

kus on tunnuse dispersioon üldpopulatsioonis.

Seega määratakse keskmine viga tavaliselt järgmise valemiga:

Seega, olles määranud valimi standardhälbe, saame määrata keskmise valimivea väärtuse, mille väärtus valemist tulenevalt on seda suurem, mida suurem on juhusliku suuruse variatsioon ja mida väiksem, suurem valimi suurus.

Seega, kui valimi suurus suureneb, väheneb keskmise vea suurus. Kui näiteks keskmist valimiviga on vaja poole võrra vähendada, siis tuleb valimi suurust suurendada neli korda, kui vaja on vähendada valimiviga kolm korda, siis valimi suurust suurendada. üheksa korda jne.

Praktilistes arvutustes kasutatakse keskmise valimivea ja osakaalu jaoks kahte valemit.

Keskmiste valikulises uuringus on keskmise vea valem järgmine:

Suhteliste näitajate (konkreetsete märkide) uurimisel on keskmise vea valem järgmine:

kusG - tunnuse osatähtsus üldpopulatsioonis.

Ülaltoodud keskmise vea valemite rakendamine eeldab, et üldine dispersioon ja üldine proportsioon on teada. Tegelikkuses on need näitajad aga teadmata ja üldrahvastiku andmete puudumise tõttu on neid võimatu arvutada. Seetõttu tuleb üldine dispersioon ja üldine osakaal asendada teiste neile lähedaste väärtustega.

Matemaatilises statistikas on tõestatud, et sellised väärtused võivad olla valimi dispersioon (st) ja valimi murdosa (co).

Seda silmas pidades saab keskmise vea valemid kirjutada järgmiselt:

Need valemid võimaldavad määrata keskmise uuesti valimimise vea. Lihtsa juhusliku resamplimise rakendamine praktikas on piiratud. Esiteks on samade üksuste uuesti mõõdistamine ebaotstarbekas ja mõnikord võimatu. Mittekorduva valiku kasutamise korduva valiku asemel dikteerib ka nõue suurendada valimi täpsust ja usaldusväärsust. Seetõttu kasutatakse praktikas sagedamini mittekorduva juhusliku valiku meetodit. Selle valikumeetodi järgi valimisse valitud üldkogumi üksus edasises valikus ei osale. Ühikud valitakse üldkogumi hulgast, mida vähendatakse eelnevalt valitud üksuste arvu võrra. Seetõttu, seoses üldkogumi suuruse muutumisega pärast iga valimist ja valiku tõenäosusega järelejäänud üksuste jaoks, viiakse keskmise valimi vea valemitesse parandustegur.

kus N on üldkogumi suurus; P- näidissuurus. Piisavalt suure N väärtuse puhul võib nimetaja puhul tähelepanuta jätta. Siis

Seetõttu on keskmise valimivea valemid vastavalt keskmise ja osa mittekorduva valiku korral järgmised:

Kuna P on alati väiksem kui M, siis on lisategur alati väiksem kui üks. Seetõttu on mittekorduva valiku korral diskreetivea absoluutväärtus alati väiksem kui korduva valiku korral.

Kui valimi suurus on piisavalt suur, on 1 ^ väärtus ühtsuse lähedal ja seetõttu võib selle tähelepanuta jätta. Seejärel määratakse juhusliku mittekorduva valiku keskmine viga isejuhusliku kordusvalimise valemiga.

Meie näite puhul arvutame välja keskmise saagivea ja nende proovitükkide osakaalu, mille saagikus on 25 senti hektari kohta või rohkem.

Keskmine proovivõtu viga

a) odra keskmine saagikus

Odra keskmine saagikus üldpopulatsioonis x -G^\u003d 25,1 ± 0,12 c / ha, see tähendab, et see on vahemikus 24,98 kuni 25,22 c / ha.

25 c/ha ja enama saagikusega maatükkide osakaal üldrahvastikus p

T-^T = 0,80 ± 0,07, s.o. on vahemikus 73–87%.

Keskmine valimiviga näitab valimi üldkogumi tunnuste võimalikke kõrvalekaldeid üldkogumi tunnustest. Samal ajal seisavad teadlased proovide võtmisel sageli silmitsi ülesandega arvutada mitte ainult keskmine viga, vaid määrata ka maksimaalne võimalik proovivõtu viga. Teades keskmist viga, on võimalik määrata piirid, millest üle valimivea väärtus ei lähe. Siiski on võimalik väita, et need kõrvalekalded ei ületa antud väärtust mitte absoluutse kindlusega, vaid ainult teatud tõenäosusega. Tõenäosuse taset, mida aktsepteeritakse võimalike piiride määramisel, mis sisaldavad üldkogumi parameetrite väärtusi, nimetatakse tõenäosuse usaldustasemeks.

Usalduse tõenäosus- see on üsna suur ja nii, et seda peetakse igal konkreetsel juhul teostatuks, tõenäosus, mis tagab usaldusväärsed statistilised järeldused. Tähistagem seda G ja selle taseme ületamise tõenäosus on a. Niisiis,a =1 - R Tõenäosusa nimetatakse olulisuse tasemeks(olulisus), mis iseloomustab ekslike järelduste suhtelist arvu järelduste koguarvus ja on defineeritud kui ühtsuse ja usaldustaseme erinevus, mis on aktsepteeritud.

Usalduse taseme määrab uurija, lähtudes vastutuse määrast ja lahendatavate ülesannete iseloomust. Majanduse statistilistes uuringutes on kõige sagedamini kasutatav usaldustase G = 0,95; P = 0,99 (vastavalt olulisuse tase a = 0,05; a = 0,01) harvemini G = 0,999. Näiteks usalduse tase G = 0,99 tähendab, et hinnanguviga 99 juhul 100-st ei ületa kehtestatud väärtust ja ainult ühel juhul 100-st võib see jõuda arvutatud väärtuseni või seda ületada.

Teatud usaldusväärse tõenäosusega arvutatud valimiviga nimetatakse marginaalne valimiviga Er.

Mõelgem, kuidas määratakse võimaliku valimi piirvea väärtus. Väärtus ep on seotud normaliseeritud hälbega u, mis on määratletud valimi piirvea suhtena ep keskmise veani ja:

Arvutuste hõlbustamiseks väljendatakse juhusliku suuruse hälvet selle keskmisest väärtusest tavaliselt standardhälbe ühikutes. Väljendus

helistas standardhälve. sisse Statistikakirjanduses ja helistas usalduse tegur, või keskmise valimivea kordsus.

Seega saab valimi keskmise normaliseeritud hälbe määrata järgmise valemiga:

ja _є_r_

Väljendusest 1 võib leida võimaliku valimi võtmise piirvea

ep = i/l.

Selle asemel asendamine d. selle väärtuses esitame keskmise valimi piirvigade ja mittekorduva juhusliku valiku proportsiooni valemid:

Seetõttu sõltub valimi võtmise piirviga keskmise vea väärtusest ja normaliseeritud hälbest ning on võrdne ± kordse keskmiste valimivigade arvuga.

Keskmised ja marginaalsed valimivead nimetatakse suurusteks ja neid väljendatakse samades ühikutes kui aritmeetiline keskmine ja standardhälve.

Normaliseeritud hälve on funktsionaalselt seotud tõenäosusega. Väärtuste leidmiseksja on koostatud spetsiaalsed tabelid (lisa 2), mille järgi saab väärtuse leidaja antud usalduse tõenäosuse tasemel ja tõenäosuse väärtusel teadaolevate ja.

Esitame väärtused ja ja nende vastavad tõenäosused suurusega valimitelen> 30, mida kasutatakse kõige sagedamini praktilistes arvutustes:

Seetõttu, millal ja = 1 tõenäosus, et valimi karakteristikud hälbivad üldistest ühe keskmise valimivea võrra, on 0,6827. See tähendab, et keskmiselt annab igast 1000 valimist 683 üldistatud karakteristikud, mis ei erine üldistest üldistest tunnustest rohkem kui ühe keskmise vea võrra. Kui u = 2, on tõenäosus 0,9545. sisse See tähendab, et igast 1000 proovi 954 annab üldistatud karakteristikud, mis erinevad üldistest üldistest karakteristikutest mitte rohkem kui kahekordse keskmise diskreetimisvea võrra ja nii edasi.

Kuna aga reeglina võetakse ainult üks valim, siis ütleme, et näiteks tõenäosusega 0,9545 saab garanteerida, et piirvea suurus ei ületa kahekordset keskmist valimit. viga.

Matemaatiliselt on tõestatud, et valimivea ja keskmise vea suhe reeglina ei ületa± 3d piisavalt suure arvu n korral, hoolimata asjaolust, et diskreetimisviga võib omandada mis tahes väärtused. Teisisõnu võib öelda, et piisavalt suure otsuse tõenäosusega (P = 0,9973) ei ületa valimi võtmise piirviga reeglina kolme keskmist valimiviga. Seetõttu võib võimaliku diskreetivea piiriks võtta väärtust Ep = 3d.

Määrame oma näite puhul keskmise saagikuse proovivõtu piirvea ja 25 q/ha või enama saagiga proovitükkide osakaalu. Me võtame tõenäosuse usaldustaseme, mis on võrdne Р = 0,9545. sisse Vastavalt tabelile (u..2) leidke väärtused ja = 2. Keskmised proovivead saagikuse ja 25 c/ha ja suurema saagiga proovitükkide osakaalu kohta leiti varem ja olid vastavalt: C~= ±0,12 q/ha; MR = ± 0,07.

Odra keskmise saagi piirviga:

Seega ei ületa proovi keskmise saagi ja üldkeskmise vahe 0,24 c/ha. Üldpopulatsiooni keskmise saagikuse piirid: x = x ± jah ~ = 25,1 + 0,24 ehk 24,86-25,34 q/ha.

Kruntide osakaalu piirviga, mille saagikus on 25 senti hektari kohta või rohkem:

Järelikult on piirviga 25 c/ha saagikusega ja enam mitte üle 14% proovitükkide osakaalu määramisel, st näidatud saagikusega proovitükkide osakaal üldkogumis jääb piiresse: G= a> ± ep = 0,80 ± 0,14, see tähendab 66 kuni 94%.

Nimetatakse lahknevusi statistilise vaatluse käigus leitud mis tahes näitaja väärtuse ja selle tegeliku suuruse vahel vaatlusvead . Sõltuvalt esinemise põhjustest eristatakse registreerimisvigu ja esindusvigu.

Registreerimisvead tekivad vaatluse või küsitluse käigus ebaõigete faktide leidmise või eksliku salvestamise tulemusena. Need on juhuslikud või süstemaatilised. Juhuslikke registreerimisvigu võivad teha nii intervjueeritavad oma vastustes kui ka registripidajad. Süstemaatilised vead võivad olla nii tahtlikud kui ka tahtmatud. Tahtlik – asjade tegeliku seisu teadlik, tendentslik moonutamine. Tahtmatud on põhjustatud erinevatest juhuslikest põhjustest (hooletus, tähelepanematus).

Esinduslikud vead (representatiivsus) tekivad mittetäieliku küsitluse tulemusena ja kui küsitluspopulatsioon ei taastoo täielikult üldkogumit. Need võivad olla juhuslikud või süstemaatilised. Juhuslikud esindusvead on kõrvalekalded, mis tekivad mittepideva vaatluse käigus, kuna valitud vaatlusüksuste kogum (valim) ei taastoo täielikult kogu populatsiooni tervikuna. Esinduslikkuse eelarvamused on kõrvalekalded, mis tulenevad ühikute juhusliku valiku põhimõtete rikkumisest. Representatiivsusvead on valimivaatlusele orgaaniliselt omased ja tulenevad sellest, et valimipopulatsioon ei taastoo täielikult üldkogumit. Esindusvigu on võimatu vältida, kuid suurte arvude seaduse piirteoreemide kasutamisel põhinevaid tõenäosusteooria meetodeid kasutades saab need vead taandada miinimumväärtusteni, mille piirid on seatud piisavalt suure täpsusega.

Valimivead – valimi ja üldkogumi tunnuste erinevus. Keskmise väärtuse puhul määratakse viga valemiga

kus

Väärtus
helistas piirviga proovid.

Valimi võtmise piirviga on juhuslik väärtus. Suurte arvude seaduse piirteoreemid on pühendatud juhuslike valimivigade mustrite uurimisele. Need mustrid on kõige põhjalikumalt avalikustatud P. L. Tšebõševi ja A. M. Ljapunovi teoreemides.

P. L. Tšebõševi teoreem vaadeldava meetodi suhtes võib selle sõnastada järgmiselt: piisavalt suure arvu sõltumatute vaatluste korral on võimalik ühtsuslähedase tõenäosusega (st peaaegu kindlalt) väita, et valimi kõrvalekalle tähendab üldine jääb meelevaldselt väikeseks. P. L. Tšebõševi teoreem tõestab, et vea väärtus ei tohiks ületada . Omakorda väärtus , mis väljendab valimi keskmise standardhälvet üldkeskmisest, sõltub tunnuse kõikumisest üldpopulatsioonis ja valitud ühikute arv n. Seda sõltuvust väljendatakse valemiga

, (7.2)

kus oleneb ka proovivõtumeetodist.

väärtust =helistas keskmine proovivõtuviga. Selles väljendis on üldine dispersioon, n on valimi suurus.

Vaatleme, kuidas valitud ühikute arv mõjutab keskmise vea väärtust n. Loogiliselt on lihtne kontrollida, et suure hulga ühikute valimisel on lahknevused keskmiste vahel väiksemad, st keskmise valimivea ja valitud ühikute arvu vahel on pöördvõrdeline seos. Sel juhul ei moodustu siin mitte lihtsalt pöördvõrdeline matemaatiline sõltuvus, vaid selline sõltuvus, mis näitab, et keskmiste lahknevuse ruut on pöördvõrdeline valitud ühikute arvuga.

Märgi muutlikkuse suurenemine toob kaasa standardhälbe suurenemise ja sellest tulenevalt ka vigade suurenemise. Kui eeldame, et kõigil ühikutel on sama tunnusväärtus, siis standardhälve muutub nulliks ja ka valimiviga kaob. Siis pole vaja proovivõttu rakendada. Siiski tuleb meeles pidada, et tunnuse varieeruvuse suurus üldpopulatsioonis on teadmata, kuna selles sisalduvate ühikute suurused pole teada. Valimipopulatsioonis on võimalik arvutada ainult tunnuse varieeruvust. Üld- ja valimipopulatsiooni dispersioonide suhet väljendatakse valemiga

Alates väärtusest piisavalt suureks n on ühtsusele lähedane, võime ligikaudselt eeldada, et valimi dispersioon on võrdne üldise dispersiooniga, s.t.

Seetõttu näitab keskmine valimiviga, millised on võimalikud valimi üldkogumi tunnuste kõrvalekalded üldkogumi vastavatest tunnustest. Selle vea suurust saab aga hinnata teatud tõenäosusega. Kordaja näitab tõenäosuse väärtust

A. M. Ljapunovi teoreem . A. M. Ljapunov tõestas, et valimi keskmiste jaotus (seega ka nende kõrvalekalded üldkeskmisest) on piisavalt suure arvu sõltumatute vaatluste korral ligikaudu normaalne, eeldusel, et üldkogumil on lõplik keskmine ja piiratud dispersioon.

Matemaatiliselt Ljapunovi teoreem võib kirjutada nii:

(7.3)

kus
, (7.4)

kus
on matemaatiline konstant;

marginaalne valimiviga , mis võimaldab välja selgitada, millistes piirides jääb üldkeskmise väärtus.

Selle integraali väärtused usalduskoefitsiendi erinevate väärtuste jaoks t arvutatakse ja on toodud spetsiaalsetes matemaatilistes tabelites. Eelkõige siis, kui:

Kuna t näitab lahknevuse tõenäosust
st tõenäosuse kohta, kui palju erineb üldkeskmine valimi keskmisest, võib seda lugeda järgmiselt: tõenäosusega 0,683 võib väita, et erinevus valimi ja üldkeskmise vahel ei ületa ühte keskmise valimivea väärtus. Teisisõnu, 68,3% juhtudest ei lähe esindusviga kaugemale
Tõenäosusega 0,954 võib väita, et esindusviga ei ületa
(st 95% juhtudest). Tõenäosusega 0,997 ehk üsna ühele lähedaselt võib eeldada, et valimi ja üldkeskmise vahe ei ületa kolmekordset keskmist valimi viga jne.

Loogiliselt võttes tundub seos siin üsna selge: mida suuremad piirid on võimalik viga lubatud, seda tõenäolisem on selle suurust hinnata.

Tunnuse valimi keskmise väärtuse tundmine
ja valimi võtmise piirviga
, on võimalik määrata piirid (limiidid), mis sisaldavad üldkeskmist

1 . Iseseisev valim - see meetod keskendub üldkogumi üksuste valimi võtmisele ilma osadeks või rühmadeks jaotamata. Samas kasutatakse valimi moodustamise põhiprintsiibi - üldkogumi kõigi üksuste võrdsed võimalused olla valitud - järgimiseks ühikute juhusliku väljavõtmise skeemi loosimise teel (loterii) või juhuslike arvude tabelit. . Võimalik on korduv ja mittekorduv ühikute valik

Õige juhusliku valimi keskmine viga on valimi keskmise võimalike väärtuste standardhälve üldkeskmisest. Juhusliku valiku meetodi keskmised valimivead on toodud tabelis. 7.2.

Tabel 7.2

Keskmine diskreetimisviga μ

Valides

kordas

mittekorduv

Keskmise jaoks

Tabelis kasutatakse järgmisi nimetusi:

on valimi dispersioon;

- näidissuurus;

– üldrahvastiku suurus;

on nende üksuste valimi osakaal, millel on uuritav tunnus;

- uuritava tunnusega ühikute arv;

- näidissuurus.

Täpsuse suurendamiseks kordaja asemel võta kordaja
, kuid suure hulgaga N erinevus nende väljendite vahel ei oma praktilist tähtsust.

Õige juhusliku valimi piirviga
arvutatakse valemiga

, (7.6)

kus t – usalduskoefitsient sõltub tõenäosuse väärtusest.

Näide. Partii hulgast juhuslikult valitud saja tootenäidise uurimisel osutus 20 ebastandardseks. Tõenäosusega 0,954 määrake piirid, milles on mittestandardsete toodete osakaal partiis.

Otsus. Arvutage kogu osa ( R):
.

Mittestandardsete toodete osakaal:
.

Proovifraktsiooni piirviga tõenäosusega 0,954 arvutatakse valemiga (7.6), kasutades tabelis toodud valemit. 7.2 jagamiseks:

Tõenäosusega 0,954 võib väita, et mittestandardsete toodete osakaal kaubapartiis jääb 12% piiresse ≤ P≤ 28 %.

Valimivaatluse kujundamise praktikas tekib vajadus määrata valimi suurus, mis on vajalik teatud täpsuse tagamiseks üldkeskmiste arvutamisel. Sel juhul on antud valiku piirviga ja selle tõenäosus. Valemist
ja keskmiste valimivigade valemid, määratakse nõutav valimi suurus. Valimi suuruse määramise valemid ( n) sõltuvad valikumeetodist. Tegeliku juhusliku valimi valimi suuruse arvutamine on toodud tabelis. 7.3.

Tabel 7.3

Mõeldud valik

keskmise jaoks

Korduv

mittekorduv

2 . Mehaaniline proovivõtt - selle meetodi puhul lähtuvad nad üldpopulatsioonis objektide paiknemise mõningate tunnuste, nende järjestuse (nimekirja, numbri, tähestiku järgi) arvestamisest. Mehaaniline proovide võtmine toimub üldpopulatsiooni üksikute objektide valimisel teatud intervalliga (iga 10. või 20. järel). Intervall arvutatakse suhtega , kus n- näidissuurus, N- üldrahvastiku suurus. Seega, kui 500 000 ühiku suurusest populatsioonist peaks saama 2% valimi, st valima 10 000 ühikut, on valiku osakaal
Osakute valik toimub vastavalt kehtestatud proportsioonile korrapäraste ajavahemike järel. Kui objektide paiknemine üldkogumis on juhuslik, siis mehaaniline valim on sisult sarnane juhusliku valikuga. Mehaanilise valiku puhul kasutatakse ainult mittekorduvat proovivõttu.

Keskmine viga ja valimi suurus mehaanilisel valikul arvutatakse õige juhusliku valimi valemite järgi (vt tabelid 7.2 ja 7.3).

3 . Tüüpiline näidis , mille juures üldpopulatsioon jaguneb mõne olulise tunnuse järgi tüüpilisteks rühmadeks; ühikute valik tehakse tüüpiliste rühmade järgi. Selle valikumeetodiga jagatakse üldpopulatsioon mõnes mõttes homogeenseteks rühmadeks, millel on oma eripärad, ning küsimus taandatakse igast rühmast valimi suuruse määramisele. Võib olla ühtne proovide võtmine - selle meetodiga valitakse igast tüüpilisest rühmast sama arv ühikuid
Selline lähenemine on õigustatud ainult siis, kui algsete tüüpiliste rühmade suurused on võrdsed. Tüüpilises valikus jagatakse rühmade suurusega ebaproportsionaalselt valitud üksuste koguarv tüüpiliste rühmade arvuga, saadud väärtus annab valiku arvu igast tüüpilisest rühmast.

Täpsem valik on proportsionaalne valim . Proportsionaalne on selline valimipopulatsiooni moodustamise skeem, kui üldkogumi igast tüüpilisest rühmast võetud proovide arv on võrdeline arvude, dispersioonide (või kombineeritud ja arvude ning dispersioonidega). Tinglikult määrame valimi suuruse 100 ühikut ja valime ühikud rühmadest:

proportsionaalselt nende üldrahvastiku suurusega (Tabel 7.4). Tabel näitab:

N i on tüüpilise rühma suurus;

d j- jaga ( N ma / N);

N– üldrahvastiku suurus;

n i– arvutatakse tüüpilise rühma valimi suurus:

, (7.7)

n on üldkogumi valimi suurus.

Tabel 7.4

N i

d j

n i

proportsionaalne standardhälbega (Tabel 7.5).

siin  i– tüüpiliste rühmade standardhälve;

n i – tüüpilise rühma valimi suurus arvutatakse valemiga

(7.8)

Tabel 7.5

N i

n i

kombineeritud (Tabel 7.6).

Valimi suurus arvutatakse valemiga

. (7.9)

Tabel 7.6

i N i

Tüüpilise valimi läbiviimisel tehakse igast rühmast otsevalik juhusliku valiku teel.

Keskmised valimivead arvutatakse tabelis toodud valemite abil. 7.7 sõltuvalt tüüpiliste rühmade hulgast valimise meetodist.

Tabel 7.7

Valikumeetod

Korduv

mittekorduv

keskmise jaoks

jagamiseks

keskmise jaoks

jagamiseks

Ebaproportsionaalne rühma suurusega

Proportsionaalne rühma suurusega

Proportsionaalne kõikumine rühmades (on kõige kasulikum)

siin
on tüüpiliste rühmade grupisiseste dispersioonide keskmine;

on üksuste osakaal, millel on uuritav tunnus;

on osa rühmasiseste erinevuste keskmine;

on standardhälve valimis i-th tüüpiline rühm;

on tüüpilise rühma valimi suurus;

on kogu valimi suurus;

on tüüpilise rühma maht;

- üldrahvastiku maht.

Iga tüüpilise rühma valimi suurus peaks olema proportsionaalne selle rühma standardhälbega.
.Arvu arvutamine
toodetud vastavalt tabelis toodud valemitele. 7.8.

Tabel 7.8

4 . seeriaproovide võtmine - kasulik juhtudel, kui üldkogumi üksused on rühmitatud väikestesse rühmadesse või seeriatesse. Jadavalimiga jagatakse üldkogum ühesuurusteks rühmadeks – seeriateks. Seeriad valitakse näidiskomplekti. Jadavalimi võtmise olemus seisneb seeriate juhuslikus või mehaanilises valikus, mille raames viiakse läbi pidev ühikute uuring. Võrdsete seeriatega jadavalimi keskmine viga sõltub ainult rühmadevahelise dispersiooni väärtusest. Keskmised vead on kokku võetud tabelis. 7.9.

Tabel 7.9

Sarja valiku meetod

keskmise jaoks

jagamiseks

Korduv

mittekorduv

Siin R on seeriate arv üldkogumis;

r– valitud seeriate arv;

– vahendite seeriate (rühmadevaheline) dispersioon;

– aktsia seeriatevaheline (gruppidevaheline) dispersioon.

Seeriavaliku puhul määratakse vajalik arv valitud seeriaid samamoodi nagu õige juhusliku valiku meetodi puhul.

Seerianäidiste arvu arvutamine toimub tabelis toodud valemite järgi. 7.10.

Tabel 7.10

Näide. Tehase masinatsehhis töötab kümnes meeskonnas 100 töölist. Töötajate kvalifikatsiooni uurimiseks koostati 20% jadane kordumatu valim, mis hõlmas kahte meeskonda. Saadi järgmine küsitletud töötajate jaotus kategooriate kaupa:

Tööliste auastmed brigaadis 1

Tööliste auastmed brigaadis 2

Tööliste auastmed brigaadis 1

Tööliste auastmed brigaadis 2

Tõenäosusega 0,997 on vaja määrata piirid, milles masinatöökoja töötajate keskmine kategooria asub.

Otsus. Määratleme meeskondade valimi keskmised ja üldkeskmise rühma keskmiste kaalutud keskmisena:

Määrame seeriatevahelise dispersiooni valemitega (5.25):

Arvutame keskmise valimivea tabelis toodud valemi abil. 7.9:

Arvutame valimi võtmise piirvea tõenäosusega 0,997:

Tõenäosusega 0,997 võib väita, et masinatöökoja töötajate keskmine auaste jääb