Biograafiad Omadused Analüüs

Näidisandmed. Statistiline valim

näidiste tüübid:

Tegelikult-juhuslik;

Mehaaniline;

tüüpiline;

seeria;

Kombineeritud.

Iseseisev valim on valida ühikud elanikkonnast juhuslikult või juhuslikult ilma järjepidevuse elementideta. Enne korraliku juhusliku valiku tegemist tuleb aga veenduda, et eranditult kõigil üldkogumi üksustel on absoluutselt võrdsed võimalused valimisse sattuda, loendites või loendis pole lünki, üksikuid üksusi ignoreerides jne. . Ka elanikkonnale tuleks kehtestada selged piirid, et üksikute üksuste kaasamises või väljajätmises kahtlust ei tekiks. Nii tuleb näiteks õpilaste eksamineerimisel märkida, kas isikud, kes viibivad akadeemiline puhkus, õpilased mitteriiklikud ülikoolid, sõjakoolid jne; kaubandusettevõtete uurimisel on oluline kindlaks teha, kas üldkogum hõlmab kaubanduspaviljonid, kommertstelgid ja muud sarnased objektid. Isejuhuslik valik võib olla nii korduv kui ka mittekorduv. Sest mittekorduv valik loosimise käigus ei tagastata loositud loose esialgsesse komplekti ega osale edasises valikus. Tabelite kasutamisel juhuslikud arvud mittekorduv valik saavutatakse numbrite vahelejätmisega, kui need korduvad valitud veerus või veergudes.

Mehaaniline proovivõtt kasutatakse juhtudel, kui üldpopulatsioon on kuidagi järjestatud, s.t. üksuste paigutuses on teatud järjestus (töötajate palganumbrid, valijate nimekirjad, telefoninumbrid vastajad, majade ja korterite arv jne).

Üldkogumit mehaanilise valiku käigus saab järjestada või järjestada uuritava tunnuse väärtuse või sellega korrelatsiooni järgi, mis suurendab valimi esinduslikkust. Kuid sel juhul suureneb süstemaatilise vea oht, mis on seotud uuritava tunnuse väärtuste alahindamisega (kui igast intervallist registreeritakse esimene väärtus) või selle ülehindamisega (kui viimane väärtus). Seetõttu on soovitav alustada valikut esimese intervalli keskelt

tüüpiline valik. Seda valikumeetodit kasutatakse juhtudel, kui kõik üldkogumi üksused võib jagada mitmeks tüüpiliseks rühmaks. Rahvastikuküsitluses võivad sellisteks rühmadeks olla näiteks linnaosad, sotsiaal-, vanuse- või haridusrühmad, ettevõtete mõõdistamisel - majandusharu või allsektor, omandivorm jne. Tüüpiline valik hõlmab üksuste valimist igast tüüpilisest rühmast puhtalt juhuslikul või mehaanilisel viisil. Sest sisse proovivõtu raam kõikide rühmade esindajad langevad tingimata ühes või teises proportsioonis, üldpopulatsiooni tüpiseerimine võimaldab mõju välistada rühmadevaheline dispersioon peal keskmine viga valim, mis sel juhul määratakse ainult rühmasisese variatsiooniga.

Tüüpilises valimis olevate üksuste valiku võib korraldada kas proportsionaalselt tüüpiliste rühmade mahuga või proportsionaalselt tunnuse rühmasisese diferentseerumisega.

seeria valik. See valikumeetod on mugav juhtudel, kui populatsiooniüksused on rühmitatud väikestesse rühmadesse või seeriatesse. Sellise seeriana on pakendid teatud koguse valmistoodetega, kaubapartiid, õpilasrühmad, malevad ja muud ühendused. Jadavalimi võtmise olemus seisneb tegelikus juhuslikus või mehaanilises seeriavalikus, mille raames viiakse läbi täielik ühikute uuring.

Sageli juhtub, et on vaja analüüsida konkreetset sotsiaalset nähtust ja hankida selle kohta teavet. Sellised ülesanded tekivad sageli statistikas ja statistilistes uuringutes. Täielikult määratletud sotsiaalse nähtuse kontrollimine on sageli võimatu. Näiteks kuidas saada teada teatud linna elanike või kõigi elanike arvamust mis tahes küsimuses? Küsida absoluutselt kõigilt on peaaegu võimatu ja väga töömahukas. Sellistel juhtudel vajame proovi. Just sellel kontseptsioonil põhinevad peaaegu kõik uuringud ja analüüsid.

Mis on näidis

Kui analüüsida konkreetset sotsiaalne nähtus vaja selle kohta infot hankida. Kui võtta mõni uuring, siis näeme, et mitte iga üksus uurimisobjekti tervikust ei allu uurimisele ja analüüsile. Arvesse võetakse ainult teatud osa sellest tervikust. See protsess on valim: kui uuritakse ainult teatud ühikuid komplektist.

Muidugi oleneb palju proovi tüübist. Kuid on ka põhireeglid. Peamine ütleb, et valik populatsioonist peab olema absoluutselt juhuslik. Kasutatavaid populatsiooniühikuid ei tohiks valida ühegi kriteeriumi tõttu. Jämedalt öeldes, kui on vaja koguda elanikkond teatud linna elanike hulgast ja valida ainult mehed, siis tekib uuringus viga, sest valikut ei tehtud juhuslikult, vaid valiti soo järgi. Peaaegu kõik proovivõtumeetodid põhinevad sellel reeglil.

Valimi võtmise reeglid

Selleks, et valitud komplekt kajastaks kogu nähtuse põhiomadusi, tuleb see üles ehitada vastavalt konkreetsetele seadustele, kus põhitähelepanu tuleks pöörata järgmistele kategooriatele:

  • valim (valimikogum);
  • üldine elanikkond;
  • esinduslikkus;
  • esindusviga;
  • rahvastikuüksus;
  • proovivõtu meetodid.

Iseärasused valikuline vaatlus ja proovide võtmine on järgmine:

  1. Kõik saadud tulemused põhinevad matemaatilistel seadustel ja reeglitel, see tähendab, et uuringu korrektse läbiviimise ja õigete arvutuste korral tulemusi subjektiivselt ei moonutata.
  2. See võimaldab saada tulemust palju kiiremini ning vähema aja ja ressurssidega, uurides mitte kogu sündmuste massiivi, vaid ainult osa neist.
  3. Saab kasutada erinevate objektide uurimiseks: alates konkreetsed küsimused, näiteks meid huvitava rühma vanus, sugu, õppima avalik arvamus või elanikkonna materiaalse toetuse tase.

Valikuline vaatlus

Valikuline on statistiline vaatlus, milles ei uurita mitte kogu uuritava komplekti, vaid ainult teatud osa sellest, mis on teatud viisil valitud, ja selle osa uurimise tulemused kehtivad kogu komplekti kohta. Seda osa nimetatakse proovivõturaamiks. See on ainus viis suure hulga uuritava objekti uurimine.

Kuid selektiivset vaatlust saab kasutada ainult juhtudel, kui on vaja ainult uurida väike gruppühikut. Näiteks meeste ja naiste suhet maailmas uurides hakatakse kasutama selektiivset vaatlust. Arusaadavatel põhjustel on võimatu arvestada iga meie planeedi elanikuga.

Aga sama uuringuga, aga mitte kõik maakera elanikud, vaid teatud 2 "A" klassi sisse konkreetne kool, teatud linn, teatud riik saab hakkama ilma juhusliku vaatluseta. Lõppude lõpuks on täiesti võimalik analüüsida kogu uuritava objekti massiivi. Selle klassi poisid ja tüdrukud on vaja kokku lugeda - see on suhe.

Valim ja populatsioon

Tegelikult pole see nii raske, kui see kõlab. Igas uurimisobjektis on kaks süsteemi: üld- ja valimipopulatsioon. Mis see on? Kõik üksused kuuluvad kindralile. Ja valimile – need ühikud kogupopulatsioonist, mis valimi jaoks võeti. Kui kõik on õigesti tehtud, on valitud osa kogu (üld)populatsiooni vähendatud paigutus.

Kui räägime üldpopulatsioonist, siis saame eristada ainult kahte selle sorti: kindlat ja määramatut üldpopulatsiooni. Sõltub sellest, kas antud süsteemi ühikute koguarv on teada või mitte. Kui see on teatud populatsioon, on valimi võtmine lihtsam tänu sellele, et on teada, mitu protsenti sellest on kokkuühikutest võetakse proovid.

See hetk on uurimistöös väga vajalik. Näiteks kui on vaja uurida madala kvaliteediga kondiitritoodete protsenti konkreetses tehases. Oletame, et populatsioon on juba defineeritud. Kindlalt on teada, et see ettevõte toodab 1000 kondiitritoodet aastas. Kui teeme sellest tuhandest 100 juhuslikust kondiitritootest proovi ja saadame need ekspertiisi, siis on viga minimaalne. Laias laastus uuriti 10% kõikidest toodetest ning tulemuste põhjal võib esindusviga arvestades rääkida kõigi toodete kehvast kvaliteedist.

Ja kui teha 100 kondiitritoote valim määramatust üldkogumist, kus tegelikult oli näiteks 1 miljon ühikut, siis on valimi ja uuringu tulemus kriitiliselt ebausutav ja ebatäpne. Kas tunnete erinevust? Seetõttu on üldpopulatsiooni kindlus enamikul juhtudel äärmiselt oluline ja mõjutab suuresti uuringu tulemust.

Rahvastiku esinduslikkus

Niisiis, nüüd üks olulisemaid küsimusi – milline peaks olema valim? See on kõige rohkem Peaasi uurimine. Selles etapis on vaja arvutada valim ja valida ühikud koguarv temasse. Üldkogum valiti õigesti, kui üldkogumi teatud tunnused ja tunnused jäävad valimisse. Seda nimetatakse esinduslikkuseks.

Teisisõnu, kui osal säilivad pärast selekteerimist samad tendentsid ja omadused nagu kogu uuritava kogusel, siis nimetatakse sellist populatsiooni esinduslikuks. Kuid mitte iga konkreetset valimit ei saa valida representatiivsest populatsioonist. On ka selliseid uurimisobjekte, mille valim lihtsalt ei saa olla esinduslik. Siit pärineb esindusvea mõiste. Aga räägime sellest veidi lähemalt.

Kuidas proovi teha

Seega on esinduslikkuse maksimeerimiseks kolm peamist valimi võtmise reeglit:


Esinduslikkuse viga (viga).

Peamine omadus valitud valimi kvaliteet on "representatiivsuse vea" mõiste. Mis see on? Need on teatud lahknevused selektiivse ja pideva vaatluse näitajate vahel. Veanäitajate järgi jaguneb esinduslikkus usaldusväärseks, tavaliseks ja ligikaudseks. Teisisõnu on lubatud kõrvalekalded kuni 3%, vastavalt 3 kuni 10% ja 10 kuni 20%. Kuigi statistikas on soovitav, et viga ei ületaks 5-6%. Vastasel juhul on põhjust rääkida valimi ebapiisavast esinduslikkusest. Esindusvea arvutamiseks ja selle mõju valimile või üldkogumile võetakse arvesse mitmeid tegureid.

  1. Tõenäosus, millega saada täpne tulemus.
  2. Proovivõtuüksuste arv. Nagu varem mainitud, mida väiksem on ühikute arv valimis, seda suurem on esindusviga ja vastupidi.
  3. Uuritava populatsiooni homogeensus. Mida heterogeensem on populatsioon, seda suurem on esindusviga. Populatsiooni võime olla esinduslik sõltub kõigi selle koostisosade homogeensusest.
  4. Valimipopulatsiooni üksuste valimise meetod.

Betoonis määratud uuringud keskmise vea protsendi määrab tavaliselt uurija ise, lähtudes vaatlusprogrammist ja varasemate uuringute andmetest. Reeglina peetakse vastuvõetavaks maksimaalset valimi viga (esindusviga) 3-5% piires.

Rohkem ei ole alati parem

Samuti tasub meeles pidada, et valikulise vaatluse korraldamisel on peamine viia selle maht vastuvõetava miinimumini. Samas ei tohiks püüda liigselt valimi koostamise vigade piirmäärasid, kuna see võib tuua kaasa valimiandmete hulga põhjendamatu suurenemise ja sellest tulenevalt ka valimi võtmise maksumuse suurenemise.

Samas ei tohiks esindusvea suurust ülemäära suurendada. Lõppude lõpuks, kuigi sel juhul valimi suurus väheneb, põhjustab see saadud tulemuste usaldusväärsuse halvenemist.

Milliseid küsimusi uurija tavaliselt küsib?

Igasugune uuring, kui seda tehakse, on mingi eesmärgi ja tulemuste saamiseks. Läbiviimisel näidisuuring on tavaliselt määratud esialgsed küsimused:


Valimi uurimisüksuste valimise meetodid

Iga valim ei ole esinduslik. Mõnikord väljendub üks ja sama märk tervikus ja selle osas erinevalt. Esinduslikkuse nõuete saavutamiseks on soovitav kasutada erinevaid proovivõtutehnikaid. Pealegi sõltub ühe või teise meetodi kasutamine konkreetsetest asjaoludest. Mõned neist proovivõtumeetoditest hõlmavad järgmist:

  • juhuslik valik;
  • mehaaniline valik;
  • tüüpiline valik;
  • jada (pesastatud) valik.

Juhuslik valik on tegevuste süsteem, mis on suunatud populatsiooni üksuste juhuslikule valikule, kui valimisse sattumise tõenäosus on üldkogumi kõigi üksuste puhul võrdne. Seda tehnikat on soovitatav kasutada ainult homogeensuse ja vähese arvu sellele omaste tunnuste korral. Muidu mõned iseloomuomadused riski, et ei satu valimisse. Juhusliku valiku tunnused on kõigi teiste valimi moodustamise meetodite aluseks.

Mehaaniline üksuste valik toimub teatud intervalliga. Kui on vaja moodustada valim konkreetsetest kuritegudest, on võimalik eemaldada iga 5., 10. või 15. kaart kõigist registreeritud kuritegude statistilistest kirjetest, olenevalt nende koguarvust ja saadaolevatest valimi suurustest. Selle meetodi puuduseks on see, et enne valimist on vaja omada täielikku arvestust üldkogumi ühikute kohta, seejärel on vaja läbi viia pingerida ja alles pärast seda on võimalik teatud intervalliga valim võtta. See meetod võtab palju aega, seetõttu ei kasutata seda sageli.

Tüüpiline (regionaliseeritud) valik – valimi tüüp, milles üldkogumik jaguneb homogeensed rühmad teatud alusel. Mõnikord kasutavad teadlased "rühmade" asemel muid mõisteid: "rajoonid" ja "tsoonid". Seejärel valitakse igast rühmast juhuslikult proportsionaalselt teatud arv ühikuid erikaal elanikkonna rühmad. Tüüpiline valik tehakse sageli mitmes etapis.

Seeriaproovi võtmine on meetod, mille puhul ühikute valik toimub rühmadena (seeriatena) ja kõik valitud rühma (seeria) ühikud kuuluvad uurimisele. Selle meetodi eeliseks on see, et mõnikord on näiteks karistust kandva isiku uurimisel keerulisem valida üksikuid ühikuid kui seeriaid. Valitud piirkondades, tsoonides rakendatakse eranditult kõigi üksuste uurimist, näiteks kõigi konkreetses asutuses karistust kandvate isikute uuringut.

Sündmuse tõenäosuse intervallhinnang. Valimite arvu arvutamise valemid juhuvaliku meetodi korral.

Meid huvitavate sündmuste tõenäosuste määramiseks kasutame valimimeetodit: teostame n sõltumatud katsed, mille puhul võib juhtuda A (või mitte toimuda) (tõenäosus R sündmuse A esinemine igas katses on konstantne). Siis sündmuste toimumise suhteline sagedus p* AGA sarjas n testid aktsepteeritakse kui punkthinnang tõenäosuse pärast lk sündmuse toimumine AGA eraldi testis. Sel juhul kutsutakse väärtus p* näidisosa sündmuste esinemised AGA ja r - üldine aktsia .

Kesksest järelduvuse tõttu piiri teoreem(Moivre-Laplace'i teoreem) suure valimi suurusega sündmuse suhtelist sagedust võib pidada normaaljaotuks parameetritega M(p*)=p ja

Seega n>30 puhul usaldusvahemiküldaktsia jaoks saab konstrueerida valemite abil:


kus u cr leitakse Laplace'i funktsiooni tabelite järgi, võttes arvesse antud usaldustõenäosust γ: 2Ф(u cr)=γ.

Väikese valimi suurusega n≤30 määratakse piirviga ε Studenti jaotustabelist:
kus t cr =t(k; α) ja vabadusastmete arv k=n-1 tõenäosus α=1-γ (kahepoolne ala).

Valemid kehtivad juhul, kui valik viidi läbi juhuslikult korduvalt (üldpopulatsioon on lõpmatu), vastasel juhul on vaja teha parandus mittekorduva valiku osas (tabel).

Üldise osakaalu keskmine valimiviga

RahvaarvLõputuülim maht N
Valiku tüüpKorduvmittekorduv
Keskmine proovivõtu viga

Valemid valimi suuruse arvutamiseks õige juhusliku valiku meetodiga

ValikumeetodProovi suuruse valemid
keskmise jaoksjagamiseks
Korduv
mittekorduv
Ühikute osakaal w = . Täpsus ε = . Tõenäosus γ =

Probleemid üldaktsiaga

Küsimusele "Kas antud p 0 väärtus katab usaldusvahemiku?" - saab vastata kontrollides statistiline hüpotees H 0: p = p 0. Eeldatakse, et katsed viiakse läbi Bernoulli testi skeemi järgi (sõltumatu, tõenäosus lk sündmuse toimumine AGA konstantne). Mahuproovi järgi n määrake sündmuse A toimumise suhteline sagedus p *: kus m- sündmuse esinemiste arv AGA sarjas n testid. Hüpoteesi H 0 testimiseks kasutatakse statistikat, mis piisavalt suure valimi korral omab standardit normaaljaotus(Tabel 1).
Tabel 1 - Hüpoteesid üldaktsia kohta

Hüpotees

H0:p=p0H 0:p 1 \u003d p 2
OletusedBernoulli testi skeemBernoulli testi skeem
Näidishinnangud
Statistika K
Statistika jaotus K Standardne tavaline N(0,1)

Näide nr 1. Juhusliku kordusvalimi abil viis ettevõtte juhtkond läbi pistelise küsitluse, milles osales 900 oma töötajat. Vastanute seas oli 270 naist. Joonistage usaldusvahemik, mis tõenäosusega 0,95 katab naiste tegeliku osakaalu kogu ettevõtte meeskonnas.
Otsus. Tingimuste järgi on naiste valimi osakaal (naiste suhteline esinemissagedus kõigi vastajate seas). Kuna valik kordub ja valimi suurus on suur (n=900), määratakse valimi piirviga valemiga

u cr väärtus leitakse Laplace'i funktsiooni tabelist seosest 2Ф(u cr)=γ, s.o. Laplace'i funktsioon (lisa 1) saab väärtuse 0,475, kui u cr =1,96. Seega piirviga ja soovitud usaldusvahemik
(p – ε, p + ε) = (0,3 – 0,18; 0,3 + 0,18) = (0,12; 0,48)
Seega võib tõenäosusega 0,95 garanteerida, et naiste osakaal kogu ettevõtte meeskonnas jääb vahemikku 0,12–0,48.

Näide nr 2. Parkla omanik loeb päeva "õnnelikuks", kui parkla täituvus on üle 80%. Aasta jooksul viidi läbi 40 parklate ülevaatust, millest 24 olid „edukad“. Tõenäosusega 0,98 leidke usaldusvahemik aasta "õnnepäevade" tõelise protsendi hindamiseks.
Otsus. “Heade” päevade proovifraktsioon on
Laplace'i funktsiooni tabeli järgi leiame antud antud u cr väärtuse
usalduse tase
Ф(2,23) = 0,49, u cr = 2,33.
Arvestades valikut mittekorduvaks (st samal päeval kahte kontrolli ei tehtud), leiame piirvea:
kus n = 40, N = 365 (päevad). Siit
ja üldmurru usaldusvahemik: (p – ε, p + ε) = (0,6 – 0,17; 0,6 + 0,17) = (0,43; 0,77)
Tõenäosusega 0,98 võib eeldada, et "heade" päevade osakaal aasta jooksul jääb vahemikku 0,43-0,77.

Näide nr 3. Pärast partii 2500 artikli kontrollimist leidsid nad, et 400 eset olid kõrgeima klassi, kuid n–m mitte. Mitut toodet tuleb kontrollida, et määrata 95% kindlusega 0,01 täpsusega premium klassi osakaal?
Otsime lahendust ümbervalimiseks valimi suuruse määramise valemi järgi.

Ф(t) = γ/2 = 0,95/2 = 0,475 ja Laplace'i tabeli järgi vastab see väärtus t=1,96
Proovi fraktsioon w = 0,16; diskreetimisviga ε = 0,01

Näide nr 4. Toodete partii võetakse vastu, kui tõenäosus, et toode vastab standardile, on vähemalt 0,97. Testitud partii juhuslikult valitud 200 toote hulgast osutus standardile vastavaks 193 toodet. Kas partii on võimalik aktsepteerida olulisuse tasemel α=0,02?
Otsus. Sõnastame peamised ja alternatiivsed hüpoteesid.
H 0: p \u003d p 0 \u003d 0,97 - teadmata üldaktsia lk on võrdne seatud väärtus p 0 =0,97. Seoses seisukorraga - tõenäosus, et testitava partii osa on standardile vastav, on 0,97; need. tootepartii saab vastu võtta.
H1: p<0,97 - вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Vaadeldud statistiline väärtus K(tabel) arvuta antud väärtuste jaoks p 0 =0,97, n = 200, m = 193


Kriitiline väärtus leitakse Laplace'i funktsiooni tabelist võrdusest


Vastavalt tingimusele α=0,02, seega F(Kcr)=0,48 ja Kcr=2,05. Kriitiline piirkond on vasakukäeline, s.o. on intervall (-∞;-K kp)= (-∞;-2,05). Vaadeldud väärtus Kobs = -0,415 ei kuulu kriitilisse piirkonda, mistõttu ei ole sellel olulisuse tasemel põhjust põhihüpoteesi ümber lükata. Võib vastu võtta tootepartii.

Näide number 5. Kaks tehast toodavad sama tüüpi osi. Nende kvaliteedi hindamiseks võeti nende tehaste toodetest proovid ja saadi järgmised tulemused. Esimese tehase 200 väljavalitud toote hulgas oli defektiga 20, teise tehase 300 toote hulgas aga 15 defektiga.
Olulisuse tasemel 0,025 saate teada, kas nende tehaste toodetud osade kvaliteedis on oluline erinevus.

Vastavalt tingimusele α=0,025, seega F(Kcr)=0,4875 ja Kcr=2,24. Kahepoolse alternatiivi korral on lubatud väärtuste ala kujul (-2,24; 2,24). Vaadeldud väärtus Kobs =2,15 jääb sellesse intervalli, s.o. sellel olulisuse tasemel ei ole põhjust põhihüpoteesi ümber lükata. Tehased toodavad sama kvaliteediga tooteid.


Plaan

  • Sissejuhatus
  • 1. Valimi moodustamise roll
  • Järeldus
  • Bibliograafia

Sissejuhatus

Statistika on analüütiline teadus, mis on vajalik kõigile kaasaegsetele spetsialistidele. Kaasaegne spetsialist ei saa olla kirjaoskaja, kui tal pole statistilist metoodikat. Statistika on ettevõtte ja ühiskonna vahelise suhtluse kõige olulisem vahend. Statistika on kõigi erialade õppekavas üks olulisemaid erialasid. statistiline kirjaoskus on kõrghariduse lahutamatu osa ning õppekavas eraldatud tundide arvu poolest on see ühel esikohal. Arvudega töötades peab iga spetsialist teadma, kuidas teatud andmed on saadud, milline on nende arvutamise olemus, kui täielikud ja usaldusväärsed need on.

1. Valimi moodustamise roll

Üldkogumit üldkogumi kõigist üksustest, millel on teatud atribuut ja mida uuritakse, nimetatakse statistikas üldkogumiks.

Praktikas ei ole ühel või teisel põhjusel alati võimalik või ebaotstarbekas arvestada kogu elanikkonnaga. Siis piirdutakse vaid mingi osa uurimisega sellest, mille lõppeesmärk on laiendada saadud tulemusi kogu üldpopulatsioonile, s.o. kasutades proovivõtumeetodit.

Selleks valitakse üldkogumikust erilisel viisil osa elemente, nn valim ning valimiandmete töötlemise tulemused (näiteks aritmeetilised keskmised) üldistatakse kogu üldkogumile.

Valimimeetodi teoreetiliseks aluseks on suurte arvude seadus. Selle seaduse kohaselt võib tunnuse piiratud hajuvuse korral üldkogumis ja piisavalt suure valimi korral täieliku usaldusväärsuse lähedase tõenäosusega valimi keskmine olla suvaliselt lähedane üldkeskmisele. See seadus, mis sisaldab teoreemide rühma, on rangelt matemaatiliselt tõestatud. Seega võib valimi kohta arvutatud aritmeetilist keskmist pidada põhjendatult üldkogumit tervikuna iseloomustavaks näitajaks.

2. Esinduslikkuse tagavad tõenäosusliku valiku meetodid

Et valimi põhjal oleks võimalik teha järeldust üldkogumi omaduste kohta, peab valim olema esinduslik (esinduslik), s.t. see peab täielikult ja adekvaatselt esindama üldrahvastiku omadusi. Valimi esinduslikkust saab tagada vaid juhul, kui andmete valik on objektiivne.

Valimikomplekt moodustatakse massitõenäosuslike protsesside põhimõttel ilma eranditeta aktsepteeritud valikuskeemist; on vaja tagada proovi suhteline homogeensus või selle jagunemine homogeenseteks ühikurühmadeks. Valimikogumi moodustamisel tuleks anda valimiüksuse selge määratlus. Soovitav on ligikaudu sama suur proovivõtuüksus ja tulemused on seda täpsemad, mida väiksem on proovivõtuüksus.

Võimalikud on kolm valikumeetodit: juhuslik valik, ühikute valimine teatud skeemi järgi, esimese ja teise meetodi kombinatsioon.

Kui valik vastavalt aktsepteeritud skeemile viiakse läbi üldkogumi hulgast, mis on varem jagatud tüüpideks (kihtideks või kihtideks), siis nimetatakse sellist valimit tüüpiliseks (või kihistunud või kihistunud või tsoneeritud). Valimi teise jaotuse liigiti määrab see, mis on valimiüksus: vaatlusüksus või üksuste jada (mõnikord kasutatakse terminit "pesa"). Viimasel juhul nimetatakse valimit jada- või pesastatud. Praktikas kasutatakse sageli tüüpilise valimi ja seeriavaliku kombinatsiooni. Matemaatilises statistikas on andmevaliku probleemi käsitlemisel vaja tutvustada valimi jagamist korduvaks ja mittekorduvaks. Esimene vastab tagastatava palli skeemile, teine ​​- pöördumatu (kui arvestada andmete valimise protsessi urnist erinevat värvi pallide valimise näitel). Sotsiaalmajanduslikus statistikas ei ole mõtet kasutada korduvat valimit, seetõttu peetakse reeglina silmas mittekorduvat valimit.

Kuna sotsiaalmajanduslikud objektid on keerulise ülesehitusega, võib valimi korraldamine olla üsna keeruline. Näiteks leibkondade valimiseks suurlinna elanike tarbimise uurimisel on lihtsam valida esmalt territoriaalsed lahtrid, elamud, seejärel korterid või majapidamised ja seejärel vastaja. Sellist näidist nimetatakse mitmeastmeliseks. Igas etapis kasutatakse erinevaid valimiüksusi: algfaasis suuremaid, viimases etapis langeb valikuüksus kokku vaatlusüksusega.

Teine proovivaatluse tüüp on mitmefaasiline proovivõtt. Selline valim sisaldab teatud arvu faase, millest igaüks erineb vaatlusprogrammi detailide poolest. Näiteks küsitletakse lühiprogrammi järgi 25% kogu üldrahvastikust, iga 4. üksus sellest valimist uuritakse terviklikuma programmi järgi jne.

Igat tüüpi proovide puhul valitakse ühikud kolmel viisil. Kaaluge juhusliku valiku protseduuri. Kõigepealt koostatakse rahvastikuüksuste nimekiri, milles igale üksusele omistatakse digitaalne kood (number või silt). Seejärel tehakse viik. Vastavate numbritega pallid pannakse trumlisse, need segatakse ja pallid valitakse. Välja kukkunud numbrid vastavad valimis olevatele ühikutele; numbrite arv võrdub kavandatud valimi suurusega.

Loosimise teel valik võib olla tingitud tehnilistest vigadest (pallide kvaliteet, trumm) ja muudest põhjustest. Objektiivsuse seisukohalt usaldusväärsem on valik juhuslike arvude tabeli järgi. Selline tabel sisaldab elektrooniliste signaalide abil valitud juhuslikult vahelduvaid numbreid. Kuna me kasutame kümnendarvusüsteemi 0, 1, 2,., 9, on suvalise numbri ilmumise tõenäosus 1/10. Seega, kui oleks vaja luua juhuslike arvude tabel, mis sisaldab 500 tähemärki, siis umbes 50 neist oleks 0, sama arv oleks 1 jne.

Sageli kasutatakse mõne skeemi järgi valikut (nn suunatud proovivõttu). Valikuskeem võetakse vastu nii, et see kajastaks üldrahvastiku põhiomadusi ja proportsioone. Lihtsaim viis: vastavalt üldkogumi ühikute loenditele, mis on koostatud nii, et ühikute järjestus ei oleks seotud uuritavate omadustega, teostatakse mehaaniline ühikute valik sammuga N: n. Tavaliselt, valik ei alga esimesest ühikust, vaid taandub poole sammu võrra, et vähendada valimi kallutatuse võimalust. Teatud tunnustega üksuste esinemissagedus, näiteks teatud õppeedukusega üliõpilased, hostelis elamine jne. määrab üldpopulatsioonis välja kujunenud struktuur.

Et olla kindlam, et valim kajastaks üldkogumi struktuuri, jagatakse viimane tüüpideks (kihtideks või aladeks) ning iga tüübi hulgast tehakse juhuslik või mehaaniline valik. Erinevatest tüüpidest valitud ühikute koguarv peaks vastama valimi suurusele.

Erilised raskused tekivad siis, kui ühikute nimekiri puudub ning valik tuleb teha kas kohapeal või valmistoote laos olevatest tootenäidistest. Nendel juhtudel on oluline üksikasjalikult välja töötada maastiku orientatsiooniskeem ja valikuskeem ning järgida seda ilma kõrvalekaldeid lubamata. Näiteks antakse arvestile korraldus liikuda kindlast tänava paarisküljel asuvast bussipeatusest põhja poole ja pärast kahe maja lugemist esimesest nurgast siseneda kolmandasse ja küsitleda iga 5. eluruumi järel. Vastuvõetud skeemi range järgimine tagab esindusliku valimi moodustamise peamise tingimuse - üksuste valiku objektiivsuse - täitmise.

Alates suvaline näidis tuleks eristada kvoodivalikut, kui valim koostatakse teatud kategooriate üksustest (kvoodid), mis peavad olema esindatud etteantud proportsioonides. Näiteks kaubamaja kliendiküsitluses võidakse kavandada 150 vastajat, sealhulgas 90 naist, kellest 25 on tüdrukud, 20 on väikelastega noored naised, 35 on ärikostüümi riietatud keskealised naised, 10 on 50. eluaastates ja vanemad naised; lisaks kavandati küsitlus 70 mehe seas, kellest 25 olid teismelised ja noormehed, 20 olid lastega noormehed, 15 olid ülikonnas, 10 olid spordirõivastes mehed. Tarbijate orientatsiooni ja eelistuste määramiseks võib selline valim olla hea, kuid kui tahame paika panna keskmise ostusumma, nende struktuuri, saame ebarepresentatiivsed tulemused. Seda seetõttu, et kvootide valimi võtmise eesmärk on valida teatud kategooriad.

Valim võib olla mitteesinduslik, isegi kui see on moodustatud üldkogumi teadaolevate proportsioonide kohaselt, kuid valik toimub ilma igasuguse skeemita - üksusi värvatakse igal viisil, et tagada nende kategooriate suhe samades proportsioonides. nagu kogupopulatsioonis (näiteks meeste ja naiste, töövõimelistest ja töövõimelistest nooremate ja vanemate vastajate suhe jne).

Need märkused peaksid teid hoiatama selliste valimi moodustamise lähenemisviiside eest ja rõhutama uuesti objektiivse valimi moodustamise vajadust.

3. Juhusliku, mehaanilise, tüüpilise ja jadavalimi korralduslikud ja metoodilised iseärasused

Sõltuvalt sellest, kuidas valimi üldkogumi elementide valik toimub, on valikuuringuid mitut tüüpi. Valik võib olla juhuslik, mehaaniline, tüüpiline ja jada.

Juhuslik valik on selline valik, mille puhul on kõigil üldkogumi elementidel võrdne võimalus olla valitud. Teisisõnu, igal üldkogumi elemendil on võrdne tõenäosus valimisse sattuda.

valimi võtmine statistiline tõenäosuslik juhuslik

Juhusliku valiku nõue saavutatakse praktikas loosi või juhuslike arvude tabeli abil.

Loosimise teel valimisel nummerdatakse eelnevalt kõik üldkogumi elemendid ja kantakse nende numbrid kaartidele. Pärast hoolikat segamist pakist mis tahes viisil (reas või muus järjekorras) valitakse valimi suurusele vastav vajalik arv kaarte. Sel juhul võid valitud kaardid kas kõrvale panna (sellega teostada nn mittekorduvat valikut) või kaardi välja tõmmates kirjutada selle numbri ja tagastada pakki, andes seeläbi võimaluse ilmuda. uuesti proovis (korduv valik). Uuesti valimisel tuleb iga kord pärast kaardi tagastamist pakki hoolikalt segada.

Joonistusmeetodit kasutatakse juhtudel, kui kogu uuritava populatsiooni elementide arv on väike. Üldkogumi suure hulga korral muutub loterii teel juhusliku valiku rakendamine keeruliseks. Suure hulga töödeldavate andmete korral on töökindlam ja vähem aeganõudvam meetod juhuslike arvude tabeli kasutamine.

Mehaaniline valik toimub järgmiselt. Kui moodustatakse 10% valim, s.o. tuleb valida üks kümnest elemendist, siis jagatakse kogu komplekt tinglikult 10 elemendist koosnevateks võrdseteks osadeks. Seejärel valitakse kümne parima hulgast juhuslikult element. Näiteks loosimisel oli märgitud üheksas number. Valimi ülejäänud elementide valik on täielikult määratud valiku N osaga esimese valitud elemendi numbriga. Vaadeldaval juhul koosneb valim elementidest 9, 19, 29 jne.

Mehaanilist valikut tuleks kasutada ettevaatlikult, kuna on reaalne nn süstemaatiliste vigade oht. Seetõttu on enne mehaanilise proovivõtu tegemist vaja uuritavat populatsiooni analüüsida. Kui selle elemendid paiknevad juhuslikult, on mehaaniliselt saadud proov juhuslik. Sageli on aga originaalkomplekti elemendid osaliselt või isegi täielikult tellitud. Mehaanilise valiku puhul on väga ebasoovitav, et elementide järjekord oleks õige korratavusega, mille periood võib kattuda mehaanilise proovivõtu perioodiga.

Sageli on populatsiooni elemendid järjestatud uuritava tunnuse väärtuse järgi kahanevas või suurenevas järjekorras ning neil puudub perioodilisus. Sellisest populatsioonist mehaaniline valik omandab suunatud selektsiooni iseloomu, kuna populatsiooni üksikud osad on esindatud valimis proportsionaalselt nende suurusega kogu populatsioonis, s.t. valiku eesmärk on muuta valim esinduslikuks.

Teine suunavaliku tüüp on tüüpiline valik. Tüüpilist valikut tuleks eristada tüüpiliste objektide valikust. Tüüpiliste objektide valikut kasutati zemstvo statistikas, samuti eelarveuuringutes. Samal ajal toimus "tüüpiliste külade" või "tüüptalude" valik teatud majanduslike tunnuste järgi, näiteks maaomandi suuruse järgi majapidamise kohta, elanike elukutse järgi jne. . Seda tüüpi valik ei saa olla valimimeetodi rakendamise aluseks, kuna siin ei ole täidetud selle põhinõue – valiku juhuslikkus.

Valimimeetodi tegeliku tüüpilise valiku korral jagatakse populatsioon kvalitatiivselt homogeenseteks rühmadeks ja seejärel tehakse iga rühma sees juhuslik valik. Tüüpilist valikut on keerulisem korraldada kui juhuslikku valikut ennast, kuna nõutakse teatud teadmisi üldkogumi koostise ja omaduste kohta, kuid see annab täpsemaid tulemusi.

Jadavalikuga jagatakse kogu populatsioon rühmadesse (seeriatesse). Seejärel isoleeritakse juhusliku või mehaanilise valiku teel teatud osa nendest seeriatest ja viiakse läbi nende pidev töötlemine. Sisuliselt on seeriavalik juhuslik või mehaaniline valik, mis viiakse läbi esialgse populatsiooni suurendatud elementide jaoks.

Teoreetilises plaanis on seeriaproovi võtmine vaadeldud kõige ebatäiuslikum. Materjali töötlemiseks seda reeglina ei kasutata, kuid see pakub teatud mugavusi uuringute korraldamisel, eriti põllumajanduse uurimisel. Näiteks viidi kollektiviseerimisele eelnenud aastatel läbi iga-aastased talurahva talude valikuuringud jadavaliku meetodil. Seda on ajaloolasel kasulik teada seeriaproovide võtmine kuna ta võib kohtuda selliste uuringute tulemustega.

Lisaks ülalkirjeldatud klassikalistele valikumeetoditele kasutatakse valimimeetodi praktikas ka teisi meetodeid. Vaatleme neist kahte.

Uuritav populatsioon võib olla mitmeastmelise struktuuriga, see võib koosneda esimese etapi üksustest, mis omakorda koosnevad teise etapi üksustest jne. Näiteks provintside hulka kuuluvad uyezdid, uyezdeid võib pidada volostide kogumiks, volostid koosnevad küladest ja külad koosnevad majapidamistest.

Selliste populatsioonide puhul saab rakendada mitmeastmelist selektsiooni, s.t. igas etapis järjestikku valida. Seega saab provintside hulgast valida maakonnad (esimene samm) mehaaniliselt, tüüpilisel või juhuslikul viisil, seejärel valida ühe näidatud meetodi abil volostid (teine ​​samm), seejärel valida külad (kolmas samm) ja lõpuks leibkonnad (neljas samm).

Kaheetapilise mehaanilise valiku näide on pikka aega praktiseeritud töötajate eelarvete valimine. Esimeses etapis valitakse mehaaniliselt ettevõtted, teises - töötajad, kelle eelarvet vaadatakse.

Uuritavate objektide tunnuste varieeruvus võib olla erinev. Näiteks talupojatalude varustamine oma tööjõuga kõigub vähem kui näiteks nende saagi suurus. Seetõttu on väiksem tööjõupakkumise valim sama tüüpiline kui suurem põllukultuuride suuruse andmete valim. Sel juhul saab põllukultuuride suuruse määramiseks kasutatud valimi põhjal teha tööjõu olemasolu kindlaksmääramiseks piisavalt esindusliku valimi, tehes seeläbi kahefaasilise valiku. Üldjuhul võib lisada ka järgmised faasid, st. saadud alamvalimist teha teine ​​alamvalim jne. Sama valikumeetodit kasutatakse juhtudel, kui uuringu eesmärgid nõuavad erinevate näitajate arvutamisel erinevat täpsust.

Ülesanne 1. Kirjeldav statistika

Eksamil said 20 õpilast järgmised hinded (100 punkti skaalal):

1) Koostage 5 intervalli jaoks sagedusjaotuste, suhteliste ja akumuleeritud sageduste jada;

2) koostada hulknurk, histogramm ja kumulatiivne hulknurk;

3) Leidke aritmeetiline keskmine, mood, mediaan, esimene ja kolmas kvartiil, kvartalivahemik, standardhälve ja variatsioonikoefitsiendid. Analüüsige andmeid nende omaduste abil ja märkige intervall, mis sisaldab 50% määratud väärtuste keskväärtustest.

1) x (min) =53, x (max) =98

R = x (max) - x (min) = 98-53 = 45

h=R/1+3,32lgn, kus n on valimi suurus, n=20

h= 45/1+3,32*lg20= 9

a (i) - intervalli alumine piir, b (i) - intervalli ülempiir.

a (1) = x (min) - h/2, b (1) = a (1) + h, siis kui b (i) on i-nda intervalli ülempiir (ja a (i+1) =b (i)), siis b (2) = a (2) + h, b (3) = a (3) + h jne. Intervallide konstrueerimine jätkub kuni järgmise intervalli alguseni, mis on võrdne või suurem kui x (max).

a(1) = 47,5 b(1) = 56,5

a(2) = 56,5 b(2) = 65,5

a(3) = 65,5 b(3) = 74,5

a(4) = 74,5 b(4) = 83,5

a(5) = 83,5 b(5) = 92,5

a(6) = 92,5 b(6) = 101,5

Intervallid, a (i) - b (i)

Sageduse loendamine

Sagedus, n(i)

Kumulatiivne sagedus, n (hi)

2) Graafikute joonistamiseks kirjutame üles suhteliste sageduste W (i) = n (i) / n variatsioonilise jaotuse jada (intervall ja diskreetne), akumuleeritud suhtelised sagedused W (hi) ja leiame suhte W (i) / h täites tabeli.

x(i)=a(i)+b(i)/2; W(hi)=n(hi)/n

Hinnangute statistiline jaotusseeria:

Intervallid, a (i) - b (i)

Suhteliste sageduste histogrammi koostamiseks piki abstsissi eraldame osalised intervallid, millest igaühele ehitame ristküliku, mille pindala on võrdne antud i-nda intervalli suhtelise sagedusega W (i). Seejärel peaks elementaarse ristküliku kõrgus olema võrdne W (i) / h.

Sama jaotusega hulknurga saab histogrammilt, kui ristkülikute ülemiste aluste keskpunktid on omavahel ühendatud sirglõikudega.

Diskreetse jada kumulatsiooni koostamiseks joonistame tunnuse väärtused piki abstsisstellge ja suhtelised akumuleeritud sagedused W (hi) piki ordinaattelge. Saadud punktid on ühendatud joonelõikudega. Abstsissi piki intervallide seeria jaoks jätsime kõrvale rühmituse ülemised piirid.

3) Aritmeetiline keskmine väärtus leitakse valemiga:

Režiim arvutatakse järgmise valemiga:

Modaalse intervalli alumine piir; h - rühmitamise intervalli laius; - modaalintervalli sagedus; - modaalile eelneva intervalli sagedus; - modaalile järgneva intervalli sagedus. = 23,125.

Leiame mediaani:

n = 20: 53.58.59.59.63.67.68.69.71.73.78.79.85.86.87.89.91.91.98.98

Väärtused asendades saame: Q1=65;

Teise kvartiili väärtus on sama, mis mediaani väärtus, seega Q2=75,5; Q3 = 88.

Kvartali vahemik on:

Ruutkeskmise (standard) hälve leitakse järgmise valemi abil:

Variatsioonikoefitsient:

Nendest arvutustest on näha, et 50% näidatud koguste keskväärtustest sisaldab intervalli 74,5–83,5.

Ülesanne 2. Hüpoteeside statistiline kontrollimine.

Spordieelistused meestele, naistele ja teismelistele on järgmised:

Testige hüpoteesi eelistuse sõltumatuse kohta soost ja vanusest b = 0,05.

1) Hüpoteesi kontrollimine eelistuste sõltumatuse kohta spordis.

Pearseni koefitsient:

Hii-ruuttesti tabeliväärtus vabadusastmega 4 b \u003d 0,05 juures on võrdne h 2 tabeliga \u003d 9,488.

Kuna hüpotees lükatakse tagasi. Erinevused eelistustes on märkimisväärsed.

2. Vastavuse hüpotees.

Võrkpall kui spordiala on korvpallile kõige lähedasem. Kontrollime meeste, naiste ja teismeliste eelistuste vastavust.

Ф 2 = 0,1896+0,1531+0,1624+0,1786+0,1415+0,1533 = 0,979.

Olulisuse tasemel b = 0,05 ja vabadusastmel k = 2 on tabeliväärtus h 2 tabl = 9,210.

Alates Ф 2 > on eelistuste erinevused märkimisväärsed.

Ülesanne 3. Korrelatsioon- ja regressioonanalüüs.

Liiklusõnnetuste analüüs andis alla 21-aastaste juhtide osakaalu ja raskete tagajärgedega õnnetuste arvu kohta 1000 juhi kohta järgmise statistika:

Tehke andmete graafiline ja korrelatsioon-regressioonanalüüs, ennustage raskete tagajärgedega õnnetuste arvu linnas, kus alla 21-aastaste juhtide arv on võrdne 20% juhtide koguarvust.

Saame valimi suurusega n = 10.

x on alla 21-aastaste juhtide protsent,

y on õnnetuste arv 1000 juhi kohta.

Võrrand lineaarne regressioon tundub, et:

Arvutame järjestikku:

Samamoodi leiame

Valimi regressioonikordaja

Seos x, y vahel on tugev.

Lineaarse regressiooni võrrand on järgmisel kujul:

peal kujund esitati valdkonnas hajumine ja ajakava lineaarne regressioon . Me kulutame prognoos jaoks x n =20 .

Saame y n =0 .2 9*20-1 .4 6 = 4 .3 4 .

Ennustav tähenduses juhtus rohkem kõik väärtused, esitatud sisse originaal laud . See on tagajärg Minema, mida korrelatsioon sõltuvus otse ja koefitsient võrdub 0,29 piisav suur . peal iga üksus juurdekasvuga Dx kas ta on annab juurdekasv Dy =0 .3

Harjutus 4 . Analüüs ajutine auastmed ja prognoosimine .

ennustada järgmise nädala indeksi väärtused, kasutades:

a) libiseva keskmise meetod, valides selle arvutamiseks kolme nädala andmed;

b) eksponentsiaalne kaalutud keskmine, valides b = 0,1.

Juhuslike arvude tabelist leiame arvud 41, 51, 69, 135, 124, 93, 91, 144, 10, 24.

Järjestame need kasvavas järjekorras: 10, 24, 41, 51, 69, 91, 93, 124, 135, 144.

Teostame uue numeratsiooni 1-st 10-ni. Algandmed saame kümne nädala kohta:

Eksponentsiaalne silumine b = 0,1 annab ainult ühe väärtuse.

Kogu perioodi keskpaiga kohta saame kolm prognoosi: 12,855; 1309; 12.895.

Nende prognooside vahel on üksmeel.

Harjutus 5 . indeks analüüs.

Ettevõte tegeleb kaupade veoga. 4 veoseliigi veomahu ja veoseühiku transpordi maksumuse kohta on andmeid mitme aasta kohta.

Määrake iga tootetüübi jaoks lihtsad hinna-, koguse- ja väärtuseindeksid, samuti Laspeyresi ja Pasche indeksid ning väärtusindeks. Kommenteerige saadud tulemusi sisukalt.

Otsus. Arvutame lihtsad indeksid:

Laspeyresi indeks:

Pasha indeks:

Türgi hind:

Individuaalsed indeksid näitavad kaupade A, B, C, D hindade ja koguste muutuste erinevust. Koondindeksid näitavad muutuste üldisi trende. Üldkokkuvõttes langes transporditava kauba maksumus 13%. Põhjus on selles, et kalleim veos on koguseliselt vähenenud 42% ja selle tariif pole palju muutunud.

Aastad 16-20 on nummerdatud järjekorras 1 kuni 5. Algandmed on kujul:

Esiteks uurime veose A koguse dünaamikat.

Näitaja

Absoluutne kasu

Kasvumäärad, %

Kasvumäär, %

Kell see tempos kasvu keskmistatud peal valemid :

, .

Sest tempos kasvu sisse ükskõik milline juhtum T jne =T R -1 .

Nüüd kaaluma lasti D .

Näitaja

Absoluutne kasu

Kasvumäärad, %

Kasvumäär, %

Järeldus

Statistikas on oluline roll keskmistel ja nende sortidel. Analüüsis kasutatakse laialdaselt keskmisi näitajaid, kuna just nendes avalduvad seaduspärasused. massinähtused ja protsessid nii ajas kui ruumis. Nii väljendub näiteks tööviljakuse kasvu muster statistika keskmise toodangu kasv ühe tööstuses töötava kohta, elanikkonna heaolutaseme pideva kasvu regulaarsus avaldub töötajate ja töötajate keskmiste sissetulekute kasvu statistilistes näitajates jne.

Selliseid muutuva tunnuse jaotuse kirjeldavaid omadusi nagu mood ja mediaan kasutatakse laialdaselt. Need on spetsiifilised omadused, nende tähendus on mis tahes konkreetne valik variatsiooniseerias.

Nii et tunnuse levinuima väärtuse iseloomustamiseks kasutatakse moodust ning muutuva tunnuse väärtuse kvantitatiivse piiri näitamiseks, milleni jõuavad pooled üldkogumi liikmetest, on mediaan. kasutatud.

Seega aitavad keskmised väärtused uurida tööstuse, konkreetse tööstuse, ühiskonna ja riigi kui terviku arengumustreid.

Bibliograafia

1. Statistika teooria: Õpik / R.A. Shmoylova, V.G. Minashkin, N.A. Sadovnikova, E.B. Šuvalov; R.A. toimetuse all. Šmoilova. - 4. väljaanne, muudetud. ja täiendav - M.: Rahandus ja statistika, 2005. - 656s.

2. Gusarov V.M. Statistika: Õpetusülikoolide jaoks. - M.: UNITI-DANA, 2001.

4. Ülesannete kogumik statistika teooriast: Õpik / Toim. prof.V. V. Glinsky ja Ph.D. PhD, dotsent L.K. Serga. Ed. Z-e. - M.: INFRA-M; Novosibirsk: Siberi leping, 2002.

5. Statistika: Õpik / Kharchenko L-P., Dolzhenkova V.G., Ionin V.G. ja teised, toim. V.G. Ionina. - Ed.2nd, muudetud. ja täiendav - M.: INFRA-M. 2003. aasta.

Sarnased dokumendid

    Kirjeldav statistika ja statistiline järeldus. Valimi esinduslikkuse tagavad valikumeetodid. Valimi tüübi mõju vea suurusele. Ülesanded valimimeetodi rakendamisel. Vaatlusandmete jaotus üldkogumile.

    test, lisatud 27.02.2011

    Proovivõtu meetod ja selle roll. Areng kaasaegne teooria valikuline vaatlus. Valikumeetodite tüpoloogia. Lihtsa juhusliku valimi praktilise rakendamise viisid. Tüüpilise (kihistunud) valimi organiseerimine. Proovi suurus kvoodivalikus.

    aruanne, lisatud 09.03.2011

    Proovide võtmise ja proovide võtmise eesmärk. Organisatsiooni omadused mitmesugused valikuline vaatlus. Vead valikuline valik ja nende arvutamise meetodid. Valimimeetodi rakendamine kütuse- ja energiakompleksi ettevõtete analüüsimisel.

    kursusetöö, lisatud 06.10.2014

    Valikuline vaatlus kui meetod statistiline uuring, selle omadused. Juhuslikud, mehaanilised, tüüpilised ja jadatüübid valimikomplektide moodustamisel. Valimivea mõiste ja põhjused, selle määramise meetodid.

    abstraktne, lisatud 06.04.2010

    Statistika mõiste ja roll juhtimismehhanismis kaasaegne majandus. Pidev ja mittepidev statistiline vaatlus, valimimeetodi kirjeldus. Valiku tüübid selektiivse vaatluse käigus, valimi vead. Tootmis- ja finantsnäitajad.

    kursusetöö, lisatud 17.03.2011

    Plaani elluviimise uurimine. 10% juhusliku valimiga uuring. Tehase tootmiskulu. piirviga proovid. Toote keskmiste hindade ja müügimahu dünaamika. Muutuv koostise hinnaindeks.

    kontrolltööd, lisatud 02.09.2009

    Mahuproovi saamine n-normaaljaotus juhuslik muutuja. Leidmine numbrilised omadused proovid. andmete rühmitamine ja variatsiooni seeria. Sageduse histogramm. Empiiriline jaotusfunktsioon. Parameetrite statistiline hindamine.

    laboritööd, lisatud 31.03.2013

    Valimi ja valimi vaatluse mõistete olemus, valiku peamised liigid ja kategooriad. Proovi mahu ja suuruse määramine. Praktiline kasutamine Statistiline analüüs valikuline vaatlus. Proovifraktsiooni ja proovi keskmise vigade arvutamine.

    kursusetöö, lisatud 17.02.2015

    Selektiivse vaatluse mõiste. Representatiivsusvead, valimivea mõõtmine. Nõutava valimi suuruse määramine. Proovivõtumeetodi kasutamine pideva meetodi asemel. Dispersioon üldkogumis ja näitajate võrdlus.

    test, lisatud 23.07.2009

    Valiku tüübid ja vaatlusvead. Valimipopulatsiooni üksuste valimise meetodid. Iseloomulik äritegevus ettevõtetele. Näidisküsitlus toote tarbijad. Valimi tunnuste jaotus üldkogumile.

Osa populatsioonist pärit objekte, mis on valitud uurimiseks, et teha järeldus kogu populatsiooni kohta. Et valimi uurimisel saadud järeldus laieneks kogu üldkogumile, peab valimil olema omadus olla esinduslik.

Valimi esinduslikkus

Valimi omadus kajastada õigesti üldkogumit. Sama valim võib, kuid ei pruugi esindada erinevaid populatsioone.
Näide:

Täielikult autot omavatest moskvalastest koosnev valim ei esinda kogu Moskva elanikkonda.

Kuni 100 töötajaga Venemaa ettevõtete valim ei esinda kõiki Venemaa ettevõtteid.

Turult oste tegevate moskvalaste valim ei kajasta kõigi moskvalaste ostukäitumist.

Samal ajal võivad need näidised (muudel tingimustel) suurepäraselt esindada vastavalt Moskva autoomanikke, Venemaa väikeseid ja keskmise suurusega ettevõtteid ning ostjaid, kes ostavad turgudel.

Oluline on mõista, et valimi esinduslikkus ja valimi koostamise viga on erinevad nähtused. Erinevalt veast ei sõltu esinduslikkus valimi suurusest.

Ükskõik kui palju me küsitletud moskvalaste-autoomanike arvu ka ei suurendaks, ei suuda me selle valimiga esindada kõiki moskvalasi.

Valimi viga (usaldusvahemik)

Valimivaatluse abil saadud tulemuste hälve üldkogumi tegelikest andmetest.

Valimiviga on kahte tüüpi: statistiline ja süstemaatiline. Statistiline viga sõltub valimi suurusest. Mida suurem on valimi suurus, seda väiksem see on.

Näide:
400 ühiku suuruse lihtsa juhusliku valimi korral on maksimaalne statistiline viga (alates 95% usalduse tase) on 5%, 600 ühikulise valimi puhul - 4%, 1100 ühikulise valimi korral - 3%. Tavaliselt mõeldakse valimi veast rääkides täpselt statistilist viga.

Süstemaatiline viga sõltub sellest erinevaid tegureid mis avaldavad uuringule püsivat mõju ja nihutavad uuringu tulemusi kindlas suunas.

Näide:
- Mis tahes tõenäosusvalimi kasutamine alahindab kõrge sissetulekuga inimeste osakaalu aktiivne pilt elu. See juhtub seetõttu, et selliseid inimesi on ühestki konkreetsest kohast (näiteks kodus) palju raskem leida.

Küsimustiku küsimustele vastamisest keeldumise probleem ("refusenikute" osakaal Moskvas on erinevate uuringute puhul 50% kuni 80%).

Mõnel juhul, kui tõelised jaotused on teada, süstemaatiline viga saab tasandada kvootide kehtestamise või andmete ümberkaalumisega, kuid enamikes reaalsetes uuringutes võib isegi selle hindamine olla üsna problemaatiline.

Näidiste tüübid

Proovid jagunevad kahte tüüpi:

tõenäosuslik

ebatõenäolisus

Tõenäosusnäidised

1.1 Juhuslik valim (lihtne juhuslik valik)

Selline valim eeldab üldkogumi homogeensust, kõigi elementide kättesaadavuse sama tõenäosust, olemasolu täielik nimekiri kõik elemendid. Elementide valimisel kasutatakse reeglina juhuslike arvude tabelit.
1.2 Mehaaniline (süstemaatiline) proovide võtmine

Omamoodi juhuslik valim, mis on sorteeritud mõne atribuudi järgi (tähestikuline järjekord, telefoninumber, sünniaeg jne). Esimene element valitakse juhuslikult, seejärel valitakse iga 'k's element 'n' sammuga. Üldkogumi suurus, samas kui - N=n*k

1.3 Stratifitseeritud (tsoneeritud)

Seda kasutatakse üldpopulatsiooni heterogeensuse korral. Üldrahvastik jaguneb rühmadeks (kihtideks). Igas kihis tehakse valik juhuslikult või mehaaniliselt.

1.4 Jada (pesastatud või rühmitatud) proovivõtt

Jadavalimi puhul ei ole valiku ühikuteks objektid ise, vaid rühmad (klastrid või pesad). Rühmad valitakse juhuslikult. Rühmasiseseid objekte uuritakse kõikjal.

Uskumatud näidised

Valik sellises valimis toimub mitte juhuse põhimõtete järgi, vaid subjektiivsete kriteeriumide järgi - ligipääsetavus, tüüpilisus, võrdne esindatus jne.

Kvoodi valimi võtmine

Esialgu eraldatakse teatud arv objektirühmi (näiteks mehed vanuses 20-30 aastat, 31-45 aastat ja 46-60 aastat; isikud, kelle sissetulek on kuni 30 tuhat rubla, sissetulek 30-60 aastat). tuhat rubla ja sissetulekuga üle 60 tuhande rubla ) Iga rühma kohta on täpsustatud uuritavate objektide arv. Objektide arv, mis peaks igasse rühma kuuluma, määratakse kõige sagedamini kas proportsionaalselt varem teadaoleva rühma osakaaluga üldkogumis või iga rühma jaoks sama. Rühmades valitakse objektid juhuslikult. Kvoodiproove kasutatakse turundusuuringutes üsna sageli.

Lumepalli meetod

Näidis on konstrueeritud järgmiselt. Igal vastajal, alustades esimesest, palutakse võtta ühendust oma sõprade, kolleegide, tuttavatega, kes sobiksid valikutingimustesse ja võiksid uuringus osaleda. Seega, välja arvatud esimene samm, moodustatakse valim uurimisobjektide endi osalusel. Meetodit kasutatakse sageli siis, kui on vaja leida ja küsitleda raskesti ligipääsetavaid vastajate gruppe (näiteks kõrge sissetulekuga vastajad, samasse erialagruppi kuuluvad vastajad, vastajad, kellel on mõni sarnane hobi/kirg jne. )
2.3 Spontaanne proovide võtmine

Küsitletakse kõige kättesaadavamaid vastajaid. Tüüpilised näited juhuslikud valimid - küsitlused ajalehtedes/ajakirjades, vastajatele isetäitmiseks antud küsimustikud, enamik Interneti-küsitlusi. Spontaansete valimite suurus ja koostis ei ole ette teada ning selle määrab ainult üks parameeter – vastajate aktiivsus.
2.4 Tüüpiliste juhtumite näidis

Valitakse üldkogumi üksused, millel on atribuudi keskmine (tüüpiline) väärtus. See tõstatab funktsiooni valimise ja selle tüüpilise väärtuse määramise probleemi.

Uurimisplaani elluviimine

Tuletame meelde, et see etapp hõlmab teabe kogumist ja selle analüüsi. Turundusuuringute plaani elluviimise protsess nõuab tavaliselt kõige rohkem uurimistööd ja on suurima vea allikas.

Statistiliste andmete kogumisel ilmnevad mitmed puudused ja probleemid:

esiteks ei pruugi osa vastajaid kokkulepitud kohas olla ja nendega tuleb uuesti ühendust võtta või asendada;

teiseks võivad mõned vastajad olla koostöövalmid või anda kallutatud, teadlikult valesid vastuseid.

Tänu kaasaegsetele andmetöötlus- ja telarenevad ja täiustuvad andmete kogumise meetodid.

Mõned ettevõtted viivad uuringuid läbi ühest keskusest. Sel juhul istuvad professionaalsed intervjueerijad kontorites ja valivad juhuslikke telefoninumbreid. Kui nad kuulevad helistajate vastust, palub intervjueerija telefonile vastanul vastata mõnele küsimusele. Viimaseid loetakse arvutimonitori ekraanilt ja vastajate vastused trükitakse klaviatuuril. See meetod välistab andmete vormindamise ja kodeerimise vajaduse, vähendab vigade arvu.