Statistilised jaotusread. Diskreetne statistiline jada

Lihtsaim viis statistilise materjali üldistamiseks on seeriate koostamine. Statistilise uuringu kokkuvõtte tulemuseks võivad olla jaotusread.

Pärast rühmitustunnuse, rühmade arvu ja rühmitamisintervallide määramist esitatakse kokkuvõtlikud ja rühmitamise andmed jaotusridade kujul ning statistiliste tabelite kujul.

Jaotusseeria on üks rühmitamise tüüp.

Jaotuse lähedal statistikas nimetatakse rahvastikuüksuste järjestatud jaotust rühmadesse mis tahes tunnuse järgi: kvalitatiivne või kvantitatiivne.

Jaotussarjade tüübid

Sõltuvalt jaotusseeria moodustamise aluseks olevast tunnusest eristatakse atribuut- ja variatsioonijaotuse seeriaid:

atribuut, mida nimetatakse kvalitatiivsetel alustel üles ehitatud jaotussarjadeks;

jaotusseeriaid nimetatakse variatsioonilisteks, mis on üles ehitatud kvantitatiivse tunnuse väärtuste kasvavas või kahanevas järjekorras.

Jaotuse variatsiooniseeria koosneb kahest veerust. Esimene veerg sisaldab muutuja tunnuse kvantitatiivseid väärtusi, mida nimetatakse variantideks ja tähistatakse. Diskreetne variant – väljendatakse täisarvuna. Intervalli valik on vahemikus alates ja kuni. Olenevalt variantide tüübist on võimalik konstrueerida diskreetne või intervallvariatsiooniseeria. Teine veerg sisaldab konkreetse variandi arvu, mis on väljendatud sageduste või sagedustega:

sagedused on absoluutarvud, mis näitavad, mitu korda antud tunnuse väärtus koondväärtuses esineb; kõigi sageduste summa peaks olema võrdne kogu elanikkonna ühikute arvuga;

sagedused on sagedused, mis on väljendatud protsentides koguarvust; kõigi protsentides väljendatud sageduste summa peab olema võrdne 100%-ga ühe murdosades.

Variatsiooniseeria mida iseloomustab kaks elementi: variant (X) ja sagedus (f). Variant on eraldiseisva elanikkonna üksuse või rühma märgi eraldiseisev väärtus. Kutsutakse numbrit, mis näitab, mitu korda teatud funktsiooni väärtus esineb sagedus. Kui sagedust väljendatakse suhtelise arvuna, nimetatakse seda sageduseks.

Variatsiooniseeriad võivad olla:

intervall, kui piirid "alates" ja "kuni" on määratletud, saab intervalljaotuse seeriat esitada graafiliselt histogrammi kujul;

diskreetne, kui uuritavat tunnust iseloomustab teatud arv.

Jaotussarjade graafiline esitus

Jaotussarjad visualiseeritakse graafiliste piltide abil.

Jaotussarjad kuvatakse järgmiselt:

hulknurk;

histogrammid;

kumuleerub;

Ehitamisel prügila horisontaalteljele (abstsissile) kantakse muutuva atribuudi väärtused ja vertikaalteljele (y-teljel) - sagedused või sagedused.

Ehitamiseks histogrammid abstsisstelg näitab intervallide piiride väärtusi ja nende põhjal ehitatakse ristkülikud, mille kõrgus on võrdeline sagedustega (või sagedustega).

Variatsioonireas oleva tunnuse jaotus vastavalt akumuleeritud sagedustele (sagedustele) on kujutatud kumulatsiooni abil.

Kumuleerida või kumulatiivne kõver on erinevalt hulknurgast üles ehitatud akumuleeritud sagedustele või sagedustele. Sel juhul asetatakse iseloomulikud väärtused abstsissteljele ja akumuleeritud sagedused või sagedused asetatakse ordinaatteljele.

Ogiva on konstrueeritud sarnaselt kumulatsioonile, ainsa erinevusega, et akumuleeritud sagedused asetatakse abstsissteljele ja tunnuste väärtused asetatakse ordinaatteljele.

Kumulatsiooni variatsioon on kontsentratsioonikõver või Lorenzi graafik. Kontsentratsioonikõvera joonistamiseks skaleeritakse ristkülikukujulise koordinaatsüsteemi mõlemad teljed protsentuaalselt vahemikus 0 kuni 100. Sel juhul näitavad abstsissteljed akumuleeritud sagedusi ja ordinaatteljed osa akumuleeritud väärtusi (in protsenti) funktsiooni mahu järgi.

Teema 9. Levitussarjad

Statistilised jaotusread- see on massilise statistilise üldkogumi esmane tunnus, uuritava üldkogumi ühikute järjestatud jaotamine rühmadesse vastavalt rühmituskriteeriumile. Iga statistiline jaotusseeria koosneb kahest elemendist:

1) muutuja atribuudi individuaalsed väärtused ( valikuid );

2) väärtused, mis näitavad, mitu korda antud varianti korratakse ( sagedused ).

Märge. Nimetatakse sagedusi, mis on väljendatud ühiku murdosades või protsentides kogusummast sagedused ; on jaotussarja number, mis on väljendatud kujul sageduste summa.

Kui grupeerimise aluseks võtta kvalitatiivne tunnus, siis nimetatakse sellist jaotussarja atribuutne(jaotus tööliikide, soo, elukutse, usu, rahvuse jne järgi). Kui jaotusrida on üles ehitatud kvantitatiivsel alusel, siis sellist jada nimetatakse variatsiooniline. Variatsiooniseeria koostamine tähendab populatsiooniühikute kvantitatiivse jaotuse järjestamist vastavalt atribuudi väärtustele ja seejärel nende väärtustega rahvastikuüksuste arvu loendamist (rühmatabeli koostamine).

Eraldada kolm variatsiooniseeria vormi:

1) järjestatud rida- see on populatsiooni üksikute üksuste jaotus uuritava tunnuse kasvavas või kahanevas järjekorras; järjestamine hõlbustab kvantitatiivsete andmete jagamist rühmadesse, tuvastab kohe objekti väikseimad ja suurimad väärtused, tõstab esile väärtused, mida kõige sagedamini korratakse; muud variatsiooniseeria vormid - rühma tabelid, mis on koostatud vastavalt uuritava tunnuse väärtuste varieerumise olemusele;

2) diskreetne seeria- see on selline variatsiooniseeria, mille konstruktsioon põhineb katkendliku muutusega märkidel, mille vahel ei ole vahepealseid väärtusi (diskreetsed märgid - tariifikategooria, laste arv peres, töötajate arv ettevõttes jne); need märgid võivad võtta ainult piiratud arvu teatud väärtusi;

Diskreetsed seeriad esindab rühma laud, mis koosneb kahest veerust: esimene veerg näitab atribuudi konkreetset väärtust ja teine - teatud atribuudi väärtusega üldkogumi ühikute arv;

3) kui atribuudil on pidev muutus (sissetuleku suurus, tööstaaž, ettevõtte põhivara maksumus jne, mis võib teatud piirides võtta mis tahes väärtuse), siis selle atribuudi jaoks on vaja ehitada intervalli seeriad (võrdsete või ebavõrdsete intervallidega).

rühma laud siin on ka kaks veergu. Esimene näitab funktsiooni väärtust intervallis "alates kuni" (valikud), teine - intervalli (sagedus) sisalduvate ühikute arvu. Väga sageli on tabelit täiendatud veeruga, milles arvutatakse akumuleeritud sagedused S, mis näitavad, kui paljudel üldkogumi üksustel on tunnusväärtus, mis ei ületa seda väärtust. Seeria f sagedusi saab asendada üksikasjadega w, väljendatuna suhtelistes numbrites (aktsiad või protsentides). Need on iga intervalli sageduste suhted nende kogusummasse (9.1):

(9.1)

Intervallväärtustega variatsioonirea koostamisel tuleb kõigepealt määrata intervalli i väärtus, mis on defineeritud kui variatsioonivahemiku R suhe rühmade arvu n (9.2):

kus R = x max - x min; n = 1 + 3,322 lgN( Sturgessi valem); N on rahvastiku ühikute koguarv.

Intervallvariatsiooni seeriaid saab koostada ka diskreetse variatsiooniga funktsioonide jaoks. Sageli ei ole statistilises uuringus kohane näidata diskreetse tunnuse eraldi väärtust, sest see raskendab reeglina tunnuse varieerumist. Seetõttu jaotatakse atribuudi võimalikud diskreetsed väärtused rühmadesse ja arvutatakse vastavad sagedused (detailid). Diskreetse tunnuse alusel intervalliseeria koostamisel ei korda kõrvuti asetsevate intervallide piirid üksteist: järgmine intervall algab järgmisest (pärast eelmise intervalli ülemist väärtust) tunnuse diskreetse väärtuse järgi.

Ebavõrdsete intervallidega jada sageduste võrdlemisel arvutatakse nende täiuse iseloomustamiseks jaotustihedus. Keskmine tihedus intervallis on jagatis sageduse ja partikulaarse intervalli suurusega. Esimesel juhul on tihedus absoluutne, teisel - suhteline. Keskmine tihedus näitab, mitu ühikut või protsenti neist on mõõtühikuvalikute kohta. Sagedus, partikulaarsus, tihedus ja kumulatiivne sagedus on variantide suuruse erinevad funktsioonid.

Pooleli statistiliste andmete analüüs, mida esindavad jaotusread, saab lisaks teadmistele jaotuse olemusest (või üldkogumi struktuurist) arvutada erinevaid statistilisi näitajaid (arvulisi karakteristikuid), mis üldistatult kajastavad uuritava jaotuse tunnuseid. omadused. Need omadused (näitajad) võib jagada 3 põhirühma

1) jaotuskeskuse omadused(keskmine, moodus, mediaan);

2) omaduste variatsiooniaste(variatsioonivahemik, keskmine lineaarhälve, dispersioon, standardhälve, variatsioonikordaja);

3) leviku vormi (tüübi) tunnused(kurtoosi ja asümmeetria näitajad, järgu tunnused, jaotuskõverad).

Kõige usaldusväärsem viis jaotusmustrite tuvastamiseks on järgmine:
1) suurendada täheldatud juhtumite arvu (vastavalt suurte arvude seadusele tühistavad sellistes seeriates juhuslikud kõrvalekalded üksikute väärtuste üldisest mustrist üksteist);

2) jagage kogum algselt võimalikult suureks arvuks rühmadeks, seejärel rühmade arvu järk-järgult vähendades optimeerige rühmitamist jaotusmustrite tuvastamiseks.

Selle lähenemise rakendamisel muutub sellele jaotusele iseloomulik muster üha selgemaks ning hulknurka kujutav katkendjoon läheneb mõnele siledale joonele ja peaks piirjoones muutuma kõveraks.

Olgu proov võetud üldkogumikust ja X 1 täheldatud P 1 kord, X 2 - P 2 korda, x k - p kuni korda ja on valimi suurus. Vaadeldud väärtused X 1 nimetatakse variantideks ja variantide jada, mis on kirjutatud kasvavas järjekorras - variatsiooniseeria .

Variantide vaatluste arvu nimetatakse sageduseks ja selle suhet valimi suurusesse suhteliseks sageduseks.

Definitsioon. valimi jaotuse statistiline (empiiriline) seadus, või lihtsalt valimi statistiline jaotus nimetada jadavarianti ja neile vastavaid sagedusi n i või suhtelised sagedused.

Valimi statistiline jaotus on mugavalt kujutatud sagedusjaotuse tabeli kujul, mida nimetatakse statistiline diskreetne jaotusrea:

(kõikide suhteliste sageduste summa on võrdne ühega).

Näide 1. Mõõtmisel homogeensetes katsealuste rühmades saadi järgmised proovid: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 ( pulss). Nende tulemuste põhjal koostage sagedusjaotuse ja suhteliste sageduste statistiline seeria.

Lahendus. 1) Sagedusjaotuse statistiline seeria:

Kontroll: 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.

Sageduse hulknurk mida nimetatakse katkendlikuks jooneks, punkte, mis ühendavad punkte Sageduste hulknurga loomiseks abstsissteljele jäta valikud kõrvale X 2 ja y-teljel - vastavad sagedused p i . Punktid on ühendatud segmentidega ja saavad sageduste hulknurga.

Suhtelise sageduse hulknurk nimetatakse katkendlikuks jooneks, punkte ühendavad lõigud. Abstsissil suhteliste sageduste hulknurga ehitamiseks loobuge valikutest X i ja y-teljel vastavad sagedused w mina . Punktid ühendatakse segmentidega ja saadakse suhteliste sageduste hulknurk

Näide 2 Koostage sageduse hulknurk ja suhteline sageduse hulknurk vastavalt näite 1 andmetele.

Lahendus: Kasutades näites 1 koostatud diskreetset statistilise jaotuse seeriat, konstrueerime sageduse hulknurga ja suhtelise sageduse hulknurga:

2. Statistilised intervalljaotusread. tulpdiagramm.

Statistilist diskreetseeriat (või empiirilist jaotusfunktsiooni) kasutatakse tavaliselt siis, kui valimis ei ole liiga palju erinevaid võimalusi või kui diskreetsus on ühel või teisel põhjusel uurija jaoks hädavajalik. Kui üldkogumi X omadus, mis meid huvitab, jaotub pidevalt või selle diskreetsust on ebaotstarbekas (või võimatu) arvesse võtta, siis grupeeritakse valikud intervallideks.

Statistilise jaotuse saab määrata ka intervallide ja neile vastavate sageduste jadana (intervallile vastav sagedus võetakse selle intervalli sageduste summaks).

1. R(vahemik) = X max -X min

2. k- rühmade arv

3. (Sturgesi valem)

4. a = x min, b = x max

Saadud rühmitust on mugav esitada sagedustabeli kujul, mida nimetatakse statistiline intervalljaotuse seeria:

Intervallid rühmitusi			...
Sagedused			...

Sarnase tabeli saab moodustada sagedusi asendades n i suhtelised sagedused.

Sotsiaalmajanduslike nähtuste ja protsesside uurimisel on olulisim etapp algandmete süstematiseerimine ja selle põhjal kogu objekti kohta kokkuvõtliku iseloomustuse saamine üldistavate näitajate abil, mis saavutatakse esmase statistilise materjali kokkuvõtte ja rühmitamise teel.

Statistiline kokkuvõte - see on järjestikuste operatsioonide kompleks konkreetsete üksikute faktide üldistamiseks, mis moodustavad kogumi, et tuvastada uuritavale nähtusele tervikuna omased tüüpilised tunnused ja mustrid. Statistilise kokkuvõtte koostamine hõlmab järgmisi samme :

rühmitamisfunktsiooni valik;
rühmade moodustamise järjekorra määramine;
rühmade ja objekti kui terviku iseloomustamiseks statistiliste näitajate süsteemi väljatöötamine;
statistiliste tabelite paigutuste väljatöötamine koondtulemuste esitamiseks.

Statistiline rühmitus nimetatakse uuritava populatsiooni üksuste jagamist homogeenseteks rühmadeks teatud nende jaoks hädavajalike tunnuste järgi. Rühmitamine on kõige olulisem statistiliste andmete summeerimise statistiline meetod, statistiliste näitajate õige arvutamise alus.

Rühmitamist on järgmist tüüpi: tüpoloogiline, struktuurne, analüütiline. Kõiki neid rühmitusi ühendab asjaolu, et objekti üksused on jaotatud rühmadesse mõne atribuudi järgi.

rühmitamise märk nimetatakse märgiks, mille järgi jagatakse rahvastiku üksused eraldi rühmadesse. Statistilise uuringu järeldused sõltuvad rühmitamise atribuudi õigest valikust. Rühmitamise alusena on vaja kasutada olulisi, teoreetiliselt põhjendatud tunnuseid (kvantitatiivseid või kvalitatiivseid).

Rühmitamise kvantitatiivsed tunnused omama arvulist avaldist (kauplemismaht, isiku vanus, perekonna sissetulek jne) ja rühmituse kvalitatiivsed tunnused kajastavad rahvastikuüksuse seisundit (sugu, perekonnaseis, ettevõtte kuuluvus majandusharule, omandivorm jne).

Pärast rühmitamise aluse kindlaksmääramist tuleks otsustada rühmade arv, millesse uuringupopulatsioon jagada. Rühmade arv sõltub uuringu eesmärkidest ja rühmitamise aluseks oleva näitaja tüübist, populatsiooni mahust, tunnuse varieeruvuse astmest.

Näiteks ettevõtete grupeerimisel omandivormide järgi võetakse arvesse munitsipaal-, föderaal- ja liidu subjektide vara. Kui rühmitamine toimub kvantitatiivse atribuudi järgi, siis tuleb erilist tähelepanu pöörata uuritava objekti ühikute arvule ja rühmitamise atribuudi kõikumise astmele.

Kui rühmade arv on kindlaks määratud, tuleks määrata rühmitamise intervallid. Intervall - need on muutuva tunnuse väärtused, mis jäävad teatud piiridesse. Igal intervallil on oma väärtus, ülemine ja alumine piir või vähemalt üks neist.

Intervalli alumine piir nimetatakse atribuudi väikseimaks väärtuseks intervallis ja ülemine piir - atribuudi suurim väärtus intervallis. Intervalli väärtus on erinevus ülemise ja alumise piiri vahel.

Rühmitamise intervallid olenevalt nende suurusest on: võrdsed ja ebavõrdsed. Kui tunnuse varieeruvus avaldub suhteliselt kitsastes piirides ja jaotus on ühtlane, siis koostatakse rühmitus võrdsete intervallidega. Võrdse intervalli väärtus määratakse järgmise valemiga :

kus Xmax, Xmin - atribuudi maksimaalne ja minimaalne väärtus agregaadis; n on rühmade arv.

Lihtsaim rühmitus, milles iga valitud rühma iseloomustab üks näitaja, on jaotusseeria.

Statistilised jaotusread - see on rahvastikuüksuste järjestatud jaotus rühmadesse vastavalt teatud atribuudile. Sõltuvalt jaotusseeria moodustamise aluseks olevast tunnusest eristatakse atribuut- ja variatsioonijaotuse seeriaid.

atribuutne nad nimetavad kvalitatiivsete tunnuste järgi üles ehitatud jaotusseeriaid, st märke, millel pole numbrilist avaldist (jaotus tööliigi, soo, elukutse jne järgi). Atribuutide jaotusread iseloomustavad üldkogumi koosseisu ühe või teise olulise tunnuse järgi. Mitme perioodi jooksul võetuna võimaldavad need andmed uurida struktuuri muutust.

Variatsiooniread nimetatakse kvantitatiivsel alusel üles ehitatud jaotussarjadeks. Iga variatsiooniseeria koosneb kahest elemendist: variantidest ja sagedustest. Valikud nimetatakse atribuudi individuaalseid väärtusi, mille see variatsioonireas võtab, see tähendab muutuja atribuudi konkreetset väärtust.

Sagedused nimetatakse variatsiooniseeria üksiku variandi või iga rühma arvuks, st need on numbrid, mis näitavad, kui sageli teatud variandid jaotuseseerias esinevad. Kõigi sageduste summa määrab kogu populatsiooni suuruse, selle mahu. Sagedused nimetatakse sagedusi, väljendatuna ühiku murdosades või protsentides koguarvust. Vastavalt sellele on sageduste summa 1 või 100%.

Olenevalt tunnuse variatsiooni olemusest eristatakse kolme variatsioonirea vormi: järjestatud seeria, diskreetseeria ja intervallseeria.

Järjestatud variatsiooniseeriad - see on populatsiooni üksikute üksuste jaotus uuritava tunnuse kasvavas või kahanevas järjekorras. Järjestus muudab kvantitatiivsete andmete rühmadeks jagamise lihtsaks, tuvastab kohe objekti väikseimad ja suurimad väärtused, tõstab esile väärtused, mida kõige sagedamini korratakse.

Diskreetsed variatsiooniseeriad iseloomustab populatsiooni üksuste jaotust diskreetse atribuudi järgi, mis võtab ainult täisarvulisi väärtusi. Näiteks tariifikategooria, laste arv peres, töötajate arv ettevõttes jne.

Kui märgil on pidev muutus, mis teatud piirides võib omandada mis tahes väärtused ("alates - kuni"), siis peate selle märgi jaoks ehitama intervalli variatsiooni seeriad . Näiteks sissetulekute suurus, töökogemus, ettevõtte põhivara maksumus jne.

Näiteid ülesannete lahendamisest teemal "Statistiline kokkuvõte ja rühmitamine"

Ülesanne 1 . Seal on info lõppenud õppeaastal üliõpilastele tellimuse alusel laekunud raamatute arvu kohta.

Koostage vahemikuga ja diskreetne variatsioonijaotuse seeria, mis tähistab seeria elemente.

Lahendus

See komplekt on õpilastele saadavate raamatute arvu valikute komplekt. Loendame selliste variantide arvu ja järjestame need variatsioonide järjestatud ja variatsioonilise diskreetse jaotusrea kujul.

2. ülesanne . Põhivara väärtuse kohta on andmeid 50 ettevõtte kohta, tuhat rubla.

Koostage jaotusseeria, tuues esile 5 ettevõtete rühma (võrdsete ajavahemike järel).

Lahendus

Lahenduseks valime ettevõtete põhivara maksumuse suurima ja väikseima väärtuse. Need on 30,0 ja 10,2 tuhat rubla.

Leidke intervalli suurus: h \u003d (30,0-10,2): 5 \u003d 3,96 tuhat rubla.

Siis kuuluvad esimesse rühma ettevõtted, mille põhivara summa on alates 10,2 tuhandest rublast. kuni 10,2 + 3,96 = 14,16 tuhat rubla. Selliseid ettevõtteid tuleb kokku 9. Teise rühma kuuluvad ettevõtted, mille põhivara maht on alates 14,16 tuhandest rublast. kuni 14,16 + 3,96 = 18,12 tuhat rubla. Selliseid ettevõtteid tuleb kokku 16. Samamoodi leiame kolmanda, neljanda ja viienda grupi ettevõtete arvu.

Saadud jaotusseeria paigutatakse tabelisse.

3. ülesanne . Mitmete kergetööstusettevõtete kohta saadi järgmised andmed:

Tehke ettevõtete rühmitus töötajate arvu järgi, moodustades võrdsete ajavahemike järel 6 rühma. Arvestage iga rühma kohta:

1. ettevõtete arv
2. töötajate arv
3. valmistatud toodete maht aastas
4. keskmine tegelik toodang töötaja kohta
5. põhivara summa
6. ühe ettevõtte põhivara keskmine suurus
7. ühe ettevõtte valmistatud toodete keskmine väärtus

Arvutamise tulemused fikseerige tabelites. Tehke omad järeldused.

Lahendus

Lahenduseks valime ettevõtte keskmise töötajate arvu suurima ja väikseima väärtuse. Need on 43 ja 256.

Leidke intervalli suurus: h = (256-43): 6 = 35,5

Siis kuuluvad esimesse rühma ettevõtted, kus keskmine töötajate arv jääb vahemikku 43–43 + 35,5 = 78,5 inimest. Selliseid ettevõtteid tuleb kokku 5. Teise rühma kuuluvad ettevõtted, kus keskmine töötajate arv jääb 78,5-78,5 + 35,5 = 114 inimest. Selliseid ettevõtteid tuleb kokku 12. Samamoodi leiame kolmanda, neljanda, viienda ja kuuenda grupi ettevõtete arvu.

Paneme saadud jaotusread tabelisse ja arvutame iga rühma jaoks vajalikud näitajad:

Järeldus : Nagu tabelist näha, on teine ettevõtete rühm kõige arvukam. See hõlmab 12 ettevõtet. Kõige väiksemad on viies ja kuues grupp (mõlemas kaks ettevõtet). Need on suurimad ettevõtted (töötajate arvu poolest).

Kuna teine rühm on kõige arvukam, on selle grupi ettevõtete toodangumaht aastas ja põhivara maht teistest tunduvalt suurem. Samas ei ole selle grupi ettevõtetes ühe töötaja keskmine tegelik toodang just kõrgeim. Siin on juhtpositsioonil neljanda grupi ettevõtted. Sellesse rühma kuulub ka üsna suur hulk põhivarasid.

Kokkuvõtteks märgime, et ühe ettevõtte põhivara keskmine suurus ja toodangu keskmine väärtus on otseselt proportsionaalsed ettevõtte suurusega (töötajate arvu poolest).

rühmitamine- see on elanikkonna jagunemine rühmadeks, mis on mingil moel homogeensed.

Teenindusülesanne. Veebikalkulaatoriga saate:

ehitada variatsiooniseeria, koostada histogramm ja hulknurk;
leida variatsiooninäitajad (keskmine, moodus (sh graafiliselt), mediaan, varieeruvusvahemik, kvartiilid, detsiilid, kvartiilne diferentseerimiskordaja, variatsioonikordaja jt näitajad);

Juhend. Sarja rühmitamiseks peate valima saadud variatsiooniseeria tüübi (diskreetne või intervall) ja määrama andmemahu (ridade arv). Saadud lahendus salvestatakse Wordi faili (vt statistiliste andmete rühmitamise näidet).

Kui rühmitamine on juba tehtud ja diskreetsed variatsiooniseeriad või intervalli seeriad, siis peate kasutama veebikalkulaatorit Variatsiooninäitajad. Jaotuse tüübi hüpoteesi testimine toodetud teenuse abil Turustusvormi uuring.

Statistiliste rühmituste tüübid

Variatsiooniseeria. Diskreetse juhusliku suuruse vaatluste puhul võib sama väärtust kohata mitu korda. Sellised juhusliku suuruse x i väärtused registreeritakse, näidates n i, mitu korda see n vaatluses ilmub, see on selle väärtuse sagedus.
Pideva juhusliku suuruse puhul kasutatakse praktikas rühmitamist.

Tüpoloogiline rühmitus- see on uuritud kvalitatiivselt heterogeense elanikkonna jagunemine klassideks, sotsiaal-majanduslikeks tüüpideks, homogeenseteks üksuste rühmadeks. Selle rühmituse koostamiseks kasutage parameetrit Diskreetne variatsiooniseeria.
Struktuurset rühmitamist nimetatakse, milles homogeenne populatsioon jagatakse rühmadesse, mis iseloomustavad selle struktuuri vastavalt mõnele varieeruvale tunnusele. Selle rühmituse koostamiseks kasutage parameetrit Intervall seeria.
Rühmitust, mis paljastab uuritavate nähtuste ja nende tunnuste vahelise seose, nimetatakse analüütiline rühm(vt seeriate analüütilist rühmitamist).

Statistiliste rühmituste loomise põhimõtted

Kasvavas järjekorras järjestatud vaatluste seeriat nimetatakse variatsiooniseeriaks. rühmitamise märk on märk, mille järgi elanikkond jaguneb eraldi rühmadesse. Seda nimetatakse rühma baasiks. Rühmitamine võib põhineda nii kvantitatiivsetel kui kvalitatiivsetel tunnustel.
Pärast rühmitamise aluse kindlaksmääramist tuleks otsustada rühmade arv, millesse uuringupopulatsioon jagada.

Statistiliste andmete töötlemiseks personaalarvutite kasutamisel toimub objekti ühikute rühmitamine standardprotseduuride abil.
Üks selline protseduur põhineb Sturgessi valemi kasutamisel rühmade optimaalse arvu määramiseks:

k = 1+3,322*lg(N)

Kus k on rühmade arv, N on rahvastikuüksuste arv.

Osaintervallide pikkuseks arvutatakse h=(x max -x min)/k

Seejärel loendage vaatluste tabamuste arv nendes intervallides, mis võetakse sagedusteks n i . Vähesed sagedused, mille väärtused on väiksemad kui 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Uute väärtustena võetakse intervallide x i =(c i-1 +c i)/2 keskpunktid.

Statistilised jaotusread. Diskreetne statistiline jada

Jaotussarjade tüübid

Jaotussarjade graafiline esitus

Näiteid ülesannete lahendamisest teemal "Statistiline kokkuvõte ja rühmitamine"

Statistiliste rühmituste tüübid

Statistiliste rühmituste loomise põhimõtted