Kuidas teha teisest andmete rühmitamist. Rühmitamise statistika

Varem rühmitatud statistika ümberrühmitamist nimetatakse teiseseks rühmitamiseks. Seda meetodit kasutatakse juhtudel, kui esialgse rühmitamise tulemusena on uuritava populatsiooni jaotuse olemus ebaselge.

Sel juhul intervalle suurendatakse või vähendatakse. Sekundaarset rühmitamist kasutatakse ka erinevate intervallidega rühmituste toomiseks võrreldavale kujule nende võrdlemise eesmärgil. Vaatame näite abil sekundaarseid rühmitamise tehnikaid.

Näide 1.

Suurendage intervalle tabelis 2.7 toodud andmete alusel:

Tabel 2.7.

	Kaupluste arv

Ülaltoodud rühmitamine ei ole piisavalt selge, kuna see ei näita selget ja ranget mustrit käibe muutuses gruppide lõikes.

Tihendame jaotusread, moodustades kuus rühma. Uued rühmad moodustatakse algsete rühmade summeerimisel (tabel 2.8.).

Tabel 2.8.

Kaupluste rühmad IV kvartali käibe järgi, tuhat rubla.	Kaupluste arv	IV kvartali kaubanduskäive, tuhat rubla.	Keskmine käive kaupluse kohta, tuhat rubla.

On täiesti selge, et mida suuremad on poed, seda suurem on käibe tase.

Näide 2.

Kolhooside jaotuse kohta majapidamiste arvu järgi on olemas järgmised andmed (tabel 2.9.).

Tabel 2.9.

		Kolhooside osakaal rühmas protsendina kogusummast	Kolhooside rühmad majapidamiste arvu järgi

Need andmed ei võimalda võrrelda kahe rajooni kolhooside jaotust majapidamiste arvu järgi, kuna neis rajoonides on kolhooside rühmi erinev. Jaotusseeria on vaja viia võrreldavale vormile.

Võrdluse aluseks on vaja võtta 1. rajooni kolhooside jaotus. Järelikult tuleb teises piirkonnas läbi viia sekundaarne rühmitamine, et moodustada sama arv rühmi ja samade intervallidega kui esimeses piirkonnas. Saame järgmised andmed (tabel 2.10.).

Tabel 2.10.

Kolhooside rühmad majapidamiste arvu järgi	Kolhooside osakaal rühmas protsendina kogusummast




		21-7=14, 14+23=37

Viiendast rühmast vastmoodustatavasse kolhooside arvu määramiseks eeldame tinglikult, et see kolhooside arv peaks olema võrdeline rühma valitud majapidamiste erikaaluga.

Määrame 50 leibkonna osakaalu viiendas rühmas.

(50 * 18) / (250 - 150) = 9

Määrame 50 leibkonna osakaalu kuuendas rühmas.

(50 * 21) / (400 - 250) = 7 jne.

Mitme rühmituse analüüsimisel ja võrdlemisel näiteks mitme töökoja, ettevõtte vms puhul võib tekkida olukord, kus algsed rühmitused ei ole võrreldavad erinevaid numbreid rühmi või erineva suurusega intervalle. Et sellised rühmitused võrreldavale vormile viia, s.t. kas ühele rühmade arvule või ühele intervalli väärtusele kasutatakse sekundaarset rühmitamise meetodit. Sekundaarne rühmitamise meetod on meetod uute rühmade moodustamiseks olemasolevate rühmade põhjal vastavalt etteantud nõuetele. Sekundaarse rühmitamise läbiviimiseks kasutatakse 2 meetodit: 1) algrühmade kombineerimine, 2) murdosaline ümberrühmitamine.

Mitme erineva rühma viimine võrreldavale vormile toimub kolmes etapis. Esimeses etapis analüüsitakse esialgseid rühmitusi, et teha kindlaks esialgsete rühmituste võrreldamatuse tingimused. Teises etapis valitakse meetod, mis võimaldab viia algsed rühmitused võrreldavale kujule. Kolmandas etapis viiakse see läbi sekundaarne ümberkorraldamine esialgsed rühmitused ja saadud tulemuste analüüs. Vajadusel viiakse läbi grupeerimine. Vaatleme sekundaarse ümberkorraldamise meetodeid.

1 viis Statistiline vaatlus ettevõtete töötajate jaotuse kohta tööstaaži järgi 2000. aastal andis järgmised tulemused (tabel 2.7).

Tabel 2.7

2002. aastal viidi läbi korduv statistiline vaatlus, mis andis järgmised tulemused (tabel 2.8). Mõlema tabeli andmete põhjal ei ole võimalik otseselt hinnata muutusi töötajate jaotuses tööstaaži järgi 2 aasta jooksul. Mõlema tabeli analüüs näitab, et need on ebajärjekindlad erinevad numbrid rühmad ja erinevad intervallide suurused.

Tabel 2.8

Mõlema tabeli andmete võrreldavale vormile toomiseks saate tabelis 2.7 ühendada nii rühmad 1 ja 2 kui ka rühmad 3 ja 4. See võimaldab hinnata ettevõttes kahe aasta jooksul toimunud muutusi töötajate jaotuses tööstaaži järgi. Andmete ümberrühmitamise tulemused statistiline vaatlus 2000. aasta kohta (tabel 2.7) on toodud tabelis 2.9.

Tabel 2.9

Võrreldes 2002. aasta andmeid (tabel 2.8) 2000. aasta ümbergrupeeritud andmetega (tabel 2.9), võime järeldada: kahe aastaga on vähenenud kuni 6-aastase staažiga töötajate arv, s.o. noored ja suurema kogemusega töötajate arv on kasvanud.

2. meetod Olgu 2002. aasta statistiline vaatlus andnud järgmised tulemused (tabel 2.10). Võrreldes 2000. aasta andmeid (tabel 2.9) ja 2002. aasta andmeid (tabel 2.7), võime järeldada, et need ei ühildu erineva rühmade arvu ja erineva intervalli suuruse tõttu. Analüüs näitab, et ühe meetodi kasutamine andmete võrreldavale vormile viimiseks on võimatu. Seetõttu kasutame 2000. aasta andmete ümbergrupeerimiseks meetodit 2 (tabel 2.7), et need vastaksid 2002. aasta andmete rühmitamisele (tabel 2.10)

Tabel 2.10

Teise meetodi kasutamine eeldab sageduste ühtlast jaotust igas rühmas. See on teise meetodi kasutamise eeltingimus. 2000. aasta andmete ümbergrupeerimiseks (tabel 2.7) teeme järgmised arvutused. Nii et uus esimene rühm (1-4) (tabel 2.10) sisaldab kõiki andmeid vanast esimesest rühmast (1-3) (tabel 22.7) ja andmeid 4-aastase töökogemusega töötajate arvu kohta vanast teisest rühmast. . 4-aastase staažiga töötajate arv on 3 (9/3=3, kuna vanas teises rühmas oli 9 töötajat ja intervall on 3). Seega uude esimesse gruppi (1-4) kuulub 18 töötajat (18=15+3)Teine uus grupp(5-8) kuuluvad 6 töötajat 5, 6-aastase kogemusega (vanast teisest rühmast 6 = 9/3 2) ja 18 töötajat 7, 8-aastase kogemusega (vanast kolmandast rühmast 18 = 27/3 2) Seega hakkab uude teise rühma (5-8) kuuluma 24 töötajat (24=6+18). Uude kolmandasse rühma (9-12) kuuluvad 9-aastase staažiga töötajad (9=27/3) ja kõik 9 töötajat vanast neljandast rühmast (10-12). Seega on uues kolmandas rühmas (9-12) 18 töötajat (18=9+9). Ühendame 2000. aasta ümbergrupeeritud ja 2002. aasta andmed ühte tabelisse (2.11), mis võimaldab teha võrdlevat analüüsi.

Tabel 2.11

Ettevõtete töötajate staaži järgi jaotuse analüüs (tabel 2.11) näitab, et 2002. aastal suurenes suurema kogemusega töötajate arv (9 aastast 12 aastani) ja vähenes väiksema staažiga töötajate arv (1 aastast 8 aastani). Seega võimaldas andmete ümberrühmitamine viia andmed võrreldavale kujule, viia läbi analüüs ja teha vajalikud järeldused.

Turvaküsimused ja ülesanded

1.Mis on statistiline vaatlus? Millised tingimused peavad olema täidetud statistilise vaatluse läbiviimisel (vt definitsiooni)?

2. Milliste kriteeriumide järgi saab statistilisi vaatlusi klassifitseerida? Too näiteid statistilise vaatluse kohta.

3. Millised vead ilmnevad statistiliste vaatluste läbiviimisel ja milliseid kontrollimeetodeid saab kasutada?

4. Määrake, milline näide sisaldab lihtsat ja milline keerukat kokkuvõtet. Näide 1. Esmaspäeval töötas kudumistöökojas 200 naistöölist. Näide 2. Esmaspäeval töötas 1. kudumistöökojas 40 naist, objektil 2 60 naist ja kokku 100 naist.

5. Milliseid rühmi töötlemisel kasutatakse statistiline teave? Kuidas need üksteisest erinevad?

6. Peatehnoloogi osakonnas töötab 15 inimest, turundus- ja müügiosakonnas 10 inimest. Millisel juhul on osakondade meeskonnad homogeensed populatsioonid ja millistel heterogeensed populatsioonid?

7. Kangakauba A päevamüüki Kangapoes oktoobris iseloomustati järgmiste andmetega (meetrites): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9 , 5, 10 , 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. Rühmitage andmed võrdsete intervallidega.

8. Grupeerige punktist 7 andmete rühmitamise tulemused ümber järgmised rühmad: (3-9), (9-15), 15-21).

Teema nr 3 STATISTILISE JAOTUSE SARJAD, TABELID, GRAAFIKA

3.1 Statistilised jaotusread - mõiste, liigid, esitusvormid

Üks statistiliste vaatlusandmete esitusviisidest on statistiline jaotusrea. Statistilised seeriad jaotus on rahvastikuüksuste järjestatud paigutus rühmadesse vastavalt rühmitamise tunnustele. Statistiliste jaotusridade abil on võimalik uurida rahvastiku muutumise struktuuri ja piire, hinnata homogeensust ning määrata rahvastikuüksuste arengumustrit. Välimuse järgi statistilised seeriad jaotused jagunevad atribuutideks, variatsioonideks ja aegridadeks.

Atribuudi- ja variatsiooniread koosnevad kahest elemendist: variatsioonid ja sagedused (sagedus või tihedus). Valik () – see on atribuudi konkreetne väärtus, mille see jaotuseseerias võtab. Sagedus () – see absoluutarv, mis näitab, mitu korda (kui sageli) esineb mingi tunnuse (variandi) konkreetne väärtus populatsioonis või kui mitmel üldkogumi ühikul on mingi tunnuse (variandi) konkreetne väärtus. Sagedus() – see on suhteline väärtus, mis määrab üksikute optsioonide osakaalu elanikkonna kogumahus (). Sagedust saab väljendada kas osakaaludes, sel juhul rahvastiku mahus võrdne ühega(), või protsendina, sel juhul on rahvastiku maht 100% (). Üldiselt arvutatakse sagedus järgmiselt

kus on rahvastiku hulk.

Tihedus() on suhteline väärtus, mis näitab, mitu populatsiooni ühikut (absoluutselt või suhteline vorm) on rühma intervalli () pikkuse ühiku kohta. Tihedus võib olla absoluutne või suhteline. Absoluutne tihedus võrdne

Suhteline tihedus võrdne

Suhtelise tiheduse arvutamisel kasutatakse sagedust, väljendatuna murdosades.

Atributiivne seeria on seeria, mis on koostatud populatsiooni kvalitatiivse tunnuse alusel. Need seeriad on koostatud tüpoloogilise rühmitamise abil ja neid saab väljendada tabelina. Näiteks ettevõtete töötajate jaotus tariifikategooriate kaupa (tabel 3.1).

Tabel 3.1

Toodud näites (tabel 3.1) on kogusumma kõik ettevõtte töötajad. Elanikkonna suurus on 250 inimest. Rahvastiku ühikuks on üks töötaja. Rahvastikuüksuse tunnuseks valiti tariifikategooria. Atribuudil on mitu spetsiifilist tähendust – variant (1. kategooria, 2. kategooria, 3. kategooria, 4. kategooria, 5. kategooria). Tabelis on atribuutide väärtused toodud veerus 2, sagedusväärtused veerus 3, sagedusväärtused veerus 4.

Variatsiooniseeriaon seeria, mis on koostatud populatsiooni kvantitatiivse tunnuse alusel. Need seeriad on koostatud peamiselt struktuursete rühmituste abil ja neid saab väljendada tabeli kujul. Variatsiooniseeriaid on kahte tüüpi: diskreetsed variatsiooniseeriad ja intervallseeriad. Diskreetsed variatsiooniseeriad – see on seeria, milles tunnuse (valikute) väärtused on esindatud diskreetsete väärtustega. Intervallvariatsiooni seeria – see on seeria, milles tunnuse väärtused on väljendatud intervallidena. Leheküljel toodud 34 üksikettevõtja päevakäibe andmete põhjal koostame variatsiooniintervallide jada (tabel 3.2)

Tabel 3.2

Veerg 3 näitab sagedust - ettevõtjate arv, kelle ühepäevakäive jääb teatud intervalli (veerg 2). 4. veerus arvutatakse sagedus protsentides valemi 3.1 abil. Seega on esimese rühma sagedus (3,1–3,9) võrdne

Teiste rühmade puhul arvutatakse sagedus sarnaselt. Veerg 5 näitab sagedust aktsiates. Selle saab kas arvutades

või konverteerides protsendid aktsiateks. Arvutuste tegemisel tuleb näidata andmeid kümnendkoha kujul täpsusega kuni 3 kohta pärast koma. See parandab arvutuste täpsust ja asjakohaste lõppandmete koostamist. Seega peaks sageduste summa protsentides olema 100% ja murdosades võrdne 1-ga.

Tabeli 3.2 veerus 6 on näidatud absoluuttiheduse väärtused. Arvutamine toimus valemi 3.2 järgi. Seega on esimese rühma absoluutne tihedus võrdne

Kui sagedus () on võetud veerust 3, siis intervalli () väärtus on määratletud esimese rühma intervalli ülemise piiri (3,9) ja alumise piiri (3,1) vahena, s.o. . Teiste rühmade absoluutne tihedus arvutatakse sarnaselt. Pärast arvutuste tegemist on vaja anda neile majanduslik tõlgendus. Nii näiteks näitab esimese rühma absoluutne tihedus seda iga tuhande rubla kohta. käive esimeses grupis on 5 ettevõtjat.

Tabeli 3.2 veerus 7 on näidatud suhtelise tiheduse väärtused. Arvutamine viidi läbi valemi 3.3 järgi. Seega on esimese rühma suhteline tihedus võrdne

Suhteline tihedus arvutatakse teiste rühmade puhul sarnaselt. Esimese grupi suhteline tihedus viitab sellele, et esimese grupi iga tuhande käibe kohta saabuvate ettevõtjate osakaal on 0,147.

Tabeli 3.3 veerus 2 on esitatud käive intervallidena ja veerus 3 on esitatud käive diskreetsete väärtuste kujul. Esimese rühma jaoks arvutatakse diskreetne väärtus järgmiselt

Käivet arvestatakse samamoodi nagu diskreetne väärtus ja teistele rühmadele.

Sageli analüüsi ajal variatsiooni seeria tunnuse väärtuste muutmisel (peamiselt kasvavas järjekorras) on vaja mõista populatsiooni mahu muutust. Sel eesmärgil kasutatakse selliseid mõisteid nagu akumuleeritud sagedused või akumuleeritud sagedused. Kogunenud sagedused ( )on sageduste summa esimesest reast kuni teatud väärtus märk kaasa arvatud. Kogunenud sagedused on sageduste summa rea algusest kuni atribuudi teatud väärtuseni, kaasa arvatud. Mõelgem nende näitajate väärtuste leidmisele vastavalt tabelis olevatele andmetele. 3.4 Tabeli 6. veerus. 3.4 näitab akumuleeritud sagedusi. Esimeses grupis (1. grupp) oli 4 ettevõtja (4. grupp) käive 3,1-3,9 tuhat rubla. (veerg 2) või keskmine käive 3,5 tuhat rubla. (gr. 3). Kuna tegemist on esimese rühmaga, siis akumuleeritud sagedus, s.o. ettevõtjate arv saab olema 4 (veerg 6). Teises rühmas on ettevõtjate arv, kelle käive on 3,9 kuni 4,7 tuhat rubla. või keskmine käive 4,3 tuhat rubla. võrdub 5 inimesega Sellest ka kogunenud sagedus, s.o. ettevõtjate arv, kelle käive on 3,1 kuni 4,7 tuhat rubla. või keskmiselt alates ja alla 4,3 tuhande rubla, võrdub 9=4+5. Kolmanda grupi puhul on akumuleeritud sagedus 16=4+5+7 jne. Kogunenud sagedus arvutatakse sarnaselt.

Koos esmase rühmitamisega kasutatakse statistikas laialdaselt sekundaarset rühmitamist . Sekundaarne rühmitus nimetatakse uute rühmade moodustamiseks varem peetud rühmitustel

Sekundaarset rühmitamist kasutatakse erinevate probleemide lahendamiseks, millest olulisemad on: 1) rühmadepõhine haridus kvantitatiivsetel tunnustel ja kvalitatiivselt homogeensed rühmad(tüübid) 2) kahe (või enama) rühma toomine erinevate intervallidega ühte tüüpi võrreldavuse ja analüüsi eesmärgil 3) suuremate rühmade moodustamine, milles avaldub selgemalt jaotuse iseloom.

Selle tehnika põhiolemus on saada võrreldavaid andmeid erinevate rühmade kohta, mille jaoks: numbriline koostis rühm (protsendi järgi) on kõikides rühmitustes fikseeritud samal tasemel; Kõigi suu rühmituste jaoks on ka võrdne arv rühmi ja sama sisu rühmatabelid. Võrdlemine ja võrdlemine ei allu absoluutsed näitajad rühmade kaupa ja suhtelised väärtused, protsent.

Sekundaarseks rühmitamiseks on kaks meetodit: 1) esmase rühmitamise intervallide teisendamine (tavaliselt lihtsalt intervalle suurendades) ja 2) igale rühmale teatud osa populatsiooni ühikute määramine (osaline ümberrühmitamine). Nende sekundaarsete rühmitamismeetodite kasutamisel eeldatakse tavaliselt, et tunnuse jaotus intervallide piires on ühtlane.

Sekundaarse rühmitamise kasutamist kahe erineva intervalliga rühma toomiseks ühte vormi võrreldavuse huvides illustreeritakse järgmise näitega. Selleks kasutame kahe ringkonna esimese detsembri andmeid loomakasvatustööliste arvu kohta (tabel 37.7).

. Tabel 37. Kahe rajooni talude rühmitamine loomakasvatajate arvu järgi

I ringkond		II piirkond
poolt talude rühmad		poolt talude rühmad
töötajate arv, inimesed	lõpuks	töötajate arv, inimesed	lõpuks

Otsesed andmed kahe piirkonna rühmade kohta ei ole võrreldavad, kuna talud jagunevad rühmadesse erinevate intervallidega: I piirkonnas 20 inimest ja II piirkonnas 30 inimest. Ka eraldatud rühmade arv ei ole sama

Kahe grupi võrreldavasse vormi viimiseks viime läbi teisejärgulise rühmitamise. Selleks rühmitatakse materjalid ümber rühmadesse, mis on mõlema piirkonna jaoks samad: võtame intervalli 40 inimest (tabel 38)

Kuna I piirkonna talude teisene rühmitamine on võimalik läbi viia lihtsalt intervalle suurendades (kahe rühmituse puhul on alumine ja ülemine intervall kokkulangev), kasutame probleemi lahendamiseks seda meetodit.

Selgitame arvutuste järjekorda. Esimesse kuni 160 töötajaga farmide rühma kuuluvad I ja II rühma farmid

. Tabel 38. Kahe rajooni talude teisene rühmitus loomakasvatajate arvu järgi

Talude osakaal nendes rühmades aastal üldine tulemus saab olema 16% (12. aprill). Teise 160–200-liikmelise tööjõuga talude rühma kuuluvad III ja IV rühma talud kokku moodustab 45% (18 27). Sarnaselt tehakse arvestusi ka ülejäänud detsembrirühmade moodustamisel.

koondab II piirkonna talud ümber. Kuna intervallide konsolideerimine II piirkonna taludele ei sobi ega lahenda probleemi, kasutame andmete osalise ümberrühmitamise meetodit esmaste rühmituste kaupa.

Esimene, äsja loodud II piirkonna farmide grupp, kus loomakasvatajate arv on kuni 160 inimest, hõlmab sama intervalliga täielikult algrühma farme. Talude osakaal selles grupis on 88%.

Teise rühma farmide gruppi, kus töötajate arv on 160 kuni 200 inimest, kuuluvad täielikult II rühma (16%) ja mõned talud. III rühm. III rühmast valitsuse võtmise osa väljaselgitamiseks on vaja see jagada alagruppidesse töötajate arvuga 190 - 200, 200 - 210, 210 - 220 inimest. Nende alarühmade talude osakaalu näitajad määratakse proportsionaalselt intervalli jaotusega. Vaadeldava intervalli suurus on 30 inimest ja see jaguneb kolmeks võrdseks osaks. Vajaliku intervalli 160 - 200 inimese saamiseks II rühma intervalli väärtusele (160 - 190 inimest) tuleks lisada kolmandik III rühma (190 - 220 inimest) intervalli väärtusest ja sama osa. selle rühma taludest.

Seega hakkab teise, vastloodud talude rühma kuuluma 16% teise rühma ja kolmandiku III rühma taludest - 10% (1/3-30), mis moodustab 26% põllumajandusettevõttest. koguarv II piirkonna talud

Teise rühma talude III rühma (200 - 240 inimest) hakkab kuuluma osa III rühma taludest (190 - 220 inimest), ülejäänud - 20% (% -30) ja kaks kolmandikku III rühma taludest. IV rühm (220 - 250 inimest) - % (% - 21), ehk 34% I piirkonna talude koguarvust II.

Sarnased arvutused tehakse ka ülejäänud, vastloodud talude rühmade moodustamisel: 240–280 ja üle 280 inimese. Kui tabelis 37 oleks koos andmetega talude osakaalu kohta rühmade lõikes toodud ka andmed nende arvu kohta, siis tehtaks arvutused vastloodud rühmade kohta samades proportsioonides, mis erikaal hostv.

Pärast sekundaarset rühmitamist muutub esmane materjal võrreldavaks, kuna kahe piirkonna jaoks võeti samad rühmad vastavalt töötajate arvule. Tabeli 38 andmetest nähtub, et kahe piirkonna talude jaotus loomakasvatustöötajate arvu järgi on oluliselt erinev: I piirkonnas on ülekaalus kuni 200 loomapidajaga farmid (61% talude koguarvust) , II piirkonnas - farmid, kus on karjakasvatajate arv - üle 200 inimese (66% talude koguarvust).

Esimese etapi tulemusena saadud teave analüüsitava üldkogumi iga ühiku kohta statistilised uuringud, iseloomustavad statistilist vaatlust selle erinevatest aspektidest, kuna neil on palju ajas ja ruumis muutuvaid märke ja omadusi. Kogu objekti kokkuvõtliku karakteristiku saamiseks üldistavate näitajate abil on vaja statistilise vaatluse käigus saadud tulemused süstematiseerida ja kokku võtta. See annab meile võimaluse tuvastada statistilise üldkogumi kui terviku ja selle üksikute komponentide tunnuseid ja tunnuseid ning avastada uuritavate sotsiaalmajanduslike nähtuste ja protsesside mustreid. Seda süstematiseerimist nimetatakse esmase statistilise materjali kokkuvõtteks.

Teine etapp statistiline töö – statistiline kokkuvõte – see on esmaste andmete töötlemine eesmärgiga saada uuritava nähtuse või protsessi üldistatud tunnused vastavalt mitmetele olulistele tunnustele, et tuvastada tüüpilised omadused ja nähtusele või protsessile tervikuna omased mustrid.

Statistiline kokkuvõte on üleminek üksikandmetelt teabele üksuste rühmade ja elanikkonna kui terviku kohta.

Kokkuvõtte koostamine koosneb kolmest etapist:

1) eelkontroll on andmete kontroll;

2) andmete rühmitamine kindlaksmääratud tunnuste järgi on tuletatud näitajate määramine;

3) koondtulemuste esitamine statistiliste tabelite kujul, need on mugav vorm saadud teabe tajumiseks;

Statistilise teabe semantiline järjepidevus on esialgne kontroll. Vastavalt statistilise kokkuvõtte programmile kasutatakse saadud teabe hilisemaks arusaadaval kujul edastamiseks andmete statistilist rühmitamist.

Saadud rühmitamistulemused esitatakse rühmitabelite kujul, mis sisaldavad uuritava populatsiooni kokkuvõtlikku tunnust ühe või mitme analüüsi loogikaga omavahel seotud tunnuse järgi. Seal on lihtsad ja keerulised kokkuvõtted. Teave üksikute üksuste kohta võetakse kokku tervikuna, jagamata neid homogeenseteks rühmadeks. Lihtsa statistilise kokkuvõtte tulemused on mõeldud materjali edasiseks töötlemiseks ka lihtsal kokkuvõttel on iseseisev tunnetuslik väärtus.

Lihtne statistiline kokkuvõte on tehing vaatlusühikute komplekti üldiste lõpp- ja grupiandmete arvutamiseks ning selle materjali tabelitesse korrastamiseks.

Lihtne statistiline kokkuvõte annab võimaluse määrata uuritava üldkogumi ühikute arvu ja uuritavate tunnuste mahtu, kuid seega ei anna lihtne kokkuvõte aimu üldkogumi koosseisu terviklikkusest. uurinud.

Kui üldkogumi ühikud jaotada homogeenseteks rühmadeks, siis arvutatakse iga rühma kohta kogusummad ja seejärel kogu üldkogumi kohta tervikuna nimetatakse sellist statistilist kokkuvõtet kompleksseks. Kompleksne kokkuvõte võimaldab meil uurida populatsiooni koosseisu ja tuvastada mõne tunnuse mõju teistele, st paljastada antud populatsioonile omased mustrid.

Kompleksne statistiline kokkuvõte on operatsioonide kompleks. sh uuritava sotsiaal-majandusliku nähtuse või protsessi vaatlusühikute jaotamine gruppidesse, näitajate süsteemi koostamine uuritava nähtuste kogumi tüüpiliste rühmade ja alarühmade iseloomustamiseks, ühikute arvu ja tulemuste loendamine igas rühmas ning alarühmad ja selle töö tulemuste esitamine statistiliste tabelite kujul. Põhineb terviklikul teoreetiline analüüs uuritavate nähtuste ja protsesside olemust ja sisu, tehakse statistiline kokkuvõte. Statistilise kokkuvõtte tegemise programm ja plaan tagab selle tulemuste usaldusväärsuse ja paikapidavuse.

Statistika koondprogramm sisaldab loendit rühmadest, millesse saab jagada või jagada statistiliste vaatlusüksuste komplekti, samuti näitajate süsteemi, mis iseloomustab uuritavat nähtuste ja protsesside kogumit nii tervikuna kui ka selle üksikuid osi. Statistilise kokkuvõtte programm sõltub uuringu eesmärkidest ja eesmärkidest. Programmi arendamine hõlmab järgmisi etappe:

1) rühmitustunnus valitakse homogeensete rühmade moodustamiseks;

2) määratakse moodustamise järjekord ja rühmade arv;

3) süsteem on väljatöötamisel statistilised näitajad iseloomustada rühmi ja objekti tervikuna;

4) kokkuvõtlike tulemuste saamiseks luuakse statistiliste tabelite paigutused.

Koos statistilise koondprogrammiga koostatakse selle elluviimise plaan. Plaan peab sisaldama teavet kokkuvõtte tegemise järjekorra, ajastuse ja tehnika, selle teostajate, tulemuste vormistamise korra ja reeglite kohta tabelite kujul.

Kokkuvõte võib olla ka detsentraliseeritud või tsentraliseeritud.

Detsentraliseeritud statistiline kokkuvõte- see on viis materjali kokkuvõtmiseks, mis viiakse läbi alt üles mööda hierarhilist juhtimisredelit ja töödeldakse igas etapis. Andmetöötlus toimub kohapeal, st ettevõtete aruanded koostavad subjektide statistikaasutused Venemaa Föderatsioon. Saadud tulemused saadetakse Vene Föderatsiooni riiklikule statistikakomiteele ja seejärel kuvatakse riigi sotsiaal-majandusliku olukorra lõplikud näitajad tervikuna.

Tsentraliseeritud statistiline kokkuvõte on meetod, kus kõik statistilise vaatluse tulemusena saadud esmased andmed koondatakse ühte keskne organisatsioon ja neid töödeldakse algusest lõpuni.

Vastavalt teostamistehnikale saab statistilisi kokkuvõtteid mehhaniseerida (elektrooniliste arvutite abil) ja käsitsi.

2. Rühmade olemus ja liigitus

Teaduslikult põhjendatud jaotus gruppidesse võimaldab teha õigeid järeldusi uuritava populatsiooni ja selles toimuvate protsesside kohta.

Teadusliku rühmitamise põhimõtted sätestati V. I. Statistiline rühmitamine, nagu märkis V. I., ei ole teisejärguline. See nõuab uuritavate nähtuste põhjalikku sotsiaal-majanduslikku analüüsi, Ülioluline statistilises rühmituses on õige valik tunnuste rühmitamine vastavalt statistilise uurimistöö eesmärkidele. Rühmitamine peaks põhinema uuritava teema jaoks kõige olulisematel, olulisematel tunnustel, mis võimaldavad tuvastada nähtuste sotsiaal-majanduslikke tüüpe. Geniaalne näide statistiliste rühmituste kasutamisest sotsiaal-majanduslike tüüpide tuvastamiseks on tabel V. I. Lenini teosest "Kapitalismi areng Venemaal".

Statistiline rühmitus– See on statistiliste uuringute läbiviimise üks peamisi etappe.

Homogeensete rühmade moodustamise protsessi, mis põhineb statistilise üldkogumi osadeks jagamisel või uuritud statistiliste üksuste liitmisel agregaadis vastavalt neile iseloomulikele tunnustele nimetatakse statistiline rühmitamine Kõige olulisem statistiline meetod andmete üldistused on statistilised rühmitused.

Meetodi abil lahendatakse kolm peamist tüüpi probleeme statistiline rühmitus:

1) nähtuste sotsiaal-majanduslike tüüpide väljaselgitamine;

2) nähtuse struktuuri ja nähtuses toimuvate struktuurinihete uurimine;

3) nähtuste ja neid nähtusi iseloomustavate märkide vaheliste seoste ja vastastikuste sõltuvuste väljaselgitamine. Eristada järgmised tüübid statistilised rühmad:

1) tüpoloogiline;

2) struktuurne;

3) analüütiline.

Kvalitatiivselt homogeenseid agregaatide rühmi, s.o objekte, mis on oma rühmitustunnuste poolest lähedased, nimetatakse tüpoloogiline rühmitus.

Tüpoloogilise rühmitamise näide on: maade rühmitamine omandivormide järgi. Põhitähelepanu tüpoloogilises rühmitamises tuleks pöörata tüüpide tuvastamisele ja rühmitustunnuse valikule. Tüpoloogilise rühmituse koostamiseks on vaja kasutada kvantitatiivseid ja kvalitatiivseid (attributiivseid) tunnuseid.

Atribuudi järgi rühmitamine viitab sellele, et tuvastatud rühmade arv vastab selle atribuudi tegelikule astmete arvule. Kvantitatiivsetest kriteeriumidest lähtuvalt on vaja õigesti määrata rühmitamise intervall ja määrata vajalik rühmade arv. Tüpoloogilise rühmituse intervallide määramise probleem lahendatakse rühmitustunnuse selliste muutuste kvantitatiivsete piiride tuvastamise alusel, mille juures nähtus muutub või omandab uue kvaliteedi.

Tüpoloogilises rühmituses sõltub rühmade arv olemasolevate sotsiaalmajanduslike tüüpide arvust. Nähtuste sotsiaalmajanduslikud tüübid sõltuvad homogeensete rühmade koostisest, struktuurist ning sama tüüpi populatsiooni ja sama tüüpi rühmade tunnuste varieerumise uurimisest, mis põhineb struktuurse rühmituse konstrueerimisel. Homogeense populatsiooni jagamist teatud rühmadesse, mis iseloomustavad struktuuri täiendavalt teatud rühmitustunnuse järgi, nimetatakse struktuurseks rühmitamiseks. Siin käsitletakse ka kvantitatiivseid ja atributiivseid omadusi. Näiteks võib tuua laotöötajate rühmitamise kvalifikatsiooni järgi.

Atribuudi järgi erinevad rühmad üksteisest atribuudi olemuse poolest. Kvantitatiivne tunnus hõlmab ka rühmade arvu ja intervalli laiuse määramist.

Statistiliste rühmituste põhiülesanne– statistilise üldkogumi ühikute tunnuste vaheliste seoste ja sõltuvuste uurimine, mis lahendatakse analüütiliste rühmituste loomisega. Analüütiline rühmitamine– see on rühmitus, mis paljastab uuritavate sotsiaalmajanduslike nähtuste ja neid iseloomustavate tunnuste vahelisi seoseid ja vastastikuseid sõltuvusi.

Kõik statistikateaduse omadused võib jagada faktoriaalseteks ja efektiivseteks. Nimetatakse märke, millel on suur mõju efektiivsete märkide muutumisele faktoriaalne. Tunnuseid, mis muutuvad faktoritunnuste mõjul, nimetatakse tõhus.

Analüütilise rühmituse koostamisel on oluliseks ülesandeks rühmade arvu valik, milleks on vaja uuritav vaatlusüksuste kogum jagada, ning nende piiride määramine.

Nõuded, mida analüütiliste rühmituste koostamisel tuleb täita, on järgmised: iga uuritav rühm peab sisaldama populatsiooni homogeenseid ühikuid rühmitamise tunnuste järgi ja iga uuritava rühma ühikute arv peab olema piisav, et saada. statistilised omadused uuritav objekt.

Lihtsat nimetatakse rühmitamine, kui rühm moodustatakse ainult ühe tunnuse järgi. Kui jagate rühma teatud tunnuste järgi alamrühmaks, nimetatakse sellist rühma kombineerituks.

Kombinatsioon rühmitamist käsitletakse siis, kui populatsioon jagatakse rühmadesse kahe või enama üksteisega kombineeritud rühmitustunnuse (kombinatsiooni) järgi. Kombineeritud rühmitused võimaldavad uurida populatsiooni ühikuid üheaegselt mitme tunnuse järgi.

Keeruliste sotsiaalmajanduslike nähtuste ja protsesside uurimisel kasutatakse kombineeritud rühmitusi. Kombineeritud rühmituse koostamiseks on vaja tuvastada piisava olemasolu suur hulk tähelepanekud.

Klastri leidmiseks (in mõõtmete ruum) objektid (punktid), tuleb rakendada mitmemõõtmeline rühmitus Kasutatud teabe põhjal on olemas rühmitused:

1) esmane – toodetud statistilise vaatluse tulemusena saadud lähteandmete alusel;

2) sekundaarne - see on rühma ühendamise või tükeldamise tulemus.

3. Rühmituste moodustamise põhimõtted

Statistiliste rühmituste koostamiseks peate valima rühmitamise tunnuse, seejärel määrama rühmade arvu, milleks uuritav statistiline üldkogum jaguneb, ja fikseerima rühmitamise intervallide piirid. Iga rühma jaoks on vaja leida konkreetsed näitajad või nende süsteem, mis peaks iseloomustama uuritavaid rühmi.

Rühmitustunnuse valimine – raske küsimus statistilise rühmitamise teoorias ja statistilises uurimistöös üldiselt. Rühmitav tunnus on aluseks, mille alusel jagatakse üldkogumi ühikud eraldi rühmad. Statistilise uuringu järelduste täpsus sõltub rühmitustunnuse täpsusastmest.

Rühma kuuluvad kvantitatiivsed ja atributiivsed (kvalitatiivsed) tunnused. Kvantitatiivsed omadused tavaliselt on numbriline avaldis(näiteks toodangu maht, inimese vanus, pere sissetulek jne). Atributiivsed tunnused annavad populatsiooniüksuse kvalitatiivse tunnuse (nt sugu, perekonnaseis, isiku poliitiline orientatsioon jne). Rühmituse atribuudi järgi valitud rühmad peavad üksteisest erinema kvalitatiivsed omadused märk. Rühmade arv, millesse statistiline üldkogum on jagatud, sõltub atribuudi astmete arvust.

Oluline on õppida majanduslik olemus uuritav nähtus kvantitatiivsete tunnuste alusel rühmituse koostamisel.

Rühmade arvu määramiseks võite kasutada Sturgessi valemit:

h+ 3,322 ? lg N,

Kus h– rühmade arv;

N– rahvastikuüksuste arv;

lgN – kümnendlogaritm alates N.

See valem viitab sellele, et rühmade arvu valik sõltub objektiivselt populatsiooni suurusest. Pärast rühmade arvu kindlaksmääramist otsustatakse rühmitamise intervallide määramise küsimus.

Rühmitamisintervalli alusel on võimalik kvantitatiivselt eristada mõnda rühma teistest ja visandada nende uue kvaliteedi tuvastamise piirid. Rühmitamisintervall on sees asuva muutuva tunnuse väärtuste intervall teatud grupp. Igal intervallil on oma pikkus (laius), ülemine ja alumine piir.

Intervalli alumine piir on väikseim väärtus intervallile iseloomulik ja intervalli ülempiir on selle suurim väärtus. Esimese intervalli alampiiriks loetakse atribuudi väikseim väärtus vaatlusühikute komplektis. Viimase intervalli ülempiir ei tohi olla väiksem kui kõrgeim väärtus iseloomulik vaatlusühikute komplektis.

Intervalli laius on erinevus ülemise ja alumise piiri vahel. Rühmitamise intervallid võivad olenevalt nende laiusest olla võrdsed või ebavõrdsed. Ebavõrdsed jagunevad järk-järgult kasvavateks, järk-järgult kahanevateks, meelevaldseteks ja spetsialiseerunud. Kui tunnuse varieeruvus avaldub suhteliselt kitsastes piirides ja jaotus on ühtlane, siis koostatakse grupp võrdsete intervallidega.

Võrdse intervalli väärtus määratakse järgmise valemiga:

h = R/n = (x max – x min) / n,

kusx max,x min – maksimaalne ja minimaalne väärtus omadused agregaadis;

n – rühmade arv.

Seda valemit nimetatakse intervallastmeks. Kui agregaadi tunnuse varieeruvusvahemik on suur ja tunnuse väärtused varieeruvad ebaühtlaselt, siis kasutatakse ebavõrdsete intervallidega rühmitamist. Ebavõrdsed intervallid on võimalik saada, kui konstrueeritud võrdsete intervallidega rühmitus sisaldab rühmi, mis ei peegelda teatud tüübid nähtust või protsessi, mida uuritakse või mis ei sisalda ühtse terviku ühikut, on vaja suurendada - ühendada kaks või enam väikest või "tühja" järjestikust võrdsed intervallid. Võrdsete või ebavõrdsete intervallide valik sõltub intervallide täituvuse astmest. Rühmitamise intervallid võivad olla suletud või avatud Suletud intervallid on intervallid, milles on määratud ülemine ja alumine piir. Avatud intervallidel on ainult üks piir (ülemine on esimese jaoks, alumine on viimane). Kvantitatiivsete omaduste poole võib liigitada pidevaks või diskreetseks tunnuseks. Kui rühm põhineb diskreetsel atribuudil, siis võrdub i-nda intervalli alumine piir 1-ga suurendatud i-nda intervalli ülemise piiriga.

Rühmitustes, mis kajastavad uuritava populatsiooni eristatud üksuste rühmade kvalitatiivseid tunnuseid ja spetsiifilisust teatud tunnuse järgi, kasutatakse spetsiaalseid intervalle. Spetsiaalsed intervallid - need on intervallid, mida kasutatakse nähtuste eristamiseks samade tüüpide kogumikust sama kriteeriumi alusel. erinevad tingimused. Lähtudes tunnuste rollist uuritavate objektide, protsesside või nähtuste vahelistes suhetes, võib need jagada faktoriaalseteks ja resultantseteks. Faktoromadused mõjutavad teisi omadusi ja produktiivseid omadusi mõjutavad muud omadused.

Eristatakse rühmi:

Esmane, koostatud põhjal esmane materjal vaatluste käigus kogutud.
Teisene, mis on koostatud esmaste põhjal, kasutatakse kahel juhul:
- kui on vaja väikesed formaalsed rühmad ümber korraldada suuremateks;
- kui on vaja anda võrdlev hinnang erinevates kohtades ja erinevatel meetoditel kogutud materjalidele.

Kahel või enamal tunnusel põhinevat rühmitamist nimetatakse - kombineeritud.
Tunnust, mille järgi nähtuste rühmi või liike eristatakse, nimetatakse rühmitamine või rühmitamise alus. Alus võib olla kvantitatiivne või omistatav. Atributiivne– see on märk, millel on nimi (näiteks elukutse: õmbleja, õpetaja jne).

Näide nr 1. Saadaval on järgmised jaotusandmed kaubandusettevõtted töötajate arvu järgi kahes piirkonnas.

Ehitada teisene rühmitus ettevõtete jaotuse andmed, piirkonna 1 andmete ümberarvutamine vastavalt piirkonna 2 grupeeringule. Millises piirkonnas keskmine arv rohkem töölisi?

Lahendus:
Esimesse rühma “Alla 5” kuulub 4/5 rühmast “1-5”. Siis on ettevõtete arv: 6*4/5 = 4,8 ≈ 5.
Rühm “5-10” hõlmab täielikult “6-10” rühma ja osa “1-5” rühmast, s.o. kindel number on 4 + (6-5) = 5
Rühm "11-20" hõlmab täielikult rühma "11-15" ja osa rühmast "16-20", nimelt ¼*50 = 12,5 ≈ 13.
Rühm "21-30" hõlmab täielikult rühma "16-20" ja "21-25" ning rühma "üle 25". Saame: (50-13) + 20 + 15 = 72

Leidke keskmine töötajate arv:
Esimese piirkonna jaoks.

Kaalutud keskmine: x av = 1960/105 = 18,67

Teise piirkonna jaoks.

Kaalutud keskmine: x av = 3502,5/117 = 29,94
Seega on teises piirkonnas keskmine töötajate arv suurem.

Näide nr 2.
Töötajate jaotus tööstaaži järgi

Grupi number	Töötajate rühmad tööstaaži, aastate järgi	Tööliste arv, inimesed	Töötajate arv protsentides koguarvust
I	2-6	6	30,0
II	6-10	6	30,0
III	10-14	5	25,0
IV	14-18	3	15,0
KOKKU		20	100,0

Jaotusreas on selguse huvides uuritav tunnus arvutatud protsentides. Esmase rühmitamise tulemused näitasid, et 60,0% töötajatest on kuni 10-aastase töökogemusega, võrdselt 2-6-aastaselt - 30% ja 6-10-aastaselt - 30%, ning 40% töötajatest on kogemustega alates 10 kuni 18 aastat.
Töökogemuse ja väljundi vaheliste seoste uurimiseks on vaja üles ehitada analüütiline rühmitus. Selle aluseks võtame samad rühmad, mis jaotussarjas. Rühmitamise tulemused esitame tabelis 2.

Tabel 2 – Töötajate rühmitamine tööstaaži järgi

Grupi number	Töötajate rühmad aastatepikkuse kogemuse järgi	Tööliste arv, inimesed	Keskmine töökogemus, aastat	Toote väljund, hõõruda.
Grupi number	Töötajate rühmad aastatepikkuse kogemuse järgi	Tööliste arv, inimesed	Keskmine töökogemus, aastat	Kokku	Ühele orjale
I	2-6	6	3,25	1335,0	222,5
II	6-10	6	7,26	1613,0	268,8
III	10-14	5	11,95	1351,0	270,2
IV	14-18	3	16,5	965,0	321,6
KOKKU:		20	8,62	5264	236

Tabeli 2 täitmiseks tuleb luua tööleht 3.

Tabel 3.

Ei.	Töötajate rühmad tööstaaži, aastate järgi	Töötaja number	Kogemused	Väljund hõõrudes.
1	2	3	4	5
1	2-6	1, 2, 3, 4,	2,0; 2,3; 3,0; 5,0; 4,5; 2,7	205, 200, 205, 250, 225, 250
Rühma kokku:		6	19,5	1335
2	6-10	5, 6, 8, 13, 17, 19	6,2; 8,0; 6,9; 7,0; 9,0; 6,5	208, 290, 270, 250, 270, 253
Rühma kohta kokku		6	43,6	1613
3	10-14	9, 12, 15, 16, 18	12,5; 13,0; 11,0; 10,5; 12,8	230, 300, 287, 276, 258
Rühma kohta kokku		5	59,8	1351
4	14-18	11, 20, 14	16, 18, 15,5	295, 320, 350
Rühma kohta kokku		3	49,5	965
Kokku		20	172.4	5264,0

Veergude jagamine (4:3); (5:3) vahekaart. 3 saame vastavad andmed tabeli 2 täitmiseks. Nii edasi kõikide rühmade kohta. Täites tabeli 2, saame analüütilise tabeli.
Pärast töötabeli arvutamist võrdleme tabeli lõpptulemusi probleemtingimuste andmetega, mis peavad ühtima. Seega lisaks rühmituste koostamisele ja keskmiste väärtuste leidmisele kontrollime ka aritmeetilist juhtimist.
Analüüsides analüütilist tabelit 2, võime järeldada, et uuritud tunnused (näitajad) sõltuvad üksteisest. Töökogemuse suurenemisega suureneb tootmisvõimsus töötaja kohta pidevalt. Neljanda rühma töötajate toodang on 99,1 rubla. kõrgem kui esimene ehk 44,5%, käsitlesime ühe tunnuse järgi rühmitamise näidet. Kuid paljudel juhtudel ei piisa sellisest rühmitusest määratud probleemide lahendamiseks. Sellistel juhtudel minnakse üle kahe või enama tunnuse järgi rühmitamisele, s.t. kombinatsioonile. Tehkem andmete sekundaarne rühmitamine keskmise tootmistoodangu põhjal.
Iseloomustame iga rühma töötajate arvu, keskmise töökogemuse, keskmise toodangu järgi - summaarsed ja töötaja kohta tehtud arvutused on toodud tabelis 4.

Tabel 4 – Töötajate rühmitamine tööstaaži ja keskmise toodangu järgi

Ei.	Tööliste rühmad		Tööliste arv, inimesed	Keskm. töökogemus, aastat	Keskmine tootmisvõimsus, hõõruda.
Ei.	kogemuse järgi	keskmise toodangu järgi jätk. sisse hõõruda.	Tööliste arv, inimesed	Keskm. töökogemus, aastat	kokku	ühe töötaja kohta
1	2-6	200,0-250,0	4	2,5	835,0	208,75
Rühma kohta kokku			6	3,25	1335,0	222,5
2	6-10	200,0-250,0	-	-	-	-
3	10-14	200,0-250,0	1	12,5	230,0	230,0
Rühma kohta kokku			5	11,96	1351,0	270,2
4	14-18	200,0-250,0	-	-	-	-
Rühma kohta kokku			3	16,5	965,0	321,6
Rühmade kaupa kokku		200,0-250,0	5	3,0	1065,0	213,0
Kokku			20	8,62	5264	263,2

Sekundaarse analüütilise rühmituse koostamiseks algselt loodud rühmade sees keskmise tootetoodangu põhjal määrame sekundaarse rühmituse intervalli, tuues esile kolm rühma, s.o. üks vähem kui algses rühmas.
Seejärel i=(350-200)/3 = 50 hõõruda.
Rohkem gruppe pole mõtet võtta, tuleb väga väike vahe, vähem saab. Grupi lõplikud andmed arvutatakse grupi kogemuste summana, saata esimesed 19, 5 aastat jagatud töötajate arvuga - 6 inimest, saame 3,25 aastat.
Tabeli andmed näitavad, et toote toodang sõltub otseselt töökogemusest.

Mõnikord ei tuvasta esialgne rühmitamine selgelt rahvastikuüksuste jaotuse olemust ega vii rühmitused võrreldavasse tüüpi, et teostada. võrdlev analüüs, on vaja olemasolevat rühmitust mõnevõrra muuta: ühendada eelnevalt tuvastatud suhteliselt väikesed rühmad väikeseks arvuks suuremateks tüüpilisteks rühmadeks või muuta eelmiste rühmade piire, et muuta rühmitus teistega võrreldavaks.