Biografije Karakteristike Analiza

Kako napraviti sekundarno grupisanje podataka. Statistika grupisanja

Pregrupisavanje prethodno grupisanih statistika naziva se sekundarno grupisanje. Ova metoda se koristi u slučajevima kada je, kao rezultat početnog grupisanja, priroda distribucije populacije koja se proučava nije jasna.

U ovom slučaju, intervali se povećavaju ili smanjuju. Sekundarno grupisanje se također koristi za dovođenje grupa u različitim intervalima u uporediv oblik u svrhu njihovog poređenja. Pogledajmo sekundarne tehnike grupisanja koristeći primjer.

Primjer 1.

Povećajte intervale na osnovu podataka u tabeli 2.7:

Tabela 2.7.

Broj prodavnica

Navedeno grupisanje nije dovoljno jasno jer ne pokazuje jasan i strog obrazac u promjeni prometa po grupama.

Zbijemo redove raspodjele, formirajući šest grupa. Nove grupe se formiraju zbrajanjem prvobitnih grupa (tabela 2.8.).

Tabela 2.8.

Grupe prodavnica prema prometu za četvrti kvartal, hiljada rubalja.

Broj prodavnica

Trgovinski promet za četvrti kvartal, hiljada rubalja.

Prosječan promet po trgovini, hiljada rubalja.

Apsolutno je jasno da što su prodavnice veće, to je i nivo prometa veći.

Primjer 2.

Dostupni su sljedeći podaci o raspodjeli kolektivnih farmi prema broju domaćinstava (Tabela 2.9.).

Tabela 2.9.

Udio kolektivnih farmi u grupi kao postotak od ukupnog broja

Grupe zadruga prema broju domaćinstava

Ovi podaci ne dozvoljavaju poređenje distribucije zadruga u dva okruga prema broju domaćinstava, jer u ovim okruzima postoji različit broj grupa kolektivnih farmi. Neophodno je dovesti seriju distribucije u uporediv oblik.

Kao osnovu za poređenje potrebno je uzeti raspodjelu kolektivnih farmi u 1. okrugu. Shodno tome, sekundarno grupisanje se mora izvršiti u drugom regionu kako bi se formirao isti broj grupa iu istim intervalima kao u prvom regionu. Dobijamo sljedeće podatke (tabela 2.10.).

Tabela 2.10.

Grupe zadruga prema broju domaćinstava

Udio kolektivnih farmi u grupi kao postotak od ukupnog broja

21-7=14, 14+23=37

Da bismo odredili broj zadruga koje je potrebno prevesti iz pete grupe u novoformiranu, uslovno ćemo pretpostaviti da ovaj broj zadruga treba da bude proporcionalan specifičnoj težini odabranih domaćinstava u grupi.

Određujemo udio 50 domaćinstava u petoj grupi.

(50 * 18) / (250 - 150) = 9

Određujemo udio 50 domaćinstava u šestoj grupi.

(50 * 21) / (400 - 250) = 7, itd.

Prilikom analize i poređenja nekoliko grupacija, na primjer, za nekoliko radionica, preduzeća i sl., može nastati situacija kada originalne grupacije nisu uporedive zbog razni brojevi grupe ili različite veličine korištenih intervala. Kako bi se takva grupisanja dovela u uporediv oblik, tj. bilo na jedan broj grupa, ili na jednu vrijednost intervala, koristi se metod sekundarnog grupisanja. Metoda sekundarnog grupisanja je metoda formiranja novih grupa na osnovu postojećih grupa prema datim zahtjevima. Da bi se izvršilo sekundarno grupisanje, koriste se 2 metode: 1) kombinovanje originalnih grupa, 2) frakciono pregrupisavanje.

Dovođenje nekoliko različitih grupa u uporediv oblik vrši se u tri faze. U prvoj fazi analiziraju se početne grupe kako bi se identifikovali uslovi za neuporedivost prvobitnih grupa. U drugoj fazi, odabire se metoda kojom se originalne grupe dovode u uporediv oblik. U trećoj fazi se provodi sekundarno preuređenje početno grupisanje i analiza dobijenih rezultata. Ako je potrebno, vrši se pregrupisavanje. Razmotrimo metode sekundarnog preuređivanja.

1 način Statističko posmatranje distribucije radnika preduzeća prema radnom stažu u 2000. godini dalo je sljedeće rezultate (tabela 2.7).

Tabela 2.7

U 2002. godini izvršeno je ponovljeno statističko posmatranje koje je dalo sljedeće rezultate (tabela 2.8). Nemoguće je direktno iz podataka u obje tabele procijeniti promjene u raspodjeli radnika po stažu preko 2 godine. Analiza obje tabele pokazuje da su one nedosljedne zbog različiti brojevi grupe i različite veličine intervala.

Tabela 2.8

Da biste podatke iz obe tabele doveli u uporediv oblik, možete kombinovati obe grupe 1 i 2, i grupe 3 i 4 u tabeli 2.7. To će omogućiti da se procijene promjene u raspodjeli radnika prema radnom stažu koje su se dogodile u preduzeću tokom dvije godine. Rezultati pregrupisavanja podataka statističko posmatranje za 2000. godinu (tabela 2.7) date su u tabeli 2.9.

Tabela 2.9

Upoređujući podatke za 2002. godinu (tabela 2.8) sa pregrupisanim podacima za 2000. godinu (tabela 2.9), možemo zaključiti: za dvije godine smanjen je broj radnika sa stažom do 6 godina, tj. mladi, a povećan je i broj radnika sa više iskustva.

Metoda 2 Neka statistička posmatranja 2002. godine daju sljedeće rezultate (tabela 2.10). Uspoređujući podatke za 2000. godinu (Tablica 2.9) i podatke za 2002. (Tablica 2.7), možemo zaključiti da su nekompatibilni zbog različitog broja grupa i različitih veličina intervala. Analiza pokazuje da je upotreba jedne metode dovođenja podataka u uporediv oblik nemoguća. Stoga koristimo metodu 2 da pregrupišemo podatke za 2000. godinu (tabela 2.7) tako da odgovaraju grupisanju podataka za 2002. godinu (tabela 2.10)

Tabela 2.10

Upotreba druge metode pretpostavlja ravnomjernu raspodjelu frekvencija unutar svake grupe. Ovo je preduvjet za korištenje druge metode. Da bismo pregrupisali podatke za 2000. godinu (Tabela 2.7), izvršićemo sljedeće proračune. Tako će nova prva grupa (1-4) (tabela 2.10) obuhvatiti sve podatke iz stare prve grupe (1-3) (tabela 22.7) i podatke o broju radnika sa 4 godine staža iz stare druge grupe . Broj radnika sa 4 godine staža je 3 (9/3=3, pošto je u staroj drugoj grupi bilo 9 radnika, a interval je 3). Tako će nova prva grupa (1-4) uključivati ​​18 radnika (18=15+3)Druga novu grupu(5-8) obuhvatiće 6 radnika sa 5,6 godina iskustva (iz stare druge grupe 6 = 9/3 2) i 18 radnika sa 7, 8 godina iskustva (iz stare treće grupe 18 = 27/3 2) Tako će nova druga grupa (5-8) uključivati ​​24 radnika (24=6+18). U novu treću grupu (9-12) biće uključeni radnici sa 9 godina iskustva (9=27/3) i svih 9 radnika iz stare četvrte grupe (10-12). Tako će u novoj trećoj grupi (9-12) biti 18 radnika (18=9+9). Objedinićemo pregrupisane podatke za 2000. i podatke za 2002. u jednu tabelu (2.11), što će omogućiti komparativnu analizu.

Tabela 2.11

Analiza distribucije radnika preduzeća prema radnom stažu (tabela 2.11) pokazuje da je u 2002. godini povećan broj radnika sa većim stažom (sa 9 na 12 godina), a smanjen broj radnika sa manjim iskustvom (sa 1 ​​na 8 godina). Dakle, pregrupisavanje podataka omogućilo je da se podaci dovedu u uporediv oblik, sprovedu analizu i izvuku potrebne zaključke.

Kontrolna pitanja i zadatke

1. Šta je statističko posmatranje? Koji uslovi moraju biti ispunjeni kada se vrši statističko posmatranje (vidi definiciju)?

2. Po kojim kriterijumima se mogu klasifikovati statistička posmatranja? Navedite primjere statističkog posmatranja.

3. Koje greške se javljaju prilikom vođenja statističkih opservacija i koje metode kontrole se mogu koristiti?

4. Odredite koji primjer sadrži jednostavan, a koji složen sažetak. Primjer 1. U ponedjeljak je 200 radnica radilo u tkalačkoj radionici. Primjer 2. U ponedjeljak je 40 radnica radilo u tkaonici na lokaciji br. 1, 60 radnica na lokaciji br. 2, a radilo je ukupno 100 radnica.

5. Koje grupe se koriste tokom obrade statističke informacije? Po čemu se razlikuju jedni od drugih?

6. Odsjek glavnog tehnologa zapošljava 15 ljudi, a odjel marketinga i prodaje 10 ljudi. U kom slučaju su timovi odjeljenja homogene populacije, a u kojim heterogene populacije?

7. Dnevnu prodaju artikla tkanine A u radnji Fabric u oktobru karakterišu sledeći podaci (u metrima): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9 , 5, 10 , 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. Grupirajte podatke koristeći jednake intervale.

8. Pregrupisati rezultate grupisanja podataka od tačke 7 do sledeće grupe: (3-9), (9-15), 15-21).

Tema br. 3 STATISTIČKA DISTRIBUCIJSKA SERIJA, TABELE, GRAFIKA

3.1 Statističke distribucijske serije - pojam, vrste, oblici prezentacije

Jedan oblik prezentacije podataka statističkog posmatranja je statistička serija distribucije. Statističke serije distribucija je uređeni raspored jedinica stanovništva u grupe prema karakteristikama grupisanja. Uz pomoć statističkih serija distribucije moguće je proučavati strukturu i granice promjene stanovništva, ocijeniti homogenost i odrediti obrazac razvoja jedinica stanovništva. Po izgledu statističke serije distribucije su podijeljene na atribute, varijacije i vremenske serije.

Atributivne i varijacione serije sastoje se od dva elementa: varijacije i frekvencije (frekvencija ili gustina). Opcija() – ovo je specifična vrijednost atributa koju uzima u seriji distribucije. Frekvencija () - Ovo apsolutni broj, pokazujući koliko se puta (koliko često) određena vrijednost osobine (varijante) pojavljuje u populaciji ili koliko jedinica populacije ima određenu vrijednost karakteristike (varijante). Učestalost() – ovo je relativna vrijednost koja određuje udio pojedinačnih opcija u ukupnom obimu populacije (). Učestalost se može izraziti ili u udjelima, u kom slučaju obim populacije jednako jedan(), ili kao procenat, u kom slučaju je obim populacije 100% (). Općenito, učestalost se izračunava na sljedeći način

gdje je obim stanovništva.

Gustina() je relativna vrijednost koja pokazuje koliko jedinica populacije (u apsolutnom ili relativni oblik) je po jedinici dužine grupnog intervala (). Gustina može biti apsolutna ili relativna. Apsolutna gustina jednak

Relativna gustina jednak

Prilikom izračunavanja relativne gustoće koristi se frekvencija izražena u razlomcima.

Atributivne serije je serija konstruisana na osnovu kvalitativne karakteristike populacije. Ove serije su konstruisane pomoću tipološkog grupisanja i mogu se izraziti u obliku tabele. Na primjer, raspodjela radnika preduzeća po tarifnim kategorijama (tabela 3.1).

Tabela 3.1

U datom primjeru (Tabela 3.1), ukupnost su svi radnici preduzeća. Broj stanovnika je 250 ljudi. Jedinica stanovništva je jedan radnik. Kao karakteristika jedinice stanovništva odabrana je tarifna kategorija. Atribut ima nekoliko specifičnih značenja - varijanta (1. kategorija, 2. kategorija, 3. kategorija, 4. kategorija, 5. kategorija). U tabeli su vrednosti atributa date u koloni 2, vrednosti frekvencije u koloni 3, a vrednosti frekvencije u koloni 4.

Varijacijska serijaje serija konstruisana na osnovu kvantitativne karakteristike populacije. Ove serije su konstruisane uglavnom koristeći strukturno grupisanje i mogu se izraziti u obliku tabele. Postoje dvije vrste varijacionih serija: diskretne varijacione serije i intervalne serije. Diskretne serije varijacija – ovo je serija u kojoj su vrijednosti karakteristike (opcije) predstavljene diskretnim vrijednostima. Serija intervalnih varijacija – ovo je serija u kojoj su vrijednosti neke karakteristike izražene kao intervali. Na osnovu podataka o dnevnom prometu 34 individualna preduzetnika datih na strani , konstruisaćemo niz intervala varijacije (tabela 3.2)

Tabela 3.2

Kolona 3 pokazuje učestalost - broj preduzetnika čiji jednodnevni promet pada u određenom intervalu (kolona 2). Kolona 4 izračunava učestalost kao procenat koristeći formulu 3.1. Tako će frekvencija za prvu grupu (3.1 – 3.9) biti jednaka

Učestalost se izračunava slično za druge grupe. Kolona 5 prikazuje učestalost u udjelima. Može se dobiti ili izračunavanjem

ili pretvaranjem postotaka u dionice. Prilikom proračuna podaci u decimalnom obliku moraju biti prikazani sa tačnošću do 3 decimale. Ovo poboljšava tačnost proračuna i proizvodnju odgovarajućih konačnih podataka. Dakle, zbir frekvencija u procentima treba da bude jednak 100%, a u razlomcima – jednak 1.

Kolona 6 tabele 3.2 pokazuje apsolutne vrednosti gustine. Proračun je izvršen prema formuli 3.2. Dakle, za prvu grupu apsolutna gustina će biti jednaka

Ako se frekvencija () uzima iz kolone 3, tada se vrijednost intervala () definira kao razlika između gornje granice (3.9) i donje granice (3.1) intervala prve grupe, tj. . Apsolutna gustina za druge grupe izračunava se na sličan način. Nakon izvršenih proračuna, potrebno je dati im ekonomsku interpretaciju. Tako, na primjer, apsolutna gustina prve grupe ukazuje na to za svaku tisuću rubalja. promet u prvoj grupi je 5 preduzetnika.

Kolona 7 tabele 3.2 prikazuje vrednosti relativne gustine. Proračun je izvršen prema formuli 3.3. Dakle, za prvu grupu će relativna gustina biti jednaka

Relativna gustina se izračunava na sličan način za druge grupe. Relativna gustina prve grupe govori da je udio preduzetnika koji dolaze na svaku hiljadu prometa u prvoj grupi 0,147.

Kolona 2 tabele 3.3 prikazuje promet u obliku intervala, au koloni 3 promet u obliku diskretnih vrednosti. Za prvu grupu, diskretna vrijednost se izračunava na sljedeći način

Promet se obračunava na isti način kao diskretna vrijednost i za druge grupe.

Često tokom analize varijantne serije postoji potreba za razumijevanjem promjene u obimu populacije kada se mijenjaju (uglavnom rastućim redoslijedom) vrijednosti karakteristike. Za to se koriste koncepti kao što su akumulirane frekvencije ili akumulirane frekvencije. Akumulirane frekvencije ( )je zbir frekvencija od prvog reda do određenu vrijednost sign inclusive. Akumulirane frekvencije je zbir frekvencija od početka serije do određene vrijednosti atributa, uključujući. Razmotrimo pronalaženje vrijednosti ovih indikatora prema podacima u tabeli. 3.4 U koloni 6 tabele. 3.4 prikazuje akumulirane frekvencije. U prvoj grupi (grupa 1) 4 preduzetnika (grupa 4) imala su promet od 3,1 do 3,9 hiljada rubalja. (kolona 2) ili prosječni promet od 3,5 hiljada rubalja. (gr. 3). Pošto je ovo prva grupa, akumulirana frekvencija, tj. broj preduzetnika će biti jednak 4 (kolona 6). U drugoj grupi, broj preduzetnika sa prometom od 3,9 do 4,7 hiljada rubalja. ili prosječni promet od 4,3 hiljade rubalja. jednako 5 osoba Otuda i akumulirana frekvencija, tj. broj preduzetnika sa prometom od 3,1 do 4,7 hiljada rubalja. ili u proseku od i manje od 4,3 hiljade rubalja, biće jednako 9=4+5. Za treću grupu, akumulirana frekvencija će biti 16=4+5+7, itd. Akumulirana frekvencija se izračunava na sličan način.

Uz primarno grupiranje, sekundarno grupiranje se široko koristi u statistici . Sekundarno grupisanje naziva se formiranjem novih grupa na osnovu prethodno održanih grupacija

Sekundarno grupisanje se koristi za rješavanje različitih problema, od kojih su najvažniji: 1) obrazovanje zasnovano na grupama na osnovu kvantitativnih karakteristika i kvalitativno homogene grupe(tipovi) 2) dovođenje dve (ili više) grupa sa različitim intervalima do jedan tip radi uporedivosti i analize, 3) formiranje većih grupa u kojima se jasnije ispoljava priroda distribucije.

Suština ove tehnike je da se dobiju uporedivi podaci za različite grupe, za koje: numerički sastav grupa (procentualno) je fiksirana na istom nivou u svim grupacijama; Za sve grupe usta takođe postoji jednak broj grupa i isti sadržaj grupnih tabela. Poređenje i poređenje nisu predmet apsolutni pokazatelji po grupama, i relativne vrijednosti, postotak.

Postoje dvije metode sekundarnog grupisanja: 1) transformacijom intervala primarnog grupisanja (obično jednostavnim povećanjem intervala) i 2) dodjeljivanjem svakoj grupi određenog dijela jedinica stanovništva (djelimično pregrupisavanje). Kada se koriste ove metode sekundarnog grupisanja, obično se pretpostavlja da će raspodjela karakteristike unutar intervala biti ujednačena.

Korištenje sekundarnog grupiranja da se dvije grupe sa različitim intervalima dovedu u jedan oblik radi uporedivosti bit će ilustrovane sljedećim primjerom. Za to koristimo podatke iz prvog decembra dva okruga o broju stočarskih radnika (tabela 37.7).

. Tabela 37. Grupisanje farmi u dva okruga prema broju stočarskih radnika

Distrikt I

Distrikt II

grupe farmi po

grupe farmi po

broj zaposlenih, ljudi

na kraju

broj zaposlenih, ljudi

na kraju

Direktni podaci za grupe dva regiona nisu uporedivi, jer su farme raspoređene u grupe u različitim intervalima: 20 ljudi u regionu I i 30 ljudi u regionu II. Broj dodijeljenih grupa također nije isti

Da bismo te dvije grupe doveli u uporediv oblik, izvršit ćemo sekundarno grupisanje. U tu svrhu, materijali će biti pregrupisani u grupe koje su iste za oba regiona: uzmimo interval od 40 ljudi (tabela 38)

Budući da je moguće izvršiti sekundarno grupisanje farmi u regiji I jednostavnim povećanjem intervala (postoji podudarnost donjeg i gornjeg intervala u dvije grupe), koristimo ovu metodu za rješavanje problema.

Objasnimo redoslijed izračunavanja. U prvu grupu gazdinstava sa do 160 zaposlenih biće gazdinstva I i II grupe

. Tabela 38. Sekundarna grupisanja gazdinstava u dva okruga prema broju stočarskih radnika

Udio farmi u ovim grupama u ukupni rezultat iznosiće 16% (12. aprila). U drugu grupu gazdinstava sa radnom snagom od 160 do 200 ljudi biće gazdinstva III i IV grupe, čiji će udeo u ukupnom hektaru iznositi 45% (18 27). Slično se kalkulacije vrše i kod formiranja preostalih decembarskih grupa.

će pregrupisati farme regije II. Budući da povećanje intervala nije pogodno za gazdinstva regiona II i ne rješava problem, koristimo metodu parcijalnog pregrupisavanja podataka po primarnim grupacijama.

Prva, novostvorena grupa gazdinstava u regionu II sa brojem stočarskih radnika do 160 ljudi će u potpunosti obuhvatiti farme primarne grupe sa istim intervalom. Učešće gazdinstava u ovoj grupi je 88%.

Druga grupa gazdinstava sekundarne grupe sa brojem zaposlenih od 160 do 200 ljudi u potpunosti će obuhvatiti gazdinstva II grupe (16%) i neke farme Grupa III. Da bi se odredio dio vlasti koji treba uzeti iz grupe III, potrebno je podijeliti je u podgrupe sa brojem zaposlenih od 190 - 200, 200 - 210, 210 - 220 ljudi. Pokazatelji udjela gazdinstava u ovim podgrupama određuju se srazmjerno podjeli intervala. Veličina intervala koji razmatramo je 30 ljudi i podijeljena je na tri jednaka dijela. Da bi se na vrijednost intervala II grupe (160 - 190 osoba) dobio potreban interval od 160 - 200 osoba, treba dodati jednu trećinu vrijednosti intervala III grupe (190 - 220 osoba) i isti dio farmi ove grupe.

Dakle, druga, novostvorena grupa gazdinstava obuhvatiće 16% gazdinstava druge grupe i jednu trećinu III grupe - 10% (1/3-30), što će iznositi 26% gazdinstava. ukupan broj farme u regiji II

III grupa gazdinstava sekundarne grupe (200 - 240 ljudi) obuhvatiće deo gazdinstava III grupe (190 - 220 ljudi), preostale - 20% (% -30) i dve trećine farmi IV grupa (220 - 250 osoba) - % (% - 21), odnosno 34% od ukupnog broja gazdinstava u regionu I II.

Slični proračuni se provode prilikom formiranja preostalih, novostvorenih grupa farmi: 240 - 280 i više od 280 ljudi. Ako bi se u tabeli 37, uz podatke o udjelu gazdinstava po grupama, dali i podaci o njihovom broju, tada bi se proračuni za novonastale grupe vršili u istim omjerima kao za specifična gravitacija hostv.

Nakon sekundarnog grupisanja primarni materijal postaje uporediv, jer su za dva regiona uzete iste grupe prema broju radnika. Iz podataka u Tabeli 38 jasno je da je distribucija gazdinstava po broju stočarskih radnika u dva regiona značajno različita: u regionu I preovlađuju farme sa do 200 stočara (61% od ukupnog broja farmi). , u regionu II - farme sa brojem stočarskih radnika - više od 200 ljudi (66% od ukupnog broja farmi).

Podaci o svakoj jedinici analizirane populacije dobijeni kao rezultat prve faze statističko istraživanje, karakteriziraju statističko promatranje sa njegovih različitih aspekata, budući da imaju brojne znakove i svojstva koja se mijenjaju u vremenu i prostoru. Da bi se dobila zbirna karakteristika cjelokupnog objekta korištenjem generalizirajućih indikatora, potrebno je sistematizirati i sumirati rezultate koji su dobijeni tokom statističkog posmatranja. To će nam dati priliku da identifikujemo karakteristike i osobine statističke populacije u cjelini i njenih pojedinačnih komponenti, te da otkrijemo obrasce društveno-ekonomskih pojava i procesa koji se proučavaju. Ova sistematizacija se naziva sažetkom primarne statističke građe.

Druga faza statistički radstatistički sažetak – ovo je obrada primarnih podataka kako bi se dobile generalizirane karakteristike fenomena ili procesa koji se proučavaju prema nizu karakteristika koje su bitne za to kako bi se identificirale tipične karakteristike i obrasci svojstveni fenomenu ili procesu u cjelini.

Statistički sažetak je prijelaz sa pojedinačnih podataka na informacije o grupama jedinica i populaciji u cjelini.

Provođenje sažetka uključuje tri faze:

1) prethodna kontrola je provjera podataka;

2) grupisanje podataka prema datim karakteristikama je određivanje izvedenih indikatora;

3) predstavljanje zbirnih rezultata u obliku statističkih tabela koje su pogodan oblik za sagledavanje primljenih informacija.

Semantička konzistentnost statističkih informacija je preliminarna kontrola. U skladu sa statističkim sumarnim programom, radi naknadnog pružanja primljenih informacija u razumljivom obliku, koristi se statističko grupisanje podataka.

Dobijeni rezultati grupisanja prikazani su u obliku tabela grupisanja koje sadrže zbirnu karakteristiku proučavane populacije prema jednoj ili više karakteristika koje su međusobno povezane logikom analize. Postoje jednostavni i složeni sažetci. Podaci o pojedinim jedinicama sumirani su kao cjelina bez podjele u homogene grupe. Rezultati jednostavnog statističkog sažetka namijenjeni su daljoj obradi materijala, a jednostavan sažetak ima i samostalnu kognitivnu vrijednost.

Jednostavan statistički sažetak je operacija za izračunavanje opštih konačnih i grupnih podataka za skup jedinica posmatranja i organizovanje ovog materijala u tabele.

Jednostavan statistički sažetak daje nam mogućnost da odredimo broj jedinica populacije koja se proučava i obim karakteristika koje se proučavaju, ali nam stoga jednostavan sažetak ne daje predstavu o integritetu sastava populacije koja se proučava. studirao.

Ako su jedinice populacije podijeljene u homogene grupe, onda se zbrojevi izračunavaju za svaku grupu, a zatim za cijelu populaciju u cjelini, takav statistički sažetak se naziva složenim. Složeni sažetak omogućava nam da proučavamo sastav populacije i identificiramo utjecaj nekih karakteristika na druge, odnosno da otkrijemo obrasce svojstvene datoj populaciji.

Kompleksni statistički sažetak je kompleks operacija. uključujući distribuciju jedinica posmatranja društveno-ekonomskog fenomena ili procesa koji se proučava u grupe, sastavljanje sistema indikatora za karakterizaciju tipičnih grupa i podgrupa proučavanog skupa fenomena, brojanje broja jedinica i rezultata u svakoj grupi i podgrupe i prikaz rezultata ovog rada u obliku statističkih tabela. Na osnovu sveobuhvatnog teorijska analiza suštinu i sadržaj fenomena i procesa koji se proučavaju, vrši se statistički sažetak. Program i plan izvođenja statističkog sažetka osigurava pouzdanost i valjanost njegovih rezultata.

Statistički zbirni program sadrži listu grupa u koje se skup jedinica statističkog posmatranja može podijeliti ili podijeliti, kao i sistem indikatora koji karakterišu proučavani skup pojava i procesa u cjelini i pojedinačnim dijelovima. Program statističkog sažetka zavisi od ciljeva i zadataka studije. Razvoj programa uključuje sljedeće faze:

1) odabrana je karakteristika grupisanja da bi se formirale homogene grupe;

2) utvrđuje se redosled formiranja i broj grupa;

3) sistem se razvija statistički pokazatelji karakterizirati grupe i objekt u cjelini;

4) statistički izgledi tabela su kreirani da daju zbirne rezultate.

Zajedno sa statističkim zbirnim programom izrađuje se plan njegove implementacije. Plan mora sadržavati podatke o redoslijedu, vremenu i tehnici izvođenja rezimea, njegovim izvršiocima, postupku i pravilima oblikovanja njegovih rezultata u obliku tabela.

Sažetak takođe može biti decentralizovan ili centralizovan.

Decentralizovani statistički sažetak- ovo je način sažimanja materijala koji se odvija odozdo prema gore duž hijerarhijske lestvice upravljanja i obrađuje se u svakoj fazi. Obrada podataka se vrši lokalno, odnosno izvještaje preduzeća sastavljaju statistički organi subjekata Ruska Federacija. Dobijeni rezultati se šalju Državnom komitetu za statistiku Ruske Federacije, a zatim se prikazuju konačni pokazatelji u cjelini za društveno-ekonomsku situaciju u zemlji.

Centralizirani statistički sažetak je metoda u kojoj su svi primarni podaci dobijeni kao rezultat statističkog posmatranja koncentrisani u jednom centralna organizacija i obrađuju se od početka do kraja.

Prema tehnici izvođenja statistički sabirci mogu biti mehanizovani (pomoću elektronskih računara) i ručni.

2. Suština i klasifikacija grupa

Naučno zasnovana distribucija u grupe omogućava izvođenje ispravnih zaključaka o populaciji koja se proučava i procesima koji se u njoj odvijaju.

Principi naučnog grupisanja izloženi su u radovima V. I. Lenjina. Statističko grupisanje, kako je V. I. Lenjin istakao, nije sporedno pitanje. Zahtijeva sveobuhvatnu socio-ekonomsku analizu fenomena koji se proučavaju, Odlučujuče u statističkom grupisanju ima pravi izbor grupisanje karakteristika u skladu sa ciljevima statističkog istraživanja. Grupisanje treba da se zasniva na najznačajnijim, najvažnijim karakteristikama za problematiku koja se proučava, što će omogućiti da se identifikuju socio-ekonomski tipovi pojava. Sjajan primjer upotrebe statističkih grupacija za identifikaciju socio-ekonomskih tipova je tabela iz djela V. I. Lenjina „Razvoj kapitalizma u Rusiji“.

Statističko grupisanje– Ovo je jedna od glavnih faza izvođenja statističkih istraživanja.

Proces formiranja homogenih grupa zasnovan na podjeli statističke populacije na dijelove ili kombinovanju proučavanih statističkih jedinica u agregat prema karakteristikama specifičnim za njih naziva se statističko grupisanje Najvažnije statistička metoda generalizacije podataka su statistička grupisanja.

Tri glavne vrste problema riješenih korištenjem metode statističko grupisanje:

1) identifikacija socio-ekonomskih tipova pojava;

2) proučavanje strukture fenomena i strukturnih pomaka koji se dešavaju u fenomenu;

3) utvrđivanje odnosa i međuzavisnosti između pojava i znakova koji ove pojave karakterišu. Razlikovati sledeće vrste statističke grupe:

1) tipološki;

2) strukturni;

3) analitičke.

Kvalitativno homogene grupe agregata, odnosno objekata koji su bliski jedan drugom po svojim karakteristikama grupisanja, nazivaju se tipološko grupisanje.

Primjer tipološkog grupisanja je: grupisanje zemljišta prema oblicima vlasništva. Glavnu pažnju u tipološkom grupisanju treba posvetiti identifikaciji tipova i odabiru karakteristike grupisanja. Za izgradnju tipološke grupe potrebno je koristiti kvantitativne i kvalitativne (atributivne) karakteristike.

Grupiranje prema atributu sugerira da broj identificiranih grupa odgovara stvarnom broju gradacija ovog atributa. Na osnovu kvantitativnih kriterijuma potrebno je pravilno postaviti interval grupisanja i odrediti potreban broj grupa. Problem određivanja intervala tipološkog grupisanja rješava se na osnovu identifikacije takvih kvantitativnih granica promjena u karakteristici grupisanja na kojima se pojava mijenja ili dobija novi kvalitet.

U tipološkom grupisanju, broj grupa zavisi od broja postojećih socio-ekonomskih tipova. Društveno-ekonomski tipovi pojava zavise od sastava, strukture homogenih grupa i proučavanja varijacija u karakteristikama unutar populacije istog tipa i grupa istog tipa na osnovu konstrukcije strukturne grupacije. Podjela homogene populacije na određene grupe, koje će dalje karakterizirati strukturu prema određenoj karakteristici grupisanja, naziva se strukturno grupiranje. Ovdje se također razmatraju kvantitativne i atributivne karakteristike. Primjer je grupiranje skladišnih radnika prema kvalifikacijama.

Po atributu, grupe se razlikuju jedna od druge po prirodi atributa. Kvantitativna karakteristika također uključuje određivanje broja grupa i širine intervala.

Glavni zadatak statističkih grupisanja– proučavanje veza i zavisnosti između karakteristika jedinica statističke populacije, koje se rešava konstruisanjem analitičkih grupa. Analitičko grupisanje– ovo je grupisanje koje otkriva odnose i međuzavisnosti između proučavanih društveno-ekonomskih pojava i karakteristika koje ih karakterišu.

Sve karakteristike u statističkoj nauci mogu se podijeliti na faktorske i efektivne. Znakovi koji imaju veliki uticaj na promenu efektivnih znakova nazivaju se faktorijel. Osobine koje se mijenjaju pod uticajem faktorskih osobina nazivaju se efektivno.

Važan zadatak pri konstruisanju analitičkog grupisanja je izbor broja grupa na koje je potrebno podeliti proučavani skup jedinica posmatranja i određivanje njihovih granica.

Zahtjevi koji moraju biti ispunjeni u procesu konstruiranja analitičkih grupa su: svaka grupa koja se proučava mora sadržavati homogene jedinice populacije prema karakteristikama grupisanja, a broj jedinica u svakoj grupi koja se proučava mora biti dovoljan da se dobije statističke karakteristike predmet koji se proučava.

Jednostavno se zove grupisanje, ako je grupa formirana prema samo jednoj osobini. Ako podijelite grupu u podgrupu u skladu s određenim karakteristikama, tada se takva grupa naziva kombinirana.

Kombinacija grupisanje se smatra kada je populacija podijeljena u grupe prema dvije ili više karakteristika grupisanja uzetih u kombinaciji (kombinacijama) jedna s drugom.Kombinirana grupisanja omogućavaju proučavanje jedinica populacije istovremeno prema više karakteristika.

Prilikom proučavanja složenih društveno-ekonomskih pojava i procesa koriste se kombinaciona grupisanja. Da bi se izgradila kombinaciona grupa, potrebno je identifikovati prisustvo dovoljnih veliki broj zapažanja.

Da biste pronašli klaster (u dimenzionalni prostor) objekti (bodovi), moraju se primijeniti multidimenzionalno grupisanje Postoje grupe zasnovane na korištenim informacijama:

1) primarni – proizveden na osnovu početnih podataka dobijenih kao rezultat statističkog posmatranja;

2) sekundarni - ovo je rezultat povezivanja ili rasparčavanja grupe.

3. Principi za građenje grupa

Da biste konstruirali statističke grupe, trebate odabrati karakteristiku grupisanja, zatim odrediti broj grupa u koje je podijeljena statistička populacija koja se proučava i utvrditi granice intervala grupisanja. Za svaku grupu potrebno je pronaći specifične indikatore ili njihov sistem koji treba da karakteriše grupe koje se proučavaju.

Odabir karakteristike grupisanja – kompleksno pitanje u teoriji statističkog grupisanja i statističkih istraživanja općenito. Grupna karakteristika je osnova na kojoj se dijele jedinice populacije odvojene grupe. Tačnost zaključaka statističke studije zavisi od stepena tačnosti karakteristike grupisanja.

Grupa uključuje kvantitativne i atributivne (kvalitativne) karakteristike. Kvantitativne karakteristike obično imaju numerički izraz(na primjer, obim proizvodnje, starost osobe, prihod porodice, itd.). Atributivne karakteristike daju kvalitativnu karakteristiku jedinice stanovništva (na primjer, spol, Porodični status, politička orijentacija osobe i sl.). Odabrane grupe prema atributu u grupisanju moraju se međusobno razlikovati kvalitativne karakteristike sign. Broj grupa na koje je podijeljena statistička populacija ovisi o broju gradacija atributa.

Važno je učiti ekonomska suština fenomen koji se proučava kada se konstruiše grupisanje na osnovu kvantitativnih karakteristika.

Da biste odredili broj grupa, možete koristiti Sturgessovu formulu:

h+ 3,322 ? lg N,

Gdje h– broj grupa;

N– broj populacijskih jedinica;

LGN – decimalni logaritam od N.

Ova formula sugerira da izbor broja grupa objektivno ovisi o veličini populacije. Nakon utvrđivanja broja grupa, rešava se pitanje određivanja intervala grupisanja.

Na osnovu intervala grupisanja moguće je kvantitativno razlikovati neke grupe od drugih i ocrtati granice identifikacije njihovog novog kvaliteta. Interval grupisanja je interval vrijednosti varijabilne karakteristike koji se nalazi unutar određene grupe. Svaki interval ima svoju dužinu (širinu), gornju i donju granicu.

Donja granica intervala je najmanju vrijednost karakteristika u intervalu, a gornja granica intervala je njegova najveća vrijednost. Donja granica prvog intervala se uzima kao najmanja vrijednost atributa u skupu jedinica posmatranja. Gornja granica posljednjeg intervala ne može biti manja od najveća vrijednost karakteristika u skupu jedinica posmatranja.

Širina intervala je razlika između gornje i donje granice. Intervali grupisanja, ovisno o njihovoj širini, mogu biti jednaki ili nejednaki. Nejednake se dijele na progresivno rastuće, progresivno opadajuće, proizvoljne i specijalizirane. Ako se varijacija neke karakteristike manifestira unutar relativno uskih granica i distribucija je ujednačena, tada se grupa gradi u jednakim intervalima.

Vrijednost jednakog intervala određena je sljedećom formulom:

h = R/n = (x max – x min) / n,

gdje jex max,x min – maksimum i minimalna vrijednost karakteristike u agregatu;

n – broj grupa.

Ova formula se zove intervalni korak. Ako je raspon varijacije karakteristike u agregatu velik i vrijednosti karakteristike variraju neravnomjerno, tada se koristi grupiranje s nejednakim intervalima. Nejednaki intervali se mogu dobiti ako konstruisano grupisanje sa jednakim intervalima sadrži grupe koje se ne odražavaju određene vrste pojava ili proces koji se proučava ili ne sadrži ni jednu jedinicu totaliteta, postoji potreba za povećanjem - kombinuje dva ili više malih ili „praznih“ uzastopnih jednakim intervalima. Izbor jednakih ili nejednakih intervala zavisi od stepena ispunjenosti intervala. Intervali grupisanja mogu biti zatvoreni ili otvoreni Zatvoreno intervali su intervali u kojima su navedene gornje i donje granice. Otvoreni intervali imaju samo jednu granicu (gornja je za prvu, donja za posljednju). Ka kvantitativnim karakteristikama može se klasifikovati kao kontinuirana ili diskretna karakteristika. Ako je grupa zasnovana na diskretnom atributu, tada je donja granica i-tog intervala jednaka gornjoj granici i-tog intervala uvećanog za 1.

U grupiranjima koja odražavaju kvalitativne karakteristike i specifičnosti izdvojenih grupa jedinica populacije koja se proučava prema određenoj karakteristici, koriste se specijalizovani intervali. Specijalizovani intervali - to su intervali koji se koriste za razlikovanje od ukupnosti istih tipova po istom kriterijumu u pojavama koje se nalaze u različitim uslovima. Na osnovu uloge koju imaju karakteristike u odnosu između predmeta, procesa ili pojava koje se proučavaju, mogu se podijeliti na faktorske i rezultantne. Faktorske karakteristike utiču na druge karakteristike, a na proizvodne karakteristike utiču druge karakteristike.

Grupe se razlikuju:

  1. Primarni, sastavljen na osnovu primarni materijal prikupljeni tokom posmatranja.
  2. Sekundarni, sastavljen na osnovu primarnih, koristi se u dva slučaja:
    • kada je potrebno reorganizirati male formalne grupe u veće;
    • kada je potrebno dati uporednu ocjenu materijala prikupljenih na različitim mjestima i različitim metodama.
Grupacija zasnovana na dvije ili više karakteristika naziva se - kombinacijski.
Karakteristika po kojoj se razlikuju grupe ili vrste pojava naziva se grupisanje ili osnova grupisanja. Osnova može biti kvantitativna ili atributivna. Atributivno– ovo je znak koji ima ime (na primjer, profesija: krojačica, učiteljica, itd.).

Primjer br. 1. Dostupni su sljedeći podaci o distribuciji trgovačke kompanije po broju zaposlenih u dva regiona.


Build sekundarno grupisanje podaci o distribuciji firmi, preračunavanje podataka iz regiona 1 u skladu sa grupisanjem regiona 2. U kom regionu prosječan broj više radnika?

Rješenje:
Prva grupa “Manje od 5” će uključivati ​​4/5 grupe “1-5”. Tada će broj firmi biti: 6*4/5 = 4,8 ≈ 5.
Grupa “5-10” u potpunosti uključuje grupu “6-10” i dio grupe “1-5”, tj. broj firme će biti 4 + (6-5) = 5
Grupa “11-20” će u potpunosti uključiti grupu “11-15” i dio grupe “16-20”, odnosno ¼*50 = 12,5 ≈ 13.
Grupa “21-30” u potpunosti uključuje grupu “16-20” i grupu “21-25” i grupu “preko 25”. Dobijamo: (50-13) + 20 + 15 = 72


Pronađite prosječan broj zaposlenih:
Za prvu regiju.

Ponderisani prosek: x av = 1960/105 = 18,67

Za drugu regiju.


Ponderisani prosek: x av = 3502,5/117 = 29,94
Tako je u drugoj regiji prosječan broj zaposlenih veći.

Primjer br. 2.
Raspodjela radnika prema radnom stažu

Broj grupeGrupe radnika prema radnom stažu, godineBroj radnika, ljudiBroj radnika kao procenat od ukupnog broja
I2-6 6 30,0
II6-10 6 30,0
III10-14 5 25,0
IV14-18 3 15,0
TOTAL20 100,0

U seriji distribucije, radi jasnoće, karakteristika koja se proučava izračunava se kao postotak. Rezultati primarnog grupisanja su pokazali da 60,0% radnika ima do 10 godina staža, sa podjednakim udjelom od 2-6 godina - 30% i od 6-10 godina - 30%, a 40% radnika ima iskustvo od 10 do 18 godina.
Za proučavanje odnosa između radnog iskustva i rezultata potrebno je izgraditi analitičku grupaciju. U osnovi ćemo uzeti iste grupe kao u distributivnoj seriji. Rezultate grupisanja predstavljamo u tabeli 2.

Tabela 2 - Grupisanje radnika po radnom stažu

Broj grupeGrupe radnika po godinama iskustvaBroj radnika, ljudiProsječno radno iskustvo, godinaIzlaz proizvoda, rub.
UkupnoZa jednog roba
I2-6 6 3,25 1335,0 222,5
II6-10 6 7,26 1613,0 268,8
III10-14 5 11,95 1351,0 270,2
IV14-18 3 16,5 965,0 321,6
UKUPNO:20 8,62 5264 236

Da biste popunili tabelu 2, potrebno je da kreirate radni list 3.

Tabela 3.

br.Grupe radnika prema radnom stažu, godineBroj radnikaIskustvoIzlaz u rub.
1 2 3 4 5
1 2-6 1, 2, 3, 4, 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
Ukupno za grupu:6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
Ukupno za grupu6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
Ukupno za grupu5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
Ukupno za grupu3 49,5 965
Ukupno20 172.4 5264,0

Podjela stubova (4:3); (5:3) tab. 3 dobijamo odgovarajuće podatke za popunjavanje tabele 2. Dakle dalje za sve grupe. Popunjavanjem tabele 2 dobijamo analitičku tabelu.
Nakon što smo izračunali radnu tabelu, upoređujemo konačne rezultate tabele sa podacima uslova problema koji se moraju podudarati. Dakle, pored konstruisanja grupisanja i pronalaženja prosečnih vrednosti, proverićemo i aritmetičku kontrolu.
Analizirajući analitičku tabelu 2, možemo zaključiti da proučavane karakteristike (indikatori) zavise jedna od druge. Sa povećanjem radnog iskustva, proizvodnja po radniku stalno raste. Proizvodnja radnika četvrte grupe iznosi 99,1 rublje. viši od prvog ili 44,5%, razmatrali smo primjer grupisanja prema jednoj osobini. Ali u velikom broju slučajeva, takvo grupisanje nije dovoljno za rješavanje zadatih problema. U takvim slučajevima prelaze na grupisanje prema dvije ili više karakteristika, tj. na kombinacijsku. Izvršimo sekundarno grupisanje podataka na osnovu prosječne proizvodnje.
Svaku grupu karakterišemo po broju radnika, prosečnom radnom stažu, prosečnom učinku – ukupno i po radniku kalkulacije su prikazane u tabeli 4.

Tabela 4 - Grupisanje radnika prema radnom stažu i prosječnom učinku

br.Radničke grupeBroj radnika, ljudiAvg. radno iskustvo, godProsječna proizvodnja, rub.
iskustvomprema prosječnoj proizvodnji nast. u rub.Ukupnopo jednom radniku
1 2-6 200,0-250,0 4 2,5 835,0 208,75
Ukupno za grupu6 3,25 1335,0 222,5
2 6-10 200,0-250,0 - - - -
3 10-14 200,0-250,0 1 12,5 230,0 230,0
Ukupno za grupu5 11,96 1351,0 270,2
4 14-18 200,0-250,0 - - - -
Ukupno za grupu3 16,5 965,0 321,6
Ukupno po grupama200,0-250,0 5 3,0 1065,0 213,0
Ukupno20 8,62 5264 263,2

Da bismo konstruisali sekundarno analitičko grupisanje na osnovu prosečnog izlaza proizvoda unutar inicijalno kreiranih grupa, odredićemo interval sekundarnog grupisanja, izdvajajući tri grupe, tj. jedan manje nego u originalnoj grupi.
Tada je i=(350-200)/3 = 50 rub.
Nema smisla uzimati više grupa, biće vrlo mali interval, manje je moguće. Konačni podaci za grupu su izračunati kao zbir staža za grupu, poslati za prvih 19, 5 godina podeljeno sa brojem radnika - 6 ljudi, dobijamo 3,25 godina.
Podaci iz tabele pokazuju da izlaz proizvoda direktno zavisi od radnog iskustva.

Ponekad početno grupisanje ne identifikuje jasno prirodu distribucije populacijskih jedinica, ili da dovede grupisanje na uporedivi tip kako bi se izvršila komparativna analiza, potrebno je donekle promijeniti postojeće grupisanje: spojiti prethodno identificirane relativno male grupe u manji broj većih tipičnih grupa ili promijeniti granice prethodnih grupa kako bi grupisanje bilo uporedivo s ostalima.