Primjer sekundarnog grupiranja. Sekundarno grupisanje

Grupacije izgrađene u istom vremenskom periodu, ali za različite objekte ili, obrnuto, za jedan objekat, ali za dva različiti periodi vrijeme možda neće biti uporedivo zbog drugačiji broj odabrane grupe ili različitost granica intervala.

Koristi se sekundarno grupisanje ili pregrupisavanje grupisanih podataka najbolje performanse fenomena koji se proučava (u slučaju kada početno grupisanje ne otkriva jasno prirodu distribucije populacijskih jedinica), ili da se grupe dovedu na uporediv tip kako bi se komparativna analiza.

Sekundarno grupisanje- operacija formiranja novih grupa na osnovu prethodno izvršenog grupisanja.

Postoje dva načina za formiranje novih grupa. Prvi, najjednostavniji i najčešći način je promjena (češće povećanje) početnih intervala. Druga metoda se zove zajedničko pregrupisavanje i sastoji se u formiranju novih grupa na osnovu dodjele svakoj grupi određeni udio agregatne jedinice. Ilustrujmo tehniku sekundarnog grupisanja na sljedećem primjeru.

Distribucija zaposlenih u preduzeću prema visini prihoda

Pregrupisaćemo podatke, formirajući nove grupe u intervalima do 5, 5-10, 10-20, 20-30, preko 30 hiljada rubalja.

Prvo nova grupa obuhvatit će cijelu prvu grupu zaposlenih i dio druge grupe. Da biste formirali grupu do 5 hiljada rubalja, potrebno je uzeti 1,0 hiljada rubalja iz intervala druge grupe. Vrijednost intervala ove grupe je 6,0 hiljada rubalja. Stoga je potrebno od toga uzeti 1/6 (1.0:6.0) dijela. Sličan udio u novoformiranoj prvoj grupi mora se uzeti i od broja zaposlenih, odnosno 20 x 1/6 = 3 osobe. Tada će u prvoj grupi biti radnika: 16 + 3 = 19 ljudi.

Drugu novu grupu čine radnici druge grupe minus oni koji su raspoređeni u prvu, odnosno 20-3 = 17 ljudi. Novoformirana treća grupa obuhvatiće sve zaposlene iz treće grupe i dio zaposlenih iz četvrte. Da biste odredili ovaj dio iz intervala 18-30 (širina intervala je 12), potrebno je prethodnom dodati 2,0 (tako da je gornja granica intervala jednaka 2,0 hiljada rubalja). Stoga je potrebno uzeti dio intervala jednak . U ovoj grupi ima 74 osobe, tako da trebamo uzeti 74x (1:6) = 12 ljudi. Nova treća grupa će uključivati 44 + 12 = 56 osoba. Novoformirana četvrta grupa će uključivati 74-12 = 62 osobe koje su ostale iz prethodne četvrte grupe. Petu novoformiranu grupu činiće radnici iz pete i šeste prethodne grupe: 37 + 9 = 46 osoba.

Tema 3. STATISTIČKI SAŽETAK I GRUPE PODATAKA.

Rezime zadataka i sadržaja

Statistički sažetak je naučno organizovana obrada materijala statističko posmatranje. Svrha sažetka je da se na osnovu sažetog materijala dobiju generalizujući statistički pokazatelji koji odražavaju suštinu društveno-ekonomskih pojava.

Statistički sažeci se razlikuju na više načina:

Prema složenosti gradnje Sažetak može biti jednostavan ili složen. Ako predstavlja ukupni rezultati za proučavanu populaciju u cjelini bez ikakve preliminarne sistematizacije prikupljenog materijala – ovo jednostavan sažetak .Kompleksni sažetak predstavlja kompleks operacija, uključujući grupisanje jedinice posmatranja, prebrojavanje zbroja za svaku grupu i za sve, i predstavljanje grupisanja i zbirnih rezultata u obliku statističkih tabela.

Po načinu razvoja sažeci su podeljeni na centralizovano , kada su svi podaci koncentrisani u jednoj organizaciji i sumirani prema razvijenoj metodologiji (koristi se za obradu materijala jednokratnih statističkih opservacija). At decentralizovano generalizacija materijala se vrši od vrha do dna duž hijerarhijske lestvice upravljanja, podvrgavajući se odgovarajućoj obradi na svakom od njih (koristi se za obradu statističkog izveštavanja).

Prema tehnici izvođenja izvještaj je podijeljen na mehanizovani i ručni.

Dakle, statistički sumar je sistematizacija i grupisanje digitalnih podataka, karakteristike formiranih grupa, sistem indikatora, izračunavanje odgovarajućih zbroja i prikaz rezultata rezimea u obliku tabela i grafikona.

Za vođenje rezimea izrađuje se plan koji utvrđuje organizaciona pitanja: ko i kada će sve operacije izvoditi, postupak za njegovo izvođenje i sastav informacija koje se objavljuju u periodičnoj štampi.

Metoda grupisanja

Početne informacije u sumarnoj fazi se sistematiziraju, formiraju se zasebni statistički agregati, tj. statističko grupisanje.

grupisanje - ovo je podjela stanovništva na grupe koje su na neki način homogene.

Poseban tip grupisanja je klasifikacija. Zasniva se na najbitnijim karakteristikama koje se vrlo malo mijenjaju (na primjer, klasifikacija industrija Nacionalna ekonomija, klasifikacija osnovnih sredstava).

Karakteristične karakteristike klasifikacije:

Osnova je kvalitativni znak.

Standardne su.

Oni su stabilni.

Odnosno, klasifikacija je legalizovana, opštepriznata, normativna grupa. Klasifikacija je osnova grupisanja.

Grupni znak- ovo je znak kojim se spajaju pojedinačne jedinice stanovništva homogene grupe. Oni su atributivni kvalitativna karakteristika i kvantitativne.

Klasifikacija karakteristika grupisanja

Prema formi izražavanja

atributivno , koji nemaju kvantitativni izraz (profesija, obrazovanje);

kvantitativno : 1)diskretno(diskontinuirano), čije su vrijednosti izražene samo kao cijeli brojevi (broj soba, djece); 2) kontinuirano, vrijednosti, koje mogu biti cijeli brojevi ili razlomci.

Prema prirodi fluktuacije

alternativa , koje neke jedinice posjeduju, a druge ne (kvalitet);

imati mnogo kvantitativne vrijednosti

Prema ulozi obilježja u odnosu proučavanih pojava

faktorijel, utiču na druge znakove;

produktivan, pod uticajem drugih

Da biste pronašli broj grupa, koristite Sturgessovu formulu

n \u003d 1 + 3,322 LGN,

gdje je N broj elemenata populacije.

Prema ovoj formuli, izbor broja grupa zavisi od veličine populacije.

Nedostatak formule je što njena primjena daje dobre rezultate ako se populacija sastoji od velikog broja jedinica i distribucija jedinica prema atributu koji leži u osnovi grupisanja je blizu normalnoj.

Drugi način određivanja broja grupa zasniva se na upotrebi indikatora standardne devijacije (). Proračunato je

gdje je - prosječna vrijednost osobine u populaciji, koja je određena formulom;

E vrijednost varijabilne karakteristike;

prosjek standardna devijacija.

Ako je vrijednost intervala 0,5, tada se populacija dijeli u 12 grupa, a kada je vrijednost intervala 2/3 i tada se populacija dijeli na 9 odnosno 6 grupa.

Ako se podijeli u 6 grupa, dobiju se sljedeći intervali:

Ove metode ne garantuju da se neće formirati "prazne" ili male grupe. “Praznim” se smatraju grupe u koje nije upala niti jedna jedinica stanovništva. Prisustvo takvih intervala ukazuje na to da je grupisanje izgrađeno pogrešno.

Nakon određivanja broja grupa, treba odrediti intervale grupisanja.

Interval- predstavlja interval između maksimalne i minimalne vrijednosti osobine u grupi.

Svaki interval ima svoju vrijednost, gornju i donju granicu ili barem jednu od njih.

Donja granica intervala je najmanja vrijednost atributa u intervalu, a gornja granica je maksimalna vrijednost atributa u njemu. Vrijednost intervala je razlika između gornje i donje granice intervala.

Intervali grupisanja u zavisnosti od njihove veličine su jednaki i nejednaki. Nejednake se dijele na progresivno rastuće, progresivno opadajuće, proizvoljne i specijalizirane.

Ako se varijacija osobine manifestira u relativno uskim granicama i distribucija je manje-više ujednačena, tada se gradi grupiranje u redovnim intervalima .

Hmax - Xmin

h=----------------;

Prije određivanja raspona varijacije, preporučuje se da se iz populacije isključe anomalna opažanja.

Vrijednost dobivena formulom se zaokružuje. To je intervalni korak.

Postoje sljedeća pravila za određivanje koraka intervala.

Ako je vrijednost intervala vrijednost koja ima jedno decimalno mjesto (na primjer, 0,66; 1,372; 5,8), tada je preporučljivo zaokružiti dobivene vrijednosti na desetine i koristiti ih kao korak intervala. (0,7; 1,4; 5,8).

Kada izračunata vrijednost intervala ima dvije značajne cifre prije decimalnog zareza i nekoliko decimalnih mjesta, tada se ova vrijednost mora zaokružiti na

Na primjer, X max = 180, X min = 80, n = 5.

h \u003d (Xmax - Xmin) / n;

h = (180 - 80) / 5 \u003d 20;

Dakle, dobili smo sljedeće intervale

80-100; 100-120; 120-140; 140-160; 160-180.

b) nejednako, kada se širina intervala postepeno povećava, a gornji interval često uopće nije zatvoren. Nejednaki intervali u ekonomskoj praksi se češće koriste.

u) otvoren, kada postoji samo gornji ili donja linija. Potreba za otvorenim intervalima nastaje zbog širenja njegovih kvantitativnih vrijednosti, što zahtijeva formiranje mnogih grupa, ako ih razdvoje obje granice.

G) zatvoreno kada postoji i donja i gornja granica. Ako su nedjeljive jedinice, ljudi, onda 1-3, 4-7, 8-11. Uz kontinuiranu promjenu atributa, isti broj služi kao gornja i donja granica dvije susjedne grupe (90-120, 120-150, 150-180).

Ovakvom konstrukcijom intervala, pitanje dodjeljivanja jedinica objekta posmatranja grupama u praksi se rješava na dva načina: po principu "inkluzivno" i "isključivo".

Aplikacija ovisi o obliku intervala pisanja, posebno prve i posljednje grupe.

180 i više - isključivo - 180 je uključeno u posljednje

preko 180 - uključujući - 180 je uključeno u prethodni.

U praksi se javlja i jedno i drugo, ali se prednost daje principu „isključivo“.

Srednja vrijednost intervala određena je nekoliko metoda.

Zbrajamo gornju i donju granicu intervala i dijelimo sa 2.

Sredina 2. intervala plus vrijednost intervala.

Sredina 2. intervala minus vrijednost intervala (za otvorene).

Na sredinu pretposljednjeg intervala dodajemo vrijednost intervala (za otvorene).

Vrste statističke grupe

tipološko grupisanje. Suština: Odabir glavnih tipova iz skupa karakteristika koje karakterišu fenomene koji se proučavaju u kvalitativno homogene. Ako a atribut, tada je broj grupa određen svojstvima fenomena koji se proučava. Na primjer, grupisanje stanovništva prema starosti i polu, broju godina, PPP, uključujući radnike, studente, inženjere, zaposlene, MOS. Izbor tipova na osnovu kvantitativno svojstvo sastoji se u definiranju grupa uzimajući u obzir vrijednosti proučavanih karakteristika. Primjer: vrtić 0-2; predškolska ustanova 3-6; škola 7-17; radno sposoban 16-54 za žene i 16-59 za muškarce.

Tipološke grupe se široko koriste u proučavanju društveno-ekonomskih pojava i procesa.

Grupisanje po obliku vlasništva 1998. godine

Strukturno grupisanje. Ovo su grupe koje se koriste za proučavanje strukture proučavane populacije. Uglavnom se strukturne grupe stvaraju na osnovu formiranja kvalitativno homogenih grupa. Uz pomoć ovakvih grupisanja mogu se proučavati: sastav stanovništva prema polu, starosti, mjestu stanovanja, sastav preduzeća prema broju zaposlenih i vrijednost osnovnih sredstava.

Grupiranje stanovništva Rusije prema mjestu stanovanja

za 1959-1994

Analitičko grupisanje (faktorsko). Koristi se za proučavanje odnosa između pojedinačnih karakteristika. Na primjer, između radnog iskustva i kvalifikacija, radnog čina i obrazovanja. Karakteristike analitičkog grupisanja: prvo, kao osnova se uzima faktorski atribut; drugo, svaku odabranu grupu karakteriziraju prosječne vrijednosti rezultirajućeg atributa.

Grupisanje komercijalnih banaka u Rusiji prema iznosu bilansne aktive

Grupa banaka prema iznosu aktive u bilansu stanja, miliona rubalja	Broj banaka, jedinica	Prosjek po banci
	Broj banaka, jedinica	broj zaposlenih, ljudi	Bilansna dobit, milijarde rubalja




50.000 ili više

Kombinovano grupisanje. To je formiranje grupa prema dvije ili više karakteristika, uzetih u određenoj kombinaciji. Istovremeno, atributivni znakovi se nalaze prvi u određenom nizu, na osnovu logike odnosa indikatora. Na primjer, grupe se formiraju prema oblicima upravljanja, dijele se u podgrupe prema stepenu rentabilnosti ili produktivnost rada, povrat na imovinu.

Ovisno o broju znakova koji se nalaze u njihovoj osnovi, dijele se na:

Jednostavno je grupisanje zasnovano na jednom atributu.

Kompleks grupisanje se zasniva na dvije ili više karakteristika

Sekundarno grupisanje

sekundarno grupisanje nazvano preuređivanje već grupisanog materijala.

Njoj prilaze:

Kad izađem veliki broj moraju se dobiti prvobitno formirane grupe manji broj većih.

Kada je, radi poređenja, potrebno različito grupiranu građu dovesti u uporedivu formu.

Statističke distribucijske serije

Među jednostavnim grupacijama posebno se izdvajaju distribucijske serije.

Redovi distribucije predstavljaju uredan raspored jedinica proučavane populacije u grupe prema atributu grupisanja.

Redovi distribucije formirani prema kvalitativnim karakteristikama nazivaju se atributivno.

Kada grupišemo niz prema kvantitativnom atributu, dobijamo varijacione linije.

Varijacijski nizovi su diskretni (diskontinuirani) i intervalni (kontinuirani).

Varijacijski nizovi se sastoje od dva elementa: varijanti i frekvencije.

Opcija - ovo je zasebna vrijednost varijabilnog atributa, koju uzima u distribucijsku seriju.

Frekvencija ovo je broj pojedinačne varijante ili svake grupe serije varijacija.

Zovu se frekvencije izražene u dijelovima jedinice ili u % ukupne vrijednosti frekvencije. Zbir frekvencija je volumen serije distribucije.

Na primjer, po atributu.

Na primjer, diskretna serija.

	Broj studenata	U % ukupnog

Priroda distribucije u diskretnim serijama je grafički prikazana kao poligon distribucije.

Primjer intervalne serije.

Distribucija radnika po proizvodnji

Izlaz, tr.	Broj radnika	Kumulativna (akumulirana) populacija

Serija intervalne distribucije grafički je predstavljena kao histogram.

U praksi, postoji potreba da se distributivni niz konvertuje u kumulativni redovi, izgrađen na akumuliranim frekvencijama. Mogu se koristiti za definiranje strukturnih prosjeka koji olakšavaju analizu podataka serije distribucije.

Kumulativne frekvencije se određuju sukcesivnim zbrajanjem učestalosti (ili učestalosti) prve grupe ovih indikatora narednih grupa serije distribucije. Kumulati i oživi se koriste za ilustraciju serije distribucije. Za njihovu izgradnju, vrijednosti diskretne karakteristike (ili krajevi intervala) su označene na osi apscise, a inkrementalni zbroji frekvencija (kumulacija) ili frekvencija (ogive) koji odgovaraju vrijednostima ovih karakteristika su označeni na osi ordinata.

Jedan od najvažnijih zahtjeva za statističke distribucijske serije je osigurati njihovu uporedivost u vremenu i prostoru.. Varijacijski nizovi sa jednakim intervalima obezbeđuju ovaj uslov.

Međutim, frekvencije pojedinačnih nejednakih intervala u ovim serijama nisu direktno uporedive. U takvim slučajevima, da biste osigurali potrebnu uporedivost, izračunajte gustina distribucije , tj. odrediti koliko jedinica u svakoj grupi ima po jedinici vrijednosti intervala.

Grupe trgovina po prometu, tr.	Broj prodavnica	Vrijednost intervala, tr.	Gustina distribucije, jedinice (1:2)

Poređenje frekvencija pojedinačne grupe pokazuje da najčešće postoje prodavnice sa intervalom od 250-450 tr.

Prilikom crtanja distribucije varijantne serije s nejednakim intervalima, visina pravokutnika se određuje proporcionalno ne frekvencijama, već pokazateljima gustoće distribucije vrijednosti proučavane osobine u odgovarajućim intervalima.

Statističke tabele

Rezultati sumiranja i grupisanja materijala opservacija prikazani su u obliku statističkih tabela. Omogućuju vam da materijal predstavite na najprikladniji, kompaktniji, vizualni i racionalniji način.

U statističkim tabelama razlikuju se subjekt i predikat. Predmet -je objekat na koji se upućuje u tabeli, a predstavlja grupe i podgrupe koje karakteriše niz indikatora. Predikat u tabeli su navedeni indikatori uz pomoć kojih se predmet proučava, tj. predmet.

Statističke tabele mogu biti jednostavne ili složene.

To jednostavno uključuju tabele liste u kojima je subjekt lista pojedinačnih objekata.

AT teško U tabelama, predmet je zbirka podijeljena u grupe prema jednoj ili više karakteristika.

Pozivaju se tabele u čijem predmetu postoji grupisanje prema jednom atributu grupa.

Ako u predmetu postoji grupisanje po dvije ili više karakteristika, poziva se tabela kombinacijski.

Na broj složene tablice uključuju i korelacijske i bilansne tabele.

Podjela tabela na proste, grupne i kombinovane tablice zasniva se na stepenu rasparčanosti predmeta. Međutim, predikat se može predstaviti na različite načine.

Ako svi pokazatelji predikata karakteriziraju subjekt zasebno, nezavisno jedan od drugog, onda se takav razvoj predikata naziva jednostavno. Ako se u predikatu jedna osobina kombinira s drugom, onda se takav razvoj predikata naziva kompleks.

Prvi put su statističke tabele korišćene u prezentaciji statističkih podataka 1727. godine u Rusiji od strane I.K. Kirilov u djelu "Cvjetna država Sveruske države"

Upotreba kombinovanih tablica pripada kasnijem periodu (1882.).

Tehničke tačke u pripremi tabela uključuju:

Jasnoća naslova.

Jedinice mjere su navedene u posebnim kolonama.

Duplikati termina se stavljaju u opšte naslove.

Kolone i redovi moraju biti numerisani.

U grupnim i kombinovanim tabelama uvek je potrebno dati ukupan broj kolona i redova.

Brojevi se zaokružuju sa istom preciznošću. Kada jedna vrijednost višestruko premašuje drugu, onda je bolje izražene pokazatelje dinamike ne u %, već u vremenima. Na primjer, umjesto 586%, slijedi 5,9 puta više.

U analitičkim tabelama značaj apsolutnih brojki bi trebao biti najmanji. Kada se obezbede istraživački interesi višecifrenih brojeva, zatim počevši od desne, treba izdvojiti milione, hiljade jedinica. Na primjer, 1458946 rubalja, 1 458 946 rubalja. ili možete zaokružiti na 2-3 cifre 1,46 miliona.

Kada tabela, uz izvještajne podatke, daje podatke o redoslijedu obračuna, tada se rezervišu u obliku fusnota.

U slučaju nepotpunog obima proučavane populacije ili odsustva početnih podataka, svi pojmovi se prvo prikazuju u redu „opći rezultati“, a zatim, nakon objašnjenja, u redu „uključujući“, njihove najvažnije komponente su na listi.

Pojedinačne ćelije možda neće biti popunjene iz sljedećih razloga:

a) "x" - ćelija se uopšte ne popunjava;

b) "..." - nema informacija;

c) "-" - sama pojava je odsutna;

d) 0,0 - tada se pri zaokruživanju s većom preciznošću može pojaviti značajna brojka.

Statistički grafovi

Statistički grafikon - ovo je crtež na kojem su statistički podaci prikazani pomoću uvjetnih geometrijskih oblika (linije, tačke, simboli).

Engleski ekonomista W. Playfair (1731-1798) smatra se osnivačem grafičke metode u statistici. U njegovom djelu “Komercijalni i politički atlas” (1786.) prvi put su korištene metode grafičkog prikaza statističkih podataka (linearni, trakasti, sektorski i drugi dijagrami).

Glavni elementi grafikona uključuju:

Polje grafikona je mjesto gdje se izvršava. Općenito je prihvaćeno da je najoptimalniji za vizualnu percepciju graf napravljen na terenu. pravougaonog oblika sa omjerom od 1:1,3 do 1:1,5 (pravilo "zlatnog presjeka"). Ponekad se koristi i kutija u obliku kvadrata.

Grafička slika - ovo su simbolični znakovi uz pomoć kojih se prikazuju statistički podaci.

Prostorni i razmjerni orijentiri. Prostorni orijentiri odrediti položaj grafičkih slika na polju grafa. Date su koordinatnom mrežom ili konturne linije.Smjerne orijentire - daju grafičkim slikama kvantitativni značaj, koji se prenosi pomoću sistema skala .

Eksplikacija grafikona - ovo je objašnjenje njegovog sadržaja, uključuje naslov grafikona, objašnjenja mjerila, objašnjenja pojedinih elemenata grafičke slike.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Moskovska akademija. S.Yu. Witte

Ekonomski fakultet

Test

Radovi završeni:

student 1. godine,

učenje na daljinu

Vislyaeva M.N.

Moskva grad

Dok radiš kontrolni zadatak Morate to učiniti sekundarno preuređenje za ne složen primjer(sami odaberite primjer) i objasnite kako i pod kojim uvjetima vrijedi takav preračun. Koristeći kompjuterski programi i složeniji primjer, također ukazuju na efekte i karakteristike upotrebe IT-a.

U svom pismenom odgovoru na zadatak, morate:

1. Objasniti odnos između formule za sabiranje varijansi i korelacionog odnosa, objasniti njeno statističko značenje.

2. Poređenje varijacija za dvije različite distribucije sa različitim srednjim vrijednostima, objasniti uslove uporedivosti kada se srednje vrijednosti razlikuju.

3. Dajte najpotpunije objašnjenje značenja granične greške, povežite ga sa konceptom reprezentativnosti uzorka i njegovog traženog volumena.

4. Objasniti odnos između procjene nepoznatih parametara LSM-om i provjere značajnosti rezultata dobivenih kriterijima za testiranje statističkih hipoteza.

Preuređenje prethodno grupisanih statistika naziva se sekundarno grupisanje. Ova metoda se koristi u onim slučajevima kada, kao rezultat početnog grupiranja, priroda distribucije proučavane populacije nije bila jasno izražena.

U ovom slučaju, intervali se povećavaju ili smanjuju. Takođe, sekundarno grupisanje se koristi za dovođenje grupa u uporedivi oblik u različitim intervalima kako bi se uporedile. Razmotrite metode sekundarnog grupiranja na primjeru.

Da biste povećali intervale na osnovu podataka u tabeli 1:

Tabela 1

	Broj prodavnica

Navedeno grupisanje nije dovoljno jasno, jer ne pokazuje jasan i strog obrazac u promjeni prometa po grupama.

Kondenzujmo seriju distribucije, formirajući šest grupa. Nove grupe se formiraju zbrajanjem prvobitnih grupa (tabela 2).

tabela 2

Grupe prodavnica prema prometu za 4. kvartal, hiljada rubalja	Broj prodavnica	Promet za IV kvartal, hiljada rubalja.	Promet u prosjeku za 1 trgovinu, hiljada rubalja.

Sasvim se jasno vidi da što su prodavnice veće, to je i nivo prometa veći.

1. Analitičkim grupiranjem možete izmjeriti vezu koristeći empirijski korelacijski odnos. Ovaj indikator je označen grčkim slovom z (ovo). Zasnovan je na pravilu dekompozicije varijanse, prema kojem je ukupna varijansa s2 jednaka zbroju unutargrupnih i međugrupnih varijansi.

Disperzija efektivne osobine unutar grupe sa relativnom konstantnošću faktora osobine nastaje usled drugih faktora. Ova disperzija se naziva rezidualna. Određuje se formulom:

gdje je y ij vrijednost karakteristike y za i-ta jedinica u j-toj grupi;

J je prosječna vrijednost osobine u j-toj grupi;

n j - broj jedinice j-th grupa;

j = 1, 2, 3, ..., tj.

Unutar grupe varijanse izračunate za pojedinačne grupe se kombinuju u prosečnu varijansu unutar grupe:

Varijanca između grupa se pripisuje faktoru koji se proučava (i faktorima povezanim s njim), pa se ova varijansa naziva faktorijalna. Određuje se formulom

Pravilo za dodavanje varijansi se može napisati:

Empirijski omjer korelacije mjeri koliki je dio ukupne fluktuacije rezultirajućeg atributa uzrokovan proučavanim faktorom. U skladu s tim, izračunava se kao omjer varijanse faktora prema totalna varijansa efektivan znak:

Ovaj indikator uzima vrijednosti u intervalu: što je bliže 1, to je bliža veza, i obrnuto.

Tabela 3. Početni podaci

Tabela 4. Radni list

Prosječni promet \u003d?X * f / f \u003d 17370/51 \u003d 340,58 hiljada rubalja.

Disperzija je:

G2=? f*(X-Xav) 2 / ? f = 38682,36/51 = 758,48

Standardna devijacija:

Koeficijent varijacije je:

V \u003d G / Xav \u003d 27,54 / 758,48 \u003d 0,081; 8,1%.

Koeficijent varijacije je manji od 33%, dakle, populacija je homogena.

Tabela 5. Početni podaci

1) prosječno vrijeme provedeno na putovanju do mjesta rada za radnike = X cf =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41,8 min.

2) izračunavanje varijanse

Disperzija je:

G2=? f odstupanje:

3) Koeficijent * (X-Xav) 2 / ? f = 43160,8 / 420 = 102,8

Srednja kvadratna varijacija je:

V \u003d G / Xav \u003d 10,14 / 41,8 \u003d 0,24; 24%

Koeficijent varijacije je manji od 33%, dakle, razmatrani skup je homogen i prosjek za njega je prilično tipičan.

Okvir za uzorkovanje može se formirati prema kvantitativni atribut statističkim vrijednostima, kao i po alternativnim ili atributnim. U prvom slučaju, generalizirajuća karakteristika uzorka je srednja vrijednost uzorka, označena, au drugom slučaju uzorak vrijednosti, označen sa w. AT stanovništva odnosno: opći prosjek i opći udio r.

Razlike -- i W -- p se nazivaju greškom uzorkovanja, koja je podijeljena greškom registracije i greškom reprezentativnosti. Prvi dio greške uzorka proizlazi iz netačnih ili netačnih podataka zbog nerazumijevanja suštine pitanja, nepažnje matičara prilikom popunjavanja upitnika, obrazaca i sl. Prilično je lako otkriti i popraviti. Drugi dio greške proizlazi iz konstantnog ili spontanog nepoštovanja principa slučajnog odabira. Teško ga je otkriti i eliminirati, mnogo je veći od prvog i stoga mu se posvećuje glavna pažnja.

Isključivo važnu ulogu za opravdanje i primjenu selektivno posmatranje igra zakon velikih brojeva. Upotreba zakona velikih brojeva je da će se, pod određenim uslovima i uz dovoljno veliki obim zapažanja, zbirne karakteristike dobijene na osnovu selektivnog posmatranja malo razlikovati od odgovarajućih karakteristika opšteg punomoćja. Na osnovu toga moguće je, povećanjem veličine uzorka, smanjiti granice moguće greške reprezentativnost, dovesti ih do najmanjih veličina. S druge strane, poznavajući granice grešaka reprezentativnosti, moguće je odrediti potrebnu veličinu uzorka.

Jedan od najvažnijih i najodgovornijih zadataka u organizaciji i provođenju opservacije uzorka je određivanje potrebne veličine uzorka, tj. njegove veličine, što bi osiguralo prijem podataka koji prilično korektno odražavaju svojstva opće populacije koja se proučava.

U tom slučaju treba uzeti u obzir sledeće: 1) sa kojim stepenom tačnosti treba da se dobije granična greška uzorkovanja; 2) kolika treba da bude verovatnoća da će se obezbediti uslovna tačnost rezultata posmatranja uzorka; 3) stepen fluktuacije proučavanih svojstava u proučavanoj opštoj populaciji.

To znači da se potrebna veličina uzorka postavlja u zavisnosti od veličine granične greške uzorkovanja, od vrijednosti koeficijenta pouzdanosti (t) i veličine varijanse.

Metoda procjene parametara linearna regresija, minimizirajući sumu kvadrata odstupanja opažanja zavisne varijable od nepoznate linearna funkcija, naziva se metoda najmanjih kvadrata.

Suština metode leži u činjenici da je kriterij za kvalitet rješenja koje se razmatra je zbir grešaka na kvadrat koji se nastoji minimizirati. Za primjenu ove metode potrebno je izvršiti što je više moguće više mjerenja nepoznate slučajne varijable (što je više - veća je tačnost rješenja) i neki skup predloženih rješenja, od kojih je potrebno izabrati najbolje. Ako je skup rješenja parametriran, tada se mora pronaći optimalna vrijednost parametara.

LSM se koristi u matematici, posebno - u teoriji vjerovatnoće i matematičke statistike. Ova metoda ima najveću primjenu u problemima filtriranja, kada je potrebno odvojiti koristan signal od šuma koji se na njega nanosi. Takođe se koristi u matematička analiza za aproksimaciju datu funkciju više jednostavne funkcije. Još jedno područje primjene LSM-a je rješavanje sistema jednadžbi s brojem nepoznatih manjim od broja jednačina.

Faze testiranja statističkih hipoteza:

Izjava glavne hipoteze H 0 i konkurentske hipoteze H 1 . Hipoteze moraju biti jasno formalizovane u matematičkom smislu.

Postavljanje vjerovatnoće b, koja se naziva nivoom značajnosti i koja odgovara greškama prve vrste, o kojoj će se u budućnosti donijeti zaključak o istinitosti hipoteze.

Izračun statistike kriterija je takav da:

njegova vrijednost zavisi od početnog uzorka;

po njegovoj vrijednosti moguće je izvesti zaključke o istinitosti hipoteze H 0 ;

sama statistika q mora poštovati neki poznati zakon distribucije, pošto q samo po sebi je slučajan.

Izgradnja kritične regije. Podskup takvih vrijednosti razlikuje se od raspona vrijednosti u, koji se može koristiti za procjenu značajnih odstupanja s pretpostavkom. Njegova veličina je odabrana na takav način da vrijedi jednakost. Ovaj skup se naziva kritična regija.

Zaključak o istinitosti hipoteze. Promatrane vrijednosti uzorka se supstituiraju u statistiku u, a pogađanjem (ili ne pogađanjem) kritične regije donosi se odluka da se odbije (ili prihvati) postavljena hipoteza H 0 .

varijacija korelacije varijanse

Hostirano na Allbest.ru

...

Slični dokumenti

Tabela diskretnih vrijednosti uzoraka slučajne varijable na uredan način. Tabela intervala statističke serije relativne frekvencije. Postavljanje empirijske funkcije distribucije i crtanje njenog grafa. Poligon i distribucija slučajne varijable.

praktični rad, dodato 26.07.2012

Numeričke karakteristike za statističke distribucije. Konstrukcija intervalne varijacione serije, poligona frekvencija, grafika funkcije raspodjele uzorka i određivanje srednje vrijednosti uzorka i varijansa uzorka dva načina.

prezentacija, dodano 01.11.2013

Prosječna vrijednost indikatora (aritmetička sredina). Indikatori varijacije - raspon varijacije, prosječna linearna devijacija, standardna devijacija, varijansa, koeficijent varijacije. Maksimalno i minimalna vrijednost statistički indikator.

test, dodano 14.11.2008

Koncept opšte populacije, matematičko očekivanje i disperzija. Osiguravanje slučajnosti i reprezentativnosti uzorka u statističkom planiranju. Diskretne i intervalne varijacione serije, bodovne procjene parametri distribucije osobina.

sažetak, dodan 13.06.2011

Essence uzorak studije. Metode za odabir jedinica u okvir za uzorkovanje. Prosječna i marginalna greška za indikatore srednja veličina i dijeljenje indikatora. Određivanje potrebne veličine uzorka za dati marginalna greška prosječna vrijednost.

prezentacija, dodano 16.03.2014

Oblici, vrste i metode statističkog posmatranja. Vrste grupiranja, njihov interval i učestalost. Struktura niza dinamike. Apsolutno i relativno statistika. Prezentacija uzorka u obliku statističke serije. Tačka i intervalna procjena.

kurs predavanja, dodato 29.11.2013

Konstrukcija intervalnih varijacionih serija po indikatorima. Izračunavanje aritmetičke sredine, moda i medijane, relativne i apsolutni pokazatelji varijacije. Definicija kvantitativne karakteristike distribucije, konstrukcija empirijske funkcije.

seminarski rad, dodan 01.11.2012

Dijagram rasipanja kao tačke na ravni, čije koordinate odgovaraju vrijednostima slučajnih varijabli X i Y, redoslijedu njegove konstrukcije i namjeni. Pronalaženje koeficijenata i crtanje grafa linearne aproksimacije, grafa kvadratne aproksimacije.

seminarski rad, dodan 03.05.2011

Naručivanje početnog odabira vremena rada do kvara. Ispitivanje statistička hipoteza o usklađenosti sa eksponencijalnom distribucijom i Weibullovom distribucijom. Procjena parametara distribucije i pokazatelja pouzdanosti, njene glavne metode i tehnike.

seminarski rad, dodan 22.01.2012

Koncept serije varijacija, statistička distribucija. Empirijska funkcija i glavne karakteristike matematičkog očekivanja varijanse uzorka. Tačka i intervalne procjene distribucije. Teorija hipoteza je analogna teoriji intervala povjerenja.

Grupacije su:

Primarno na osnovu primarni materijal prikupljeni tokom posmatranja.
Sekundarni, sastavljen na osnovu primarnih, koristi se u dva slučaja:
- kada je potrebno reformisati male formalne grupe u veće;
- kada je potrebno dati uporednu ocjenu materijala prikupljenih na različitim mjestima i različitim metodama.

Grupacija sastavljena od dvije ili više karakteristika naziva se − kombinacijski.
Znak po kojem se vrši selekcija grupa ili tipova pojava naziva se grupisanje ili osnova grupisanja. Osnova može biti kvantitativna ili atributivna. Atributivno- ovo je znak koji ima ime (na primjer, profesija: krojačica, učiteljica, itd.).

Primjer #1. Imamo sljedeće podatke o distribuciji trgovačke firme po broju zaposlenih u dva regiona.

Konstruišite sekundarno grupisanje podataka o distribuciji firme ponovnim izračunavanjem podataka regiona 1 prema grupisanju regiona 2. U kom regionu prosječna populacija više radnika?

Rješenje:
Prva grupa "Manje od 5" će uključivati 4/5 grupe "1-5". Tada će broj firmi biti: 6*4/5 = 4,8 ≈ 5.
Grupa "5-10" u potpunosti uključuje grupu "6-10" i dio grupe "1-5", tj. broj firme će biti 4 + (6-5) = 5
Grupa "11-20" u potpunosti će uključivati grupu "11-15" i dio grupe "16-20", odnosno ¼ * 50 \u003d 12,5 ≈ 13.
Grupa "21-30" u potpunosti obuhvata grupu "16-20" i grupu "21-25", te grupu "preko 25". Dobijamo: (50-13) + 20 + 15 = 72

Pronađite prosječan broj zaposlenih:
za prvu regiju.

Ponderisani prosek: x sr = 1960/105 = 18,67

za drugu regiju.

Ponderisani prosek: xav = 3502,5/117 = 29,94
Tako je u drugoj regiji prosječan broj zaposlenih veći.

Primjer #2.
Raspodjela radnika prema radnom stažu

broj grupe	Grupe radnika prema radnom stažu, godine	Broj radnika, osoba	Broj radnika kao procenat od ukupnog broja
I	2-6	6	30,0
II	6-10	6	30,0
III	10-14	5	25,0
IV	14-18	3	15,0
TOTAL		20	100,0

U seriji distribucije, radi jasnoće, osobina koja se proučava izračunava se kao procenat. Rezultati primarnog grupisanja pokazali su da 60,0% radnika ima iskustvo do 10 godina, a podjednako od 2-6 godina - 30% i od 6-10 godina - 30%, a 40% radnika ima iskustvo 10 do 18 godina.
Za proučavanje odnosa između radnog iskustva i rezultata potrebno je izgraditi analitičku grupaciju. U osnovi uzimamo iste grupe kao u distributivnoj seriji. Rezultati grupisanja prikazani su u tabeli 2.

Tabela 2 - Grupisanje radnika po radnom stažu

broj grupe	Grupe radnika po godinama iskustva	Broj radnika, osoba	Prosječno radno iskustvo, godina	Razvoj proizvoda, rub.
broj grupe	Grupe radnika po godinama iskustva	Broj radnika, osoba	Prosječno radno iskustvo, godina	Ukupno	Za jednog radnika.
I	2-6	6	3,25	1335,0	222,5
II	6-10	6	7,26	1613,0	268,8
III	10-14	5	11,95	1351,0	270,2
IV	14-18	3	16,5	965,0	321,6
UKUPNO:		20	8,62	5264	236

Za popunjavanje tabele 2. potrebno je sastaviti radnu tabelu 3.

Tabela 3

br. p / str	Grupe radnika prema radnom stažu, godine	Broj radnika	Iskustvo	Proizvodnja u rub.
1	2	3	4	5
1	2-6	1, 2, 3, 4,	2,0; 2,3; 3,0; 5,0; 4,5; 2,7	205, 200, 205, 250, 225, 250
Ukupno za grupu:		6	19,5	1335
2	6-10	5, 6, 8, 13, 17, 19	6,2; 8,0; 6,9; 7,0; 9,0; 6,5	208, 290, 270, 250, 270, 253
Group Total		6	43,6	1613
3	10-14	9, 12, 15, 16, 18	12,5; 13,0; 11,0; 10,5; 12,8	230, 300, 287, 276, 258
Group Total		5	59,8	1351
4	14-18	11, 20, 14	16, 18, 15,5	295, 320, 350
Group Total		3	49,5	965
Ukupno		20	172.4	5264,0

Podjela grafikona (4:3); (5:3) tab. 3 dobićemo relevantne podatke za popunjavanje tabele 2. Dakle dalje za sve grupe. Popunjavajući tabelu 2. dobijamo analitičku tabelu.
Nakon izračunavanja radne tabele, upoređujemo konačne rezultate tabele sa datim uslovima problema, oni se moraju podudarati. Tako ćemo pored građenja grupacija, pronalaženja prosječnih vrijednosti, provjeriti i aritmetičku kontrolu.
Analizirajući analitičku tabelu 2, možemo zaključiti da proučavane karakteristike (indikatori) zavise jedna od druge. Sa porastom radnog iskustva, učinak po radniku se stalno povećava. Razvoj radnika četvrte grupe za 99,1 rubalja. viši od prvog ili za 44,5%, razmatrali smo primjer grupisanja prema jednom atributu. Ali u nizu slučajeva takvo grupisanje je nedovoljno za rješavanje postavljenih zadataka. U takvim slučajevima prelaze na grupisanje prema dva ili više obilježja, tj. na kombinaciju. Napravimo sekundarno grupisanje podataka o prosječnom izlazu.
Svaku grupu karakterišemo brojem radnika, prosečnim radnim iskustvom, prosečnom proizvodnjom – ukupno i po radniku, kalkulacije su prikazane u tabeli 4.

Tabela 4 - Grupisanje radnika prema radnom stažu i prosječnom učinku

br. p / str	Radničke grupe		Broj radnika, osoba	Avg. radno iskustvo, god	Prosječan učinak, rub.
br. p / str	po stažu	prema prosječnoj proizvodnji prod. u rubljama	Broj radnika, osoba	Avg. radno iskustvo, god	Ukupno	za jednog radnika.
1	2-6	200,0-250,0	4	2,5	835,0	208,75
Group Total			6	3,25	1335,0	222,5
2	6-10	200,0-250,0	-	-	-	-
3	10-14	200,0-250,0	1	12,5	230,0	230,0
Group Total			5	11,96	1351,0	270,2
4	14-18	200,0-250,0	-	-	-	-
Group Total			3	16,5	965,0	321,6
Ukupno po grupama		200,0-250,0	5	3,0	1065,0	213,0
Ukupno			20	8,62	5264	263,2

Za izgradnju sekundarnog analitičkog grupisanja na osnovu prosječne proizvodnje proizvoda unutar inicijalno kreiranih grupa, određujemo interval sekundarnog grupisanja, izdvajajući tri grupe, tj. jedan manje nego u originalnoj grupi.
Tada je i=(350-200)/3 = 50 rubalja.
Nema smisla uzimati više grupa, bit će vrlo mali interval, manje je moguće. Konačni podaci za grupu su izračunati kao zbir staža za grupu, poslatih za prvih 19, 5 godina podijeljen sa brojem radnika - 6 ljudi, dobijemo 3,25 godina.
Podaci u tabeli pokazuju da razvoj proizvoda direktno zavisi od radnog staža.

Ponekad početno grupisanje ne otkriva jasno prirodu distribucije jedinica stanovništva, ili da bi se grupe dovele na uporediv tip u svrhu provođenja komparativne analize, potrebno je donekle promijeniti postojeće grupiranje: kombinovati prethodno identifikovali relativno male grupe u mali broj većih tipičnih grupa ili promenili granice prethodnih grupa, kako bi grupisanje bilo uporedivo sa ostalima.

Grupisanje podataka vrši se u skladu sa zbirnim programom kako bi se dobijene informacije naknadno predstavile na razumljiv način.

grupisanje- ujedinjenje jedinica stanovništva u neke grupe koje imaju svoje karakteristike, zajedničke karakteristike i slične veličine proučavane osobine.

Rezultati grupisanja su prikazani u obliku grupisane tabele koje čine informacije vidljivim. Tabela sadrži sažetak numerička karakteristika proučavane populacije prema jednoj ili više bitnih karakteristika, međusobno povezanih logikom analize.

Primjer 5.2. Osnova tabele grupisanja

Naslov tabele (opći naslov)

Tabela grupisanja sadrži tri vrste naslova: opšte, gornje i bočno. Naslovi tabela treba da budu kratki i da opisuju sadržaj indikatora.

Opšti naslov odražava sadržaj cijele tabele, ukazujući na koje mjesto i vrijeme se odnosi. Nalazi se iznad rasporeda u sredini i predstavlja vanjsko zaglavlje. Gornji naslovi karakterišu sadržaj kolona (predikatnih naslova), a bočni naslovi (predmetni naslovi) karakterišu redove. Predmet statističke tabele- objekt karakteriziran brojevima. Predikat- sistem indikatora koji karakteriše objekat proučavanja, tj. predmet. Treba izbjegavati pojavu ćelija u kojima ne može biti početnih podataka. U ćelijama u kojima nema podataka zbog nepotpunosti pozadinske informacije pravite posebne napomene.

Primjer 5.3. Primjer tablice grupisanja

Stav studenata Fakulteta GISES-a prema smanjenju veličine stipendije (na osnovu rezultata studije iz januara 1999. godine)

Na ovaj način, grupisanje- ovo je podjela jedinica stanovništva u grupe prema odabranim različitim karakteristikama.

Grupacije se razlikuju po:

Poslovi sistematizacije podataka;

Broj znakova za grupisanje;

korištene informacije.

Prema zadacima sistematizacije podataka razlikuju se: tipološki, strukturalni i analitički.

Tipološke grupe su dizajnirane da identifikuju kvalitativno homogene grupe populacija, tj. objekti koji su istovremeno bliski jedni drugima po svim karakteristikama grupisanja. Na primjer, grupisanje gradskih preduzeća prema obliku vlasništva. Tipološko grupisanje deli heterogeni skup jedinica posmatranja u kvalitativno homogene grupe (klase, vrste pojava). Prilikom njegove konstruisanja, kvantitativne i atributivne karakteristike mogu se koristiti kao karakteristike grupisanja.

Strukturne grupe su podjela homogene populacije na grupe koje karakteriziraju njenu strukturu prema određenoj osobini grupisanja. Na primjer, grupiranje radnika u radnji prema kvalifikacijama. Drugi primjer strukturnog grupisanja je grupisanje privrednih sektora u gorivo i energetiku, petrohemiju, agroindustrijski kompleks, rudarstvo, telekomunikacije, transport, metalurgiju, odbrambenu industriju itd. Po svojoj prirodi, strukturno grupiranje je također prilično općenito, iako u pojedinačni slučajevi općenito, inferioran je u odnosu na tipološke grupe.

Analitičke grupe su dizajnirane da identifikuju odnos između karakteristika. Izgrađuju se analitičke grupe, naglašavajući rezultirajuće karakteristike, tj. znakova koji se mijenjaju pod uticajem faktorskih znakova, i faktorskih znakova, tj. one, zavisnost rezultirajućih karakteristika od kojih se istražuje. Analitičko grupisanje je drugačije sljedeće karakteristike: jedinice stanovništva su grupisane prema faktorskom atributu; svaku odabranu grupu karakteriziraju prosječne vrijednosti rezultirajućeg atributa, čija promjena vrijednosti određuje prisutnost veze i ovisnosti između atributa. Svaka odabrana grupa treba da sadrži statistički homogene jedinice populacije prema atributu grupisanja. Broj jedinica u svakoj dodijeljenoj grupi trebao bi biti dovoljan da se dobije pouzdanost statističke karakteristike fenomen ili proces koji se proučava.

Prema korištenim informacijama, razlikuju se primarne i sekundarne grupe.

Primarne grupe izrađuju se na osnovu početnih podataka dobijenih kao rezultat statističkih posmatranja.

Sekundarne grupe- rezultat kombiniranja ili cijepanja primarnih grupacija, omogućavaju vam da prevaziđete nekompatibilnost izvornih podataka u primarnim grupacijama i na taj način ih kombinujete u jednu zajedničku grupu i izvršite poređenje, poređenje podataka prikazanih u njima nakon sekundarnog grupiranja .

Prilikom razvijanja primarne grupacije, to je bitno izbor broja grupa. Broj grupa zavisi od tipa obeležja na kome se grupiše (osnova grupisanja), od obima populacije i stepena varijacije obeležja.

Prilikom konstruisanja grupa na kvalitativnoj osnovi, broj grupa odgovara broju stepena gradacije karakteristike. Prilikom grupiranja po kvantitativnom atributu, cijeli skup vrijednosti atributa se dijeli na intervale. U ovom slučaju moguća su dva pristupa: grupisanje sa jednakim i nejednakim intervalima.

Za određivanje ovih parametara u prvom slučaju preporučuje se Sturgessova formula:

n = 1 + (3,322× LGN), (5.1)

gdje N je broj zapažanja.

U ovom slučaju, vrijednost intervala je:

I \u003d (Xmax - Xmin) / n. (5.2)

Glavni koraci izgradnja statističkih grupa uključuje:

Izbor atributa grupisanja;

Određivanje potrebnog broja grupa u koje treba podijeliti studijsku populaciju;

Utvrđivanje granica intervala grupisanja;

Uspostavljanje za svaku grupu indikatora ili njihov sistem, koji treba da karakteriše odabrane grupe.

Grupisanje u nejednakim intervalima stvara mnogo problema u obradi podataka, tako da treba izbjegavati grupiranje kad god je to moguće.

Pitanja za samoispitivanje:

Šta je sažetak?

Šta je grupisanje podataka?

Koje vrste grupa poznajete?

Koje su karakteristike svake vrste grupisanja?

Kakav je odnos između grupiranja, tabele i sažetka?

Koja je posebnost složenih višedimenzionalnih grupacija?

Šta znači sekundarno grupisanje?

Čemu služi sekundarno grupisanje?