Biografije Karakteristike Analiza

Statističke serije i njihove vrste. Statističke distribucijske serije, njihov značaj i primjena u statistici

Statističko mjerenje, kontinuirano i selektivno posmatranje društveno-ekonomske pojave i procesi, statistička grupisanja, metode obrade i analize statističke informacije.

Statističko posmatranje je sistematsko, naučno organizovano i po pravilu sistematsko prikupljanje podataka o pojavama i procesima. javni život registracijom unaprijed određenih bitnih karakteristika kako bi se dobile dalje generalizirajuće karakteristike ovih pojava i procesa. Na osnovu posmatranja donose se zaključci o određenim mentalnih procesa. Postoje dvije vrste posmatranja - kontinuirano i selektivno. kontinuirano zvano posmatranje, kada se zabeleže sve karakteristike i manifestacije mentalna aktivnost osobu na određeno vreme. Za razliku od ovoga, kada selektivno posmatranje skreće pažnju samo na one činjenice u ljudskom ponašanju koje su direktno ili indirektno povezane sa temom koja se proučava.

Selektivno posmatranje je jedna od najčešće korištenih vrsta nekontinuiranog posmatranja. Selektivno posmatranje zasniva se na ideji da određeni dio jedinica odabranih slučajnim redoslijedom može predstavljati cijeli proučavani skup fenomena prema karakteristikama koje zanimaju istraživača. cilj selektivno posmatranje je da se dobiju informacije za određivanje zbirnih generalizirajućih karakteristika cjelokupne proučavane opće populacije.

grupisanje- ovo je raspodjela skupa jedinica proučavane populacije u grupe u skladu sa predznakom koji je bitan za ovu grupu. Metoda grupisanja vam omogućava da pružite primarnu generalizaciju podataka, njihovu prezentaciju u uređenijem obliku. Karakteristike po kojima se vrši grupisanje se nazivaju karakteristike grupisanja. Grupna osobina se ponekad naziva osnova grupisanja. Pravi izbor značajna karakteristika grupisanja omogućava izvođenje naučno utemeljenih zaključaka na osnovu rezultata statistička studija. Funkcije grupisanja mogu biti kvantitativno izraz (obim, prihod, kurs, starost, itd.), i kvaliteta(oblik vlasništva preduzeća, pol lica, pripadnost delatnosti, bračni status itd.). Sistem metoda, tehnika uz pomoć kojih statistika istražuje masovne pojave, forme statistička metodologija. Njegova specifičnost leži u činjenici da su svi glavni metodološke tehnike koristi se dok su zadaci završeni tri uzastopne etape (faze) statističko istraživanje:
I. Statističko posmatranje;
II. sažetke i grupiranje primarnih statističkih podataka;
III. naučna obrada i analiza statističkih informacija.
Sadržaj rada prva faza uključuje korištenje metode masovnih opservacija, koja nije ništa drugo do prikupljanje primarnih statističkih informacija.
Na druga faza prikupljene informacije korištenjem metode statističke grupe generalizovan i raspoređen na određeni način.
Na treća faza metodom generalizujućih indikatora vrši se analiza statističkih informacija.

Organizacioni oblici i vrste statističko posmatranje. Metode statističkog posmatranja. Vrste grupiranja, njihova primjena u statistici. Karakteristike grupisanja, njihovo opravdanje i izbor. Određivanje broja grupa i veličine intervala.

Glavni organizacioni oblici statističkog posmatranja obuhvataju: izveštavanje i posebno organizovano posmatranje.

Izvještavanje- ovo je oblik statističkog posmatranja, u kojem nadležni statistički organi primaju informacije od preduzeća i organizacija koje obavljaju privredne aktivnosti u određenom vremenskom periodu. Informacije se moraju dostaviti na zakonski redoslijed izvještajnih dokumenata.

tijela državna statistika odobravaju se oblici statističkog izvještavanja.

AT komercijalne aktivnosti izvještavanje se dijeli na:

1) na nacionalnom nivou - obavezan je za sve organizacije i dostavlja se u konsolidovanom obliku organima državne statistike;

2) unutarresorni - ovo izvještavanje važi u okviru resora i ministarstava. Postoji sledeće forme izvještavanje:

1) standard se zove izvještavanje, koji sadrži indikatore koji su isti za sva preduzeća, institucije raznih organizacione forme, kao i za druge aktivnosti

2) ako preduzeće ima svoje specifičnosti, onda se u ovu organizaciju uvodi specijalizovano izveštavanje;

3) izveštavanje koje svako preduzeće dostavlja u istim vremenskim intervalima naziva se periodično;

4) izvještavanje, koje po potrebi primaju statistički organi, naziva se jednokratno izvještavanje. Svaka organizacija ima pravo da odabere način na koji će pružati izvještajne podatke.

Vrste statističkog posmatranja:

1) ako su apsolutno sve jedinice proučavanog skupa pojava i procesa podvrgnute ispitivanju, onda kontinuirano statističko posmatranje;

2) ako je dio jedinica proučavanog skupa pojava podvrgnut ispitivanju, onda ovo diskontinuirano statističko posmatranje;

3) selektivno posmatranje naziva se opservacija, u kojoj su karakteristike čitavog skupa činjenica date prema nekim njihovim dijelovima, odabranim slučajnim redoslijedom;

4) monografski pregled - ovo je detaljna studija i opis pojedinih jedinica stanovništva;

5) ako je ispitivanju podvrgnut onaj dio jedinica populacije u kojem je vrijednost proučavane osobine preovlađujuća u cijelom obimu, onda se to naziva metoda glavnog niza;

6) poziva se prikupljanje podataka na osnovu dobrovoljnog popunjavanja upitnika od strane adresata anketna anketa;

7) ako se posmatranje vrši kontinuirano, a istovremeno se bilježe sve činjenice i pojave koje se događaju u stanju promjene, tada se ovo posmatranje naziva struja;

8) ako se posmatranje vrši neredovno, ali samo kada je potrebno, poziva se ovo posmatranje jednom;

9) periodični naziva se opservacija koja se ponavlja u određenim intervalima (godina, mjesec, kvartal, itd.).

U zavisnosti od izvora prikupljenih informacija, postoje:

1) posmatranje koje vrše sami registratori merenjem i uz pomoć pregleda, prebrojavanja i vaganja obeležja predmeta proučavanja naziva se neposrednim;

2) anketa je zapažanje u kojem se na određenom obrascu zapisuju odgovori na pitanja;

3) pri dokumentovanju činjenica dokumenti služe kao izvor informacija.

Pružanje od strane preduzeća, organizacija statističkih izvještaja o njihovim ekonomska aktivnost u strogo u dogledno vrijeme zove se izvještavanje. Tip statističkog posmatranja, koji uključuje davanje informacija organima koji sprovode posmatranje, naziva se privatni metod.

Ako dopisnici daju informacije vlastima, onda se ovaj metod naziva dopisnički. (1) Tipološke grupe

Njihov zadatak je da identifikuju socio-ekonomske tipove ili suštinski homogene grupe.

(2) Strukturne grupe

Njihov zadatak je da proučavaju sastav pojedinačnih tipičnih grupa kombinovanjem jedinica populacije koje su bliske jedna drugoj u smislu veličine atributa grupisanja.

(3) Analitičke grupe

Njihov zadatak je da identifikuju uticaj nekih karakteristika na druge (da identifikuju odnos između društveno-ekonomskih pojava).

(4) Kombinovane grupe

Oni dijele populaciju u grupe prema dvije ili više karakteristika. Istovremeno, grupe formirane prema jednom atributu dijele se u podgrupe prema drugom atributu.

Ovakva grupisanja omogućavaju proučavanje strukture stanovništva po više osnova istovremeno. Grupni znak- znak kojim se spajaju pojedinačne jedinice stanovništva pojedinačne grupe. Za grupisanje treba uzeti osnovne karakteristike koje najviše izražavaju karakterne osobine fenomen koji se proučava.

primarno grupisanje- direktno grupisanje podataka statističkog posmatranja. Sekundarno grupisanje je preuređenje prethodno grupisanih podataka. Need sekundarno grupisanje javlja se u dva slučaja:

1) prethodno napravljeno grupisanje ne ispunjava ciljeve studije u odnosu na broj grupa;

2) da uporedi podatke koji se odnose na različite vremenske periode ili na različite teritorije, ako je primarno grupisanje izvršeno prema različitim karakteristikama grupisanja ili u različitim intervalima.

Postoje dva načina sekundarnog grupisanja: udruživanje malih grupa, te veće i selekcija određeni udio agregatne jedinice.

Glavni zadaci riješeni uz pomoć grupiranja:

1) izdvajanje u ukupnost proučavanih pojava njihovih socio-ekonomskih tipova;

2) proučavanje strukture društvenih pojava;

3) identifikacija veza i zavisnosti između društvenih pojava.

Za određivanje optimalnog broja grupa koristi se Sturgessova formula: , gdje je n broj grupa; N je broj jedinica stanovništva. n je zaokruženo na cijeli broj. Nakon određivanja broja grupa, treba odrediti intervale grupisanja. Interval su vrijednosti varijabilnog atributa koje se nalaze unutar određenih granica. Donja granica intervala se zove najmanju vrijednost karakteristika u intervalu, a gornja granica - najveća vrijednost upišite se. Vrijednost (širina) intervala je razlika između gornje i donje granice intervala. Intervali grupisanja u zavisnosti od njihove veličine su jednaki i nejednaki. Ako se varijacija neke osobine manifestira unutar relativno uskih granica i distribucija je manje-više ujednačena, tada se gradi grupiranje sa u jednakim intervalima. Vrijednost jednakog intervala određena je formulom: , gdje su i maksimalni i minimalna vrijednost Open atributa su intervali za koje je naznačena samo jedna granica: gornja je za prvi interval, donja je za zadnji. Širina otvorenog intervala uzima se jednakom širini intervala koji se nalazi uz njega. Intervali se nazivaju zatvorenim ako su obe granice označene. Kada se grupiše prema kvantitativnom atributu, granice intervala mogu se označiti na različite načine. Ako je osnova grupisanja neprekidna karakteristika, tada ista vrijednost obilježja djeluje i kao gornja i donja granica dva susjedna intervala. Dakle, gornja granica i-tog intervala jednaka je donjoj granici i+1-tog intervala. S takvim označavanjem granica može se postaviti pitanje koju grupu uključiti jedinice objekta, čije se vrijednosti atributa podudaraju s granicama intervala. Obično se donja granica formira po „inkluzivnom“, a gornja – po „isključivom“ principu. Ako je grupisanje zasnovano na diskretnom atributu, tada je donja granica i-tog intervala jednaka gornjoj granici i-1. intervala, uvećana za 1. Nejednaki intervali se koriste u statistici kada su vrijednosti atribut variraju neravnomjerno iu značajnim veličinama.

Statistical Series distribucije, njihove vrste. Glavne karakteristike distributivnih serija.

Najvažniji dio statistička analiza je konstrukcija distributivnih serija (strukturno grupisanje) u cilju isticanja karakteristična svojstva i zakonitosti proučavane populacije. U zavisnosti od toga koji je znak (kvantitativni ili kvalitativni) uzet kao osnova za grupisanje podataka, prema tome se razlikuju vrste distributivnih serija.
Ako se kao osnova za grupisanje uzme kvalitativni atribut, onda se takva distributivna serija naziva atributivna (distribucija po vrsti rada, po spolu, po profesiji, po vjeri, nacionalnosti, itd.).
Ako je niz distribucije izgrađen na kvantitativnoj osnovi, onda se takav niz naziva varijacionim. Izgraditi varijacioni niz znači naručiti kvantitativnu distribuciju jedinica stanovništva prema vrijednostima atributa, a zatim prebrojati broj jedinica stanovništva sa ovim vrijednostima (izgraditi grupnu tablicu).
Grafički, serije distribucije su prikazane kao:
1) histogram - graf prema kojem se serija varijacija intervala prikazuje u obliku stupaca koji se nalaze jedan uz drugi. (Na osi Ox - granice intervala, na Oy - frekvencija intervala).
2) poligon distribucije - graf na kojem je graf distribucije prikazan kao linijski dijagram. (Prema Ox - vrijednost predznaka varijable, prema Oy - frekvencija).
3) kumulativni - graf na kojem su, prema Ox, vrijednosti varijabilne karakteristike ili gornje granice intervala, a prema Oy, akumulirane frekvencije.
4) ogive - a) graf na kojem su, duž Ox, vrijednosti ​​promjenljive
znak, prema Oy - frekvencija znaka;
b) graf na kojem je Ox kumulativna frekvencija, Oy
– vrijednosti varijabilnog svojstva. U varijacionom nizu postoji određeni odnos u promjeni frekvencija i vrijednosti varijabilnog atributa: s povećanjem varijabilnog atributa, vrijednost frekvencije prvo raste na određenu vrijednost, a zatim opada. Takve promjene se nazivaju obrasci distribucije.
Važna svojstva krivulje distribucije su stepen njene asimetrije, visoki ili niski vrh, koji zajedno karakterišu oblik ili tip krivulje distribucije.
Važan zadatak je definicija oblika krive.
Priroda ukupne distribucije uključuje procjenu stepena njene homogenosti i izračunavanje indikatora asimetrije i ekscesa.
Distribucija se naziva simetričnom, u kojoj su frekvencije bilo koje dvije varijante jednako raspoređene na obje strane centra raspodjele jednake jedna drugoj.
Za simetrične distribucije, aritmetička sredina, mod i medijan su jednaki.
Najtačniji i najčešći je indikator zasnovan na definiciji centralni trenutak trećeg reda.
Uobičajena raspodjela je normalna raspodjela, koja se može grafički prikazati kao simetrična kupolasta kriva.
Kupolasti oblik krivulje pokazuje da je većina vrijednosti koncentrirana oko centra mjerenja, a u istinski simetričnoj unimodalnoj raspodjeli, srednja vrijednost, mod i medijan će se poklopiti.
Zakon normalna distribucija pretpostavlja da je odstupanje od srednje vrijednosti rezultat veliki broj mala odstupanja, da su pozitivna i negativna odstupanja podjednako vjerovatna i da je najvjerovatnija vrijednost svih in jednako pouzdana mjerenja je njihov aritmetički prosjek.
Teorijska kriva distribucije je kriva distribucije koja izražava opšti obrazac ovog tipa.
Kriva normalne distribucije odražava obrazac koji se javlja kada mnogi slučajni uzroci interaguju.
Za simetrične distribucije izračunava se indeks ekscesa (zašiljenost).
Kurtoza je pad vrha empirijske distribucije nagore ili nadole od vrha krive normalne distribucije.
Procjena indikatora asimetrije i kurtozisa omogućava da se zaključi da li se ova empirijska raspodjela može pripisati tipu krivulja normalne distribucije.

Vrste apsolutnih vrijednosti, mjerne jedinice i načini dobijanja. Relativne vrijednosti, njihove vrste, metode izračunavanja. Relativne vrijednosti planiranog zadatka, struktura, dinamika, intenzitet, koordinacija, poređenje i metode njihovog proračuna i analize.

Apsolutne vrijednosti su ekonomski jednostavne (broj radnji, zaposlenih) i ekonomski složene (obim trgovine, veličina osnovnih sredstava). Apsolutne vrijednosti se uvijek nazivaju brojevima, imaju određenu dimenziju, mjerne jedinice. U statističkoj nauci koriste se prirodne, novčane (vrijednost) i radne jedinice mjerenja. Jedinice mjerenja nazivaju se prirodnim ako odgovaraju potrošačkom ili prirodna svojstva predmet, proizvod i biće izraženi fizičkim težinama, mjerama dužine itd. U statističkoj praksi prirodne jedinice mjerenja mogu biti kompozitna. Uvjetno prirodne mjerne jedinice se koriste kada se zbrajaju različita dobra, proizvodi. Apsolutne vrijednosti se koriste u praksi trgovine, koriste se u analizi i predviđanju komercijalnih aktivnosti. Na osnovu ovih vrijednosti sastavljaju se poslovni ugovori u komercijalnoj djelatnosti, procjenjuje se obim potražnje za određenim proizvodima itd. Svi aspekti društvenog života mjere se apsolutnim vrijednostima. Apsolutne vrijednosti prema načinu izražavanja veličina procesa koji se proučavaju dijele se na: pojedinačne i ukupne, one pak pripadaju jednoj od vrsta generalizirajućih vrijednosti. Veličine kvantitativnih predznaka za svaku statističku jedinicu karakterišu pojedinačne apsolutne vrijednosti, a ujedno su i osnova za statistički sažetak za spajanje pojedinačnih jedinica statistički objekat u grupe. Na njihovoj osnovi dobivaju se apsolutne vrijednosti u kojima je moguće izdvojiti indikatore obima karakteristika populacije i pokazatelje veličine populacije.

Relativne vrijednosti su pokazatelj koji je količnik dijeljenja dva statistika i karakteriše kvantitativni odnos između njih. Za obračun relativne vrijednosti brojilac je upoređeni indikator, koji će odražavati fenomen koji se proučava, a imenilac odražava indikator sa kojim će se ovo poređenje vršiti, on je osnova ili osnova za poređenje. Osnova poređenja je svojevrsni metar. Baza ima rezultat omjera u zavisnosti od kvantitativne (numeričke) vrijednosti, koji se izražava u: koeficijentu, procentu, ppm ili decimilu.

Ako se baza poređenja uzme kao jedinica, tada je relativna vrijednost koeficijent i pokazuje koliko je puta vrijednost koja se proučava veća od baze. Ako se baza poređenja uzme kao 100%, onda će rezultat izračunavanja relativne vrijednosti biti izražen u procentima.

Ako se baza poređenja uzme kao 1000, tada se rezultat poređenja izražava u ppm (%0). Relativne vrijednosti se također mogu izraziti u decimilima ako je osnova omjera 10.000.

U zavisnosti od svrhe statističke studije, relativne vrednosti se dele na sledeće vrste: ispunjenje ugovornih obaveza; relativne vrijednosti koje karakteriziraju strukturu stanovništva; relativne vrijednosti dinamike; poređenja; koordinacija; relativne vrijednosti intenziteta.

Relativni pokazatelji planirani cilj (OPPP) se koriste za napredno planiranje djelatnosti subjekta finansijske i ekonomske sfere i dr.

CVPP se izračunava pomoću sljedeće formule:

Relativne vrijednosti strukture su pokazatelji koji karakteriziraju udio u sastavu proučavanih populacija. Relativna vrijednost strukture određena je odnosom apsolutne vrijednosti pojedinog elementa statističke populacije prema apsolutnoj vrijednosti cjelokupne populacije, odnosno kao odnos dijela prema općoj (cjelini) i karakteriše specifična gravitacija dijelovi cjeline, u obliku procenta.

Relativne vrijednosti dinamike karakteriziraju promjenu proučavane pojave tokom vremena, otkrivaju smjer razvoja i mjere intenzitet razvoja. Relativna vrijednost dinamike izračunava se kao odnos nivoa nekog obilježja u određenom periodu ili vremenskoj tački prema nivou istog obilježja u prethodnom periodu ili trenutku, odnosno karakteriše promjenu u nivo određene pojave tokom vremena. Relativne vrijednosti dinamike nazivaju se stope rasta:

Imenovane vrijednosti su izražene u vrijednostima relativnog intenziteta:

Relativna vrijednost intenziteta = apsolutna vrijednost fenomena koji se proučava / apsolutna vrijednost koja karakterizira volumen sredine u kojoj se fenomen širi

Relativni indikatori koordinacije (RIC) su omjer jednog dijela populacije prema drugom dijelu iste populacije:

OPC = nivo koji karakteriše i-ti deo populacije / nivo koji karakteriše deo populacije izabran kao osnovu poređenja

Prosjek u statistici, njegova suština i uslovi primjene. Vrste i oblici sredine. Prosječno jednostavno i ponderirano. Prosječne težine, njihov izbor. Izračunavanje prosjeka prema podacima serije varijacione distribucije.

Prosječna vrijednost je sažetak kvantitativna karakteristika skupovi iste vrste fenomena na jednoj različitoj osnovi. U ekonomskoj praksi se koristi širok spektar indikatora koji se izračunavaju kao prosječni. Najvažnija imovina srednja veličina leži u tome što on predstavlja vrijednost određenog atributa u cjelokupnoj populaciji kao jedinstven broj, uprkos njegovim kvantitativnim razlikama u pojedinim jedinicama populacije, i izražava ono zajedničko što je svojstveno svim jedinicama populacije koja se proučava. Dakle, kroz karakteristiku jedinice stanovništva karakteriše cjelokupno stanovništvo u cjelini. Najvažniji uslov za naučnu upotrebu prosjeka u Statistička analiza društveni fenomen je homogenost populacije za koju se izračunava prosjek. Kvalitativna homogenost stanovništva utvrđuje se na osnovu sveobuhvatnog teorijska analiza suštinu fenomena. Na primjer, prilikom izračunavanja prosječnog prinosa potrebno je da se ulazni podaci odnose na isti usjev (prosječan prinos pšenice) ili grupu usjeva (prosječni prinos žitarica). Ne možete izračunati prosjek za heterogene usjeve. Prosjeci dobijeni za heterogene populacije će iskriviti prirodu društvenog fenomena koji se proučava, krivotvoriti ga ili biti besmislen. Drugi važan uslov upotreba prosjeka u analizi je dovoljan broj jedinica u populaciji, prema kojima se izračunava prosječna vrijednost atributa. Osigurana je dovoljnost analiziranih jedinica tačna definicija granice proučavane populacije, tj. položen za početna faza statističko istraživanje. Ovaj uslov postaje odlučujući kada se koristi posmatranje uzorka, kada je potrebno osigurati reprezentativnost uzorka.

Određivanje maksimalne i minimalne vrijednosti osobine u ispitivanoj populaciji također je uvjet za korištenje prosječne vrijednosti u analizi. U slučaju velikih odstupanja između ekstremnih vrijednosti i prosjeka, potrebno je provjeriti pripadaju li ekstremi ispitivanoj populaciji. Ako je jaka varijabilnost osobine uzrokovana slučajnim, kratkoročnim faktorima, onda možda ekstremne vrednosti nisu karakteristični za populaciju. Stoga ih treba isključiti iz analize, jer utiču na veličinu prosjeka. Srednje Ovo je jedna od najčešćih generalizacija. Ispravno razumijevanje suštine prosjeka određuje njegov poseban značaj u tržišnoj ekonomiji, kada prosjek kroz jednostruki i nasumičan, omogućava vam da identifikujete opšte i neophodno, da identifikujete trend obrazaca. ekonomski razvoj. Karakteriziraju prosječne vrijednosti kvalitativni pokazatelji komercijalne aktivnosti: troškovi distribucije, profit, profitabilnost itd. U statistici postoji nekoliko tipova prosječnih vrijednosti:

1. Po prisustvu znaka težine: a) neponderisana prosečna vrednost; b) ponderisani prosek.

2. Prema obliku obračuna: a) srednja aritmetička vrijednost; b) prosjek harmonska vrijednost;

c) geometrijska sredina; d) srednji kvadratni korijen, kubni, itd. količine.

3. Po obuhvatu stanovništva: a) prosek grupe; b) ukupna prosječna vrijednost. Prilikom izračunavanja prosječnih vrijednosti, koncept „ težina ". Ponder će biti trošak osnovnih proizvodnih sredstava i normiranih obrtnih sredstava, odnosno koncept težina i frekvencije ne poklapaju se uvijek.

U praksi je potrebno izabrati jednu iz mase karakteristika, koju treba koristiti kao uteg. Izbor težine ne treba shvatiti na način da svaki put može postojati nekoliko opcija vaganja. Pitanje se mora riješiti na način da se, kao rezultat vaganja, osigura povratak na one vrijednosti koje su imale ulogu brojnika pri izračunavanju prosječne vrijednosti. Shodno tome, prilikom vaganja proseka kao pondere treba uzeti imenilac razlomka, jer tek kada pomnožimo sa onim čime smo delili, vratićemo se na prvobitnu vrednost.

Serija varijacija sastoji se od dvije kolone, lijeva kolona sadrži vrijednosti atributa varijable, koje se nazivaju varijante i označavaju sa (x), a desna kolona sadrži apsolutne brojeve koji pokazuju koliko puta se svaka varijanta pojavljuje. Vrijednosti u ovoj koloni nazivaju se frekvencijama i označavaju se sa (f). Zajedno sa prosječnim vrijednostima kao statističke karakteristike varijacione serije raspodele, izračunavaju se strukturni proseci - mod i medijan.
Moda(Mo) predstavlja vrijednost proučavane osobine, ponovljene sa najviša frekvencija.
Medijan(Me) je vrijednost karakteristike koja se nalazi u sredini rangirane (uređene) populacije.
Glavno svojstvo medijane je da je zbir apsolutnih odstupanja vrijednosti atributa od medijane manji nego od bilo koje druge vrijednosti ∑|x i - Me|=min.

7. Strukturni prosjeci: mod, medijan, kvartili i decili.

Mod je vrijednost osobine koja se najčešće javlja u datoj populaciji. U odnosu na varijacioni niz, mod je najčešća vrijednost rangirane serije. Pokazuje veličinu obilježja, karakterističnog za značajan dio populacije, a određuje se formulom:

gdje je x0 donja granica intervala;

h je vrijednost intervala;

f m– frekvencija intervala;

f m-1– učestalost prethodnog intervala;

f m+1– učestalost narednog intervala.

Medijan je varijanta koja se nalazi u centru rangirane serije. Medijan dijeli niz na dva jednaka dijela na način da se na obje njegove strane nalazi isti broj populacijskih jedinica. Istovremeno, u jednoj polovini populacijskih jedinica vrijednost varijabilnog obilježja je manja od medijane, dok je u drugoj polovini veća.

Deskriptivna priroda medijane očituje se u činjenici da karakterizira kvantitativnu granicu vrijednosti promjenjivog atributa, koje posjeduje polovina jedinica populacije.

Prilikom određivanja medijane u nizu varijacije intervala, prvo se određuje interval u kojem se nalazi (medijalni interval). Ovaj interval karakteriše činjenica da je njegov akumulirani zbir frekvencija jednak ili veći od polovine zbira svih frekvencija serije. Izračunavanje medijane serije varijacije intervala provodi se prema formuli:

gdje je x0 donja granica intervala; h je vrijednost intervala;

f m– frekvencija intervala; f je broj članova serije; sm- 1 - zbir akumuliranih članova niza koji prethode ovom. Zajedno sa medijanom za više kompletne karakteristike strukture proučavane populacije koriste i druge vrijednosti opcija koje zauzimaju sasvim određenu poziciju u rangiranoj seriji. To uključuje kvartile i decile. Kvartili dijele niz zbirom frekvencija na četiri jednaka dijela, a decili - na deset jednake dijelove. Postoje tri kvartila i devet decila. Medijan i mod, za razliku od aritmetičke sredine, ne poništavaju se individualne razlike u vrijednostima varijabilnog atributa i stoga su dodatne i vrlo važne karakteristike statističke populacije. U praksi se često koriste umjesto prosjeka ili uz njega. Posebno je svrsishodno izračunati medijan i mod u onim slučajevima kada proučavana populacija sadrži određeni broj jedinica s vrlo velikom ili vrlo malom vrijednošću varijabilnog atributa.

8. Indikatori varijacije osobine: opseg varijacije, prosjek standardna devijacija, koeficijent varijacije.

Za karakterizaciju stepena homogenosti proučavane populacije, stepena fluktuacije individualnog znanja o znaku od prosjeka za cijelu populaciju, koriste se tzv. indikatori varijacije: raspon varijacije, prosječna linearna devijacija, standardnu ​​devijaciju i koeficijent varijacije. Raspon varijacije je razlika između maksimalne i minimalne vrijednosti osobine za datu populaciju. Prikazuje samo razliku između maksimalne i minimalne vrijednosti osobine koja se proučava, bez dodirivanja stupnja fluktuacije (varijacije) osobina drugih jedinica populacije. Srednja linearna devijacija je aritmetička sredina dobijena iz apsolutnih odstupanja individualne vrednosti znak iz aritmetičke sredine za cijelu populaciju. Standardna devijacija se određuje uzimanjem kvadratnog korijena zbira kvadrata linearnih devijacija podijeljen s brojem pojedinačnih vrijednosti obilježja populacije koja se proučava. Koeficijent varijacije: procenat srednje vrijednosti standardna devijacija na aritmetičku sredinu.

Statističke distribucijske serije- uređena raspodjela jedinica stanovništva u grupe prema određenom atributu. Karakterizira sastav (strukturu) fenomena koji se proučava, omogućava suđenje o homogenosti populacije, obrascima distribucije i granicama varijacije jedinica populacije.

Redovi distribucije konstruisani prema atributnim (kvalitativnim) karakteristikama nazivaju se atributivno(raspodjela stanovništva prema polu, zaposlenosti, nacionalnosti, profesiji, itd.).

Redovi distribucije izgrađeni na kvantitativnoj osnovi nazivaju se varijacijski(raspodjela stanovništva prema starosti, radnika - prema radnom stažu, platama itd.). Varijaciona serija distribucije sastoji se od dva elementa: varijanti i frekvencija. Opcije su pojedinačne vrijednosti obilježja koje uzima u seriji. Frekvencije je broj pojedinačnih varijanti ili svake grupe varijantnog niza, tj. ovo su brojevi koji pokazuju koliko se često određene opcije pojavljuju u nizu distribucije. Zbir svih frekvencija naziva se volumen populacije i određuje broj elemenata cijele populacije. Učestalosti su frekvencije izražene u dijelovima jedinica ili u % od ukupnog broja.

Varijacijski nizovi, ovisno o prirodi varijacije, dijele se na diskretne i intervalne. Diskretne varijacijske serije su zasnovane na diskretnim (diskontinuiranim) karakteristikama koje imaju samo cjelobrojne vrijednosti, na diskretnim karakteristikama predstavljenim kao intervali. Intervalne varijacijske serije su zasnovane na kontinuiranim karakteristikama (koji imaju bilo koje vrijednosti, čak i one razlomke).

7. Tabelarni i grafički prikaz statističkih podataka.

Rezultati sumiranja i grupisanja prikazani su u obliku tabela. Tabela je racionalan, vizuelan i kompaktan oblik statističkog materijala.

Statistička tabela - tabela koja sadrži rezultate prebrojavanja praktičnih podataka i rezultat je sažetka početnih informacija.

Tabela karakterizira totalitet prema jednoj ili više logički povezanih karakteristika.

Statistička tabela ima svoj subjekt i predikat. Subjekt je objekt karakteriziran brojevima. Predikat tabele je sistem indikatora.

Tabele su jednostavne i složene. Jednostavna tabela daje jednostavnu listu objekata. Kompleksna tabela sadrži grupisanje populacijskih jedinica istovremeno prema 2 ili više karakteristika. Tabela treba da bude kompaktna, naslovi trebaju biti kratki, informacije u kolonama i kolonama treba da se završavaju rezimeom. Kolone i redovi moraju imati mjerne jedinice, tada je potrebno izvršiti ravnomjernu i logičnu provjeru tabele.

Statistički grafikon je crtež u kojem su statistički agregati okarakterizirani određenim pokazateljima opisani korištenjem uvjetnih geometrijskih slika ili znakova. Prilikom konstruisanja grafikona potrebno je ispoštovati zahtjeve: vidljivost, ekspresivnost, jasnoća. Grafičko polje je dio ravni u kojoj se nalaze grafičke slike. Koriste se vrste grafikona: linija, traka, traka, pita, sektor, kovrdžava, tačka, volumen, grafikoni i statističke karte. Kartogram je šematska geografska karta koja ističe industrije ili sastav stanovništva.

Rezultati sažimanja i grupisanja materijala statističkih opservacija sastavljaju se u obliku statističkih serija distribucije. Statističke serije raspodjele predstavljaju uređenu distribuciju jedinica proučavane populacije u grupe prema grupisanom (varijabilnom) atributu. Oni karakteriziraju sastav (strukturu) fenomena koji se proučava, omogućavaju suditi o homogenosti populacije, granicama njene promjene i obrascima razvoja promatranog objekta. Ovisno o osobini, serije statističke distribucije se dijele na:

Atributivno (kvalitativno);

Varijabilno (kvantitativno)

a) diskretno;

b) interval.

Serija distribucije atributa

Nizovi atributa se formiraju prema kvalitativnim karakteristikama, a to može biti pozicija radnika u trgovini, profesija, pol, obrazovanje itd.

Tabela 1 - Distribucija zaposlenih u preduzeću po obrazovanju.

AT ovaj primjer obeležje grupisanja je obrazovanje zaposlenih u preduzeću (viša, srednja). Ove distributivne serije su atributivne, jer varijabilno obeležje nije predstavljeno kvantitativnim, već kvalitativnim pokazateljima. Najveći broj radnici sa srednjom stručnom spremom (oko 40%); ostali zaposleni su prema tome podijeljeni u grupe kvalitativna karakteristika: srednji specijalno obrazovanje- 25%; sa nepotpunim višim - 20%; sa najvišim - 15%.

Varijabilne distribucijske serije

Variation Series grade se na osnovu kvantitativne karakteristike grupisanja. Varijacijski nizovi se sastoje od dva elementa: varijante i frekvencije.

Opcija- ovo je zasebna vrijednost varijabilnu osobinu koju preuzima u seriji distribucije. One mogu biti pozitivne ili negativne, apsolutne ili relativne. Frekvencija- ovo je broj pojedinačnih varijanti ili svake grupe serije varijacija. Zovu se frekvencije izražene kao dijelovi jedinice ili kao postotak od ukupnog broja frekvencije. Zbir frekvencija naziva se volumen populacije i određuje broj elemenata cijele populacije.

Frekvencije su frekvencije izražene kao relativne vrijednosti (udjeli jedinica ili postoci). Zbir frekvencija jednak je jedan ili 100%. Zamjena frekvencija sa frekvencijama omogućava vam da uporedite varijacione serije sa drugačiji broj zapažanja.

Varijacijski nizovi, ovisno o prirodi varijacije, dijele se na: diskretne (diskontinuirane) i intervalne (kontinuirane). Diskretne distribucijske serije su zasnovane na diskretnim (diskontinuiranim) karakteristikama koje imaju samo cjelobrojne vrijednosti (na primjer, kategorija plaće radnika, broj djece u porodici).

Intervalne distributivne serije su zasnovane na kontinuiranoj promjeni vrijednosti osobine koja uzima bilo koje (uključujući razlomke) kvantitativne izraze, tj. vrijednost karakteristika u takvim redovima je data kao interval.

U prisustvu dovoljno velikog broja opcija za vrijednosti atributa, primarnu seriju je teško vidjeti, a njeno direktno razmatranje ne daje ideju o raspodjeli jedinica prema vrijednosti atribut u agregatu. Stoga je prvi korak u poretku primarne serije njeno rangiranje – raspored svih opcija u rastućem (opadajućem) redoslijedu.

Za konstruiranje diskretne serije s malim brojem opcija, ispisuju se sve varijante vrijednosti atributa koje se pojavljuju X i, a zatim se izračunava učestalost ponavljanja varijante f i. Uobičajeno je rasporediti niz distribucije u obliku tabele koja se sastoji od dva stupca (ili reda), od kojih jedan predstavlja opcije, a drugi - frekvencije.

Za izgradnju distributivnog niza karakteristika koje se kontinuirano mijenjaju, ili diskretnih, predstavljenih kao intervali, potrebno je uspostaviti optimalan broj grupa (intervala) u koje treba podijeliti sve jedinice proučavane populacije.

Serija distribucije je najjednostavnije grupisanje u kojem je svaka istaknuta grupa okarakterisana samo jedan znak .

U tabeli 2 (samo broj banaka) - mali uzorak - najjednostavnija serija.

Primjer: sa djecom koja jesu drugačije vrijeme u dvorištu je bilo: 9 10 11 8 8 9 9 11 11. Rangiramo od min do max i dobijemo:

Primjer 2 : sa studentima u publici.

Tabela 0

Distribucija broja učenika u grupi 302

Broj studenata (osoba)

Ukupno:

Statističke distribucijske serije - ovo je uređena serija distribucije jedinica stanovništva u grupe prema određenom varijabilnom atributu.

Postoje 2 vrste redova:

1. atributivni

Na primjer: tabela 0 Distribucija broja učenika u grupi 302 prema polu (ženski, muški), broju, % (numeracija kolona je obavezna).

Izgrađen je na kvalitativnoj osnovi, koja nema numerički izraz. Takvi redovi karakteriziraju populaciju prema ispitivanoj osobini.

2. varijacijski

Izgrađen od kvantitativno atributa, a atribut je poređan uzlaznim ili silaznim redoslijedom vrijednosti atributa, tj. red mora biti rangiran.

Karakteristike opsega distribucije:

1. x – opcija(e) je vrijednost karakteristike u nizu varijacija, tj. one vrijednosti koje uzima atribut grupisanja;

2. f - frekvencija- pokazuje koliko puta nalaze u agregatu datu vrijednost sign.

Primjer 3 : Djeca su šetala po dvorištu. AT određeno vrijeme bilo ih je: 9 10 11 8 8 9 9 11 11. Rangiramo niz od najmanjeg do najvećeg i vidimo koliko puta se pojavljuje ova ili ona opcija.

Zbir svih frekvencija jednak je zbiru elemenata serije

Ponekad se za karakterizaciju serije koriste frekvencije – izražene frekvencije u % ili udjelima 1,0 .

U oba slučaja, Wi-Frequency = 100% ili Wi-Frequency = 1 otkucaj.

(Vidi tabelu 0: 83,3+16,7 = 100,0%)

(vidi tabelu 0: 0,83+0,17 = 1,00).

Ovisno o prirodi varijacijske osobine, varijacioni nizovi se dijele na diskretno i interval.

U diskretnim serijama, opcije su predstavljene u obliku cijeli brojevi a njihove vrijednosti se mogu prebrojati.

Primjer 4:

Tabela 4

Distribucija porodica prema broju djece

Broj djece u porodici (osoba)

Broj porodica (jedinica)

S (akumulirane frekvencije)

Ukupno:

intervalne serije- ovo je serija, u mački. vrijednost karakteristike je izražena kao intervali.

U intervalnim serijama, predznak se može kontinuirano mijenjati (od min do max) i međusobno se razlikovati proizvoljno male veličine .

Intervalne serije se koriste u slučajevima kada se vrijednost atributa mijenja kontinuirano, a takođe i ako diskretni predznak varira u veoma širokim granicama, tj. broj opcija je prilično velik.

Pravila za konstruisanje redova, izbor broja grupa i intervala, kao i prilikom grupisanja.

Tabela 5

Raspodjela zaposlenih u preduzeću po veličini mjesečnika plate, rub.

Plata (rub.)

Broj zaposlenih (osoba)

Akumulirane frekvencije

Ukupno:

Osim frekvencija, koriste se kumulativne frekvencije ili kumulativne frekvencije.

One se određuju sekvencijalnim zbrajanjem frekvencija prethodnih intervala i označavaju se sa S.

Kumulativne frekvencije se nazivaju akumulirane frekvencije, pokazuju koliko elemenata reda ima vrijednost do određenog reda.

Nesistematizovani podaci prikupljeni u procesu statističkog posmatranja čine primarnu seriju podataka. Uz dovoljno veliki obim populacije, primarne serije podataka postaju teško uočljive i njihovo direktno razmatranje ne može dati ideju o raspodjeli jedinica stanovništva prema veličini atributa.

Prvi korak u poretku primarnog reda je njegovo rangiranje, tj. raspored svih varijanti serije (karakteristične vrijednosti) u rastućem ili opadajućem redoslijedu. Rangiranje podataka vam omogućava da:

  • odmah vidjeti maksimalnu i minimalnu vrijednost atributa u agregatu i identificirati razliku između njih (X max - X min);
  • odrediti broj ponavljanja pojedinih varijanti serije (učestalost).

Kao rezultat toga, primarni neuređeni niz podataka se pretvara u uređeni niz, koji će odražavati broj ponavljanja svake opcije:

Ova serija se naziva statistička serija distribucije. Karakteriše sastav i strukturu fenomena koji se proučava, omogućava suđenje stepena homogenosti proučavane populacije, obrazaca i granica varijacije analiziranog obeležja.

Elementi serije statističke distribucije su varijante X, a frekvencije / (apsolutna vrijednost broja ponavljanja d-th opcije).

Za karakterizaciju strukture stanovništva koristi se indikator koji se naziva učestalost (4) i određuje se formulom

Iz definicije frekvencije i frekvencije proizlaze sljedeće jednakosti: gdje N - obim stanovništva.

Serija distribucije može se dobiti kao rezultat grupiranja. Redovi distribucije mogu biti atributi i varijacije.

Serija atributa je statistička serija distribucije koja se gradi na bazi atributa. Kao primjer takve serije može se uzeti u obzir, posebno, distribucija radnika u radionici preduzeća prema zanimanjima (tabela 3.2).

Distribucija radnika u radnjama po zanimanjima

varijantne serije je statistička serija distribucije, koja se gradi na kvantitativnoj osnovi. Serija varijacija se može uzeti u obzir diskretne serije, ako je znak na kojem je) "sagrađena, odnosno diskretna. Serija raspodjele varijacije može biti i intervalna ako je znak na kojem se gradi kontinuiran. Primjer takvog niza je raspodjela radnika u radionici ili preduzeća prema nivou vještina (Tabela 3.3).

Tabela 3.3

Distribucija radnika u radnji prema nivou vještina

Kao primjer serije intervalne distribucije možemo dati primjer distribucije preduzeća po obimu proizvodnje (vidi paragraf 3.3). intervalna distribucija u ovom slučaju se vrši u procesu konstruisanja odgovarajućeg analitičkog grupisanja prikazanog u tabeli. 3.4.

Intervalni niz distribucije, zajedno sa diskretnim nizom distribucije, omogućava otkrivanje i proučavanje strukture fenomena koji se proučava (objekta posmatranja).

Tabela 3.4

Distribucija preduzeća po obimu proizvodnje

Grupe preduzeća po obimu proizvodnje, miliona rubalja

Količina

preduzeća

(učestalost)

Učešće u ukupnom broju preduzeća

Akumulirano

/o

Xi

ALI

ALI

d,

Statistički niz distribucije može se smatrati obaveznim rezultatom svakog statističkog grupisanja. Prilikom konstruisanja distributivnih serija, broj grupa i dužina intervala određuju se prema pravilima koja se koriste pri izvođenju statističkih grupisanja (vidi paragraf 3.2).

Radi jasnoće i bolje razumijevanje statistički nizovi distribucije mogu se prikazati ne u tabelarnom, već u grafičkom obliku.

Najčešće grafički prikaz serija distribucije se koristi za prikaz varijacionih statističkih serija distribucije.

Za prikaz diskretne serije koriste se linijski grafikoni, koji se nazivaju poligoni distribucije. Prilikom izgradnje poligona distribucije u pravougaoni sistem koordinate na osi apscise odlažu varijante (vrijednosti) analiziranog obilježja. Na y-osi je ucrtana učestalost distribucije varijanti ili vrijednosti osobina. Svrsishodnost prikazivanja frekvencija na ordinatnoj osi objašnjava se sljedećim:

  • ovo je najpogodniji metod za veliki obim proučavane statističke populacije;
  • ovo omogućava da se u okviru jednog grafikona prikaže serija statističkih distribucija dva ili više obeležja sa različitim brojem jedinica stanovništva.

Presjek tačaka duž ose apscise i ose ordinata nastaje slomljena linija, što je poligon distribucije (slika 3.1 - na osnovu podataka u tabeli 3.3).

Za grafički prikaz intervalne serije, po pravilu se koriste trakasti grafikoni koji su prihvaćeni u ovaj slučaj nazvani histogrami.

Možete izgraditi histogram intervalne serije distribucije preduzeća u smislu obima proizvodnje (vidi tabelu 3.4). Osa apscise u ovom slučaju su segmenti, jednak intervali serije distribucije (u prihvaćenoj skali). Nadalje, na ovim segmentima se grade pravokutnici, koji su po visini, iscrtani duž y-ose, jednaki frekvenciji ili frekvenciji svakog intervala (slika 3.2).


Rice. 3.1.


Rice. 3.2.

Za rješavanje problema kao što su određivanje strukturnih prosjeka, praćenje procesa koncentracije proučavane pojave, itd., uobičajeno je da se serije distribucije transformišu u kumulativne serije, koje se nižu u zavisnosti od akumuliranih frekvencija ili frekvencija. Pravilo za izračunavanje akumulacije frekvencija (frekvencija) svakog intervala serije distribucije je prilično jednostavno. Akumulacija frekvencija (frekvencija) se izračunava kao zbir frekvencije (učestalosti) datog intervala i frekvencija (učestalosti) svih intervala koji prethode ovom intervalu.

Kao primjer konstruiranja kumulativnog niza uzimamo podatke u tabeli. 3.4 iz posljednje kolone (vidi kumulativnu učestalost s,) i izgradi odgovarajući dijagram (slika 3.3).

Prilikom konstruisanja kumulativnih nizova u pravougaonom koordinatnom sistemu, gornje granice intervala redova distribucije iscrtavaju se na osi apscise, a akumulirane frekvencije (frekvencije) koje odgovaraju ovim intervalima na osi ordinata.


Rice. 3.3.

Korištenjem kumulata može se ilustrirati proces koncentracije, gdje uz akumulaciju frekvencija (učestalosti) postoje distribucije i sume akumuliranih grupisanih (ili drugih bitnih) karakteristika proučavane pojave u statističkoj seriji. Takve krive, koje odražavaju proces koncentracije, nazivaju se Lorenzove krive.

Dakle, ako se pozovemo na podatke u tabeli. 3.4 i sl. 3.3, može se primijetiti da akumulirana učestalost drugog intervala pokazuje da sedam preduzeća od 25 proizvodi oko 19% ukupne proizvodnje, dok svako od sedam preduzeća ima obim proizvodnje ne veći od 8,2 miliona rubalja. a ovih sedam preduzeća čini 28% ukupno smatranim preduzećima.

po najviše važan uslov od svega što se može predstaviti konstrukciji statističkih serija distribucije je zahtjev uporedivosti u vremenu i prostoru podataka o intervalima. Istovremeno, sasvim je jasno da se u redovima sa jednakim intervalima ovaj zahtjev ispunjava automatski. U tim serijama distribucije, čiji intervali nisu jednaki, uobičajeno je da se gustina distribucije izračunava kao količnik dijeljenja frekvencije intervala njegovom dužinom. U grafičkom prikazu distribucijskih serija sa nejednakim intervalima uobičajeno je da se na y-osi iscrtavaju ns frekvencije (frekvencije), a vrijednosti gustine distribucije.

Da bi se olakšala konstrukcija grupa i grafičkih prikaza statističkih serija, mogu se koristiti uređivači. tabele(npr. Excel).

  • Vidi: Makarova N. V., Trofimets V. S. Statistika u Excelu. M.: Finansije i statistika, 2009; i druge slične publikacije.