Biografije Karakteristike Analiza

Serije statističke distribucije. Statistička diskretna distribucija

Pustiti van populacija ekstrahira se uzorak i x 1 promatrano P 1 put, x 2 - P 2 puta, x k - str do puta i veličina je uzorka. Promatrane vrijednosti x 1 nazivaju se varijante, a slijed varijanti ispisuje se uzlazno - serije varijacija .

Broj varijanti promatranja naziva se učestalost, a njegov odnos prema veličini uzorka naziva se relativna učestalost.

Definicija. Statistički (empirijski) zakon distribucije uzorka, ili jednostavno statistička distribucija uzorka imenovati niz opcija i njihove odgovarajuće učestalosti n i ili relativne frekvencije.

Statistička distribucija Uzorke je zgodno prikazati u obliku tablice distribucije frekvencija, tzv statistički diskretne serije distribucije:

(zbroj svih relativnih frekvencija jednak je jedan).

Primjer 1. Mjerenjem u homogenim skupinama ispitanika dobiveni su sljedeći uzorci: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 (otkucaji srca). Na temelju ovih rezultata sastavite statistički niz distribucija frekvencija i relativnih frekvencija.

Riješenje. 1) Statistički niz distribucije učestalosti:

Kontrola: 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.

Frekvencijski poligon nazvana izlomljena linija, segmenti koji spajaju točke Za konstruiranje frekvencijskog poligona, opcije su postavljene na apscisnoj osi x 2, a na ordinati - odgovarajuće frekvencije p i . Točke se spajaju segmentima i dobiva se poligon frekvencija.

Poligon relativnih frekvencija naziva se izlomljena linija, segmenti koji spajaju točke. Za konstruiranje poligona relativnih frekvencija, opcije se iscrtavaju na apscisnoj osi x i , a na osi ordinata pripadajuće frekvencije w ja Točke se spajaju segmentima i dobiva se poligon relativnih frekvencija

Primjer 2. Konstruirajte poligon frekvencija i poligon relativnih frekvencija na temelju podataka u primjeru 1.

Riješenje: Koristeći seriju diskretne statističke distribucije kompiliranu u primjeru 1, konstruirat ćemo poligon frekvencije i poligon relativne frekvencije:


2. Serije statističke intervalne distribucije. Grafikon.

Statistički diskretni niz (ili empirijska funkcija distribucije) obično se koristi kada Odlican prijatelj jedni od drugih nema previše opcija u uzorku, ili kada je diskretnost iz ovog ili onog razloga značajna za istraživača. Ako je karakteristika opće populacije X koja nas zanima distribuirana kontinuirano ili je njezinu diskretnost nepraktično (ili nemoguće) uzeti u obzir, tada se opcije grupiraju u intervale.


Statistička distribucija također se može specificirati kao niz intervala i frekvencija koje im odgovaraju (zbroj frekvencija koje spadaju unutar ovog intervala uzima se kao frekvencija koja odgovara intervalu).

1. R(raspon) = X max -X ​​​​min

2. k- broj grupa

3. (Sturgesova formula)

4. a = x min, b = x max

Zgodno je dobiveno grupiranje prikazati u obliku tablice učestalosti, koja se naziva serija statističke intervalne distribucije:

Intervali frakcije ...
Frekvencije ...

Analogna tablica može se formirati zamjenom frekvencija n i relativne frekvencije.

Uzorak dobiven tijekom eksperimentalno istraživanje, je neuređeni skup brojeva zapisan redoslijedom u kojem su izvršena mjerenja. Tipično, uzorak se sastavlja u obliku tablice, čiji prvi red (ili stupac) sadrži broj eksperimenta ja, au drugom (drugom) - fiksna vrijednost nasumična varijabla znak. U ovom obliku uzorak predstavlja primarni oblik evidentiranja statističkog materijala koji se može obraditi različiti putevi. Kao primjer, razmotrite rezultate prikazane na atletskim natjecanjima od strane bacača kugle i prikazane u tablici 1. Prvi redak ove tablice sadrži brojeve mjerenja, a drugi - njihove numeričke vrijednosti u metrima.

stol 1

Rezultati natjecanja u bacanju kugle

x i 16,36 14,91 15,31 14,26 14,77 13,88 14,97 14,01 14,07 14,48
x i 14,44 14,81 13,81 15,15 15,23 15,69 14,29 14,15 14,57 13,92
x i 13,62 14,92 15,73 13,22 14,65 14,8 13,04 15,1 13,3

Kao što se može vidjeti iz tablice 1, jednostavan statistički agregat prestaje biti prikladan oblik prezentiranja statističkog materijala čak i s relativno malom veličinom uzorka: prilično je glomazan i slabo vizualan. Vrlo je teško analizirati dobivene eksperimentalne podatke, a još manje donositi zaključke na temelju njih. Na temelju toga dobiveni statistički materijal mora se obraditi za daljnje istraživanje. Najjednostavniji način obrade uzorka je rangiranje. Rangiranje je raspored opcija u uzlaznom ili silaznom redoslijedu njihovih vrijednosti. Tablica 2 u nastavku prikazuje rangirani uzorak, čiji su elementi poredani uzlaznim redoslijedom.

tablica 2

Rezultati rangiranih natjecanja u bacanju kugle

x i 13,04 13,22 13,3 13,62 13,81 13,88 13,92 14,01 14,07 14,15
x i 14,26 14,29 14,44 14,48 14,57 14,65 14,77 14,8 14,81 14,91
x i 14,92 14,97 15,1 15,15 15,23 15,31 15,69 15,73 16,36

Ali čak iu ovom obliku, dobiveni eksperimentalni podaci su slabo vidljivi i od male su koristi izravna analiza. Zbog toga, da bi statistička građa bila kompaktnija i preglednija, mora se podvrgnuti daljnjoj obradi – izrađuje se tzv. statistička serija. Konstrukcija statističke serije počinje grupiranjem.

Grupiranje je proces organiziranja i sistematiziranja podataka dobivenih tijekom eksperimenta, s ciljem izdvajanja informacija sadržanih u njima. U procesu grupiranja uzorak se raspoređuje u skupine ili intervale grupiranja, od kojih svaki sadrži određeni raspon vrijednosti svojstva koje se proučava. Proces grupiranja počinje dijeljenjem cjelokupnog raspona varijacije karakteristike u intervale grupiranja.

Za svaku specifičnu namjenu statistička istraživanja, volumena uzorka koji se razmatra i stupnja varijacije karakteristike u njemu, postoji optimalna vrijednost za broj intervala i širinu svakog od njih. Približna vrijednost optimalan broj intervala k može se odrediti na temelju veličine uzorka P bilo koristeći podatke dane u tablici 3, ili koristeći Sturgessovu formulu:

k = 1 + 3,322 lg n.

Tablica 3

Određivanje broja intervala grupiranja

Vrijednost dobivena iz formule k gotovo uvijek ispadne razlomačka vrijednost koja se mora zaokružiti na cijeli broj, budući da broj intervala ne može biti razlomački. Praksa pokazuje da je u pravilu bolje zaokružiti, jer formula daje dobri rezultati na velike vrijednosti n, a kada je mali - donekle precijenjen.

Razmislite o grupiranju opcije uzorka u konkretan primjer. Da bismo to učinili, pogledajmo primjer bacača kugle (vidi tablice 1, 2). Broj intervala grupiranja odredit ćemo na temelju podataka danih u tablici 3. Uz veličinu uzorka n=29 preporučljivo je odabrati broj intervala jednak k=5 (Sturgessova formula daje vrijednost k =5,9).

Dogovorimo se da u primjeru koji razmatramo koristimo intervale jednake širine. U tom slučaju, nakon što se odredi broj intervala grupiranja, treba izračunati širinu svakog od njih koristeći odnos:

Ovdje h- širina intervala, i x max i x min - maksimalna odnosno minimalna vrijednost atributa u uzorku. Količine x max i x min određuju se izravno iz tablice izvornih podataka (vidi tablicu 2). U ovom slučaju:

(m).

Ovdje je potrebno zadržati se na točnosti određivanja širine intervala. Moguće su dvije situacije: točnost izračunate vrijednosti h odgovara točnosti eksperimenta ili je premašuje. U potonji slučaj Za određivanje granica intervala moguće je koristiti dva pristupa. S teorijska točka pogled najispravnije je koristiti dobivenu vrijednost h konstruirati intervale. Ovaj pristup neće unijeti dodatna iskrivljenja povezana s obradom eksperimentalnih podataka. Međutim, u praktične svrhe u statističkim studijama koje se odnose na fizička kultura i sport, uobičajeno je zaokružiti dobivenu vrijednost h na točnost mjerenja podataka. To je zbog činjenice da je za vizualni prikaz dobivenih rezultata pogodno da granice intervala budu moguće vrijednosti atributa. Dakle, dobivenu vrijednost širine intervala treba zaokružiti uzimajući u obzir točnost eksperimenta. Posebno napominjemo da se zaokruživanje ne smije vršiti u općeprihvaćenom matematičkom smislu, već prema gore, tj. u suvišku, kako se ne bi smanjio ukupni raspon varijacije karakteristike - zbroj širina svih intervala ne smije biti manji od razlike između maksimalne i minimalne vrijednosti karakteristike. U primjeru koji se razmatra, eksperimentalni podaci su određeni na najbližu stotinku (0,01 m), stoga vrijednost širine intervala dobivenu iznad treba zaokružiti na najbližu stotinku. Kao rezultat dobivamo:

h= 0,67 (m).

Nakon određivanja širine intervala grupiranja potrebno je odrediti njihove granice. Preporučljivo je uzeti donju granicu prvog intervala jednaku minimalnoj vrijednosti atributa u uzorku x min.:

x H1 = x min.

U primjeru koji se razmatra x Hl = 13,04 (m).

Da bi se dobila gornja granica prvog intervala ( x B1) trebate dodati vrijednost širine intervala vrijednosti donje granice prvog intervala:

x B1 = x H1 + h.

Imajte na umu da će gornja granica svakog intervala (ovdje prvog) istovremeno biti i donja granica sljedećeg (u u ovom slučaju drugi) interval: x H2 = x U 1.

Vrijednosti donje i gornje granice svih preostalih intervala određuju se na sličan način:

x B i = x N i +1 = x N i + h.

U ovom primjeru:

x B1 = x H2 = x H1 + h=13,04+0,67=13,71 (m),

x B2 = x H3 = x H2+ h=13,71+0,67=14,38 (m),

x B3 = x H4 = x H3+ h=14,38+0,67=15,05 (m),

x B4 = x H5 = x H4 + h=15,05+0,67=15,72 (m),

x B5 = x H5+ h=15,72+0,67=16,39 (m).

Prije grupiranja opcije, predstavljamo koncept srednja vrijednost intervala x i, jednaka vrijednosti obilježje jednako udaljeno od krajeva ovog intervala. S obzirom da je od donje granice udaljen za iznos jednak polovici širine intervala, za njegovo određivanje pogodno je koristiti relaciju:

x i=x N ja+ h/2,

Gdje x N i - donja granica ja-ro interval, i h- njegova širina. Srednje vrijednosti intervala koristit će se kasnije pri obradi grupiranih podataka.

Nakon utvrđivanja granica svih intervala, opcije uzorka treba rasporediti po tim intervalima. Ali prvo morate odlučiti u koji interval uključiti vrijednost koja se nalazi točno na granici dvaju intervala, odnosno kada se vrijednost opcija podudara s gornjom granicom jednog i donjom granicom intervala koji je uz njega. U tom slučaju, opcija se može dodijeliti bilo kojem od dva susjedna intervala i, kako bi se uklonila dvosmislenost u grupiranju, pristajemo u takvim slučajevima dodijeliti opcije gornjem intervalu. Sljedeći argument može se dati u korist ovog pristupa. Budući da se minimalna vrijednost atributa podudara s donjom granicom prvog intervala i uključena je u ovaj interval, tada opciju koja pada na granicu dvaju intervala treba klasificirati kao jedan od njih, čija je vrijednost donje granice jednak je opciji koja se razmatra.

Prijeđimo na razmatranje statističke tablice - vidi tablicu 4, koja se sastoji od sedam stupaca.

Tablica 4

Prikaz tablice rezultati bacanja kugle

Prva tri stupca statističke tablice sadrže redom brojeve intervala grupiranja ja, njihove granice x N ja- x U ja i srednje vrijednosti intervala x ja .

Četvrti stupac sadrži učestalosti intervala. Frekvencija interval je broj koji pokazuje koliko opcija postoji, tj. rezultati mjerenja su unutar ovog intervala. Za označavanje ove količine uobičajeno je koristiti simbol n i. Zbroj svih frekvencija svih intervala uvijek je jednak veličini uzorka P, pomoću koje se može provjeriti ispravnost grupiranja.

Peti stupac tablice 4. namijenjen je za unos u nju akumulirana frekvencija interval - broj dobiven zbrajanjem frekvencije trenutnog intervala s frekvencijama svih prethodnih intervala. Obično se označava akumulirana frekvencija latinično pismo N i. Akumulirana frekvencija pokazuje koliko opcija ima vrijednosti koje nisu veće od gornje granice intervala.

Učestalost se nalazi u šestom stupcu tablice. Frekvencija naziva se frekvencija predstavljena u relativnim terminima, tj. omjer učestalosti i veličine uzorka. Zbroj svih frekvencija uvijek je jednak 1. Simbol se koristi za označavanje frekvencije f i:

f i=n i /n.

Učestalost intervala povezana je s vjerojatnošću da slučajna varijabla padne u taj interval. Prema Bernoullijevom teoremu, s neograničenim povećanjem broja eksperimenata, učestalost događaja konvergira u vjerojatnosti njegovoj vjerojatnosti. Ako pod događajem razumijemo da vrijednost proučavane veličine pada u određeni interval, tada postaje jasno da kada veliki broj eksperimentima, učestalost intervala približava se vjerojatnosti da izmjerena slučajna varijabla padne u taj interval.

I frekvencija i učestalost opisuju ponovljivost rezultata u uzorku. Uspoređujući ih statistička značajnost, treba napomenuti da je informacijski sadržaj frekvencije znatno veći od sadržaja frekvencije. Doista, ako je, kao na primjer u tablici 4, učestalost drugog intervala 8 i stoga je 8 rezultata palo u ovaj interval, onda je teško razumjeti je li to malo ili puno; ako u uzorku ima 1000 varijanti, onda je ta učestalost mala, a ako ih ima 20, onda je velika. U ovom slučaju, za objektivna procjena potrebno je vrijednost frekvencije usporediti s veličinom uzorka. Ako koristite učestalost, možete odmah reći koji je udio rezultata pao unutar intervala koji se razmatra (približno 28% u navedenom primjeru). Stoga frekvencija daje više vizualni prikaz o ponovljivosti karakteristike u uzorku. Posebno treba istaknuti još jednu važnu prednost učestalosti. Njegova uporaba omogućuje usporedbu uzoraka različitih veličina. Učestalost nije primjenjiva u takve svrhe.

Sedmi stupac tablice sadrži akumuliranu frekvenciju. Kumulativna učestalost je omjer akumulirane frekvencije i veličine uzorka. Akumulirana frekvencija označena je slovom F i:

Akumulirana frekvencija pokazuje koji udio varijante uzorka ima vrijednosti koje ne prelaze vrijednost gornje granice intervala.

Zadnji redak statističke tablice služi za kontrolu grupiranja.

Nakon popunjavanja tablice, vratimo se na definiciju statističke serije. U pravilu se statistički niz prikazuje u obliku tablice u čijem su prvom retku navedeni intervali, au drugom retku frekvencije ili frekvencije koje im odgovaraju. Tako, statistički blizu nazvan dvostruko serije brojeva, uspostavljajući vezu između brojčane vrijednosti proučavanog svojstva i njegove učestalosti u uzorku. Značajna prednost statističkih serija je što one, za razliku od statističkih agregata, daju jasnu predodžbu o karakteristične značajke varijacija znakova.


©2015-2019 stranica
Sva prava pripadaju njihovim autorima. Ova stranica ne polaže pravo na autorstvo, ali omogućuje besplatnu upotrebu.
Datum izrade stranice: 20.08.2016

Najjednostavniji način sažimanja statističke građe je konstruiranje serija. Zbirni rezultat statističke studije može biti serija distribucije.

Nakon utvrđivanja obilježja grupiranja, broja grupa i intervala grupiranja, zbirni i grupirani podaci prikazuju se u obliku serija distribucije i prikazuju u obliku statističkih tablica.

Niz distribucije jedna je od vrsta grupiranja.

Blizu distribucije u statistici se uređena raspodjela populacijskih jedinica u skupine prema bilo kojem obilježju naziva: kvalitativna ili kvantitativna.

  1. Vrste distribucijskih serija

Ovisno o obilježju na kojem se temelji formiranje niza distribucije, atributivni i varijacijske serije distribucije:

    nizovi distribucije konstruirani prema kvalitativnim karakteristikama nazivaju se atributivnim;

    Varijacijski nizovi su nizovi distribucije konstruirani uzlaznim ili silaznim redoslijedom vrijednosti kvantitativnog obilježja.

Varijacijski niz distribucije sastoji se od dva stupca. Prvi stupac sadrži kvantitativne vrijednosti varirajuće karakteristike, koje se nazivaju varijante i označavaju. Diskretna opcija - izražena kao cijeli broj. Opcija intervala kreće se od i do. Ovisno o vrsti opcija, možete konstruirati diskretni ili intervalni niz varijacija. Drugi stupac sadrži broj specifičnih opcija, izraženih u terminima učestalosti ili učestalosti:

    frekvencije su apsolutni brojevi, pokazujući koliko se puta određena vrijednost atributa pojavljuje ukupno; zbroj svih frekvencija mora biti jednak broju jedinica u cjelokupnoj populaciji;

    učestalosti su učestalosti izražene kao postotak ukupnog broja; zbroj svih frekvencija izražen u postocima mora biti jednak 100% u razlomcima od jedan.

Serije varijacija karakteriziraju dva elementa: varijanta (X) i učestalost (f). Varijanta je zasebna vrijednost obilježja pojedine jedinice ili skupine stanovništva. Poziva se broj koji pokazuje koliko se puta pojavljuje određena vrijednost karakteristike frekvencija. Ako je frekvencija izražena kao relativni broj, onda se to naziva frekvencija.

Serije varijacija mogu biti:

    interval, kada su granice "od" i "do" definirane, serije intervalne distribucije mogu se prikazati grafički u obliku histograma;

    diskretan kada je karakteristika koja se proučava karakterizirana određenim brojem.

  1. Grafički prikaz serija distribucije

Distribucijske serije vizualno su prikazane pomoću grafičkih slika.

Serije distribucije prikazane su kao:

    odlagalište otpada;

    histogrami;

    kumulira;

Prilikom gradnje poligon za testiranje na vodoravnoj osi (apscisnoj osi) nanose se vrijednosti varirajuće karakteristike, a na okomita os(y-os) - frekvencije ili frekvencije.

Za gradnju histogrami Vrijednosti granica intervala naznačene su duž osi apscise i na njihovoj osnovi konstruirani su pravokutnici, čija je visina proporcionalna frekvencijama (ili frekvencijama).

Distribucija karakteristike u nizu varijacija preko akumuliranih frekvencija (učestalosti) prikazana je pomoću kumulacije.

Kumulira ili kumulativna krivulja, za razliku od poligona, konstruirana je od akumuliranih frekvencija ili frekvencija. U ovom slučaju, vrijednosti karakteristike postavljene su na apscisnu os, a akumulirane frekvencije ili frekvencije postavljene su na ordinatnu os.

Ogiva konstruiran je slično kumulatu s jedinom razlikom što su akumulirane frekvencije smještene na apscisnoj osi, a karakteristične vrijednosti na ordinatnoj osi.

Vrsta kumulata je koncentracijska krivulja ili Lorentzov dijagram. Za konstruiranje krivulje koncentracije, na obje osi pravokutnog koordinatnog sustava ucrtana je skala u postocima od 0 do 100. Istovremeno su akumulirane frekvencije naznačene na apscisnoj osi, a akumulirane vrijednosti udjela. (u postocima) po volumenu karakteristike naznačeni su na ordinatnoj osi.

Pretpostavimo da kao rezultat mjerenja parametara objekata koji se proučavaju postoji statistička populacija koja predstavlja skup vrijednosti SV X dobivenih kao rezultat mjerenja (opažanja).

Histogram je konstruiran sljedećim redoslijedom.

1. Cijeli raspon mjerenja SV () podijeljen je u intervale i izračunava se broj vrijednosti koje padaju na svaki interval. Ovaj broj je podijeljen sa ukupno mjerenja (proizvodi) i utvrđuje se učestalost koja odgovara tom intervalu.

Zbroj frekvencija svih znamenki očito mora biti jednak jedan.

2. Konstruirana je tablica 1.1 koja prikazuje intervale redoslijedom njihovog položaja duž apscisne osi i pripadajućih frekvencija. Ova tablica se zove statistički blizu.

Tablica 1.1

Statistički nizovi SV vrijednosti

Interval,
Broj vrijednosti
Frekvencija,

Ovdje je oznaka i-tog intervala; - njegove granice; k je broj intervala.

Prilikom grupiranja opaženih SW vrijednosti u intervale može doći do situacije u kojoj vrijednost pada na granicu intervala. U ovom slučaju postavlja se pitanje kojoj kategoriji treba pripisati ovu vrijednost. Preporuča se brojati dana vrijednost pripada jednako oba intervala i dodajte 0,5 brojevima oba intervala.

3. Određivanje broja intervala.

Broj intervala u koje treba grupirati statistički niz ne smije biti prevelik, jer u tom slučaju niz distribucije postaje neizražajan, a frekvencije u njemu pokazuju nepravilne fluktuacije. S druge strane, ne bi smio biti premalen, jer se s malim brojem intervala svojstva distribucije pregrubo opisuju statističkim serijama.

Praksa pokazuje da je u većini slučajeva racionalno odabrati broj intervala unutar 10¸20. Što je statistički materijal veći i homogeniji, to više velika količina intervali se mogu odabrati prilikom sastavljanja statističke serije.

Također možete koristiti empirijske formule, koje nude razni autori. U ovom radu predlaže se korištenje formula kao takvih sljedeći izrazi

Ovi izrazi dobiveni su za najčešće distribucije u praksi s kurtozom u rasponu od 1,8 do 6, odnosno od uniformne do Laplaceove distribucije.

Duljine intervala mogu biti iste ili različite. Očito, lakše ih je uzeti iste. Međutim, kada se pripremaju podaci o CB-ima koji su previše neravnomjerno raspoređeni, ponekad je zgodno odabrati u području najveća gustoća intervali distribucije su uži nego u području niske gustoće.

4. Grafički dizajn histograma.

Statistički niz je prikazan grafički u obliku tzv histogrami(Slika 1.1). Konstruiran je na sljedeći način. Intervali se crtaju po apscisnoj osi, a na svakom od intervala konstruira se pravokutnik kao baza čija je površina jednaka frekvenciji zadanog intervala. Da biste konstruirali histogram, trebate podijeliti učestalost svakog intervala s njegovom duljinom i uzeti dobiveni broj kao visinu pravokutnika. U slučaju intervala jednake duljine, visine pravokutnika proporcionalne su odgovarajućim frekvencijama. Iz načina konstruiranja histograma proizlazi da ukupna površina jednako je jedan.

Očito, kako se broj eksperimenata povećava, mogu se birati sve manji i manji intervali, au isto vrijeme, vrh histograma će se sve više približavati krivulji koja ograničava područje, jednako jedan. Ova krivulja je grafikon funkcija gustoće vjerojatnosti f(x) ( diferencijalna funkcija distribucija za kontinuirani CB ).

5. Funkcija statističke distribucije .

Koristeći podatke statističke serije, moguće je konstruirati statistička (empirijska) funkcija distribucije SV X. Da bi se to postiglo, iz niza se uzimaju točke x i granica intervala i odgovarajući zbroji frekvencija pi koji odgovaraju pravokutnicima histograma koji leže lijevo od tih točaka. Ove frekvencije i njihove sume označene su kao F(x i). Tada dobivamo sustav izraza koji određuju točke statističke funkcije distribucije. Njihovim spajanjem isprekidanom linijom ili glatkom krivuljom dobivamo približan graf funkcije statističke distribucije ( funkcija kumulativne distribucije za kontinuirani CB ) F(x) (slika 1.2).

Najvažnija faza u proučavanju društveno-ekonomskih pojava i procesa je sistematizacija primarnih podataka i na temelju toga dobivanje sumarne karakteristike cjelokupnog objekta pomoću općih pokazatelja, što se postiže sažimanjem i grupiranjem primarne statističke građe.

Statistički sažetak - to je kompleks sekvencijalne operacije generalizacijom specifičnih pojedinačnih činjenica koje tvore skup u cilju identifikacije tipične karakteristike i obrazaca svojstvenih fenomenu koji se proučava kao cjelini. Provođenje statističkog sažetka uključuje sljedeće korake :

  • odabir karakteristika grupiranja;
  • određivanje redoslijeda formiranja grupa;
  • razvoj sustava statistički pokazatelji karakterizirati skupine i objekt u cjelini;
  • razvoj izgleda statističkih tablica za prikaz sažetih rezultata.

Statističko grupiranje naziva se podjela jedinica populacije na koje se proučava homogene grupe prema određenim karakteristikama bitnim za njih. Grupiranja su najvažnija statistička metoda generalizacije Statistički podaci, osnova za ispravan izračun statističkih pokazatelja.

razlikovati sljedeće vrste grupiranja: tipološka, ​​strukturna, analitička. Sve ove grupiranja objedinjuje činjenica da su jedinice objekta podijeljene u skupine prema nekom obilježju.

Značajka grupiranja je karakteristika po kojoj se jedinice populacije dijele u posebne skupine. Iz pravi izbor Obilježje grupiranja određuje zaključke statističke studije. Kao osnova za grupiranje potrebno je koristiti značajna, teorijski utemeljena obilježja (kvantitativna ili kvalitativna).

Kvantitativne karakteristike grupiranja imati numerički izraz (opseg trgovanja, dob osobe, prihod obitelji itd.), i kvalitativni znakovi grupiranja odražavaju stanje jedinice populacije (spol, Obiteljski status, industrijska pripadnost poduzeća, njegov oblik vlasništva itd.).

Nakon što se utvrdi osnova grupiranja, mora se odlučiti o broju skupina u koje treba podijeliti proučavanu populaciju. Broj grupa ovisi o ciljevima istraživanja i vrsti pokazatelja koji je u osnovi grupiranja, obujmu populacije i stupnju varijacije obilježja.

Na primjer, grupiranje poduzeća prema vrsti vlasništva uzima u obzir općinsku, federalnu i federalnu imovinu. Ako se grupiranje vrši po kvantitativna karakteristika, tada je potrebno preokrenuti Posebna pažnja o broju jedinica proučavanog objekta i stupnju fluktuacije obilježja grupiranja.

Nakon što se odredi broj grupa, moraju se odrediti intervali grupiranja. Interval - to su vrijednosti različitih karakteristika koje se nalaze unutar određenih granica. Svaki interval ima svoju vrijednost, gornju i donju granicu ili barem jednu od njih.

Donja granica intervala naziva se najmanja vrijednost karakteristike u intervalu, i Gornja granica - najveća vrijednost karakteristike u intervalu. Vrijednost intervala je razlika između gornje i donje granice.

Ovisno o veličini, intervali grupiranja su jednaki ili nejednaki. Ako se varijacija karakteristike očituje unutar relativno uskih granica i distribucija je ujednačena, tada se grupa gradi u jednakim intervalima. Veličina jednak interval određena sljedećom formulom :

gdje Xmax, Xmin - maksimum i minimalna vrijednost karakteristike u agregatu; n - broj grupa.

Najjednostavnije grupiranje u kojem je svaka odabrana skupina karakterizirana jednim pokazateljem predstavlja niz distribucije.

Serije statističke distribucije - ovo je uređena raspodjela populacijskih jedinica u skupine prema određenom obilježju. Ovisno o obilježju na kojem se formira niz distribucije, razlikuju se atributivni i varijacijski niz distribucije.

Atributivni nazivaju se nizovi distribucije konstruirani prema kvalitativne značajke, odnosno znakove koji nemaju brojčani izraz(raspodjela prema vrsti rada, prema spolu, prema profesiji itd.). Serija atributa distribucije karakteriziraju sastav stanovništva prema određenim bitnim obilježjima. Uzeti u nekoliko razdoblja, ti podaci omogućuju proučavanje promjena u strukturi.

Serije varijacija nazivaju se serije distribucije konstruirane na kvantitativnoj osnovi. Svaki niz varijacija sastoji se od dva elementa: opcija i učestalosti. Mogućnosti se zovu pojedinačne vrijednosti karakteristike koje ono zauzima u nizu varijacija, odnosno specifična vrijednost varirajućeg obilježja.

Frekvencije nazivaju se brojevi pojedinih varijanti ili svake skupine varijacijskog niza, odnosno to su brojevi koji pokazuju koliko se često pojedine varijante pojavljuju u nizu distribucije. Zbroj svih frekvencija određuje veličinu cijele populacije, njen volumen. Frekvencije nazivaju se frekvencije izražene u dijelovima jedinice ili kao postotak ukupnog broja. Sukladno tome, zbroj frekvencija je jednak 1 ili 100%.

Ovisno o prirodi varijacije obilježja, razlikuju se tri oblika varijacijskih serija: rangirane serije, diskretne serije i intervalne serije.

Rangirane serije varijacija - ovo je distribucija pojedinačnih jedinica populacije u uzlaznom ili silaznom redoslijedu karakteristike koja se proučava. Rangiranje vam omogućuje jednostavno dijeljenje kvantitativnih podataka u skupine, odmah otkrivanje najmanjih i najveća vrijednost karakteristika, istaknuti vrijednosti koje se najčešće ponavljaju.

Diskretni varijacijski nizovi karakterizira distribuciju populacijskih jedinica prema diskretnom obilježju koje ima samo cjelobrojne vrijednosti. Na primjer, tarifna kategorija, broj djece u obitelji, broj zaposlenih u poduzeću itd.

Ako karakteristika ima kontinuiranu promjenu, koja unutar određenih granica može poprimiti bilo koje vrijednosti ("od - do"), tada je za ovu karakteristiku potrebno izgraditi intervalne varijacijske serije . Na primjer, iznos prihoda, radni staž, trošak dugotrajne imovine poduzeća itd.

Primjeri rješavanja zadataka na temu “Statistički sažetak i grupiranje”

Problem 1 . Postoji podatak o broju knjiga koje su studenti dobili putem pretplate u protekloj akademskoj godini.

Konstruirajte rangirane i diskretne serije distribucije varijacija, označavajući elemente serije.

Riješenje

Ovaj set predstavlja mnogo opcija za broj knjiga koje studenti dobivaju. Izbrojimo broj takvih opcija i posložimo ih u obliku varijacijski rangiranih i varijacijskih diskretnih serija distribucije.

Problem 2 . Postoje podaci o troškovima dugotrajne imovine za 50 poduzeća, tisuća rubalja.

Konstruirajte niz distribucije, ističući 5 grupa poduzeća (u jednakim intervalima).

Riješenje

Za rješavanje biramo najveći i najmanja vrijednost vrijednost dugotrajne imovine poduzeća. To su 30,0 i 10,2 tisuća rubalja.

Nađimo veličinu intervala: h = (30,0-10,2):5= 3,96 tisuća rubalja.

Tada će prva skupina uključivati ​​poduzeća čija dugotrajna imovina iznosi od 10,2 tisuće rubalja. do 10,2+3,96=14,16 tisuća rubalja. Bit će 9 takvih poduzeća čija će osnovna sredstva iznositi od 14,16 tisuća rubalja. do 14,16+3,96=18,12 tisuća rubalja. Slično će biti 16 takvih poduzeća hajdemo pronaći broj poduzeća uključena u treću, četvrtu i petu skupinu.

Dobiveni niz distribucije stavljamo u tablicu.

Problem 3 . Za niz poduzeća lake industrije dobiveni su sljedeći podaci:

Grupirajte poduzeća prema broju radnika, formirajući 6 grupa na jednakim razmacima. Izračunajte za svaku grupu:

1. broj poduzeća
2. broj radnika
3. obujam proizvedenih proizvoda godišnje
4. prosječni stvarni učinak po radniku
5. obujam dugotrajne imovine
6. prosječna veličina osnovna sredstva jednog poduzeća
7. prosječna vrijednost proizvoda koje proizvede jedno poduzeće

Rezultate proračuna prikazati u tablicama. Donesite zaključke.

Riješenje

Za rješavanje ćemo odabrati najveću i najmanju vrijednost prosječnog broja radnika u poduzeću. To su 43 i 256.

Nađimo veličinu intervala: h = (256-43):6 = 35,5

Tada će u prvu skupinu ući poduzeća čiji je prosječan broj radnika od 43 do 43 + 35,5 = 78,5 ljudi. U drugu grupu ući će 5 poduzeća čiji će prosječni broj radnika biti od 78,5 do 78,5+35,5=114 radnika. Bit će 12 takvih poduzeća. Slično ćemo pronaći broj poduzeća uključenih u treću, četvrtu, petu i šestu skupinu.

Dobivenu seriju distribucije stavljamo u tablicu i izračunavamo potrebne pokazatelje za svaku skupinu:

Zaključak : Kao što je vidljivo iz tablice, druga skupina poduzeća je najbrojnija. Uključuje 12 poduzeća. Najmanje skupine su peta i šesta skupina (po dva poduzeća). To su najveća poduzeća (po broju radnika).

Budući da je druga skupina najveća, obujam proizvoda godišnje proizvedenih od strane poduzeća ove skupine i obujam dugotrajne imovine znatno su veći od ostalih. Istovremeno, prosječni stvarni učinak po radniku u poduzećima ove skupine nije najveći. Ovdje prednjače poduzeća četvrte skupine. Ova grupa također čini prilično veliki obujam dugotrajne imovine.

Zaključno napominjemo da je prosječna veličina dugotrajne imovine i Prosječna vrijednost proizvedeni proizvodi jednog poduzeća izravno su proporcionalni veličini poduzeća (broju radnika).