Biografije Karakteristike Analiza

Konstrukcija diskretnog niza. Konstrukcija diskretnog varijacijskog niza

Pošaljite svoj dobar rad u bazu znanja jednostavno je. Koristite obrazac u nastavku

Dobar posao na stranicu">

Studenti, diplomanti, mladi znanstvenici koji koriste bazu znanja u svom studiju i radu bit će vam vrlo zahvalni.

Objavljeno na http://www.allbest.ru/

ZADATAK1

Dostupne su sljedeće informacije o plaće zaposlenici u poduzeću:

Tablica 1.1

Iznos plaća u konv. jazbina jedinice

Potrebno je izgraditi intervalni niz distribucije pomoću kojeg se nalazi;

1) prosječna plaća;

2) prosječno linearno odstupanje;

4) standardna devijacija;

5) raspon varijacije;

6) koeficijent oscilacije;

7) linearni koeficijent varijacije;

8) jednostavni koeficijent varijacije;

10) medijan;

11) koeficijent asimetrije;

12) Pearsonov indeks asimetrije;

13) koeficijent kurtoze.

Odluka

Kao što znate, opcije (prepoznate vrijednosti) poredane su uzlaznim redoslijedom u obliku diskretne varijacijske serije. S velikim brojem varijanti (više od 10), čak iu slučaju diskretne varijacije grade se intervalne serije.

Ako je niz intervala sastavljen s parnim intervalima, tada se raspon varijacije dijeli s navedeni broj intervali. U tom slučaju, ako je dobivena vrijednost cijeli broj i jednoznačna (što je rijetko), tada se duljina intervala uzima jednakom ovom broju. U drugim slučajevima proizvedeno zaokruživanje nužno u strana povećanje, Tako do posljednja preostala znamenka bila je parna. Očito, s povećanjem duljine intervala, raspon varijacije po veličini, jednak umnošku broj intervala: razlika između izračunate i početne duljine intervala

a) Ako je vrijednost proširenja raspona varijacije beznačajna, tada se ili dodaje najvećoj ili oduzima od najmanje vrijednosti značajke;

b) Ako je veličina širenja raspona varijacije opipljiva, tada se, kako bi se izbjeglo miješanje središta raspona, grubo dijeli na pola, istodobno dodajući najvećim i oduzimajući od najmanjih vrijednosti značajka.

Ako se niz intervala sastavlja s nejednakim intervalima, tada je proces pojednostavljen, ali kao i prije, duljina intervala mora biti izražena kao broj sa zadnjom parnom znamenkom, što uvelike pojednostavljuje naknadne izračune. numeričke karakteristike.

30 - veličina uzorka.

Sastavimo niz intervalne distribucije pomoću Sturgesove formule:

K \u003d 1 + 3,32 * lg n,

K - broj grupa;

K \u003d 1 + 3,32 * lg 30 \u003d 5,91 \u003d 6

Pronalazimo raspon znaka - plaće zaposlenika u poduzeću - (x) prema formuli

R \u003d xmax - xmin i podijelite sa 6; R=195-112=83

Tada će duljina intervala biti l traka=83:6=13.83

Početak prvog intervala bit će 112. Dodavanje 112 l ras=13,83, dobivamo njegovu konačnu vrijednost 125,83, što je ujedno i početak drugog intervala itd. kraj petog intervala je 195.

Pri pronalaženju frekvencija treba se voditi pravilom: "ako se vrijednost značajke podudara s granicom unutarnjeg intervala, tada se treba odnositi na prethodni interval."

Dobivamo intervalni niz frekvencija i kumulativne frekvencije.

Tablica 1.2

Dakle, 3 zaposlenika imaju plaće. plaćanje od 112 do 125,83 konvencionalnih jedinica. Najveća plaća plaćanje od 181,15 do 195 konvencionalnih jedinica. samo 6 radnika.

Da bismo izračunali numeričke karakteristike, pretvaramo intervalni niz u diskretni, uzimajući sredinu intervala kao varijantu:

Tablica 1.3

14131,83

Prema formuli ponderirane aritmetičke sredine

cond.pon.un.

Prosječno linearno odstupanje:

gdje je xi vrijednost proučavane značajke u i-toj jedinici populacije,

Prosječna vrijednost proučavanog svojstva.

Objavljeno na http://www.allbest.ru/

LObjavljeno na http://www.allbest.ru/

Monetarna jedinica

Standardna devijacija:

Disperzija:

Relativni raspon varijacije (koeficijent oscilacije): c=R:,

Relativno linearno odstupanje: q = L:

Koeficijent varijacije: V = y:

Koeficijent oscilacije pokazuje relativnu volatilnost ekstremne vrijednosti znak se odnosi na aritmetičku sredinu, a koeficijent varijacije karakterizira stupanj i homogenost populacije.

c \u003d R: \u003d 83 / 159,485 * 100% \u003d 52,043%

Dakle, razlika između ekstremnih vrijednosti je 5,16% (=94,84%-100%) manja od prosječne plaće zaposlenih u poduzeću.

q \u003d L: \u003d 17,765 / 159,485 * 100% \u003d 11,139%

V \u003d y: \u003d 21,704 / 159,485 * 100% \u003d 13,609%

Koeficijent varijacije je manji od 33%, što ukazuje na slabu varijaciju plaća zaposlenih u poduzeću, tj. da Prosječna vrijednost tipična je karakteristika nadnica radnika (homogen agregat).

U seriji intervalne distribucije moda određuje se formulom -

Učestalost modalnog intervala, tj. intervala koji sadrži najveći broj opcija;

Učestalost intervala koji prethodi modalnom;

Učestalost intervala koji slijedi nakon modala;

Duljina modalnog intervala;

Donja granica modalnog intervala.

Za određivanje medijani u intervalnom nizu koristimo formulu

gdje je kumulativna (kumulativna) frekvencija intervala koji prethodi medijanu;

Donja granica srednjeg intervala;

Učestalost srednjeg intervala;

Duljina srednjeg intervala.

Srednji interval- interval čija akumulirana frekvencija (=3+3+5+7) prelazi polovicu zbroja frekvencija - (153,49; 167,32).

Izračunajmo zakrivljenost i kurtozu, za što ćemo sastaviti novi radni list:

Tablica 1.4

Činjenični podaci

Procijenjeni podaci

Izračunajte moment trećeg reda

Prema tome, asimetrija je

Od 0,3553 0,25, asimetrija se prepoznaje kao značajna.

Izračunajte moment četvrtog reda

Prema tome, kurtosis je

Kao< 0, то эксцесс является плосковершинным.

Stupanj asimetrije može se odrediti pomoću Pearsonovog koeficijenta asimetrije (As): oscilacija uzorak trošak promet

gdje je aritmetička sredina serije distribucije; -- moda; -- standardna devijacija.

Kod simetrične (normalne) distribucije = Mo, dakle, koeficijent asimetrije je nula. Ako je As > 0, tada postoji više moda, dakle, postoji desna asimetrija.

Ako je As< 0, то manje mode, dakle, postoji lijevostrana asimetrija. Koeficijent asimetrije može varirati od -3 do +3.

Distribucija nije simetrična, već ima lijevostranu asimetriju.

ZADATAK 2

Kolika bi trebala biti veličina uzorka tako da postoji vjerojatnost od 0,954 da pogreška uzorkovanja ne prijeđe 0,04 ako je poznato da je varijanca iz prethodnih istraživanja 0,24?

Odluka

Veličina uzorka na bez ponovnog izbora izračunava se formulom:

t - koeficijent pouzdanosti (uz vjerojatnost 0,954 jednak je 2,0; određuje se iz tablica integrala vjerojatnosti),

y2=0,24 - standardna devijacija;

10000 ljudi - veličina uzorka;

Dx \u003d 0,04 - granična pogreška srednja vrijednost uzorka.

S vjerojatnošću od 95,4%, može se tvrditi da veličina uzorka pruža relativna pogreška ne više od 0,04, trebalo bi biti najmanje 566 obitelji.

ZADATAK3

Dostupni su sljedeći podaci o prihodu od glavne djelatnosti poduzeća, u milijunima rubalja.

Da biste analizirali niz dinamike, odredite sljedeće pokazatelje:

1) lančani i osnovni:

Apsolutni dobici;

Stope rasta;

Stope rasta;

2) srednje

Razina dinamičkog raspona;

Apsolutni rast;

Brzina rasta;

Stopa povećanja;

3) apsolutna vrijednost rasta od 1%.

Odluka

1. Apsolutni rast (Dy)- ovo je razlika između sljedeće razine serije i prethodne (ili osnovne):

lanac: Du \u003d yi - yi-1,

osnovno: Du \u003d yi - y0,

yi - razina retka,

i - broj razine reda,

y0 - razina bazne godine.

2. Stopa rasta (uto) je omjer sljedeće razine niza i prethodne (ili bazne godine 2001):

lanac: Tu = ;

osnovni: Tu =

3. Stopa rasta (TD) - ovo je omjer apsolutnog rasta prema prethodnoj razini, izražen u%.

lanac: Tu = ;

osnovni: Tu =

4. Apsolutna vrijednost povećanje od 1% (A)- je omjer apsolutnog rasta lanca i stope rasta, izražen u%.

I =

Razina srednjeg reda izračunato pomoću formule aritmetičke sredine.

Prosječna razina prihoda od osnovne djelatnosti za 4 godine:

Prosječni apsolutni rast izračunava se formulom:

gdje je n broj razina u nizu.

U prosjeku, za godinu, prihod od osnovne djelatnosti porastao je za 3,333 milijuna rubalja.

Prosječna godišnja stopa rasta izračunava se formulom geometrijske sredine:

un - konačna razina serije,

y0 - Prva razina red.

uto \u003d 100% \u003d 102,174%

Prosječna godišnja stopa rasta izračunava se formulom:

T? \u003d Tu - 100% \u003d 102,74% - 100% \u003d 2,74%.

Tako su u prosjeku za godinu prihodi od osnovne djelatnosti poduzeća porasli za 2,74%.

ZADACII4

Izračunati:

1. Individualni indeksi cijena;

2. Opći indeks prometa;

3. Agregatni indeks cijena;

4. Zbirni indeks fizičkog obujma prodaje robe;

5. Apsolutni porast vrijednosti prometa i raščlanjivanje po faktorima (zbog promjene cijena i broja prodane robe);

6. Napravite kratke zaključke za sve dobivene bodove.

Odluka

1. Po uvjetima, pojedinačni indeksi cijena proizvoda A, B, C iznosili su -

ipA=1,20; ipB=1,15; irV=1,00.

2. Indeks ukupnog prometa izračunava se po formuli:

I w \u003d \u003d 1470/1045 * 100% \u003d 140,67%

Promet u trgovini porastao je za 40,67% (140,67% -100%).

Cijene sirovina u prosjeku su porasle za 10,24 posto.

Visina dodatnih troškova za kupce od povećanja cijena:

w(p) = ? p1q1-? p0q1 \u003d 1470 - 1333.478 \u003d 136.522 milijuna rubalja.

Kao rezultat rasta cijena, kupci su morali potrošiti dodatnih 136,522 milijuna rubalja.

4. Opći indeks fizičkog obujma robne razmjene:

Fizički obujam robne razmjene porastao je za 27,61%.

5. Definirajte opća promjena promet u drugom razdoblju u usporedbi s prvim razdobljem:

w \u003d 1470- 1045 \u003d 425 milijuna rubalja.

zbog promjene cijena:

W(p) \u003d 1470 - 1333,478 \u003d 136,522 milijuna rubalja.

promjenom fizičke glasnoće:

w(q) \u003d 1333,478 - 1045 \u003d 288,478 milijuna rubalja.

Promet robe veći je za 40,67 posto. Cijene u prosjeku za 3 robe povećane su za 10,24%. Fizički obujam robne razmjene porastao je za 27,61%.

Općenito, obujam prodaje porastao je za 425 milijuna rubalja, uključujući zbog rasta cijena, porastao je za 136,522 milijuna rubalja, a zbog povećanja obima prodaje - za 288,478 milijuna rubalja.

ZADATAK5

Za 10 pogona u jednoj industriji dostupni su sljedeći podaci.

Tvornički br.

Izlaz, tisuća komada (X)

Na temelju datih podataka:

I) potvrditi odredbe logičke analize o prisutnosti linearne korelacije između predznaka faktora (proizvodnja) i rezultantnog predznaka (potrošnja električne energije), iscrtati početne podatke na grafu korelacijskog polja i izvući zaključke o oblik odnosa, navesti njegovu formulu;

2) odrediti parametre jednadžbe veze i dobivenu teorijsku liniju ucrtati na graf korelacijskog polja;

3) izračunati linearni koeficijent korelacije,

4) obrazložiti vrijednosti pokazatelja dobivenih u stavku 2) i 3);

5) pomoću dobivenog modela napraviti prognozu moguće potrošnje električne energije u postrojenju s proizvodnim obujmom od 4,5 tisuća jedinica.

Odluka

Znakovni podaci - obujam proizvodnje (faktor), označen s hi; znak - potrošnja električne energije (rezultat) kroz ui; točke s koordinatama (x, y) ucrtane su na OXY korelacijsko polje.

Točke korelacijskog polja nalaze se duž neke ravne linije. Dakle, veza je linearna, regresijsku jednadžbu ćemo tražiti u obliku pravca Yx=ax+b. Da bismo ga pronašli, koristimo sustav normalnih jednadžbi:

Kreirajmo proračunsku tablicu.

Na temelju dobivenih prosjeka sastavljamo sustav i rješavamo ga s obzirom na parametre a i b:

Dakle, dobivamo regresijsku jednadžbu za y na x: \u003d 3,57692 x + 3,19231

Na korelacijskom polju gradimo regresijsku liniju.

Zamjenom vrijednosti x iz stupca 2 u regresijsku jednadžbu dobivamo izračunate (stupac 7) i uspoređujemo ih s podacima y, što se odražava u stupcu 8. Usput, potvrđena je i ispravnost izračuna slučajnošću prosječnih vrijednosti y i.

Koeficijentlinearna korelacija ocjenjuje čvrstoću odnosa između značajki x i y i izračunava se formulom

Kutni koeficijent izravne regresije a (na x) karakterizira smjer identificiranogovisnostiznakovi: za a>0 su isti, za a<0- противоположны. Njegov apsolutni vrijednost - mjera promjene predznaka rezultante kada se predznak faktorijela promijeni po jedinici mjerenja.

Slobodni član izravne regresije otkriva smjer, a njegova apsolutna vrijednost - kvantitativnu mjeru utjecaja na efektivni predznak svih ostalih faktora.

Ako< 0, tada se resurs atributa faktora pojedinog objekta koristi s manje, i kada>0 Sviši učinak od prosjeka za cijeli skup objekata.

Napravimo postregresijsku analizu.

Koeficijent pri x izravne regresije je 3,57692 > 0, dakle, s povećanjem (smanjenjem) proizvodnje, potrošnja električne energije raste (pada). Povećanje proizvodnje za 1 tisuću komada. daje prosječno povećanje potrošnje električne energije za 3,57692 tisuće kWh.

2. Slobodni član izravne regresije je 3,19231, dakle, utjecaj drugih čimbenika povećava snagu utjecaja proizvodnje na potrošnju električne energije u apsolutno mjerenje za 3,19231 tisuća kWh.

3. Koeficijent korelacije od 0,8235 otkriva vrlo blisku ovisnost potrošnje električne energije o učinku.

Prema jednadžbi regresijski model lako napraviti predviđanja. Da biste to učinili, vrijednosti x, volumen proizvodnje, zamjenjuju se u regresijsku jednadžbu i predviđa se potrošnja električne energije. U ovom slučaju, vrijednosti x mogu se uzeti ne samo unutar zadanog raspona, već i izvan njega.

Napravimo prognozu o mogućoj potrošnji električne energije u postrojenju s proizvodnim opsegom od 4,5 tisuća jedinica.

3,57692*4,5 + 3,19231= 19,288 45 tisuća kWh.

POPIS KORIŠTENIH IZVORA

1. Zakharenkov S.N. Socioekonomska statistika: Vodič za studij. - Minsk: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Opća teorija statistika. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistika. - M.: Prospekt, 2002.

4. Opća teorija statistike / Ed. izd. O.E. Bašina, A.A. Spirin. - M.: Financije i statistika, 2000.

5. Socioekonomska statistika: Udžbenik.-praktič. dodatak / Zakharenkov S.N. itd. - Minsk: YSU, 2004.

6. Socioekonomska statistika: Zbornik. džeparac. / Ed. Nesterovich S.R. - Minsk: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistika - Minsk, 2000.

8. Harčenko L.P. Statistika. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistika. - M.: INFRA - M, 1999.

10. Ekonomska statistika / Ed. Yu.N. Ivanova - M., 2000.

Domaćin na Allbest.ru

...

Slični dokumenti

    Izračun aritmetičke sredine za intervalne serije distribucija. Definicija opći indeks fizički obujam trgovine. Analiza apsolutne promjene ukupnih troškova proizvodnje uslijed promjena fizičkog obujma. Izračun koeficijenta varijacije.

    test, dodan 19.07.2010

    Suština trgovine na veliko, malo i javne trgovine. Formule za izračun pojedinačnih, zbirnih indeksa prometa. Izračun karakteristika niza intervalne distribucije - aritmetička sredina, mod i medijan, koeficijent varijacije.

    seminarski rad, dodan 10.05.2013

    Izračun planiranog i stvarnog obima prodaje, postotak plana, apsolutna promjena prometa. Određivanje apsolutnog rasta, prosječnih stopa rasta i rasta novčanih prihoda. Izračun strukturnih prosjeka: modusi, medijani, kvartili.

    test, dodan 24.02.2012

    Intervalni niz raspodjele banaka po obimu dobiti. Određivanje moda i medijana dobivenog niza intervalne distribucije grafička metoda i kroz izračune. Izračun karakteristika serije intervalne distribucije. Izračunavanje aritmetičke sredine.

    test, dodan 15.12.2010

    Formule za određivanje prosječnih vrijednosti intervalne serije - modovi, medijani, varijance. Izračun analitičkih pokazatelja vremenskih serija prema lančanim i osnovnim shemama, stope rasta i rasta. Pojam kompozitnog indeksa troškova, cijena, troškova i prometa.

    seminarski rad, dodan 27.02.2011

    Pojam i namjena, red i pravila građenja varijacijske serije. Analiza homogenosti podataka u skupinama. Pokazatelji varijacije (fluktuacije) svojstva. Određivanje linearne sredine i standardna devijacija, koeficijent oscilacije i varijacija.

    test, dodan 26.04.2010

    Pojam modusa i medijana kao tipičnih obilježja, redoslijed i kriteriji za njihovo određivanje. Određivanje moda i medijana u diskretnom i intervalnom nizu varijacija. Kvartili i decili kao dodatne karakteristike varijacijskih statističkih serija.

    test, dodan 11.09.2010

    Konstrukcija intervalnog niza distribucije na osnovi grupiranja. Karakterizacija odstupanja distribucije frekvencija od simetrične forme, izračun pokazatelja kurtoze i asimetrije. Analiza pokazatelja bilance ili računa dobiti i gubitka.

    kontrolni rad, dodano 19.10.2014

    Transformacija empirijskog niza u diskretni i intervalni. Određivanje prosječne vrijednosti diskretnog niza pomoću njegovih svojstava. Izračun diskretnog niza modova, medijana, indikatora varijacije (disperzija, devijacija, koeficijent oscilacije).

    test, dodan 17.04.2011

    Konstrukcija statističkog niza distribucije organizacija. Grafička definicija način i srednje vrijednosti. Čvrstoća korelacije s korištenjem koeficijenta determinacije. Određivanje pogreške uzorkovanja prosječnog broja zaposlenih.

Najlakše je generalizirati statistički materijal je konstrukcija redova. Zbirni rezultat statistička studija mogu postojati distribucijske linije. Niz distribucije u statistici je uređena distribucija populacijskih jedinica u skupine prema bilo kojem atributu: kvalitativnom ili kvantitativnom. Ako je niz izgrađen na kvalitativnoj osnovi, onda se naziva atributivnim, a ako na kvantitativni atribut, zatim varijacijski.

Varijacijski niz karakteriziraju dva elementa: varijanta (X) i učestalost (f). Varijanta je posebna vrijednost znaka posebne jedinice ili skupine stanovništva. Broj koji pokazuje koliko se puta pojavljuje određena vrijednost značajke naziva se učestalost. Ako je frekvencija izražena kao relativni broj, onda se naziva frekvencija. Serije varijacija mogu biti intervalne kada su definirane granice “od” i “do” ili mogu biti diskretne kada se osobina koja se proučava karakterizira određenim brojem.

Razmotrit ćemo konstrukciju varijacijskih nizova na primjerima.

Primjer. a postoje i podaci o platnim kategorijama 60 radnika u jednoj od radionica pogona.

Raspodijeliti radnike prema tarifnoj kategoriji, izgraditi niz varijacija.

Da bismo to učinili, ispisujemo sve vrijednosti atributa uzlaznim redoslijedom i izračunavamo broj radnika u svakoj grupi.

Tablica 1.4

Raspodjela radnika po kategorijama

Čin radnika (X)

Broj radnika

osoba (f)

u % ukupnog (posebno)

Dobili smo varijacijski diskretni niz u kojem je osobina koja se proučava (radnički čin) predstavljena određenim brojem. Radi jasnoće, niz varijacija je grafički prikazan. Na temelju ovog niza distribucije konstruirana je distribucijska ploha.

Riža. 1.1. Poligon za raspored radnika po platnim kategorijama

Razmotrit ćemo konstrukciju intervalnog niza s jednakim intervalima koristeći sljedeći primjer.

Primjer. Poznati podaci o trošku osnovnog kapitala 50 poduzeća u milijunima rubalja. Potrebno je prikazati raspodjelu poduzeća prema trošku fiksnog kapitala.

Da bismo prikazali distribuciju poduzeća prema trošku fiksnog kapitala, najprije odlučujemo o broju grupa koje želimo razlikovati. Pretpostavimo da odlučimo izdvojiti 5 grupa poduzeća. Zatim određujemo veličinu intervala u skupini. Da bismo to učinili, koristimo formulu

Prema našem primjeru.

Dodavanjem vrijednosti intervala minimalnoj vrijednosti atributa dobivamo grupe poduzeća prema trošku fiksnog kapitala.

Jedinica koja ima dvostruka vrijednost, odnosi se na grupu u kojoj djeluje kao gornja granica (tj. vrijednost značajke 17 će ići u prvu grupu, 24 u drugu itd.).

Izbrojimo broj biljaka u svakoj skupini.

Tablica 1.5

Raspodjela poduzeća prema vrijednosti fiksnog kapitala (milijuna rubalja)

Trošak fiksnog kapitala
u milijunima rubalja (X)

Broj tvrtki
(frekvencija) (f)

Akumulirane frekvencije
(kumulativno)

Prema ovoj distribuciji dobiven je niz varijacijskih intervala iz kojeg proizlazi da 36 poduzeća ima stalni kapital u vrijednosti od 10 do 24 milijuna rubalja. itd.

Serije intervalne distribucije mogu se grafički prikazati kao histogram.

Rezultati obrade podataka dokumentirani su u statističke tablice. Statističke tablice sadrže svoj subjekt i predikat.

Predmet je onaj skup ili dio skupa koji je podvrgnut obilježju.

Predikat je pokazatelj koji karakterizira subjekt.

Razlikuju se tablice: jednostavne i skupne, kombinacijske, s jednostavnim i složenim razvojem predikata.

Jednostavna tablica u predmetu sadrži popis pojedinačnih jedinica.

Ako predmet ima grupiranje jedinica, onda se takva tablica naziva skupna tablica. Na primjer, skupina poduzeća prema broju radnika, skupine stanovništva prema spolu.

Predmet kombinirane tablice sadrži grupiranje prema dva ili više kriterija. Na primjer, stanovništvo je podijeljeno prema spolu u skupine prema obrazovanju, dobi itd.

Kombinacijske tablice sadrže informacije koje vam omogućuju prepoznavanje i karakterizaciju odnosa niza pokazatelja i obrazac njihovih promjena u prostoru i vremenu. Kako bi tablica bila vizualna pri razvijanju svoje teme, ograničeni su na dva ili tri znaka, tvoreći ograničeni broj skupina za svaki od njih.

Predikat u tablicama može se razviti na različite načine. Uz jednostavan razvoj predikata, svi njegovi pokazatelji nalaze se neovisno jedan o drugom.

Sa složenim razvojem predikata, pokazatelji se međusobno kombiniraju.

Pri izradi bilo koje tablice mora se polaziti od ciljeva studije i sadržaja obrađenog materijala.

Osim tablica, statistika koristi grafikone i dijagrame. Grafikon - statistički podaci se prikazuju pomoću geometrijski oblici. Grafikoni se dijele na linijske i trakaste, ali mogu postojati i vitičasti grafikoni (crteži i simboli), okrugli grafikoni(za krug je uzeta vrijednost cijele populacije, a prikazane su površine pojedinih sektora specifična gravitacija ili dio toga sastavni dijelovi), radijalne karte(izgrađen na temelju polarnih ordinata). Kartogram je kombinacija konturne karte ili plana područja s dijagramom.

Prikupljeni rezultati grupiranja Statistički podaci, u pravilu, prikazani su u obliku serija distribucije. Niz raspodjele je uređena raspodjela populacijskih jedinica u skupine prema svojstvu koje se proučava.

Serije distribucije dijele se na atributne i varijacijske, ovisno o značajci koja je u osnovi grupiranja. Ako je znak kvalitativan, tada se serija distribucije naziva atributivnom. Primjer niza atributa je distribucija poduzeća i organizacija prema obliku vlasništva (vidi tablicu 3.1).

Ako je atribut na temelju kojeg je konstruirana serija distribucije kvantitativna, tada se serija naziva varijacijskom.

Varijacijski niz distribucije uvijek se sastoji od dva dijela: varijante i njima odgovarajućih frekvencija (ili frekvencija). Varijanta je vrijednost koja može poprimiti značajku u jedinicama populacije, učestalost je broj jedinica promatranja koje imaju danu vrijednost značajke. Zbroj učestalosti uvijek je jednak veličini populacije. Ponekad se umjesto učestalosti računaju učestalosti - to su učestalosti izražene ili u dijelovima jedinice (tada je zbroj svih frekvencija jednak 1), ili kao postotak volumena populacije (zbroj učestalosti bit će jednak 100%).

Varijacijski nizovi su diskretni i intervalni. Za diskretne serije (tablica 3.7) opcije su izražene konkretne brojke, obično cijeli.

Tablica 3.8. Raspodjela zaposlenih prema radnom vremenu u osiguravajućem društvu
Radno vrijeme u poduzeću punih godina(opcije) Broj zaposlenih
Ljudski (frekvencije) u % od ukupnog broja (često)
do godinu dana 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Ukupno 129 100,0

U nizu intervala (vidi tablicu 3.2), vrijednosti indikatora postavljene su kao intervali. Intervali imaju dvije granice: donju i gornju. Intervali mogu biti otvoreni i zatvoreni. Otvoreni nemaju niti jedan od obruba, pa u tablici. 3.2 prvi interval nema donju granicu, a posljednji nema gornju granicu. Prilikom konstruiranja niza intervala, ovisno o prirodi širenja vrijednosti atributa, koriste se jednaki i nejednaki intervali (tablica 3.2 prikazuje niz varijacija s jednakim intervalima).

Ako značajka ima ograničen broj vrijednosti, obično ne više od 10, grade se diskretne serije distribucije. Ako je varijanta veća, tada diskretna serija gubi svoju vidljivost; u ovom slučaju preporučljivo je koristiti intervalni oblik varijacijskog niza. Uz kontinuiranu varijaciju značajke, kada se njezine vrijednosti unutar određenih granica razlikuju jedna od druge za proizvoljno mali iznos, također se gradi niz intervalne distribucije.

3.3.1. Konstrukcija diskretnih varijacijskih nizova

Razmotrite tehniku ​​konstruiranja diskretnih varijacijskih nizova koristeći primjer.

Primjer 3.2. O kvantitativnom sastavu 60 obitelji dostupni su sljedeći podaci:

Da bi se dobila predodžba o raspodjeli obitelji prema broju njihovih članova, potrebno je konstruirati varijacijski niz. Budući da atribut ima ograničen broj cjelobrojnih vrijednosti, konstruiramo diskretni varijacijski niz. Da biste to učinili, prvo se preporuča ispisati sve vrijednosti atributa (broj članova u obitelji) uzlaznim redoslijedom (tj. rangirati statističke podatke):

Zatim morate prebrojati broj obitelji s istim sastavom. Broj članova obitelji (vrijednost varijable svojstva) su opcije (označit ćemo ih s x), broj obitelji s istim sastavom su frekvencije (označit ćemo ih s f). Rezultate grupiranja predstavljamo u obliku sljedećeg diskretnog varijacijskog niza distribucije:

Tablica 3.11.
Broj članova obitelji (x) Broj obitelji (y)
1 8
2 14
3 20
4 9
5 5
6 4
Ukupno 60

3.3.2. Konstrukcija intervalnih varijacijskih serija

Pokažimo metodu konstruiranja niza intervalne varijacijske distribucije koristeći sljedeći primjer.

Primjer 3.3. Kao rezultat statističko promatranje dobili sljedeće podatke o prosječnoj kamatnoj stopi 50 poslovnih banaka (%):

Tablica 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Kao što vidite, izuzetno je nezgodno pregledavati takav niz podataka, osim toga, nema obrazaca promjene u indikatoru. Konstruirajmo niz intervalne distribucije.

  1. Definirajmo broj intervala.

    Broj intervala u praksi često određuje sam istraživač na temelju ciljeva svakog pojedinog promatranja. Međutim, može se izračunati i matematički pomoću Sturgessove formule

    n = 1 + 3,322lgN,

    gdje je n broj intervala;

    N je obujam populacije (broj jedinica promatranja).

    Za naš primjer dobivamo: n \u003d 1 + 3,322lgN \u003d 1 + 3,322lg50 \u003d 6,6 "7.

  2. Odredimo vrijednost intervala (i) formulom

    gdje je x max - najveća vrijednost značajke;

    x min - minimalna vrijednost atributa.

    Za naš primjer

    Intervali varijacijskog niza su ilustrativni ako njihove granice imaju "zaokružene" vrijednosti, pa ćemo vrijednost intervala 1,9 zaokružiti na 2, a minimalnu vrijednost obilježja 12,3 na 12,0.

  3. Definirajmo granice intervala.

    Intervali se u pravilu pišu tako da je gornja granica jednog intervala ujedno i donja granica sljedećeg intervala. Dakle, za naš primjer, dobivamo: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24.0-26.0.

    Takav zapis znači da je značajka kontinuirana. Ako se varijante atributa strogo prihvate određene vrijednosti, na primjer, samo cijeli brojevi, ali njihov broj je prevelik za izgradnju diskretne serije, tada možete stvoriti niz intervala gdje se donja granica intervala neće poklapati s gornjom granicom sljedećeg intervala (to će značiti da je značajka diskretna). Na primjer, u raspodjeli zaposlenika poduzeća prema dobi, možete stvoriti sljedeće intervalne skupine godina: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 i više.

    Također, u našem primjeru, mogli bismo otvoriti prvi i zadnji interval, itd. pisati: do 14,0; 24.0 i više.

  4. Na temelju početnih podataka konstruiramo rangirani niz. Da bismo to učinili, pišemo uzlaznim redoslijedom vrijednosti koje značajka zauzima. Rezultati su prikazani u tablici: Tablica 3.13. Rangirane serije kamatnih stopa poslovnih banaka
    Stopa banke % (opcije)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Izračunajmo frekvencije.

    Prilikom brojanja frekvencija može doći do situacije da vrijednost značajke padne na granicu intervala. U tom slučaju možete slijediti pravilo: dana jedinica se dodjeljuje intervalu za koji je njezina vrijednost gornja granica. Dakle, vrijednost 16.0 u našem primjeru odnosit će se na drugi interval.

Rezultati grupiranja dobiveni u našem primjeru bit će prikazani u tablici.

Tablica 3.14. Podjela poslovnih banaka prema kamatnim stopama
Kratka stopa, % Broj banaka, jedinica (frekvencije) Akumulirane frekvencije
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Ukupno 50 -

Zadnji stupac tablice predstavlja akumulirane frekvencije koje se dobivaju uzastopnim zbrajanjem frekvencija, počevši od prvog (npr. za prvi interval - 5, za drugi interval 5 + 9 = 14, za treći interval 5 + 9 + 4 = 18, itd.). Akumulirana učestalost, npr. 33, pokazuje da 33 banke imaju stopu kredita koja ne prelazi 20% (gornja granica odgovarajućeg intervala).

U procesu grupiranja podataka pri konstruiranju varijacijskih serija ponekad se koriste nejednaki intervali. Ovo se odnosi na one slučajeve gdje karakteristične vrijednosti poštuju pravilo aritmetike ili geometrijska progresija ili kada primjena Sturgessove formule rezultira "praznim" intervalnim grupama koje ne sadrže jedinice promatranja. Tada granice intervala proizvoljno postavlja sam istraživač na temelju zdrav razum i ciljevi ankete ili formule. Dakle, za podatke koji se mijenjaju aritmetička progresija, vrijednost intervala izračunava se na sljedeći način.

Stanje:

Postoje podaci o starosnom sastavu radnika (godine): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Izgradite niz intervalne distribucije.
    2. Izgraditi grafička slika red.
    3. Grafički odredi modu i medijan.

Odluka:

1) Prema Sturgessovoj formuli, stanovništvo se mora podijeliti u 1 + 3,322 lg 30 = 6 grupa.

Maksimalna dob je 38 godina, a minimalna 18 godina.

Širina intervala Budući da krajevi intervala moraju biti cijeli brojevi, podijelit ćemo populaciju u 5 skupina. Širina intervala - 4.

Da bismo olakšali izračune, posložimo podatke uzlaznim redoslijedom: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29 , 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

Distribucija dobni sastav radnika

Grafički, serija se može prikazati kao histogram ili poligon. Histogram - stupčasti grafikon. Baza stupca je širina intervala. Visina trake jednaka je frekvenciji.

Poligon (ili poligon distribucije) je grafikon frekvencija. Da bismo ga izgradili prema histogramu, spojimo središta gornjih stranica pravokutnika. Zatvaramo poligon na x-osi na udaljenosti jednake polovici intervala od krajnjih x vrijednosti.

Mod (Mo) je vrijednost osobine koja se proučava, koja se najčešće pojavljuje u određenoj populaciji.

Da biste odredili način iz histograma, trebate odabrati najviši pravokutnik, povući liniju od desnog vrha ovog pravokutnika udesno gornji kut prethodnog pravokutnika i nacrtajte liniju od lijevog vrha modalnog pravokutnika do lijevog vrha sljedećeg pravokutnika. Iz točke sjecišta ovih linija povucite okomicu na x-os. Apscisa će biti moda. Mo ≈ 27,5. To znači da je najčešća dob u ovoj populaciji 27-28 godina.

Medijan (Me) je vrijednost osobine koja se proučava, koja je u sredini uređenog niza varijacija.

Medijan nalazimo kumulatom. Cumulate - graf akumuliranih frekvencija. Apscise su varijante niza. Ordinate su akumulirane frekvencije.

Da bismo odredili medijan za kumulat, nalazimo duž ordinatne osi točku koja odgovara 50% akumuliranih frekvencija (u našem slučaju, 15), povlačimo ravnu liniju kroz nju, paralelnu s osi Ox, i povlačimo okomitu na osi x od točke njezina presjeka s kumulatom. Apscisa je medijan. Ja ≈ 25.9. To znači da je polovica radnika u ovoj populaciji mlađa od 26 godina.

Najvažnija faza u proučavanju društveno-ekonomskih pojava i procesa je sistematizacija primarnih podataka i na temelju toga dobivanje sumarne karakteristike cjelokupnog objekta pomoću generalizirajućih pokazatelja, što se postiže sažimanjem i grupiranjem primarne statističke građe.

Statistički sažetak je kompleks uzastopne operacije na generalizaciji specifičnih pojedinačnih činjenica koje tvore skup, identificirati tipične karakteristike i obrazaca svojstvenih fenomenu koji se proučava kao cjelini. Provođenje statističkog sažetka uključuje sljedeće korake :

  • izbor značajke grupiranja;
  • određivanje redoslijeda formiranja skupina;
  • razvoj sustava statistički pokazatelji karakterizirati skupine i objekt u cjelini;
  • izrada izgleda statističkih tablica za prikaz sumarnih rezultata.

Statističko grupiranje naziva podjela jedinica proučavane populacije na homogene grupe prema određenim karakteristikama koje su im bitne. Grupiranja su najvažnija statistička metoda generalizacija statističkih podataka, osnova za pravilno izračunavanje statističkih pokazatelja.

razlikovati sljedeće vrste grupiranja: tipološka, ​​strukturna, analitička. Sva ta grupiranja objedinjuje činjenica da su jedinice objekta podijeljene u skupine prema nekom svojstvu.

znak grupiranja naziva se znak kojim se jedinice stanovništva dijele u posebne skupine. Iz pravi izbor značajka grupiranja ovisi o zaključcima statističke studije. Kao temelj za grupiranje potrebno je koristiti značajna, teorijski potkrijepljena obilježja (kvantitativna ili kvalitativna).

Kvantitativni znakovi grupiranja imati numerički izraz (opseg trgovanja, dob osobe, prihod obitelji itd.), i kvalitativne značajke grupiranja odražavaju stanje jedinice populacije (spol, bračni status, industrijska pripadnost poduzeća, njegov oblik vlasništva itd.).

Nakon što se utvrdi osnova grupiranja, treba odlučiti o broju skupina u koje treba podijeliti ispitivanu populaciju. Broj skupina ovisi o ciljevima istraživanja i vrsti pokazatelja koji je u osnovi grupiranja, volumenu populacije, stupnju varijacije svojstva.

Na primjer, grupiranje poduzeća prema oblicima vlasništva uzima u obzir općinsku, federalnu i imovinu subjekata federacije. Ako se grupiranje provodi na kvantitativnoj osnovi, tada je potrebno obrnuti Posebna pažnja o broju jedinica proučavanog objekta i stupnju fluktuacije atributa grupiranja.

Kada se odredi broj grupa, treba odrediti i intervale grupiranja. Interval - to su vrijednosti varijabilne karakteristike koje leže unutar određenih granica. Svaki interval ima svoju vrijednost, gornju i donju granicu ili barem jednu od njih.

Donja granica intervala naziva se najmanja vrijednost atributa u intervalu, i Gornja granica - najveća vrijednost atributa u intervalu. Vrijednost intervala je razlika između gornje i donje granice.

Intervali grupiranja, ovisno o veličini, su: jednaki i nejednaki. Ako se varijacija svojstva očituje u relativno uskim granicama i distribucija je ujednačena, tada se grupiranje gradi s jednakim intervalima. Vrijednost jednak interval određuje se sljedećom formulom :

gdje Xmax, Xmin - maksimum i minimalna vrijednost osobina u agregatu; n je broj grupa.

Najjednostavnije grupiranje, u kojem je svaka odabrana grupa karakterizirana jednim pokazateljem, je serija distribucije.

Statističke serije distribucija - ovo je uređena raspodjela populacijskih jedinica u skupine prema određenom atributu. Ovisno o svojstvu na kojem se formira niz distribucije, razlikuju se atributivni i varijacijski niz distribucije.

atributivni naziva se serija distribucije konstruirana prema kvalitativne značajke, odnosno znakove koji nemaju brojčani izraz(raspodjela po vrstama poslova, po spolu, po profesijama itd.). Redovi atributa distribucije karakteriziraju sastav stanovništva prema jednom ili drugom bitnom obilježju. Uzeti kroz nekoliko razdoblja, ovi podaci omogućuju nam proučavanje promjena u strukturi.

Varijacijski redovi nazvane serije distribucije izgrađene na kvantitativnoj osnovi. Svaki varijacijski niz sastoji se od dva elementa: varijanti i učestalosti. Mogućnosti nazvao pojedinačne vrijednosti svojstvo, koje uzima u varijacijskom nizu, odnosno specifičnu vrijednost varirajućeg svojstva.

Frekvencije naziva se broj pojedine varijante ili svake skupine varijacijskog niza, odnosno to su brojevi koji pokazuju koliko se često pojedine varijante pojavljuju u nizu distribucije. Zbroj svih frekvencija određuje veličinu cijele populacije, njen volumen. Frekvencije nazivaju se frekvencije, izražene u dijelovima jedinice ili kao postotak od ukupnog broja. Sukladno tome, zbroj frekvencija je jednak 1 ili 100%.

Ovisno o prirodi varijacije svojstva, razlikuju se tri oblika varijacijske serije: rangirana serija, diskretna serija i intervalna serija.

Rangirane serije varijacija - ovo je distribucija pojedinih jedinica populacije u uzlaznom ili silaznom redoslijedu osobine koja se proučava. Rangiranje olakšava podjelu kvantitativnih podataka u skupine, odmah otkrivanje najmanjih i najveća vrijednost značajku, označite vrijednosti koje se najčešće ponavljaju.

Diskretni varijacijski nizovi karakterizira distribuciju populacijskih jedinica prema diskretnom atributu koji ima samo cjelobrojne vrijednosti. Na primjer, tarifna kategorija, broj djece u obitelji, broj zaposlenih u poduzeću itd.

Ako znak ima kontinuiranu promjenu, koja unutar određenih granica može poprimiti bilo koje vrijednosti ("od - do"), tada za ovaj znak morate izgraditi serija intervalnih varijacija . Na primjer, iznos prihoda, radno iskustvo, trošak dugotrajne imovine poduzeća itd.

Primjeri rješavanja zadataka na temu "Statistički sažetak i grupiranje"

Zadatak 1 . Postoji podatak o broju knjiga koje su studenti dobili u pretplati za proteklu akademsku godinu.

Izgradite rasponski i diskretni varijacijski niz distribucije, označavajući elemente niza.

Odluka

Ovaj set predstavlja skup opcija za broj knjiga koje studenti dobivaju. Izbrojimo broj takvih varijanti i posložimo ih u obliku varijacijskih rangiranih i varijacijskih diskretnih serija distribucije.

Zadatak 2 . Postoje podaci o vrijednosti dugotrajne imovine za 50 poduzeća, tisuća rubalja.

Izgradite niz distribucije, ističući 5 grupa poduzeća (u jednakim intervalima).

Odluka

Za rješenje biramo najveći i najmanja vrijednost vrijednost dugotrajne imovine poduzeća. To su 30,0 i 10,2 tisuća rubalja.

Pronađite veličinu intervala: h \u003d (30,0-10,2): 5 \u003d 3,96 tisuća rubalja.

Tada će prva grupa uključivati ​​poduzeća čija je dugotrajna imovina od 10,2 tisuće rubalja. do 10,2 + 3,96 = 14,16 tisuća rubalja. Takvih će poduzeća biti 9. Druga skupina će uključivati ​​poduzeća čija će dugotrajna imovina iznositi od 14,16 tisuća rubalja. do 14,16 + 3,96 = 18,12 tisuća rubalja. Bit će 16 takvih poduzeća. pronaći broj poduzeća uključena u treću, četvrtu i petu skupinu.

Dobiveni niz distribucije nalazi se u tablici.

Zadatak 3 . Za niz poduzeća lake industrije dobiveni su sljedeći podaci:

Napravite grupiranje poduzeća prema broju radnika formirajući 6 grupa na jednakim razmacima. Brojite za svaku grupu:

1. broj poduzeća
2. broj radnika
3. obujam proizvedenih proizvoda godišnje
4. prosječni stvarni učinak po radniku
5. iznos dugotrajne imovine
6. prosječna veličina osnovna sredstva jednog poduzeća
7. prosječna vrijednost proizvedenih proizvoda jednog poduzeća

Rezultate izračuna zabilježite u tablice. Zaključite sami.

Odluka

Za rješenje biramo najveću i najmanju vrijednost prosječnog broja radnika u poduzeću. To su 43 i 256.

Odredite veličinu intervala: h = (256-43): 6 = 35,5

Tada će u prvu skupinu ući poduzeća s prosječnim brojem radnika od 43 do 43 + 35,5 = 78,5 ljudi. Takvih će poduzeća biti 5. U drugu skupinu ući će poduzeća u kojima će prosječan broj radnika biti od 78,5 do 78,5 + 35,5 = 114 ljudi. Takvih će poduzeća biti 12. Slično tome, nalazimo broj poduzeća uključenih u treću, četvrtu, petu i šestu skupinu.

Rezultirajuću seriju distribucije stavljamo u tablicu i izračunavamo potrebne pokazatelje za svaku skupinu:

Zaključak : Kao što je vidljivo iz tablice, druga skupina poduzeća je najbrojnija. Uključuje 12 poduzeća. Najmanje su peta i šesta skupina (po dva poduzeća). To su najveća poduzeća (po broju radnika).

Budući da je druga skupina najbrojnija, obujam godišnje proizvodnje poduzeća ove skupine i obujam dugotrajne imovine znatno su veći od ostalih. Istovremeno, prosječni stvarni učinak jednog radnika u poduzećima ove skupine nije najveći. Ovdje prednjače poduzeća četvrte skupine. Ova grupa također čini prilično veliki iznos dugotrajne imovine.

Zaključno napominjemo da su prosječna veličina dugotrajne imovine i prosječna vrijednost outputa jednog poduzeća izravno proporcionalne veličini poduzeća (u smislu broja radnika).