Biografije Karakteristike Analiza

Konstrukcija diskretne serije. Konstrukcija diskretne varijacione serije

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Dobar posao na stranicu">

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

ZADATAK1

Dostupne su sljedeće informacije o plate zaposleni u preduzeću:

Tabela 1.1

Iznos plata u konvencionalnim terminima. den. jedinice

Potrebno je konstruisati intervalnu seriju distribucije pomoću koje se može pronaći;

1) prosečna plata;

2) prosečno linearno odstupanje;

4) standardna devijacija;

5) opseg varijacije;

6) koeficijent oscilacije;

7) linearni koeficijent varijacije;

8) jednostavan koeficijent varijacije;

10) medijana;

11) koeficijent asimetrije;

12) Pearsonov indeks asimetrije;

13) koeficijent kurtozisa.

Rješenje

Kao što znate, opcije (prepoznate vrijednosti) su poređane rastućim redoslijedom u formu diskretne serije varijacija. Sa velikim brojem opcija (više od 10), čak iu slučaju diskretne varijacije, konstruišu se intervalne serije.

Ako se intervalni niz sastavlja s parnim intervalima, tada se raspon varijacije dijeli sa specificirani broj intervalima. Štaviše, ako je rezultirajuća vrijednost cijeli broj i nedvosmislena (što je rijetko), onda se pretpostavlja da je dužina intervala jednaka ovom broju. U drugim slučajevima proizvedeno zaokruživanje Neophodno V strana povećati, Dakle to zadnja cifra je bila paran. Očigledno, kako se dužina intervala povećava, raspon varijacija po veličini, jednak proizvodu broj intervala: razlika između izračunate i početne dužine intervala

A) Ako je veličina proširenja raspona varijacije beznačajna, tada se ili dodaje najvećoj ili oduzima od najmanje vrijednosti karakteristike;

b) Ako je veličina proširenja raspona varijacije uočljiva, tada se, kako bi se izbjegla zabuna središta raspona, grubo podijeli na pola istovremenim dodavanjem najvećem i oduzimanjem od najmanjih vrijednosti karakteristika.

Ako se sastavlja niz intervala sa nejednakim intervalima, proces se pojednostavljuje, ali se dužina intervala i dalje mora izraziti kao broj sa posljednjom parnom znamenkom, što uvelike pojednostavljuje naknadna izračunavanja numeričke karakteristike.

30 je veličina uzorka.

Kreirajmo intervalnu seriju distribucije koristeći Sturgesovu formulu:

K = 1 + 3,32*log n,

K - broj grupa;

K = 1 + 3,32*lg 30 = 5,91=6

Opseg atributa - plate radnika u preduzeću - (x) pronalazimo koristeći formulu

R= xmax - xmin i podijeliti sa 6; R= 195-112=83

Tada će dužina intervala biti l traka=83:6=13,83

Početak prvog intervala će biti 112. Dodajući se na 112 l ras = 13,83, dobijamo njegovu konačnu vrijednost 125,83, što je ujedno i početak drugog intervala itd. kraj petog intervala - 195.

Prilikom pronalaženja frekvencija treba se voditi pravilom: "ako se vrijednost neke karakteristike poklapa s granicom unutrašnjeg intervala, onda je treba pripisati prethodnom intervalu."

Dobijamo intervalni niz frekvencija i kumulativnih frekvencija.

Tabela 1.2

Dakle, 3 zaposlena imaju platu. naknada od 112 do 125,83 konvencionalnih novčanih jedinica. Najveća plata naknada od 181,15 do 195 konvencionalnih novčanih jedinica. samo 6 zaposlenih.

Da bismo izračunali numeričke karakteristike, transformiramo niz intervala u diskretni niz, uzimajući sredinu intervala kao opciju:

Tabela 1.3

14131,83

Korištenje formule ponderirane aritmetičke sredine

konvencionalnim novčanim jedinicama

Prosječna linearna devijacija:

gdje je xi vrijednost karakteristike koja se proučava za i-tu jedinicu populacije,

Prosječna vrijednost proučavane osobine.

Objavljeno na http://www.allbest.ru/

LObjavljeno http://www.allbest.ru/

Konvencionalne novčane jedinice

Standardna devijacija:

disperzija:

Relativni raspon varijacije (koeficijent oscilacije): c= R:,

Relativna linearna devijacija: q = L:

Koeficijent varijacije: V = y:

Koeficijent oscilacije pokazuje relativnu oscilaciju ekstremne vrednosti karakteristika se odnosi na aritmetičku sredinu, a koeficijent varijacije karakteriše stepen i homogenost populacije.

c= R: = 83 / 159,485*100% = 52,043%

Dakle, razlika između ekstremnih vrednosti je 5,16% (=94,84%-100%) manja od prosečne plate zaposlenih u preduzeću.

q = L: = 17,765/ 159,485*100% = 11,139%

V = y: = 21,704/ 159,485*100% = 13,609%

Koeficijent varijacije je manji od 33%, što ukazuje na slabu varijaciju zarada radnika u preduzeću, tj. to prosječna vrijednost je tipična karakteristika zarada radnika (populacija je homogena).

U intervalnim serijama distribucije moda određena formulom -

Učestalost modalnog intervala, tj. intervala koji sadrži najveći broj opcija;

Učestalost intervala koji prethodi modalnom;

Učestalost intervala nakon modalnog;

Dužina modalnog intervala;

Donja granica modalnog intervala.

Za utvrđivanje medijane u nizu intervala koristimo formulu

gdje je kumulativna (akumulirana) frekvencija intervala koji prethodi medijani;

Donja granica srednjeg intervala;

Medijan intervalne frekvencije;

Dužina srednjeg intervala.

Medijan interval- interval čija akumulirana frekvencija (=3+3+5+7) prelazi polovinu zbira frekvencija - (153,49; 167,32).

Izračunajmo asimetriju i kurtozis, za koje ćemo kreirati novi radni list:

Tabela 1.4

činjenični podaci

Izračunati podaci

Izračunajmo trenutak trećeg reda

Prema tome, asimetrija je jednaka

Pošto je 0,3553 0,25, asimetrija se smatra značajnom.

Izračunajmo trenutak četvrtog reda

Prema tome, eksces je jednak

Jer< 0, то эксцесс является плосковершинным.

Stupanj asimetrije se može odrediti korištenjem Pearsonovog koeficijenta asimetrije (As): obrt vrijednosti uzorka oscilacije

gdje je aritmetička sredina serije distribucije; -- moda; -- standardna devijacija.

Sa simetričnom (normalnom) raspodjelom = Mo, dakle, koeficijent asimetrije je nula. Ako je As > 0, tada postoji više moda, dakle, postoji desna asimetrija.

If As< 0, то manje mode, dakle, postoji levostrana asimetrija. Koeficijent asimetrije može varirati od -3 do +3.

Distribucija nije simetrična, već ima asimetriju na lijevoj strani.

ZADATAK 2

Kolika treba da bude veličina uzorka da sa verovatnoćom 0,954 greška uzorkovanja ne pređe 0,04 ako se na osnovu prethodnih istraživanja zna da je varijansa 0,24?

Rješenje

Veličina uzorka na ponovljen izbor izračunato po formuli:

t - koeficijent pouzdanosti (sa vjerovatnoćom od 0,954 jednak je 2,0; određeno iz tabela integrala vjerovatnoće),

y2=0,24 - standardna devijacija;

10.000 ljudi - veličina uzorka;

Dx =0,04 - marginalna greška prosek uzorka.

Sa vjerovatnoćom od 95,4% može se reći da veličina uzorka pruža relativna greška ne više od 0,04, mora biti najmanje 566 porodica.

ZADATAK3

Dostupni su sljedeći podaci o prihodima od glavnih aktivnosti poduzeća, miliona rubalja.

Za analizu niza dinamike odredite sljedeće indikatore:

1) lančani i osnovni:

Apsolutna povećanja;

Stope rasta;

Stopa rasta;

2) prosjek

Dynamics row level;

Apsolutno povećanje;

Stopa rasta;

Stopa povećanja;

3) apsolutna vrijednost povećanja od 1%.

Rješenje

1. Apsolutno povećanje (Dy)- ovo je razlika između sljedećeg nivoa serije i prethodnog (ili osnovnog):

lanac: DN = yi - yi-1,

osnovno: DN = yi - y0,

ui - nivo reda,

i - broj nivoa reda,

y0 - nivo bazne godine.

2. Stopa rasta (Tu) je omjer sljedećeg nivoa serije i prethodnog (ili bazne godine 2001.):

lanac: Tu = ;

osnovno: Tu =

3. Stopa rasta (TD) je odnos apsolutnog rasta u odnosu na prethodni nivo, izražen u %.

lanac: Tu = ;

osnovno: Tu =

4. Apsolutna vrijednost 1% povećanje (A)- ovo je omjer apsolutnog rasta lanca i stope rasta, izražen u %.

A =

Prosječan nivo reda izračunato pomoću formule aritmetičke sredine.

Prosječan nivo prihoda od osnovne djelatnosti za 4 godine:

Prosječno apsolutno povećanje izračunato po formuli:

gdje je n broj nivoa serije.

U prosjeku, za godinu, prihod od osnovne djelatnosti povećan je za 3,333 miliona rubalja.

Prosječna godišnja stopa rasta izračunato pomoću formule geometrijske sredine:

un je završni nivo reda,

y0 - Prvi nivo red.

Tu = 100% = 102,174%

Prosječna godišnja stopa rasta izračunato po formuli:

T? = Ut - 100% = 102,74% - 100% = 2,74%.

Tako je u proseku tokom godine prihod od osnovne delatnosti preduzeća povećan za 2,74%.

ZADACIA4

Izračunati:

1. Pojedinačni indeksi cijena;

2. Opšti indeks trgovinskog prometa;

3. Agregatni indeks cijena;

4. Zbirni indeks fizičkog obima prodaje robe;

5. Apsolutni porast vrijednosti trgovinskog prometa raščlaniti po faktorima (zbog promjena cijena i broja prodate robe);

6. Napravite kratki zaključci za sve dobijene indikatore.

Rješenje

1. Prema stanju, pojedinačni indeksi cijena za proizvode A, B, C iznosili su -

ipA=1,20; irB=1,15; irV=1,00.

2. Izračunat ćemo opći indeks trgovinskog prometa koristeći formulu:

I w = = 1470/1045*100% = 140,67%

Trgovinski promet je povećan za 40,67% (140,67%-100%).

Cijene roba su u prosjeku porasle za 10,24%.

Visina dodatnih troškova kupaca od povećanja cijena:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478= 136,522 miliona rubalja.

Kao rezultat rasta cijena, kupci su morali potrošiti dodatnih 136,522 miliona rubalja.

4. Opšti indeks fizičkog obima trgovinskog prometa:

Fizički obim trgovinskog prometa povećan je za 27,61%.

5. Hajde da definišemo ukupna promjena promet u drugom periodu u odnosu na prvi period:

w = 1470-1045 = 425 miliona rubalja.

zbog promjena cijena:

W(p) = 1470 - 1333,478 = 136,522 miliona rubalja.

zbog promjena u fizičkom volumenu:

w(q) = 1333,478 - 1045 = 288,478 miliona rubalja.

Promet robe povećan je za 40,67%. Cijene su u prosjeku za 3 robe porasle za 10,24%. Fizički obim trgovinskog prometa povećan je za 27,61%.

Općenito, obim prodaje porastao je za 425 miliona rubalja, uključujući i zbog rasta cijena za 136,522 miliona rubalja, a zbog povećanja obima prodaje - za 288,478 miliona rubalja.

ZADATAK5

Dostupni su sljedeći podaci za 10 tvornica u jednoj industriji.

Broj biljke

Proizvodnja proizvoda, hiljada kom. (X)

Na osnovu datih podataka:

I) potvrditi odredbe logičke analize o postojanju linearne korelacije između faktorske karakteristike (volumen proizvoda) i rezultantne karakteristike (potrošnja električne energije), iscrtati početne podatke na grafu korelacionog polja i izvesti zaključke o obliku odnosa, navedite njegovu formulu;

2) odrediti parametre jednačine veze i naneti rezultujuću teorijsku liniju na grafik korelacionog polja;

3) izračunati koeficijent linearne korelacije,

4) objasni značenje indikatora dobijenih u st. 2) i 3);

5) koristeći dobijeni model, napraviti prognozu moguće potrošnje energije u postrojenju sa obimom proizvodnje od 4,5 hiljada jedinica.

Rješenje

Podaci atributa - obim proizvodnje (faktor), biće označeni sa xi; znak - potrošnja električne energije (rezultat) kroz yi; tačke sa koordinatama (x, y) su iscrtane na korelacionom polju OXY.

Tačke korelacionog polja nalaze se duž određene prave linije. Prema tome, odnos je linearan, tražićemo jednadžbu regresije u obliku prave linije Ux=ax+b. Da bismo ga pronašli, koristimo sistem normalnih jednačina:

Kreirajmo proračunsku tablicu.

Koristeći pronađene prosjeke, komponujemo sistem i rješavamo ga s obzirom na parametre a i b:

Dakle, dobijamo jednačinu regresije za y na x: = 3,57692 x + 3,19231

Na korelacionom polju gradimo liniju regresije.

Zamjenom x vrijednosti iz kolone 2 u regresionu jednačinu, dobijamo izračunate (kolona 7) i upoređujemo ih sa podacima y, što se ogleda u koloni 8. Inače, ispravnost proračuna potvrđuje podudarnost prosječnih vrijednosti y i.

Koeficijentlinearna korelacija procjenjuje bliskost odnosa između karakteristika x i y i izračunava se pomoću formule

Ugaoni koeficijent direktne regresije a (na x) karakterizira smjer identificiranogzavisnostiznaci: za a>0 oni su isti, za a<0- противоположны. Njegova apsolutna vrijednost - mjera promjene rezultantne karakteristike kada se faktorska karakteristika promijeni za jedinicu mjere.

Slobodni termin direktne regresije otkriva pravac, a njegova apsolutna vrijednost je kvantitativna mjera utjecaja svih ostalih faktora na rezultirajuću karakteristiku.

Ako< 0, tada se resurs faktorske karakteristike pojedinačnog objekta koristi sa manje i kada>0 Withveća efikasnost od prosjeka za cijeli skup objekata.

Hajde da izvršimo postregresijsku analizu.

Koeficijent pri x direktne regresije jednak je 3,57692 >0, dakle, s povećanjem (smanjenjem) proizvodnog učinka, potrošnja električne energije raste (opada). Povećanje proizvodnje za 1 hiljadu jedinica. daje prosječno povećanje potrošnje električne energije za 3,57692 hiljade kWh.

2. Slobodni termin direktne regresije jednak je 3,19231, dakle, uticaj drugih faktora povećava jačinu uticaja proizvodnje proizvoda na potrošnju električne energije u apsolutno merenje za 3,19231 hiljada kWh.

3. Koeficijent korelacije od 0,8235 otkriva vrlo blisku zavisnost potrošnje električne energije od proizvodnje proizvoda.

Prema jednadžbi regresijski model lako napraviti predviđanja. Da bi se to postiglo, vrijednosti x - volumena proizvodnje - zamjenjuju se u jednadžbu regresije i predviđa se potrošnja električne energije. U ovom slučaju, vrijednosti x mogu se uzeti ne samo unutar datog raspona, već i izvan njega.

Hajde da napravimo prognozu o mogućoj potrošnji energije u fabrici sa obimom proizvodnje od 4,5 hiljada jedinica.

3,57692*4,5 + 3,19231= 19,288 45 hiljada kWh.

SPISAK KORIŠĆENIH IZVORA

1. Zakharenkov S.N. Socio-ekonomska statistika: Udžbenik i praktični vodič. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Opća teorija statistika. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Statistika. - M.: Prospekt, 2002.

4. Opća teorija statistike / Pod op. ed. O.E. Bašina, A.A. Spirina. - M.: Finansije i statistika, 2000.

5. Socio-ekonomska statistika: obrazovna i praktična. dodatak / Zakharenkov S.N. i drugi - Mn.: Državni univerzitet u Jerevanu, 2004.

6. Socio-ekonomska statistika: Udžbenik. dodatak. / Ed. Nesterovich S.R. - Mn.: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Statistika - Minsk, 2000.

8. Kharchenko L.P. Statistika. - M.: INFRA - M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Statistika. - M.: INFRA - M, 1999.

10. Ekonomska statistika / Ed. Yu.N. Ivanova - M., 2000.

Objavljeno na Allbest.ru

...

Slični dokumenti

    Izračunavanje aritmetičke sredine za intervalne serije distribucije. Definicija opšti indeks fizički obim trgovinskog prometa. Analiza apsolutne promjene ukupnih troškova proizvodnje zbog promjene fizičkog obima. Proračun koeficijenta varijacije.

    test, dodano 19.07.2010

    Suština trgovine na veliko, malo i javnog prometa. Formule za izračunavanje pojedinačnih i zbirnih indeksa prometa. Proračun karakteristika serije intervalne distribucije - aritmetička sredina, mod i medijan, koeficijent varijacije.

    kurs, dodato 10.05.2013

    Obračun planiranog i stvarnog obima prodaje, procenat ispunjenosti plana, apsolutna promjena prometa. Određivanje apsolutnog rasta, prosječne stope rasta i povećanja novčanog prihoda. Izračunavanje strukturnih prosjeka: modovi, medijani, kvartili.

    test, dodano 24.02.2012

    Intervalna serija distribucije banaka po obimu dobiti. Pronalaženje moda i medijana rezultirajućeg niza intervalne distribucije grafička metoda i proračunima. Proračun karakteristika intervalnih redova raspodjele. Izračunavanje aritmetičke sredine.

    test, dodano 15.12.2010

    Formule za određivanje prosječnih vrijednosti intervalne serije - modovi, medijani, disperzija. Proračun analitičkih pokazatelja dinamičkih serija pomoću lančanih i osnovnih shema, stopa rasta i priraštaja. Koncept konsolidovanog indeksa troškova, cijena, rashoda i prometa.

    kurs, dodan 27.02.2011

    Pojam i namjena, red i pravila građenja varijantne serije. Analiza homogenosti podataka u grupama. Indikatori varijacije (fluktuacije) osobine. Određivanje linearnog prosjeka i kvadratna devijacija, koeficijent oscilacije i varijacije.

    test, dodano 26.04.2010

    Koncept modusa i medijana kao tipičnih karakteristika, redosled i kriterijumi za njihovo određivanje. Pronalaženje moda i medijana u diskretnim i intervalnim varijacionim serijama. Kvartili i decili kao dodatne karakteristike varijacione statističke serije.

    test, dodano 09.11.2010

    Konstrukcija niza intervalne distribucije na osnovu karakteristika grupisanja. Karakteristike odstupanja distribucije frekvencije od simetričnog oblika, izračunavanje indikatora kurtozisa i asimetrije. Analiza indikatora bilansa stanja ili bilansa uspjeha.

    test, dodano 19.10.2014

    Pretvaranje empirijskih nizova u diskretne i intervalne. Određivanje prosječne vrijednosti za diskretnu seriju koristeći njena svojstva. Proračun pomoću diskretne serije modova, medijana, indikatora varijacije (disperzija, devijacija, koeficijent oscilacije).

    test, dodano 17.04.2011

    Izgradnja statističke serije distribucije organizacija. Grafička definicija mod i srednje vrijednosti. Bliskost korelacije pomoću koeficijenta determinacije. Određivanje greške uzorka prosječnog broja zaposlenih.

Najjednostavniji način da se sumira statistički materijal je konstrukcija serije. Rezime rezultata statističko istraživanje može postojati distributivna serija. Serija distribucije u statistici je uređena distribucija jedinica stanovništva u grupe prema bilo kojoj osobini: kvalitativnoj ili kvantitativnoj. Ako je niz konstruiran prema kvalitativnom kriteriju, onda se naziva atributivnim, a ako je prema kvantitativna karakteristika, zatim varijacijski.

Varijacijsku seriju karakteriziraju dva elementa: varijanta (X) i frekvencija (f). Varijanta je posebna vrijednost karakteristike pojedine jedinice ili grupe populacije. Broj koji pokazuje koliko puta se pojavljuje data vrijednost atributa naziva se frekvencija. Ako je frekvencija izražena kao relativan broj, onda se naziva frekvencijom. Serija varijacija može biti intervalna, kada su definisane granice „od“ i „do“, ili može biti diskretna, kada je karakteristika koja se proučava okarakterisana određenim brojem.

Pogledajmo konstrukciju varijacionih serija koristeći primjere.

Primjer. a postoje podaci o tarifnim kategorijama 60 radnika u jednoj od pogona fabrike.

Rasporedite radnike prema tarifnoj kategoriji, napravite varijantnu seriju.

Da bismo to učinili, zapisujemo sve vrijednosti karakteristike u rastućem redoslijedu i brojimo broj radnika u svakoj grupi.

Tabela 1.4

Distribucija radnika po kategorijama

Radnički rang (X)

Broj radnika

osoba (f)

u % ukupnog (posebno)

Dobili smo varijantnu diskretnu seriju u kojoj je karakteristika koja se proučava (radnički rang) predstavljena određenim brojem. Radi jasnoće, serije varijacija su prikazane grafički. Na osnovu ove distribucijske serije konstruisana je distributivna površina.

Rice. 1.1. Poligon za raspodjelu radnika po tarifnim kategorijama

Razmotrit ćemo konstrukciju intervalnog niza s jednakim intervalima koristeći sljedeći primjer.

Primjer. Poznati su podaci o vrednosti osnovnog kapitala 50 preduzeća u milionima rubalja. Potrebno je prikazati distribuciju firmi prema troškovima osnovnog kapitala.

Da bismo prikazali distribuciju firmi prema vrijednosti osnovnog kapitala, prvo rješavamo pitanje broja grupa koje želimo istaknuti. Pretpostavimo da smo odlučili da identifikujemo 5 grupa preduzeća. Zatim određujemo veličinu intervala u grupi. Da bismo to učinili, koristimo formulu

Prema našem primjeru.

Dodavanjem vrijednosti intervala minimalnoj vrijednosti atributa dobijamo grupe firmi po cijeni fiksnog kapitala.

Jedinica koja ima dvostruko značenje, pripada grupi u kojoj djeluje kao gornja granica (tj. vrijednost atributa 17 ide u prvu grupu, 24 u drugu itd.).

Izbrojimo broj fabrika u svakoj grupi.

Tabela 1.5

Distribucija firmi prema vrijednosti fiksnog kapitala (miliona rubalja)

Troškovi osnovnog kapitala
u milionima rubalja (X)

Broj firmi
(učestalost) (f)

Akumulirane frekvencije
(kumulativno)

Prema ovoj distribuciji dobijen je varijacioni intervalni niz iz kojeg proizilazi da 36 firmi ima osnovni kapital u vrijednosti od 10 do 24 miliona rubalja. itd.

Intervalni niz distribucije može se grafički predstaviti u obliku histograma.

Rezultati obrade podataka prikazani su u statističke tabele. Statističke tabele sadrže svoj subjekt i predikat.

Subjekt je totalitet ili dio totaliteta koji se karakterizira.

Predikati su indikatori koji karakterišu subjekt.

Razlikuju se tabele: jednostavne i grupne, kombinacione, sa jednostavnim i složenim razvojem predikata.

Jednostavna tabela u predmetu sadrži listu pojedinačnih jedinica.

Ako predmet sadrži grupisanje jedinica, onda se takva tabela naziva grupna tabela. Na primjer, grupa preduzeća prema broju radnika, grupe stanovništva prema polu.

Predmet kombinovane tabele sadrži grupisanje prema dve ili više karakteristika. Na primjer, stanovništvo je podijeljeno po spolu u grupe prema obrazovanju, starosti itd.

Kombinovane tabele sadrže informacije koje omogućavaju identifikaciju i karakterizaciju odnosa brojnih indikatora i obrazaca njihovih promena kako u prostoru tako iu vremenu. Da bi tabela bila jasna kada razvijate njen predmet, ograničite se na dvije ili tri karakteristike, formirajući ograničen broj grupa za svaku od njih.

Predikat u tabelama može se razviti na različite načine. Jednostavnim razvojem predikata, svi njegovi indikatori se nalaze nezavisno jedan od drugog.

U složenom razvoju predikata, indikatori se međusobno kombinuju.

Prilikom konstruiranja bilo koje tablice mora se polaziti od svrhe studije i sadržaja obrađenog materijala.

Pored tabela, statistika koristi i grafikone i dijagrame. Grafikon – statistički podaci su prikazani pomoću geometrijski oblici. Grafikoni se dijele na linijske i trakaste, ali mogu postojati i figurativni grafikoni (crteži i simboli), pie charts(krug se uzima kao veličina cjelokupne populacije, a prikazane su površine pojedinih sektora specifična gravitacija ili dio toga komponente), radijalni dijagrami(izgrađen na bazi polarnih ordinata). Kartogram je kombinacija okvirne karte ili plana lokacije sa dijagramom.

Rezultati grupisanja prikupljenih statistički podaci, po pravilu se prikazuju u obliku distributivnih serija. Serija distribucije je uređena raspodjela jedinica stanovništva u grupe prema osobini koja se proučava.

Distribucijski nizovi se dijele na atributivne i varijacione, ovisno o osobini koja čini osnovu grupisanja. Ako je atribut kvalitativan, tada se distribucijski niz naziva atributivan. Primjer serije atributa je distribucija preduzeća i organizacija prema vrsti vlasništva (vidi tabelu 3.1).

Ako je karakteristika po kojoj se konstruira distribucijski niz kvantitativna, tada se niz naziva varijacionim.

Varijaciona serija distribucije se uvijek sastoji od dva dijela: varijante i odgovarajućih frekvencija (ili frekvencija). Varijanta je vrijednost koju karakteristika može poprimiti u jedinicama populacije, dok je učestalost broj jedinica posmatranja koje imaju datu vrijednost karakteristike. Zbir frekvencija je uvijek jednak obimu populacije. Ponekad se umjesto frekvencija računaju frekvencije - to su frekvencije izražene ili kao razlomci jedinice (tada je zbir svih frekvencija jednak 1), ili kao postotak obima populacije (zbir frekvencija će biti jednak 100%).

Varijacijski nizovi su diskretni i intervalni. Za diskretne serije (Tablica 3.7), opcije su izražene konkretni brojevi, najčešće cijeli.

Tabela 3.8. Raspodjela zaposlenih prema vremenu rada u osiguravajućem društvu
Vrijeme provedeno u radu u kompaniji pune godine(opcije) Broj zaposlenih
čovjek (frekvencije) u % ukupnog (učestalosti)
do godinu dana 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Ukupno 129 100,0

U intervalnim serijama (vidi tabelu 3.2), vrijednosti indikatora su navedene u obliku intervala. Intervali imaju dvije granice: donju i gornju. Intervali mogu biti otvoreni ili zatvoreni. Otvoreni nemaju jednu od granica, tako da je u tabeli. 3.2 prvi interval nema donju granicu, a posljednji nema gornju granicu. Prilikom konstruiranja intervalnog niza, ovisno o prirodi širenja vrijednosti atributa, koriste se i jednaki i nejednaki intervali (Tabela 3.2 prikazuje varijacioni niz sa jednakim intervalima).

Ako karakteristika poprimi ograničen broj vrijednosti, obično ne više od 10, konstruiraju se diskretni nizovi distribucije. Ako je opcija veća, tada diskretna serija gubi svoju jasnoću; u ovom slučaju, preporučljivo je koristiti intervalni oblik varijacionog niza. Uz kontinuiranu varijaciju karakteristike, kada se njene vrijednosti unutar određenih granica razlikuju jedna od druge za proizvoljno mali iznos, također se konstruira niz intervalne distribucije.

3.3.1. Konstrukcija diskretnih varijacionih serija

Razmotrimo metodologiju za konstruiranje diskretnih varijacionih nizova koristeći primjer.

Primjer 3.2. O kvantitativnom sastavu 60 porodica dostupni su sljedeći podaci:

Da bi se stekla ideja o raspodjeli porodica po broju članova, trebalo bi konstruirati varijantni niz. Budući da znak ima ograničen broj cjelobrojnih vrijednosti, konstruiramo diskretni varijacioni niz. Da biste to učinili, preporučljivo je prvo zapisati sve vrijednosti atributa (broj članova u porodici) uzlaznim redoslijedom (tj. rangirati statističke podatke):

Zatim morate izbrojati broj porodica sa istim sastavom. Broj članova porodice (vrijednost varijabilne karakteristike) su varijante (označićemo ih sa x), broj porodica istog sastava su frekvencije (označićemo ih sa f). Rezultate grupiranja predstavljamo u obliku sljedećih diskretnih varijacionih distribucijskih serija:

Tabela 3.11.
Broj članova porodice (x) Broj porodica (y)
1 8
2 14
3 20
4 9
5 5
6 4
Ukupno 60

3.3.2. Konstrukcija intervalnih varijacionih serija

Hajde da demonstriramo metodologiju za konstruisanje nizova distribucije intervalnih varijacija koristeći sledeći primer.

Primjer 3.3. Kao rezultat statističko posmatranje O prosječnoj kamatnoj stopi 50 komercijalnih banaka (%) dobijeni su sljedeći podaci:

Tabela 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Kao što vidimo, pregled takvog niza podataka je izuzetno nezgodan, osim toga, nisu vidljivi obrasci promjena u indikatoru. Konstruirajmo niz intervalne distribucije.

  1. Odredimo broj intervala.

    Broj intervala u praksi često postavlja sam istraživač na osnovu ciljeva svakog konkretnog posmatranja. Istovremeno, može se izračunati i matematički koristeći Sturgessovu formulu

    n = 1 + 3,322lgN,

    gdje je n broj intervala;

    N je obim populacije (broj jedinica posmatranja).

    Za naš primjer dobijamo: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6 "7.

  2. Odredimo veličinu intervala (i) koristeći formulu

    gdje je x max maksimalna vrijednost atributa;

    x min - minimalna vrijednost atributa.

    Za naš primjer

    Intervali varijacionog niza su jasni ako njihove granice imaju „okrugle“ vrijednosti, pa zaokružimo vrijednost intervala 1,9 na 2, a minimalnu vrijednost karakteristike 12,3 na 12,0.

  3. Odredimo granice intervala.

    Intervali se po pravilu pišu na način da je gornja granica jednog intervala ujedno i donja granica sljedećeg intervala. Dakle, za naš primjer dobijamo: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24.0-26.0.

    Takav unos znači da je atribut kontinuiran. Ako su varijante znaka striktno prihvaćene određene vrijednosti, na primjer, samo cijeli brojevi, ali njihov broj je prevelik za konstruiranje diskretne serije, tada možete kreirati niz intervala gdje se donja granica intervala neće poklapati s gornjom granicom sljedećeg intervala (to će značiti da je karakteristika diskretna). Na primjer, u raspodjeli zaposlenih u preduzeću po godinama, možete kreirati sljedeće intervalne grupe godina: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 i više.

    Dodatno, u našem primjeru, mogli bismo otvoriti prvi i posljednji interval, itd. pisati: do 14,0; 24.0 i više.

  4. Na osnovu početnih podataka konstruisaćemo rangiranu seriju. Da bismo to učinili, zapisujemo u rastućem redoslijedu vrijednosti koje znak zauzima. Rezultate predstavljamo u tabeli: Tabela 3.13. Rangirani niz kamatnih stopa komercijalnih banaka
    Bankovna stopa % (opcije)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Hajde da izbrojimo frekvencije.

    Prilikom brojanja frekvencija može nastati situacija kada vrijednost karakteristike padne na granicu nekog intervala. U ovom slučaju možete se voditi pravilom: data jedinica je dodijeljena intervalu za koji je njena vrijednost gornja granica. Dakle, vrijednost 16.0 u našem primjeru će se odnositi na drugi interval.

Rezultati grupisanja dobijeni u našem primjeru bit će prikazani u tabeli.

Tabela 3.14. Distribucija komercijalnih banaka po kamatnim stopama
Kratka stopa, % Broj banaka, jedinica (frekvencije) Akumulirane frekvencije
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Ukupno 50 -

Posljednja kolona tabele predstavlja akumulirane frekvencije koje se dobijaju uzastopnim zbrajanjem frekvencija počevši od prvog (na primjer, za prvi interval - 5, za drugi interval 5 + 9 = 14, za treći interval 5 + 9 + 4 = 18, itd.). Akumulirana učestalost, na primjer, 33, pokazuje da 33 banke imaju kreditnu stopu koja ne prelazi 20% (gornja granica odgovarajućeg intervala).

U procesu grupisanja podataka prilikom konstruisanja varijacionih serija ponekad se koriste nejednaki intervali. Ovo se odnosi na one slučajeve kada se karakteristične vrijednosti povinuju aritmetičkim ili geometrijska progresija ili kada primena Sturgessove formule dovodi do pojave „praznih“ intervalnih grupa koje ne sadrže ni jednu jedinicu posmatranja. Tada granice intervala postavlja proizvoljno sam istraživač na osnovu zdrav razum i ciljeve ankete ili korištenje formula. Dakle, za promjenu podataka aritmetička progresija, veličina intervala se izračunava na sljedeći način.

Stanje:

Postoje podaci o starosnom sastavu radnika (godine): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Konstruirajte niz intervalne distribucije.
    2. Build grafička slika red.
    3. Grafički odredite mod i medijan.

Rješenje:

1) Prema Sturgessovoj formuli, stanovništvo se mora podijeliti na 1 + 3,322 lg 30 = 6 grupa.

Maksimalna starost - 38, minimalna - 18 godina.

Širina intervala Pošto krajevi intervala moraju biti cijeli brojevi, populaciju dijelimo u 5 grupa. Širina intervala - 4.

Radi lakšeg izračunavanja, podatke ćemo rasporediti u rastućem redoslijedu: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

Distribucija starosni sastav radnici

Grafički, serija se može prikazati kao histogram ili poligon. Histogram - trakasti grafikon. Osnova kolone je širina intervala. Visina stuba je jednaka frekvenciji.

Poligon (ili poligon distribucije) - graf frekvencije. Da bismo ga izgradili pomoću histograma, povezujemo sredine gornjih strana pravokutnika. Zatvaramo poligon na osi Ox na udaljenosti jednakim polovini intervala od ekstremnih vrijednosti x.

Mod (Mo) je vrijednost karakteristike koja se proučava, a koja se najčešće javlja u datoj populaciji.

Da biste odredili način rada iz histograma, morate odabrati najviši pravougaonik, povući liniju od desnog vrha ovog pravokutnika udesno gornji ugao prethodni pravougaonik, a od levog vrha modalnog pravougaonika povući liniju do levog vrha sledećeg pravougaonika. Od presjeka ovih linija povucite okomitu na x-osu. Apscisa će biti moda. Mo ≈ 27.5. To znači da je najčešća dob u ovoj populaciji 27-28 godina.

Medijan (Me) je vrijednost karakteristike koja se proučava, a koja se nalazi u sredini uređene serije varijacija.

Medijanu nalazimo koristeći kumulat. Kumulati - graf akumuliranih frekvencija. Apscise su varijante niza. Ordinate su akumulirane frekvencije.

Da bismo odredili medijan preko kumulata, nalazimo tačku duž ordinatne ose koja odgovara 50% akumuliranih frekvencija (u našem slučaju 15), kroz nju povlačimo pravu liniju, paralelnu sa Ox osi, i iz tačke njegov presek sa kumulatom, nacrtajte okomitu na x osu. Apscisa je medijana. Me ≈ 25.9. To znači da je polovina zaposlenih u ovoj populaciji mlađa od 26 godina.

Najvažnija faza u proučavanju društveno-ekonomskih pojava i procesa je sistematizacija primarnih podataka i, na osnovu toga, dobijanje zbirne karakteristike cjelokupnog objekta korištenjem općih indikatora, što se postiže sumiranjem i grupiranjem primarne statističke građe.

Statistički sažetak - To je kompleks sekvencijalne operacije uopštavanjem specifičnih pojedinačnih činjenica koje čine skup radi identifikacije tipične karakteristike i obrasce svojstvene fenomenu koji se proučava u cjelini. Provođenje statističkog sažetka uključuje sljedeće korake :

  • izbor karakteristika grupisanja;
  • utvrđivanje redosleda formiranja grupe;
  • razvoj sistema statistički indikatori karakterizirati grupe i objekt u cjelini;
  • razvoj statističkih tabela za predstavljanje zbirnih rezultata.

Statističko grupisanje naziva se podjela jedinica populacije koja se proučava homogene grupe prema određenim karakteristikama bitnim za njih. Grupacije su najvažnije statistička metoda generalizacija statističkih podataka, osnova za pravilno izračunavanje statističkih pokazatelja.

Razlikovati sledeće vrste grupisanja: tipološka, ​​strukturalna, analitička. Sve ove grupacije objedinjuje činjenica da su jedinice objekta podijeljene u grupe prema nekim karakteristikama.

Funkcija grupisanja je karakteristika po kojoj se jedinice populacije dijele u posebne grupe. Od pravi izbor Karakteristika grupiranja zavisi od zaključaka statističke studije. Kao osnovu za grupisanje potrebno je koristiti značajne, teorijski zasnovane karakteristike (kvantitativne ili kvalitativne).

Kvantitativne karakteristike grupisanja imaju numerički izraz (obim trgovine, starost osobe, prihod porodice, itd.), i kvalitativni znaci grupisanja odražavaju stanje jedinice stanovništva (pol, Porodični status, granska pripadnost preduzeća, njegov oblik vlasništva itd.).

Nakon što se utvrdi osnova grupisanja, mora se odlučiti o broju grupa u koje treba podijeliti populaciju koja se proučava. Broj grupa zavisi od ciljeva studije i tipa indikatora koji leži u osnovi grupisanja, obima populacije i stepena varijacije karakteristike.

Na primjer, grupisanje preduzeća prema vrsti vlasništva uzima u obzir opštinsku, federalnu i federalnu imovinu. Ako se grupisanje vrši na kvantitativnoj osnovi, onda je potrebno preokrenuti Posebna pažnja o broju jedinica objekta koji se proučava i stepenu varijabilnosti karakteristike grupisanja.

Nakon što je određen broj grupa, moraju se odrediti intervali grupisanja. Interval - to su vrijednosti različite karakteristike koje se nalaze unutar određenih granica. Svaki interval ima svoju vrijednost, gornju i donju granicu ili barem jednu od njih.

Donja granica intervala naziva se najmanja vrijednost karakteristike u intervalu, i gornja granica - najveća vrijednost karakteristike u intervalu. Vrijednost intervala je razlika između gornje i donje granice.

Intervali grupisanja, ovisno o njihovoj veličini, su: jednaki i nejednaki. Ako se varijacija neke karakteristike manifestira unutar relativno uskih granica i distribucija je ujednačena, tada se grupa gradi u jednakim intervalima. Magnituda jednak interval određena sljedećom formulom :

gdje je Xmax, Xmin - maksimum i minimalna vrijednost karakteristike u agregatu; n - broj grupa.

Najjednostavnije grupisanje u kojem je svaka odabrana grupa okarakterisana jednim indikatorom predstavlja seriju distribucije.

Statističke serije distribucija - ovo je uređena raspodjela jedinica stanovništva u grupe prema određenoj osobini. U zavisnosti od karakteristike na kojoj se formira distribucioni niz, razlikuju se atributivni i varijacioni distributivni redovi.

Atributivno nazivaju se redovi distribucije konstruisani prema kvalitativne karakteristike, odnosno znakove koje nema numerički izraz(distribucija po vrsti rada, po polu, po zanimanju, itd.). Serija atributa distribucije karakterišu sastav stanovništva prema određenim bitnim karakteristikama. Preuzeti kroz nekoliko perioda, ovi podaci omogućavaju proučavanje promjena u strukturi.

Varijacijska serija nazivaju se redovi distribucije konstruisani na kvantitativnoj osnovi. Bilo koja serija varijacija sastoji se od dva elementa: opcija i frekvencija. Opcije su pozvani individualne vrednosti karakteristike koje uzima u seriji varijacije, odnosno specifičnu vrijednost varijabilne karakteristike.

Frekvencije nazivaju se brojevi pojedinačnih varijanti ili svake grupe varijantnog niza, odnosno to su brojevi koji pokazuju koliko se često pojedine varijante pojavljuju u distributivnom nizu. Zbir svih frekvencija određuje veličinu cjelokupne populacije, njen volumen. Frekvencije nazivaju se frekvencije izražene u dijelovima jedinice ili kao postotak ukupne vrijednosti. Prema tome, zbir frekvencija je jednak 1 ili 100%.

U zavisnosti od prirode varijacije neke karakteristike razlikuju se tri oblika varijacionih serija: rangirani niz, diskretni niz i intervalni niz.

Rangirane serije varijacija - ovo je raspodjela pojedinačnih jedinica populacije u rastućem ili padajućem redoslijedu karakteristike koja se proučava. Rangiranje vam omogućava da lako podijelite kvantitativne podatke u grupe, odmah otkrijete najmanje i najveća vrijednost karakteristika, istaknite vrijednosti koje se najčešće ponavljaju.

Diskretne serije varijacija karakterizira raspodjelu jedinica stanovništva prema diskretnoj karakteristici koja uzima samo cjelobrojne vrijednosti. Na primjer, tarifna kategorija, broj djece u porodici, broj zaposlenih u preduzeću itd.

Ako karakteristika ima kontinuiranu promjenu, koja u određenim granicama može poprimiti bilo koje vrijednosti („od - do“), tada je za ovu karakteristiku potrebno izgraditi intervalne varijacione serije . Na primjer, iznos prihoda, radni staž, trošak osnovnih sredstava preduzeća itd.

Primjeri rješavanja zadataka na temu “Statistički sažetak i grupiranje”

Problem 1 . Postoje podaci o broju knjiga koje su studenti dobili putem pretplate u protekloj akademskoj godini.

Konstruirati rangirane i diskretne serije distribucije varijacija, označavajući elemente serije.

Rješenje

Ovaj set predstavlja mnogo opcija za broj knjiga koje studenti dobijaju. Izbrojimo broj takvih opcija i uredimo ih u obliku varijacijskih rangiranih i varijacijskih diskretnih distribucijskih serija.

Problem 2 . Postoje podaci o troškovima osnovnih sredstava za 50 preduzeća, hiljada rubalja.

Napravite distributivnu seriju, naglašavajući 5 grupa preduzeća (u jednakim intervalima).

Rješenje

Za rješavanje biramo najveće i najmanju vrijednost vrijednost osnovnih sredstava preduzeća. To su 30,0 i 10,2 hiljade rubalja.

Nađimo veličinu intervala: h = (30,0-10,2):5= 3,96 hiljada rubalja.

Tada će prva grupa uključivati ​​preduzeća čija osnovna sredstva iznose od 10,2 hiljade rubalja. do 10,2+3,96=14,16 hiljada rubalja. Takvih preduzeća će biti 9. U drugu grupu spadaju preduzeća čija osnovna sredstva iznose od 14,16 hiljada rubalja. do 14,16+3,96=18,12 hiljada rubalja. Slično će biti 16 takvih preduzeća hajde da nađemo broj preduzeća uključena u treću, četvrtu i petu grupu.

Rezultirajuću seriju distribucije stavljamo u tabelu.

Problem 3 . Za više preduzeća lake industrije dobijeni su sljedeći podaci:

Grupirajte preduzeća po broju radnika, formirajući 6 grupa u jednakim intervalima. Izračunajte za svaku grupu:

1. broj preduzeća
2. broj radnika
3. obim proizvedenih proizvoda godišnje
4. prosječna stvarna proizvodnja po radniku
5. obim osnovnih sredstava
6. prosječne veličine osnovna sredstva jednog preduzeća
7. prosječna vrijednost proizvoda koje proizvede jedno preduzeće

Rezultate proračuna prikažite u tabelama. Izvucite zaključke.

Rješenje

Za rješavanje izabraćemo najveću i najmanju vrijednost prosječnog broja radnika u preduzeću. To su 43 i 256.

Nađimo veličinu intervala: h = (256-43):6 = 35,5

Tada će u prvu grupu spadati preduzeća čiji je prosječan broj radnika od 43 do 43 + 35,5 = 78,5 ljudi. Biće 5 takvih preduzeća. U drugu grupu biće preduzeća čiji će prosečan broj radnika biti od 78,5 do 78,5+35,5=114 ljudi. Biće 12 takvih preduzeća.

Rezultirajuću seriju distribucije stavljamo u tabelu i izračunavamo potrebne indikatore za svaku grupu:

Zaključak : Kao što se vidi iz tabele, druga grupa preduzeća je najbrojnija. Uključuje 12 preduzeća. Najmanje grupe su peta i šesta grupa (po dva preduzeća). Ovo su najveća preduzeća (po broju radnika).

Budući da je druga grupa najveća, obim proizvoda koje godišnje proizvode preduzeća ove grupe i obim osnovnih sredstava su znatno veći od ostalih. Istovremeno, prosječna stvarna proizvodnja po radniku u preduzećima ove grupe nije najveća. Preduzeća četvrte grupe tu prednjače. Ova grupa takođe čini prilično veliki obim osnovnih sredstava.

U zaključku, napominjemo da su prosječna veličina osnovnih sredstava i prosječan iznos proizvodnje jednog preduzeća direktno proporcionalni veličini preduzeća (u smislu broja radnika).