Biografije Karakteristike Analiza

Intervalne serije varijacija u jednakim intervalima. Za studente i školarce - pomoć u učenju

Prilikom obrade velikih količina informacija, što je posebno važno pri vođenju modernih naučni razvoj, istraživač se suočava sa ozbiljnim zadatkom pravilnog grupisanja početnih podataka. Ako su podaci diskretni, onda, kao što smo vidjeli, nema problema - samo treba izračunati učestalost svake karakteristike. Ako ispitivana osobina ima kontinuirano karaktera (što je češće u praksi), onda izbor optimalnog broja intervala za grupisanje obeležja nije nimalo trivijalan zadatak.

Za grupisanje kontinuiranih slučajnih varijabli, cjelina raspon varijacije karakteristika je podijeljena na nekoliko intervala To.

Grupirani interval (kontinuirano) varijacione serije nazivaju se intervali rangirani po vrijednosti karakteristike (), gdje je zajedno s odgovarajućim frekvencijama () naznačen broj opažanja koja su pala u r "-ti interval, ili relativne frekvencije ():

Intervali karakterističnih vrijednosti

mi frekvencija

trakasti grafikon I kumulirati (ogiva), o kojima smo već detaljno raspravljali, odličan su alat za vizualizaciju podataka koji vam omogućava da steknete primarno razumijevanje strukture podataka. Takvi grafovi (slika 1.15) grade se za kontinuirane podatke na isti način kao i za diskretne podatke, samo uzimajući u obzir činjenicu da kontinuirani podaci u potpunosti ispunjavaju područje svojih mogućih vrijednosti, uzimajući bilo koje vrijednosti.

Rice. 1.15.

Zbog toga kolone na histogramu i kumulat moraju biti u kontaktu, nemaju područja u kojima vrijednosti atributa ne spadaju u sve moguće(tj. histogram i kumulat ne bi trebali imati "rupe" duž ose apscise, u koje vrijednosti varijable koja se proučava ne padaju, kao na slici 1.16). Visina trake odgovara frekvenciji - broju zapažanja koja spadaju u dati interval, ili relativnoj frekvenciji - proporciji opažanja. Intervali ne smije prelaziti i obično su iste širine.

Rice. 1.16.

Histogram i poligon su aproksimacije krivulje gustine vjerovatnoće ( diferencijalna funkcija) f(x) teorijska raspodjela, razmatrana u okviru teorije vjerovatnoće. Stoga je njihova konstrukcija od tolikog značaja u primarnoj statističkoj obradi kvantitativnih kontinuiranih podataka – po njihovom obliku može se suditi o hipotetičkom zakonu raspodjele.

Kumulacija - kriva akumuliranih frekvencija (frekvencija) intervalne serije varijacije. Grafikon funkcije integralne distribucije uspoređuje se sa kumulatom F(x), takođe razmatran u toku teorije verovatnoće.

U osnovi, koncepti histograma i kumulata su povezani upravo sa kontinuiranim podacima i njihovim intervalnim serijama varijacije, budući da su njihovi grafikoni empirijske procjene funkcije gustoće vjerovatnoće i funkcije distribucije, respektivno.

Konstrukcija intervalne varijacione serije počinje određivanjem broja intervala k. A ovaj zadatak je možda najteži, najvažniji i kontroverzni u pitanju koje se proučava.

Broj intervala ne bi trebao biti premali, jer će histogram biti previše gladak ( preglađen), gubi sve karakteristike varijabilnosti početnih podataka - na sl. 1.17 možete vidjeti kako isti podaci na kojima su prikazani grafovi na Sl. 1.15 se koriste za konstruisanje histograma sa manjim brojem intervala (lijevi grafikon).

U isto vrijeme, broj intervala ne bi trebao biti prevelik - inače nećemo moći procijeniti gustoću distribucije podataka koji se proučavaju duž numeričke ose: histogram će se pokazati nedovoljno izglađenim (uglađen) sa nepopunjenim intervalima, neujednačen (vidi sliku 1.17, desni grafikon).

Rice. 1.17.

Kako odrediti najpoželjniji broj intervala?

Još 1926. godine Herbert Sturges je predložio formulu za izračunavanje broja intervala na koje je potrebno podijeliti početni skup vrijednosti proučavanog atributa. Ova formula je zaista postala super popularna - nudi je većina statističkih udžbenika, a mnogi je statistički paketi koriste po defaultu. Da li je to opravdano iu svim slučajevima veoma je ozbiljno pitanje.

Dakle, na čemu se zasniva Sturgesova formula?

Razmislite binomna distribucija, čija gornja granica uključuje posljednji broj rangirane serije.

Mi gradimo intervalne serije(Tabela 2.3).

Intervalna serija distribucije firmi ali prosječan broj menadžera u jednom od regiona Ruske Federacije u prvom kvartalu izvještajne godine

Zaključak. Najbrojnija grupa preduzeća je grupa sa prosečnim brojem menadžera od 25-30 ljudi, koja obuhvata 8 firmi (27%); najmanja grupa sa prosječnim brojem menadžera od 40-45 ljudi uključuje samo jednu firmu (3%).

Korištenje originalne tablice podataka. 2.1, kao i intervalne serije distribucije firmi po broju menadžera (tabela 2.3), potrebno izgraditi analitičko grupisanje odnosa između broja menadžera i obima prodaje firmi i na osnovu toga izvesti zaključak o prisutnosti (ili odsustvu) veze između navedenih znakova.

Rješenje:

Analitičko grupisanje se gradi na faktorskoj osnovi. U našem zadatku, predznak faktora (x) je broj menadžera, a rezultantni znak (y) je obim prodaje (tabela 2.4).

Hajde da gradimo sada analitičko grupisanje(Tabela 2.5).

Zaključak. Na osnovu podataka konstruisanog analitičkog grupisanja, može se reći da sa povećanjem broja menadžera prodaje raste i prosječan obim prodaje kompanije u grupi, što ukazuje na postojanje direktne veze između ovih karakteristika.

Tabela 2.4

Pomoćna tabela za građenje analitičke grupe

Broj rukovodilaca, osoba,

Broj kompanije

Obim prodaje, milioni rubalja, god

» = 59 f = 9,97

I-™ 4 - Yu.22

74 '25 1PY1

U4 = 7 = 10,61

at = ’ =10,31 30

Tabela 2.5

Zavisnost obima prodaje od broja menadžera kompanije u jednom od regiona Ruske Federacije u prvom kvartalu izvještajne godine

KONTROLNA PITANJA
  • 1. Šta je suština statističkog posmatranja?
  • 2. Navedite faze statističkog posmatranja.
  • 3. Šta su organizacione forme statističko posmatranje?
  • 4. Navedite vrste statističkog posmatranja.
  • 5. Šta je statistički sažetak?
  • 6. Navedite vrste statističkih izvještaja.
  • 7. Šta je statističko grupisanje?
  • 8. Navedite vrste statističkih grupa.
  • 9. Šta je distributivna serija?
  • 10. Imenujte strukturne elemente distributivnog niza.
  • 11. Koja je procedura za konstruisanje serije distribucije?