Biografije Karakteristike Analiza

Osnovne statističke kategorije. Koeficijenti odnosa kvalitativnih karakteristika

Metoda grupisanja vam omogućava da proučavate stanje i odnose ekonomske pojave, ako grupe karakterišu indikatori koji otkrivaju najznačajnije aspekte fenomena koji se proučava.

Prilikom analize i planiranja potrebno je ne oslanjati se na nasumične činjenice, ali na indikatorima koji izražavaju glavni, tipični, korijen. Ova karakterizacija je data različite vrste srednje vrijednosti, kao i mod i medijan.

Pitanje homogenosti stanovništva ne bi trebalo da se rešava formalno u smislu oblika njegovog rasporeda. O njemu se, kao io pitanju tipičnog prosjeka, mora odlučivati ​​na osnovu uzroka i uslova koji formiraju populaciju. Homogen je takav skup čije se jedinice formiraju pod uticajem zajedničkih glavnih uzroka i uslova koji određuju opšti nivo ove karakteristike, svojstvene cjelokupnoj populaciji.

Prema teoriji tipoloških grupa, odlučujuče u procjeni homogenosti populacije ne pripada obliku rasprostranjenosti, već veličini varijacije i uslovima za njeno formiranje. Kvalitativno homogen skup karakterizira varijacija u određenim granicama, nakon čega počinje novi kvalitet. Istovremeno, da bi se ocijenila kvalitativna homogenost agregata, ovim granicama se mora pristupiti sa stanovišta suštine materije, a ne formalno, jer ista količina pod različitim uslovima izražava novi kvalitet. Na primjer, sa istim brojem radnika, preduzeća nekih grana industrije su velika, dok su druga mala.

Za sveobuhvatan i dubinska studija fenomena, da bi se objektivno okarakterisale vrste pojava, njihovi odnosi i procesi usled razvoja sistema u celini, potrebno je kombinovati grupne proseke sa opštim prosecima. Kombinacija takvih prosjeka jedan je od glavnih elemenata analize složenih sistema. Ova kombinacija u jednu celinu povezuje dva organski komplementarna statistička metoda: metoda prosjeka i metoda grupisanja. Prilikom izračunavanja prosjeka, pojedinačne vrijednosti koje se razlikuju po grupi zamjenjuju se jednom prosječnom vrijednošću. Gde slučajna odstupanja vrijednosti atributa za pojedinačne jedinice u smjeru povećanja ili smanjenja međusobno su uravnotežene i poništavaju jedna drugu, a prosječna vrijednost pokazuje tipičnu veličinu atributa karakterističnog za ovu grupu. Prosječna vrijednost služi kao karakteristika populacije i istovremeno se odnosi na njen pojedinačni element - nosioca kvalitativnih karakteristika fenomena. Značenje prosjeka je sasvim konkretno, ali u isto vrijeme apstraktno; dobija se apstrahovanjem od slučajnog pojedinca za svaku jedinicu da bi se identifikovalo opšte, tipično koje je karakteristično za sve jedinice i koje formira ovaj set. Prilikom izračunavanja prosječne vrijednosti, broj populacijskih jedinica trebao bi biti dovoljno velik. Vrijednost prosjeka se definiše kao odnos ukupnog obima pojava i broja populacijskih jedinica u grupi. Za negrupirane podatke, ovo će biti jednostavna aritmetička sredina:

a za grupisane podatke, gdje svaka vrijednost karakteristike ima svoju frekvenciju, ponderirana aritmetička sredina:

gdje X i- vrijednost karakteristike; f i je frekvencija ovih vrijednosti karakteristika.

Pošto se aritmetička sredina izračunava kao omjer zbira karakterističnih vrijednosti prema ukupna snaga, nikada ne ide dalje od ovih vrijednosti. Aritmetička sredina ima niz svojstava koja se široko koriste za pojednostavljenje izračunavanja.

1. Zbir odstupanja individualne vrednosti predznak srednje vrijednosti je uvijek nula:

Dokaz. n

Odvajanje lijevog i desna strana on

2. Ako se karakteristične vrijednosti (X i) promijene u k puta, tada će se promijeniti i aritmetička sredina x jednom.

Dokaz.

Označavamo aritmetičku sredinu novih vrijednosti atributa sa X, tada:

Konstantna vrijednost 1/k može se izvaditi iz predznaka zbira, a onda dobijamo:

3. Ako je izvan svih karakterističnih vrijednosti X i oduzmite ili dodajte isti konstantni broj, tada će se aritmetička sredina smanjiti ili povećati za taj iznos.

Dokaz.

Prosjek odstupanja karakterističnih vrijednosti od konstantan brojće biti jednako:

To se na isti način dokazuje iu slučaju sabiranja konstantnog broja.

4. Ako su frekvencije svih karakterističnih vrijednosti smanjene ili povećane u n puta, onda se prosjek neće promijeniti:

Ako postoje podaci o ukupnom volumenu i poznatim vrijednostima osobine, ali nepoznatim frekvencijama, za određivanje prosjeka koristi se formula ponderirane aritmetičke sredine.

Na primjer, dostupni su podaci o prodajnim cijenama kupusa i ukupnom prihodu za različite prodajne periode (tabela 1).

Tabela 1.

Prodajna cijena kupusa i ukupni prihod za različite prodajne periode


Kako je prosječna cijena omjer ukupnog prihoda i ukupne količine prodanog kupusa, potrebno je prvo odrediti količinu prodanog kupusa za različite prodajne periode kao omjer prihoda i cijene, a zatim odrediti prosječna cijena prodati kupus.

U našem primjeru prosječna cijena bi bila:

Ako se računa u ovaj slučaj prosječnu prodajnu cijenu prema jednostavnoj aritmetičkoj sredini, onda dobijamo drugačiji rezultat, koji će iskriviti pravo stanje i precijeniti prosječnu prodajnu cijenu, jer činjenica da veliki udio u prodaji otpada na kasni kupus sa nižom cijenom neće uzeti u obzir.

Ponekad je potrebno odrediti prosječnu vrijednost kada su karakteristične vrijednosti date u obrascu razlomci brojeva, tj. recipročne vrijednosti cijelih brojeva (na primjer, kada se proučava produktivnost rada kroz njegov inverzni indikator, intenzitet rada). U takvim slučajevima, preporučljivo je koristiti formulu harmonijske srednje vrijednosti:

Dakle, prosječno vrijeme potrebno za proizvodnju jedinice proizvodnje je harmonska sredina. Ako je X 1 = 1/4 sata, X 2 = 1/2 sata, X 3 = 1/3 sata, tada je harmonijska sredina ovih brojeva:

Za izračunavanje prosječne vrijednosti iz omjera dvaju indikatora istog imena, na primjer, stope rasta, koristi se geometrijska sredina izračunata po formuli:

gdje je X 1 x X 2 ... x ... X 4 - omjer dvije veličine istog imena, na primjer, lančane stope rasta; n je veličina skupa omjera stopa rasta.

Razmatrane srednje vrijednosti imaju svojstvo maoranta:

Neka, na primjer, imamo sljedeće vrijednosti X(20; 40), tada će tipovi proseka koji smo ranije razmatrali biti jednaki:

Prilikom proučavanja sastava populacije, tipična veličina neke osobine može se ocijeniti na osnovu takozvanih strukturnih prosjeka – moda i medijana.

Modanajčešća vrijednost karakteristike u populaciji naziva se. U nizu varijacija intervala prvo se pronalazi modalni interval. U pronađenom modalnom intervalu mod se izračunava po formuli:

gdje je X 0 donja granica modalnog intervala; d- vrijednost intervala; f 1 , f 2 , f 3 – frekvencije premodalnih, modalnih i postmodalnih intervala.

Vrijednost mode u intervalne serije prilično lako pronaći na osnovu grafikona. Da biste to učinili, povlače se dvije linije od granica dva susjedna stupca u najvišoj koloni histograma. Od točke presjeka ovih linija, okomita se spušta na osu apscise. Vrijednost karakteristike na osi apscise će biti mod (slika 2).


Rice. 2

Za rješavanje praktičnih problema najveće interesovanje predstavlja obično način izražen kao interval, a ne kao diskretni broj. To se objašnjava svrhom modusa, koji treba da otkrije najčešće dimenzije fenomena.

Prosjek - vrijednost tipična za sve jedinice homogene populacije. Mode je također tipična vrijednost, ali direktno određuje veličinu atributa, što je karakteristično za značajan dio, ali ipak ne za cijelu populaciju. Ona ima veliki značaj riješiti neke probleme, na primjer, predvidjeti koje veličine obuće, odjeće treba biti namijenjena masovnoj proizvodnji itd.

Medijan- vrijednost karakteristike, koja se nalazi u sredini rangirane serije. Označava centar distribucije jedinica stanovništva i dijeli ga na dva jednaka dijela.

Medijan je najbolja karakteristika centralni trend, kada su granice ekstremnih intervala otvorene. Medijan je prihvatljivija karakteristika nivoa distribucije čak i ako postoje pretjerano velike ili pretjerano male vrijednosti u nizu distribucije koje imaju jak uticaj do sredine, ali ne i do medijane. Medijan također ima svojstvo linearnog minimuma: suma apsolutne vrijednosti odstupanja vrijednosti atributa za sve jedinice populacije od medijane su minimalna, tj.

Ovo svojstvo je od velike važnosti za rješavanje nekih praktičnih problema - na primjer, za izračunavanje najkraće moguće udaljenosti za različite vrste transport, locirati benzinske stanice na način da udaljenost do svih automobila koje servisira ova stanica bude minimalna, itd.

Kada se traži medijana, ona se prvo određuje serijski broj u distributivnoj seriji:

Nadalje, prema serijskom broju, sama medijana se nalazi iz akumuliranih frekvencija serije. AT diskretne serije- bez ikakvog proračuna, ali u intervalnoj seriji, znajući redni broj medijane, akumulirane frekvencije se koriste za pronalaženje medijanskog intervala, u kojem je vrijednost medijane već određena najjednostavnijim metodom interpolacije. Medijan se izračunava pomoću formule:

gdje X 0 je donja granica srednjeg intervala; d– vrijednost intervala; f _ 1 – frekvencija akumulirana do srednjeg intervala; f je frekvencija srednjeg intervala.

Izračunajmo srednju vrijednost, mod i medijan koristeći intervalnu distribuciju kao primjer. Podaci su dati u tabeli. 2.


Stoga se kao centar distribucije mogu koristiti različiti indikatori: srednja vrijednost, modus i medijan,


i svaka od ovih karakteristika ima svoje karakteristike. Dakle, za prosječnu vrijednost je karakteristično da su sva odstupanja od nje individualne vrednosti znakovi se međusobno poništavaju, tj.

Medijan se odlikuje činjenicom da je zbroj odstupanja pojedinačnih vrijednosti atributa od njega (isključujući znakove) minimalan. Režim karakteriše vrednost osobine koja se najčešće pojavljuje. Stoga, ovisno o tome koja od karakteristika je od interesa za istraživača, treba odabrati jednu od razmatranih karakteristika. AT pojedinačni slučajevi sve karakteristike su izračunate.

Njihovo poređenje i identifikacija odnosa između njih pomaže da se razjasne karakteristike distribucije jedne ili druge varijacione serije. Dakle, u simetričnim serijama, kao u našem slučaju, sve tri karakteristike (srednja vrijednost, mod i medijan) se približno poklapaju. Što je veća razlika između mode i prosjek, što je serija asimetričnija. Utvrđeno je da je za umjereno asimetrične serije razlika između moda i aritmetičke sredine približno tri puta veća od razlike između medijane i aritmetičke sredine:

Ovaj omjer se može koristiti za određivanje jednog indikatora od dva poznata. Iz ovoga slijedi da je kombinacija moda, medijane i srednje vrijednosti također važna za karakterizaciju tipa distribucije.

informatika i matematika - Teorijski materijali za prvi kolokvijum

1. Stavka matematičke statistike, njegove glavne sekcije. Koncept od statistička distribucija. Normalna distribucija. Pod kojim uslovima je slučajna varijabla normalno raspoređena?

Statistika je nauka koja proučava zbir. wt. yavl-I u cilju identifikacije prirodnog. i proučavati ih uz pomoć generalizovanih indikatora.

Sve metode matematičke statistike mogu se pripisati njena dva glavna odjeljka: teorije statističke procjene parametara i teorije testiranja statističkih hipoteza.

Sekcije:

1. deskriptivna statistika

2. metoda uzorkovanja, intervali povjerenja

3. korelacione analize

4. regresiona analiza

5. analiza kvalitativnih karakteristika

6. multivarijantna statistička analiza:

a) grupisane

b) faktorijel

7. analiza vremenskih serija

8. diferencijalne jednadžbe

9. matematičko modeliranje istorijskih procesa

Distribucija:

Teorijski (beskonačno mnogo objekata i savršeno se ponašaju)

Empirijski (stvarni podaci koji se mogu ucrtati u histogram)

Normalna distribucija - kada na prirodu distribucije utiču mnogi faktori, a nijedan od njih nije odlučujući. Posebno se često koristi u praksi.


2. Normalna distribucija može se grafički predstaviti kao zvonasta, simetrična kriva sa jednim vrhom. Visina (ordinata) svake tačke na ovoj krivulji pokazuje koliko se često javlja odgovarajuća vrijednost. deskriptivna statistika. Srednje vrijednosti - aritmetička sredina, medijan, mod. U kojim situacijama ove tri mjere daju slične vrijednosti, a u kojim se jako razlikuju?

Deskriptivna statistika - Ovo su deskriptivne statistike.

aritmetička sredina, medijan, mod - prosječne mjere - koeficijenti koji mogu karakterizirati skup objekata

· srednja (aritmetička) vrijednost - zbir svih navedenih vrijednosti ukupan broj zapažanja ( prihvaćene oznake: znači ili ), tj. srednje aritmetička vrijednost karakteristika se naziva vrijednost

gdje je vrijednost karakteristike y i-ti objekat, n- broj objekata u agregatu.

· mod - najčešća vrijednost varijable (M)

· medijan je prosječna vrijednost (prihvaćene oznake: medijan, m). Medijan je "srednja" vrijednost karakteristike u smislu da polovina objekata u populaciji ima vrijednost ove karakteristike manju, a druga polovina više od medijane. Možete približno izračunati medijan tako što ćete poredati sve vrijednosti atributa u rastućem (opadajućem) redoslijedu i pronaći broj u ovom varijacionom nizu, koji ili ima broj ( n+1)/2 - u slučaju nepare n, ili je u sredini između brojeva sa brojevima n/2 i ( n+1)/2 - u slučaju paran n.

Ne mogu se sve navedene karakteristike izračunati za kvalitativne karakteristike. Ako je atribut kvalitativan i nominalan, tada se za njega može pronaći samo mod (njegova vrijednost će biti naziv kategorije nominalnog atributa koja se najčešće pojavljuje). Ako je atribut rang jedan, tada se pored moda može pronaći i medijan za njega. Aritmetička sredina se može izračunati samo za kvantitativne osobine.

U slučaju kvantitativnih podataka, sve karakteristike prosječnog nivoa mjere se u istim jedinicama kao i sam originalni atribut.

Vrijednosti koeficijenata su iste ako je raspored raspodjele simetričan.


3. Indikatori heterogenosti - varijansa, srednja kvadratna (standardna) devijacija, koeficijent varijacije. AT u kojim jedinicama se mjere? Zašto uvoditi koncept koeficijenta varijacije?

· srednji kvadrat ili standardna devijacija- mjera širenja karakterističnih vrijednosti oko aritmetičke srednje vrijednosti (prihvaćene oznake: Std.Dev. ( standardna devijacija), s ili s). Vrijednost ovog odstupanja izračunava se po formuli

.

· varijansa karakteristika ( s2 ili s2)

· koeficijent varijacije - odnos standardne devijacije i aritmetičke sredine, izražen kao procenat (označen u statistici slovom V). Koeficijent se izračunava po formuli: .

Sviove mjere se mogu izračunati samo za kvantitativne karakteristike. Svi oni pokazuju koliko jako variraju vrijednosti atributa (ili bolje rečeno, njihova odstupanja od prosjeka) u datoj populaciji. Kako manje vrijednosti mjere raspršenosti, to su vrijednosti karakteristika za sve objekte bliže njihovoj prosječnoj vrijednosti, a time i jedni drugima. Ako je vrijednost mjere rasipanja jednaka nuli, vrijednosti atributa su iste za sve objekte.

Najčešće korištena je srednja kvadratna (ili standardna) devijacija s. Mjeri se, kao i aritmetička sredina, u istim jedinicama kao i sama originalna karakteristika. Ako se sve vrijednosti atributa promijene nekoliko puta, standardna devijacija će se promijeniti na isti način, međutim, ako se sve vrijednosti atributa povećaju (smanje) za određeni iznos, njegova standardna devijacija Neće se promijeniti. Uz standardnu ​​devijaciju često se koristi varijansa (= njen kvadrat), ali je u praksi manje zgodna mjera, jer. jedinice varijanse ne odgovaraju mjernim jedinicama.

Značenje koeficijenta varijacije je da, za razliku od s, on mjeri ne apsolutnu, već relativnu mjeru širenja vrijednosti atributa u statističkoj populaciji.

Što više V , što je manje homogeno stanovništvo.

Homogene Transitional Heterogeneous

V = 0 - 30% V = 30 - 50% V = 50 - 100%

Možda »100% (previše heterogena populacija).


4. Koncept odselektivna metoda. Representative Sample, njegove metode formiranje Dvije vrste grešaka uzorkovanja. Vjerovatnoća povjerenja.

uzorak:

Predstavnik

Slučajno

Mehaničko uzorkovanje - slično slučajni uzorak(svakog 10., 20. itd.).

Prirodno (ono što je ostalo od HS tokom vremena) uzorkovanje.

Reprezentativni uzorak - tačno odražava svojstva stanovništva.

Da bi se uzorak ispravno reflektovao osnovna svojstva, svojstveno općoj populaciji, it trebalo bi da bude nasumično, tj. Sve stavke u populaciji moraju imati jednake šanse da budu uključene u uzorak.

Uzorci se formiraju pomoću posebnih tehnike. Najjednostavniji je slučajni odabir, na primjer, korištenjem uobičajenog žrebanja (za male populacije) ili korištenjem tabela. slučajni brojevi. Za veće, ali prilično homogene populacije, koristi se mehanička selekcija (koja je korišćena u statistici Zemstva). Za heterogene populacije sa određenom strukturom češće se koristi tipična selekcija. Postoje i druge metode, uključujući - kombinacije Različiti putevi selekcija u nekoliko faza uzorkovanja.

Rezultati uzorka uvijek sadrže greške. Ove greške se mogu podijeliti u dvije klase: slučajne i sistematske. Prvi uključuju slučajna odstupanja karakteristika uzorka od opštih, zbog same prirode metode uzorkovanja. Vrijednost slučajne greške može se izračunati (procijeniti). Sistematske greške, s druge strane, nisu nasumično; oni su povezani sa odstupanjem strukture uzorka od realne strukture opšte populacije. Sistematske greške se javljaju kada se prekrši osnovno pravilo slučajnog odabira – osiguravajući da svi objekti imaju jednake šanse da budu uključeni u uzorak. Greške ove vrste statistika nije u mogućnosti procijeniti.

Glavni izvori sistematske greške su: a) neadekvatnost formiranog uzorka ciljevima studije; b) nepoznavanje prirode distribucije u opštoj populaciji i, kao rezultat, kršenje u uzorku strukture opšte populacije; c) svjesni odabir najpovoljnijih i najpovoljnijih elemenata opšte populacije.

Vjerovatnoća -


5. Vjerovatnoća povjerenja. Srednji (standardni) i marginalna greška uzorkovanja. Interval povjerenja za procjenu prosječne vrijednosti u opšta populacija. Testiranje hipoteze o statistička značajnost razlike između dva uzorka srednje vrijednosti.

Interval povjerenja - vrijednost izračunatog koeficijenta, u koji bi, vjerujemo, trebala pasti ova vrijednost za gen. Agregat.

Vjerovatnoća - vjerovatnoća da je vrijednost izračunatog koeficijenta za gen. Stanovništvo će pasti unutar intervala povjerenja. Što više DV, to više CI.

Neizbežno širenje srednje vrednosti uzorka oko opšte srednje vrednosti (tj. standardne devijacije vrednosti uzorka) naziva se standardna greška uzorkovanja m, što je izraženo formulom (s- prosek standardna devijacija, n- veličina uzorka). standardna greška uzorka je manja, što je manja vrijednosts(što karakteriše širenje vrednosti osobina) i što je veća veličina uzorka n.

Ako se metoda uzorkovanja koristi za rad s nekvantitativnim podacima, tada ulogu aritmetičke sredine u populaciji igra proporcija ili učestalost q sign. Udio se izračunava kao omjer broja objekata koji imaju ovu osobinu () prema broju objekata u cjelokupnoj populaciji: . Ulogu mjere širenja igra količina .

U ovom slučaju, standardna greška uzorkovanjamizračunato po formuli:

Tačnost i pouzdanost procene parametara opšte populacije na osnovu uzorka su u inverzni odnos: što je veća preciznost (tj. manja marginalna greška i što je interval pouzdanosti uži), to je niža pouzdanost takve procjene (stepen pouzdanosti). I obrnuto - što je niža tačnost procjene, veća je njena pouzdanost. Često se interval pouzdanosti gradi za 95% pouzdanosti, tako da je marginalna greška uzorkovanja obično jednaka dvostrukoj srednjoj grešci.m..

Interval pouzdanosti za procjenu srednje vrijednosti u općoj populaciji:

X(g.s.) =x(odabrano) +-Δ =x(odabrano) +- = X(odabrano) +- σ(g.s.)/√n

Kriterijumi za srednju razliku

Često postoji problem poređenja dvije srednje vrijednosti uzorka kako bi se testirala hipoteza da su ti uzorci dobijeni iz iste opće populacije, a stvarna odstupanja u vrijednostima srednjih vrijednosti uzorka se objašnjavaju slučajnošću uzoraka.

Hipoteza koja se testira može se formulisati na sljedeći način: razlika između srednjih vrijednosti uzorka je slučajna, tj. opšti proseci su jednaki u oba slučaja. As statistička karakteristika vrijednost se ponovo koristi t, što je razlika između srednjih vrijednosti uzorka podijeljene sa prosječnom standardnom greškom srednje vrijednosti za oba uzorka.

Stvarna vrijednost statističke karakteristike se upoređuje sa kritičnom vrijednošću koja odgovara odabranom nivou značajnosti. Ako je stvarna vrijednost veća od kritične vrijednosti, testirana hipoteza se odbacuje, tj. razlika između srednjih vrijednosti se smatra značajnom (značajnom).


7. Korelacija. Koeficijent linearne korelacije, njegova formula, granice njegovih vrijednosti. Koeficijent determinacije, njegovo smisleno značenje. Koncept od statistička značajnost koeficijenta korelacije.

Koeficijent korelacije pokazuje koliko su dvije varijable blisko povezane .

Koeficijent korelacije r uzima vrijednosti u rasponu od -1 do +1. Ako r= 1, tada između dvije varijable postoji funkcionalna pozitiva linearna veza, tj. u dijagramu raspršenja, odgovarajuće tačke leže na pravoj liniji sa pozitivnim nagibom. Ako r = -1, tada postoji funkcionalna negativna veza između dvije varijable. Ako r = 0, zatim varijable koje se razmatraju linearno nezavisna, tj. u dijagramu raspršivanja, oblak tačaka je "horizontalno rastegnut".

Preporučljivo je izračunati jednadžbu regresije i koeficijent korelacije samo u slučaju kada se odnos između varijabli barem približno može smatrati linearnim. U suprotnom, rezultati mogu biti potpuno pogrešni, posebno koeficijent korelacije može biti blizu nule u prisustvu jake veze. Ovo posebno važi za slučajeve u kojima je zavisnost jasno nelinearna (na primer, zavisnost između varijabli je približno opisana sinusoidom ili parabolom). U mnogim slučajevima, ovaj problem se može zaobići transformacijom originalnih varijabli. Međutim, da bi se naslutila potreba za takvom transformacijom, tj. da saznate šta podaci mogu sadržavati složenih oblika zavisnosti, poželjno ih je “vidjeti”. Zbog toga bi proučavanje odnosa između kvantitativnih varijabli trebalo obično uključivati ​​pregled dijagrama raspršenja.

Koeficijenti korelacije mogu se izračunati bez preliminarne konstrukcije regresione linije. U ovom slučaju se postavlja pitanje tumačenja znakova kao efektivnih i faktorskih, tj. zavisni i nezavisni nisu postavljeni, a korelacije se shvaćaju kao konzistentnost ili sinhronizam istovremene promjene vrijednosti obilježja u prijelazu s objekta na objekt.

Ako objekte karakteriše čitav niz kvantitativnih karakteristika, odmah možete izgraditi tzv. korelacione matrice, tj. kvadratna tabela, čiji je broj redova i kolona jednak broju karakteristika, a na preseku svakog reda i kolone je koeficijent korelacije odgovarajućeg para obeležja.

Koeficijent korelacije nema smislenu interpretaciju. Međutim, njegov trg, tzv koeficijent determinacije(R2), Ima.

koeficijent determinacije (R 2) - ovo je pokazatelj koliko se promjene u zavisnoj osobini objašnjavaju promjenama u nezavisnoj. Preciznije, to je proporcija varijanse nezavisnog obeležja objašnjena uticajem zavisne .

Ako su dvije varijable funkcionalno linearno zavisne (tačke na dijagramu raspršenja leže na istoj pravoj liniji), onda možemo reći da je promjena varijable y potpuno objašnjeno promjenom varijable x, a to je samo slučaj kada je koeficijent determinacije jednako jedan(u ovom slučaju koeficijent korelacije može biti jednak i 1 i -1). Ako su dvije varijable linearno nezavisne (metod najmanjih kvadrata daje horizontalnu liniju), zatim varijablu y njegove varijacije ni na koji način nisu "dugovane" varijabli x– u ovom slučaju je koeficijent determinacije jednak nuli. U srednjim slučajevima, koeficijent determinacije pokazuje koji je dio promjena u varijabli y objašnjeno promjenom varijable x(ponekad je zgodno ovu vrijednost predstaviti kao postotak).


8. Parna soba ivišestruko linearna regresija. Koeficijent višestruka korelacija. Smisaono značenje koeficijenta regresije, njegov značaj, pojam t- statistika. Smisaono značenje koeficijenta determinacije R2.

Regresiona analiza - Statistička metoda koja vam omogućava da izgradite modele objašnjenja na osnovu interakcije karakteristika.

po najviše jednostavan slučaj odnos je odnos u paru, tj. odnos između dve osobine. Pretpostavlja se da je odnos između dvije varijable, po pravilu, uzročne prirode, tj. jedan od njih zavisi od drugog. Prvi (ovisni) se poziva regresiona analiza rezultirajući drugo (nezavisno) - faktorijel. Treba napomenuti da nije uvijek moguće jednoznačno odrediti koja je od dvije varijable nezavisna, a koja zavisna. Komunikacija se često može posmatrati kao dvosmjerna.

Parna regresijska jednačina : y = kx + b.

Na zavisnu varijablu najčešće djeluje više faktora odjednom, među kojima je teško izdvojiti jedinu ili glavnu. Na primjer, prihod preduzeća zavisi od istovremeno od dva faktora proizvodnje - broja radnika i napajanja. Štaviše, ova dva faktora nisu nezavisna jedan od drugog.

Jednačina višestruka regresija : y = k 1 · x 1 + k 2 · x 2 + … + b,

gdje x 1 , x 2, . . . - nezavisne varijable, od kojih proučavana (rezultujuća) varijabla y zavisi u jednom ili drugom stepenu;

k 1 , k 2. . . su koeficijenti za odgovarajuće varijable ( koeficijenti regresije) koji pokazuje koliko se vrijednost rezultirajuće varijable mijenja kada se jedna nezavisna varijabla promijeni za jedan.

Jednačina višestruke regresije specificira regresijski model objašnjavajući ponašanje zavisne varijable. Nema regresijski model ne može reći koja je varijabla zavisna (posledica), a koja je nezavisna (uzroci).

R - višestruke šanse korelacija, meri ukupnost uticaja nezavisnih obeležja, bliskost odnosa rezultirajućeg obeležja sa celim skupom nezavisnih obeležja, izraženo u%.

Pokazuje koji se udio karakteristika uzima u obzir u dijelu rezultata, tj. koliko % se varijacija karakteristike y objašnjava varijacijama razmatranih karakteristika X1, X2, X3.

T-statistikapokazuje nivo stat. značaj svakog od njih koeficijent regresije, tj. njegovu robusnost u odnosu na uzorak.

T = b/ Δb

Statistički značajno t >2. Što je veći koeficijent, to bolje.

preko R ² donosimo zaključak o % karakteristika uzetih u obzir objašnjavaju rezultat.


9. Metode multidimenzionalnog Statistička analiza. Klaster analiza. Koncept od hijerarhijski metod i oK-means metoda. Multivarijantna klasifikacija sa koristeći rasplinute skupove.

JE:

klaster analiza

Faktorska analiza

Višedimenzionalno skaliranje

klaster analiza - kombinovanje objekata u grupu sa zajedničkim ciljem (postoji mnogo znakova).

Metode klaster analize:

1. hijerarhijski(stablo hijerarhijske analize):

glavna ideja hijerarhijski metod sastoji se u sekvencijalnom povezivanju grupisanih objekata - prvo najbližih, a zatim sve udaljenijih jedan od drugog. Procedura za izradu klasifikacije sastoji se od uzastopni koraci, na svakoj od kojih su dvije najbliže grupe objekata spojene (klasteri).

2. k-means metoda.

Zahtijeva unaprijed definirane klase (klasteri). Naglašava varijansu unutar klase. na osnovu hipoteze o najvjerovatnijem broju klasa. Zadatak metode je da se izgradi zadani broj klastera, koji bi se trebali razlikovati jedan od drugog što je više moguće.

Postupak klasifikacije počinje izgradnjom zadanog broja klastera dobijenih slučajnim grupiranjem objekata. Svaki klaster treba da se sastoji od maksimalno "sličnih" objekata, a sami klasteri trebaju biti maksimalno "različiti" jedni drugima.

Rezultati ove metode omogućavaju vam da dobijete centre svih klasa (kao i druge parametre deskriptivne statistike) za svaku od originalnih karakteristika, a također vidite grafički prikaz o tome kako i po kojim parametrima se rezultujuće klase razlikuju.

Ako se rezultati klasifikacija dobiveni različitim metodama poklapaju, onda to potvrđuje stvarnost. Postojeće grupe (pouzdanost, pouzdanost).


10. Metode multidimenzionalne statističke analize. Faktorska analiza, svrha njene upotrebe. Koncept od faktorske težine, njihove granice vrijednosti; udio ukupne varijanse objašnjen faktorima.

Multivarijantna statistička analiza. Njegova svrha: izgradnja pojednostavljenog uvećanog niza objekata.

JE:

klaster analiza

Faktorska analiza

Višedimenzionalno skaliranje

U srži faktorska analiza leži ideja da se iza složenih međuodnosa eksplicitno datih osobina krije relativno jednostavnija struktura koja odražava najbitnije karakteristike fenomena koji se proučava, a „spoljna“ obeležja su funkcije skrivenih zajednički faktori definisanje ove strukture.

Svrha: prelaz sa više osobine malog broja faktora.

in faktorska analiza sve veličine uključene u faktorski model su standardizovane, tj. su bezdimenzionalne veličine sa aritmetičkom sredinom 0 i standardnom devijacijom 1.

Koeficijent odnosa između određene osobine i zajedničkog faktora, koji izražava stepen uticaja faktora na obeležje, naziva se faktor opterećenja ove osobine za ovaj zajednički faktor . Ovo je broj između -1 i 1. Što je dalje od 0, to je jača veza. Vrijednost faktorskog opterećenja za određeni faktor, blizu nule, ukazuje da ovaj faktor praktično ne utječe na ovu osobinu.

Naziva se vrijednost (mjera ispoljavanja) faktora u pojedinačnom objektu faktorska težina objekt za ovaj faktor. Ponderi faktora vam omogućavaju da rangirate, poredate objekte prema svakom faktoru. Što je veća faktorska težina nekog objekta, to više manifestuje tu stranu pojave ili onaj obrazac koji se reflektuje ovim faktorom. Faktori su standardizirane vrijednosti, ne mogu biti = nula. Težine faktora blizu nule ukazuju srednji stepen manifestacije faktora, pozitivne - da je ovaj stepen iznad prosjeka, negativne - o tome. da je ispod prosjeka.

Tabela faktora težine ima n redova po broju objekata i k kolone po broju zajedničkih faktora. Položaj objekata na osi svakog faktora pokazuje, s jedne strane, redoslijed kojim su oni rangirani ovim faktorom, as druge strane, ujednačenost ili neujednačenost u njihovom rasporedu, prisustvo nakupina tačaka koje prikazuju objekte. , što omogućava vizuelno isticanje više ili manje homogenih grupa.


11. Vrste kvalitativnih znakova. Nazivne karakteristike, primjeri iz istorijskih izvora. Tabela za nepredviđene situacije. Koeficijent povezanosti nazivnih karakteristika, granice njegovih vrijednosti.

Ocenjeni podaci prikazani su po kategorijama za koje redoslijed apsolutno nije bitan. Za njih nije definiran nikakav drugi način poređenja, osim doslovnog podudaranja/nepodudaranja.

Primjeri nominalnih varijabli:

· Nacionalnost: Englez, Belorus, Nemac, Rus, Japanac, itd.

· Zanimanje: zaposlenik, doktor, vojnik, učitelj itd.

· Profil obrazovanja: humanitarni, tehnički, medicinski, pravni itd.

Ako bismo u slučaju stepena obrazovanja i dalje mogli porediti ljude u smislu „bolji-gori“ ili „viši-niži“, sada smo lišeni i ove mogućnosti; jedini ispravan način poređenja je da se kaže da su te ličnosti "sve istoričari", ili "nisu svi pravnici".

Tablice za nepredviđene situacije

Tabela nepredviđenih okolnosti je pravougaona tabela, čiji redovi označavaju kategorije jednog obeležja (na primer, različite društvene grupe), a kolone označavaju kategorije drugog (na primer, partijska pripadnost). Svaki objekat kolekcije spada u jednu od ćelija ove tabele u skladu sa kategorijom u koju spada za svaku od dve karakteristike. Dakle, u ćelijama tabele nalaze se brojevi koji predstavljaju učestalost zajedničkog pojavljivanja kategorija dvaju obeležja (broj ljudi koji pripadaju određenoj društvenoj grupi i pripadaju određenoj stranci). U zavisnosti od prirode distribucije ovih frekvencija unutar tabele, može se proceniti da li postoji veza između karakteristika. Kakva je veza između društveni status i partijska pripadnost? U ovom slučaju, prisustvo veze bi ukazivalo na prisustvo određenih političkih preferencija među pripadnicima različitih društvene grupe. Formalno gledano, ova veza se shvaća kao češća (ili obrnuto, rjeđa) zajednička pojava pojedinih kombinacija kategorija u odnosu na očekivanu pojavu – situaciju da tamo dođu čisto slučajni objekti (npr. veći udio seljaka u Trudovik, i plemići u partiji kadeta, nego udjeli ovih društvenih grupa u cjelokupnoj populaciji poslanika Dume).


12. Vrste kvalitativnih znakova. Znakovi ranga, primjeri iz istorijskih izvora. AT koje su granice vrijednosti koeficijenta rang korelacije? Koje koeficijente treba koristiti za procjenu odnosa između ranga i nazivni znakovi?

Kvalitativni (ili kategorički) podaci se dijele na dvije vrste: rangirane i nominalne.

Podaci o rangusu predstavljene kategorijama za koje možete odrediti redoslijed, tj. kategorije su uporedive po principu "više-manje" ili "bolje-gore".

Primjeri varijabli ranga:

· Ocjene na ispitu imaju izraženu rangovnu prirodu i izražavaju se u kategorijama kao što su "odličan", "dobar", "zadovoljavajući" itd.

· Nivo obrazovanja može se predstaviti kao skup kategorija: "viša", "srednja" itd.

Naravno, možemo uvesti ljestvicu rangiranja i njome rangirati sve ljude za koje znamo njihov nivo obrazovanja ili rezultat testa. Međutim, da li je tačno da je "dobro" isto toliko gore od "odlično" koliko je "zadovoljavajuće" gore od "dobro"? Unatoč činjenici da formalno, u slučaju ocjena, možete dobiti razliku u bodovima, teško da je ispravno mjeriti udaljenost od "odlično" do "dobro" koristeći ista pravila kao za udaljenost od Moskve do Sankt Peterburga . U slučaju nivoa obrazovanja, to je posebno jasno jednostavne proračune nemoguće, jer ne postoji jedinstveno pravilo za oduzimanje "srednjeg" obrazovanja od "višeg", čak i ako visokom obrazovanju dodijelimo šifru "3", a srednjem - šifru "2".

Posebnost kvalitativnih podataka ne znači da se oni ne mogu analizirati matematičkim i statističkim metodama.

Broj objekata poredanih u skladu sa stepenom ispoljavanja određenog svojstva naziva se rangiranim, svakom broju takve serije se dodeljuje rang.

Mjere odnosa između para karakteristika, od kojih svaka rangira proučavani skup objekata, nazivaju se u statistici koeficijenti korelacije ranga .

Ovi koeficijenti su izgrađeni na osnovu sljedeća tri svojstva:

· ako se rangirani niz za oba svojstva potpuno poklapa (tj. svaki objekt zauzima isto mjesto u oba niza), tada bi koeficijent korelacije ranga trebao biti jednak +1, što znači punu pozitivnu korelaciju:

· ako se objekti u istom redu nalaze u obrnutim redosledom u odnosu na drugi koeficijent je -1, što znači potpunu negativnu korelaciju;

· u drugim situacijama, vrijednosti koeficijenta su u intervalu [-1, +1]; povećanje modula koeficijenta od 0 do 1 karakterizira povećanje korespondencije između dva rangirana reda.

Specificirana svojstva imaju koeficijente rang korelacije Spearman r i Kedalla t .

Kedallov koeficijent daje konzervativniju procjenu korelacije od Spearmanovog koeficijenta (numerička vrijednosttuvek manje odr).

Koeficijenti odnosa kvalitativnih karakteristika

Za procjenu odnosa kvalitativnih karakteristika potreban je koeficijent koji bi u slučaju maksimalnog odnosa imao određeni maksimum i koji bi omogućio međusobno poređenje. različiti stolovi po jačini odnosa između karakteristika. U ovom slučaju se uklapamo Cramerov koeficijent V .

Na osnovu vrijednosti hi-kvadrat testa, Cramerov koeficijent vam omogućava da izmjerite snagu odnosa između dvije kategorizirane varijable - da je izmjerite brojem koji uzima vrijednosti od 0 do 1, tj. od potpunog nedostatka komunikacije do maksimuma jaka veza. Koeficijent vam omogućava da uporedite zavisnosti različiti znakovi, kako bi se otkrile više i manje jake veze.


13. Matematičko modeliranje istorijski procesi ifenomeni. Definicija pojma "model". Tri vrste modela, primjeri istih koristiti u istorijsko istraživanje.

14. Diferencijalne jednadžbe kao glavni alat za konstrukciju matematički modeli teorijski tip. Njihove karakteristike u poređenju sa modelima simulacionog i statističkog tipa. Primjer takvog modela.

Pošaljite svoj dobar rad u bazu znanja je jednostavno. Koristite obrazac ispod

Dobar posao na stranicu">

Studenti, postdiplomci, mladi naučnici koji koriste bazu znanja u svom studiranju i radu biće vam veoma zahvalni.

Objavljeno na http://www.allbest.ru/

Zadatak 1

U nekom regionu u tekuće godine Počinjeno je 12.390 krivičnih djela, au prethodnoj godini 11.800 krivičnih djela. Izračunati (u %) stopu rasta i stopu rasta broja registrovanih krivičnih djela u tekućoj godini u odnosu na prethodnu. Također izračunajte stope kriminala za svaku godinu ako je stanovništvo regije na kraju prethodne godine iznosio je 1.475.000, a na kraju tekuće godine - 1.770.000 ljudi. Izvucite zaključke o dinamici kriminala u regionu.

Odluka: Za dobijanje tačne slike kriminala, takav pokazatelj kriminala kao što je dinamika, odnosno promena tokom vremena, je od velike važnosti. Dinamiku kriminala karakterišu koncepti apsolutnog rasta (ili opadanja) i stope rasta i rasta kriminala, da bi se utvrdilo koje su ove karakteristike izračunate prema određenim formulama.

Stope rasta kriminala izračunavaju se na osnovu osnovnih pokazatelja dinamike, što uključuje poređenje podataka za niz godina (a ponekad i decenija, ako je potreban široki obuhvat materijala) sa konstantnom osnovom, što se podrazumijeva kao nivo kriminala. u početnom periodu za analizu. Ova kalkulacija omogućava kriminolozima u velikoj mjeri garantovati uporedivost relativni indikatori, u procentima, koji pokazuju u kakvoj je korelaciji krivično djelo narednih perioda sa prethodnim.

U proračunu se 100% uzima iz podataka izvorne godine; dobijeni pokazatelji za naredne godine odražavaju samo procenat rasta, što računicu čini tačnim, a sliku objektivnijom; kada se radi sa relativnim podacima, moguće je isključiti uticaj na smanjenje ili povećanje kriminaliteta povećanja ili smanjenja broja stanovnika koji su navršili godine za krivičnu odgovornost.

Stopa porasta kriminala se računa u procentima. Stopa porasta kriminala pokazuje koliko je naknadna stopa kriminala porasla ili smanjena u odnosu na prethodni period. Prihvaćeno simbol vektor stope rasta: ako postotak raste, stavlja se znak plus; ako se smanjuje, stavlja se znak minus.

S obzirom na uslove našeg zadatka, treba da primenimo odgovarajuće formule i izračunamo rast i rast kriminala.

1) Stopa rasta kriminala izračunava se po formuli ^

Tr \u003d U / U2 * 100%,

gdje je U pokazatelj stope kriminaliteta, a U2 indikator stope kriminala iz prethodnog perioda. Dakle, stopa rasta kriminala pod uslovima problema će biti - 12390/11800 * 100% = 1,05%.

2) Stopa porasta kriminala izračunava se po sljedećoj formuli:

Tpr \u003d Tr-100%.

Dakle, stopa rasta prema uslovima problema biće 1,05% -100% = 98,95%.

Stopa kriminala je specifičan zbirni indikator ukupno evidentirani zločini, u korelaciji sa stanovništvom. Označava broj zločina na 100.000, 10.000 ili 1.000 stanovnika i objektivna je mjera kriminaliteta koja omogućava upoređivanje njegovih nivoa u različitim regijama iu različitim godinama.

Stopa kriminala pomaže da se adekvatnije procijeni dinamika nivoa kriminala po glavi stanovnika.

Stopa kriminala se izračunava po formuli:

KP \u003d (P x 100000): N,

gdje je P - apsolutni broj evidentirani zločini; a H ​​je apsolutni broj ukupne populacije.

Oba indikatora su uzeta u istom teritorijalnom i vremenskom obimu. Broj zločina se obično računa na 100.000 stanovnika. Ali sa malim brojem zločina i stanovništva (u gradu, okrugu, u preduzeću), stopa kriminala se može izračunati na 10 hiljada ili na 1 hiljadu stanovnika. u svakom slučaju, ovi brojevi označavaju dimenziju koeficijenta koji se razmatra, koji se mora naznačiti: broj krivičnih djela na 100.000 ili 10.000 stanovnika.

Izračunajmo stopu kriminala u odnosu na uslove našeg problema:

1) CP = (12390 * 100000): 1,770,000 ljudi. = 700 (u tekućoj godini).

2) CP = (11800 * 100000): 1,475,000 = 800 (prethodna godina).

Kriminal u regionu je u opadanju, jer se, analizirajući stopu kriminala, može zaključiti da je povećanjem stanovništva u regionu (za 16,6%), i blagim povećanjem broja krivičnih dela za 1,05%, generalno, porast kriminala se smanjuje (-98,95 %).

Zadatak 2

Starost 11 mladih specijalista ustanove, primljenih u službu, u tekućoj godini iznosila je 19,25,21,23,23,23,25,20,18,20,21 godina, respektivno. Sumirajte i grupišite podatke u statističku tabelu učestalosti. Radi jasnoće, napravite poligon frekvencija i pronađite modalnu, medijanu i prosječnu vrijednost starosti zaposlenih radnika.

Odluka: grupisanje- ovo je podjela stanovništva na grupe koje su na neki način homogene. Sa stanovišta pojedinačnih jedinica stanovništva, grupisanje je udruživanje pojedinačnih jedinica stanovništva u grupe koje su na neki način homogene.

Metoda grupisanja se zasniva na sledećim kategorijama - atribut grupisanja, interval grupisanja i broj grupa.

Grupni znak- ovo je znak kojim se pojedinačne jedinice stanovništva ujedinjuju u homogene grupe.

Interval ocrtava kvantitativne granice grupa. U pravilu predstavlja interval između maksimalne i minimalne vrijednosti atributa u grupi.

Određivanje broja grupa.

Broj grupa približno je određen Sturgessovom formulom:

n = 1 + 3,2log n = 1 + 3,2log(11) = 4.

Širina intervala će biti:

Xmax- maksimalna vrijednost grupna osobina u agregatu. Xmin - minimalna vrijednost funkcije grupisanja. Hajde da definišemo granice grupe.

Broj grupe

Zaključak

Gornja granica

Ista vrijednost karakteristike služi kao gornja i donja granica dvije susjedne (prethodne i sljedeće) grupe.

Za svaku vrijednost serije izračunavamo koliko puta ona pada u određeni interval. Da biste to učinili, sortirajte niz uzlaznim redoslijedom.

broj stanovništva

frekvencija fi

Poligon frekvencije je graf gustine i vjerovatnoće slučajna varijabla, je isprekidana linija koja povezuje točke koje odgovaraju srednjim vrijednostima intervala grupiranja sa frekvencijama ovih intervala.

Prosječna vrijednost:

Modadoslovno značenje. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

gdje je x 0 - početak modalnog intervala; h - vrijednost intervala; f 2 - frekvencija koja odgovara modalnom intervalu; f 1 - premodalna frekvencija; f 3 - postmodalna frekvencija.

Za početak intervala biramo 19,75, jer upravo taj interval predstavlja najveći broj.

Najčešća vrijednost serije je 20,92.

Medijan. Medijan dijeli uzorak na dva dijela: polovina opcije je manja od medijane, polovina je više.

U nizu distribucije intervala možete odmah odrediti samo interval u kojem će se mod ili medijan nalaziti. Medijan odgovara opciji u sredini raspona. Medijan je interval 19,75-21,5, jer u ovom intervalu, akumulirana frekvencija S je veća od medijanskog broja (medijana je prvi interval, čija akumulirana frekvencija S prelazi polovinu ukupan iznos frekvencije).

Tako će 50% jedinica stanovništva biti manje od 21,28.

Zadatak 3

Odredite potrebnu veličinu uzorka za proučavanje prosječne starosti certificiranih službenika Federalne kazneno-popravne službe Rusije, pod uslovom da je standardna devijacija 10 godina, a maksimalna dozvoljena greška uzorkovanja ne smije biti veća od 5%.

Tražimo rješenje prema formuli za određivanje veličine uzorka za ponovnu selekciju.

F(t) = g/2 = 0,95/2 = 0,475 i prema Laplaceovoj tabeli ova vrijednost odgovara t=1,96.

Procijenjena standardna devijacija s = 10; greška uzorkovanja e = 5.

Zadatak 4

Sljedeća tabela daje zvaničnu statistiku odjela o raspodjeli osuđenika prema zatvorskim (kaznama) za 2002-2011, objavljenu na službenoj web stranici Federalne kazneno-popravne službe Rusije: www.fsin.su. Odrediti raspon i koeficijent varijacije broja osuđenih za svaku kalendarsku godinu i zaključiti o homogenosti strukture ovog statističkog obilježja.

Glavni indikator koji karakteriše homogenost podataka je koeficijent varijacije. U statistici je općenito prihvaćeno da ako je vrijednost koeficijenta manja od 33%, onda je skup podataka homogen, ako je veći od 33%, onda je heterogen.

Koeficijent varijacije

Jer v? 30%, tada je populacija homogena, a varijacija je slaba. Dobijeni rezultati se mogu vjerovati.

Rok kazne

1 do 3 godine

3 do 5 godina

5 do 10 godina

Od 10 do 15 godina

Preko 15 godina

Maksimalna vrijednost (MAX funkcija)

Minimalna vrijednost (MIN funkcija)

Varijacija raspona

Prosječna vrijednost (AVERAGE funkcija)

Standardna devijacija (STANDAR LONA funkcija)

Koeficijent varijacije

jednostavan prosek:

Moda značenje

Medijan

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 70580. Dakle, medijan Me = 70580.

Indikatori varijacije. .

R \u003d X max - X min.

R = 295916-2250 = 293666.

Prosječna linearna devijacija

Svaka vrijednost serije razlikuje se od druge u prosjeku za 90895,71.

Disperzija

(srednja greška uzorci).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti 103008 u prosjeku za 107169,83.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Jer v>

ili

Faktor oscilacije

jednostavan prosek:

Moda

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 76186. Dakle, medijan Me = 76186.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R = X max - X min

R = 291112-3101 = 288011.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 83422,69.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 97334,29 u prosjeku za 100750,25.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu volatilnost ekstremne vrednosti karakteristika oko srednje vrednosti.

jednostavan prosek:

Moda doslovno značenje. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 71093. Dakle, medijan Me = 71093.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R = X max - X min

R = 243852-3856 = 239996.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 68998,08.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 85765,57 u prosjeku za 82541,55.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

:

Moda. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 74588. Dakle, medijan Me = 74588.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R \u003d X max - X min,

R=242984-5304=237680.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 73148,73.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 92104,14 u prosjeku za 82873,1.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

jednostavna aritmetička sredina:

Moda. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 76678. Prema tome, medijana Me = 76678

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R \u003d X max - X min.

R = 249346-6536 = 242810.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 79680,53.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 99551,71 u prosjeku za 87389,04.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

jednostavna aritmetička sredina:

Moda. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 76461. Dakle, medijan Me = 76461.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R \u003d X max - X min.

R = 254722-6704 = 248018.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 82302,82.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 102346,71 u prosjeku za 89787,88.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

jednostavna aritmetička sredina:

Moda. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 78959. Dakle, medijan Me = 78959.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R \u003d X max - X min.

R = 261334-7635 = 253699.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 83791,55.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 104898,86 u prosjeku za 91616,15.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

jednostavna aritmetička sredina:

Moda. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 75916. Dakle, medijan Me = 75916.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R \u003d X max - X min.

R=263863-8145=255718.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 82767,96.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 103440,71 u prosjeku za 91207,92.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

jednostavna aritmetička sredina:

Moda. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 78019. Dakle, medijan Me = 78019.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R = X max - X min

R = 260094-7798 = 252296.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 77827,76.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 99212,29 u prosjeku za 88081,39.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

jednostavna aritmetička sredina:

Moda. Mod je najčešća vrijednost karakteristike u jedinicama date populacije.

Ne postoji način rada (sve vrijednosti serije su individualne).

Medijan. Medijan je vrijednost karakteristike koja dijeli jedinice rangirane serije na dva dijela. Medijan odgovara opciji u sredini raspona.

Nalazimo sredinu rangiranog niza: h = (n + 1) / 2 = (7 + 1) / 2 = 4. Ovaj broj odgovara vrijednosti serije 72248. Dakle, medijan Me = 72248.

Indikatori varijacije. Stope apsolutne varijacije.

Raspon varijacije je razlika između maksimalne i minimalne vrijednosti atributa primarne serije.

R \u003d X max - X min.

R = 242137-7173 = 234964.

Prosječna linearna devijacija- izračunati kako bi se uzele u obzir razlike svih jedinica proučavane populacije.

Svaka vrijednost serije razlikuje se od druge u prosjeku za 70459,02.

Disperzija- karakteriše meru širenja oko svoje srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Standardna devijacija(srednja greška uzorkovanja).

Svaka vrijednost serije razlikuje se od prosječne vrijednosti od 91375,14 u prosjeku za 80674,43.

Relativne mjere varijacije. Relativni indikatori varijacije uključuju: koeficijent oscilacije, linearni koeficijent varijacije, relativno linearno odstupanje.

Koeficijent varijacije- mjera relativnog širenja vrijednosti stanovništva: pokazuje koliki je udio prosječne vrijednosti ove veličine njen prosječni raspon.

Pošto v>70%, populacija se približava ivici heterogenosti, a varijacija je jaka.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan. U ovom slučaju, u praktičnim studijama, različite statističke metode dovode populaciju do homogenog oblika.

Linearni koeficijent varijacije ili Relativna linearna devijacija- karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti.

Faktor oscilacije- odražava relativnu fluktuaciju ekstremnih vrijednosti atributa oko prosjeka.

Zadatak 5

U uslovima prethodnog zadatka pregrupisati zadate intervale rečenica kako bi se poboljšali relativni pokazatelji varijacije atributa u 2010. godini. Izgraditi histograme distribucije osuđenih po rokovima zatvora (kaznama) za 2010. godinu prije i poslije grupisanja podataka i zaključiti o homogenosti strukture statističke karakteristike koja se proučava.

Odluka:

Pošto v>30%, ali v<70 %, то вариация умеренная.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan.

Preuredimo podatke na sljedeći način:

Grupa 1) uključuje grupe: do godinu dana, godinu dana, od 1-3 godine, odnosno 156978.

Grupa 2) uključuje iz grupe preko 3 do 5 godina u potpunosti i 1/5 iz grupe preko 5 do 10 godina, dobijamo 1/5 * 260094 + 168651 = 220669,8.

Grupa 3) obuhvata 3\5 grupa od 5 do 10 tj. 3\5*260094=156056.4.

Grupa 4) (1\5*260094)+(1\5*78019)=67622,6.

Grupa 5) 3\5*78019=46811.4.

Grupa 6 30744+(1\5*78019)=46347.8.

Bar grafikona. Da bismo dobili zaključak o homogenosti proučavane statističke karakteristike, izračunavamo koeficijent varijacije:

Pošto v>30%, ali v<70 %, то вариация умеренная.

Koeficijent varijacije je mnogo veći od 33%. Posljedično, razmatrani skup je heterogen i prosjek za njega je nedovoljno tipičan.

Zadatak 6

Ukratko navedite (sažetak, na 1-2 stranice) sadržaj i rezultate nedavne službene statističke studije u društvenoj i pravnoj sferi (potrebne su teme - po vašem izboru, linkovi na internet resurse), izvucite zaključke i iznesite odgovarajuće statističke podatke. hipoteze za kratkoročnu perspektivu.

Kao zvanična statistička studija uzeta je studija o zaostalim obavezama zarada od 01.12.2015.

Od 1. decembra 2015. godine, prema organizacijama (koji se ne odnose na mala preduzeća), ukupan dug u pogledu plata za raspon posmatranih vrsta privredne djelatnosti iznosila je 3900 miliona rubaljaona i u odnosu na 1. novembar 2015. godine povećan je za 395 miliona rubalja (za 11,3%).

Zaostale plate zbog nedostatka sopstvenih sredstava od 1. decembra 2015. godine iznosio 3818 miliona rubaljaona, odnosno 97,9% ukupnog iznosa dospjelog duga. U poređenju sa 01.11.2015 povećana je za 389 miliona rubalja (za 11,3%). Dug zbog neblagovremenog prijema sredstava iz budžeta svih nivoa iznosio 82 miliona rubaljaona i povećan u odnosu na 1. novembar 2015. godine. za 6 miliona rubalja (za 7,7%), uključujući dug iz savezne Budžet iznosio je 62 miliona rubalja i smanjen je u odnosu na 1. novembar 2015. godine. za 6 miliona rubalja (za 8,6%), budžeta subjekata Ruske Federacije iznosio je 1,1 milion rubalja (povećanje od 0,2 miliona rubalja ili 20,7%), lokalni budžeti - 19 miliona rubalja (povećanje od 12 miliona rubalja ili 2,5 puta).

U rudarstvu, prerađivačkoj industriji, zdravstvu i socijalnim uslugama, ribarstvu i uzgoju ribe, 100% zaostalih plata nastaje zbog nedostatka vlastitih sredstava organizacija.

U ukupnom iznosu zaostalih plata, 37% otpada na prerađivačku proizvodnju, 29% - na građevinarstvo, 9% - na proizvodnju i distribuciju električne energije, gasa i vode, 7% - na transport, 6% - na rudarstvo, 5% - za poljoprivredu, lov i pružanje usluga u ovim oblastima, sječu.

Obim zaostalih plata na dan 01.12.2015 iznosio je manje od 1% mjesečne mase zarada radnika u posmatranim vrstama privredne djelatnosti.

Zaostale plate za prošli mjesec, za koje su izvršene obračunske obaveze, u ukupnom iznosu dospjelih dugovanja u prosjeku su iznosile 29%: proizvodnja i distribucija električne energije, gasa i vode - 75%, djelatnosti u oblasti obrazovanja - 37%, zdravstvo i socijalne usluge - 35%, naučno istraživanje i razvoj - 32%, građevinarstvo - 29%, transport - 23%, proizvodnja - 22%.

Od ukupnog iznosa neisplaćenih zarada, dugovi formirani u 2014. godini čine 457 miliona rubalja (11,7%), u 2013. godini. i ranije - 657 miliona rubalja (16,8%).

Generalno, posmatrajući dinamiku zaostalih plata (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), možemo zaključiti da će doći do značajnog pada u Januar, februar 2016.

Najveći procenat duga otpada na prerađivačku industriju - 37%, 29% - na građevinarstvo, najvjerovatnije je to zbog smanjenja potražnje potrošača za proizvodima, a shodno tome i smanjenja profita.

Hajde da postavimo hipotezu. Od januara 2016. godine postotak duga će se smanjiti zbog raspodjele godišnjeg budžeta za narednu godinu, uzimajući u obzir djelimičnu otplatu zaostalih plata, i iznosiće 2.700 miliona dinara. Dinamika varijacije kriminala medijana

Za testiranje hipoteze (Ovu tabelu uzimamo kao osnovu http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Konstruirajmo diskretni varijacioni niz. Da biste to učinili, sortirajte niz uzlaznim redoslijedom i prebrojite broj ponavljanja za svaki element serije.

Izračunajmo prosjek:

Izračunajmo varijansu. Disperzija - karakteriše meru disperzije oko njene srednje vrednosti (mera disperzije, tj. odstupanja od srednje vrednosti).

Koristeći jednostrani test sa b = 0,05, testirajte ovu hipotezu ako je na uzorku od n = 24 mjeseca prosjek bio 2741,25, a varijansa je poznata i jednaka je y = 193469,27

Odluka. Standardna devijacija:

Postavlja se nulta hipoteza H 0 da je vrijednost matematičkog očekivanja opće populacije jednaka broju m 0: = 2700.

Alternativna hipoteza:

H 1: m? 2700, kritično područje - bilateralno.

Za testiranje nulte hipoteze koristi se slučajna varijabla:

gdje je x srednja vrijednost uzorka; S je standardna devijacija opće populacije.

Ako je nulta hipoteza tačna, onda slučajna varijabla T ima standardnu ​​normalnu distribuciju. Kritična vrijednost statistike T određuje se na osnovu vrste alternativne hipoteze:

P(|T|

Nađimo eksperimentalnu vrijednost statistike T:

Budući da je veličina uzorka prilično velika (n>30), umjesto prave vrijednosti standardne devijacije, možete koristiti njegovu procjenu S=439,851.

F (t cr) = (1-b) / 2 = (1-0,05) / 2 = 0,475.

Prema tablici Laplaceove funkcije nalazimo pri kojem t kp vrijednost F (t kp) = 0,475.

Eksperimentalna vrijednost kriterija T nije pala u kritično područje T ? t kp , pa treba prihvatiti nultu hipotezu. Vrijednost matematičkog očekivanja opće populacije može se uzeti jednakom 2700

Bibliografija

1. Kazantsev S.Ya. Pravna statistika: Udžbenik / Ed. S.Ya. Kazantseva, S.Ya. Lebedeva - M.: UNITY-DANA: Pravo i pravo, 2009

2. Kurys? u K.N. Osnovi pravne statistike: udžbenik. dodatak / K.N. Kurys? in; VUI FPS Rusije. - Vladimir, 2005. - 44 str.

3. Makarova N.V. Statistika u Excelu: udžbenik. dodatak / N.V. Makarova, V.Ya. Trofimets. - M.: Finansije i statistika.

4. Kondratyuk L.V., Ovchinsky V.S. Kriminološka dimenzija / ur. K.K. Goryainov. - M.: Norma, 2008.

5. Yakovlev V.B. Statistika. Proračuni u Microsoft Excel-u: udžbenik. Priručnik za univerzitete / V.B. Yakovlev. - M.: Kolos, 2005. - 352 str.

Hostirano na Allbest.ru

...

Slični dokumenti

    Proučavanje maloljetničke delikvencije sa stanovišta objekta kriminološkog istraživanja. Veza između tinejdžerskog alkoholizma, zloupotrebe supstanci, ovisnosti o drogama i kriminala. Uzroci i uslovi i načini prevencije maloljetničke delikvencije.

    seminarski rad, dodan 08.04.2011

    Metodologija specifičnih kriminoloških istraživanja. Kriminološke karakteristike nasilnog kriminala i njegova prevencija. Javna opasnost i težina posljedica nasilnih krivičnih djela. Statistika kriminala.

    test, dodano 15.01.2011

    Formula za izračunavanje stope kriminala. Obračun prosječnog godišnjeg opterećenja po sudiji, prosječnog trajanja istrage krivičnih predmeta, prosječne godišnje stope rasta kriminala. Izračunavanje indikatora načina rada, medijane, varijacije i standardne devijacije.

    test, dodano 20.04.2011

    Proučavanje osnova kriminala iz plaćenika: pojam, elementi, objekti i subjektivni aspekti. Opis društvene i specijalno-kriminološke prevencije kriminala iz plaćeničkih pobuda. Izrada seta mjera za sprječavanje kriminala.

    teza, dodana 09.11.2012

    Pojam i predmet kriminološkog predviđanja. Utvrđivanje mogućih promjena stanja, nivoa, strukture i dinamike kriminala u budućnosti. Evaluacija razvoja kriminala u budućnosti. Planiranje i prevencija kontrole kriminala.

    seminarski rad, dodan 29.05.2015

    Proučavanje tipova kriminološkog predviđanja i projektovanja u oblasti kriminaliteta. Karakteristike prognoze maloljetničke delikvencije u Republici Kazahstan. Izrada programa za borbu protiv kriminala na nacionalnom nivou.

    rad, dodato 25.10.2015

    Maloljetnička delinkvencija kao predmet kriminološkog istraživanja. Osnovne, kriminološke karakteristike maloljetničke delikvencije. Stanje kriminala. Osobine ličnih karakteristika maloljetnika.

    sažetak, dodan 04.01.2003

    Trendovi u kriminalnom ponašanju savremenih žena: rast i stalan udio teških i recidivističkih krivičnih djela, podmlađivanje kriminalaca i povećanje broja starijih žena među osuđenicama. Opće mjere za prevenciju ženskog kriminala.

    sažetak, dodan 01.03.2014

    Izračunavanje relativnih pokazatelja strukture i koordinacije kategorija osuđenika prema težini počinjenih krivičnih djela. Stope kriminala i kaznenog dosijea po federalnim okruzima i Rusiji u cjelini. Proračun pokazatelja dinamike pomoću MS Excel-a.

    test, dodano 31.07.2011

    Pojam, vrste, značenja, determinante latentnog kriminala, njegovi uzroci, metode prevencije i smanjenja. Utvrđivanje nivoa i analiza strukture kriminaliteta. Sistematski pristup proučavanju latentnog kriminala kao društvenog fenomena.

apstraktno

Srednje vrijednosti i indikatori varijacije

1. Suština prosjeka u statistici

2. Vrste prosjeka i metode za njihovo izračunavanje

3. Glavni indikatori varijacije i njihov značaj u statistici

1. Suština prosječnih ponderalica u statistici

U procesu proučavanja masovnih društveno-ekonomskih pojava, postaje neophodno identificirati njihova zajednička svojstva, tipične veličine i karakteristične karakteristike. Potreba za generalizirajućim prosjekom javlja se kada karakteristike koje karakteriziraju jedinice populacije koja se proučava kvantitativno variraju. Na primjer, količina dnevne proizvodnje tkalja u tekstilnoj fabrici zavisi od opštih uslova proizvodnje, tkalci koriste iste sirovine, rade na istim mašinama itd. Istovremeno, proizvodnja po satu pojedinih tkalaca varira; varira, jer zavisi od individualnih karakteristika svakog tkača (njegove kvalifikacije, profesionalno iskustvo, itd.). Da bi se okarakterisala dnevna proizvodnja svih tkalaca preduzeća, potrebno je izračunati prosječnu dnevnu proizvodnju, jer će se samo u ovom pokazatelju odražavati opći uvjeti proizvodnje za tkalje.

Dakle, izračunavanje prosječnih generalizirajućih pokazatelja znači skretanje pažnje (apstrakciju) sa osobina koje se ogledaju u veličini osobine u pojedinačnim jedinicama, te identifikaciju tipičnih osobina i svojstava koja su zajednička datom skupu.

Dakle, prosječna vrijednost u statistici je generalizirana, kvantitativna karakteristika znaka i statističke populacije. Izražava karakterističnu, tipičnu vrijednost osobine u jedinicama populacije koje se formiraju u datim uslovima mjesta i vremena pod uticajem ukupnosti faktora. Djelovanje različitih faktora stvara fluktuaciju, varijaciju prosječne karakteristike. Prosječna vrijednost je opšta mjera njihovog djelovanja, rezultanta svih ovih faktora. Prosječna vrijednost karakterizira populaciju prema prosječnom atributu, ali se odnosi na jedinicu populacije. Na primjer, prosječna proizvodnja po radniku datog preduzeća je odnos cjelokupne proizvodnje (za bilo koji vremenski period) i ukupnog (prosječnog za isti period) broja njegovih radnika. Karakterizira produktivnost rada datog agregata, ali se odnosi na jednog radnika. U prosječnoj vrijednosti fenomena mase poništavaju se individualne razlike u jedinicama statističke populacije u vrijednostima prosječnog atributa, uslijed slučajnih okolnosti. Kao rezultat ovog međusobnog poništavanja, u prosjeku se manifestuje opšte, prirodno svojstvo date statističke ukupnosti pojava. Postoji dijalektička veza između prosječnih i pojedinačnih vrijednosti prosječnog atributa, kao i između opšteg i pojedinačnog. Prosjek je najvažnija kategorija statističke nauke i najvažniji oblik generalizirajućih indikatora. Mnogi fenomeni društvenog života postaju jasni i određeni tek kada se generalizuju u obliku prosjeka. Takvi su, na primjer, gore spomenuta produktivnost rada, ukupnost radnika, prinos poljoprivrednih kultura i tako dalje. Prosjek je najvažniji metod naučne generalizacije u statistici. U tom smislu se govori o metodi prosjeka, koja se široko koristi u ekonomiji. Mnoge kategorije ekonomske nauke su definisane korišćenjem koncepta prosjeka.

Glavni uslov za ispravnu primjenu prosječne vrijednosti je homogenost statističke populacije prema prosječnom atributu. Homogeni statistički totalitet je takav totalitet u kojem su njeni sastavni elementi (jedinice) slični jedni drugima u pogledu karakteristika bitnih za ovo istraživanje i pripadaju istoj vrsti fenomena. Homogena populacija, budući da je homogena u nekim aspektima, može biti heterogena u drugim. Samo u prosecima za takve agregate ispoljavaju se specifičnosti, obrasci razvoja analizirane pojave. Prosjek izračunat za heterogenu statističku populaciju, tj. onaj u kome se kombinuju kvalitativno različite pojave gubi svoj naučni značaj. Takvi prosjeci su fiktivni, ne samo da ne daju predstavu o stvarnosti, već je i iskrivljuju. Za formiranje homogenih statističkih agregata vrši se odgovarajuće grupisanje. Uz pomoć grupisanja iu kvalitativno homogenom skupu mogu se razlikovati kvantitativno karakteristične grupe. Za svaku od njih može se izračunati vlastiti prosjek, nazvan grupni (privatni) prosjek, za razliku od opšteg prosjeka (za populaciju u cjelini).

2. Vrste prosjeka

Od velikog značaja u metodologiji prosjeka su pitanja izbora oblika prosjeka, tj. formule po kojima možete pravilno izračunati prosječnu vrijednost, te izbor prosječnih težina. Najčešće se koristi u statistici agregatna sredina, aritmetička sredina, harmonijska sredina, sredinageometrijski, srednji kvadrat, mod i medijan. Upotreba određene formule ovisi o sadržaju prosječne karakteristike i specifičnim podacima na osnovu kojih se ona mora izračunati. Da biste odabrali oblik prosjeka, možete koristiti takozvani prosječni početni omjer.

2.1 Aritmetička sredina

Aritmetička sredina je jedan od najčešćih oblika prosjeka. Aritmetička sredina izračunava se kao količnik dijeljenja zbroja pojedinačnih vrijednosti (opcija) promjenjivih potpišite na njihov broj. Aritmetička sredina se koristi u slučajevima kada se volumen varijabilnog atributa pojava homogene statističke populacije formira zbrajanjem vrijednosti atributa svih jedinica pojava u statističkoj populaciji. Postoje sljedeće aritmetičke srednje vrijednosti:

1) jednostavna aritmetička sredina, koji se određuje jednostavnim zbrajanjem kvantitativnih vrijednosti promjenjivog atributa i dijeljenjem ove sume njihovim varijantama i izračunava se pomoću sljedeće formule:

X - prosječna vrijednost statističke populacije,

x i - zbir pojedinačnih varirajućih varijanti fenomena statističke populacije,

n i - broj različitih varijanti fenomena statističke populacije.

2) Ponderisana aritmetička sredina- prosječna vrijednost znaka pojave, izračunata uzimajući u obzir pondere. Ponderi prosječnih vrijednosti su frekvencije s kojima se pojedinačne vrijednosti prosječne karakteristike uzimaju u obzir prilikom izračunavanja njene prosječne vrijednosti. Izbor pondera za prosečnu vrednost zavisi od prirode prosečne karakteristike i prirode podataka dostupnih za izračunavanje prosečnih vrednosti. Kao ponderi prosječnih vrijednosti mogu biti pokazatelji broja jedinica ili veličina dijelova statističke populacije (u obliku apsolutnih ili relativnih vrijednosti) koji imaju datu varijantu (vrijednost) prosječne karakteristike fenomena statističku populaciju, kao i vrijednost indikatora povezanog sa prosječnim obilježjem. Ponderirana aritmetička sredina izračunava se pomoću sljedeće formule:

X- aritmetički ponderisani prosek,

x - vrijednost pojedinačnih varijabilnih varijanti fenomena statističke populacije,

Svrha jednostavne i ponderisane aritmetičke sredine je da odredi srednju vrednost promenljivog atributa. Ako se u proučavanoj statističkoj populaciji varijante vrijednosti atributa javljaju jednom ili imaju istu težinu, tada se koristi prosta aritmetička sredina, ali ako se varijante vrijednosti ovog atributa javljaju više puta u proučavanu populaciju ili imaju različite težine, aritmetička sredina se koristi za određivanje prosječne vrijednosti varijabilnog atributa.

2.2 Prosječan harmonik

Harmonička sredina se koristi za izračunavanje prosječne vrijednosti kada nema direktnih podataka o težinama, već su varijante prosječne karakteristike (x) i proizvoda vrijednosti opcija na broj jedinica koje imaju ovu vrijednost w (w = xf) su poznati.

Ovaj prosjek se izračunava korištenjem sljedećih formula:

1.) Prosječni harmonik jednostavan:

X - harmonično jednostavno,

n - broj različitih varijanti fenomena statističke populacije.

2) Prosječna ponderirana harmonika:

X - harmonijski ponderisani prosjek,

x - zbir pojedinačnih varirajućih varijanti fenomena statističke populacije,

Kada se koristi harmonijski ponder, ponderi se identifikuju i tako se dobije isti rezultat koji bi dao izračunavanje ponderisane aritmetičke sredine kada bi bili poznati svi podaci potrebni za to.

2.3 Prosječan agregat

Prosječni agregat se izračunava po formuli:

X - prosječan agregat,

x - zbir pojedinačnih varirajućih varijanti fenomena statističke populacije,

Zbirni prosjek se izračunava u slučajevima kada su poznate (dostupne) vrijednosti brojnika i nazivnika početnog omjera prosjeka.

2.4 Geometrijska sredina

Geometrijska sredina je jedan od oblika prosječne vrijednosti i izračunava se kao korijen n-tog stepena iz proizvoda pojedinačnih vrijednosti - varijanti atributa (x) i određuje se sljedećom formulom:

Geometrijska sredina se uglavnom koristi za izračunavanje prosječnih stopa rasta.

2.5 Mod i medijan

Uz gore razmatrane prosjeke, tzv strukturni proseci - mod i medijan.

Mod (Mo) je vrijednost koja se najčešće pojavljuje u jedinicama stanovništva. Za diskretne serije, ova opcija ima najveću frekvenciju.

U intervalnim varijacionim serijama moguće je, prije svega, odrediti interval u kojem se nalazi mod, tj. takozvani modalni interval. U varijacionom nizu sa jednakim intervalima, modalni interval je određen najvećom frekvencijom, u serijama sa nejednakim intervalima, najvećom gustinom distribucije.

Da biste odredili način rada u redovima s jednakim intervalima, koristite formulu sljedećeg oblika:

Hn - donja granica modalnog intervala,

h - vrijednost intervala,

f 1 , f 2 , f 3 - frekvencije (ili pojedinosti) premodalnih, modalnih i postmodalnih intervala, respektivno.

U intervalnoj seriji, mod se može pronaći grafički. Da biste to učinili, povlače se dvije linije od granica dva susjedna stupca u najvišoj koloni histograma. Zatim se od točke njihovog sjecišta okomica spušta na osu apscise. Vrijednost karakteristike na apscisi koja odgovara okomici bit će mod.

U mnogim slučajevima, kada se stanovništvo karakteriše kao generalizovani indikator, prednost se daje modu, a ne aritmetičkoj sredini.

Dakle, kada se proučavaju cijene na tržištu, nije fiksirana i proučavana u dinamici prosječna cijena za određeni proizvod, već modalna; kada se proučava potražnja stanovništva za određenom veličinom obuće ili odjeće, zanimljivo je odrediti modalnu veličinu obuće, a prosječna veličina kao takva ovdje uopće nije bitna. Moda nije samo od nezavisnog interesa, već igra i ulogu pomoćnog indikatora u prosjeku, karakterizirajući njegovu tipičnost. Ako je aritmetička sredina bliska vrijednosti modu, onda je tipična.

Medijan (Me) je vrijednost karakteristike u srednjoj jedinici rangirane serije. (Rangirani niz je niz u kojem su vrijednosti atributa napisane uzlaznim ili silaznim redoslijedom.)

Da bi se pronašao medijan, prvo se odredi njegov serijski broj. Da biste to učinili, s neparnim brojem jedinica, jedan se dodaje zbroju svih frekvencija, a sve se dijeli sa dva. Ako je broj jedinica paran, u nizu će biti dvije srednje jedinice, a po svim pravilima medijan treba odrediti kao prosjek vrijednosti ove dvije jedinice. Istovremeno, praktički s parnim brojem jedinica, medijana se nalazi kao vrijednost atributa jedinice, čiji je redni broj određen ukupnim zbrojem frekvencija podijeljenim sa dva. Poznavajući redni broj medijane, lako je pronaći njegovu vrijednost iz akumuliranih frekvencija.

U intervalnim serijama, nakon određivanja rednog broja medijane kumulativnim frekvencijama (partikularima), nalazi se srednji interval, a zatim se najjednostavnijom interpolacijskom tehnikom utvrđuje vrijednost same medijane. Ovaj proračun se izražava sljedećom formulom:

X n - donja granica srednjeg intervala,

h - vrijednost srednjeg intervala,

Redni broj medijane,

S Me - 1 frekvencija (frekvencija) akumulirana do srednjeg intervala,

F Me - frekvencija (posebna) srednjeg intervala.

Prema napisanoj formuli, donjoj granici intervala medijane dodaje se onaj dio vrijednosti intervala koji pada na dio jedinica ove grupe koje nedostaju na rednom broju medijane. Drugim riječima, izračunavanje medijane temelji se na pretpostavci da se rast obilježja među jedinicama svake grupe odvija ravnomjerno. Na osnovu rečenog medijana se može izračunati i na drugi način. Određivanjem srednjeg intervala moguće je od gornje granice medijanskog intervala (Xv) oduzeti onaj dio intervala koji pada na dio jedinica koje prelaze redni broj medijane, tj. prema sljedećoj formuli:

Medijan se može odrediti i grafički. Da bi se to postiglo, gradi se kumulat i od tačke na skali akumuliranih frekvencija (partikula) koja odgovara rednom broju medijane, povlači se ravna linija paralelna s osom x dok se ne siječe s kumulatom. Zatim se od točke presjeka označene prave linije s kumulatom spušta okomica na osu apscise. Vrijednost karakteristike na x-osi koja odgovara nacrtanoj ordinati (okomito) bit će medijan.

Po istom principu, lako je pronaći vrijednost karakteristike za bilo koju jedinicu rangirane serije.

Dakle, čitav skup indikatora se može koristiti za izračunavanje prosječne vrijednosti serije varijacija.

3. Glavni indikatori varijcije i njihov značaj u statistici

Kada se proučava varijabilno svojstvo u jedinicama populacije, ne može se ograničiti samo na izračunavanje prosječne vrijednosti iz pojedinačnih varijanti, jer se ista prosječna vrijednost može odnositi na populacije koje su daleko od identičnog sastava. Ovo se može ilustrovati sledećim uslovnim primerom, koji odražava podatke o broju domaćinstava u poljoprivrednim preduzećima dva okruga:

Prosječan broj domaćinstava u gazdinstvima dva okruga je isti - 160. Istovremeno, sastav ovih gazdinstava u dva okruga je daleko od istog. Stoga postaje neophodno izmjeriti varijaciju osobine u populaciji.

U tu svrhu u statistici se izračunava niz karakteristika, tj. indikatori. Najelementarniji pokazatelj varijacije osobine je raspon varijacija R, što je razlika između maksimalne i minimalne vrijednosti osobine u ovoj seriji varijacija, tj. R = Xmax - Xmin. U našem primjeru, u 1. regiji R = 300 - 80 - 220, au drugoj regiji R = 180 - 145 = 35.

Raspon indikatora varijacije nije uvijek primjenjiv, jer uzima u obzir samo ekstremne vrijednosti osobine, koje se mogu jako razlikovati od svih ostalih jedinica. Ponekad pronađu omjer raspona varijacije i aritmetičke sredine i koriste ovu vrijednost, nazivajući je indikatorom oscilacije.

Tačnije, varijaciju u nizu možete odrediti pomoću indikatora koji uzimaju u obzir odstupanja svih opcija od aritmetičke sredine. U statistici postoje dva takva indikatora - srednja linearna i srednja kvadratna devijacija.

Prosječna linearna devijacija predstavlja aritmetičku sredinu apsolutnih vrijednosti odstupanja varijanti od srednje vrijednosti. Znaci odstupanja se u ovom slučaju zanemaruju, inače će zbir svih odstupanja biti jednak nuli. Ovaj indikator se izračunava po formuli:

b) za seriju varijacija:

Treba imati na umu da će prosječno linearno odstupanje biti minimalno ako se odstupanja računaju od medijane, tj. prema formuli:

Standardna devijacija () izračunava se na sljedeći način - svako odstupanje od prosjeka se kvadrira, svi kvadrati se sabiraju (uzimajući u obzir težine), nakon čega se zbir kvadrata dijeli sa brojem članova niza i iz količnika se izvlači kvadratni korijen.

Sve ove radnje izražene su sljedećim formulama:

a) za negrupisane podatke:

b) za seriju varijacija:

f, tj. Standardna devijacija je kvadratni korijen aritmetičke sredine kvadratnih devijacija srednje vrijednosti. Izraz ispod korijena naziva se varijansa. Disperzija ima nezavisan izraz u statistici i jedan je od najvažnijih indikatora varijacije.

gdje je - maksimalna i minimalna vrijednost atributa u agregatu;

je broj grupa.

Distribucijske serije se mogu vizualizirati korištenjem njihovog grafičkog prikaza. U tu svrhu se grade poligon, histogram, kumulativna kriva, ožica.

TEMA 4.Apsolutne i relativne vrijednosti

Pojam statističkog indikatora i njegove vrste

statistika- ovo je kvantitativna i kvalitativna generalizujuća karakteristika nekog svojstva grupe jedinica ili agregata kao celine u specifičnim uslovima mesta i vremena. Za razliku od karakteristike, statistički pokazatelj se dobija proračunom. To može biti jednostavno prebrojavanje jedinica populacije, zbir vrijednosti atributa, poređenje dvije ili više vrijednosti, složenija poređenja.

1. Prema obuhvatu jedinica stanovništva, statistički pokazatelji se dijele:


2. Prema načinu obračuna statistički pokazatelji se dijele na:

3. Prema prostornoj sigurnosti, statistički indikatori se dijele na:


Prema obliku izražavanja, statistički pokazatelji se dijele na:

Apsolutne vrijednosti

Apsolutna vrijednost (indikator)- ovo je broj koji izražava veličinu, obim pojave u specifičnim uslovima mjesta i vremena. Apsolutne vrijednosti se uvijek nazivaju vrijednostima, odnosno imaju neku mjernu jedinicu. Ovisno o odabranoj jedinici mjere, razlikuju se sljedeće: vrste apsolutnih vrijednosti:

1. prirodno- karakteriziraju obim i veličinu fenomena u smislu dužine, težine, zapremine, broja jedinica, broja događaja. Prirodni indikatori se koriste za karakterizaciju zapremine, veličine pojedinih vrsta istoimenih proizvoda, pa je njihova upotreba ograničena.

2. Uslovno prirodno- koriste se u slučaju da je potrebno prenijeti različite vrste proizvoda, ali iste vrijednosti, u jedan uslovni indikator. Uslovno prirodni pokazatelj se izračunava množenjem prirodnog pokazatelja sa koeficijentom konverzije (preračunavanja). Koeficijenti konverzije se uzimaju iz imenika ili se izračunavaju nezavisno. Uvjetno prirodni indikatori se koriste za karakterizaciju volumena, veličine homogenih proizvoda, pa je njihova upotreba ograničena.

3. Rad- imaju mjerne jedinice kao što su čovjek-sat, čovjek-dan. Koristi se za određivanje troškova radnog vremena, za obračun nadnica i produktivnosti rada.

4. Troškovi(univerzalni) mjere se u valuti dotične zemlje. Indikatori troškova = količina proizvoda u fizičkom izrazu * cijena jedinice proizvodnje. Indikatori troškova su univerzalni, jer vam omogućavaju da odredite količinu, veličinu različitih vrsta proizvoda.

Nedostaci apsolutnih indikatora: nemoguće je okarakterisati kvalitativne karakteristike i strukturu fenomena koji se proučava, za to se koriste relativni indikatori koji se izračunavaju na osnovu apsolutnih pokazatelja.

Relativne vrijednosti

Relativni indikator- ovo je pokazatelj koji je količnik dijeljenja jednog apsolutnog indikatora drugim i daje numeričku mjeru odnosa između njih.


Neimenovani O.P.

1. Koeficijent se dobija ako je baza poređenja 1. Ako je koeficijent veći od 1, onda pokazuje koliko je puta upoređena vrednost veća od baze poređenja. Ako je koeficijent manji od 1, onda pokazuje koji dio baze poređenja je upoređena vrijednost.

2. Procenat će se dobiti ako je osnova poređenja 100. Procenat se dobija množenjem koeficijenta sa 100.

3. Permille (‰) - ako je osnova poređenja 1000. Dobiva se množenjem koeficijenta sa 1000. Promile se koriste kako bi se izbjegle razlomke vrijednosti ​​​indikatora. Oni se široko koriste u demografskoj statistici, gdje se stope smrtnosti, nataliteta i brakova određuju na 1.000 ljudi.

4. Prodecimille (‰0) ako je baza poređenja 10 000. Dobije se množenjem koeficijenta sa 10 000. Na primjer, koliko ljekara, bolničkih kreveta na 10 000 ljudi.

Vrste relativnih vrijednosti (indikatori):

1. Indeks relativne strukture:

Ovaj indikator se izračunava iz grupisanih podataka i pokazuje udio pojedinih dijelova u ukupnom obimu stanovništva. Može se izraziti kao omjer (udio) ili postotak (specifična težina). Primjer, 0,4 - udio, 40% - specifična težina. Zbir svih udjela je jednak 1, a specifična težina je 100%.

2. Relativni indikator dinamike:

.

Ovaj indikator pokazuje promjenu fenomena tokom vremena. Izražava se u obliku koeficijenta - faktora rasta iu obliku procenta - stope rasta.

3. Relativni učinak plana:

Ovaj indikator pokazuje stepen realizacije plana i izražava se u obliku %.

Relativni ciljni indikator:

Ovaj indikator pokazuje šta se planira promijeniti indikator u budućnosti u odnosu na prethodni period i izražava se u procentima.

Odnos između indikatora: .

5. Relativni indikator koordinacije:

Ovaj indikator se može izračunati za 1, 10, 100 jedinica i pokazuje koliko jedinica jednog dijela u prosjeku otpada na 1, 10, 100 jedinica drugog dijela. Na primjer, broj gradskog stanovništva na 1, 10, 100 stanovnika sela

6. Indikator relativnog intenziteta:

Ovaj indikator se izračunava upoređivanjem različitih indikatora koji su međusobno u određenom odnosu. Ovaj indikator se može izračunati za 1, 10, 100 jedinica i imenovan je indikator. Na primjer, gustina naseljenosti - ljudi / 1, 10, 100 km2.

7. Indeks relativnog poređenja:

Ovaj indikator se izračunava upoređivanjem sličnih indikatora koji se odnose na isti vremenski period, ali za različite objekte ili teritorije. Izražava se u obliku koeficijenta i procenta.

TEMA 5. Srednje vrijednosti i indikatori varijacije

1. Prosječna vrijednost: koncept i vrste

Prosječna vrijednost - ovo je opšti pokazatelj koji karakteriše tipičan nivo različite kvantitativne osobine po jedinici populacije u određenim uslovima mesta i vremena.

Uslovi za izračunavanje prosječne vrijednosti:

1. Populacija za koju se izračunava prosječna vrijednost mora biti dovoljno velika, inače se neće poništiti slučajna odstupanja u vrijednosti atributa i prosjek neće pokazati obrasce svojstvene ovom procesu.

2. Populacija za koju se izračunava prosječna vrijednost mora biti kvalitativno homogena, inače ne samo da neće imati naučnu vrijednost, već može biti i štetna, narušavajući pravu prirodu fenomena koji se proučava.

3. Ukupan prosjek treba dopuniti prosjecima grupe. Generalni prosjek pokazuje tipičnu veličinu cijele populacije, a grupni prosjeci pokazuju njene pojedinačne dijelove sa specifičnim svojstvima.

4. Za sveobuhvatan opis pojave treba izračunati sistem prosječnih indikatora, prema najznačajnijim karakteristikama.

Prosječna vrijednost je uvijek imenovana, ima istu dimenziju kao i prosječna karakteristika.

Vrste prosjeka:

1. Moć znači(ovo uključuje aritmetičku sredinu, harmonijsku sredinu, srednji kvadrat, geometrijsku sredinu);

2. Strukturni prosjeci(način i medijan).

Srednja vrijednost snage se izračunava po formuli (korijen na stepen R srednje vrijednosti svih opcija uzetih u određenoj mjeri):

gdje je srednja vrijednost snage ispitivane karakteristike;

− pojedinačna vrijednost prosječne karakteristike;

− indikator stepena prosjeka;

− broj znakova (jedan skup);

− iznos.

U zavisnosti od stepena dobijaju se različite vrste jednostavnih proseka.

Značenje

Naziv jednostavnog prosjeka

jednostavan harmonik

gdje je P proizvod

jednostavna geometrijska

jednostavna aritmetika

jednostavno kvadratno

Što je veći eksponent () u srednjem stepenu, to je veća vrednost same srednje vrednosti. Ako izračunamo sve ove prosjeke za iste podatke, dobićemo sljedeći omjer:

Ovo svojstvo potencijskog značenja da se povećava s povećanjem eksponenta funkcije definiranja naziva se pravilo većine srednjih vrijednosti.

Od ovih tipova prosjeka, najčešće korišteni su aritmetički prosjek i harmonijski prosjek. Izbor vrste prosjeka ovisi o početnim informacijama.

Aritmetička sredina: metode proračuna i njena svojstva

Aritmetička sredina je količnik dijeljenja zbira pojedinačnih vrijednosti obilježja svih jedinica stanovništva brojem jedinica stanovništva.

Aritmetička sredina se koristi u obliku jednostavnog prosjeka i ponderiranog prosjeka. jednostavna aritmetička sredina izračunato po formuli:

gdje je prosječna vrijednost karakteristike;

- pojedinačne vrijednosti atributa (opcije);

− broj populacijskih jedinica (opcija).

Jednostavna aritmetička sredina koristi se u dva slučaja:

kada se svaka varijanta pojavljuje samo jednom u seriji distribucije;

kada su sve frekvencije jednake.

Aritmetički ponderisani prosjek koristi se kada frekvencije nisu jednake jedna drugoj:

gdje − frekvencije ili težine (brojevi koji pokazuju koliko

puta pojavljivanja pojedinačnih vrijednosti

znak).

Svojstva aritmetičke sredine(bez dokaza):

1. Prosječna vrijednost konstantne vrijednosti jednaka je samoj sebi: .

2. Proizvod prosječne vrijednosti i zbira frekvencija jednak je zbiru proizvoda opcija i njihovih frekvencija: .

3. Ako se svaka opcija poveća ili smanji za isti iznos, tada će se prosječna vrijednost povećati ili smanjiti za isti iznos: .

4. Ako se svaka opcija poveća ili smanji za isti broj puta, tada će se prosječna vrijednost povećati ili smanjiti za isti broj puta: .

5. Ako se sve frekvencije povećaju ili smanje za isti broj puta, prosječna vrijednost se neće promijeniti: .

6. Prosječna vrijednost zbira jednaka je zbiru prosječnih vrijednosti: .

7. Zbir odstupanja svih vrijednosti osobina od prosječne vrijednosti je nula.

3. Metode za izračunavanje srednjeg harmonika

U nekim slučajevima, priroda početnih podataka je takva da izračunavanje aritmetičke sredine gubi smisao i jedini generalizirajući pokazatelji mogu biti harmonska sredina.

Vrste srednjeg harmonika:

1. Prosječan harmonik jednostavan izračunato po formuli:

Simple harmonic simple koristi se vrlo rijetko, samo za izračunavanje prosječnog vremena utrošenog na proizvodnju jedinice proizvodnje, pod uslovom da su frekvencije svih opcija jednake.

2. Prosječno ponderisano harmonikom izračunato po formuli:

.

gdje je ukupna zapremina fenomena.

Harmonski ponderisani prosjek se koristi ako je poznat cjelokupni volumen fenomena, ali nisu poznate frekvencije. Ovaj harmonik se koristi za izračunavanje prosječnih pokazatelja kvaliteta: prosječne plate, prosječne cijene, prosječne cijene, prosječni prinos, prosječna produktivnost rada.

4. Strukturni prosjeci: mod i medijan

Strukturni proseci (mod, medijan) se koriste za proučavanje unutrašnje strukture i strukture serije distribucije vrednosti atributa.

Moda- najčešća vrijednost atributa u jedinicama populacije. U seriji distribucije u kojoj se svaka varijanta javlja jednom, mod se ne izračunava. U diskretnoj seriji, mod je varijanta sa najvećom frekvencijom. Za intervalni niz sa jednakim intervalima, mod se izračunava po formuli:

.

gdje je početna (donja) granica modalnog intervala;

- vrijednost modalnog, prije - i postmodalnog intervala, respektivno

− učestalost modalnih, pre- i postmodalnih intervala, respektivno.

Modalni interval je interval koji ima najveću frekvenciju.

Medijan je vrijednost karakteristike koja se nalazi u sredini rangirane serije i dijeli ovaj niz na dva jednaka dijela po broju jedinica: jedan dio ima vrijednosti karakteristike manje od medijane, a drugi je veći od medijane.

rangirani red je raspored karakterističnih vrijednosti u rastućem ili opadajućem redoslijedu.

U diskretno rangiranoj seriji, gdje se svaka opcija javlja jednom, a broj opcija nije paran, srednji broj je određen formulom:

gdje je broj članova u nizu.

U diskretno rangiranoj seriji, gdje se svaka opcija pojavljuje jednom, a broj opcija je paran, medijana će biti aritmetička sredina dvije opcije koje se nalaze u sredini rangirane serije.

U diskretno rangiranoj seriji, gdje se svaka opcija pojavljuje nekoliko puta, srednji broj je određen formulom:

Zatim, počevši od prve opcije, frekvencije se uzastopno zbrajaju dok se ne dobije .

Za intervalni niz, medijana se izračunava po formuli:

,

gdje je donja granica srednjeg intervala;

− vrijednost srednjeg intervala;

−ukupan broj populacijskih jedinica;

− kumulativna frekvencija do srednjeg intervala;

je frekvencija srednjeg intervala.

Medijanski interval je interval u kojem je njegova akumulirana frekvencija jednaka ili veća od polovine zbira svih frekvencija u nizu.

5. Indikatori varijacije

Varijacija funkcije- ovo je razlika u individualnim vrijednostima osobine unutar proučavane populacije. Varijaciju osobine karakterišu indikatori varijacije. Indikatori varijacije dopunjuju prosječne vrijednosti, karakterišu stepen homogenosti statističke populacije za datu osobinu, granice varijacije osobine. Odnos indikatora varijacije određuje odnos između karakteristika.

Indikatori varijacije se dijele na:

1) Apsolutno: opseg varijacije; prosječno linearno odstupanje; standardna devijacija; disperzija. Imaju iste jedinice kao i karakteristične vrijednosti.

2) Relativni: koeficijent oscilacije, koeficijent varijacije, relativno linearno odstupanje.

Raspon varijacije pokazuje koliko se mijenja vrijednost atributa:

gdje je maksimalna vrijednost atributa;

je minimalna vrijednost karakteristike.

Srednja linearna devijacija i srednja kvadratna devijacija pokazuju koliko se pojedinačne vrijednosti neke karakteristike u prosjeku razlikuju od njene srednje vrijednosti.

Prosječna linearna devijacija definirano:

- jednostavno; - ponderisano.

Disperzija definirani su:

- jednostavno; - ponderisano;

- jednostavno; - ponderisano.

Ako je prosječna vrijednost atributa izračunata pomoću jednostavne aritmetike, onda se izračunava pomoću jednostavne formule, ako je prosjek izračunat pomoću ponderirane, onda se izračunava pomoću ponderirane formule.

Disperzijai standardnu ​​devijaciju također se može izračunati korištenjem druge formule:

- jednostavno; - ponderisano.

Da bi se uporedile varijacije različitih osobina u istoj populaciji ili iste osobine u različitim populacijama, izračunava se relativni indikator varijacije, tzv. koeficijent varijacije:

Što je veća vrijednost koeficijenta varijacije, veća je širina vrijednosti atributa oko prosjeka, populacija je manje homogena po svom sastavu i manje je reprezentativan prosjek. Skup se smatra homogenim ako koeficijent varijacije ne prelazi 33%.

6. Vrste disperzija i zakon (pravilo) dodavanja disperzija

Ako se populacija koja se proučava sastoji od nekoliko grupa formiranih na osnovu bilo koje karakteristike, tada se pored ukupne varijanse utvrđuje i međugrupna varijansa

Prema pravilo dodavanja varijanse ukupna varijansa je jednaka zbroju prosjeka unutargrupnih i međugrupnih varijansi:

Koristeći pravilo sabiranja varijansi, uvijek je moguće odrediti treću, nepoznatu, iz dvije poznate varijanse, kao i procijeniti jačinu uticaja atributa grupisanja.

Empirijski koeficijent determinacije prikazuje udio zbog varijacije grupne osobine u ukupnoj varijaciji proučavane osobine:

Empirijska korelacija pokazuje utjecaj atributa koji leži u osnovi grupiranja na varijaciju rezultirajućeg atributa:

Empirijski odnos korelacije varira od 0 do 1. Ako nema veze, ako - veza je potpuna. Međuvrijednosti se procjenjuju prema njihovoj blizini graničnim vrijednostima.

TEMA 6.Serija dinamike

1. Serija dinamike: pojam i vrste

Serija dinamike ( hronološke serije, dinamičke serije, vremenske serije) je niz brojčanih vrijednosti statističkog indikatora raspoređenih u hronološki niz. Niz dinamike sastoji se od dva elementa (graf):

1. vrijeme (t) su trenuci (datumi) ili periodi (godine, kvartali, mjeseci, dani) vremena na koje se odnose statistički pokazatelji (nivoi serije).

2. nivo serije (y) – vrijednosti statističkog indikatora koji karakteriše stanje pojave u određenom trenutku ili u određenom vremenskom periodu.

Nivo reda y

Vrste dinamičkih serija:

1. Po vremenu:

A) interval - serije, čiji nivoi karakterišu veličinu fenomena u određenom vremenskom periodu (dan, mesec, kvartal, godina). Primjer takve serije su podaci o dinamici proizvodnje, broju radnih dana i sl. Apsolutni nivoi intervalne serije se mogu sumirati, zbir ima smisla, što omogućava dobijanje niza dinamike proširenih perioda.

B) trenutni - serije, čiji nivoi karakterišu veličinu fenomena na dan (trenutak) vremena. Primjer takve serije mogu biti podaci o dinamici stanovništva, stoke, inventara, vrijednosti osnovnih sredstava, obrtnih sredstava, itd. Nivoi trenutne serije se ne mogu sumirati, zbir nema smisla, jer sljedeći nivo u potpunosti ili djelimično uključuje prethodni nivo.

2. Prema obliku prezentacije (načinu izražavanja) nivoa:

A) niz apsolutnih vrijednosti.

B) niz relativnih vrijednosti. Relativne vrijednosti karakteriziraju, na primjer, dinamiku udjela gradskog i ruralnog stanovništva (%) i stopu nezaposlenosti.