Biografije Karakteristike Analiza

raspršivanje pare. Izračun varijance u programu Microsoft Excel

Disperzija u statistici nalazi se kao pojedinačne vrijednosti značajka na kvadrat od . Ovisno o početnim podacima, određuje se jednostavnom i ponderiranom formulom varijance:

1. (za negrupirane podatke) izračunava se po formuli:

2. Ponderirana varijanca (za niz varijacija):

gdje je n frekvencija (faktor ponovljivosti X)

Primjer pronalaženja varijance

Ova stranica opisuje standardni primjer pronalaženje varijance, također možete pogledati druge zadatke za njeno pronalaženje

Primjer 1. Za grupu od 20 učenika imamo sljedeće podatke dopisni odjel. Potrebno je izgraditi intervalni niz distribucije obilježja, izračunati srednju vrijednost obilježja i proučiti njegovu varijancu

Hajdemo graditi intervalno grupiranje. Odredimo raspon intervala formulom:

gdje je X max najveća vrijednost značajke grupiranja;
X min je minimalna vrijednost značajke grupiranja;
n je broj intervala:

Prihvaćamo n=5. Korak je: h \u003d (192 - 159) / 5 \u003d 6,6

Napravimo intervalno grupiranje

Za daljnje izračune napravit ćemo pomoćnu tablicu:

X'i je sredina intervala. (na primjer, sredina intervala 159 - 165,6 = 162,3)

Prosječni rast učenika određuje se formulom aritmetičkog ponderiranog prosjeka:

Disperziju određujemo formulom:

Formula varijance može se pretvoriti na sljedeći način:

Iz ove formule proizlazi da varijanca je razlika između srednje vrijednosti kvadrata opcija i kvadrata i srednje vrijednosti.

Disperzija u varijacijske serije S u jednakim razmacima metodom momenata može se izračunati na sljedeći način kada se koristi drugo svojstvo varijance (dijeljenje svih opcija s vrijednošću intervala). Definicija varijance, izračunat metodom momenata, prema sljedećoj formuli oduzima manje vremena:

gdje je i vrijednost intervala;
A - uvjetna nula, koja je prikladna za korištenje sredine intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - moment drugog reda

(ako se u statističkoj populaciji atribut mijenja na način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativnom) može se izračunati po formuli:

Zamjena u ovu formulu disperzija q \u003d 1- p, dobivamo:

Vrste disperzije

Ukupna varijanca mjeri varijaciju svojstva u cijeloj populaciji kao cjelini pod utjecajem svih čimbenika koji uzrokuju tu varijaciju. Jednaka je srednjem kvadratu odstupanja pojedinačne vrijednosti obilježje x ukupne srednje vrijednosti x i može se definirati kao jednostavna varijanca ili ponderirana varijanca.

karakterizira slučajnu varijaciju, tj. dio varijacije, koji je posljedica utjecaja neobračunatih čimbenika i ne ovisi o faktoru predznaka koji je u osnovi grupiranja. Ova varijanca jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar skupine X od aritmetičke sredine skupine i može se izračunati kao jednostavna varijanca ili kao ponderirana varijanca.

Na ovaj način, mjere varijance unutar grupe varijacija svojstva unutar skupine i određuje se formulom:

gdje je xi - prosjek skupine;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijance, koji se moraju utvrditi u zadatku proučavanja utjecaja kvalifikacija radnika na razinu produktivnosti rada u radionici, pokazuju varijacije učinka u svakoj skupini uzrokovane svim mogućim čimbenicima (tehničko stanje opreme, dostupnost alata i materijala, itd.). dob radnika, intenzitet rada i sl.), osim razlika u kvalifikacijskoj kategoriji (unutar grupe svi radnici imaju istu stručnu spremu).

Iznutra prosječno grupne varijance odražava slučajan, tj. onaj dio varijacije koji se dogodio pod utjecajem svih ostalih čimbenika, s izuzetkom faktora grupiranja. Izračunava se po formuli:

Karakterizira sustavnu varijaciju dobivenog svojstva, koja je posljedica utjecaja čimbenika svojstva koji je u osnovi grupiranja. Jednaka je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti. Međugrupna varijanca izračunava se formulom:

Pravilo zbrajanja varijance u statistici

Prema pravilo dodavanja varijance ukupna varijanca jednaka je zbroju prosjeka unutargrupnih i međugrupnih varijanci:

Značenje ovog pravila je da je ukupna varijanca koja nastaje pod utjecajem svih čimbenika jednaka zbroju varijanci koje nastaju pod utjecajem svih ostalih čimbenika i varijance koja nastaje zbog faktora grupiranja.

Pomoću formule za zbrajanje varijanci možemo odrediti dva poznate varijance treća nepoznanica, kao i prosuditi jačinu utjecaja značajke grupiranja.

Svojstva disperzije

1. Ako su sve vrijednosti atributa smanjene (povećane) za isto konstantna vrijednost, tada se varijanca neće promijeniti.
2. Ako su sve vrijednosti atributa smanjene (povećane) za isti broj puta n, tada će se varijanca prema tome smanjiti (povećati) za n^2 puta.

Često u statistici, pri analizi pojave ili procesa, potrebno je uzeti u obzir ne samo podatke o prosječnim razinama proučavanih pokazatelja, već i raspršenost ili varijacija u vrijednostima pojedinih jedinica , koji je važna karakteristika proučavana populacija.

Cijene dionica, obujam ponude i potražnje, kamatne stope u različita razdoblja vrijeme i na različitim mjestima.

Glavni pokazatelji koji karakteriziraju varijaciju , su raspon, varijanca, standardna devijacija i koeficijent varijacije.

Varijacija raspona je razlika između maksimuma i minimalne vrijednosti znak: R = Xmax – Xmin. Nedostatak ovog pokazatelja je što ocjenjuje samo granice varijacije svojstva i ne odražava njegovu fluktuaciju unutar tih granica.

Disperzija lišen ovog nedostatka. Izračunava se kao srednji trg odstupanja karakterističnih vrijednosti od njihove prosječne vrijednosti:

Pojednostavljeni način izračuna varijance provodi se pomoću sljedećih formula (jednostavnih i ponderiranih):

Primjeri primjene ovih formula prikazani su u 1. i 2. zadatku.

Pokazatelj koji se široko koristi u praksi je standardna devijacija :

Prosjek standardna devijacija definirano kao Korijen od varijance i ima istu dimenziju kao svojstvo koje se proučava.

Razmatrani pokazatelji omogućuju dobivanje apsolutna vrijednost varijacije, tj. procijeniti ga u mjernim jedinicama osobine koja se proučava. Za razliku od njih, koeficijent varijacije mjeri fluktuaciju u relativnom smislu - u odnosu na prosječnu razinu, što je u mnogim slučajevima poželjno.

Formula za izračunavanje koeficijenta varijacije.

Primjeri rješavanja problema na temu "Pokazatelji varijacije u statistici"

Zadatak 1 . Proučavajući utjecaj oglašavanja na veličinu prosječnog mjesečnog depozita u bankama okruga, ispitane su 2 banke. Dobiveni su sljedeći rezultati:

Definirati:
1) za svaku banku: a) prosječna veličina mjesečni depozit; b) disperzija doprinosa;
2) prosječni mjesečni depozit za dvije banke zajedno;
3) Disperzija depozita za 2 banke, ovisno o oglašavanju;
4) Disperzija depozita za 2 banke, ovisno o svim čimbenicima osim oglašavanja;
5) Ukupna varijanca korištenjem pravila zbrajanja;
6) Koeficijent determinacije;
7) Korelacijski odnos.

Riješenje

1) Napravimo tablicu za izračun banke s oglašavanjem . Da bismo odredili prosječni mjesečni depozit, nalazimo sredine intervala. U ovom slučaju, vrijednost otvorenog intervala (prvog) uvjetno se izjednačava s vrijednošću intervala koji mu graniči (drugi).

Prosječna veličina doprinosa nalazimo pomoću formule ponderirane aritmetičke sredine:

29 000/50 = 580 rubalja

Disperzija doprinosa nalazi se formulom:

23 400/50 = 468

Izvest ćemo slične radnje za banku bez oglasa :

2) Pronađite prosječni depozit za dvije banke zajedno. Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 rubalja.

3) Varijancu depozita, za dvije banke, ovisno o oglašavanju, naći ćemo po formuli: σ 2 =pq (formula varijance alternativnog predznaka). Ovdje je p=0,5 udio čimbenika koji ovise o oglašavanju; q=1-0,5, tada je σ 2 =0,5*0,5=0,25.

4) Kako je udio ostalih čimbenika 0,5, onda je varijanca depozita za dvije banke, koja ovisi o svim čimbenicima osim oglašavanja, također 0,25.

5) Odredite ukupnu varijancu pomoću pravila zbrajanja.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 činjenica + σ 2 ostatak \u003d 552,08 + 345,96 \u003d 898,04

6) Koeficijent determinacije η 2 = σ 2 činjenica / σ 2 = 345,96/898,04 = 0,39 = 39% - veličina doprinosa ovisi o oglašavanju 39%.

7) Empirijski omjer korelacije η = √η 2 = √0,39 = 0,62 - odnos je prilično blizak.

Zadatak 2 . Postoji grupiranje poduzeća prema vrijednosti utrživih proizvoda:

Odrediti: 1) disperziju vrijednosti utrživih proizvoda; 2) standardna devijacija; 3) koeficijent varijacije.

Riješenje

1) Po uvjetu je prikazan niz intervalne distribucije. Mora se izraziti diskretno, odnosno pronaći sredinu intervala (x "). U skupinama zatvorenih intervala sredinu nalazimo jednostavnom aritmetičkom sredinom. U skupinama s gornjom granicom, kao razlika između te gornje granice i pola veličine intervala koji slijedi (200-(400 -200):2=100).

U skupinama s donjom granicom - zbroj ove donje granice i polovice veličine prethodnog intervala (800+(800-600):2=900).

Izračun prosječne vrijednosti utrživih proizvoda vrši se prema formuli:

Hsr = k × ((Σ ((x "-a): k) × f): Σf) + a. Ovdje je \u003d 500 veličina opcije s najveća frekvencija, k=600-400=200 - veličina intervala na najvećoj frekvenciji. Stavimo rezultat u tablicu:

Tako, Prosječna vrijednost tržišnih proizvoda za razdoblje koje se proučava kao cjelina je Xav = (-5:37) × 200 + 500 = 472,97 tisuća rubalja.

2) Disperziju nalazimo pomoću sljedeće formule:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 \u003d 35.675,67-730.62 \u003d 34.945,05

3) standardna devijacija: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tisuća rubalja.

4) koeficijent varijacije: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52%

Teorija vjerojatnosti - poseban odjeljak matematike, koju studiraju samo studenti visokoškolskih ustanova. Volite li izračune i formule? Ne bojite se mogućnosti upoznavanja s normalnom distribucijom, entropijom ansambla, matematičkim očekivanjem i diskretnom varijancom nasumična varijabla? Onda će vas ova tema jako zanimati. Pogledajmo neke od najvažnijih Osnovni koncepti ovu granu znanosti.

Prisjetimo se osnova

Čak i ako se najviše sjećate jednostavni pojmovi teorije vjerojatnosti, nemojte zanemariti prve odlomke članka. Činjenica je da bez jasnog razumijevanja osnova nećete moći raditi s formulama o kojima se raspravlja u nastavku.

Dakle, ima ih slučajni događaj, neki eksperiment. Kao rezultat izvršenih radnji možemo dobiti nekoliko ishoda - neki od njih su češći, drugi rjeđi. Vjerojatnost događaja je omjer broja stvarno primljenih ishoda jedne vrste prema ukupni broj moguće. Samo znajući klasična definicija ovog koncepta, možete početi proučavati matematičko očekivanje i disperzije kontinuiranih slučajnih varijabli.

Prosjek

Još u školi, na satovima matematike, počeli ste raditi s aritmetičkom sredinom. Ovaj se koncept naširoko koristi u teoriji vjerojatnosti i stoga se ne može zanemariti. Glavna stvar za nas ovaj trenutak je da ćemo ga susresti u formulama za matematičko očekivanje i varijancu slučajne varijable.

Imamo niz brojeva i želimo pronaći aritmetičku sredinu. Sve što se od nas traži je zbrojiti sve raspoloživo i podijeliti s brojem elemenata u nizu. Neka imamo brojeve od 1 do 9. Zbroj elemenata će biti 45, a tu vrijednost ćemo podijeliti sa 9. Odgovor: - 5.

Disperzija

razgovarajući znanstveni jezik, varijanca je prosječni kvadrat odstupanja dobivenih vrijednosti obilježja od aritmetičke sredine. Jedan je označen velikim latiničnim slovom D. Što je potrebno za njegovo izračunavanje? Za svaki element niza izračunamo razliku između raspoloživog broja i aritmetičke sredine te je kvadriramo. Bit će točno onoliko vrijednosti koliko može biti ishoda za događaj koji razmatramo. Zatim sažimamo sve primljeno i dijelimo s brojem elemenata u nizu. Ako imamo pet mogućih ishoda, onda podijelimo s pet.

Varijanca također ima svojstva koja morate zapamtiti kako biste je primijenili pri rješavanju problema. Na primjer, ako se slučajna varijabla poveća X puta, varijanca se povećava X puta kvadrata (tj. X*X). Nikad nije manji od nule i ne ovisi o pomaku vrijednosti za jednaka vrijednost gore ili dolje. Osim toga, za nezavisni testovi varijanca zbroja jednaka je zbroju varijanci.

Sada svakako trebamo razmotriti primjere varijance diskretne slučajne varijable i matematičkog očekivanja.

Recimo da izvedemo 21 eksperiment i dobijemo 7 različitih rezultata. Svaku smo promatrali 1, 2, 2, 3, 4, 4 i 5 puta. Kolika će biti varijanca?

Prvo izračunavamo aritmetičku sredinu: zbroj elemenata je, naravno, 21. Podijelimo ga sa 7, dobivamo 3. Sada oduzimamo 3 od svakog broja u izvornom nizu, kvadriramo svaku vrijednost i zbrajamo rezultate . Ispada 12. Sada nam ostaje da podijelimo broj s brojem elemenata i, čini se, to je sve. Ali postoji kvaka! Raspravljajmo o tome.

Ovisnost o broju pokusa

Ispada da pri izračunavanju varijance nazivnik može biti jedan od dva broja: N ili N-1. Ovdje je N broj izvedenih eksperimenata ili broj elemenata u nizu (što je u biti isto). O čemu to ovisi?

Ako se broj testova mjeri u stotinama, onda u nazivnik moramo staviti N. Ako u jedinicama, onda N-1. Znanstvenici su granicu odlučili povući sasvim simbolično: ona danas ide duž broja 30. Ako smo proveli manje od 30 eksperimenata, tada ćemo količinu podijeliti s N-1, a ako je više, onda s N.

Zadatak

Vratimo se našem primjeru rješavanja problema varijance i očekivanja. Dobili smo međubroj 12, koji je trebalo podijeliti s N ili N-1. Budući da smo proveli 21 eksperiment, što je manje od 30, odabrat ćemo drugu opciju. Dakle, odgovor je: varijanca je 12/2 = 2.

Očekivana vrijednost

Prijeđimo na drugi koncept, koji moramo razmotriti u ovom članku. Matematičko očekivanje je rezultat zbrajanja svih mogućih ishoda pomnoženih s odgovarajućim vjerojatnostima. Važno je razumjeti da se dobivena vrijednost, kao i rezultat izračuna varijance, dobiva samo jednom za cijeli zadatak, bez obzira koliko ishoda uzima u obzir.

Formula matematičkog očekivanja vrlo je jednostavna: uzmemo ishod, pomnožimo ga s vjerojatnošću, dodamo isto za drugi, treći rezultat itd. Sve vezano uz ovaj koncept lako je izračunati. Na primjer, zbroj matematičkih očekivanja jednak je matematičkom očekivanju zbroja. Isto vrijedi i za rad. Takav jednostavne operacije daleko od toga da nam svaka količina u teoriji vjerojatnosti dopušta ispunjavanje s njom. Uzmimo zadatak i izračunajmo vrijednost dva pojma koja smo proučavali odjednom. Osim toga, odvukla nas je teorija - vrijeme je za praksu.

Još jedan primjer

Izveli smo 50 pokusa i dobili 10 vrsta ishoda - brojevi od 0 do 9 - koji se pojavljuju u različitim postotak. To su redom: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Podsjetimo se da za dobivanje vjerojatnosti morate postotke podijeliti sa 100. Dakle, dobivamo 0,02; 0,1 itd. Navedimo primjer rješavanja problema za varijancu slučajne varijable i matematičko očekivanje.

Aritmetičku sredinu računamo pomoću formule koju smo zapamtili osnovna škola: 50/10 = 5.

Sada prevedimo vjerojatnosti u broj ishoda "u komadima" kako bi bilo zgodnije za brojanje. Dobijemo 1, 5, 2, 7, 1, 9, 3, 8, 5 i 9. Od svake dobivene vrijednosti oduzimamo aritmetičku sredinu, nakon čega svaki od dobivenih rezultata kvadriramo. Pogledajte kako to učiniti s prvim elementom kao primjerom: 1 - 5 = (-4). Nadalje: (-4) * (-4) = 16. Za ostale vrijednosti, napravite ove operacije sami. Ako ste sve napravili kako treba, nakon dodavanja svega dobit ćete 90.

Nastavimo računati varijancu i srednju vrijednost dijeljenjem 90 s N. Zašto biramo N, a ne N-1? Tako je, jer broj izvedenih eksperimenata prelazi 30. Dakle: 90/10 = 9. Dobili smo disperziju. Ako dobijete drugi broj, ne očajavajte. Najvjerojatnije ste napravili banalnu pogrešku u izračunima. Provjerite još jednom što ste napisali i sigurno će sve doći na svoje mjesto.

Na kraju, prisjetimo se formule matematičkog očekivanja. Nećemo dati sve izračune, samo ćemo napisati odgovor s kojim se možete uvjeriti nakon što prođete sve potrebne procedure. Očekivana vrijednost bit će 5,48. Sjećamo se samo kako izvoditi operacije, koristeći primjer prvih elemenata: 0 * 0,02 + 1 * 0,1 ... i tako dalje. Kao što vidite, jednostavno množimo vrijednost ishoda s njegovom vjerojatnošću.

Odstupanje

Drugi koncept usko povezan s disperzijom i matematičkim očekivanjima je standardna devijacija. Označeno je bilo latiničnim slovima sd, ili grčko malo slovo "sigma". Ovaj koncept pokazuje kako vrijednosti u prosjeku odstupaju od središnje značajke. Da biste pronašli njegovu vrijednost, morate izračunati kvadratni korijen varijance.

Ako napravite graf normalna distribucija i želite vidjeti izravno na njemu standardna devijacija, to se može učiniti u nekoliko koraka. Uzmite polovicu slike lijevo ili desno od načina (središnja vrijednost), nacrtajte okomito na vodoravnu os tako da su površine dobivenih figura jednake. Vrijednost segmenta između sredine distribucije i rezultirajuće projekcije na vodoravnoj osi bit će standardna devijacija.

Softver

Kao što je vidljivo iz opisa formula i prikazanih primjera, izračunavanje varijance i matematičkog očekivanja nije najlakši postupak s aritmetičkog gledišta. Kako ne biste gubili vrijeme, ima smisla koristiti program koji se koristi u višim obrazovne ustanove- zove se "R". Ima funkcije koje vam omogućuju izračunavanje vrijednosti za mnoge pojmove iz statistike i teorije vjerojatnosti.

Na primjer, definirate vektor vrijednosti. To se radi na sljedeći način: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Konačno

Disperzija i matematičko očekivanje su bez kojih je teško bilo što izračunati u budućnosti. U glavnom kolegiju predavanja na sveučilištima razmatraju se već u prvim mjesecima studija predmeta. Upravo zbog nerazumijevanja ovih jednostavnih pojmova i nemogućnosti njihovog izračunavanja, mnogi studenti odmah počnu zaostajati u programu, a kasnije dobivaju loše ocjene na kraju sesije, što ih uskraćuje za stipendije.

Vježbajte barem tjedan dana pola sata dnevno, rješavajući zadatke slične onima predstavljenima u ovom članku. Tada ćete se na bilo kojem testu teorije vjerojatnosti nositi s primjerima bez suvišnih savjeta i varalica.

Disperzija se u statistici definira kao standardna devijacija pojedinačnih vrijednosti obilježja na kvadrat od aritmetičke sredine. Uobičajeni način za izračunavanje kvadrata odstupanja opcija od srednje vrijednosti i zatim njihov prosjek.

U ekonomskoj i statističkoj analizi uobičajeno je ocjenjivati ​​varijaciju značajke najčešće koristeći standardnu ​​devijaciju, koja je kvadratni korijen varijance.

(3)

Karakterizira apsolutnu fluktuaciju vrijednosti atributa varijable i izražava se u istim jedinicama kao i varijante. U statistici je često potrebno usporediti varijacije različitih značajki. Za takve usporedbe koristi se relativni pokazatelj varijacije, koeficijent varijacije.

Disperzijska svojstva:

1) ako oduzmete bilo koji broj od svih opcija, tada se varijanca neće promijeniti;

2) ako se sve vrijednosti varijante podijele s nekim brojem b, tada će se varijanca smanjiti za b^2 puta, tj.

3) ako izračunate prosječni kvadrat odstupanja od bilo kojeg broja s nejednakom aritmetičkom sredinom, tada će on biti veći od varijance. U ovom slučaju, točno definiranom vrijednošću po kvadratu razlike između prosječne vrijednosti poz.

Varijanca se može definirati kao razlika između srednje kvadratne vrijednosti i srednje kvadratne vrijednosti.

17. Grupne i međugrupne varijacije. Pravilo zbrajanja varijance

Ako je statistička populacija podijeljena u skupine ili dijelove prema svojstvu koje se proučava, tada se za takvu populaciju mogu izračunati sljedeće vrste disperzije: grupna (privatna), grupna prosječna (privatna) i međugrupna.

Ukupna varijanca- odražava varijaciju svojstva zbog svih uvjeta i uzroka koji djeluju u određenoj statističkoj populaciji.

Grupna varijanca- jednak je srednjem kvadratu odstupanja pojedinačnih vrijednosti atributa unutar skupine od aritmetičke sredine te skupine, koja se naziva sredina skupine. U ovom slučaju, prosjek grupe ne podudara se s ukupnim prosjekom za cijelu populaciju.

Grupna varijanca odražava varijaciju osobine samo zbog uvjeta i uzroka koji djeluju unutar grupe.

Prosječna grupna odstupanja- definira se kao ponderirana aritmetička sredina grupnih disperzija, pri čemu su ponderi volumeni skupina.

Međugrupna varijanca- jednak je srednjem kvadratu odstupanja grupnih srednjih vrijednosti od ukupne srednje vrijednosti.

Međugrupna varijanca karakterizira varijaciju rezultantnog atributa zbog atributa grupiranja.

Između razmatranih tipova disperzija postoji određeni odnos: ukupna disperzija jednaka je zbroju prosječne grupne i međugrupne disperzije.

Ova relacija se naziva pravilo zbrajanja varijance.

18. Dinamički niz i njegovi sastavni elementi. Vrste dinamičkih serija.

Serije u statistici- to su digitalni podaci koji prikazuju promjenu neke pojave u vremenu ili prostoru i omogućuju statističku usporedbu pojava kako u procesu njihovog razvoja u vremenu, tako iu različitim oblicima i vrstama procesa. Zahvaljujući tome, moguće je otkriti međusobnu ovisnost pojava.

Proces razvoja kretanja društvenih pojava u vremenu u statistici se obično naziva dinamikom. Za prikaz dinamike izgrađuju se nizovi dinamika (kronološki, vremenski), koji su nizovi vremenski promjenjivih vrijednosti statističkog pokazatelja (primjerice, broj osuđenika tijekom 10 godina), poredanih kronološkim redom. Njihovi sastavni elementi su brojčane vrijednosti danog pokazatelja i razdoblja ili točke u vremenu na koje se odnose.

Najvažnija karakteristika vremenske serije- njihova veličina (volumen, vrijednost) ove ili one pojave, postignuta u određenom razdoblju ili određenom trenutku. Prema tome, veličina članova niza dinamike je njegova razina. razlikovati početna, srednja i završna razina dinamičke serije. Prva razina pokazuje vrijednost prvog, konačnog - vrijednost posljednjeg člana niza. Prosječna razina predstavlja prosječni kronološki varijacijski raspon i izračunava se ovisno o tome je li vremenska serija intervalna ili trenutna.

Još jedna važna karakteristika dinamičke serije- vrijeme proteklo od početnog do konačnog opažanja ili broj takvih opažanja.

Postoje različite vrste vremenskih serija, a mogu se klasificirati prema sljedećim kriterijima.

1) Ovisno o načinu izražavanja razina, nizovi dinamike dijele se na nizove apsolutnih i izvedenih pokazatelja (relativne i prosječne vrijednosti).

2) Ovisno o tome kako razine niza izražavaju stanje pojave u određenim vremenskim točkama (na početku mjeseca, tromjesečja, godine itd.) ili njezinu vrijednost za određene vremenske intervale (npr. po danu, mjesec, godina, itd.) n.), razlikuju trenutne i intervalne nizove dinamike, redom. Serije trenutaka u analitičkom radu agencija za provođenje zakona koriste se relativno rijetko.

U teoriji statistike dinamika se razlikuje i prema nizu drugih klasifikacijskih obilježja: ovisno o udaljenosti između razina - s ekvidistantnim razinama i vremenski nejednakim razinama; ovisno o prisutnosti glavnog trenda procesa koji se proučava - stacionarni i nestacionarni. Pri analizi dinamičkih serija sljedeće razine serije prikazane su kao komponente:

Y t \u003d TP + E (t)

gdje je TR deterministička komponenta koja određuje opći trend promjene tijekom vremena ili trend.

E (t) je slučajna komponenta koja uzrokuje fluktuacije razine.

Izračunajmo uMSEXCELvarijance i standardne devijacije uzorka. Također izračunavamo varijancu slučajne varijable ako je poznata njezina distribucija.

Prvo razmislite disperzija, onda standardna devijacija.

Varijanca uzorka

Varijanca uzorka (varijanca uzorka,uzorakvarijanca) karakterizira širenje vrijednosti u nizu u odnosu na .

Sve 3 formule su matematički ekvivalentne.

Iz prve formule se vidi da varijanca uzorka je zbroj kvadrata odstupanja svake vrijednosti u nizu od prosjeka podijeljeno s veličinom uzorka minus 1.

disperzija uzorci koristi se funkcija DISP(), eng. naziv VAR-a, tj. VARIJANCIJA. Od MS EXCEL-a 2010 preporuča se koristiti njegov analog DISP.V() , eng. naziv VARS, tj. Odstupanje uzorka. Osim toga, počevši od verzije MS EXCEL 2010, postoji funkcija DISP.G (), eng. VARP naziv, tj. VARIJANCIJA populacije koja se izračunava disperzija za populacija. Cijela razlika se svodi na nazivnik: umjesto n-1 kao DISP.V() , DISP.G() ima samo n u nazivniku. Prije MS EXCEL 2010, funkcija VARP() se koristila za izračun varijance populacije.

Varijanca uzorka
=KVADRAT(Uzorak)/(BROJ(Uzorak)-1)
=(SUMSQ(Uzorak)-BROJ(Uzorak)*PROSJEK(Uzorak)^2)/ (BROJ(Uzorak)-1)- uobičajena formula
=SUM((Uzorak -PROSJEK(Uzorak))^2)/ (BROJ(Uzorak)-1) –

Varijanca uzorka je jednak 0 samo ako su sve vrijednosti međusobno jednake i, prema tome, jednake Srednja vrijednost. Obično, što je veća vrijednost disperzija, veće je širenje vrijednosti u nizu.

Varijanca uzorka je točkasta procjena disperzija distribucija slučajne varijable iz koje se uzorak. O gradnji intervali povjerenja prilikom ocjenjivanja disperzija može se pročitati u članku.

Varijanca slučajne varijable

Izračunati disperzija slučajna varijabla, morate je znati.

Za disperzija slučajna varijabla X često koristi oznaku Var(X). Disperzija jednak je kvadratu odstupanja od srednje vrijednosti E(X): Var(X)=E[(X-E(X)) 2 ]

disperzija izračunava se formulom:

gdje je x i vrijednost koju slučajna varijabla može poprimiti, a μ prosječna vrijednost (), p(x) je vjerojatnost da će slučajna varijabla poprimiti vrijednost x.

Ako slučajna varijabla ima , tada disperzija izračunava se formulom:

Dimenzija disperzija odgovara kvadratu mjerne jedinice izvornih vrijednosti. Na primjer, ako su vrijednosti u uzorku mjere težine dijela (u kg), tada bi dimenzija varijance bila kg 2 . Ovo može biti teško protumačiti, dakle, za karakterizaciju širenja vrijednosti, vrijednosti jednake kvadratnom korijenu disperzijastandardna devijacija.

Neka svojstva disperzija:

Var(X+a)=Var(X), gdje je X slučajna varijabla, a a konstanta.

Var(aH)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ovo svojstvo disperzije koristi se u članak o linearnoj regresiji.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), gdje su X i Y slučajne varijable, Cov(X;Y) je kovarijanca ovih slučajnih varijabli.

Ako su slučajne varijable nezavisne, onda su njihove kovarijanca je 0, i stoga Var(X+Y)=Var(X)+Var(Y). Ovo svojstvo varijance koristi se u izlazu.

Pokažimo da je za nezavisne veličine Var(X-Y)=Var(X+Y). Doista, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Ovo svojstvo varijance koristi se za iscrtavanje.

Standardna devijacija uzorka

Standardna devijacija uzorka je mjera koliko su široko raspršene vrijednosti u uzorku u odnosu na njihove .

Po definiciji, standardna devijacija jednako je kvadratnom korijenu od disperzija:

Standardna devijacija ne uzima u obzir veličinu vrijednosti u uzorkovanje, već samo stupanj raspršenosti vrijednosti oko njih sredini. Uzmimo primjer da to ilustriramo.

Izračunajmo standardnu ​​devijaciju za 2 uzorka: (1; 5; 9) i (1001; 1005; 1009). U oba slučaja je s=4. Očito je da je omjer standardne devijacije prema vrijednostima niza značajno različit za uzorke. Za takve slučajeve koristite Koeficijent varijacije(Coefficient of Variation, CV) - omjer standardna devijacija do prosjeka aritmetika, izraženo u postocima.

U MS EXCEL 2007 i starijim verzijama za izračun Standardna devijacija uzorka koristi se funkcija =STDEV(), eng. naziv STDEV, tj. standardna devijacija. Od MS EXCEL-a 2010 preporuča se koristiti njegov analog = STDEV.B () , eng. ime STDEV.S, tj. Standardno odstupanje uzorka.

Osim toga, počevši od verzije MS EXCEL 2010, postoji funkcija STDEV.G () , eng. naziv STDEV.P, tj. Standartno odstupanje populacije koje izračunava standardna devijacija za populacija. Cijela razlika se svodi na nazivnik: umjesto n-1 kao STDEV.V() , STDEV.G() ima samo n u nazivniku.

Standardna devijacija također se može izračunati izravno iz formula u nastavku (pogledajte datoteku primjera)
=SQRT(SQUADROTIV(uzorak)/(BROJ(uzorak)-1))
=SQRT((SUMSQ(Uzorak)-BROJ(Uzorak)*PROSJEK(Uzorak)^2)/(BROJ(Uzorak)-1))

Ostale mjere disperzije

Funkcija SQUADRIVE() računa s umm kvadratnih odstupanja vrijednosti od njihovih sredini. Ova funkcija će vratiti isti rezultat kao formula =VAR.G( Uzorak)*ČEK( Uzorak) , gdje Uzorak- referenca na raspon koji sadrži niz vrijednosti uzorka (). Izračuni u funkciji QUADROTIV() rade se prema formuli:

Funkcija SROOT() također je mjera raspršenosti skupa podataka. Funkcija SIROTL() izračunava prosjek apsolutnih vrijednosti odstupanja vrijednosti od sredini. Ova funkcija će vratiti isti rezultat kao formula =SUMPROIZVOD(ABS(Uzorak-PROSJEK(Uzorak)))/BROJ(Uzorak), gdje Uzorak- referenca na raspon koji sadrži niz vrijednosti uzorka.

Izračuni u funkciji SROOTKL () izrađuju se prema formuli: