Biografije Karakteristike Analiza

Matematička disperzijska formula. Disperzija diskretne slučajne varijable

Izračunajmo uMSEXCELvarijanca uzorka i standardna devijacija. Također ćemo izračunati varijancu slučajne varijable ako je poznata njezina distribucija.

Prvo razmotrimo disperzija, onda standardna devijacija.

Varijanca uzorka

Varijanca uzorka (varijanca uzorka,uzorakvarijanca) karakterizira širenje vrijednosti u nizu u odnosu na .

Sve 3 formule su matematički ekvivalentne.

Iz prve formule jasno je da varijanca uzorka je zbroj kvadrata odstupanja svake vrijednosti u nizu od prosjeka, podijeljeno s veličinom uzorka minus 1.

odstupanja uzorci koristi se funkcija DISP(), engleski. naziv VAR, tj. VARIJANCIJA. Od MS EXCEL-a 2010 preporuča se koristiti njegov analog DISP.V() , eng. naziv VARS, tj. Uzorak VARiance. Osim toga, počevši od verzije MS EXCEL 2010, postoji funkcija DISP.G (), eng. naziv VARP, tj. VARIJANCIJA populacije koja se izračunava disperzija Za populacija. Cijela razlika se svodi na nazivnik: umjesto n-1 kao DISP.V(), DISP.G() ima samo n u nazivniku. Prije MS EXCEL 2010, funkcija VAR() se koristila za izračunavanje varijance populacije.

Varijanca uzorka
=KVADRAT(Uzorak)/(BROJ(Uzorak)-1)
=(SUMSQ(Uzorak)-BROJ(Uzorak)*PROSJEK(Uzorak)^2)/ (BROJ(Uzorak)-1)– uobičajena formula
=SUM((Uzorak -PROSJEK(Uzorak))^2)/ (BROJ(Uzorak)-1) –

Varijanca uzorka je jednak 0, samo ako su sve vrijednosti međusobno jednake i, prema tome, jednake Prosječna vrijednost. Obično, što je veća vrijednost odstupanja, veće je širenje vrijednosti u nizu.

Varijanca uzorka je točkasta procjena odstupanja distribucija slučajne varijable od koje je napravljena uzorak. O gradnji intervali povjerenja prilikom ocjenjivanja odstupanja može se pročitati u članku.

Varijanca slučajne varijable

Izračunati disperzija slučajna varijabla, morate je znati.

Za odstupanja slučajna varijabla X često se označava Var(X). Disperzija jednako kvadratu odstupanja od srednje vrijednosti E(X): Var(X)=E[(X-E(X)) 2 ]

disperzija izračunava se formulom:

gdje je x i vrijednost koju slučajna varijabla može poprimiti, a μ prosječna vrijednost (), p(x) je vjerojatnost da će slučajna varijabla poprimiti vrijednost x.

Ako slučajna varijabla ima , tada disperzija izračunava se formulom:

Dimenzija odstupanja odgovara kvadratu mjerne jedinice izvornih vrijednosti. Na primjer, ako vrijednosti u uzorku predstavljaju mjerenje težine dijela (u kg), tada bi dimenzija varijance bila kg 2 . To može biti teško protumačiti, tako da karakterizira širenje vrijednosti, vrijednost jednaka kvadratnom korijenu odstupanjastandardna devijacija.

Neka svojstva odstupanja:

Var(X+a)=Var(X), gdje je X slučajna varijabla, a a konstanta.

Var(aH)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ovo svojstvo disperzije koristi se u članak o linearnoj regresiji.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), gdje su X i Y slučajne varijable, Cov(X;Y) je kovarijanca ovih slučajnih varijabli.

Ako su slučajne varijable nezavisne, onda one kovarijanca je jednako 0, i stoga Var(X+Y)=Var(X)+Var(Y). Ovo svojstvo disperzije koristi se u derivaciji.

Pokažimo da je za nezavisne veličine Var(X-Y)=Var(X+Y). Doista, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Ovo svojstvo disperzije koristi se za konstrukciju .

Standardna devijacija uzorka

Standardna devijacija uzorka je mjera koliko su široko raspršene vrijednosti u uzorku u odnosu na njihove .

A-priorat, standardna devijacija jednako kvadratnom korijenu od odstupanja:

Standardna devijacija ne uzima u obzir veličinu vrijednosti u uzorak, već samo stupanj disperzije vrijednosti oko njih prosjek. Uzmimo primjer da to ilustriramo.

Izračunajmo standardnu ​​devijaciju za 2 uzorka: (1; 5; 9) i (1001; 1005; 1009). U oba slučaja je s=4. Očito je da se omjer standardne devijacije i vrijednosti niza značajno razlikuje između uzoraka. Za takve slučajeve koristite Koeficijent varijacije(Coefficient of Variation, CV) - omjer Standardna devijacija do prosjeka aritmetika, izraženo u postocima.

U MS EXCEL 2007 i starijim verzijama za izračun Standardna devijacija uzorka koristi se funkcija =STDEV(), eng. ime STDEV, tj. Standardno odstupanje. Od verzije MS EXCEL 2010 preporuča se koristiti njegov analog =STDEV.B() , engleski. ime STDEV.S, tj. Standardno odstupanje uzorka.

Osim toga, počevši od verzije MS EXCEL 2010, postoji funkcija STANDARDEV.G(), engleski. naziv STDEV.P, tj. Standartno odstupanje populacije, koje izračunava standardna devijacija Za populacija. Cijela razlika se svodi na nazivnik: umjesto n-1 kao u STANDARDEV.V(), STANDARDEVAL.G() ima samo n u nazivniku.

Standardna devijacija također se može izračunati izravno pomoću formula u nastavku (pogledajte datoteku primjera)
=SQRT(SQUADROTIV(uzorak)/(BROJ(uzorak)-1))
=SQRT((SUMSQ(Uzorak)-BROJ(Uzorak)*PROSJEK(Uzorak)^2)/(BROJ(Uzorak)-1))

Ostale mjere raspršenosti

Funkcija SQUADRIVE() računa s zbroj kvadrata odstupanja vrijednosti od njihovih prosjek. Ova funkcija će vratiti isti rezultat kao formula =DISP.G( Uzorak)*ČEK( Uzorak) , Gdje Uzorak- referenca na raspon koji sadrži niz vrijednosti uzorka (). Izračuni u funkciji QUADROCL() vrše se prema formuli:

Funkcija SROTCL() također je mjera širenja skupa podataka. Funkcija SROTCL() izračunava prosjek apsolutnih vrijednosti odstupanja vrijednosti od prosjek. Ova funkcija će vratiti isti rezultat kao formula =SUMPROIZVOD(ABS(Uzorak-PROSJEK(Uzorak)))/BROJ(Uzorak), Gdje Uzorak- referenca na raspon koji sadrži niz vrijednosti uzorka.

Izračuni u funkciji SROOTKL () izrađuju se prema formuli:

Raspon varijacije (ili raspon varijacije) - je razlika između maksimalne i minimalne vrijednosti svojstva:

U našem primjeru raspon varijacije smjenskog učinka radnika je: u prvoj brigadi R = 105-95 = 10 djece, u drugoj brigadi R = 125-75 = 50 djece. (5 puta više). Ovo sugerira da je učinak 1. brigade „stabilniji“, ali druga brigada ima više rezervi za povećanje učinka, jer Ako svi radnici postignu maksimalni učinak za ovu brigadu, ona može proizvesti 3 * 125 = 375 dijelova, au 1. brigadi samo 105 * 3 = 315 dijelova.
Ako ekstremne vrijednosti neke karakteristike nisu tipične za populaciju, tada se koriste rasponi kvartila ili decila. Kvartilni raspon RQ= Q3-Q1 pokriva 50% volumena populacije, prvi decilni raspon RD1 = D9-D1 pokriva 80% podataka, drugi decilni raspon RD2= D8-D2 – 60%.
Nedostatak indikatora raspona varijacije je što njegova vrijednost ne odražava sve fluktuacije svojstva.
Najjednostavniji opći pokazatelj koji odražava sve fluktuacije karakteristike je prosječno linearno odstupanje, što je aritmetička sredina apsolutnih odstupanja pojedinih opcija od njihove prosječne vrijednosti:

,
za grupirane podatke
,
gdje je xi vrijednost atributa u diskretnoj seriji ili sredina intervala u intervalnoj distribuciji.
U gornjim formulama, razlike u brojniku se uzimaju modulo, inače će prema svojstvu aritmetičke sredine brojnik uvijek biti jednak nuli. Stoga se prosječno linearno odstupanje rijetko koristi u statističkoj praksi, samo u slučajevima kada zbrajanje pokazatelja bez uzimanja u obzir predznaka ima ekonomskog smisla. Uz njegovu pomoć analizira se, primjerice, sastav radne snage, rentabilnost proizvodnje, vanjskotrgovinski promet.
Varijanca osobine je prosječni kvadrat odstupanja varijante od njihove prosječne vrijednosti:
jednostavna varijanca
,
ponderirana varijanca
.
Formula za izračun varijance može se pojednostaviti:

Dakle, varijanca je jednaka razlici između prosjeka kvadrata opcije i kvadrata prosjeka opcije populacije:
.
Međutim, zbog zbrajanja kvadrata odstupanja, varijanca daje iskrivljenu predodžbu o odstupanjima, pa se na temelju nje izračunava prosjek standardna devijacija, koji pokazuje koliko u prosjeku pojedine varijante neke osobine odstupaju od svoje prosječne vrijednosti. Izračunava se uzimanjem kvadratnog korijena varijance:
za negrupirane podatke
,
za serije varijacija

Što je manja vrijednost varijance i standardne devijacije, što je populacija homogenija, to će prosječna vrijednost biti pouzdanija (tipičnija).
Prosječna linearna i standardna devijacija su imenovani brojevi, tj. izraženi su u mjernim jedinicama neke karakteristike, identični su po sadržaju i bliski po značenju.
Preporuča se izračunati apsolutne pokazatelje varijacije pomoću tablica.
Tablica 3 - Izračun karakteristika varijacije (na primjeru razdoblja podataka o smjenskom učinku radnika posade)


Broj radnika

Sredina intervala

Izračunate vrijednosti

Ukupno:

Prosječna smjena rada radnika:

Prosječno linearno odstupanje:

Odstupanje proizvodnje:

Standardna devijacija učinka pojedinačnih radnika od prosječnog učinka:
.

1 Proračun disperzije metodom momenata

Izračunavanje odstupanja uključuje glomazne izračune (posebno ako je prosjek izražen kao veliki broj s nekoliko decimalnih mjesta). Izračuni se mogu pojednostaviti korištenjem pojednostavljene formule i svojstava disperzije.
Disperzija ima sljedeća svojstva:

  1. Ako se sve vrijednosti karakteristike smanjuju ili povećavaju za istu vrijednost A, tada se disperzija neće smanjiti:

,

, zatim ili
Koristeći svojstva disperzije i prvo reducirajući sve varijante populacije za vrijednost A, a zatim dijeleći s vrijednošću intervala h, dobivamo formulu za izračun disperzije u varijacijskim serijama s jednakim intervalima na neki način:
,
gdje je disperzija izračunata metodom momenata;
h – vrijednost intervala varijacijskog niza;
– opcija novih (transformiranih) vrijednosti;
A je konstantna vrijednost, koja se koristi kao sredina intervala s najvećom frekvencijom; ili opcija s najvećom učestalošću;
– kvadrat momenta prvog reda;
– moment drugog reda.
Izračunajmo disperziju koristeći metodu momenata na temelju podataka o smjenskom učinku radnika tima.
Tablica 4 - Izračun varijance metodom momenata


Grupe proizvodnih radnika, kom.

Broj radnika

Sredina intervala

Izračunate vrijednosti

Postupak izračuna:


  1. Izračunavamo varijancu:

2 Izračun varijance alternativnog obilježja

Među karakteristikama koje proučava statistika postoje i one koje imaju samo dva međusobno isključiva značenja. Ovo su alternativni znakovi. Dane su im dvije kvantitativne vrijednosti: opcija 1 i 0. Učestalost opcije 1, koja je označena s p, je udio jedinica koje posjeduju ovu karakteristiku. Razlika 1-r=q je frekvencija opcija 0. Dakle,


xi

Aritmetička sredina alternativnog predznaka
, jer je p+q=1.

Varijanca alternativnog svojstva
, jer 1-r=q
Dakle, varijanca alternativnog obilježja jednaka je umnošku udjela jedinica koje posjeduju to obilježje i udjela jedinica koje nemaju to obilježje.
Ako se vrijednosti 1 i 0 pojavljuju jednako često, tj. p=q, varijanca doseže svoj maksimum pq=0,25.
Varijanca alternativnog atributa koristi se u uzorcima istraživanja, na primjer, kvalitete proizvoda.

3 Razlika između grupa. Pravilo zbrajanja varijance

Disperzija je, za razliku od ostalih karakteristika varijacije, aditivna veličina. Odnosno, u agregatu koji je podijeljen u skupine prema čimbeničkim karakteristikama x , varijanca rezultantne karakteristike g može se rastaviti na varijancu unutar svake skupine (unutar skupina) i varijancu između skupina (između skupina). Zatim, uz proučavanje varijacije svojstva kroz cijelu populaciju kao cjelinu, postaje moguće proučavati varijaciju u svakoj skupini, kao i između tih skupina.

Ukupna varijanca mjeri varijacije u svojstvu na u cijelosti pod utjecajem svih čimbenika koji su uzrokovali tu varijaciju (odstupanja). Jednak je srednjem kvadratnom odstupanju pojedinačnih vrijednosti atributa na od velikog prosjeka i može se izračunati kao jednostavna ili ponderirana varijanca.
Međugrupna varijanca karakterizira varijaciju dobivenog svojstva na izazvana utjecajem faktora-znaka x, koji je činio osnovu grupiranja. On karakterizira varijaciju prosjeka grupe i jednak je srednjem kvadratu odstupanja prosjeka grupe od ukupnog prosjeka:
,
gdje je aritmetička sredina i-te skupine;
– broj jedinica u i-toj skupini (učestalost i-te skupine);
– ukupni prosjek stanovništva.
Varijanca unutar grupe odražava slučajnu varijaciju, tj. onaj dio varijacije koji je uzrokovan utjecajem neobračunatih čimbenika i ne ovisi o čimbeniku-atributu koji čini osnovu grupiranja. Karakterizira varijaciju pojedinačnih vrijednosti u odnosu na grupne prosjeke i jednaka je srednjem kvadratnom odstupanju pojedinačnih vrijednosti atributa na unutar skupine iz aritmetičke sredine te skupine (srednja vrijednost skupine) i izračunava se kao jednostavna ili ponderirana varijanca za svaku skupinu:
ili ,
gdje je broj jedinica u grupi.
Na temelju varijanci unutar grupe za svaku grupu, može se odrediti ukupna sredina varijanci unutar grupe:
.
Odnos između triju disperzija naziva se pravila za dodavanje varijanci, prema kojem je ukupna varijanca jednaka zbroju varijance između grupa i prosjeka varijanci unutar grupe:

Primjer. Proučavanjem utjecaja tarifnog razreda (kvalifikacije) radnika na razinu proizvodnosti njihova rada došlo se do sljedećih podataka.
Tablica 5 – Raspodjela radnika prema prosječnom satnom učinku.



p/p

Radnici 4. kategorije

Radnici V kategorije

Izlaz
radnik, kom.,

Izlaz
radnik, kom.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

U ovom primjeru radnici su podijeljeni u dvije skupine prema faktoru x- kvalifikacije, koje karakterizira njihov rang. Rezultirajuće svojstvo - proizvodnja - varira pod njegovim utjecajem (varijacije među grupama) i zbog drugih slučajnih čimbenika (varijacije unutar grupa). Cilj je izmjeriti ove varijacije pomoću tri varijance: ukupne, između grupa i unutar grupa. Empirijski koeficijent determinacije pokazuje udio varijacije u rezultirajućoj karakteristici na pod utjecajem znaka faktora x. Ostatak ukupne varijacije na uzrokovane promjenama drugih čimbenika.
U primjeru, empirijski koeficijent determinacije je:
ili 66,7 posto
To znači da je 66,7% varijacija u produktivnosti radnika posljedica razlika u kvalifikacijama, a 33,3% utjecaja drugih čimbenika.
Empirijski korelacijski odnos pokazuje tijesnost odnosa između grupiranja i učinkovitih značajki. Izračunava se kao kvadratni korijen empirijskog koeficijenta determinacije:

Empirijski omjer korelacije, poput , može poprimiti vrijednosti od 0 do 1.
Ako nema veze, tada je =0. U ovom slučaju =0, tj. grupne srednje vrijednosti su međusobno jednake i nema međugrupne varijacije. To znači da grupirajuće obilježje – faktor ne utječe na formiranje opće varijacije.
Ako je veza funkcionalna, tada je =1. U ovom slučaju, varijanca grupne sredine jednaka je ukupnoj varijanci (), to jest, nema varijacije unutar grupe. To znači da karakteristika grupiranja u potpunosti određuje varijaciju rezultirajuće karakteristike koja se proučava.
Što je vrijednost korelacijskog omjera bliža jedinici, to je veza između obilježja bliža, bliža funkcionalnoj ovisnosti.
Za kvalitativno ocjenjivanje bliskosti veza između karakteristika koriste se Chaddockovi odnosi.

U primjeru , što ukazuje na usku vezu između produktivnosti radnika i njihove kvalifikacije.

Uz proučavanje varijacije obilježja kroz cijelu populaciju kao cjelinu, često je potrebno pratiti kvantitativne promjene obilježja po skupinama na koje je populacija podijeljena, kao i između skupina. Ova studija varijacije postiže se izračunavanjem i analizom različitih vrsta varijance.
Postoje ukupne, međugrupne i unutargrupne varijance.
Ukupna varijanca σ 2 mjeri varijaciju svojstva u cijeloj populaciji pod utjecajem svih čimbenika koji su uzrokovali tu varijaciju.

Međugrupna varijanca (δ) karakterizira sustavnu varijaciju, tj. razlike u vrijednosti proučavanog svojstva koje nastaju pod utjecajem faktorskog svojstva koje čini osnovu skupine. Izračunava se pomoću formule:
.

Varijanca unutar grupe (σ) odražava nasumične varijacije, tj. dio varijacije koji se javlja pod utjecajem neobračunatih čimbenika i ne ovisi o čimbeniku-atributu koji čini osnovu grupe. Izračunava se po formuli:
.

Prosjek varijanci unutar grupe: .

Postoji zakon koji povezuje 3 tipa disperzije. Ukupna varijanca jednaka je zbroju prosjeka varijance unutar grupe i između grupe: .
Taj se omjer naziva pravilo za dodavanje varijanci.

Pokazatelj koji se široko koristi u analizi je udio varijance između grupa u ukupnoj varijanci. Nosi ime empirijski koeficijent determinacije (η 2): .
Kvadratni korijen empirijskog koeficijenta determinacije naziva se empirijski omjer korelacije (η):
.
Karakterizira utjecaj karakteristike koja čini osnovu grupe na varijaciju rezultirajuće karakteristike. Empirijski omjer korelacije kreće se od 0 do 1.
Pokažimo njegovu praktičnu upotrebu na sljedećem primjeru (tablica 1).

Primjer br. 1. Tablica 1 - Produktivnost rada dvije grupe radnika u jednoj od radionica NPO "Ciklon"

Izračunajmo ukupne i grupne srednje vrijednosti i varijance:




Početni podaci za izračun prosjeka unutargrupne i međugrupne varijance prikazani su u tablici. 2.
tablica 2
Proračun i δ 2 za dvije grupe radnika.


Radničke grupe
Broj radnika, ljudi Prosjek, djeca/smjena Disperzija

Završena tehnička obuka

5 95 42,0

Oni koji nisu završili tehničku obuku

5 81 231,2

Svi radnici

10 88 185,6
Izračunajmo pokazatelje. Prosjek odstupanja unutar grupe:
.
Međugrupna varijanca

Ukupna varijanca:
Dakle, empirijski omjer korelacije: .

Uz varijacije kvantitativnih karakteristika, mogu se uočiti i varijacije kvalitativnih karakteristika. Ova studija varijacije postiže se izračunavanjem sljedećih vrsta varijanci:

Disperzija udjela unutar grupe određena je formulom

Gdje n i– broj jedinica u posebnim skupinama.
Udio proučavanog obilježja u cjelokupnoj populaciji, koji se određuje formulom:
Tri vrste varijance međusobno su povezane na sljedeći način:
.

Ovaj odnos varijanci naziva se teorem zbrajanja varijanci udjela svojstava.

Teorija vjerojatnosti je posebna grana matematike koju proučavaju samo studenti visokoškolskih ustanova. Volite li izračune i formule? Ne plaše li vas izgledi da se upoznate s normalnom distribucijom, entropijom ansambla, matematičkim očekivanjem i disperzijom diskretne slučajne varijable? Onda će vam ova tema biti vrlo zanimljiva. Upoznajmo se s nekoliko najvažnijih temeljnih pojmova ove grane znanosti.

Prisjetimo se osnova

Čak i ako se sjećate najjednostavnijih pojmova teorije vjerojatnosti, nemojte zanemariti prve odlomke članka. Poanta je da bez jasnog razumijevanja osnova nećete moći raditi s formulama o kojima se raspravlja u nastavku.

Dakle, dogodi se neki slučajni događaj, neki eksperiment. Kao rezultat radnji koje poduzimamo, možemo dobiti nekoliko ishoda - neki se od njih javljaju češće, drugi rjeđe. Vjerojatnost događaja je omjer broja stvarno postignutih ishoda jedne vrste prema ukupnom broju mogućih. Tek ako znate klasičnu definiciju ovog koncepta, možete početi proučavati matematičko očekivanje i disperziju kontinuiranih slučajnih varijabli.

Prosjek

Još u školi, na satu matematike, počeli ste raditi s aritmetičkom sredinom. Ovaj se koncept naširoko koristi u teoriji vjerojatnosti i stoga se ne može zanemariti. Za nas je u ovom trenutku najvažnije da ćemo ga susresti u formulama za matematičko očekivanje i disperziju slučajne varijable.

Imamo niz brojeva i želimo pronaći aritmetičku sredinu. Sve što se od nas traži je zbrojiti sve raspoloživo i podijeliti s brojem elemenata u nizu. Neka su nam brojevi od 1 do 9. Zbroj elemenata bit će jednak 45, a tu vrijednost ćemo podijeliti s 9. Odgovor: - 5.

Disperzija

Znanstveno rečeno, disperzija je prosječni kvadrat odstupanja dobivenih vrijednosti neke karakteristike od aritmetičke sredine. Označava se jednim velikim latiničnim slovom D. Što je potrebno za njegovo izračunavanje? Za svaki element niza izračunamo razliku postojećeg broja i aritmetičke sredine te je kvadriramo. Bit će točno onoliko vrijednosti koliko može biti ishoda za događaj koji razmatramo. Zatim zbrojimo sve primljeno i podijelimo s brojem elemenata u nizu. Ako imamo pet mogućih ishoda, onda podijelimo s pet.

Disperzija također ima svojstva koja treba zapamtiti kako bi se mogla koristiti pri rješavanju problema. Na primjer, kada se slučajna varijabla povećava za X puta, varijanca se povećava za X kvadratnih puta (tj. X*X). Nikada nije manji od nule i ne ovisi o pomaku vrijednosti gore ili dolje za jednake iznose. Također, za nezavisna ispitivanja, varijanca zbroja jednaka je zbroju varijanci.

Sada svakako trebamo razmotriti primjere varijance diskretne slučajne varijable i matematičkog očekivanja.

Recimo da izvedemo 21 eksperiment i dobijemo 7 različitih rezultata. Svaku smo promatrali 1, 2, 2, 3, 4, 4 i 5 puta. Kolika će biti varijanca?

Prvo, izračunajmo aritmetičku sredinu: zbroj elemenata je, naravno, 21. Podijelite ga sa 7, dobivate 3. Sada oduzmite 3 od svakog broja u izvornom nizu, kvadrirajte svaku vrijednost i zbrojite rezultate. Rezultat je 12. Sada sve što trebamo učiniti je podijeliti broj s brojem elemenata i, čini se, to je sve. Ali postoji caka! Raspravljajmo o tome.

Ovisnost o broju pokusa

Ispada da pri izračunavanju varijance nazivnik može sadržavati jedan od dva broja: N ili N-1. Ovdje je N broj izvedenih eksperimenata ili broj elemenata u nizu (što je u biti isto). O čemu ovo ovisi?

Ako se broj testova mjeri u stotinama, onda u nazivnik moramo staviti N. Ako u jedinicama, onda N-1. Znanstvenici su granicu odlučili povući sasvim simbolično: ona danas prolazi kroz brojku 30. Ako smo proveli manje od 30 eksperimenata, tada ćemo količinu podijeliti s N-1, a ako više, onda s N.

Zadatak

Vratimo se našem primjeru rješavanja problema varijance i matematičkog očekivanja. Dobili smo međubroj 12 koji je trebalo podijeliti sa N ili N-1. Budući da smo proveli 21 eksperiment, što je manje od 30, odabrat ćemo drugu opciju. Dakle, odgovor je: varijanca je 12/2 = 2.

Očekivana vrijednost

Prijeđimo na drugi koncept, koji moramo razmotriti u ovom članku. Matematičko očekivanje je rezultat zbrajanja svih mogućih ishoda pomnoženih s odgovarajućim vjerojatnostima. Važno je razumjeti da se dobivena vrijednost, kao i rezultat izračuna varijance, dobiva samo jednom za cijeli problem, bez obzira koliko se ishoda u njemu razmatra.

Formula za matematičko očekivanje vrlo je jednostavna: uzmemo ishod, pomnožimo ga s njegovom vjerojatnošću, dodamo isto za drugi, treći rezultat itd. Sve vezano uz ovaj koncept nije teško izračunati. Na primjer, zbroj očekivanih vrijednosti jednak je očekivanoj vrijednosti zbroja. Isto vrijedi i za rad. Ne dopušta vam svaka količina u teoriji vjerojatnosti izvođenje tako jednostavnih operacija. Uzmimo problem i izračunajmo značenje dva pojma koja smo proučavali odjednom. Osim toga, odvukla nas je teorija - vrijeme je za praksu.

Još jedan primjer

Proveli smo 50 ispitivanja i dobili 10 vrsta ishoda - brojevi od 0 do 9 - koji se pojavljuju u različitim postocima. To su redom: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Podsjetimo se da za dobivanje vjerojatnosti trebate podijeliti postotne vrijednosti sa 100. Dakle, dobivamo 0,02; 0,1 itd. Navedimo primjer rješavanja problema za varijancu slučajne varijable i matematičko očekivanje.

Aritmetičku sredinu izračunavamo pomoću formule koju pamtimo iz osnovne škole: 50/10 = 5.

Sada pretvorimo vjerojatnosti u broj ishoda "u komadima" kako bismo lakše brojali. Dobijemo 1, 5, 2, 7, 1, 9, 3, 8, 5 i 9. Od svake dobivene vrijednosti oduzimamo aritmetičku sredinu, nakon čega svaki od dobivenih rezultata kvadriramo. Pogledajte kako to učiniti koristeći prvi element kao primjer: 1 - 5 = (-4). Sljedeće: (-4) * (-4) = 16. Za ostale vrijednosti, napravite ove operacije sami. Ako ste sve napravili kako treba, nakon što ih sve zbrojite dobit ćete 90.

Nastavimo računati varijancu i očekivanu vrijednost dijeljenjem 90 s N. Zašto biramo N umjesto N-1? Točno, jer broj izvedenih eksperimenata premašuje 30. Dakle: 90/10 = 9. Dobili smo varijancu. Ako dobijete drugi broj, ne očajavajte. Najvjerojatnije ste napravili jednostavnu pogrešku u izračunima. Provjerite još jednom što ste napisali i vjerojatno će sve doći na svoje mjesto.

Na kraju, sjetite se formule za matematičko očekivanje. Nećemo dati sve izračune, samo ćemo napisati odgovor koji možete provjeriti nakon što prođete sve potrebne procedure. Očekivana vrijednost bit će 5,48. Prisjetimo se samo kako izvoditi operacije, na primjeru prvih elemenata: 0*0,02 + 1*0,1... i tako dalje. Kao što vidite, vrijednost ishoda jednostavno množimo s njegovom vjerojatnošću.

Odstupanje

Drugi koncept usko povezan s disperzijom i matematičkim očekivanjima je standardna devijacija. Označava se latiničnim slovima sd ili grčkim malim slovima "sigma". Ovaj koncept pokazuje koliko u prosjeku vrijednosti odstupaju od središnje značajke. Da biste pronašli njegovu vrijednost, morate izračunati kvadratni korijen varijance.

Ako iscrtate graf normalne distribucije i želite vidjeti kvadrat odstupanja izravno na njemu, to se može učiniti u nekoliko faza. Uzmite polovicu slike lijevo ili desno od načina (središnja vrijednost), nacrtajte okomito na vodoravnu os tako da su površine dobivenih figura jednake. Veličina segmenta između sredine distribucije i rezultirajuće projekcije na vodoravnu os predstavljat će standardnu ​​devijaciju.

Softver

Kao što je vidljivo iz opisa formula i prikazanih primjera, izračunavanje varijance i matematičkog očekivanja nije najjednostavniji postupak s aritmetičkog stajališta. Kako ne bismo gubili vrijeme, ima smisla koristiti program koji se koristi u visokoškolskim ustanovama - zove se "R". Ima funkcije koje vam omogućuju izračunavanje vrijednosti za mnoge pojmove iz statistike i teorije vjerojatnosti.

Na primjer, odredite vektor vrijednosti. To se radi na sljedeći način: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Konačno

Disperzija i matematičko očekivanje su bez kojih je teško bilo što izračunati u budućnosti. U glavnom kolegiju predavanja na sveučilištima oni se obrađuju već u prvim mjesecima studija predmeta. Upravo zbog nerazumijevanja ovih jednostavnih pojmova i nemogućnosti izračunavanja, mnogi studenti odmah počnu zaostajati u programu, a kasnije na kraju dobiju loše ocjene, zbog čega ostaju bez stipendija.

Vježbajte barem tjedan dana, pola sata dnevno, rješavati zadatke slične onima predstavljenima u ovom članku. Zatim, na bilo kojem ispitu iz teorije vjerojatnosti, moći ćete se nositi s primjerima bez suvišnih savjeta i varalica.

Glavni generalizirajući pokazatelji varijacije u statistici su disperzije i standardne devijacije.

Disperzija ovo aritmetička sredina kvadrat odstupanja svake karakteristične vrijednosti od ukupnog prosjeka. Varijanca se obično naziva srednji kvadrat odstupanja i označava se s  2. Ovisno o izvornim podacima, varijanca se može izračunati pomoću jednostavne ili ponderirane aritmetičke sredine:

 neponderirana (jednostavna) varijanca;

 ponderirana varijanca.

Standardna devijacija ovo je generalizirajuća karakteristika apsolutnih veličina varijacije znakovi u agregatu. Izražava se u istim mjernim jedinicama kao atribut (u metrima, tonama, postocima, hektarima itd.).

Standardna devijacija je kvadratni korijen varijance i označava se s :

 standardna devijacija neponderirana;

 ponderirana standardna devijacija.

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je standardna devijacija manja, aritmetička sredina bolje odražava cjelokupnu predstavljenu populaciju.

Izračunu standardne devijacije prethodi izračun varijance.

Postupak za izračunavanje ponderirane varijance je sljedeći:

1) odredite ponderiranu aritmetičku sredinu:

2) izračunajte odstupanja opcija od prosjeka:

3) kvadrirajte odstupanje svake opcije od prosjeka:

4) pomnožite kvadrate odstupanja s težinama (frekvencijama):

5) sažeti dobivene produkte:

6) dobiveni iznos se dijeli sa zbrojem težina:

Primjer 2.1

Izračunajmo ponderiranu aritmetičku sredinu:

Vrijednosti odstupanja od srednje vrijednosti i njihovi kvadrati prikazani su u tablici. Definirajmo varijancu:

Standardna devijacija će biti jednaka:

Ako su izvorni podaci prikazani u obliku intervala serija distribucije , tada prvo treba odrediti diskretnu vrijednost atributa, a zatim primijeniti opisanu metodu.

Primjer 2.2

Pokažimo izračun varijance za intervalnu seriju koristeći podatke o raspodjeli sjetvene površine kolektivne farme prema prinosu pšenice.

Aritmetička sredina je:

Izračunajmo varijancu:

6.3. Izračun varijance pomoću formule na temelju pojedinačnih podataka

Tehnika proračuna odstupanja složen, a s velikim vrijednostima opcija i frekvencija može biti glomazan. Proračuni se mogu pojednostaviti korištenjem svojstava disperzije.

Disperzija ima sljedeća svojstva.

1. Smanjenje ili povećanje težine (frekvencije) varirajuće karakteristike za određeni broj puta ne mijenja disperziju.

2. Smanjenje ili povećanje svake vrijednosti karakteristike za isti konstantni iznos A ne mijenja disperziju.

3. Svaku vrijednost karakteristike smanjite ili povećajte za određeni broj puta k odnosno smanjuje ili povećava varijancu u k 2 puta standardna devijacija  u k jednom.

4. Disperzija karakteristike u odnosu na proizvoljnu vrijednost uvijek je veća od disperzije u odnosu na aritmetičku sredinu po kvadratu razlike između prosječne i proizvoljne vrijednosti:

Ako A 0, tada dolazimo do jednakosti:

odnosno varijanca karakteristike jednaka je razlici između srednjeg kvadrata karakterističnih vrijednosti i kvadrata srednje vrijednosti.

Svako se svojstvo može koristiti samostalno ili u kombinaciji s drugima pri izračunu varijance.

Postupak za izračunavanje varijance je jednostavan:

1) odrediti aritmetička sredina :

2) kvadrirajte aritmetičku sredinu:

3) kvadrirajte odstupanje svake varijante serije:

x ja 2 .

4) pronađite zbroj kvadrata opcija:

5) podijelite zbroj kvadrata opcija s njihovim brojem, tj. odredite prosječni kvadrat:

6) odrediti razliku između srednjeg kvadrata karakteristike i kvadrata srednje vrijednosti:

Primjer 3.1 O produktivnosti radnika dostupni su sljedeći podaci:

Napravimo sljedeće izračune: