Biografije Karakteristike Analiza

Mere disperzije. Izračunavanje grupne, međugrupne i ukupne varijanse (prema pravilu sabiranja varijanse)

Za grupisane podatke rezidualna disperzija- prosjek unutargrupnih disperzija:

Gdje je σ 2 j unutargrupna varijansa j -te grupe.

Za negrupisane podatke rezidualna disperzija je mjera tačnosti aproksimacije, tj. aproksimacija linije regresije originalnim podacima:
gdje je y(t) prognoza prema jednadžbi trenda; y t – početni niz dinamike; n je broj bodova; p je broj koeficijenata regresione jednadžbe (broj varijabli koje objašnjavaju).
U ovom primjeru se zove nepristrasna procjena varijanse.

Primjer #1. Raspodjelu radnika tri preduzeća jednog udruženja po tarifnim kategorijama karakterišu sljedeći podaci:

Kategorija plate radnikaBroj radnika u preduzeću
preduzeće 1preduzeće 2preduzeće 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

definirati:
1. disperzija za svako preduzeće (unutargrupna disperzija);
2. prosjek unutargrupnih disperzija;
3. međugrupna disperzija;
4. ukupna varijansa.

Odluka.
Prije nego što se pristupi rješavanju problema, potrebno je utvrditi koja je karakteristika efektivna, a koja faktorijalna. U primjeru koji se razmatra, efektivna karakteristika je "Tarifna kategorija", a faktorska karakteristika je "Broj (naziv) preduzeća".
Tada imamo tri grupe (preduzeća) za koje je potrebno izračunati grupni prosjek i unutargrupne varijanse:


Kompanijaprosek grupe,varijansa unutar grupe,
1 4 1,8

Prosek varijansi unutar grupe ( rezidualna disperzija) izračunato po formuli:


gdje možete izračunati:
ili:


onda:
Ukupna disperzija bit će jednaka: s 2 = 1,6 + 0 = 1,6.
Ukupna varijansa se također može izračunati korištenjem jedne od sljedeće dvije formule:

Prilikom rješavanja praktičnih problema često se mora suočiti sa znakom koji ima samo dvije alternativne vrijednosti. U ovom slučaju se ne govori o težini određene vrijednosti neke karakteristike, već o njenom udjelu u agregatu. Ako se udio populacijskih jedinica koje imaju osobinu koja se proučava označava sa " R", a ne posjedovanje - kroz" q“, tada se disperzija može izračunati po formuli:
s 2 = p×q

Primjer #2. Na osnovu podataka o učinku šest radnika brigade utvrditi međugrupnu varijansu i procijeniti uticaj radne smjene na njihovu produktivnost rada ako je ukupna varijansa 12,2.

br. radne brigadeRadni učinak, kom.
u prvoj smjeniu 2. smjeni
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Odluka. Početni podaci

Xf1f2f 3f4f5f6Ukupno
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Ukupno 31 33 37 37 40 38

Tada imamo 6 grupa za koje je potrebno izračunati grupnu srednju vrijednost i unutargrupne varijanse.
1. Pronađite prosječne vrijednosti svake grupe.







2. Pronađite srednji kvadrat svake grupe.







Rezultate proračuna sumiramo u tabeli:
Broj grupeGrupni prosjekUnutargrupna varijansa
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Unutargrupna varijansa karakteriše promjenu (varijaciju) proučavane (rezultirajuće) osobine unutar grupe pod uticajem svih faktora, osim faktora koji leži u osnovi grupisanja:
Izračunavamo prosjek unutargrupnih disperzija koristeći formulu:


4. Međugrupna varijansa karakteriše promjenu (varijaciju) proučavane (rezultirajuće) osobine pod utjecajem faktora (faktorske osobine) koji leži u osnovi grupisanja.
Međugrupna disperzija se definiše kao:

gdje


Onda

Ukupna varijansa karakteriše promjenu (varijaciju) proučavane (rezultirajuće) osobine pod utjecajem svih faktora (faktorskih osobina) bez izuzetka. Po uslovu zadatka jednak je 12,2.
Empirijska korelacija mjeri koliko je ukupne fluktuacije rezultirajućeg atributa uzrokovano proučavanim faktorom. Ovo je omjer faktorske varijanse i ukupne varijanse:

Određujemo empirijsku korelaciju:

Odnosi između karakteristika mogu biti slabe ili jake (bliske). Njihovi kriterijumi se vrednuju na Chaddock skali:
0,1 0,3 0,5 0,7 0,9 U našem primjeru, odnos između faktora Y karakteristike X je slab
Koeficijent determinacije.

Definirajmo koeficijent determinacije:

Dakle, 0,67% varijacije je zbog razlika između osobina, a 99,37% zbog drugih faktora.
Zaključak: u ovom slučaju učinak radnika ne zavisi od rada u određenoj smjeni, tj. uticaj radne smjene na njihovu produktivnost rada nije značajan i uzrokovan je drugim faktorima.

Primjer #3. Na osnovu podataka o prosječnoj plati i kvadrata odstupanja od njene vrijednosti za dvije grupe radnika, pronađite ukupnu varijansu primjenom pravila dodavanja varijanse:

Odluka:
Prosjek varijansi unutar grupe

Međugrupna disperzija se definiše kao:


Ukupna varijansa će biti: 480 + 13824 = 14304

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge zadatke za njeno pronalaženje

Primjer 1. Određivanje grupe, prosjeka grupe, između grupe i ukupne varijanse

Primjer 2. Pronalaženje varijanse i koeficijenta varijacije u tabeli grupisanja

Primjer 3. Pronalaženje varijanse u diskretnom nizu

Primjer 4. Za grupu od 20 dopisnih studenata imamo sljedeće podatke. Potrebno je izgraditi intervalnu seriju distribucije obeležja, izračunati srednju vrednost obeležja i proučiti njegovu varijansu

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala po formuli:

gdje je X max maksimalna vrijednost obilježja grupisanja;
X min je minimalna vrijednost obilježja grupisanja;
n je broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159) / 5 = 6,6

Napravimo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X "i - sredina intervala. (na primjer, sredina intervala 159 - 165,6 \u003d 162,3)

Prosječan rast učenika određen je formulom aritmetičkog ponderisanog prosjeka:

Određujemo disperziju po formuli:

Formula se može pretvoriti na sljedeći način:

Iz ove formule slijedi da varijansa je razlika između srednje vrijednosti kvadrata opcija i kvadrata i srednje vrijednosti.

Varijanca u serijama varijacija sa jednakim intervalima prema metodi momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Definicija varijanse, izračunato metodom momenata, prema sljedećoj formuli je manje dugotrajno:

gdje je i vrijednost intervala;
A - uslovna nula, što je pogodno za korištenje sredine intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

Varijanca karakteristika (ako se u statističkoj populaciji atribut mijenja na način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati po formuli:

Zamjenom u ovoj formuli disperzije q = 1- p, dobijamo:

Vrste disperzije

Ukupna varijansa mjeri varijaciju osobine u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti obilježja x od ukupne srednje vrijednosti x i može se definirati kao jednostavna varijansa ili ponderirana varijansa.

Unutargrupna varijansa karakterizira slučajnu varijaciju, tj. dio varijacije, koji je posljedica utjecaja neuračunatih faktora i ne zavisi od faktora znaka koji leži u osnovi grupisanja. Takva varijansa je jednaka srednjem kvadratu odstupanja pojedinačnih vrijednosti obilježja unutar X grupe od aritmetičke sredine grupe i može se izračunati kao prosta varijansa ili kao ponderisana varijansa.



dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi - prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radnji pokazuju varijacije u proizvodnji u svakoj grupi uzrokovane svim mogućim faktorima (tehničko stanje opreme, dostupnost alata i materijala, starost radnika, intenzitet rada itd.), osim razlika u kvalifikacionoj kategoriji (unutar grupe svi radnici imaju istu kvalifikaciju).

Matematičko očekivanje i varijansa su najčešće korištene numeričke karakteristike slučajne varijable. Oni karakterišu najvažnije karakteristike distribucije: njen položaj i stepen disperzije. U mnogim problemima prakse, potpun, iscrpan opis slučajne varijable - zakona raspodjele - ili se uopće ne može dobiti, ili uopće nije potreban. U ovim slučajevima, oni su ograničeni na približan opis slučajne varijable koristeći numeričke karakteristike.

Matematičko očekivanje se često naziva jednostavno kao prosječna vrijednost slučajne varijable. Disperzija slučajne varijable je karakteristika disperzije, disperzija slučajne varijable oko njenog matematičkog očekivanja.

Matematičko očekivanje diskretne slučajne varijable

Pristupimo konceptu matematičkog očekivanja, prvo polazeći od mehaničke interpretacije distribucije diskretne slučajne varijable. Neka je jedinična masa raspoređena između tačaka x-ose x1 , x 2 , ..., x n, a svaka materijalna tačka ima masu koja joj odgovara iz str1 , str 2 , ..., str n. Potrebno je izabrati jednu tačku na x-osi, koja karakteriše položaj čitavog sistema materijalnih tačaka, uzimajući u obzir njihove mase. Prirodno je kao takvu tačku uzeti centar mase sistema materijalnih tačaka. Ovo je ponderisani prosjek slučajne varijable X, u kojoj je apscisa svake tačke xi ulazi sa "težinom" jednakom odgovarajućoj vjerovatnoći. Srednja vrijednost tako dobijene slučajne varijable X naziva se njeno matematičko očekivanje.

Matematičko očekivanje diskretne slučajne varijable je zbir proizvoda svih mogućih vrijednosti i vjerovatnoća ovih vrijednosti:

Primjer 1 Organizirana je dobitna lutrija. Ima 1000 dobitaka, od kojih je 400 po 10 rubalja. 300 - 20 rubalja svaki 200 - 100 rubalja svaki. i po 100 - 200 rubalja. Koliki je prosječan dobitak za osobu koja kupi jednu kartu?

Odluka. Prosječan dobitak ćemo pronaći ako se ukupan iznos dobitka, koji je jednak 10*400 + 20*300 + 100*200 + 200*100 = 50.000 rubalja, podijeli sa 1000 (ukupan iznos dobitka). Tada dobijamo 50000/1000 = 50 rubalja. Ali izraz za izračunavanje prosječnog dobitka također se može predstaviti u sljedećem obliku:

S druge strane, pod ovim uvjetima, iznos dobitka je slučajna varijabla koja može poprimiti vrijednosti od 10, 20, 100 i 200 rubalja. sa vjerovatnoćama jednakim 0,4, respektivno; 0,3; 0,2; 0.1. Stoga je očekivana prosječna isplata jednaka zbiru proizvoda veličine isplata i vjerovatnoće njihovog primanja.

Primjer 2 Izdavač je odlučio da objavi novu knjigu. Knjigu će prodati za 280 rubalja, od čega će 200 dobiti njemu, 50 knjižari, a 30 autoru. Tabela daje informacije o cijeni izdavanja knjige i vjerovatnoći prodaje određenog broja primjeraka knjige.

Pronađite očekivani profit izdavača.

Odluka. Slučajna varijabla "profit" jednaka je razlici između prihoda od prodaje i troška troškova. Na primjer, ako se proda 500 primjeraka knjige, tada je prihod od prodaje 200 * 500 = 100.000, a trošak izdavanja 225.000 rubalja. Tako se izdavač suočava sa gubitkom od 125.000 rubalja. Sljedeća tabela sumira očekivane vrijednosti slučajne varijable - profit:

BrojProfit xi Vjerovatnoća stri xi str i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Ukupno: 1,00 25000

Tako dobijamo matematičko očekivanje profita izdavača:

.

Primjer 3Šansa za pogodak jednim udarcem str= 0,2. Odredite potrošnju školjki koje daju matematičko očekivanje broja pogodaka jednakog 5.

Odluka. Iz iste formule očekivanja koju smo do sada koristili izražavamo x- potrošnja školjki:

.

Primjer 4 Odredite matematičko očekivanje slučajne varijable x broj pogodaka sa tri hica, ako je vjerovatnoća pogađanja sa svakim udarcem str = 0,4 .

Savjet: pronađite vjerovatnoću vrijednosti slučajne varijable po Bernulijeva formula .

Expectation Properties

Razmotrite svojstva matematičkog očekivanja.

Nekretnina 1. Matematičko očekivanje konstantne vrijednosti jednako je ovoj konstanti:

Nekretnina 2. Konstantni faktor se može izvaditi iz predznaka očekivanja:

Nekretnina 3. Matematičko očekivanje sume (razlike) slučajnih varijabli jednako je zbiru (razlici) njihovih matematičkih očekivanja:

Nekretnina 4. Matematičko očekivanje proizvoda slučajnih varijabli jednako je proizvodu njihovih matematičkih očekivanja:

Svojstvo 5. Ako su sve vrijednosti slučajne varijable X smanjiti (povećati) za isti broj With, tada će se njegovo matematičko očekivanje smanjiti (povećati) za isti broj:

Kada ne možete biti ograničeni samo na matematička očekivanja

U većini slučajeva, samo matematičko očekivanje ne može adekvatno okarakterizirati slučajnu varijablu.

Neka slučajne varijable X i Y dati su sljedećim zakonima o distribuciji:

Značenje X Vjerovatnoća
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Značenje Y Vjerovatnoća
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Matematička očekivanja ovih veličina su ista - jednaka nuli:

Međutim, njihova distribucija je drugačija. Slučajna vrijednost X može uzeti samo vrijednosti koje se malo razlikuju od matematičkog očekivanja i slučajne varijable Y može uzeti vrijednosti koje značajno odstupaju od matematičkog očekivanja. Sličan primjer: prosječna plata ne omogućava procjenu omjera visoko i nisko plaćenih radnika. Drugim riječima, prema matematičkom očekivanju ne može se suditi kakva su odstupanja od njega, barem u prosjeku, moguća. Da biste to učinili, morate pronaći varijansu slučajne varijable.

Disperzija diskretne slučajne varijable

disperzija diskretna slučajna varijabla X naziva se matematičko očekivanje kvadrata njegovog odstupanja od matematičkog očekivanja:

Standardna devijacija slučajne varijable X je aritmetička vrijednost kvadratnog korijena njegove varijanse:

.

Primjer 5 Izračunajte varijanse i standardne devijacije slučajnih varijabli X i Y, čiji su zakoni distribucije dati u gornjim tabelama.

Odluka. Matematička očekivanja slučajnih varijabli X i Y, kao što je gore utvrđeno, jednaki su nuli. Prema formuli disperzije za E(X)=E(y)=0 dobijamo:

Zatim standardne devijacije slučajnih varijabli X i Y konstituisati

.

Dakle, sa istim matematičkim očekivanjima, varijansa slučajne varijable X veoma mali i nasumični Y- značajno. To je posljedica razlike u njihovoj distribuciji.

Primjer 6 Investitor ima 4 alternativna investiciona projekta. U tabeli su sumirani podaci o očekivanoj dobiti u ovim projektima sa odgovarajućom vjerovatnoćom.

Projekat 1Projekat 2Projekat 3Projekat 4
500, P=1 1000, P=0,5 500, P=0,5 500, P=0,5
0, P=0,5 1000, P=0,25 10500, P=0,25
0, P=0,25 9500, P=0,25

Pronađite za svaku alternativu matematičko očekivanje, varijansu i standardnu ​​devijaciju.

Odluka. Hajde da pokažemo kako se ove količine izračunavaju za 3. alternativu:

Tabela sažima pronađene vrijednosti za sve alternative.

Sve alternative imaju ista matematička očekivanja. To znači da na duge staze svi imaju ista primanja. Standardna devijacija se može tumačiti kao mjera rizika – što je veća, veći je rizik ulaganja. Investitor koji ne želi mnogo rizika će izabrati projekat 1 jer ima najmanju standardnu ​​devijaciju (0). Ako investitor preferira rizik i visoke prinose u kratkom periodu, tada će izabrati projekat sa najvećom standardnom devijacijom - projekat 4.

Svojstva disperzije

Predstavimo svojstva disperzije.

Nekretnina 1. Disperzija konstantne vrijednosti je nula:

Nekretnina 2. Konstantni faktor se može izvaditi iz znaka disperzije kvadriranjem:

.

Nekretnina 3. Varijanca slučajne varijable jednaka je matematičkom očekivanju kvadrata ove vrijednosti, od čega se oduzima kvadrat matematičkog očekivanja same vrijednosti:

,

gdje .

Nekretnina 4. Varijanca sume (razlike) slučajnih varijabli jednaka je zbiru (razlici) njihovih varijansi:

Primjer 7 Poznato je da je diskretna slučajna varijabla X uzima samo dvije vrijednosti: −3 i 7. Osim toga, poznato je matematičko očekivanje: E(X) = 4 . Pronađite varijansu diskretne slučajne varijable.

Odluka. Označiti sa str vjerovatnoća sa kojom slučajna varijabla poprima vrijednost x1 = −3 . Zatim vjerovatnoća vrijednosti x2 = 7 bit će 1 − str. Izvedemo jednačinu za matematičko očekivanje:

E(X) = x 1 str + x 2 (1 − str) = −3str + 7(1 − str) = 4 ,

odakle dobijamo vjerovatnoce: str= 0,3 i 1 − str = 0,7 .

Zakon distribucije slučajne varijable:

X −3 7
str 0,3 0,7

Izračunavamo varijansu ove slučajne varijable koristeći formulu iz svojstva 3 varijanse:

D(X) = 2,7 + 34,3 − 16 = 21 .

Pronađite sami matematičko očekivanje slučajne varijable, a zatim pogledajte rješenje

Primjer 8 Diskretna slučajna varijabla X uzima samo dvije vrijednosti. Uzima veću vrijednost od 3 sa vjerovatnoćom od 0,4. Osim toga, poznata je varijansa slučajne varijable D(X) = 6 . Pronađite matematičko očekivanje slučajne varijable.

Primjer 9 Urna sadrži 6 bijelih i 4 crne kuglice. Iz urne se uzimaju 3 kuglice. Broj bijelih loptica među izvučenim kuglicama je diskretna slučajna varijabla X. Pronađite matematičko očekivanje i varijansu ove slučajne varijable.

Odluka. Slučajna vrijednost X može uzeti vrijednosti 0, 1, 2, 3. Odgovarajuće vjerovatnoće se mogu izračunati iz pravilo množenja vjerovatnoća. Zakon distribucije slučajne varijable:

X 0 1 2 3
str 1/30 3/10 1/2 1/6

Otuda matematičko očekivanje ove slučajne varijable:

M(X) = 3/10 + 1 + 1/2 = 1,8 .

Varijanca date slučajne varijable je:

D(X) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Matematičko očekivanje i disperzija kontinuirane slučajne varijable

Za kontinuiranu slučajnu varijablu, mehanička interpretacija matematičkog očekivanja zadržat će isto značenje: centar mase za jediničnu masu raspoređenu kontinuirano na x-osu s gustinom f(x). Za razliku od diskretne slučajne varijable, za koju je argument funkcije xi mijenja se naglo, za kontinuiranu slučajnu varijablu, argument se kontinuirano mijenja. Ali matematičko očekivanje kontinuirane slučajne varijable također je povezano s njenom srednjom vrijednošću.

Da biste pronašli matematičko očekivanje i varijansu kontinuirane slučajne varijable, morate pronaći određene integrale . Ako je data funkcija gustoće kontinuirane slučajne varijable, ona ulazi direktno u integrand. Ako je data funkcija distribucije vjerovatnoće, onda je diferenciranjem potrebno pronaći funkciju gustoće.

Aritmetički prosjek svih mogućih vrijednosti kontinuirane slučajne varijable naziva se njegova matematičko očekivanje, označeno sa ili .

Disperzija slučajne varijable je mjera širenja vrijednosti ove varijable. Mala varijansa znači da su vrijednosti grupisane blizu jedna drugoj. Velika varijansa ukazuje na snažno raspršivanje vrijednosti. U statistici se koristi koncept disperzije slučajne varijable. Na primjer, ako uporedite varijansu vrijednosti dvije veličine (kao što su rezultati opservacija pacijenata muškog i ženskog pola), možete testirati značaj neke varijable. Varijanca se takođe koristi pri izgradnji statističkih modela, jer mala varijansa može biti znak da preterujete vrednosti.

Koraci

Izračun varijance uzorka

  1. Zabilježite vrijednosti uzorka. U većini slučajeva statističarima su dostupni samo uzorci određenih populacija. Na primjer, statističari po pravilu ne analiziraju troškove održavanja populacije svih automobila u Rusiji - oni analiziraju slučajni uzorak od nekoliko hiljada automobila. Takav uzorak pomoći će u određivanju prosječne cijene po automobilu, ali najvjerovatnije će rezultirajuća vrijednost biti daleko od stvarne.

    • Na primjer, hajde da analiziramo broj peciva prodanih u kafiću u 6 dana, uzetih nasumično. Uzorak ima sljedeći oblik: 17, 15, 23, 7, 9, 13. Ovo je uzorak, a ne populacija, jer nemamo podatke o prodatim pecivama za svaki dan rada kafića.
    • Ako vam je data populacija, a ne uzorak vrijednosti, pređite na sljedeći odjeljak.
  2. Zapišite formulu za izračunavanje varijanse uzorka. Disperzija je mjera širenja vrijednosti neke veličine. Što je vrijednost disperzije bliža nuli, to su vrijednosti bliže grupisane. Kada radite s uzorkom vrijednosti, koristite sljedeću formulu za izračunavanje varijanse:

    • s 2 (\displaystyle s^(2)) = ∑[(x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2)) je disperzija. Disperzija se mjeri u kvadratnim jedinicama.
    • x i (\displaystyle x_(i))- svaku vrijednost u uzorku.
    • x i (\displaystyle x_(i)) trebate oduzeti x̅, kvadrirati ga, a zatim dodati rezultate.
    • x̅ – srednja vrijednost uzorka (srednja vrijednost uzorka).
    • n je broj vrijednosti u uzorku.
  3. Izračunajte srednju vrijednost uzorka. Označava se kao x̅. Srednja vrijednost uzorka se izračunava kao normalna aritmetička sredina: zbrojite sve vrijednosti u uzorku, a zatim podijelite rezultat s brojem vrijednosti u uzorku.

    • U našem primjeru dodajte vrijednosti u uzorku: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Sada podijelite rezultat s brojem vrijednosti u uzorku (u našem primjeru ima 6): 84 ÷ 6 = 14.
      Srednja vrijednost uzorka x̅ = 14.
    • Srednja vrijednost uzorka je središnja vrijednost oko koje se distribuiraju vrijednosti u uzorku. Ako se vrijednosti u uzorku grupišu oko srednje vrijednosti uzorka, tada je varijansa mala; inače, disperzija je velika.
  4. Oduzmite srednju vrijednost uzorka od svake vrijednosti u uzorku. Sada izračunajte razliku x i (\displaystyle x_(i))- x̅, gdje x i (\displaystyle x_(i))- svaku vrijednost u uzorku. Svaki dobiveni rezultat pokazuje u kojoj mjeri određena vrijednost odstupa od srednje vrijednosti uzorka, odnosno koliko je ta vrijednost udaljena od srednje vrijednosti uzorka.

    • U našem primjeru:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x 6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • Ispravnost dobijenih rezultata je lako provjeriti, jer njihov zbir mora biti jednak nuli. Ovo se odnosi na određivanje prosječne vrijednosti, budući da su negativne vrijednosti (udaljenosti od prosječne vrijednosti do manjih vrijednosti) u potpunosti nadoknađene pozitivnim vrijednostima (udaljenosti od prosječne vrijednosti do većih vrijednosti).
  5. Kao što je gore navedeno, zbir razlika x i (\displaystyle x_(i))- x̅ mora biti jednako nuli. To znači da je srednja varijansa uvijek nula, što ne daje nikakvu predstavu o širenju vrijednosti neke veličine. Da biste riješili ovaj problem, kvadrirajte svaku razliku x i (\displaystyle x_(i))- x̅. Ovo će rezultirati time da dobijete samo pozitivne brojeve koji, kada se zbroje, nikada neće dati 0.

    • U našem primjeru:
      (x 1 (\displaystyle x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Našli ste kvadrat razlike - x̅) 2 (\displaystyle ^(2)) za svaku vrijednost u uzorku.
  6. Izračunajte zbir kvadrata razlika. Odnosno, pronađite dio formule koji je napisan ovako: ∑[( x i (\displaystyle x_(i))-x̅) 2 (\displaystyle ^(2))]. Ovdje znak Σ označava zbir kvadrata razlika za svaku vrijednost x i (\displaystyle x_(i)) u uzorku. Već ste pronašli kvadratne razlike (x i (\displaystyle (x_(i))-x̅) 2 (\displaystyle ^(2)) za svaku vrijednost x i (\displaystyle x_(i)) u uzorku; sada samo dodajte ove kvadrate.

    • U našem primjeru: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Podijelite rezultat sa n - 1, gdje je n broj vrijednosti u uzorku. Prije nekog vremena, da bi izračunali varijansu uzorka, statističari su jednostavno podijelili rezultat sa n; u ovom slučaju, dobićete srednju vrednost kvadratne varijanse, koja je idealna za opisivanje varijanse datog uzorka. Ali zapamtite da je svaki uzorak samo mali dio opće populacije vrijednosti. Ako uzmete drugačiji uzorak i izvršite iste proračune, dobit ćete drugačiji rezultat. Kako se ispostavilo, dijeljenje sa n - 1 (a ne samo sa n) daje bolju procjenu varijanse populacije, što je ono što tražite. Dijeljenje sa n - 1 postalo je uobičajeno, pa je uključeno u formulu za izračunavanje varijanse uzorka.

    • U našem primjeru uzorak uključuje 6 vrijednosti, odnosno n = 6.
      Varijanca uzorka = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. Razlika između varijanse i standardne devijacije. Imajte na umu da formula sadrži eksponent, pa se varijansa mjeri u kvadratnim jedinicama analizirane vrijednosti. Ponekad je takvom vrijednošću prilično teško upravljati; u takvim slučajevima se koristi standardna devijacija, koja je jednaka kvadratnom korijenu varijanse. Zbog toga se varijansa uzorka označava kao s 2 (\displaystyle s^(2)), i standardna devijacija uzorka kao s (\displaystyle s).

    • U našem primjeru, standardna devijacija uzorka je: s = √33,2 = 5,76.

    Proračun varijanse stanovništva

    1. Analizirajte neki skup vrijednosti. Skup uključuje sve vrijednosti količine koja se razmatra. Na primjer, ako proučavate starost stanovnika Lenjingradske regije, tada populacija uključuje starost svih stanovnika ove regije. U slučaju rada sa agregatom, preporučuje se kreiranje tabele i unos vrednosti agregata u nju. Razmotrite sljedeći primjer:

      • U jednoj prostoriji se nalazi 6 akvarijuma. Svaki akvarij sadrži sljedeći broj riba:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Zapišite formulu za izračunavanje varijanse stanovništva. Budući da populacija uključuje sve vrijednosti određene količine, sljedeća formula vam omogućava da dobijete točnu vrijednost varijanse populacije. Da bi razlikovali varijansu populacije od varijance uzorka (koja je samo procjena), statističari koriste različite varijable:

      • σ 2 (\displaystyle ^(2)) = (∑(x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n
      • σ 2 (\displaystyle ^(2))- varijansa stanovništva (čita se kao "sigma na kvadrat"). Disperzija se mjeri u kvadratnim jedinicama.
      • x i (\displaystyle x_(i))- svaka vrijednost u agregatu.
      • Σ je predznak zbira. Odnosno, za svaku vrijednost x i (\displaystyle x_(i)) oduzmite μ, kvadratirajte ga, a zatim dodajte rezultate.
      • μ je srednja vrijednost populacije.
      • n je broj vrijednosti u općoj populaciji.
    3. Izračunajte srednju vrijednost stanovništva. Kada se radi sa opštom populacijom, njena prosečna vrednost se označava kao μ (mu). Srednja populacija se izračunava kao uobičajena aritmetička sredina: zbrojite sve vrijednosti u populaciji, a zatim podijelite rezultat s brojem vrijednosti u populaciji.

      • Imajte na umu da se prosjeci ne računaju uvijek kao aritmetička sredina.
      • U našem primjeru, populacija znači: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Oduzmite srednju vrijednost populacije od svake vrijednosti u populaciji.Što je vrijednost razlike bliža nuli, to je određena vrijednost bliža srednjoj vrijednosti stanovništva. Pronađite razliku između svake vrijednosti u populaciji i njene srednje vrijednosti, i dobićete prvi pogled na distribuciju vrijednosti.

      • U našem primjeru:
        x 1 (\displaystyle x_(1))- μ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- μ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- μ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- μ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- μ = 15 - 10,5 = 4,5
        x 6 (\displaystyle x_(6))- μ = 18 - 10,5 = 7,5
    5. Kvadrirajte svaki rezultat koji dobijete. Vrijednosti razlike bit će i pozitivne i negativne; ako ove vrijednosti stavite na brojevnu pravu, onda će ležati desno i lijevo od srednje vrijednosti populacije. Ovo nije dobro za izračunavanje varijanse, jer se pozitivni i negativni brojevi međusobno poništavaju. Stoga kvadrirajte svaku razliku da dobijete isključivo pozitivne brojeve.

      • U našem primjeru:
        (x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) za svaku populacijsku vrijednost (od i = 1 do i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), gdje x n (\displaystyle x_(n)) je posljednja vrijednost u populaciji.
      • Da biste izračunali prosječnu vrijednost dobijenih rezultata, potrebno je pronaći njihov zbir i podijeliti ga sa n: (( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x n (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2))) / n
      • Sada napišimo gornje objašnjenje koristeći varijable: (∑( x i (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n i dobijemo formulu za izračunavanje varijanse populacije.

Disperzija u statistici nalazi se kao pojedinačne vrijednosti obilježja u kvadratu od . Ovisno o početnim podacima, određuje se jednostavnim i ponderiranim formulama varijanse:

1. (za negrupirane podatke) se izračunava po formuli:

2. Ponderirana varijansa (za seriju varijacija):

gdje je n frekvencija (faktor ponovljivosti X)

Primjer pronalaženja varijanse

Ova stranica opisuje standardni primjer pronalaženja varijanse, možete pogledati i druge zadatke za njeno pronalaženje

Primjer 1. Za grupu od 20 dopisnih studenata imamo sljedeće podatke. Potrebno je izgraditi intervalnu seriju distribucije obeležja, izračunati srednju vrednost obeležja i proučiti njegovu varijansu

Hajde da napravimo intervalno grupisanje. Odredimo raspon intervala po formuli:

gdje je X max maksimalna vrijednost obilježja grupisanja;
X min je minimalna vrijednost obilježja grupisanja;
n je broj intervala:

Prihvatamo n=5. Korak je: h = (192 - 159) / 5 = 6,6

Napravimo intervalno grupiranje

Za dalje proračune napravićemo pomoćnu tabelu:

X'i je sredina intervala. (na primjer, sredina intervala 159 - 165,6 = 162,3)

Prosječan rast učenika određen je formulom aritmetičkog ponderisanog prosjeka:

Određujemo disperziju po formuli:

Formula varijanse se može pretvoriti na sljedeći način:

Iz ove formule slijedi da varijansa je razlika između srednje vrijednosti kvadrata opcija i kvadrata i srednje vrijednosti.

Varijanca u serijama varijacija sa jednakim intervalima prema metodi momenata može se izračunati na sljedeći način koristeći drugo svojstvo disperzije (dijeleći sve opcije vrijednošću intervala). Definicija varijanse, izračunato metodom momenata, prema sljedećoj formuli je manje dugotrajno:

gdje je i vrijednost intervala;
A - uslovna nula, što je pogodno za korištenje sredine intervala s najvećom frekvencijom;
m1 je kvadrat momenta prvog reda;
m2 - trenutak drugog reda

(ako se u statističkoj populaciji atribut mijenja na način da postoje samo dvije međusobno isključive opcije, tada se takva varijabilnost naziva alternativa) može se izračunati po formuli:

Zamjenom u ovoj formuli disperzije q = 1- p, dobijamo:

Vrste disperzije

Ukupna varijansa mjeri varijaciju osobine u cijeloj populaciji kao cjelini pod utjecajem svih faktora koji uzrokuju ovu varijaciju. Jednaka je srednjem kvadratu odstupanja pojedinačnih vrijednosti obilježja x od ukupne srednje vrijednosti x i može se definirati kao jednostavna varijansa ili ponderirana varijansa.

karakterizira slučajnu varijaciju, tj. dio varijacije, koji je posljedica utjecaja neuračunatih faktora i ne zavisi od faktora znaka koji leži u osnovi grupisanja. Takva varijansa je jednaka srednjem kvadratu odstupanja pojedinačnih vrijednosti obilježja unutar X grupe od aritmetičke sredine grupe i može se izračunati kao prosta varijansa ili kao ponderisana varijansa.

dakle, mjere varijance unutar grupe varijacija osobine unutar grupe i određena je formulom:

gdje je xi - prosjek grupe;
ni je broj jedinica u grupi.

Na primjer, unutargrupne varijanse koje je potrebno utvrditi u zadatku proučavanja uticaja kvalifikacija radnika na nivo produktivnosti rada u radnji pokazuju varijacije u proizvodnji u svakoj grupi uzrokovane svim mogućim faktorima (tehničko stanje opreme, dostupnost alata i materijala, starost radnika, intenzitet rada itd.), osim razlika u kvalifikacionoj kategoriji (unutar grupe svi radnici imaju istu kvalifikaciju).

Prosjek varijansi unutar grupe odražava slučajni, odnosno onaj dio varijacije koji je nastao pod utjecajem svih ostalih faktora, osim faktora grupisanja. Izračunava se po formuli:

Karakteriše sistematsku varijaciju rezultujuće osobine, koja je posledica uticaja faktora osobine koji leži u osnovi grupisanja. Ona je jednaka srednjem kvadratu odstupanja srednjih vrednosti grupe od ukupne srednje vrednosti. Međugrupna varijansa se izračunava po formuli:

Pravilo dodavanja varijanse u statistici

Prema pravilo dodavanja varijanse ukupna varijansa je jednaka zbroju prosjeka unutargrupnih i međugrupnih varijansi:

Značenje ovog pravila je da je ukupna varijansa koja nastaje pod uticajem svih faktora jednaka zbiru varijansi koje nastaju pod uticajem svih ostalih faktora, i varijanse koja nastaje usled faktora grupisanja.

Koristeći formulu za sabiranje varijansi, moguće je od dvije poznate varijanse odrediti treću nepoznatu, a također i procijeniti jačinu utjecaja atributa grupisanja.

Svojstva disperzije

1. Ako se sve vrijednosti atributa smanje (povećaju) za istu konstantnu vrijednost, tada se varijansa neće promijeniti od ovoga.
2. Ako se sve vrijednosti atributa smanje (povećaju) za isti broj puta n, tada će se varijansa shodno tome smanjiti (povećati) za n^2 puta.