Biografije Karakteristike Analiza

Univarijantna analiza tabele korelacije varijanse. Multivarijantna analiza varijanse i strukturno modeliranje jednačina

Jednofaktorski model disperzije ima oblik

gdje Xjj- vrijednost varijable koja se proučava, dobijena na z-nivo faktor (r = 1, 2,..., t) suma serijski broj (j- 1,2,..., P);/y - efekat zbog uticaja i-tog nivoa faktora; e^. - slučajna komponenta, odnosno poremećaj uzrokovan uticajem nekontrolisanih faktora, tj. varijacija varijable unutar jednog nivoa.

Ispod nivo faktora podrazumjeva se neka njegova mjera ili stanje, na primjer, količina unesenog đubriva, vrsta topljenja metala ili serijski broj dijelova itd.

Osnovni preduslovi za analizu varijanse.

1. Matematičko očekivanje perturbacije ? (/ - je nula za bilo koje i, one.

  • 2. Perturbacije su međusobno nezavisne.
  • 3. Disperzija perturbacije (ili varijable Xu) je konstantna za bilo koji ij> one.

4. Perturbacija e# (ili varijabla Xu) ima normalan zakon raspodjele N( 0; a 2).

Uticaj nivoa faktora može biti kao fiksno, ili sistematično(model I), i nasumično(model II).

Neka, na primjer, treba utvrditi da li postoje značajne razlike između serija proizvoda u pogledu nekog pokazatelja kvaliteta, tj. provjeriti utjecaj na kvalitetu jednog faktora - serije proizvoda. Ako su sve serije sirovina uključene u studiju, onda je uticaj nivoa takvog faktora sistematičan (model I), a nalazi su primenljivi samo na one pojedinačne serije koje su bile uključene u istraživanje; ako je uključen samo nasumično odabran dio serija, onda je utjecaj faktora slučajan (model II). U multifaktorskim kompleksima moguć je mješoviti model III, u kojem neki faktori imaju nasumične nivoe, dok su drugi fiksni.

Razmotrimo ovaj problem detaljnije. Neka bude t serije proizvoda. Od svake serije odabrane na odgovarajući način p L, p 2 ,p t proizvoda (radi jednostavnosti pretpostavljamo da u = n 2 =... = n t = n). Vrijednosti indeksa kvalitete ovih proizvoda predstavljamo u obliku matrice zapažanja


Potrebno je provjeriti značaj uticaja serija proizvoda na njihov kvalitet.

Ako pretpostavimo da su elementi redova matrice promatranja numeričke vrijednosti (realizacije) slučajnih varijabli X t , X 2 ,..., x t, izražavaju kvalitet proizvoda i imaju normalan zakon distribucije sa matematičkim očekivanjima, respektivno a v a 2 , ..., a t i jednake disperzije a 2 , tada dati zadatak svodi se na testiranje nulte hipoteze #0: a v = a 2l = ... = a t, sprovedena u analizi varijanse.

Označimo prosjek preko nekog indeksa zvjezdicom (ili tačkom) umjesto indeksa, tada prosjek kvalitet proizvoda i-te serije, odn prosek grupe za i-ti nivo faktora, poprima oblik

a ukupan prosek -

Razmotrimo zbir kvadrata odstupanja opažanja od ukupne srednje vrijednosti xn:

ili Q= Q+ Q2+ ?>z Posljednji pojam

budući da je zbir odstupanja vrijednosti varijable od njene srednje vrijednosti, tj. ? 1.g y - x) jednako je nuli. ) =x

Prvi pojam se može napisati kao

Kao rezultat, dobijamo sljedeći identitet:

t p. _

gdje Q=Y X [ x ij _ x ", I 2 - general, ili kompletan, zbir kvadrata odstupanja; 7=1

Q, - n^, gdje to jedan; k (n -1) - stepeni slobode ^ -distribucija, 5 i ja 7]- ^-Fišerov kriterijum. Primjer 6.1. Dvije stotine pretpostavki da faktor brzine prezentacije riječi utiče na performanse njihove reprodukcije (podaci u tabeli na slici 8.1). Redoslijed rješenja:

o Formulisanje hipoteza.

H 0: faktor brzine nije izraženiji od slučajnog; H 1: Faktor stope je izraženiji od slučajnog.

o Provjera pretpostavki: istraženi parametar normalno distribucija; uzorci nepovezano identično volumeni; mjerenja na skali omjera.

o Definicija empirijski kriterijum G EMF zasniva se na poređenju kvadrata zbira kolona sa zbirom kvadrata svih empirijskih vrijednosti. Svaka kolona predstavlja uzorak i odgovara određenoj gradaciji faktora brzine.

o Uvedene oznake:

P= 6 - broj zapažanja (redova)

to= 3 - broj faktora (barovi)

PC = 6-3 = 18 - ukupno individualne vrijednosti;

7 - indeks reda se mijenja od 1 do P(7 = 1, 2, ..., n)

i- indeks stupca se mijenja sa 1 na na (i= 1, 2, ..., k).

o Matematički proračuni(vidi sliku 6.1 6.2):

i = 1 7 = 1 p m kp^ u = 1)

Postoji 1 = 6 2 + sedam 2 + 6 2 + 5 2 + _ + 5 2 + 5 2 = 432; i 2 = - (34 2 + +29 2 + 23 2) = 421;

i 3^^ (34 + 29 + 23) 2 = 410,89; 3 ili 6

Rice. 6.1. Rezultati Fig. 6.2. Proračunske formule

analiza varijanse jednosmjerna analiza varijanse

o Kritična vrijednost^ kr se može dobiti pomoću funkcije

RDISP() za nivo značajnosti za a = 0,05 (0,01) i broj stepeni slobode to 1 = 3-1 = 2 i k (n -1) = 3 (6-1) \u003d 15. G 0u05 ~ 3,68 i G 0u01 ~ 6,36.

o Donošenje odluka. Zbog ¥ HMF> P 0? 01(6,89 > 6,36), nulta hipoteza H 0 odstupa na nivou značajnosti od 0,01.

o Formulisanje zaključaka. Razlike u volumenu reprodukcije riječi (faktor brzine) su izraženije nego slučajne. Ovaj odnos se može grafički prikazati na Sl. 6.3.

Rice. 6.3. Zavisnost prosječne količine reproduciranih riječi o brzini prezentacije

Proračuni jednofaktorskog modela mogu se izvršiti korištenjem paketa "Analiza podataka", odjeljak "Jednofaktorska analiza varijanse" (slika 6.4).

Rice. 6.4. Paketni meni "Analiza podataka" Nakon unosa odgovarajućih parametara (sl. 6.5), možete dobiti rezultate jednosmjerne analize varijanse (sl. 6.6).

Rice. 6.5. Prozor dijaloga

Rice. 6.6. Rezultati jednosmjerne analize varijanse (a = 0,05)

Računarski paket „Analiza podataka“ vrši proračune osnovnih statistika (zbira, proseka, varijanse, vrednosti empirijskih i teorijskih kriterijuma, itd.), što istraživaču daje osnovu za statističke zaključke.