Biografije Karakteristike Analiza

Analiza varijance odnosi se na broj. Hipoteza koju treba testirati jest da nema razlike između skupina.

Gore opisane metode provjere statističke hipoteze o značaju razlika između dva prosjeka u praksi su od ograničene koristi. To je zbog činjenice da se radi utvrđivanja utjecaja svih mogućih uvjeta i čimbenika na rezultantno svojstvo terenski i laboratorijski pokusi u pravilu ne provode na dva, već na većem broju uzoraka (1220 ili više). ).

Istraživači često uspoređuju srednje vrijednosti nekoliko uzoraka spojenih u jedan kompleks. Na primjer, kada se proučava učinak različitih vrsta i doza gnojiva na prinose usjeva, pokusi se ponavljaju u različite opcije. U tim slučajevima parne usporedbe postaju glomazne, a statistička analiza cijelog kompleksa zahtijeva korištenje posebne metode. Ova metoda, razvijena u matematičkoj statistici, naziva se analiza varijance. Prvi ga je upotrijebio engleski statističar R. Fisher pri obradi rezultata agronomskih pokusa (1938.).

Analiza varijance je metoda statistička procjena pouzdanost manifestacije ovisnosti djelotvornog obilježja o jednom ili više čimbenika. Metodom analize varijance provjeravaju se statističke hipoteze o prosjekima u nekoliko općih populacija koje imaju normalna distribucija.

Analiza varijance jedna je od glavnih metoda statističke procjene rezultata eksperimenta. Također se sve više koristi u analizi ekonomskih informacija. Analizom varijance moguće je utvrditi koliko su selektivni pokazatelji odnosa efektivnih i faktorskih znakova dovoljni za diseminaciju podataka dobivenih iz uzorka na opću populaciju. Prednost ove metode je što daje prilično pouzdane zaključke iz malih uzoraka.

Ispitivanjem varijacije rezultirajućeg atributa pod utjecajem jednog ili više faktora, analizom varijance, može se dobiti, osim općih procjena značajnosti ovisnosti, i procjena razlika u prosječnim vrijednostima koje formiraju se na različitim razinama čimbenika, a značaj međudjelovanja čimbenika. Analiza varijance koristi se za proučavanje ovisnosti i kvantitativnih i kvalitativne značajke, kao i njihova kombinacija.

Suština ove metode je statistička studija vjerojatnost utjecaja jednog ili više čimbenika, kao i njihova interakcija na djelotvorno svojstvo. Sukladno tome, uz pomoć disperzijske analize rješavaju se tri glavna zadatka: 1) ukupni rezultat značajnost razlika između grupnih sredina; 2) procjena vjerojatnosti međudjelovanja čimbenika; 3) procjena značajnosti razlika između parova sredina. Najčešće istraživači moraju rješavati takve probleme pri provođenju terenskih i zootehničkih pokusa, kada se proučava utjecaj nekoliko čimbenika na rezultirajuću osobinu.

Principijelna shema disperzijske analize uključuje utvrđivanje glavnih izvora varijacije efektivne značajke i određivanje volumena varijacije (zbrojeva kvadrata odstupanja) prema izvorima njenog formiranja; određivanje broja stupnjeva slobode koji odgovaraju komponentama opća varijacija; izračun varijanci kao omjera odgovarajućih volumena varijacije prema njihovom broju stupnjeva slobode; analiza odnosa disperzija; procjena pouzdanosti razlike između prosjeka i formuliranje zaključaka.

Ova shema je sačuvana iu jednostavnim ANOVA modelima, kada su podaci grupirani prema jednom atributu, iu složenim modelima, kada su podaci grupirani prema dva ili više atributa. Međutim, povećanjem broja grupnih obilježja komplicira se proces razgradnje opće varijacije prema izvorima njezina nastanka.

Prema shemi spoja analiza varijance može se predstaviti u obliku pet uzastopnih faza:

1) definicija i dekompozicija varijacije;

2) određivanje broja stupnjeva slobode varijacije;

3) proračun disperzija i njihovih omjera;

4) analiza disperzija i njihovih omjera;

5) procjena pouzdanosti razlike između srednjih vrijednosti i formulacija zaključaka o testiranju nulte hipoteze.

Najdugotrajniji dio analize varijance je prva faza - definiranje i dekompozicija varijacije prema izvorima njezina nastanka. Redoslijed širenja ukupnog volumena varijacije detaljno je razmatran u 5. poglavlju.

Osnova za rješavanje problema disperzijske analize je zakon proširenja (adicije) varijacije, prema kojem se ukupna varijacija (kolebanja) rezultirajućeg atributa dijeli na dva: varijaciju uslijed djelovanja proučavanog faktora (čimbenici). ), te varijacija uzrokovana djelovanjem slučajnih uzroka, tj

Pretpostavimo da je populacija koja se proučava podijeljena prema atributu faktora u nekoliko skupina, od kojih svaka ima svoje karakteristike prosjek učinkovit znak. U isto vrijeme, varijacija ovih vrijednosti može se objasniti s dvije vrste razloga: onima koji sustavno djeluju na efektivnu značajku i podložni su prilagodbi tijekom eksperimenta i onima koji nisu podložni prilagodbi. Očito je da međugrupna (faktorska ili sustavna) varijacija uglavnom ovisi o djelovanju proučavanog čimbenika, a unutargrupna (rezidualna ili slučajna) - o djelovanju slučajnih čimbenika.

Za procjenu značajnosti razlika između središnjih vrijednosti skupine potrebno je utvrditi međugrupne i unutargrupne varijacije. Ako međugrupna (faktorijalna) varijacija značajno premašuje unutargrupnu (rezidualnu) varijaciju, tada je faktor utjecao na rezultirajuću osobinu, značajno mijenjajući vrijednosti grupnih prosjeka. No, postavlja se pitanje koji se omjer međugrupnih i unutargrupnih varijacija može smatrati dovoljnim za zaključak o pouzdanosti (značajnosti) razlika između grupnih sredina.

Za procjenu značajnosti razlika između srednjih vrijednosti i formuliranje zaključaka o testiranju nulte hipoteze (H0: x1 = x2 = ... = xn), analiza varijance koristi svojevrsni standard - G-kriterij, zakon distribucije koju je ustanovio R. Fisher. Ovaj kriterij je omjer dvije varijance: faktorijelne, generirane djelovanjem faktora koji se proučava, i rezidualne, zbog djelovanja slučajnih uzroka:

Omjer disperzije r = t>u : £ * 2 američki statističar Snedecor predložio je da se označi slovom G u čast izumitelja analize varijance R. Fishera.

Varijance °2 i io2 su procjene varijance populacija. Ako su uzorci s varijancama od °2 °2 izvučeni iz iste opće populacije, gdje je varijacija u vrijednostima slučajni lik, tada je razlika u vrijednostima °2 °2 također slučajna.

Ako se eksperimentom provjerava utjecaj nekoliko čimbenika (A, B, C, itd.) na efektivnu značajku u isto vrijeme, tada bi disperzija zbog djelovanja svakog od njih trebala biti usporediva s °npr.gP, to je

Ako je vrijednost varijance faktora značajno veća od ostatka, tada je faktor značajno utjecao na rezultirajući atribut i obrnuto.

U multifaktorijalnim pokusima, uz varijaciju zbog djelovanja svakog faktora, gotovo uvijek postoji varijacija zbog međudjelovanja faktora ($av: ^ls ^ss $liís). Suština interakcije je da se učinak jednog faktora bitno mijenja u različite razine drugi (na primjer, učinkovitost kvalitete tla pri različitim dozama gnojiva).

Međudjelovanje čimbenika također treba procijeniti usporedbom odgovarajućih varijanci 3 ^w.gr:

Pri izračunu stvarne vrijednosti B-kriterija, najveća varijanca se uzima u brojniku, stoga je B > 1. Očito, što je B-kriterij veći, to su veće razlike između varijanci. Ako je B = 1, tada se uklanja pitanje procjene značajnosti razlika u varijancama.

Za određivanje granica slučajnih fluktuacija, omjera varijanci G. Fisher je razvio posebne tablice B-distribucije (Dodatak 4 i 5). Kriterij B je funkcionalno povezan s vjerojatnošću i ovisi o broju stupnjeva slobode varijacije k1 i k2 od dvije uspoređene varijance. Za izvođenje zaključaka o granici obično se koriste dvije tablice visoka vrijednost kriterij za razine značajnosti od 0,05 i 0,01. Razina značajnosti od 0,05 (ili 5%) znači da samo u 5 slučajeva od 100 kriterij B može poprimiti vrijednost jednaku ili višu od one navedene u tablici. Smanjenje razine značajnosti s 0,05 na 0,01 dovodi do povećanja vrijednosti kriterija B između dvije varijance zbog djelovanja samo slučajnih uzroka.

Vrijednost kriterija također izravno ovisi o broju stupnjeva slobode dviju uspoređivanih disperzija. Ako broj stupnjeva slobode teži beskonačnosti (k-me), tada omjer bi za dvije disperzije teži jedinici.

Tablična vrijednost kriterija B pokazuje moguće nasumična varijabla omjeri dviju varijanci na danoj razini značajnosti i odgovarajući broj stupnjeva slobode za svaku od uspoređivanih varijanci. U ovim tablicama, vrijednost B je dana za uzorke napravljene iz iste opće populacije, gdje su razlozi promjene vrijednosti samo slučajni.

Vrijednost G nalazi se iz tablica (Dodatak 4 i 5) na sjecištu odgovarajućeg stupca (broj stupnjeva slobode za veću disperziju - k1) i retka (broj stupnjeva slobode za manju disperziju). - k2). Dakle, ako je veća varijanca (brojnik G) k1 = 4, a manja (nazivnik G) k2 = 9, tada će Ga na razini značajnosti a = 0,05 biti 3,63 (pril. 4). Dakle, kao rezultat djelovanja slučajnih uzroka, budući da su uzorci mali, varijanca jednog uzorka može na razini značajnosti od 5% premašiti varijancu drugog uzorka za 3,63 puta. Sa smanjenjem razine značajnosti s 0,05 na 0,01, tablična vrijednost kriterija D, kao što je gore navedeno, će se povećati. Dakle, uz iste stupnjeve slobode k1 = 4 i k2 = 9 i a = 0,01, tablična vrijednost kriterija G bit će 6,99 (pril. 5).

Razmotrite postupak određivanja broja stupnjeva slobode u analizi varijance. Broj stupnjeva slobode, koji odgovara ukupnom zbroju kvadrata odstupanja, rastavlja se na odgovarajuće komponente slično rastavljanju zbroja kvadrata odstupanja ukupni broj stupnjevi slobode (k") se rastavlja na broj stupnjeva slobode za međugrupne (k1) i unutargrupne (k2) varijacije.

Dakle, ako se uzorak populacije sastoji od N opažanja podijeljena sa t grupe (broj opcija pokusa) i P podskupina (broj ponavljanja), tada će broj stupnjeva slobode k biti:

a) za ukupan zbroj kvadrata odstupanja (dszar)

b) za međugrupni zbroj kvadrata odstupanja ^m.gP)

c) za unutargrupnu sumu kvadrata odstupanja u w.gr)

Prema pravilu varijacije zbrajanja:

Na primjer, ako su u pokusu formirane četiri varijante pokusa (m = 4) u po pet ponavljanja (n = 5), a ukupno opažanja N = = t o p \u003d 4 * 5 \u003d 20, tada je broj stupnjeva slobode jednak:

Poznavajući zbrojeve kvadrata odstupanja broja stupnjeva slobode, moguće je odrediti nepristrane (prilagođene) procjene za tri varijance:

Nulta hipoteza H0 po kriteriju B testira se na isti način kao i Studentovim u-testom. Za donošenje odluke o provjeri H0 potrebno je izračunati stvarnu vrijednost kriterija i usporediti je s tablična vrijednost Ba za prihvaćenu razinu značajnosti a i broj stupnjeva slobode k1 i k2 za dvije disperzije.

Ako je Bfakg > Ba, tada, u skladu s prihvaćenom razinom značajnosti, možemo zaključiti da razlike u varijancama uzorka nisu određene samo slučajnim faktorima; oni su značajni. U ovom slučaju, nulta hipoteza se odbacuje i postoji razlog za vjerovanje da faktor značajno utječe na rezultirajući atribut. Ako< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Korištenje jednog ili drugog modela analize varijance ovisi o broju proučavanih faktora io metodi uzorkovanja.

Ovisno o broju faktora koji određuju varijaciju efektivnog svojstva, uzorci se mogu formirati od jednog, dva ili više faktora. Prema ovoj analizi varijance se dijeli na jednofaktorsku i višefaktorsku. Inače se naziva i jednofaktorski i višefaktorski disperzijski kompleks.

Shema dekompozicije opće varijacije ovisi o formiranju skupina. Može biti slučajan (promatranja jedne skupine nisu povezana s opažanjima druge skupine) i neslučajan (promatranja dva uzorka međusobno su povezana zajedničkim uvjetima eksperimenta). Sukladno tome dobivaju se neovisni i ovisni uzorci. Nezavisni uzorci mogu se formirati s jednakim i neparnim brojevima. Formiranje zavisnih uzoraka pretpostavlja njihov jednak broj.

Ako su skupine formirane nenasilnim redoslijedom, tada ukupna količina varijacije rezultirajuće osobine uključuje, uz faktorijel (međugrupnu) i rezidualnu varijaciju, varijaciju ponavljanja, tj.

U praksi je u većini slučajeva potrebno uzeti u obzir ovisne uzorke kada su uvjeti za skupine i podskupine izjednačeni. Da, unutra iskustvo na terenu cijelo mjesto je podijeljeno u blokove, s najviše virivnyanniya uvjetima. Istovremeno, svaka varijanta eksperimenta dobiva jednake mogućnosti da bude zastupljena u svim blokovima, čime se postiže izjednačavanje uvjeta za sve testirane opcije, iskustva. Ova metoda konstruiranja iskustva naziva se metoda slučajnih blokova. Slično se provode i pokusi sa životinjama.

Pri obradi socioekonomskih podataka metodom disperzijske analize mora se imati na umu da je, zbog velikog broja čimbenika i njihove međusobne povezanosti, teško čak i uz najpažljivije usklađivanje uvjeta utvrditi stupanj objektivni utjecaj svakog pojedinog faktora na efektivni atribut. Stoga je razina rezidualne varijacije određena ne samo slučajnim uzrocima, već i značajnim čimbenicima koji nisu uzeti u obzir prilikom izrade ANOVA modela. Kao rezultat toga, rezidualna disperzija kao osnova za usporedbu ponekad postaje neadekvatna za svoju svrhu, jasno je precijenjena u veličini i ne može djelovati kao kriterij za značaj utjecaja faktora. U tom smislu, pri izgradnji modela analize varijance, problem selekcije postaje relevantan. kritični faktori te niveliranje uvjeta za očitovanje djelovanja svake od njih. Osim. korištenje analize varijance pretpostavlja normalnu ili približno normalnu distribuciju statističkih populacija koje se proučavaju. Ako ovaj uvjet nije ispunjen, tada će procjene dobivene analizom varijance biti preuveličane.

Analiza varijance(od latinskog Dispersio - disperzija / na engleskom Analysis Of Variance - ANOVA) koristi se za proučavanje utjecaja jedne ili više kvalitativnih varijabli (faktora) na jednu zavisnu kvantitativnu varijablu (odgovor).

Analiza varijance temelji se na pretpostavci da se neke varijable mogu smatrati uzrocima (čimbenici, nezavisne varijable): , a druge posljedicama (ovisne varijable). Nezavisne varijable ponekad se nazivaju podesivim faktorima upravo zato što u eksperimentu istraživač ima priliku varirati ih i analizirati dobiveni rezultat.

Glavni cilj analiza varijance(ANOVA) je studija značajnosti razlika između srednjih vrijednosti usporedbom (analizom) varijanci. Razdvajanje ukupna varijanca na više izvora, omogućuje vam da usporedite varijancu uzrokovanu razlikom između grupa s varijancom uzrokovanom varijabilnošću unutar grupe. Ako je nulta hipoteza točna (o jednakosti srednjih vrijednosti u nekoliko skupina promatranja odabranih iz opće populacije), procjena varijance povezana s unutargrupnom varijabilnošću trebala bi biti blizu procjene međugrupne varijance. Ako jednostavno uspoređujete srednje vrijednosti dvaju uzoraka, analiza varijance će dati isti rezultat kao normalni t-test neovisnog uzorka (ako uspoređujete dvije neovisne grupe objekata ili opažanja) ili t-test ovisnog uzorka ( ako uspoređujete dvije varijable na istom i istom skupu objekata ili opažanja).

Bit analize varijance je u podjeli ukupne varijance proučavanog svojstva na zasebne komponente, zbog utjecaja pojedinih čimbenika, te testiranju hipoteza o značajnosti utjecaja tih čimbenika na proučavano svojstvo. Međusobnom usporedbom komponenti disperzije Fisherovim F-testom moguće je utvrditi koliki je udio ukupne varijabilnosti rezultirajućeg svojstva posljedica djelovanja prilagodljivih faktora.

Izvorni materijal za analizu varijance su podaci istraživanja tri ili više uzoraka: , koji mogu biti jednakog ili nejednakog broja, povezani i nepovezani. Prema broju identificiranih podesivih faktora može se izvršiti analiza varijance jednofaktorski(istodobno se proučava utjecaj jednog faktora na rezultate pokusa), dvofaktorski(kada se proučava utjecaj dva faktora) i multifaktorski(omogućuje procjenu ne samo utjecaja svakog od čimbenika zasebno, već i njihovu interakciju).

Analiza varijance spada u skupinu parametarskih metoda i stoga je treba koristiti samo kada se dokaže da je distribucija normalna.

Analiza varijance koristi se ako se zavisna varijabla mjeri na ljestvici omjera, intervala ili reda, a utjecajne varijable nisu numeričke (ljestvica naziva).

Primjeri zadataka

U zadacima koji se rješavaju analizom varijance javlja se odgovor numeričke prirode na koji utječe nekoliko varijabli nominalne prirode. Na primjer, nekoliko vrsta obroka za tov stoke ili dva načina držanja i sl.

Primjer 1: Tijekom tjedna radilo je nekoliko ljekarničkih kioska na tri različite lokacije. U budućnosti možemo ostaviti samo jedno. Potrebno je utvrditi postoji li statistički značajna razlika u količini prodaje lijekova na kioscima. Ako da, odabrat ćemo kiosk s najvećim prosječnim dnevnim opsegom prodaje. Ako se razlika u obujmu prodaje pokaže statistički beznačajnom, tada bi drugi pokazatelji trebali biti temelj za odabir kioska.

Primjer 2: Usporedba kontrasta grupnih sredstava. Sedam političkih opredjeljenja poredano je od ekstremno liberalnih do ekstremno konzervativnih, a linearni kontrast se koristi za testiranje postoji li trend rasta vrijednosti skupine različit od nule – tj. postoji li značajno linearno povećanje prosječne dobi kada se razmatraju skupine poredane u smjeru od liberala ka konzervativcu.

Primjer 3: Dvosmjerna analiza varijance. Na broj prodanih proizvoda, osim veličine trgovine, često utječe i položaj polica s proizvodima. Ovaj primjer sadrži tjedne podatke o prodaji koje karakteriziraju četiri rasporeda polica i tri veličine trgovine. Rezultati analize pokazuju da oba čimbenika - položaj polica s robom i veličina trgovine - utječu na broj prodaja, ali njihova interakcija nije značajna.

Primjer 4: Univarijatna ANOVA: Randomizirani dizajn punog bloka s dva tretmana. Utjecaj na pečenje kruha svih moguće kombinacije tri masti i tri parala za tijesto. Četiri uzorka brašna uzeta od četiri različiti izvori, služili su kao čimbenici blokiranja. Potrebno je utvrditi važnost interakcije mast-ripper. Nakon toga, za određivanje različitih opcija za odabir kontrasta, omogućujući vam da saznate koje se kombinacije razina čimbenika razlikuju.

Primjer 5: Model hijerarhijskog (ugniježđenog) plana s mješovitim učincima. Proučava se utjecaj četiri nasumično odabrane glave ugrađene u alatni stroj na deformaciju izrađenih staklenih katodnih držača. (Glave su ugrađene u stroj, tako da se ista glava ne može koristiti na različitim strojevima.) Učinak glave se tretira kao slučajni faktor. Statistika ANOVA pokazuje da nema značajnih razlika između strojeva, ali postoje naznake da se glave mogu razlikovati. Razlika između svih strojeva nije značajna, ali je za dva od njih razlika između tipova glava značajna.

Primjer 6: Univarijatna analiza ponovljenih mjerenja pomoću plana podijeljene plohe. Ovaj eksperiment je proveden kako bi se odredio učinak anksioznosti pojedinca na uspješnost ispita u četiri uzastopna pokušaja. Podaci su organizirani tako da se mogu smatrati skupinama podskupova cijelog skupa podataka ("cijeli dijagram"). Učinak anksioznosti nije bio značajan, dok je učinak pokušaja bio značajan.

Popis metoda

  • Modeli faktorijelnog eksperimenta. Primjeri: čimbenici koji utječu na uspješnost rješavanja matematičkih problema; čimbenici koji utječu na količinu prodaje.

Podaci se sastoje od nekoliko nizova opažanja (obrada), koji se smatraju realizacijama neovisnih uzoraka. Početna hipoteza je da nema razlike u tretmanima, tj. pretpostavlja se da se sva promatranja mogu smatrati jednim uzorkom iz ukupne populacije:

  • Jednofaktorski parametarski model: Scheffeova metoda.
  • Jednofaktorski neparametarski model [Lagutin M.B., 237]: Kruskal-Wallisov kriterij [Hollender M., Wolf D.A., 131], Jonkheerov kriterij [Lagutin M.B., 245].
  • Opći slučaj modela s konstantnim faktorima, Cochranov teorem [Afifi A., Eisen S., 234].

Podaci su dvostruko ponovljena opažanja:

  • Dvofaktorski neparametarski model: Friedmanov kriterij [Lapach, 203], Pageov kriterij [Lagutin M.B., 263]. Primjeri: usporedba učinkovitosti proizvodnih metoda, poljoprivredne prakse.
  • Dvofaktorski neparametarski model za nepotpune podatke

Priča

Odakle ime analiza varijance? Može se činiti čudnim da se postupak za usporedbu srednjih vrijednosti naziva analizom varijance. Zapravo, to je zbog činjenice da pri ispitivanju statističke značajnosti razlike između sredina dviju (ili više) skupina zapravo uspoređujemo (analiziramo) varijance uzorka. Predlaže se temeljni koncept analize varijance Fisher 1920. godine. Možda bi prirodniji termin bio analiza zbrojem kvadrata ili analiza varijacije, no zbog tradicije koristi se termin analiza varijance. U početku je analiza varijance razvijena za obradu podataka dobivenih tijekom posebno dizajniranih eksperimenata i smatrana je jedinom metodom koja ispravno istražuje uzročne odnose. Metoda je korištena za ocjenu pokusa u biljnoj proizvodnji. Kasnije je postalo jasno opće znanstveno značenje analize disperzije za eksperimente u psihologiji, pedagogiji, medicini itd.

Književnost

  1. Sheff G. Analiza disperzije. - M., 1980.
  2. Ahrens H. Leiter Yu. Multivarijantna analiza varijance.
  3. Kobzar A.I. Primijenjena matematička statistika. - M.: Fizmatlit, 2006.
  4. Lapach S. N., Chubenko A. V., Babich P. N. Statistika u znanosti i poslovanju. - Kijev: Morion, 2002.
  5. Lagutin M. B. Vizualna matematička statistika. U dva sveska. - M.: P-centar, 2003.
  6. Afifi A., Eisen S. Statistička analiza: Pristup uz pomoć računala.
  7. Hollender M., Wolf D.A. Neparametarske metode statistike.

Linkovi

Um nije samo u znanju, već i u sposobnosti primjene znanja u praksi. (Aristotel)

Analiza varijance

Uvodni pregled

U ovom odjeljku pregledat ćemo osnovne metode, pretpostavke i terminologiju ANOVE.

Napominjemo da se u engleskoj literaturi analiza varijance obično naziva analizom varijacije. Stoga ćemo, radi sažetosti, u nastavku ponekad koristiti taj izraz ANOVA (An analiza o f va rijacija) za konvencionalnu ANOVA i izraz MANOVA za multivarijatnu analizu varijance. U ovom odjeljku ćemo redom razmotriti glavne ideje analize varijance ( ANOVA), analiza kovarijance ( ANCOVA), multivarijatna analiza varijance ( MANOVA) i multivarijantna analiza kovarijance ( MANCOVA). Nakon kratke rasprave o prednostima analize kontrasta i post hoc kriteriji Razmotrimo pretpostavke na kojima se temelje metode analize varijance. Pred kraj ovog odjeljka objašnjavaju se prednosti multivarijantnog pristupa za analizu ponovljenih mjerenja u odnosu na tradicionalni jednodimenzionalni pristup.

Ključne ideje

Svrha analize varijance. Glavna svrha analize varijance je proučavanje značajnosti razlike između srednjih vrijednosti. Poglavlje (Poglavlje 8) daje kratak uvod u testiranje statističke značajnosti. Ako samo uspoređujete srednje vrijednosti dva uzorka, analiza varijance će dati isti rezultat kao i normalna analiza. t- kriterij za neovisne uzorke (ako se uspoređuju dvije neovisne skupine objekata ili opažanja), odn t- kriterij za ovisne uzorke (ako se dvije varijable uspoređuju na istom skupu objekata ili opažanja). Ako niste upoznati s ovim kriterijima, preporučujemo da pogledate uvodni pregled poglavlja (poglavlje 9).

Odakle ime Analiza varijance? Može se činiti čudnim da se postupak za usporedbu srednjih vrijednosti naziva analizom varijance. Zapravo, to je zbog činjenice da kada ispitujemo statističku značajnost razlike između srednjih vrijednosti, zapravo analiziramo varijance.

Dijeljenje zbroja kvadrata

Za veličinu uzorka n varijanca uzorka izračunato kao zbroj kvadrata odstupanja od srednje vrijednosti uzorka podijeljen s n-1 (veličina uzorka minus jedan). Dakle, za fiksnu veličinu uzorka n, varijanca je funkcija zbroja kvadrata (odstupanja), označena, za sažetost, SS(od engleskog zbroja kvadrata - zbroj kvadrata). Analiza varijance temelji se na podjeli (ili cijepanju) varijance na dijelove. Razmotrite sljedeći skup podataka:

Srednje vrijednosti dviju skupina značajno se razlikuju (2 odnosno 6). Zbroj kvadrata odstupanja unutra svake grupe je 2. Zbrajajući ih zajedno, dobivamo 4. Ako sada ponovimo ove izračune isključujući pripadnost skupini, odnosno ako izračunamo SS na temelju kombinirane srednje vrijednosti dva uzorka, dobivamo 28. Drugim riječima, varijanca (zbroj kvadrata) temeljena na varijabilnosti unutar grupe rezultira puno manjim vrijednostima nego kada se izračunava na temelju ukupne varijabilnosti (u odnosu na ukupnu znači). Razlog tome je očito značajna razlika između prosjeka, a ta razlika između prosjeka objašnjava postojeća razlika između zbrojeva kvadrata. Doista, ako koristimo modul Analiza varijance, dobit će se sljedeći rezultati:

Kao što se vidi iz tablice, ukupni zbroj kvadrata SS=28 podijeljeno na zbroj kvadrata zbog unutargrupni varijabilnost ( 2+2=4 ; vidi drugi redak tablice) i zbroj kvadrata zbog razlike srednjih vrijednosti. (28-(2+2)=24; pogledajte prvi redak tablice).

SS greške iSS posljedica. Varijabilnost unutar grupe ( SS) obično se naziva varijanca pogreške. To znači da se obično ne može predvidjeti ili objasniti kada se eksperiment provodi. S druge strane, SS posljedica(ili međugrupna varijabilnost) može se objasniti razlikom između srednjih vrijednosti u ispitivanim skupinama. Drugim riječima, pripadnost određenoj skupini objašnjava međugrupna varijabilnost, jer znamo da te skupine imaju različita sredstva.

Provjera značaja. U poglavlju se raspravlja o glavnim idejama testiranja statističke značajnosti Osnovni pojmovi statistike(Poglavlje 8). U istom poglavlju objašnjeni su razlozi zašto mnogi testovi koriste omjer objašnjene i neobjašnjene varijance. Primjer ove upotrebe je sama analiza varijance. Testiranje značajnosti u ANOVA-i temelji se na usporedbi varijance zbog varijacije između grupa (tzv. učinak srednjeg kvadrata ili MSPosljedica) i disperzija zbog širenja unutar grupe (tzv srednja kvadratna greška ili MSgreška). Ako je nulta hipoteza istinita (jednakost srednjih vrijednosti u dvjema populacijama), tada možemo očekivati ​​relativno malu razliku u srednjim vrijednostima uzorka zbog slučajne varijabilnosti. Prema tome, prema nultoj hipotezi, varijanca unutar grupe praktički će se podudarati s ukupnom varijancom izračunatom bez uzimanja u obzir članstva u grupi. Rezultirajuće varijance unutar grupe mogu se usporediti pomoću F- test koji provjerava je li omjer varijanci značajno veći od 1. U gornjem primjeru, F- Test pokazuje da je razlika između srednjih vrijednosti statistički značajna.

Osnovna logika ANOVE. Ukratko, možemo reći da je svrha analize varijance testiranje statističke značajnosti razlike između sredina (za skupine ili varijable). Ova provjera se provodi pomoću analize varijance, tj. dijeljenjem ukupne varijance (varijacije) na dijelove, od kojih je jedan posljedica slučajne pogreške (tj. unutargrupna varijabilnost), a drugi je povezan s razlikom srednjih vrijednosti. Posljednja komponenta varijance zatim se koristi za analizu statističke značajnosti razlike između srednjih vrijednosti. Ako je ta razlika značajna, nulta hipoteza se odbacuje i prihvaća se alternativna hipoteza da postoji razlika između srednjih vrijednosti.

Zavisne i nezavisne varijable. Varijable čije su vrijednosti određene mjerenjima tijekom eksperimenta (na primjer, rezultat postignut na testu) nazivaju se ovisan varijable. Varijable kojima se može manipulirati u eksperimentu (na primjer, metode obuke ili drugi kriteriji koji vam omogućuju da promatranja podijelite u skupine) nazivaju se čimbenici ili nezavisna varijable. Ovi koncepti su detaljnije opisani u poglavlju Osnovni pojmovi statistike(Poglavlje 8).

Multivarijantna analiza varijance

U gornjem jednostavnom primjeru možete odmah izračunati t-test neovisnog uzorka koristeći odgovarajuću opciju modula Osnovne statistike i tablice. Dobiveni rezultati se naravno poklapaju s rezultatima analize varijance. Međutim, analiza varijance sadrži fleksibilne i moćne tehnička sredstva, koji se može koristiti za mnogo složenije studije.

Mnogo faktora. Svijet je sam po sebi složen i višedimenzionalan. Iznimno su rijetke situacije u kojima je neka pojava u potpunosti opisana jednom varijablom. Na primjer, ako pokušavamo naučiti kako uzgajati velike rajčice, trebali bismo uzeti u obzir čimbenike koji se odnose na genetsku strukturu biljaka, vrstu tla, svjetlost, temperaturu itd. Stoga, kada provodite tipičan eksperiment, morate se nositi s velikim brojem čimbenika. Glavni razlog zašto je korištenje ANOVA-e poželjnije od ponovne usporedbe dva uzorka na različitim razinama korištenja faktora t- kriterij je da je analiza varijance više djelotvoran a za male uzorke informativniji.

Upravljanje faktorima. Pretpostavimo da u primjeru analize dvaju uzoraka o kojoj smo raspravljali, dodamo još jedan faktor, na primjer, Kat- Spol. Neka se svaka grupa sastoji od 3 muškarca i 3 žene. Dizajn ovog eksperimenta može se prikazati u obliku tablice 2 puta 2:

Eksperiment. Grupa 1 Eksperiment. Grupa 2
Muškarci2 6
3 7
1 5
Prosjek2 6
žene4 8
5 9
3 7
Prosjek4 8

Prije nego što napravite izračune, možete vidjeti da u ovom primjeru ukupna varijanca ima najmanje tri izvora:

(1) slučajna pogreška (unutar grupne varijance),

(2) varijabilnost povezana s članstvom u eksperimentalnoj skupini, i

(3) varijabilnost zbog spola promatranih objekata.

(Imajte na umu da postoji još jedan mogući izvor varijabilnosti - interakcija faktora, o čemu ćemo kasnije govoriti). Što se događa ako ne uključimo katspol kao čimbenik u analizi i izračunati uobičajeno t-kriterij? Ako računamo zbrojeve kvadrata, zanemarujući kat -spol(tj. kombiniranje objekata različitog spola u jednu grupu pri izračunavanju varijance unutar grupe, uz dobivanje zbroja kvadrata za svaku grupu jednak SS=10, te ukupni zbroj kvadrata SS= 10+10 = 20), tada dobivamo veću vrijednost varijanca unutar grupe nego s točnijom analizom s dodatnim podgrupiranjem prema polu- spol(u ovom slučaju unutargrupna sredina bit će jednaka 2, a ukupni unutargrupni zbroj kvadrata bit će jednak SS = 2+2+2+2 = 8). Ova razlika je posljedica činjenice da je srednja vrijednost za muškarci - mužjaci manje od prosjeka za žene -žena, a ova razlika u sredinama povećava ukupnu varijabilnost unutar grupe ako se spol ne uzme u obzir. Kontrola varijance pogreške povećava osjetljivost (snagu) testa.

Ovaj primjer pokazuje još jednu prednost analize varijance u odnosu na konvencionalnu analizu. t-kriterij za dva uzorka. Analiza varijance omogućuje proučavanje svakog faktora kontroliranjem vrijednosti drugih faktora. To je zapravo glavni razlog njegove veće statističke snage (za dobivanje smislenih rezultata potrebni su manji uzorci). Iz tog razloga analiza varijance, čak i na malim uzorcima, daje statistički značajnije rezultate od jednostavne. t- kriterij.

Učinci interakcije

Postoji još jedna prednost korištenja ANOVA-e u odnosu na konvencionalnu analizu. t- kriterij: analiza varijance omogućuje otkrivanje interakcija između faktora i stoga omogućuje proučavanje složenijih modela. Za ilustraciju, razmotrite još jedan primjer.

Glavni učinci, parne (dvofaktorske) interakcije. Pretpostavimo da postoje dvije skupine učenika, a psihološki su učenici prve skupine prilagođeni ispunjavanju postavljenih zadataka i svrhovitiji su od učenika druge skupine, koju čine ljeniji učenici. Podijelimo svaku grupu nasumično na pola i ponudimo jednoj polovici svake grupe težak zadatak, a drugoj lakši. Nakon toga mjerimo koliko se učenici trude na tim zadacima. Prosjeci za ovu (fiktivnu) studiju prikazani su u tablici:

Koji se zaključak može izvući iz ovih rezultata? Može li se zaključiti da: (1) učenici više rade na težem zadatku; (2) rade li motivirani učenici više od lijenih? Nijedna od ovih izjava ne odražava bit sustavne prirode prosjeka danih u tablici. Analizirajući rezultate, ispravnije bi bilo reći da samo motivirani učenici rade više na složenim zadacima, dok samo lijeni učenici rade više na lakim zadacima. Drugim riječima, priroda učenika i složenost zadatka međusobno djelujući jedna na drugu utječu na količinu potrebnog napora. To je primjer interakcija u paru između prirode učenika i složenosti zadatka. Imajte na umu da izjave 1 i 2 opisuju glavni efekti.

Interakcije višeg reda. Dok je interakcije u paru relativno lako objasniti, interakcije višeg reda mnogo je teže objasniti. Zamislimo da je u gore razmotrenom primjeru uveden još jedan faktor kat -Spol i dobili smo sljedeću tablicu prosjeka:

Kakvi se zaključci sada mogu izvući iz dobivenih rezultata? Srednji dijagrami olakšavaju tumačenje složenih učinaka. Modul analize varijance omogućuje vam izradu ovih grafikona gotovo jednim klikom.

Slika u grafikonima ispod predstavlja trosmjernu interakciju koja se proučava.

Gledajući grafikone, možemo reći da postoji interakcija između prirode i težine testa za žene: motivirane žene rade više na teškom zadatku nego na lakom. Kod muškaraca je ista interakcija obrnuta. Može se vidjeti da opis interakcije između čimbenika postaje zbunjujući.

Opći način opisivanja interakcija. NA opći slučaj interakcija između čimbenika opisuje se kao promjena jednog učinka pod utjecajem drugog. U gore navedenom primjeru dvofaktorska interakcija može se opisati kao promjena glavnog učinka faktora koji karakterizira složenost zadatka, pod utjecajem faktora koji opisuje karakter učenika. Za međudjelovanje tri čimbenika iz prethodnog odlomka možemo reći da se međudjelovanje dvaju čimbenika (složenosti zadatka i karaktera učenika) mijenja pod utjecajem spolSpol. Ako se proučava interakcija četiri faktora, može se reći da se interakcija tri faktora mijenja pod utjecajem četvrtog faktora, tj. postoje različite vrste interakcija na različitim razinama četvrtog faktora. Pokazalo se da je u mnogim područjima interakcija pet ili čak višečimbenika nije neobično.

Složeni planovi

Međugrupni i unutargrupni planovi (planovi ponovnog mjerenja)

Kad se uspoređuju dva razne skupine uobičajeno korišten t- kriterij za neovisne uzorke (iz modula Osnovne statistike i tablice). Kada se dvije varijable uspoređuju na istom skupu objekata (opažanja), koristi se ona t-kriterij za zavisne uzorke. Za analizu varijance također je važno jesu li uzorci ovisni ili ne. Ako postoje ponovljena mjerenja istih varijabli (pod različitim uvjetima ili u drugačije vrijeme) za iste objekte, onda kažu o prisutnosti faktor ponovljenih mjerenja(također se zove intragrupni faktor budući da se izračunava zbroj kvadrata unutar grupe da bi se procijenio njegov značaj). Ako se uspoređuju različite skupine objekata (na primjer, muškarci i žene, tri soja bakterija itd.), tada se opisuje razlika između skupina međugrupni faktor. Metode za izračun kriterija značajnosti za dvije opisane vrste faktora su različite, ali njihova opća logika i tumačenje su isti.

Inter- i intra-grupni planovi. U mnogim slučajevima, eksperiment zahtijeva uključivanje faktora između grupa i faktora ponovljenih mjerenja u dizajnu. Na primjer, mjere se matematičke vještine učenica i učenika (gdje kat -Spol-međugrupni faktor) na početku i na kraju semestra. Dvije dimenzije vještina svakog učenika čine faktor unutar grupe (faktor ponovljenih mjerenja). Tumačenje glavnih učinaka i interakcija za čimbenike međugrupnih i ponovljenih mjerenja je isto, a obje vrste čimbenika očito mogu međusobno komunicirati (na primjer, žene stječu vještine tijekom semestra, a muškarci ih gube).

Nepotpuni (ugniježđeni) planovi

U mnogim slučajevima, učinak interakcije može se zanemariti. To se događa ili kada je poznato da nema učinka interakcije u populaciji, ili kada je implementacija puna faktorijel plan je nemoguć. Na primjer, proučava se učinak četiri aditiva za gorivo na potrošnju goriva. Odabrana su četiri automobila i četiri vozača. puna faktorijel eksperiment zahtijeva da se svaka kombinacija: dodatak, vozač, automobil pojavi barem jednom. To zahtijeva najmanje 4 x 4 x 4 = 64 ispitne grupe, što oduzima previše vremena. Osim toga, gotovo da nema interakcije između vozača i aditiva za gorivo. Imajući ovo na umu, možete koristiti plan latinski kvadrati, koji sadrži samo 16 skupina testova (četiri aditiva označena su slovima A, B, C i D):

Latinski kvadrati opisani su u većini knjiga o eksperimentalnom dizajnu (npr. Hays, 1988; Lindman, 1974; Milliken i Johnson, 1984; Winer, 1962) i ovdje se o njima neće raspravljati u detalje. Imajte na umu da su latinični kvadrati nenpuna planovi koji ne uključuju sve kombinacije razina faktora. Na primjer, vozač 1 vozi automobil 1 samo s aditivom A, vozač 3 vozi automobil 1 samo s aditivom C. Razine faktora aditivi ( A, B, C i D) ugniježđene u ćelije tablice automobil x vozač - kao jaja u gnijezdu. Ovo mnemoničko pravilo je korisno za razumijevanje prirode ugniježđeni ili ugniježđeni planovi. Modul Analiza varijance pruža jednostavne načine za analizu planova ove vrste.

Analiza kovarijance

Glavna ideja

U poglavlju Ključne ideje održana je kratka rasprava o ideji kontrolnih faktora i kako uključivanje aditivnih faktora može smanjiti zbroj kvadrata pogrešaka i povećati statističku snagu dizajna. Sve se to može proširiti na varijable s kontinuiranim skupom vrijednosti. Kada su takve kontinuirane varijable uključene kao faktori u dizajn, one se nazivaju kovarijate.

Fiksne kovarijable

Pretpostavimo da uspoređujemo matematičke vještine dviju skupina učenika koji su učili iz dva različita udžbenika. Pretpostavimo također da imamo podatke o kvocijentu inteligencije (IQ) za svakog učenika. Možemo pretpostaviti da je IQ povezan s matematičkim vještinama i koristiti se ovim informacijama. Za svaku od dvije skupine učenika može se izračunati koeficijent korelacije između IQ-a i matematičkih vještina. Pomoću ovog koeficijenta korelacije moguće je razlikovati udio varijance u grupama koji se objašnjava utjecajem IQ-a i neobjašnjivi udio varijance (vidi također Osnovni pojmovi statistike(poglavlje 8) i Osnovne statistike i tablice(poglavlje 9)). Preostali dio varijance koristi se u analizi kao varijanca pogreške. Ako postoji korelacija između IQ-a i matematičkih vještina, tada se varijance pogrešaka mogu značajno smanjiti. SS/(n-1) .

Učinak kovarijabli naF- kriterij. F- kriterijem se procjenjuje statistička značajnost razlike između srednjih vrijednosti u skupinama, dok se izračunava omjer međugrupne varijance ( MSposljedica) na varijancu pogreške ( MSgreška) . Ako a MSgreška smanjuje, primjerice, kada se uzme u obzir IQ faktor, vrijednost F povećava se.

Mnogo kovarijabli. Obrazloženje korišteno gore za jednu kovarijatu (IQ) lako se proširuje na više kovarijati. Na primjer, uz IQ možete uključiti mjerenje motivacije, prostornog razmišljanja itd. Umjesto uobičajenog koeficijenta korelacije, koristi se višestruki faktor korelacije.

Kada vrijednostF -kriteriji se smanjuju. Ponekad uvođenje kovarijabli u dizajn eksperimenta smanjuje vrijednost F- kriteriji . To obično znači da kovarijable nisu samo u korelaciji s zavisnom varijablom (kao što su matematičke vještine), već i s faktorima (kao što su različiti udžbenici). Pretpostavimo da se IQ mjeri na kraju semestra, nakon gotovo godišnji trening dvije grupe učenika na dva različita udžbenika. Iako su učenici podijeljeni u skupine nasumično, moglo bi se pokazati da je razlika u udžbenicima tolika da će i IQ i matematičke vještine u različitim skupinama jako varirati. U ovom slučaju, kovarijable ne samo da smanjuju varijancu pogreške, već i varijancu između grupa. Drugim riječima, nakon kontrole razlike u IQ-u između skupina, razlika u matematičkim vještinama više neće biti značajna. Može se reći i drugačije. Nakon “eliminiranja” utjecaja kvocijenta inteligencije nenamjerno je isključen utjecaj udžbenika na razvoj matematičkih vještina.

Prilagođeni prosjeci. Treba izračunati kada kovarijabla utječe na faktor među grupama prilagođeni prosjeci, tj. takve srednje vrijednosti, koje se dobivaju nakon uklanjanja svih procjena kovarijabli.

Interakcija između kovarijabli i faktora. Baš kao što se istražuju interakcije između čimbenika, mogu se istražiti interakcije između kovarijabli i između skupina čimbenika. Pretpostavimo da je jedan od udžbenika posebno prikladan za pametne učenike. Drugi udžbenik je pametnim učenicima dosadan, a manje pametnim učenicima je isti udžbenik težak. Kao rezultat toga, postoji pozitivna korelacija između IQ-a i ishoda učenja u prvoj skupini (pametniji učenici, bolji rezultat) i nulta ili blaga negativna korelacija u drugoj skupini (što je učenik pametniji, manja je vjerojatnost da će steći matematičke vještine iz drugog udžbenika). U nekim se studijama o ovoj situaciji raspravlja kao o primjeru kršenja pretpostavki analize kovarijance. Međutim, budući da modul Analiza varijance koristi najčešće metode analize kovarijance, moguće je posebno procijeniti statističku značajnost interakcije između faktora i kovarijanata.

Varijabilne kovarijable

Dok se o fiksnim kovarijatama dosta često govori u udžbenicima, varijable se mnogo rjeđe spominju. Obično, kada provodimo pokuse s ponavljanim mjerenjima, zanimaju nas razlike u mjerenjima istih veličina u različitim vremenskim točkama. Naime, zanima nas koliki je značaj tih razlika. Ako se mjerenje kovarijable provodi u isto vrijeme kad i mjerenja zavisne varijable, može se izračunati korelacija između kovarijable i zavisne varijable.

Na primjer, možete proučavati interes za matematiku i matematičke vještine na početku i na kraju semestra. Bilo bi zanimljivo provjeriti jesu li promjene u interesu za matematiku povezane s promjenama u matematičkim vještinama.

Modul Analiza varijance u STATISTIKA automatski procjenjuje statističku značajnost promjena kovarijabli u tim planovima, gdje je to moguće.

Multivarijatni dizajni: multivarijatna ANOVA i analiza kovarijance

Međugrupni planovi

Svi prethodno razmatrani primjeri uključivali su samo jednu zavisnu varijablu. Kada postoji više zavisnih varijabli u isto vrijeme, samo se povećava složenost izračuna, a sadržaj i temeljna načela se ne mijenjaju.

Na primjer, istraživanje se provodi na dva različita udžbenika. Istovremeno se proučava uspjeh učenika u studiju fizike i matematike. U ovom slučaju postoje dvije ovisne varijable i morate saznati kako dva različita udžbenika utječu na njih istovremeno. Da biste to učinili, možete koristiti multivarijantnu analizu varijance (MANOVA). Umjesto jednodimenzionalnog F kriterij, višedimenzionalan F test (Wilks l-test) koji se temelji na usporedbi matrice kovarijance pogreške i matrice kovarijance među grupama.

Ako su zavisne varijable međusobno korelirane, tada tu korelaciju treba uzeti u obzir pri izračunu testa značajnosti. Očito, ako se isto mjerenje ponovi dva puta, tada se u ovom slučaju ne može dobiti ništa novo. Ako se dimenzija koja je u korelaciji s njom doda postojećoj dimenziji, onda neke nove informacije, ali nova varijabla sadrži suvišne informacije, što se odražava u kovarijanci između varijabli.

Interpretacija rezultata. Ako je ukupni multivarijatni kriterij značajan, možemo zaključiti da je odgovarajući učinak (npr. vrsta udžbenika) značajan. Međutim, oni ustaju sljedeća pitanja. Utječe li vrsta udžbenika na poboljšanje samo matematičkih vještina, samo tjelesnih vještina ili oboje? Zapravo, nakon dobivanja smislenog multivarijantnog kriterija, za jedan glavni učinak ili interakciju, jednodimenzionalni F kriterij. Drugim riječima, zavisne varijable koje pridonose značajnosti multivarijatnog testa ispituju se zasebno.

Planovi s ponovljenim mjerenjima

Ako se matematičke i tjelesne sposobnosti učenika mjere na početku i na kraju semestra, onda se radi o ponovljenim mjerenjima. Proučavanje kriterija značaja u takvim planovima je logičan razvoj jednodimenzionalni slučaj. Imajte na umu da se metode multivarijatne ANOVA također često koriste za istraživanje značaja faktora univarijatnih ponovljenih mjerenja koji imaju više od dvije razine. O odgovarajućim aplikacijama bit će riječi kasnije u ovom dijelu.

Zbrajanje vrijednosti varijabli i multivarijantna analiza varijance

Čak i iskusni korisnici univarijatne i multivarijatne ANOVE često se zbune dobivanjem različitih rezultata kada se primjenjuje multivarijatna ANOVA na, recimo, tri varijable i kada se primjenjuje univarijatna ANOVA na zbroj triju varijabli kao jednu varijablu.

Ideja zbrajanje varijable je da svaka varijabla sadrži neku pravu varijablu, koja se istražuje, kao i slučajnu grešku mjerenja. Stoga, kada se uprosječuju vrijednosti varijabli, pogreška mjerenja će biti bliža 0 za sva mjerenja, a prosječne vrijednosti će biti pouzdanije. Zapravo, u ovom je slučaju primjena ANOVA-e na zbroj varijabli razumna i moćna tehnika. Međutim, ako su ovisne varijable multivarijantne prirode, zbrajanje vrijednosti varijabli nije prikladno.

Na primjer, neka se ovisne varijable sastoje od četiri mjere uspjeh u društvu. Svaki pokazatelj karakterizira potpuno neovisnu stranu ljudska aktivnost(na primjer, profesionalni uspjeh, poslovni uspjeh, obiteljsko blagostanje itd.). Zbrajanje ovih varijabli je kao zbrajanje jabuke i naranče. Zbroj ovih varijabli ne bi bio prikladna univarijantna mjera. Stoga se takvi podaci moraju tretirati kao višedimenzionalni pokazatelji multivarijatna analiza varijance.

Analiza kontrasta i post hoc testovi

Zašto se uspoređuju pojedinačni skupovi srednjih vrijednosti?

Obično se hipoteze o eksperimentalnim podacima ne formuliraju samo u smislu glavnih učinaka ili interakcija. Primjer je sljedeća hipoteza: određeni udžbenik poboljšava matematičke vještine samo kod muških učenika, dok je drugi udžbenik približno jednako učinkovit za oba spola, ali ipak manje učinkovit za muškarce. Može se predvidjeti da uspješnost udžbenika utječe na spol učenika. Međutim, ovo predviđanje također vrijedi priroda interakcije. Za učenike jedne knjige očekuje se značajna razlika među spolovima, a za učenike druge knjige rezultati praktički neovisni o spolu. Ova vrsta hipoteze obično se istražuje analizom kontrasta.

Analiza kontrasta

Ukratko, analiza kontrasta omogućuje nam procjenu statističke značajnosti nekih linearnih kombinacija složenih učinaka. Kontrastna analiza glavni je i neizostavan element svakog složenog ANOVA plana. Modul Analiza varijance ima dovoljno razne mogućnosti analiza kontrasta, koja vam omogućuje da istaknete i analizirate bilo koju vrstu usporedbe sredstava.

a posteriori usporedbe

Ponekad se kao rezultat obrade eksperimenta otkrije neočekivan učinak. Iako u većini slučajeva kreativni istraživač može objasniti bilo koji rezultat, to ne pruža mogućnosti za daljnju analizu i dobivanje procjena za prognozu. Ovaj problem je jedan od onih za koje post hoc kriteriji, odnosno kriterije koji ne koriste apriorno hipoteze. Za ilustraciju, razmotrite sljedeći eksperiment. Pretpostavimo da 100 kartica sadrži brojeve od 1 do 10. Nakon što smo sve te kartice ubacili u zaglavlje, nasumično odaberemo 20 puta 5 kartica i izračunamo prosječnu vrijednost za svaki uzorak (prosjek brojeva napisanih na karticama). Možemo li očekivati ​​da postoje dva uzorka čije su srednje vrijednosti značajno različite? Ovo je vrlo vjerojatno! Odabirom dva uzorka s maksimalnom i minimalnom sredinom, može se dobiti razlika u sredinama koja se jako razlikuje od razlike u sredinama, na primjer, prva dva uzorka. Ova se razlika može istražiti, na primjer, analizom kontrasta. Ne ulazeći u detalje, postoji nekoliko tzv a posteriori kriteriji koji se temelje točno na prvom scenariju (uzimanje ekstremnih prosjeka od 20 uzoraka), tj. ti se kriteriji temelje na odabiru najrazličitijih sredstava za usporedbu svih sredstava u dizajnu. Ti se kriteriji primjenjuju kako se čisto slučajno ne bi dobio umjetni učinak, na primjer, da se pronađe značajna razlika između srednjih vrijednosti kada je nema. Modul Analiza varijance nudi širok raspon takvih kriterija. Kada se u eksperimentu koji uključuje više grupa naiđe na neočekivane rezultate, a posteriori postupci za ispitivanje statističke značajnosti dobivenih rezultata.

Zbroj kvadrata tipa I, II, III i IV

Multivarijatna regresija i analiza varijance

postoji blizak odnos između metode multivarijatne regresije i analize varijance (analiza varijacija). U obje metode se istražuje linearni model. Ukratko, gotovo svi eksperimentalni dizajni mogu se istražiti pomoću multivarijatne regresije. Razmotrite sljedeći jednostavni plan križnih grupa 2 x 2.

DV A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Stupci A i B sadrže kodove koji karakteriziraju razine faktora A i B, stupac AxB sadrži umnožak dva stupca A i B. Te podatke možemo analizirati pomoću multivarijatne regresije. Varijabilna DV definirana kao zavisna varijabla, varijable iz A prije AxB kao nezavisne varijable. Proučavanje značajnosti za koeficijente regresije će se podudarati s izračunima u analizi varijance značajnosti glavnih učinaka čimbenika A i B i učinak interakcije AxB.

Neuravnoteženi i uravnoteženi planovi

Kada se izračunava korelacijska matrica za sve varijable, na primjer, za gore prikazane podatke, može se vidjeti da su glavni učinci čimbenika A i B i učinak interakcije AxB nekorelirano. Ovo svojstvo učinaka naziva se i ortogonalnost. Kažu da efekti A i B - ortogonalni ili nezavisna jedni od drugih. Ako su svi učinci u planu ortogonalni jedni na druge, kao u gornjem primjeru, tada se kaže da je plan uravnotežena.

Uravnoteženi planovi imaju "dobro svojstvo". Izračuni u analizi takvih planova vrlo su jednostavni. Svi izračuni svode se na izračun korelacije između učinaka i zavisnih varijabli. Budući da su učinci ortogonalni, djelomične korelacije (kao u cijelosti višedimenzionalni regresije) se ne izračunavaju. Međutim, u stvaran život planovi nisu uvijek uravnoteženi.

Razmotrite stvarne podatke s nejednakim brojem opažanja u ćelijama.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Ako kodiramo ove podatke kao što je gore navedeno i izračunamo korelacijsku matricu za sve varijable, tada se ispostavlja da su faktori dizajna međusobno povezani. Čimbenici u planu sada nisu ortogonalni i takvi se planovi nazivaju neuravnotežen. Imajte na umu da je u ovom primjeru korelacija između faktora u potpunosti povezana s razlikom u frekvencijama 1 i -1 u stupcima matrice podataka. Drugim riječima, eksperimentalni dizajni s nejednakim volumenom ćelija (točnije, neproporcionalnim volumenom) bit će neuravnoteženi, što znači da će se glavni učinci i interakcije miješati. U ovom slučaju, da biste izračunali statističku značajnost učinaka, morate u potpunosti izračunati multivarijantnu regresiju. Ovdje postoji nekoliko strategija.

Zbroj kvadrata tipa I, II, III i IV

Vrsta zbroja kvadratajaiIII. Za proučavanje važnosti svakog faktora u multivarijantnom modelu, može se izračunati djelomična korelacija svakog faktora, pod uvjetom da su svi drugi faktori već uzeti u obzir u modelu. Također možete unijeti faktore u model korak po korak, popravljajući sve faktore koji su već uneseni u model i zanemarujući sve ostale faktore. Općenito, ovo je razlika između tip III i tipja zbrojevi kvadrata (ova je terminologija uvedena u SAS, vidi na primjer SAS, 1982; detaljna rasprava se također može naći u Searle, 1987, str. 461; Woodward, Bonett i Brecht, 1990, str. 216; ili Milliken i Johnson, 1984., str. 138).

Vrsta zbroja kvadrataII. Sljedeća "srednja" strategija formiranja modela je: kontrolirati sve glavne učinke u proučavanju značaja jednog glavnog učinka; u kontroli svih glavnih učinaka i svih interakcija u paru, kada se ispituje značaj jedne interakcije u paru; u kontroli svih glavnih učinaka svih interakcija u paru i svih interakcija tri čimbenika; u proučavanju zasebne interakcije tri faktora itd. Ovako izračunate sume kvadrata učinaka nazivaju se tipII zbrojevi kvadrata. Tako, vrstaII sume kvadrata kontroliraju sve učinke istog reda i niže, zanemarujući sve učinke višeg reda.

Vrsta zbroja kvadrataIV. Konačno, za neke posebne planove s ćelijama koje nedostaju (nepotpuni planovi) moguće je izračunati tzv. tip IV zbrojevi kvadrata. O ovoj metodi će biti riječi kasnije u vezi s nepotpunim planovima (planovima s ćelijama koje nedostaju).

Tumačenje pretpostavke zbroja kvadrata tipa I, II i III

zbroj kvadrata tipIII najlakše protumačiti. Prisjetimo se da sume kvadrata tipIII ispitati učinke nakon kontrole svih ostalih učinaka. Na primjer, nakon pronalaska statistički značajnog tipIII učinak za faktor A u modulu Analiza varijance, možemo reći da postoji jedan značajan učinak faktora A, nakon uvođenja svih ostalih učinaka (čimbenika) i prema tome protumačiti ovaj učinak. Vjerojatno u 99% svih primjena analize varijance, ova vrsta kriterija je od interesa za istraživača. Ova vrsta zbroja kvadrata obično se izračunava u modulu Analiza varijance prema zadanim postavkama, bez obzira je li opcija odabrana Regresijski pristup ili ne (standardni pristupi usvojeni u modulu Analiza varijance razmotreno u nastavku).

Značajni učinci dobiveni korištenjem zbrojeva kvadrata tip ili tipII zbrojeve kvadrata nije tako lako protumačiti. Najbolje ih je interpretirati u kontekstu postupne multivarijantne regresije. Ako se koristi zbroj kvadrata tipja utvrđeno je da je glavni učinak faktora B značajan (nakon uključivanja faktora A u model, ali prije dodavanja interakcije između A i B), može se zaključiti da postoji značajan glavni učinak faktora B, pod uvjetom da postoji nema interakcije između faktora A i B. (Ako se koristi kriterij tipIII, faktor B se također pokazao značajnim, onda možemo zaključiti da postoji značajan glavni učinak faktora B, nakon uvođenja svih ostalih faktora i njihovih interakcija u model).

U smislu rubnih sredstava hipoteze tipja i tipII obično nemaju jednostavno tumačenje. U tim se slučajevima kaže da se ne može protumačiti značaj učinaka uzimajući u obzir samo marginalna sredstva. radije predstavljeno str srednje vrijednosti povezane su sa složenom hipotezom koja kombinira srednje vrijednosti i veličinu uzorka. Na primjer, vrstaII hipoteze za faktor A u jednostavnom primjeru dizajna 2 x 2 o kojem smo ranije raspravljali bile bi (vidi Woodward, Bonett i Brecht, 1990., str. 219):

nij- broj promatranja u ćeliji

uij- prosječna vrijednost u ćeliji

n. j- granični prosjek

Ne ulazeći u detalje (za više detalja vidi Milliken i Johnson, 1984., 10. poglavlje), jasno je da ovo nisu jednostavne hipoteze i da u većini slučajeva nijedna od njih nije od posebnog interesa za istraživača. Međutim, postoje slučajevi kada hipoteze tipja može biti od interesa.

Zadani računalni pristup u modulu Analiza varijance

Zadano ako opcija nije označena Regresijski pristup, modul Analiza varijance koristi model prosječne ćelije. Za ovaj je model karakteristično da se zbrojevi kvadrata za različite učinke izračunavaju za linearne kombinacije srednjih vrijednosti ćelija. U potpunom faktorijelnom pokusu, ovo rezultira zbrojevima kvadrata koji su isti kao zbrojevi kvadrata o kojima smo govorili ranije kao vrsta III. Međutim, u opciji Planirane usporedbe(u prozoru Analiza rezultata varijance), korisnik može postaviti hipotezu o bilo kojoj linearnoj kombinaciji ponderiranih ili neponderiranih srednjih vrijednosti ćelija. Dakle, korisnik može testirati ne samo hipoteze tipIII, ali hipoteze bilo koje vrste (uključujući vrstaIV). Ovaj opći pristup osobito korisno pri ispitivanju dizajna s ćelijama koje nedostaju (tzv. nepotpuni dizajni).

Za potpune faktorijelne dizajne ovaj je pristup također koristan kada se žele analizirati ponderirane granične sredine. Na primjer, pretpostavimo da u jednostavnom dizajnu 2 x 2 koji smo ranije razmotrili, želimo usporediti ponderirane (u smislu razina faktora) B) granični prosjeci za faktor A. Ovo je korisno kada distribuciju opažanja po stanicama nije pripremio eksperimentator, nego je ona izgrađena nasumično, a ta se slučajnost odražava u distribuciji broja opažanja prema razinama faktora B u agregatu .

Na primjer, postoji faktor - dob udovica. Mogući uzorak ispitanika podijeljen je u dvije skupine: mlađe od 40 godina i starije od 40 godina (faktor B). Drugi čimbenik (faktor A) u planu je jesu li udovice primale socijalnu potporu od neke agencije (dok su neke udovice bile nasumično odabrane, druge su služile kao kontrola). U ovom slučaju, dobna distribucija udovica u uzorku odražava stvarnu dobnu distribuciju udovica u populaciji. Procjena učinkovitosti grupe socijalne podrške za udovice sve godine odgovarat će ponderiranom prosjeku za dvije dobne skupine (s težinama koje odgovaraju broju opažanja u skupini).

Planirane usporedbe

Imajte na umu da zbroj unesenih omjera kontrasta nije nužno jednak 0 (nula). Umjesto toga, program će automatski napraviti prilagodbe tako da se odgovarajuće hipoteze ne miješaju s ukupnim prosjekom.

Da bismo to ilustrirali, vratimo se jednostavnom planu 2 x 2 o kojem smo ranije govorili. Podsjetimo se da je broj stanica ovog neuravnoteženog dizajna -1, 2, 3 i 1. Recimo da želimo usporediti ponderirane granične prosjeke za faktor A (ponderirane učestalošću razina faktora B). Možete unijeti omjere kontrasta:

Imajte na umu da zbroj ovih koeficijenata ne iznosi 0. Program će postaviti koeficijente tako da njihov zbroj iznosi 0, zadržavajući njihov relativne vrijednosti, tj.:

1/3 2/3 -3/4 -1/4

Ovi kontrasti će usporediti ponderirane prosjeke za faktor A.

Hipoteze o glavnoj sredini. Hipoteza da je neponderirana glavna sredina 0 može se istražiti pomoću koeficijenata:

Hipoteza da je ponderirana glavna sredina 0 testirana je pomoću:

Ni u kojem slučaju program ne ispravlja omjere kontrasta.

Analiza planova s ​​ćelijama koje nedostaju (nepotpuni planovi)

Faktorski dizajni koji sadrže prazne ćelije (obrada kombinacija ćelija u kojima nema opažanja) nazivaju se nepotpunim. U takvim dizajnima neki faktori obično nisu ortogonalni i neke se interakcije ne mogu izračunati. Uopće ne postoji najbolja metoda analizu takvih planova.

Regresijski pristup

U nekim starijim programima koji se oslanjaju na analizu ANOVA dizajna korištenjem multivarijatne regresije, zadani faktori u nepotpunim dizajnima dani su na uobičajeni način(kao da je plan gotov). Zatim se provodi multivarijatna regresijska analiza za te lažno kodirane faktore. Nažalost, ova metoda dovodi do rezultata koje je vrlo teško, ako ne i nemoguće, protumačiti jer nije jasno kako svaki učinak doprinosi linearnoj kombinaciji srednjih vrijednosti. Razmotrite sljedeći jednostavan primjer.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Promašeno

Ako je multivarijatna regresija obrasca Zavisna varijabla = Konstanta + Faktor A + Faktor B, tada hipoteza o značaju faktora A i B u smislu linearnih kombinacija sredina izgleda ovako:

Faktor A: Ćelija A1,B1 = Ćelija A2,B1

Faktor B: Ćelija A1,B1 = Ćelija A1,B2

Ovaj slučaj je jednostavan. U više komplicirane planove nemoguće je zapravo odrediti što će se točno istraživati.

Srednje stanice, pristup analizi varijance , hipoteze tipa IV

Pristup koji se preporučuje u literaturi i čini se poželjnijim jest proučavanje smislenih (u smislu istraživačkih zadataka) apriorno hipoteze o sredstvima promatranim u ćelijama plana. Detaljna rasprava o ovom pristupu može se pronaći u Dodge (1985), Heiberger (1989), Milliken i Johnson (1984), Searle (1987) ili Woodward, Bonett i Brecht (1990). Zbrojevi kvadrata povezani s hipotezama o linearnoj kombinaciji sredina u nepotpunim dizajnima, istražujući procjene dijela učinaka, također se nazivaju zbrojevi kvadrata. IV.

Automatsko generiranje tipskih hipotezaIV. Kada multivarijatni dizajni imaju složen uzorak stanica koje nedostaju, poželjno je definirati ortogonalne (neovisne) hipoteze čije je istraživanje ekvivalentno istraživanju glavnih učinaka ili interakcija. Algoritamske (računalne) strategije (temeljene na pseudo-inverznoj matrici dizajna) razvijene su za generiranje odgovarajućih težina za takve usporedbe. Nažalost, konačne hipoteze nisu jednoznačno definirane. Naravno, oni ovise o redoslijedu kojim su učinci definirani i rijetko ih je lako protumačiti. Stoga se preporuča pažljivo proučiti prirodu stanica koje nedostaju, a zatim formulirati hipoteze tipIV, koji su najrelevantniji za ciljeve studije. Zatim istražite te hipoteze koristeći opciju Planirane usporedbe u prozoru rezultate. Najlakši način za specificiranje usporedbi u ovom slučaju je zahtijevanje uvođenja vektora kontrasta za sve faktore zajedno u prozoru Planirane usporedbe. Nakon poziva dijaloškog okvira Planirane usporedbe bit će prikazane sve grupe trenutnog plana, a one koje su izostavljene bit će označene.

Preskočene ćelije i provjera specifičnog učinka

Postoji nekoliko vrsta planova u kojima mjesto stanica koje nedostaju nije slučajno, već pažljivo planirano, što omogućuje jednostavnu analizu glavnih učinaka bez utjecaja na druge učinke. Na primjer, kada potreban broj ćelija u planu nije dostupan, često se koriste planovi. latinski kvadrati procijeniti glavne učinke nekoliko čimbenika s velikim brojem razina. Na primjer, faktorski dizajn 4 x 4 x 4 x 4 zahtijeva 256 ćelija. U isto vrijeme, možete koristiti Grčko-latinski trg za procjenu glavnih učinaka, imajući samo 16 ćelija u planu (pogl. Planiranje pokusa, svezak IV, sadrži Detaljan opis takvi planovi). Nepotpuni dizajni u kojima se glavni učinci (i neke interakcije) mogu procijeniti pomoću jednostavnih linearnih kombinacija srednjih vrijednosti nazivaju se uravnoteženi nepotpuni planovi.

U uravnoteženim dizajnima, standardna (zadana) metoda generiranja kontrasta (težina) za glavne efekte i interakcije zatim će proizvesti analizu tablice varijanci u kojoj se zbrojevi kvadrata za odgovarajuće efekte međusobno ne miješaju. Opcija Specifični učinci prozor rezultateće generirati kontraste koji nedostaju upisivanjem nule u ćelije plana koje nedostaju. Odmah nakon što je opcija zatražena Specifični učinci za korisnika koji proučava neku hipotezu, pojavljuje se tablica rezultata sa stvarnim težinama. Imajte na umu da se u uravnoteženom dizajnu zbrojevi kvadrata odgovarajućih učinaka izračunavaju samo ako su ti učinci ortogonalni (neovisni) u odnosu na sve druge glavne učinke i interakcije. U suprotnom, koristite opciju Planirane usporedbe istražiti smislene usporedbe između sredstava.

Ćelije koje nedostaju i kombinirani učinci/članovi pogreške

Ako opcija Regresijski pristup u ploči za pokretanje modula Analiza varijance nije odabrano, model prosječnih ćelija koristit će se pri izračunu zbroja kvadrata za učinke (zadana postavka). Ako dizajn nije uravnotežen, onda kada se kombiniraju neortogonalni efekti (pogledajte gornju raspravu o opciji Stanice koje nedostaju i specifični učinak) može se dobiti zbroj kvadrata koji se sastoji od neortogonalnih (ili preklapajućih) komponenti. Ovako dobiveni rezultati obično se ne mogu interpretirati. Stoga treba biti vrlo oprezan pri odabiru i implementaciji složenih nepotpunih eksperimentalnih dizajna.

Postoje mnoge knjige koje detaljno govore o planovima. drugačiji tip. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken i Johnson, 1984; Searle, 1987; Woodward i Bonett, 1990), ali ova vrsta informacija je izvan dosega ovog udžbenika. Međutim, kasnije u ovom odjeljku prikazat ćemo analizu različite vrste planovi.

Pretpostavke i učinci kršenja pretpostavki

Odstupanje od pretpostavke normalne distribucije

Pretpostavimo da se zavisna varijabla mjeri na numeričkoj skali. Pretpostavimo također da zavisna varijabla ima normalnu distribuciju unutar svake grupe. Analiza varijance sadrži širok raspon grafikona i statistike za potvrđivanje ove pretpostavke.

Učinci kršenja. općenito F kriterij je vrlo otporan na odstupanje od normalnosti (vidi Lindman, 1974. za detaljne rezultate). Ako je kurtosis veći od 0, tada je vrijednost statistike F mogu postati vrlo male. Nulta hipoteza je prihvaćena, iako možda nije istinita. Situacija je obrnuta kada je kurtosis manji od 0. Asimetrija distribucije obično ima mali učinak na F statistika. Ako je broj opažanja u ćeliji dovoljno velik, tada odstupanja od normale nema poseban značaj zahvaljujući središnji granični teorem , prema kojem je raspodjela srednje vrijednosti blizu normalne, bez obzira na početnu raspodjelu. Detaljna rasprava o održivosti F statistike se mogu naći u Box i Anderson (1955), ili Lindman (1974).

Homogenost disperzije

Pretpostavke. Pretpostavlja se da su varijance različitih skupina plana iste. Ta se pretpostavka naziva pretpostavkom homogenost disperzije. Podsjetimo se da smo na početku ovog odjeljka, kada smo opisivali izračun zbroja kvadrata pogrešaka, izvršili zbrajanje unutar svake skupine. Ako se varijance u dvije skupine razlikuju jedna od druge, tada njihovo zbrajanje nije baš prirodno i ne daje procjenu ukupne varijance unutar grupe (budući da u ovom slučaju uopće nema opće varijance). Modul Analiza disperzije -ANOVA/MANOVA sadrži veliki set statistički kriteriji otkrivanje odstupanja od pretpostavki homogenosti varijance.

Učinci kršenja. Lindman (1974., str. 33) to pokazuje F kriterij je prilično stabilan u odnosu na kršenje pretpostavki o homogenosti varijance ( heterogenost disperzija, vidi također Box, 1954a, 1954b; Hsu, 1938).

Poseban slučaj: korelacija srednjih vrijednosti i varijanci. Ima trenutaka kada F statistika može zavesti. To se događa kada su srednje vrijednosti u ćelijama dizajna u korelaciji s varijancom. Modul Analiza varijance omogućuje vam iscrtavanje dijagrama raspršenosti varijance ili standardne devijacije u odnosu na sredstva za otkrivanje takve korelacije. Razlog zašto je takva korelacija opasna je sljedeći. Zamislimo da je na planu 8 ćelija, od kojih 7 ima gotovo isti prosjek, au jednoj ćeliji prosjek je puno veći od ostalih. Zatim F test može detektirati statistički značajan učinak. Ali pretpostavimo da je u ćeliji s velikom srednjom vrijednošću varijanca mnogo veća od ostalih, tj. srednja vrijednost i varijanca u stanicama su ovisne (što je veća srednja vrijednost, veća je varijanca). U ovom slučaju, velika srednja vrijednost je nepouzdana, jer može biti uzrokovana velikim odstupanjem u podacima. Međutim F statistika na temelju ujedinjen varijanca unutar ćelija obuhvatit će veliku srednju vrijednost, iako kriteriji temeljeni na varijanci u svakoj ćeliji neće sve razlike u sredinama smatrati značajnima.

Ovakva priroda podataka (velika srednja vrijednost i velika varijanca) često se susreće kada postoje izvanredna opažanja. Jedno ili dva izvanredna opažanja snažno pomiču srednju vrijednost i znatno povećavaju varijancu.

Homogenost varijance i kovarijance

Pretpostavke. U multivarijantnim dizajnima, s viševarijantnim ovisnim mjerama, također se primjenjuju homogene pretpostavke varijance koje su ranije opisane. Međutim, budući da postoje viševarijantne ovisne varijable, također je potrebno da njihove unakrsne korelacije (kovarijance) budu ujednačene u svim ćelijama plana. Modul Analiza varijance ponude različiti putevi testiranje ovih pretpostavki.

Učinci kršenja. Višedimenzionalni analog F- kriterij - λ-test Wilksa. Ne zna se mnogo o stabilnosti (robustnosti) Wilksovog λ-testa s obzirom na kršenje gornjih pretpostavki. Međutim, budući da interpretacija rezultata modula Analiza varijance obično se temelji na značaju jednodimenzionalnih učinaka (nakon utvrđivanja značaja opći kriterij), rasprava o robusnosti tiče se uglavnom jednodimenzionalne analize varijance. Stoga treba pažljivo ispitati značaj jednodimenzionalnih učinaka.

Poseban slučaj: analiza kovarijance. Osobito teške povrede homogenosti varijance/kovarijance mogu se pojaviti kada su kovarijable uključene u dizajn. Konkretno, ako je korelacija između kovarijabli i zavisnih mjera različita u različitim ćelijama dizajna, može uslijediti pogrešno tumačenje rezultata. Treba imati na umu da se u analizi kovarijance, u biti, regresijska analiza provodi unutar svake ćelije kako bi se izolirao onaj dio varijance koji odgovara kovarijanti. Pretpostavka o homogenosti varijance/kovarijance pretpostavlja da se ova regresijska analiza izvodi pod sljedećim ograničenjem: sve regresijske jednadžbe(nagibi) su isti za sve ćelije. Ako to nije predviđeno, mogu se pojaviti velike pogreške. Modul Analiza varijance ima nekoliko posebnih kriterija za testiranje ove pretpostavke. Možda bi bilo preporučljivo koristiti ove kriterije kako biste bili sigurni da su regresijske jednadžbe za različite ćelije približno iste.

Sferičnost i složena simetrija: razlozi za korištenje pristupa multivarijantnih ponovljenih mjera u analizi varijance

U dizajnu koji sadrži faktore ponovljenih mjerenja s više od dvije razine, primjena univarijantne analize varijance zahtijeva dodatne pretpostavke: pretpostavke složene simetrije i pretpostavke sferičnosti. Ove se pretpostavke rijetko ispunjavaju (vidi dolje). Stoga je posljednjih godina multivarijatna analiza varijance stekla popularnost u takvim planovima (oba pristupa kombinirana su u modulu Analiza varijance).

Pretpostavka složene simetrije Pretpostavka složene simetrije je da su varijance (ukupno unutar grupe) i kovarijance (po grupi) za različite ponovljene mjere ujednačene (iste). Ovo je dovoljan uvjet da univarijantni F test za ponovljena mjerenja bude valjan (tj. prijavljene F-vrijednosti su u prosjeku konzistentne s F-distribucijom). Međutim, u ovaj slučaj ovaj uvjet nije neophodan.

Pretpostavka sferičnosti. Pretpostavka sferičnosti je nužna i dovoljan uvjet kako bi F-test bio opravdan. Sastoji se u tome da su unutar grupa sva promatranja neovisna i ravnomjerno raspoređena. Priroda ovih pretpostavki, kao i utjecaj njihovog kršenja, obično nisu dobro opisani u knjigama o analizi varijance - ova će biti opisana u sljedećim paragrafima. Također će pokazati da se rezultati univarijatnog pristupa mogu razlikovati od rezultata multivarijatnog pristupa i objasniti što to znači.

Potreba za neovisnošću hipoteza. Opći način analize podataka u analizi varijance je pristajanje modela. Ako ih, s obzirom na model koji odgovara podacima, ima apriorno hipoteze, tada se varijanca dijeli kako bi se testirale te hipoteze (kriteriji za glavne učinke, interakcije). S računalne točke gledišta, ovaj pristup stvara neki skup kontrasta (skup usporedbi sredstava u dizajnu). Međutim, ako kontrasti nisu neovisni jedni o drugima, dijeljenje varijanci postaje besmisleno. Na primjer, ako su dva kontrasta A i B su identični i odgovarajući dio se odabire iz varijance, zatim se isti dio bira dva puta. Na primjer, glupo je i besmisleno izdvajati dvije hipoteze: “srednja vrijednost u ćeliji 1 veća je od prosjeka u ćeliji 2” i “srednja vrijednost u ćeliji 1 je viša od prosjeka u ćeliji 2”. Dakle, hipoteze moraju biti neovisne ili ortogonalne.

Neovisne hipoteze u ponovljenim mjerenjima. Opći algoritam, implementiran u modulu Analiza varijance, pokušat će generirati neovisne (ortogonalne) kontraste za svaki učinak. Što se tiče faktora ponovljenih mjerenja, ovi kontrasti dovode do mnogih hipoteza o Razlike između razina razmatranog faktora. Međutim, ako su te razlike u korelaciji unutar skupina, tada rezultirajući kontrasti više nisu neovisni. Na primjer, u obuci gdje se učenici mjere tri puta u jednom semestru, može se dogoditi da su promjene između 1. i 2. dimenzije negativno povezane s promjenom između 2. i 3. dimenzije predmeta. Oni koji su svladali većinu gradiva između 1. i 2. dimenzije, svladavaju manji dio tijekom vremena koje je proteklo između 2. i 3. dimenzije. Zapravo, za većinu slučajeva gdje se analiza varijance koristi u ponovljenim mjerenjima, može se pretpostaviti da su promjene u razinama u korelaciji između ispitanika. Međutim, kada se to dogodi, složene pretpostavke o simetriji i sferičnosti nisu ispunjene i nezavisni kontrasti se ne mogu izračunati.

Utjecaj kršenja i načini njihovog ispravljanja. Kada složene pretpostavke o simetriji ili sferičnosti nisu ispunjene, analiza varijance može dati pogrešne rezultate. Prije nego što su multivarijatni postupci bili dovoljno razvijeni, napravljeno je nekoliko pretpostavki kako bi se nadoknadila kršenja ovih pretpostavki. (Vidi, na primjer, Greenhouse & Geisser, 1959. i Huynh & Feldt, 1970.). Ove metode su i danas u širokoj upotrebi (zato su i predstavljene u modulu Analiza varijance).

Multivarijantna analiza varijance pristupa ponovljenim mjerenjima. Općenito, problemi složene simetrije i sferičnosti odnose se na činjenicu da skupovi kontrasta uključeni u proučavanje učinaka faktora ponovljenih mjerenja (s više od 2 razine) nisu neovisni jedni o drugima. Međutim, oni ne moraju biti neovisni ako se koriste. višedimenzionalni kriterij za istovremeno testiranje statističke značajnosti dviju ili više ponovljenih mjera kontrasta faktora. To je razlog zašto se metode multivarijatne analize varijance sve više koriste za testiranje značajnosti univarijatnih faktora ponovljenih mjerenja s više od 2 razine. Ovaj pristup se široko koristi jer općenito ne zahtijeva pretpostavku složene simetrije i pretpostavku sferičnosti.

Slučajevi u kojima se ne može koristiti pristup multivarijatne analize varijance. Postoje primjeri (planovi) kada se ne može primijeniti pristup multivarijantne analize varijance. To su obično slučajevi u kojima postoji mali broj subjekata u dizajnu i mnogo razina u faktoru ponovljenih mjerenja. Tada može biti premalo opažanja za izvođenje multivarijantne analize. Na primjer, ako postoji 12 entiteta, str = 4 faktor ponovljenih mjerenja, a svaki faktor ima k = 3 razine. Tada će interakcija 4 faktora “trošiti” (k-1) str = 2 4 = 16 stupnjevi slobode. Međutim, postoji samo 12 subjekata, stoga se multivarijatni test ne može provesti u ovom primjeru. Modul Analiza varijance samostalno će detektirati ta opažanja i izračunati samo jednodimenzionalne kriterije.

Razlike u univarijantnim i multivarijantnim rezultatima. Ako studija uključuje velik broj ponovljenih mjerenja, mogu postojati slučajevi u kojima univarijantni pristup ponovljenih mjerenja ANOVA-e daje rezultate koji se jako razlikuju od onih dobivenih multivarijantnim pristupom. To znači da su razlike između razina dotičnih ponovljenih mjerenja u korelaciji između ispitanika. Ponekad je ova činjenica od nekog neovisnog interesa.

Multivarijantna analiza varijance i strukturno modeliranje jednadžbi

Posljednjih je godina modeliranje strukturnih jednadžbi postalo popularno kao alternativa multivarijantnoj analizi disperzije (vidi, na primjer, Bagozzi i Yi, 1989; Bagozzi, Yi i Singh, 1991; Cole, Maxwell, Arvey i Salas, 1993). Ovaj vam pristup omogućuje testiranje hipoteza ne samo o srednjim vrijednostima u različitim skupinama, već i o korelacijskim matricama zavisnih varijabli. Na primjer, možete ublažiti pretpostavke o homogenosti varijance i kovarijance i eksplicitno uključiti pogreške u model za svaku grupu varijance i kovarijance. Modul STATISTIKAModeliranje strukturnih jednadžbi (SEPATH) (vidi Svezak III) dopušta takvu analizu.

Analiza varijance

1. Pojam analize varijance

Analiza varijance- ovo je analiza varijabilnosti svojstva pod utjecajem bilo kojeg kontroliranog varijabilnog čimbenika. U stranoj literaturi analiza varijance često se naziva ANOVA, što se prevodi kao analiza varijance (Analysis of Variance).

Zadatak analize varijance sastoji se u izoliranju varijabilnosti različite vrste od opće varijabilnosti svojstva:

a) varijabilnost zbog djelovanja svake od proučavanih nezavisnih varijabli;

b) varijabilnost zbog međudjelovanja proučavanih nezavisnih varijabli;

c) slučajna varijacija zbog svih ostalih nepoznatih varijabli.

Varijabilnost zbog djelovanja proučavanih varijabli i njihove interakcije korelira sa slučajnom varijabilnošću. Pokazatelj ovog omjera je Fisherov F test.

Formula za izračun kriterija F uključuje procjene varijanci, odnosno parametara distribucije obilježja, stoga je kriterij F parametarski kriterij.

nego u više varijabilnost svojstva posljedica je proučavanih varijabli (čimbenika) ili njihove interakcije, što je veća empirijske vrijednosti kriterija.

Nula hipoteza u analizi varijance će reći da su prosječne vrijednosti proučavanog efektivnog svojstva u svim gradacijama iste.

Alternativa hipoteza će tvrditi da su prosječne vrijednosti efektivnog atributa u različitim gradacijama proučavanog faktora različite.

Analiza varijance nam omogućuje konstataciju promjene svojstva, ali ne indicira smjer ove promjene.

Počnimo analizu varijance s najjednostavnijim slučajem, kada proučavamo djelovanje samo jedan varijabla (jedan faktor).

2. Jednosmjerna analiza varijance za nepovezane uzorke

2.1. Svrha metode

Metoda univarijantne analize varijance koristi se u slučajevima kada se proučavaju promjene efektivnog atributa pod utjecajem promjenjivih uvjeta ili stupnjevanja bilo kojeg faktora. U ovoj verziji metode utjecaj svake gradacije faktora je razne uzorak ispitanika. Moraju postojati najmanje tri gradacije faktora. (Mogu postojati dvije gradacije, ali u ovom slučaju nećemo moći uspostaviti nelinearne ovisnosti i čini se razumnijim koristiti jednostavnije).

Neparametarska varijanta ove vrste analize je Kruskal-Wallis H test.

Hipoteze

H 0: Razlike između faktorskih ocjena (različiti uvjeti) nisu ništa izraženije od slučajnih razlika unutar svake skupine.

H 1: Razlike između stupnjevanja faktora (različiti uvjeti) su izraženije od slučajnih razlika unutar svake skupine.

2.2. Ograničenja univarijatne analize varijance za nepovezane uzorke

1. Univarijatna analiza varijance zahtijeva najmanje tri gradacije faktora i najmanje dva subjekta u svakoj gradaciji.

2. Rezultirajuća osobina mora biti normalno raspoređena u ispitivanom uzorku.

Istina, obično se ne navodi radi li se o distribuciji svojstva u cijelom ispitivanom uzorku ili u onom njegovom dijelu koji čini disperzijski kompleks.

3. Primjer rješavanja problema metodom jednofaktorske analize varijance za nepovezane uzorke na primjeru:

Tri različite skupine od šest ispitanika dobile su popise od deset riječi. Riječi su prvoj skupini predstavljene niskom brzinom od 1 riječi u 5 sekundi, drugoj skupini prosječnom brzinom od 1 riječi u 2 sekunde, a trećoj skupini visokom brzinom od 1 riječi u sekundi. Predviđeno je da učinak reprodukcije ovisi o brzini prezentacije riječi. Rezultati su prikazani u tablici. jedan.

Broj reproduciranih riječi stol 1

broj predmeta

mala brzina

Prosječna brzina

velika brzina

ukupni iznos

H 0: Razlike u glasnoći riječi između skupine nisu ništa izraženije od slučajnih razlika unutra svaka grupa.

H1: Razlike u glasnoći riječi između skupine su izraženije od slučajnih razlika unutra svaka grupa. Koristeći eksperimentalne vrijednosti prikazane u tablici. 1, utvrdit ćemo neke vrijednosti koje će biti potrebne za izračun kriterija F.

Izračun glavnih veličina za jednosmjernu analizu varijance prikazan je u tablici:

tablica 2

Tablica 3

Redoslijed operacija u jednosmjernoj ANOVA za nepovezane uzorke

Često korištena u ovoj i sljedećim tablicama, oznaka SS je kratica za "zbroj kvadrata". Ova se kratica najčešće koristi u prevedenim izvorima.

SS činjenica znači varijabilnost svojstva, zbog djelovanja proučavanog faktora;

SS uobičajen- opća varijabilnost svojstva;

S CA- varijabilnost zbog faktora koji nisu uzeti u obzir, "slučajna" ili "rezidualna" varijabilnost.

MS - "srednji trg", ili srednja vrijednost zbroja kvadrata, prosječna vrijednost odgovarajućeg SS.

df - broj stupnjeva slobode, koji smo, razmatrajući neparametarske kriterije, označili grčkim slovom v.

Zaključak: H 0 je odbijen. H 1 je prihvaćen. Razlike u volumenu reprodukcije riječi među skupinama izraženije su od slučajnih razlika unutar svake skupine (α=0,05). Dakle, brzina prezentacije riječi utječe na volumen njihove reprodukcije.

U nastavku je prikazan primjer rješavanja problema u Excelu:

Početni podaci:

Naredbom: Alati->Analiza podataka->Jednosmjerna analiza varijance dobivamo sljedeće rezultate: