Biografije Karakteristike Analiza

Metode istraživanja analiza korelacije disperzije. ANOVA METODE

Analiza varijanse

1. Koncept analiza varijanse

Analiza varijanse- ovo je analiza varijabilnosti osobine pod uticajem bilo kojeg kontrolisanog varijabilnog faktora. U stranoj literaturi, analiza varijanse se često naziva ANOVA, što se prevodi kao analiza varijanse (Analysis of Variance).

Zadatak analize varijanse sastoji se u izolovanju varijabilnosti različite vrste od opšte varijabilnosti osobine:

a) varijabilnost zbog djelovanja svake od proučavanih nezavisnih varijabli;

b) varijabilnost zbog interakcije proučavanih nezavisnih varijabli;

c) slučajna varijacija zbog svih ostalih nepoznatih varijabli.

Varijabilnost zbog djelovanja proučavanih varijabli i njihove interakcije je u korelaciji sa slučajnom varijabilnošću. Pokazatelj ovog omjera je Fišerov F test.

Formula za izračunavanje kriterijuma F uključuje procene varijansi, odnosno parametara distribucije obeležja, stoga je kriterijum F parametarski kriterijum.

Nego u više varijabilnost osobine je zbog proučavanih varijabli (faktora) ili njihove interakcije, što je veća empirijske vrijednosti kriterija.

Zero hipoteza u analizi varijanse će reći da su prosječne vrijednosti proučavane efektivne osobine u svim gradacijama iste.

Alternativa hipoteza će reći da su prosječne vrijednosti efektivnog atributa u različitim gradacijama proučavanog faktora različite.

Analiza varijanse nam omogućava da konstatujemo promjenu osobine, ali ne ukazuje smjer ove promjene.

Počnimo analizu varijanse s najjednostavnijim slučajem, kada proučavamo samo djelovanje jedan varijabla (jedan faktor).

2. Jednosmjerna analiza varijanse za nepovezane uzorke

2.1. Svrha metode

Metoda univarijantne analize varijanse koristi se u slučajevima kada se proučavaju promjene efektivnog atributa pod utjecajem promjenjivih uslova ili gradacija bilo kojeg faktora. U ovoj verziji metode, uticaj svake od gradacija faktora je razne uzorak ispitanika. Moraju postojati najmanje tri gradacije faktora. (Možda postoje dvije gradacije, ali u ovom slučaju nećemo moći uspostaviti nelinearne zavisnosti i čini se da je razumnije koristiti jednostavnije).

Neparametrijska varijanta ove vrste analize je Kruskal-Wallis H test.

Hipoteze

H 0: Razlike između faktorskih ocena (različiti uslovi) nisu ništa izraženije od slučajnih razlika unutar svake grupe.

H 1: Razlike između gradacija faktora (različiti uslovi) su izraženije nego slučajne razlike unutar svake grupe.

2.2. Ograničenja univarijantne analize varijanse za nepovezane uzorke

1. Univarijantna analiza varijanse zahtijeva najmanje tri gradacije faktora i najmanje dva predmeta u svakoj gradaciji.

2. Rezultirajuća osobina mora biti normalno raspoređena u ispitivanom uzorku.

Istina, obično nije naznačeno da li je riječ o distribuciji neke osobine u cijelom ispitivanom uzorku ili u onom njegovom dijelu koji čini kompleks disperzije.

3. Primjer rješavanja problema metodom jednofaktorske analize varijanse za nepovezane uzorke na primjeru:

Tri različite grupe od šest ispitanika dobile su liste od deset riječi. Prvoj grupi riječi su predstavljene malom brzinom od 1 riječ u 5 sekundi, drugoj grupi prosječnom brzinom od 1 riječi u 2 sekunde, a trećoj grupi velikom brzinom od 1 riječi u sekundi. Predviđeno je da će performanse reprodukcije zavisiti od brzine prezentacije reči. Rezultati su prikazani u tabeli. jedan.

Broj reproduciranih riječi Tabela 1

broj predmeta

mala brzina

prosječna brzina

velika brzina

ukupan iznos

H 0: Razlike u volumenu riječi između grupe nisu izraženije od slučajnih razlika unutra svaka grupa.

H1: Razlike u volumenu riječi između grupe su izraženije od slučajnih razlika unutra svaka grupa. Koristeći eksperimentalne vrijednosti prikazane u tabeli. 1, ustanovit ćemo neke vrijednosti koje će biti potrebne za izračunavanje kriterija F.

Izračun glavnih veličina za jednosmjernu analizu varijanse prikazan je u tabeli:

tabela 2

Tabela 3

Redoslijed operacija u jednosmjernoj ANOVA-i za nepovezane uzorke

Često korištena u ovoj i sljedećim tabelama, oznaka SS je skraćenica za "zbir kvadrata". Ova skraćenica se najčešće koristi u prevedenim izvorima.

SS činjenica označava varijabilnost osobine, usled delovanja proučavanog faktora;

SS često- opšta varijabilnost osobine;

S CA- varijabilnost zbog neuračunatih faktora, "slučajne" ili "rezidualne" varijabilnosti.

GOSPOĐA - "srednji kvadrat“, ili srednja vrijednost zbira kvadrata, prosječna vrijednost odgovarajućeg SS.

df - broj stepena slobode, koji smo, uzimajući u obzir neparametarske kriterijume, označili grčkim slovom v.

Zaključak: H 0 je odbijen. H 1 je prihvaćen. Razlike u obimu reprodukcije riječi između grupa su izraženije od slučajnih razlika unutar svake grupe (α=0,05). Dakle, brzina prezentacije riječi utječe na volumen njihove reprodukcije.

U nastavku je prikazan primjer rješavanja problema u Excelu:

Početni podaci:

Koristeći naredbu: Alati->Analiza podataka->Jednosmjerna analiza varijanse, dobijamo sljedeće rezultate:

Metode verifikacije o kojima smo gore govorili statističke hipoteze o značaju razlika između dva prosjeka u praksi su od ograničene upotrebe. To je zbog činjenice da u cilju identifikacije uticaja svih mogućih uslova i faktora na proizvodni atribut, polje i laboratorijski eksperimenti, u pravilu se provodi korištenjem ne dva, već veći broj uzoraka (1220 ili više).

Istraživači često uspoređuju srednje vrijednosti nekoliko uzoraka kombinovanih u pojedinačni kompleks. Na primjer, proučavanje efekta razne vrste i dozama gnojiva na prinose usjeva, eksperimenti se ponavljaju u različite opcije. U tim slučajevima poređenje u paru postaje glomazno, a statistička analiza cijelog kompleksa zahtijeva korištenje posebne metode. Ova metoda, razvijena u matematičkoj statistici, naziva se analiza varijanse. Prvi ga je upotrebio engleski statističar R. Fisher prilikom obrade rezultata agronomskih eksperimenata (1938).

Analiza varijanse je metoda statistička evaluacija pouzdanost manifestacije zavisnosti efektivne karakteristike od jednog ili više faktora. Koristeći metodu analize varijanse, testiraju se statističke hipoteze u vezi sa prosjekom u nekoliko općih populacija koje imaju normalnu distribuciju.

Analiza varijanse je jedna od glavnih metoda statističke evaluacije rezultata eksperimenta. Takođe se sve više koristi u analizi ekonomskih informacija. Analiza varijanse omogućava da se utvrdi koliko su selektivni pokazatelji odnosa između efektivnih i faktorskih znakova dovoljni za diseminaciju podataka dobijenih iz uzorka na opštu populaciju. Prednost ove metode je što daje prilično pouzdane zaključke iz malih uzoraka.

Ispitivanjem varijacije rezultujućeg atributa pod uticajem jednog ili više faktora, koristeći analizu varijanse, može se dobiti, pored opštih procena značajnosti zavisnosti, i ocena razlika u prosečnim vrednostima koje formiraju se na različitim nivoima faktora, te značaj interakcije faktora. Analiza varijanse se koristi za proučavanje zavisnosti i kvantitativnih i kvalitativne karakteristike, kao i njihovu kombinaciju.

Suština ove metode je statistička studija verovatnoća uticaja jednog ili više faktora, kao i njihova interakcija na efektivno obeležje. U skladu s tim, uz pomoć analize disperzije rješavaju se tri glavna zadatka: 1) ukupni rezultat značaj razlika između grupnih sredstava; 2) procena verovatnoće interakcije faktora; 3) procena značajnosti razlika između parova sredstava. Najčešće takve probleme istraživači moraju rješavati prilikom izvođenja terenskih i zootehničkih eksperimenata, kada se proučava utjecaj više faktora na rezultirajuću osobinu.

Osnovna shema disperzione analize uključuje utvrđivanje glavnih izvora varijacije efektivne karakteristike i određivanje obima varijacije (zbira kvadrata odstupanja) prema izvorima njenog formiranja; određivanje broja stupnjeva slobode koji odgovaraju komponentama ukupne varijacije; izračunavanje varijansi kao omjera odgovarajućih volumena varijacije i njihovog broja stupnjeva slobode; analiza odnosa između disperzija; procjena pouzdanosti razlike između prosjeka i formulisanje zaključaka.

Ova šema je sačuvana i u jednostavnim ANOVA modelima, kada su podaci grupirani prema jednom atributu, iu složenim modelima, kada su podaci grupirani prema dva i veliki broj znakovi. Međutim, s povećanjem broja grupnih karakteristika, proces dekompozicije opće varijacije prema izvorima njenog formiranja postaje složeniji.

Prema dijagram strujnog kola analiza varijanse može se predstaviti kao pet uzastopnih koraka:

1) definicija i dekompozicija varijacije;

2) određivanje broja stepeni slobode varijacije;

3) proračun disperzija i njihovih odnosa;

4) analizu disperzija i njihovih odnosa;

5) procena pouzdanosti razlike između srednjih vrednosti i formulisanje zaključaka o testiranju nulte hipoteze.

Najzahtjevniji dio analize varijanse je prva faza – definicija i dekompozicija varijacije prema izvorima njenog formiranja. Redoslijed proširenja ukupnog volumena varijacije detaljno je razmotren u poglavlju 5.

Osnova za rješavanje problema disperzione analize je zakon ekspanzije (sabiranja) varijacije, prema kojem opšta varijacija(fluktuacije) efektivnog atributa dijelimo na dva: varijaciju zbog djelovanja proučavanog faktora (faktora) i varijaciju uzrokovanu djelovanjem slučajnih uzroka, tj.

Pretpostavimo da je ispitana populacija podijeljena prema faktorskom atributu u nekoliko grupa, od kojih je svaka karakterizirana svojim vlastitim prosjek efektivan znak. U isto vrijeme, varijacija ovih vrijednosti može se objasniti s dvije vrste razloga: onima koji djeluju sistematski na efektivnu karakteristiku i podložni su prilagođavanju u toku eksperimenta i onima koji nisu podložni prilagođavanju. Očigledno je da međugrupna (faktorska ili sistematska) varijacija zavisi uglavnom od djelovanja proučavanog faktora, a unutargrupna (rezidualna ili nasumična) - od djelovanja slučajnih faktora.

Da bi se procenila značajnost razlika između grupnih srednjih vrednosti, potrebno je utvrditi međugrupne i unutargrupne varijacije. Ako međugrupna (faktorska) varijacija značajno premašuje unutargrupnu (rezidualnu) varijaciju, tada je faktor utjecao na rezultirajuću osobinu, značajno mijenjajući vrijednosti grupnih prosjeka. Ali postavlja se pitanje, koji je odnos između međugrupnih i unutargrupnih varijacija može se smatrati dovoljnim za zaključak o pouzdanosti (značajnosti) razlika između grupnih srednjih vrijednosti.

Za procjenu značaja razlika između srednjih vrijednosti i formuliranje zaključaka o testiranju nulte hipoteze (H0: x1 = x2 = ... = xn), analiza varijanse koristi neku vrstu standarda - G-kriterijum, zakon distribucije koju je ustanovio R. Fisher. Ovaj kriterij je omjer dvije varijanse: faktorijalne, nastale djelovanjem faktora koji se proučava, i rezidualne, zbog djelovanja slučajnih uzroka:

Omjer disperzije r = t>u : £ * 2 američkog statističara Snedekora predložio je da se označi slovom G u čast izumitelja analize varijanse R. Fishera.

Varijance od °2 i io2 su procjene varijanse stanovništva. Ako su uzorci s varijacijama od °2°2 izvučeni iz iste opće populacije, gdje je varijacija u vrijednostima imala slučajni karakter, onda je neslaganje u vrijednostima od °2 °2 također slučajno.

Ako se eksperimentom istovremeno provjerava uticaj više faktora (A, B, C, itd.) na efektivno svojstvo, tada bi disperzija zbog djelovanja svakog od njih trebala biti uporediva sa °e.gstr, to je

Ako je vrijednost faktorske varijanse značajno veća od ostatka, tada je faktor značajno utjecao na rezultirajući atribut i obrnuto.

U multifaktorskim eksperimentima, pored varijacije zbog djelovanja svakog faktora, gotovo uvijek postoji varijacija zbog interakcije faktora ($av: ^ls ^ss $liís). Suština interakcije je da se efekat jednog faktora značajno menja na različitim nivoima drugi (na primjer, efikasnost kvaliteta tla pri različitim dozama gnojiva).

Interakciju faktora takođe treba proceniti upoređivanjem odgovarajućih varijansi 3 ^w.gr:

Prilikom izračunavanja stvarne vrijednosti B-kriterijuma, u brojiocu se uzima najveća varijansa, dakle B > 1. Očigledno je da što je veći B-kriterijum, značajnija razlika između disperzija. Ako je B = 1, onda se otklanja pitanje procjene značajnosti razlika u varijansama.

Za određivanje granica slučajnih fluktuacija, omjer varijansi G. Fisher je razvio posebne tablice B-distribucije (Dodatak 4 i 5). Kriterijum B je funkcionalno povezan sa verovatnoćom i zavisi od broja stepeni slobode varijacije k1 i k2 od dvije upoređene varijanse. Za izvođenje zaključaka o granici obično se koriste dvije tabele visoka vrijednost kriterijum za nivoe značajnosti 0,05 i 0,01. Nivo značajnosti od 0,05 (ili 5%) znači da samo u 5 slučajeva od 100 kriterijuma B može poprimiti vrednost jednaku ili veću od one koja je navedena u tabeli. Smanjenje nivoa značajnosti sa 0,05 na 0,01 dovodi do povećanja vrednosti kriterijuma B između dve varijanse usled delovanja samo slučajnih uzroka.

Vrijednost kriterija također direktno ovisi o broju stupnjeva slobode dvije upoređene disperzije. Ako broj stupnjeva slobode teži beskonačnosti (k-me), tada omjer bi za dvije disperzije teži jedinici.

Tabelarna vrijednost kriterija B prikazuje moguću slučajnu vrijednost omjera dvije varijanse na datom nivou značajnosti i odgovarajući broj stupnjeva slobode za svaku od upoređenih varijansi. U ovim tabelama data je vrijednost B za uzorke napravljene iz iste opće populacije, gdje su razlozi za promjenu vrijednosti samo slučajni.

Vrijednost G se nalazi iz tabela (Dodatak 4 i 5) na presjeku odgovarajuće kolone (broj stupnjeva slobode za veću disperziju - k1) i reda (broj stupnjeva slobode za manju disperziju). - k2). Dakle, ako je veća varijansa (brojilac G) k1 = 4, a manja (imenik G) k2 = 9, tada će Ga na nivou značajnosti a = 0,05 biti 3,63 (prilika 4). Dakle, kao rezultat djelovanja slučajnih uzroka, budući da su uzorci mali, varijansa jednog uzorka može na nivou značajnosti od 5% premašiti varijansu drugog uzorka za 3,63 puta. Sa smanjenjem nivoa značajnosti sa 0,05 na 0,01, tabelarna vrijednost kriterija D, kao što je gore navedeno, će se povećati. Dakle, sa istim stepenima slobode k1 = 4 i k2 = 9 i a = 0,01, tabelarna vrednost kriterijuma G biće 6,99 (približno 5).

Razmotrimo postupak određivanja broja stupnjeva slobode u analizi varijanse. Broj stupnjeva slobode, koji odgovara ukupnom zbiru kvadrata odstupanja, razlaže se na odgovarajuće komponente slično kao i razlaganje suma kvadrata odstupanja ukupan broj stepena slobode (k") se dekomponuje na broj stepena slobode za međugrupne (k1) i unutargrupne (k2) varijacije.

Sta ako okvir za uzorkovanje, koji se sastoji od N zapažanja podijeljena po t grupe (broj opcija eksperimenta) i P podgrupe (broj ponavljanja), tada će broj stupnjeva slobode k biti:

i za ukupan iznos kvadratna devijacija (d7zar)

b) za međugrupni zbir kvadrata odstupanja ^m.gP)

c) za unutargrupni zbir kvadrata odstupanja in w.gr)

Prema pravilu varijacije dodavanja:

Na primjer, ako su se u eksperimentu formirale četiri varijante eksperimenta (m = 4) u po pet ponavljanja (n = 5), i ukupno zapažanja N = = t o p \u003d 4 * 5 \u003d 20, tada je broj stupnjeva slobode jednak:

Poznavajući sume kvadrata odstupanja broja stupnjeva slobode, moguće je odrediti nepristrasne (prilagođene) procjene za tri varijanse:

Nul hipoteza H0 po kriterijumu B testira se na isti način kao i Studentovim u-testom. Za donošenje odluke o provjeri H0 potrebno je izračunati stvarnu vrijednost kriterija i uporediti je sa tabelarnom vrijednošću Ba za prihvaćeni nivo značajnosti a i broj stupnjeva slobode k1 i k2 za dvije disperzije.

Ako je Bfakg > Ba, onda, u skladu sa prihvaćenim nivoom značajnosti, možemo zaključiti da su razlike u varijansama uzorka određene ne samo slučajnim faktorima; oni su značajni. U ovom slučaju, nulta hipoteza se odbacuje i postoji razlog za vjerovanje da faktor značajno utječe na rezultirajući atribut. Ako< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Upotreba jednog ili drugog ANOVA modela zavisi i od broja proučavanih faktora i od metode uzorkovanja.

U zavisnosti od broja faktora koji određuju varijaciju efektivne karakteristike, uzorke mogu formirati jedan, dva ili više faktora. Prema ovoj analizi varijanse se dijeli na jednofaktorske i višefaktorske. Inače se naziva i jednofaktorski i višefaktorski disperzioni kompleks.

Šema dekompozicije opšte varijacije zavisi od formiranja grupa. Može biti nasumična (zapažanja jedne grupe nisu povezana sa zapažanjima druge grupe) i neslučajna (zapažanja dva uzorka su međusobno povezana zajedničkim uslovima eksperimenta). Shodno tome, dobijaju se nezavisni i zavisni uzorci. Nezavisni uzorci se mogu formirati sa jednakim i neparnim brojevima. Formiranje zavisnih uzoraka pretpostavlja njihov jednak broj.

Ako su grupe formirane nenasilnim redom, onda ukupna količina varijacije rezultirajuće osobine uključuje, uz faktorijalnu (međugrupnu) i rezidualnu varijaciju, varijaciju ponavljanja, tj.

U praksi je u većini slučajeva potrebno uzeti u obzir zavisne uzorke kada su uslovi za grupe i podgrupe izjednačeni. Da, u iskustvo na terenu cijela lokacija je podijeljena u blokove, s najviše virivnyanniya uvjetima. Istovremeno, svaka varijanta eksperimenta dobija jednake mogućnosti da bude zastupljena u svim blokovima, čime se postiže izjednačavanje uslova za sve testirane opcije, iskustvo. Ova metoda konstruisanja iskustva naziva se metodom nasumičnih blokova. Slično se izvode i eksperimenti sa životinjama.

Prilikom obrade socio-ekonomskih podataka metodom disperzione analize, mora se imati na umu da je, zbog bogatog broja faktora i njihove međusobne povezanosti, teško, čak i uz najpažljivije usklađivanje uslova, utvrditi stepen objektivni uticaj svakog pojedinačnog faktora na efektivni atribut. Stoga je nivo rezidualne varijacije određen ne samo slučajnim uzrocima, već i značajnim faktorima koji nisu uzeti u obzir prilikom izgradnje ANOVA modela. Kao rezultat toga, rezidualna disperzija kao osnova za poređenje ponekad postaje neadekvatna za svoju svrhu, jasno je precijenjena po veličini i ne može služiti kao kriterij za značajnost utjecaja faktora. U tom smislu, kada se grade modeli analize varijanse, to postaje stvarni problem izbor kritični faktori i nivelisanje uslova za ispoljavanje delovanja svakog od njih. Osim toga. korištenje analize varijanse pretpostavlja normalno ili blizu normalna distribucija proučavali statističke agregate. Ako ovaj uslov nije ispunjen, onda će procjene dobijene analizom varijanse biti preuveličane.

Analiza varijanse(od latinskog Dispersio - disperzija / na engleskom Analysis Of Variance - ANOVA) koristi se za proučavanje uticaja jedne ili više kvalitativnih varijabli (faktora) na jednu zavisnu kvantitativnu varijablu (odgovor).

Analiza varijanse zasniva se na pretpostavci da se neke varijable mogu smatrati uzrocima (faktori, nezavisne varijable): , a druge kao posljedice (zavisne varijable). Nezavisne varijable se ponekad nazivaju podesivi faktori upravo zato što u eksperimentu istraživač ima priliku da ih varira i analizira rezultirajući rezultat.

glavni cilj analiza varijanse(ANOVA) je studija o značaju razlika između srednjih vrijednosti upoređivanjem (analizom) varijansi. Podjela ukupne varijanse na više izvora omogućava da se uporedi varijansa zbog međugrupne razlike sa varijansom zbog varijanse unutar grupe. Ako je nulta hipoteza tačna (o jednakosti srednjih vrijednosti u nekoliko grupa opservacija odabranih iz opće populacije), procjena varijanse povezane s unutargrupnom varijabilnosti trebala bi biti bliska procjeni međugrupna varijansa. Ako jednostavno uspoređujete srednje vrijednosti dva uzorka, analiza varijanse će dati isti rezultat kao normalan t-test nezavisnog uzorka (ako uspoređujete dvije nezavisne grupe objekata ili zapažanja) ili t-test zavisnog uzorka ( ako uspoređujete dvije varijable na istom i istom skupu objekata ili zapažanja).

Suština analize varijanse je u podjeli ukupne varijanse ispitivanog svojstva na zasebne komponente, zbog uticaja specifičnih faktora, i testiranju hipoteza o značaju uticaja ovih faktora na proučavano svojstvo. Upoređujući komponente disperzije među sobom koristeći Fisherov F-test, moguće je utvrditi koliki je udio ukupne varijabilnosti rezultirajuće osobine uzrokovan djelovanjem podesivih faktora.

Izvorni materijal za analizu varijanse su podaci proučavanja tri ili više uzoraka: , koji mogu biti jednakog ili nejednakog broja, povezanih i nepovezanih. Prema broju identifikovanih prilagodljivih faktora, može biti analiza varijanse jednofaktorski(istovremeno se proučava uticaj jednog faktora na rezultate eksperimenta), dvofaktorski(prilikom proučavanja uticaja dva faktora) i multifaktorski(omogućava vam da procijenite ne samo utjecaj svakog od faktora posebno, već i njihovu interakciju).

Analiza varijanse spada u grupu parametarskih metoda i stoga je treba koristiti samo kada se dokaže da je raspodjela normalna.

Analiza varijanse se koristi ako se zavisna varijabla mjeri na skali omjera, intervala ili reda, a varijable koje utječu nisu numeričke (skala imena).

Primjeri zadataka

U problemima koji se rješavaju analizom varijanse javlja se odgovor numeričke prirode, na koji utječe više varijabli koje imaju nominalnu prirodu. Na primjer, nekoliko vrsta obroka za tov stoke ili dva načina njihovog držanja, itd.

Primjer 1: Tokom sedmice, nekoliko apotekarskih kioska radilo je na tri različite lokacije. U budućnosti možemo ostaviti samo jednu. Potrebno je utvrditi da li postoji statistički značajna razlika između obima prodaje lijekova u kioscima. Ako da, mi ćemo izabrati kiosk sa najvećim prosječnim dnevnim obimom prodaje. Ako se razlika u obimu prodaje pokaže statistički beznačajnom, onda bi drugi pokazatelji trebali biti osnova za odabir kioska.

Primjer 2: Poređenje kontrasta grupnih sredstava. Sedam političkih opredeljenja poređano je od ekstremno liberalnih do ekstremno konzervativnih, a linearni kontrast se koristi da bi se testiralo postoji li uzlazni trend različit od nule u srednjim vrednostima grupe – tj. da li postoji značajno linearno povećanje prosečne starosti kada se razmatraju grupe poredane u smjer od liberalnog ka konzervativnom.

Primjer 3: Dvosmjerna analiza varijanse. Na broj prodaje proizvoda, osim veličine trgovine, često utječe i lokacija polica s proizvodom. Ovaj primjer sadrži nedjeljne brojke prodaje koje karakteriziraju četiri rasporeda polica i tri veličine trgovine. Rezultati analize pokazuju da oba faktora – lokacija polica sa robom i veličina radnje – utiču na broj prodaje, ali njihova interakcija nije značajna.

Primjer 4: Univarijantna ANOVA: Nasumični dizajn punog bloka s dva tretmana. Uticaj na pečenje hleba svih moguće kombinacije tri masti i tri ripera za tijesto. Četiri uzorka brašna uzeta od četiri različitih izvora, služio je kao blokirajući faktor. Treba identifikovati značaj interakcije između masnoće i kidača. Nakon toga, odredite različite opcije za odabir kontrasta, što vam omogućava da saznate koje se kombinacije razina faktora razlikuju.

Primjer 5: Model hijerarhijskog (ugniježđenog) plana s mješovitim efektima. Proučava se utjecaj četiri nasumično odabrane glave ugrađene u alatnu mašinu na deformaciju proizvedenih staklenih katodnih držača. (Glave su ugrađene u mašinu, tako da se ista glava ne može koristiti na različitim mašinama.) Efekat glave se tretira kao slučajni faktor. ANOVA statistika pokazuje da nema značajnih razlika između mašina, ali postoje naznake da se glave mogu razlikovati. Razlika između svih mašina nije značajna, ali za dve od njih razlika između tipova glava je značajna.

Primjer 6: Univarijantna analiza ponovljenih mjerenja korištenjem plana split-plot. Ovaj eksperiment je proveden kako bi se odredio učinak ocjene anksioznosti pojedinca na izvođenje ispita u četiri uzastopna pokušaja. Podaci su organizirani tako da se mogu smatrati grupama podskupova cijelog skupa podataka („cijela dijagrama“). Efekat anksioznosti nije bio značajan, dok je efekat pokušaja bio značajan.

Lista metoda

  • Modeli faktorskog eksperimenta. Primjeri: faktori koji utiču na uspješnost rješavanja matematičkih problema; faktori koji utiču na obim prodaje.

Podaci se sastoje od nekoliko serija posmatranja (obrada), koje se smatraju realizacijom nezavisnih uzoraka. Početna hipoteza je da nema razlike u tretmanima, tj. pretpostavlja se da se sva opažanja mogu smatrati jednim uzorkom iz ukupne populacije:

  • Jednofaktorski parametarski model: Scheffeova metoda.
  • Jednofaktorski neparametarski model [Lagutin M.B., 237]: Kruskal-Wallisov kriterijum [Hollender M., Wolf D.A., 131], Jonkheerov kriterijum [Lagutin M.B., 245].
  • Opšti slučaj modela sa konstantnim faktorima, Cochranova teorema [Afifi A., Eisen S., 234].

Podaci su dvostruko ponovljena zapažanja:

  • Dvofaktorski neparametarski model: Friedmanov kriterijum [Lapach, 203], Pejdžov kriterijum [Lagutin M.B., 263]. Primjeri: poređenje efektivnosti proizvodnih metoda, poljoprivredne prakse.
  • Dvofaktorski neparametarski model za nepotpune podatke

Priča

Odakle je došlo ime analiza varijanse? Može izgledati čudno da se postupak za poređenje srednjih vrijednosti naziva analiza varijanse. Zapravo, to je zbog činjenice da kada se ispituje statistička značajnost razlike između srednjih vrijednosti dvije (ili više) grupa, mi zapravo upoređujemo (analiziramo) varijanse uzorka. Predlaže se osnovni koncept analize varijanse Fisher 1920. godine. Možda bi prirodniji termin bio zbir analize kvadrata ili analize varijacije, ali zbog tradicije se koristi termin analiza varijanse. U početku je analiza varijanse razvijena za obradu podataka dobijenih u toku posebno dizajniranih eksperimenata i smatrana je jedinom metodom koja ispravno istražuje uzročne veze. Metoda je korištena za evaluaciju eksperimenata u biljnoj proizvodnji. Kasnije je postao jasan opšti naučni značaj analize disperzije za eksperimente u psihologiji, pedagogiji, medicini itd.

Književnost

  1. Sheff G. Analiza disperzije. - M., 1980.
  2. Ahrens H. Leiter Yu. Multivarijantna analiza varijanse.
  3. Kobzar A.I. Primijenjeno matematička statistika. - M.: Fizmatlit, 2006.
  4. Lapach S. N., Chubenko A. V., Babich P. N. Statistika u nauci i biznisu. - Kijev: Morion, 2002.
  5. Lagutin M. B. Vizuelna matematička statistika. U dva toma. - M.: P-centar, 2003.
  6. Afifi A., Eisen S. Statistička analiza: Računarski pristup.
  7. Hollender M., Wolf D.A. Neparametarske metode statistike.

Linkovi

Srednji kvadrati i s R 2 su nepristrasne procjene zavisne varijable, vođene regresijom ili eksplanatornom varijablom, respektivno X i uticaj neobračunatih slučajnih faktora i grešaka; m je broj procijenjenih parametara regresije, n je broj opservacija. U nedostatku linearne veze između zavisne i eksplanatorne (faktorske) varijable, slučajne varijable i s R 2 imaju 2 - distribuciju, respektivno, sa m-1 i n-m stepena slobode, a njihov odnos F je distribucija sa istim stepenima slobode. Stoga je jednadžba regresije značajna na nivou ako stvarno posmatrana vrijednost statistike premašuje vrijednost u tabeli:

(5.11),

gdje je tabelarna vrijednost F - Fisher - Snedekorovog testa, određena na nivou značajnosti na k1 = m-1 i k2 = n-m stepena slobode.

S obzirom na značenje vrijednosti i s R 2 , možemo reći da vrijednost F pokazuje u kojoj mjeri regresija procjenjuje vrijednost zavisne varijable bolje od njene srednje vrijednosti.

U slučaju parne sobe linearna regresija m = 2, a jednačina regresije je značajna na nivou if

(5.12)

Sljedeći omjer može poslužiti kao mjera značajnosti linije regresije:

gdje je ŷ i -i-e izjednačena vrijednost; -srednje aritmetičke vrijednosti y i ; σ y.x - srednja kvadratna greška (greška aproksimacije) regresijska jednačina, izračunato od dobro poznata formula; n je broj upoređenih parova vrijednosti karakteristika; m je broj faktorskih karakteristika.

Zaista, veza je veća, što je značajnija mjera disperzije obilježja, zbog regresije, premašuje mjeru disperzije odstupanja stvarnih vrijednosti od niveliranih.

Ovaj omjer nam omogućava da riješimo pitanje značaja regresione jednadžbe u cjelini, odnosno prisutnosti stvarnog života statistička zavisnost između varijabli. Jednačina regresije je značajna, tj. postoji statistička veza između znakova, ako je za dati nivo značajnost, izračunata vrijednost Fišerovog kriterija F premašuje kritičnu vrijednost Fcr, koja se nalazi na sjecištu m-te kolone i th reda posebne statističke tabele, koja se zove "Tabela Fisherovih vrijednosti F-test".

Primjer. Koristimo Fišerov kriterijum da procenimo značaj regresione jednačine konstruisane u prošlom predavanju, odnosno jednačine koja izražava odnos između žetve i setve po glavi stanovnika.

Zamjenom u formulu za izračunavanje Fisherovog kriterija, podacima iz prethodnog primjera, dobijamo

Pozivajući se na tabelu F-distribucije za P=0,95 (α=1-P=0,5) i uzimajući u obzir da je n-2=21, m-1 =1, u tabeli vrednosti F-testa za raskrsnice 1. kolone i 21. reda nalazimo kritičnu vrijednost F cr, jednaku 4,32 sa stepenom pouzdanosti P=0,95. Budući da izračunata vrijednost F-kriterijuma značajno premašuje Fcr vrijednost, značajna je otkrivena linearna veza, odnosno apriorna hipoteza o prisutnosti linearna veza potvrđeno. Zaključak je izveden sa stepenom pouzdanosti P=0,95. Može se provjeriti da li je izlaz u ovaj slučajće ostati isti ako se pouzdanost poveća na P=0,99 (odgovarajuća vrijednost F cr =8,02 za nivo značajnosti α=0,01).


Koeficijent determinacije. Uz pomoć F-kriterijuma utvrdili smo da postoji linearna zavisnost između količine žetve žitarica i količine sjetve po glavi stanovnika. Stoga se može tvrditi da količina žetve žitarica po stanovniku linearno zavisi od količine sjetve po glavi stanovnika. Sada je umesno postaviti pitanje koje pojašnjava – u kojoj meri količina setve po glavi stanovnika određuje količinu žetve žitarica po glavi stanovnika? Na ovo pitanje se može odgovoriti izračunavanjem koji se dio varijacije rezultirajuće osobine može objasniti utjecajem faktorske osobine. Ovoj svrsi služi indeks (ili koeficijent) determinacije R 2 , koji omogućava procjenu udjela raspršenosti uzetog u obzir regresijom u ukupnom raspršivanju efektivnog atributa. Koeficijent determinacije, jednak omjeru faktorske varijacije prema ukupnoj varijaciji osobine, omogućava procjenu koliko je "uspješno" odabran tip funkcije koja opisuje stvarnu statističku zavisnost.

Ako je koeficijent determinacije R 2 poznat, onda se kriterijum značajnosti regresione jednadžbe ili sam koeficijent determinacije (Fisherov kriterijum) može zapisati kao:

Fišerov kriterijum nam takođe omogućava da procenimo korisnost uključivanja dodatni faktori u model za jednačinu višestruka linearna regresija.

U ekonometriji, osim opšti kriterijum Fisher, koncept se također koristi privatni kriterijum . Parcijalni F-kriterijum pokazuje stepen uticaja dodatne nezavisne varijable na rezultujući atribut i može se koristiti kada se odlučuje da li se ova nezavisna varijabla dodati u jednadžbu ili je isključiti iz nje.

Rasipanje obilježja objašnjeno pomoću dvofaktorske regresione jednadžbe koja je ranije konstruirana može se razložiti na dva tipa: 1) raspršivanje obilježja zbog nezavisne varijable x 1, i 2) rasipanje obilježja zbog nezavisne varijable x 2 kada je x 1 već uključen u jednačinu. Prva komponenta odgovara širenju atributa, objašnjenom jednadžbom, koja uključuje samo varijablu x 1 . Razlika između raspršenosti obilježja zadane parnom linearnom regresijskom jednadžbom i raspršenosti obilježja danog dvosmjernom linearnom regresijskom jednadžbom odredit će dio raspršivanja koji se objašnjava dodatnom nezavisnom varijablom x 2 .

Omjer specificirane razlike i raspršenosti obilježja, koji nije objašnjen regresijom, je vrijednost privatni kriterijum. Određeni F-test se također naziva sekvencijalni if statističke karakteristike se konstruiraju uzastopnim dodavanjem varijabli regresionoj jednadžbi.

Primjer. Procijenite korisnost uključivanja dodatne varijable "prinos" u regresionu jednačinu (prema podacima i rezultatima prethodno razmatranih primjera).

Rasipanje karakteristike objašnjeno jednadžbom višestruka regresija a izračunato kao zbir kvadrata razlika izjednačenih vrijednosti i njihove srednje vrijednosti, jednaka je 1623,8815. Širenje atributa, objašnjeno jednostavnom regresijskom jednadžbom, je 1545,1331.

Rasipanje karakteristike, koje nije objašnjeno regresijom, određeno je kvadratom srednje vrednosti kvadratna greška jednačina i jednaka je 10,9948.

Koristeći ove karakteristike, izračunavamo privatni F-kriterijum

Sa nivoom pouzdanosti od 0,95 (α = 0,05), tabelarna vrednost F (1,20), odnosno vrednost na preseku 1. kolone i 20. reda tabele. 4A aplikacija, jednaka 4,35. Izračunata vrijednost F-kriterijuma značajno premašuje tabelarni, te stoga ima smisla uključivanje varijable "prinos" u jednačinu.

Dakle, ranije doneseni zaključci u vezi sa regresijskim koeficijentima su sasvim legitimni.

4th studijsko pitanje. Procjena značaja pojedinačnih parametara regresione jednačine primjenom Studentovog t-testa.

Vrlo često se u ekonometriji traži da se proceni značaj koeficijenta korelacije r, odnosno da se odredi koliko je značajna razlika koeficijenta korelacije od nule (na primjer, kada se analizira multikolinearnost i procjenjuje upareni koeficijent korelacije između faktora u jednačini višestruke regresije).

Istovremeno, pretpostavlja se da u odsustvu korelacije, statistika t,

Ima t-Studentova distribucija sa (n-2) stepena slobode.

Koeficijent korelacije r xy je značajan na nivou , (inače se odbacuje hipoteza N 0 o jednakosti opšteg koeficijenta korelacije sa nulom), ako

(5.13),

Gdje je vrijednost tabele t-Studentov kriterijum, određen na nivou značajnosti a sa brojem stepeni slobode (n-2).

U linearnoj regresiji obično se procjenjuje značaj ne samo jednačine u cjelini, već i njenih pojedinačnih parametara. U tu svrhu utvrđuje se njegova standardna greška za svaki od parametara. Postupak za procjenu značajnosti ovog parametra se ne razlikuje od prethodnog razmatranog za koeficijent regresije; izračunava se vrijednost t-kriterijuma, njegova vrijednost se upoređuje sa tabelarnom vrijednošću na (n-2) stepena slobode. Testiranje hipoteza o značaju regresije i koeficijenata korelacije je ekvivalentno testiranju hipoteze o značaju linearna jednačina regresija.

Zaključak. Dakle, u ovom predavanju smo razmotrili opšta pravila testiranje statističkih hipoteza i njihovo praktična upotreba prilikom procene značaja regresionih jednačina i njihovih pojedinačnih parametara korišćenjem kriterijuma Fisher i Student.

Analiza varijanse

Rad na kursu po disciplini: " Analiza sistema»

Izvođač student gr. 99 ISE-2 Zhbanov V.V.

Orenburg Državni univerzitet

fakultet informacione tehnologije

Katedra za primijenjenu informatiku

Orenburg-2003

Uvod

Svrha rada: upoznati se sa takvom statističkom metodom kao što je analiza varijanse.

Analiza disperzije (od latinskog Dispersio - disperzija) - statistička metoda, omogućavajući analizu uticaja razni faktori na varijablu koja se proučava. Metodu je razvio biolog R. Fisher 1925. godine i prvobitno je korištena za procjenu eksperimenata u proizvodnji usjeva. Kasnije je postao jasan opšti naučni značaj analize disperzije za eksperimente u psihologiji, pedagogiji, medicini itd.

Svrha analize varijanse je da se testira značajnost razlike između srednjih vrednosti upoređivanjem varijansi. Varijanca mjerenog atributa se razlaže na nezavisne pojmove, od kojih svaki karakterizira utjecaj određenog faktora ili njihovu interakciju. Naknadno poređenje ovakvih pojmova omogućava nam da procenimo značaj svakog faktora koji se proučava, kao i njihovu kombinaciju /1/.

Ako je nulta hipoteza tačna (o jednakosti srednjih vrijednosti u nekoliko grupa opservacija odabranih iz opće populacije), procjena varijanse povezane s unutargrupnom varijansom trebala bi biti bliska procjeni međugrupne varijanse.

Prilikom istraživanja tržišta često se postavlja pitanje uporedivosti rezultata. Na primjer, provođenjem anketa o potrošnji proizvoda u različite regije zemljama, potrebno je izvući zaključke o tome koliko se podaci istraživanja međusobno razlikuju ili ne. uporedi pojedinačni indikatori nema smisla i stoga se postupak poređenja i naknadnog vrednovanja provodi prema nekim prosječnim vrijednostima i odstupanjima od ove prosječne procjene. Proučava se varijacija ove osobine. Varijanca se može uzeti kao mjera varijacije. Disperzija σ 2 je mjera varijacije, definirana kao prosjek odstupanja osobine na kvadrat.

U praksi se često javljaju problemi general- zadaci provjere značajnosti razlika u prosjecima uzoraka više populacija. Na primer, potrebno je proceniti uticaj različitih sirovina na kvalitet proizvoda, rešiti problem uticaja količine đubriva na prinos poljoprivrednih proizvoda.

Ponekad se analiza varijanse koristi za utvrđivanje homogenosti nekoliko populacija (varijanse ovih populacija su po pretpostavci iste; ako analiza varijanse pokaže da su matematička očekivanja ista, onda su populacije u tom smislu homogene). Homogeni agregati se mogu kombinovati u jedan i na taj način dobiti više informacija o njemu. pune informacije, dakle, pouzdaniji zaključci /2/.

1 Analiza varijanse

1.1 Osnovni koncepti analize varijanse

U procesu posmatranja objekta koji se proučava, kvalitativni faktori se menjaju proizvoljno ili na unapred određen način. Specifična implementacija faktora (na primjer, određeni temperaturni režim, odabrana oprema ili materijal) naziva se nivo faktora ili metoda obrade. ANOVA model sa fiksnim nivoima faktora naziva se model I, model sa slučajnim faktorima naziva se model II. Variranjem faktora, može se istražiti njegov uticaj na veličinu odgovora. Trenutno opšta teorija analiza varijanse razvijena za modele I.

U zavisnosti od broja faktora koji određuju varijaciju rezultujuće karakteristike, analiza varijanse se deli na jednofaktorsku i višefaktorsku.

Glavne šeme za organiziranje početnih podataka s dva ili više faktora su:

Unakrsna klasifikacija, karakteristična za modele I, u kojoj se svaki nivo jednog faktora kombinuje sa svakom gradacijom drugog faktora prilikom planiranja eksperimenta;

Hijerarhijska (ugniježđena) klasifikacija, karakteristična za model II, u kojoj svaka nasumično odabrana vrijednost jednog faktora odgovara vlastitom podskupu vrijednosti drugog faktora.

Ako se istovremeno istražuje zavisnost odgovora od kvalitativnih i kvantitativnih faktora, tj. faktori mješovite prirode, tada se koristi analiza kovarijanse /3/.

Dakle, ovi modeli se međusobno razlikuju po načinu izbora nivoa faktora, što, očigledno, prvenstveno utiče na mogućnost generalizacije dobijenih eksperimentalnih rezultata. Za analizu varijanse u jednofaktorskim eksperimentima razlika između ova dva modela nije toliko značajna, ali u multivarijantnoj analizi varijanse može biti vrlo važna.

Prilikom provođenja analize varijanse moraju se ispuniti sljedeće statističke pretpostavke: bez obzira na nivo faktora, vrijednosti odgovora imaju normalan (Gausov) zakon raspodjele i istu varijansu. Ova jednakost disperzija naziva se homogenost. Dakle, promjena metode obrade utiče samo na poziciju slučajne varijable odgovora, koju karakterizira srednja vrijednost ili medijan. Stoga, sva opažanja odgovora pripadaju porodici pomaka normalnih distribucija.

Za ANOVA tehniku ​​se kaže da je "robusna". Ovaj izraz, koji koriste statističari, znači da se ove pretpostavke mogu u određenoj mjeri narušiti, ali uprkos tome, tehnika se može koristiti.

Kada je zakon raspodjele vrijednosti odgovora nepoznat, koriste se neparametarske (najčešće rangirane) metode analize.

Analiza varijanse zasniva se na podjeli varijanse na dijelove ili komponente. Varijaciju zbog uticaja faktora koji leži u osnovi grupisanja karakteriše međugrupna disperzija σ 2 . To je mjera varijacije parcijalnih srednjih vrijednosti za grupe oko zajedničke sredine i određena je formulom:

,

gdje je k broj grupa;

n j je broj jedinica u j-toj grupi;

Privatni prosjek za j-tu grupu;

Ukupni prosjek u populaciji jedinica.

Varijaciju zbog uticaja drugih faktora u svakoj grupi karakteriše unutargrupna disperzija σ j 2 .

.

Između totalna varijansaσ 0 2 , unutargrupna varijansa σ 2 i međugrupna varijansa postoji odnos:

σ 0 2 = + σ 2 .

Unutargrupna varijansa objašnjava uticaj faktora koji se ne uzimaju u obzir prilikom grupisanja, a međugrupna varijansa objašnjava uticaj faktora grupisanja na prosek grupe /2/.

1.2 Jednosmjerna analiza varijanse

Jednofaktorski model disperzije ima oblik:

x ij = μ + F j + ε ij , (1)

gdje je x ij vrijednost varijable koja se proučava, dobijena na i-ti nivo faktor (i=1,2,...,m) sa j-tim serijski broj(j=1,2,...,n);

F i je efekat zbog uticaja i-tog nivoa faktora;

εij – slučajna komponenta, odnosno poremećaj uzrokovan uticajem nekontrolisanih faktora, tj. varijacije unutar jednog nivoa.

Osnovni preduslovi za analizu varijanse:

Matematičko očekivanje perturbacije ε ij je jednako nuli za bilo koji i, tj.

M(ε ij) = 0; (2)

Perturbacije ε ij su međusobno nezavisne;

Varijanca varijable x ij (ili perturbacija ε ij) je konstantna za

bilo koje i, j, tj.

D(ε ij) = σ 2 ; (3)

Varijabla x ij (ili perturbacija ε ij) ima normalan zakon

distribucije N(0;σ 2).

Uticaj nivoa faktora može biti fiksni ili sistematski (Model I) ili slučajan (Model II).

Neka, na primjer, treba utvrditi da li postoje značajne razlike između serija proizvoda u pogledu nekog pokazatelja kvaliteta, tj. provjeriti utjecaj na kvalitetu jednog faktora - serije proizvoda. Ako su sve serije sirovina uključene u studiju, onda je uticaj nivoa takvog faktora sistematičan (model I), a nalazi su primenljivi samo na one pojedinačne serije koje su bile uključene u istraživanje. Ako uključimo samo slučajno odabrani dio stranaka, onda je utjecaj faktora slučajan (model II). U multifaktorskim kompleksima moguć je mješoviti model III, u kojem neki faktori imaju nasumične nivoe, dok su drugi fiksni.

Neka bude m serija proizvoda. Iz svake serije odabrano je n 1 , n 2 , ..., n m proizvoda (radi jednostavnosti, pretpostavlja se da je n 1 =n 2 =...=n m =n). Vrijednosti pokazatelja kvalitete ovih proizvoda prikazane su u matrici promatranja:

x 11 x 12 … x 1n

x 21 x 22 … x 2n

…………………………… = (x ij), (i = 1,2, …, m; j = 1,2, …, n).

x m 1 x m 2 … x mn

Potrebno je provjeriti značaj uticaja serija proizvoda na njihov kvalitet.

Ako pretpostavimo da su elementi reda matrice posmatranja numeričke vrijednosti slučajne varijable H 1 ,H 2 ,...,H m , koji izražava kvalitet proizvoda i ima normalan zakon raspodjele sa matematičkim očekivanjima, odnosno a 1 ,a 2 ,...,a m i identičnim varijacijama σ 2 , tada dati zadatak svodi se na provjeru nulte hipoteze H 0: a 1 =a 2 =...= a m, provedenu u analizi varijanse.

Prosjek preko nekog indeksa je označen zvjezdicom (ili tačkom) umjesto indeksa, tada prosjek kvaliteta proizvodi i-ti serija, ili prosek grupe za i-ti nivo faktora, imaće oblik:

gdje je i * prosječna vrijednost po kolonama;

Ij je element matrice posmatranja;

n je veličina uzorka.

I ukupan prosek:

. (5)

Zbir kvadrata odstupanja opažanja x ij od ukupne srednje vrijednosti ** izgleda ovako:

2 = 2 + 2 +

2 2 . (6)

Q \u003d Q 1 + Q 2 + Q 3.

Poslednji član je nula

budući da je zbir odstupanja vrijednosti varijable od njene srednje vrijednosti jednak nuli, tj.

2 =0.

Prvi pojam se može napisati kao:

Rezultat je identitet:

Q = Q 1 + Q 2 , (8)

gdje - ukupni, ili ukupni, zbir kvadrata odstupanja;

- zbir kvadrata odstupanja grupnih sredstava od ukupnog prosjeka, odnosno međugrupni (faktorski) zbir kvadrata odstupanja;

- zbir kvadrata odstupanja opažanja od grupnih srednjih vrijednosti, ili unutargrupni (rezidualni) zbir kvadrata odstupanja.

Ekspanzija (8) sadrži glavnu ideju analize varijanse. U odnosu na problem koji se razmatra, jednakost (8) pokazuje da se ukupna varijacija indikatora kvaliteta, mjerena zbirom Q, sastoji od dvije komponente - Q 1 i Q 2, koje karakterišu varijabilnost ovog indikatora između serija (Q 1 ) i varijabilnost unutar serija (Q 2), karakterišući istu varijaciju za sve serije pod uticajem neuračunatih faktora.

U analizi varijanse ne analiziraju se zbroji kvadrata odstupanja, već takozvani srednji kvadrati, koji su nepristrasne procjene odgovarajućih varijansi, koje se dobijaju dijeljenjem zbira kvadrata odstupanja sa odgovarajućim broj stepena slobode.

Broj stepeni slobode je definisan kao ukupan broj posmatranja minus broj jednačina koje ih povezuju. Dakle, za srednji kvadrat s 1 2 , koji je nepristrasna procjena međugrupne varijanse, u proračunu se koristi broj stupnjeva slobode k 1 =m-1, pošto m grupnih znači međusobno povezanih jednom jednačinom (5). A za srednji kvadrat s22, koji je nepristrasna procjena varijanse unutar grupe, broj stupnjeva slobode je k2=mn-m, jer izračunava se korištenjem svih mn opservacija međusobno povezanih m jednačina (4).

Na ovaj način:

Ako pronađemo matematička očekivanja srednjih kvadrata i , zamijenimo izraz xij (1) u njihove formule kroz parametre modela, dobićemo:

(9)

jer uzimajući u obzir svojstva matematičkog očekivanja

a

(10)

Za model I sa fiksnim nivoima faktora F i (i=1,2,...,m) su neslučajne vrijednosti, dakle

M(S) = 2 /(m-1) +σ 2 .

Hipoteza H 0 ima oblik F i = F * (i = 1,2,...,m), tj. uticaj svih nivoa faktora je isti. Ako je ova hipoteza tačna

M(S)= M(S)= σ 2 .

Za slučajni model II izraz F i u izrazu (1) je slučajna vrijednost. Označavajući ga varijansom

dobijamo od (9)

(11)

i, kao u modelu I

Tabela 1.1 predstavlja opšti oblik izračunavanje vrijednosti, korištenjem analize varijanse.

Tabela 1.1 - Osnovna tabela analize varijanse

Komponente varijanse

Zbir kvadrata

Broj stepeni slobode

Srednji kvadrat

Srednje kvadratno očekivanje

Intergroup

Intragroup

Hipoteza H 0 će imati oblik σ F 2 =0. Ako je ova hipoteza tačna

M(S)= M(S)= σ 2 .

U slučaju jednofaktorskog kompleksa i za model I i za model II, srednji kvadrati S 2 i S 2 su nepristrasne i nezavisne procjene iste varijanse σ 2 .

Stoga se testiranje nulte hipoteze H 0 svelo na testiranje značajnosti razlike između nepristrasnih procjene uzorka S i S disperzije σ 2 .

Hipoteza H 0 se odbacuje ako je stvarno izračunata vrednost statistike F = S/S veća od kritične vrednosti F α: K 1: K 2 , određene na nivou značajnosti α sa brojem stepeni slobode k 1 = m-1 i k 2 =mn-m, i prihvaćeno ako je F< F α: K 1: K 2 .

Fisher F distribucija (za x > 0) ima sljedeća funkcija gustina (za = 1, 2, ...; = 1, 2, ...):

gdje - stepeni slobode;

G - gama funkcija.

U vezi sa ovim problemom, pobijanje hipoteze H 0 znači postojanje značajnih razlika u kvalitetu proizvoda različitih serija na nivou značajnosti koji se razmatra.

Za izračunavanje zbira kvadrata Q 1 , Q 2 , Q često je zgodno koristiti sljedeće formule:

(12)

(13)

(14)

one. generalno nije neophodno da se sami pronađu proseci.

Dakle, postupak jednosmjerne analize varijanse sastoji se u testiranju hipoteze H 0 da postoji jedna grupa homogenih eksperimentalnih podataka naspram alternative da postoji više takvih grupa. Homogenost se odnosi na istovjetnost srednjih vrijednosti i varijansi u bilo kojem podskupu podataka. U ovom slučaju, varijanse mogu biti i poznate i nepoznate unaprijed. Ako postoji razlog vjerovati da je poznata ili nepoznata varijansa mjerenja ista u cijelom skupu podataka, onda se zadatak jednosmjerne analize varijanse svodi na proučavanje značajnosti razlike u srednjim vrijednostima u grupama podataka / 1/.

1.3 Multivarijantna disperzija analiza

Odmah treba napomenuti da ne postoji fundamentalna razlika između multivarijantne i jednofaktorske analize varijanse. Multivarijantna analiza se ne mijenja uobičajena logika analizu varijanse, ali je samo donekle komplikuje, jer pored uzimanja u obzir uticaja na zavisnu varijablu svakog od faktora posebno, treba proceniti i njihov zajedničko djelovanje. Dakle, nova stvar koju multivarijantna analiza varijanse donosi u analizu podataka tiče se uglavnom sposobnosti procjene međufaktorske interakcije. Međutim, još uvijek je moguće ocijeniti utjecaj svakog faktora posebno. U tom smislu, postupak multivarijantne analize varijanse (u varijanti njegove kompjuterske upotrebe) je nesumnjivo ekonomičniji, jer u samo jednoj vožnji rješava dva problema odjednom: procjenjuje se utjecaj svakog od faktora i njihova interakcija / 3/.

Opća shema dvofaktorski eksperiment, čiji se podaci obrađuju analizom varijanse, ima oblik:



Slika 1.1 - Šema dvofaktorskog eksperimenta

Podaci koji su podvrgnuti multivarijantnoj analizi varijanse često se označavaju prema broju faktora i njihovim nivoima.

Pod pretpostavkom da su u razmatranom problemu kvaliteta različitih m serija proizvodi proizvedeni na različitim t mašinama i potrebno je utvrditi postoje li značajne razlike u kvaliteti proizvoda za svaki faktor:

A - serija proizvoda;

B - mašina.

Rezultat je prelazak na problem dvofaktorske analize varijanse.

Svi podaci prikazani su u tabeli 1.2, u kojoj su redovi - nivoi A i faktora A, koloni - nivoi B j faktora B, au odgovarajućim ćelijama tabele su vrednosti indikatora kvaliteta proizvoda x ijk (i = 1,2, ... ,m; j=1,2,...,l; k=1,2,...,n).

Tabela 1.2 - Pokazatelji kvaliteta proizvoda

x 11l ,…,x 11k

x 12l ,…,x 12k

x 1jl ,…,x 1jk

x 1ll ,…,x 1lk

x 2 1l ,…,x 2 1k

x 22l ,…,x 22k

x 2jl ,…,x 2jk

x 2ll ,…,x 2lk

x i1l ,…,x i1k

x i2l ,…,x i2k

xijl ,…,xijk

xjll ,…,xjlk

x m1l ,…,x m1k

x m2l ,…,x m2k

xmjl ,…,xmjk

x mll ,…,x mlk

Dvofaktorski model disperzije ima oblik:

x ijk =μ+F i +G j +I ij +ε ijk , (15)

gdje je x ijk vrijednost zapažanja u ćeliji ij sa brojem k;

μ - opšti prosjek;

F i - efekat zbog uticaja i-tog nivoa faktora A;

G j - efekat usled uticaja j-tog nivoa faktora B;

I ij - efekat zbog interakcije dva faktora, tj. odstupanje od prosjeka za posmatranja u ćeliji ij od zbira prva tri člana u modelu (15);

ε ijk - perturbacija zbog varijacije varijable unutar jedne ćelije.

Pretpostavlja se da ε ijk ima normalnu distribuciju N(0; s 2), a sva matematička očekivanja F * , G * , I i * , I * j su jednaka nuli.

Grupni prosjeci se nalaze po formulama:

u ćeliji:

po redu:

po koloni:

ukupan prosjek:

Tabela 1.3 predstavlja opći prikaz izračunavanja vrijednosti pomoću analize varijanse.

Tabela 1.3 - Osnovna tabela analize varijanse

Komponente varijanse

Zbir kvadrata

Broj stepeni slobode

Srednji kvadrati

međugrupa (faktor A)

međugrupa (faktor B)

Interakcija

Ostatak

Provjera nulte hipoteze HA, HB, HAB o odsustvu utjecaja na razmatranu varijablu faktora A, B i njihove interakcije AB vrši se poređenjem omjera , , (za model I sa fiksnim nivoima faktora) ili relacija , , (za slučajni model II) sa odgovarajućim tablične vrijednosti F - Fisher-Snedecorov kriterijum. Za mješoviti model III, testiranje hipoteza o faktorima sa fiksnim nivoima vrši se na isti način kao u modelu II, a za faktore sa slučajnim nivoima, kao u modelu I.

Ako je n=1, tj. sa jednim opažanjem u ćeliji, onda se ne mogu testirati sve nulte hipoteze, budući da Q3 komponenta ispada iz ukupnog zbira kvadrata odstupanja, a sa njom i srednji kvadrat, jer u ovom slučaju ne može biti govora o interakciji faktori.

Sa stanovišta računske tehnike, za pronalaženje zbira kvadrata Q 1, Q 2, Q 3, Q 4, Q, svrsishodnije je koristiti formule:

Q 3 \u003d Q - Q 1 - Q 2 - Q 4.

Odstupanje od osnovnih preduslova analize varijanse - normalnosti distribucije varijable koja se proučava i jednakosti varijansi u ćelijama (ako nije prevelika) - ne utiče značajno na rezultate analize varijanse sa jednak broj opažanja u ćelijama, ali može biti vrlo osjetljiv ako je njihov broj nejednak. Osim toga, s nejednakim brojem promatranja u ćelijama, složenost aparata za analizu varijanse naglo raste. Stoga se preporučuje planiranje šeme sa jednak broj zapažanja u ćelijama, a ako nedostaju podaci, onda ih nadoknaditi prosječnim vrijednostima drugih zapažanja u ćelijama. U ovom slučaju, međutim, vještački uvedeni nedostajući podaci ne bi se trebali uzimati u obzir prilikom izračunavanja broja stepeni slobode /1/.

2 Primjena ANOVA u razne procese i istraživanja

2.1 Upotreba analize varijanse u proučavanju procesa migracije

Migracija je složena društveni fenomenšto umnogome određuje ekonomske i političke aspekte društva. Proučavanje migracionih procesa povezano je sa identifikacijom faktora interesovanja, zadovoljstvom uslovima rada i procenom uticaja dobijenih faktora na međugrupno kretanje stanovništva.

λ ij = c i q ij a j ,

gdje je λ ij intenzitet prijelaza iz originalne grupe i (izlaz) u novu grupu j (ulaz);

c i – mogućnost i sposobnost napuštanja grupe i (c i ≥0);

q ij – atraktivnost nova grupa u poređenju sa originalom (0≤q ij ≤1);

a j – dostupnost grupe j (a j ≥0).

ν ij ≈ n i λ ij =n i c i q ij a j . (16)

U praksi za pojedinac vjerovatnoća p prelaska u drugu grupu je mala, a broj n grupe koja se razmatra je velik. U ovom slučaju, zakon rijetki događaji, odnosno granica ν ij je Poissonova raspodjela s parametrom μ=np:

.

Kako μ raste, distribucija se približava normalnoj. Transformirana vrijednost √ν ij se može smatrati normalno distribuiranom.

Ako uzmemo logaritam izraza (16) i izvršimo potrebne promjene varijabli, onda možemo dobiti analizu modela varijanse:

ln√ν ij =½lnν ij =½(lnn i +lnc i +lnq ij +lna j)+ε ij ,

X i,j =2ln√ν ij -lnn i -lnq ij ,

Xi,j =Ci +Aj +ε.

Vrijednosti C i i A j omogućavaju da se dobije dvosmjerni ANOVA model sa jednim opažanjem po ćeliji. reverzna transformacija koeficijenti c i i a j su izračunati iz C i i A j .

Prilikom provođenja analize varijanse, sljedeće vrijednosti treba uzeti kao vrijednosti efektivne karakteristike Y:

X \u003d (X 1,1 + X 1,2 +: + X mi, mj) / mimj,

gdje je mimj procjena matematičkog očekivanja X i,j ;

X mi i X mj - broj izlaznih i ulaznih grupa.

Nivoi faktora I će biti mi izlazne grupe, nivoi faktora J će biti mj ulazne grupe. Mi=mj=m se pretpostavlja. Problem je testirati hipoteze H I i H J o jednakostima matematička očekivanja Y vrijednosti na nivoima I i i na nivoima J j , i,j=1,…,m. Testiranje hipoteze H I zasniva se na poređenju vrijednosti nepristrasnih procjena varijanse s I 2 i s o 2 . Ako je hipoteza H I tačna, tada vrijednost F (I) = s I 2 /s o 2 ima Fisherovu raspodjelu sa brojem stupnjeva slobode k 1 =m-1 i k 2 =(m-1)(m- 1). Za dati nivo značajnosti α, desna kritična tačka x pr,α cr. Ako a numerička vrijednost F (I) broj vrijednosti pada u interval (x pr, α kr, +∞), tada se hipoteza H I odbacuje i vjeruje se da faktor I utiče na efektivnu osobinu. Meri se stepen ovog uticaja prema rezultatima posmatranja brzina uzorkovanja određivanje, koje pokazuje koliki je udio varijanse efektivne karakteristike u uzorku zbog utjecaja faktora I na njega. Ako je F (I) broj

2.2 Principi matematičke i statističke analize podataka biomedicinskih istraživanja

Ovisno o zadatku, obimu i prirodi materijala, vrsti podataka i njihovim odnosima, postoji izbor metoda matematičke obrade u fazama kako preliminarne (za procjenu prirode distribucije u uzorku studije) tako i konačnu analizu u skladu sa ciljevima studije. Izuzetno važan aspekt je provjera homogenosti odabranih opservacijskih grupa, uključujući i kontrolne, koju može izvršiti ili ekspert, ili multivarijantnim statističkim metodama (na primjer, korištenjem klaster analize). Ali prvi korak je sastavljanje upitnika koji daje standardizovan opis karakteristika. Naročito kada se provode epidemiološke studije, gdje je potrebno jedinstvo u razumijevanju i opisivanju istih simptoma od strane različitih liječnika, uključujući i uzimanje u obzir raspona njihovih promjena (ozbiljnosti). Ako postoje značajne razlike u registraciji početnih podataka (subjektivna procjena prirode patoloških manifestacija od strane različitih stručnjaka) i nemoguće ih je dovesti u jedinstveni oblik u fazi prikupljanja informacija, tada se vrši tzv. kovarijantna korekcija. može se provesti, što podrazumijeva normalizaciju varijabli, tj. otklanjanje abnormalnosti indikatora u matrici podataka. "Koordinacija mišljenja" se vrši uzimajući u obzir specijalnost i iskustvo doktora, što onda omogućava međusobno upoređivanje rezultata ispitivanja koje su oni dobili. Za to se može koristiti multivarijantna analiza varijanse i regresiona analiza.

Znakovi mogu biti ili istog tipa, što je rijetko, ili različitih tipova. Ovaj izraz se odnosi na njihovu različitu metrološku evaluaciju. Kvantitativni ili numerički znaci su oni koji se mjere na određenoj skali i na skalama intervala i omjera (I grupa znakova). Kvalitativno, rangiranje ili bodovanje koriste se za izražavanje medicinskih pojmova i pojmova koji nemaju numeričke vrijednosti (na primjer, ozbiljnost stanja) i mjere se na skali poretka (II grupa znakova). Klasifikacija ili naziv (na primjer, profesija, krvna grupa) - mjere se u skali imena (III grupa znakova).

U mnogim slučajevima pokušava se analizirati izuzetno veliki broj karakteristika, što bi trebalo da pomogne u povećanju informativnog sadržaja prikazanog uzorka. Međutim, izbor korisnih informacija, odnosno odabir karakteristika je apsolutno neophodna operacija, jer da bi se riješio bilo koji problem klasifikacije, moraju se odabrati informacije koje nose informacije koje su korisne za ovaj zadatak. U slučaju da to iz nekog razloga istraživač ne provodi sam ili ne postoje dovoljno potkrijepljeni kriteriji za smanjenje dimenzije prostora obilježja iz smislenih razloga, borba protiv redundantnosti informacija već se vodi formalnim metodama, tj. procjenu sadržaja informacija.

Analiza varijanse vam omogućava da odredite uticaj različitih faktora (uslova) na osobinu (fenomen) koja se proučava, što se postiže dekompozicijom ukupne varijabilnosti (disperzije izražene kao zbir kvadrata odstupanja od opšteg prosjeka) na pojedinačne komponente uzrokovane uticajem različitih izvora varijabilnosti.

Uz pomoć analize varijanse, pretnje bolesti se ispituju u prisustvu faktora rizika. Koncept relativnog rizika razmatra odnos između pacijenata sa određenom bolešću i onih bez nje. Relativna vrijednost rizika omogućava da se utvrdi koliko se puta povećava vjerovatnoća oboljevanja u njegovom prisustvu, što se može procijeniti pomoću sljedeće pojednostavljene formule:

gdje je a prisustvo osobine u studijskoj grupi;

b - odsustvo osobine u studijskoj grupi;

c - prisustvo znaka u grupi poređenja (kontrola);

d - odsustvo znaka u grupi poređenja (kontrola).

Skor atributa rizika (rA) koristi se za procjenu udjela morbiditeta povezanog s datim faktorom rizika:

,

gdje je Q učestalost osobine koja označava rizik u populaciji;

r" - relativni rizik.

Identifikacija faktora koji doprinose nastanku (manifestaciji) bolesti, tj. faktori rizika mogu se provoditi na različite načine, na primjer, procjenom informativnosti uz naknadno rangiranje znakova, što, međutim, ne ukazuje na kumulativni učinak odabranih parametara, za razliku od upotrebe regresije, faktorske analize, metoda teorije prepoznavanja obrazaca, koji omogućavaju dobijanje "simptomatskih kompleksa" faktora rizika. Pored toga, sofisticiranije metode omogućavaju analizu indirektnih veza između faktora rizika i bolesti /5/.

2.3 Biotest tla

Različiti zagađivači, ulazeći u agrocenozu, mogu u njoj doživjeti različite transformacije, povećavajući pritom svoje toksično djelovanje. Iz tog razloga su se pokazale neophodne metode za integralnu procjenu kvaliteta komponenti agrocenoze. Istraživanja su rađena na osnovu multivarijantne analize varijanse u 11-poljnom žitno-travno-rednom plodoredu. U eksperimentu je proučavan uticaj sledećih faktora: plodnost zemljišta (A), sistem đubriva (B), sistem zaštite bilja (C). Plodnost zemljišta, sistem đubriva i sistem zaštite bilja proučavani su u dozama od 0, 1, 2 i 3. Osnovne opcije su bile predstavljene sledećim kombinacijama:

000 - početni nivo plodnosti, bez upotrebe đubriva i sredstava za zaštitu bilja od štetočina, bolesti i korova;

111 - prosječni nivo plodnosti tla, minimalna doza đubriva, biološka zaštita biljaka od štetočina i bolesti;

222 - početni nivo plodnosti zemljišta, prosečna doza đubriva, hemijska zaštita biljaka od korova;

333 - visok nivo plodnosti tla, visoka doza đubriva, hemijska zaštita biljaka od štetočina i bolesti.

Proučavali smo opcije u kojima je prisutan samo jedan faktor:

200 - plodnost:

020 - đubriva;

002 - sredstva za zaštitu bilja.

Kao i opcije s različitom kombinacijom faktora - 111, 131, 133, 022, 220, 202, 331, 313, 311.

Cilj rada bio je proučavanje inhibicije hloroplasta i koeficijenta trenutnog rasta, kao indikatora zagađenosti tla, u različitim varijantama multifaktorskog eksperimenta.

Inhibicija fototaksije hloroplasta patke proučavana je u različitim horizontima tla: 0–20, 20–40 cm. Učešće u ukupnoj disperziji plodnosti zemljišta iznosilo je 39,7%, sistema đubriva - 30,7%, sistema zaštite bilja - 30,7%.

Za proučavanje kombinovanog dejstva faktora na inhibiciju fototaksije hloroplasta korišćene su različite kombinacije eksperimentalnih varijanti: u prvom slučaju - 000, 002, 022, 222, 220, 200, 202, 020, u drugom slučaju - 111, 333, 331, 313, 133, 311, 131.

Rezultati dvosmjerne analize varijanse ukazuju na značajan uticaj interakcije đubriva i sistema zaštite bilja na razlike u fototaksiji za prvi slučaj (udio u ukupnoj varijansi je 10,3%). Za drugi slučaj, utvrđen je značajan utjecaj interakcije plodnosti tla i sistema gnojiva (53,2%).

Trosmjerna analiza varijanse pokazala je u prvom slučaju značajan utjecaj interakcije sva tri faktora. Učešće u ukupnoj disperziji iznosilo je 47,9%.

Trenutni koeficijent rasta proučavan je u različitim varijantama eksperimenta 000, 111, 222, 333, 002, 200, 220. Prva faza ispitivanja bila je prije primjene herbicida na usjevima ozime pšenice (april), druga faza - nakon primjena herbicida (maj) i zadnja - u vrijeme berbe (juli). Preteče - suncokret i kukuruz za žito.

Pojava novih listova uočena je nakon kratke lag faze sa periodom ukupnog udvostručavanja svježe mase od 2-4 dana.

U kontroli iu svakoj varijanti, na osnovu dobijenih rezultata, izračunat je koeficijent trenutnog rasta populacije r, a zatim je izračunato vrijeme udvostručavanja broja listova (t udvostručavanje).

t udvostručuje \u003d ln2 / r.

Proračun ovih pokazatelja izvršen je u dinamici uz analizu uzoraka tla. Analiza podataka pokazala je da je vrijeme udvostručenja populacije patke prije obrade bilo najkraće u odnosu na podatke nakon obrade tla i u vrijeme žetve. U dinamici posmatranja veći je interes reakcija tla nakon primjene herbicida i u vrijeme žetve. Prije svega, interakcija s gnojivima i nivo plodnosti.

Ponekad dobijanje direktnog odgovora na primenu hemijskih preparata može biti komplikovano interakcijom preparata sa đubrivima, kako organskim tako i mineralnim. Dobijeni podaci omogućili su da se prati dinamika odziva primijenjenih preparata, u svim varijantama sa hemijskim sredstvima zaštite, gdje je rast indikatora zaustavljen.

Podaci jednosmjerne analize varijanse pokazali su značajan uticaj svakog indikatora na stopu rasta patke u prvoj fazi. U drugoj fazi, efekat razlike u plodnosti zemljišta iznosio je 65,0%, u sistemu đubriva i sistemu zaštite bilja - po 65,0%. Faktori su pokazali značajne razlike između prosjeka u pogledu trenutnog koeficijenta rasta opcije 222 i opcija 000, 111, 333. U trećoj fazi udio u ukupnoj disperziji plodnosti zemljišta iznosio je 42,9%, sistemi đubriva i sistemi zaštite bilja. - po 42,9%. Značajna razlika je zabilježena u prosječnim vrijednostima opcija 000 i 111, opcija 333 i 222.

Proučeni uzorci tla iz opcija terenskog monitoringa razlikuju se jedni od drugih u smislu inhibicije fototaksije. Uočen je uticaj faktora plodnosti, sistem đubriva i sredstva za zaštitu bilja sa učešćem od 30,7 i 39,7% u jednofaktorskoj analizi, u dvofaktorskoj i trofaktorskoj analizi registrovan je zajednički uticaj faktora.

Analiza eksperimentalnih rezultata pokazala je neznatne razlike između horizonata tla u pogledu indikatora inhibicije fototaksije. Razlike su označene prosječnim vrijednostima.

U svim varijantama u kojima postoje sredstva za zaštitu bilja, uočava se promjena položaja hloroplasta i zastoj rasta lećice /6/.

2.4 Gripa uzrokuje povećanu proizvodnju histamina

Istraživači iz Dječije bolnice u Pittsburghu (SAD) dobili su prve dokaze da se nivo histamina povećava s akutnim respiratornim virusnim infekcijama. Unatoč činjenici da se ranije sugeriralo da histamin igra ulogu u nastanku simptoma akutnih respiratornih infekcija gornjih disajnih puteva.

Naučnike je zanimalo zašto mnogi ljudi koriste antihistaminike, koji su u mnogim zemljama uključeni u OTC kategoriju, za samoliječenje “prehlade” i obične prehlade. dostupno bez lekarskog recepta.

Cilj ove studije bio je da se utvrdi da li je proizvodnja histamina povećana tokom eksperimentalne infekcije virusom gripa A.

15 zdravih dobrovoljaca intranazalno je ubrizgano virusom gripa A, a zatim je promatrano da li je došlo do razvoja infekcije. Dnevno u toku bolesti dobrovoljcima je prikupljan jutarnji dio urina, a zatim je određivan histamin i njegovi metaboliti i izračunata ukupna količina histamina i njegovih metabolita koji se izlučuju dnevno.

Bolest se razvila kod svih 15 dobrovoljaca. Analiza varijanse potvrdila je značajno viši nivo histamina u urinu 2-5 dana virusne infekcije (p<0,02) - период, когда симптомы «простуды» наиболее выражены. Парный анализ показал, что наиболее значительно уровень гистамина повышается на 2 день заболевания. Кроме этого, оказалось, что суточное количество гистамина и его метаболитов в моче при гриппе примерно такое же, как и при обострении аллергического заболевания.

Rezultati ove studije daju prvi direktan dokaz da je nivo histamina povišen kod akutnih respiratornih infekcija /7/.

Analiza varijanse u hemiji

Analiza disperzije je skup metoda za određivanje disperzije, odnosno karakteristika veličine čestica u disperznim sistemima. Analiza disperzije uključuje različite metode za određivanje veličine slobodnih čestica u tekućim i plinovitim medijima, veličine pornih kanala u fino poroznim tijelima (u ovom slučaju se umjesto koncepta disperzije koristi ekvivalentni koncept poroznosti), kao i specifičnu površinu. Neke od metoda disperzione analize omogućavaju da se dobije potpuna slika raspodjele čestica po veličini (volumen), dok druge daju samo prosječnu karakteristiku disperzije (poroznost).

Prva grupa uključuje, na primjer, metode za određivanje veličine pojedinačnih čestica direktnim mjerenjem (analiza sita, optička i elektronska mikroskopija) ili indirektnim podacima: brzina taloženja čestica u viskoznom mediju (analiza sedimentacije u gravitacionom polju i u centrifugama), veličina impulsa električne struje, koja nastaje prolaskom čestica kroz rupu u nevodljivoj pregradi (konduktometrijska metoda).

Druga grupa metoda kombinira procjenu prosječnih veličina slobodnih čestica i određivanje specifične površine prahova i poroznih tijela. Prosječna veličina čestica se utvrđuje intenzitetom raspršene svjetlosti (nefelometrija), ultramikroskopom, difuzijskim metodama itd., specifična površina određena je adsorpcijom plinova (pare) ili otopljenih tvari, propusnošću plina, brzinom rastvaranja i druge metode. Ispod su granice primjenjivosti različitih metoda analize varijanse (veličine čestica u metrima):

Analiza sita - 10 -2 -10 -4

Analiza sedimentacije u gravitacionom polju - 10 -4 -10 -6

Konduktometrijska metoda - 10 -4 -10 -6

Mikroskopija - 10 -4 -10 -7

Metoda filtriranja - 10 -5 -10 -7

Centrifugiranje - 10 -6 -10 -8

Ultracentrifugiranje - 10 -7 -10 -9

Ultramikroskopija - 10 -7 -10 -9

Nefelometrija - 10 -7 -10 -9

Elektronska mikroskopija - 10 -7 -10 -9

Metoda difuzije - 10 -7 -10 -10

Analiza disperzije ima široku primenu u različitim oblastima nauke i industrijske proizvodnje za procenu disperzije sistema (suspenzije, emulzije, solovi, prahovi, adsorbenti, itd.) veličine čestica od nekoliko milimetara (10 -3 m) do nekoliko nanometara (10 -9 m) /8/.

2.6 Upotreba direktne namjerne sugestije u budnom stanju u metodi odgoja fizičkih kvaliteta

Fizički trening je temeljna strana sportskog treninga, jer ga u većoj mjeri od ostalih aspekata treninga karakterišu fizička opterećenja koja utiču na morfološka i funkcionalna svojstva tijela. Uspeh tehničkog treninga, sadržaj taktike sportiste, ostvarivanje ličnih svojstava u procesu treninga i takmičenja zavise od nivoa fizičke spremnosti.

Jedan od glavnih zadataka fizičkog treninga je obrazovanje fizičkih kvaliteta. S tim u vezi, postoji potreba za razvojem pedagoških sredstava i metoda koje omogućavaju uzimanje u obzir starosnih karakteristika mladih sportista koji čuvaju njihovo zdravlje, ne zahtijevaju dodatno vrijeme, a istovremeno podstiču rast fizičkih kvaliteta i kao rezultat, sportski duh. Upotreba verbalnog heteroutjecaja u trenažnom procesu u primarnim trenažnim grupama jedno je od obećavajućih područja istraživanja ovog pitanja.

Analiza teorije i prakse implementacije inspirativnog verbalnog hetero-uticaja otkrila je glavne kontradikcije:

Dokazi o efektivnoj upotrebi specifičnih metoda verbalnog heterouticaja u trenažnom procesu i praktične nemogućnosti njihovog korišćenja od strane trenera;

Prepoznavanje direktne namjerne sugestije (u daljnjem tekstu DSP) u budnom stanju kao jedne od glavnih metoda verbalnog hetero-utjecaja u pedagoškoj aktivnosti trenera i nepostojanje teorijskog opravdanja za metodološke karakteristike njegove upotrebe u sportu. treninga, a posebno u procesu vaspitanja fizičkih kvaliteta.

U vezi sa uočenim kontradiktornostima i nedovoljnom razvijenošću, problem korišćenja sistema metoda verbalnog heterouticaja u procesu vaspitanja fizičkih kvaliteta sportista predodredio je svrhu studije - razvoj racionalnih ciljanih metoda PPV u budnom stanju, doprinos unapređenju procesa vaspitanja fizičkih kvaliteta na osnovu procene psihičkog stanja, ispoljavanja i dinamike fizičkih kvaliteta džudista osnovnih trenažnih grupa.

U cilju ispitivanja i utvrđivanja efikasnosti eksperimentalnih metoda PPV-a u razvoju fizičkih kvaliteta džudista, sproveden je uporedni pedagoški eksperiment u kojem su učestvovale četiri grupe - tri eksperimentalne i jedna kontrolna. U prvoj eksperimentalnoj grupi (EG) korišćena je tehnika PPV M1, u drugoj - PPV M2 tehnika, u trećoj - tehnika PPV M3. U kontrolnoj grupi (CG) PPV metode nisu korištene.

Da bi se utvrdila efikasnost pedagoškog uticaja PPV metoda u procesu vaspitanja fizičkih kvaliteta kod džudista, izvršena je jednofaktorska analiza varijanse.

Stepen uticaja metodologije PPV M1 u procesu obrazovanja:

Izdržljivost:

a) nakon trećeg mjeseca iznosio je 11,1%;

Brzinske sposobnosti:

a) nakon prvog mjeseca - 16,4%;

b) nakon drugog - 26,5%;

c) nakon trećeg - 34,8%;

a) nakon drugog mjeseca - 26,7%;

b) nakon trećeg - 35,3%;

Fleksibilnost:

a) nakon trećeg mjeseca - 20,8%;

a) nakon drugog mjeseca glavnog pedagoškog eksperimenta, stepen uticaja metodologije bio je 6,4%;

b) nakon trećeg - 10,2%.

Shodno tome, značajne promjene u pokazateljima nivoa razvijenosti fizičkih kvaliteta metodom PPV M1 pronađene su u brzinskim sposobnostima i snazi, stupanj utjecaja metode u ovom slučaju je najveći. Najmanji stepen uticaja metodologije uočen je u procesu vaspitanja izdržljivosti, fleksibilnosti i koordinacionih sposobnosti, što daje osnovu da se govori o nedovoljnoj efikasnosti upotrebe PPV M1 metode u vaspitanju ovih kvaliteta.

Stepen uticaja metodologije PPV M2 u procesu obrazovanja:

Izdržljivost

a) nakon prvog mjeseca eksperimenta - 12,6%;

b) nakon drugog - 17,8%;

c) nakon trećeg - 20,3%.

Brzinske sposobnosti:

a) nakon trećeg mjeseca treninga - 28%.

a) nakon drugog mjeseca - 27,9%;

b) nakon trećeg - 35,9%.

Fleksibilnost:

a) nakon trećeg mjeseca obuke - 14,9%;

Koordinacione sposobnosti - 13,1%.

Dobijeni rezultat jednofaktorske analize varijanse ovog EG-a nam omogućava da zaključimo da je PPV M2 metoda najefikasnija u razvoju izdržljivosti i snage. Manje je efikasan u procesu razvoja fleksibilnosti, brzine i sposobnosti koordinacije.

Stepen uticaja metodologije PPV M3 u procesu obrazovanja:

Izdržljivost:

a) nakon prvog mjeseca eksperimenta 16,8%;

b) nakon drugog - 29,5%;

c) nakon trećeg - 37,6%.

Brzinske sposobnosti:

a) nakon prvog mjeseca - 26,3%;

b) nakon drugog - 31,3%;

c) nakon trećeg - 40,9%.

a) nakon prvog mjeseca - 18,7%;

b) nakon drugog - 26,7%;

c) nakon trećeg - 32,3%.

Fleksibilnost:

a) nakon prvog - nema promjena;

b) nakon drugog - 16,9%;

c) nakon trećeg - 23,5%.

Koordinacione sposobnosti:

a) nema promjena nakon prvog mjeseca;

b) nakon drugog - 23,8%;

c) nakon trećeg - 91%.

Tako je jednofaktorska analiza varijanse pokazala da je primjena metode PPV M3 u pripremnom periodu najefikasnija u procesu vaspitanja fizičkih kvaliteta, jer se stepen njenog uticaja povećava nakon svakog mjeseca pedagoškog eksperimenta. /9/.

2.7 Ublažavanje akutnih psihotičnih simptoma kod pacijenata sa shizofrenijom atipičnim antipsihotikom

Svrha istraživanja bila je proučavanje mogućnosti primjene rispolepta za ublažavanje akutne psihoze kod pacijenata s dijagnozom šizofrenije (paranoidni tip prema ICD-10) i šizoafektivnog poremećaja. Istovremeno, indikator trajanja perzistencije psihotičnih simptoma u farmakoterapiji rispoleptom (glavna grupa) i klasičnim antipsihoticima korišten je kao glavni kriterij koji se proučava.

Osnovni ciljevi istraživanja bili su određivanje indikatora trajanja psihoze (tzv. neto psihoza), koji je shvaćen kao očuvanje produktivnih psihotičnih simptoma od početka upotrebe antipsihotika, izraženo u danima. Ovaj indikator je izračunat odvojeno za grupu risperidona i posebno za grupu klasične antipsihotike.

Uz to, postavljen je zadatak da se utvrdi udio smanjenja produktivnih simptoma pod utjecajem risperidona u odnosu na klasične antipsihotike u različitim periodima terapije.

Proučavano je ukupno 89 pacijenata (42 muškarca i 47 žena) sa akutnim psihotičnim simptomima u okviru paranoidnog oblika šizofrenije (49 pacijenata) i šizoafektivnog poremećaja (40 pacijenata).

Prva epizoda i trajanje bolesti do 1 godine registrovani su kod 43 pacijenta, dok su u ostalim slučajevima u vrijeme istraživanja zabilježene naknadne epizode shizofrenije s trajanjem bolesti dužim od 1 godine.

Rispoleptom terapiju primilo je 29 osoba, među kojima je bilo 15 pacijenata sa tzv. prvom epizodom. Terapiju klasičnim neurolepticima primilo je 60 osoba, među kojima je bilo 28 osoba sa prvom epizodom. Doza rispolepta varirala je u rasponu od 1 do 6 mg dnevno i iznosila je u prosjeku 4±0,4 mg/dan. Risperidon se uzimao isključivo oralno nakon jela jednom dnevno uveče.

Terapija klasičnim antipsihoticima uključivala je primjenu trifluoperazina (triftazina) u dnevnoj dozi do 30 mg intramuskularno, haloperidola u dnevnoj dozi do 20 mg intramuskularno, triperidola u dnevnoj dozi do 10 mg oralno. Velika većina pacijenata uzimala je klasične antipsihotike kao monoterapiju tijekom prve dvije sedmice, nakon čega su prelazili, ako je potrebno (uz zadržavanje deluzijskih, halucinatornih ili drugih produktivnih simptoma), na kombinaciju nekoliko klasičnih antipsihotika. Istovremeno, kao glavni lijek je ostao neuroleptik s izraženim elektivnim antideluzionim i antihalucinacijskim djelovanjem (npr. haloperidol ili triftazin), lijek s izrazitim hipnosedativnim djelovanjem (hlorpromazin, tizercin, hlorprotiksen u dozama do 50-100 mg / dan) je dodavan uveče.

U grupi koja je uzimala klasične antipsihotike planirano je uzimanje antiholinergičkih korektora (Parkopan, Cyclodol) u dozama do 10-12 mg/dan. Korektori su propisani u slučaju pojave izrazitih ekstrapiramidnih nuspojava u vidu akutne distonije, parkinsonizma izazvanog lijekovima i akatizije.

U tabeli 2.1 prikazani su podaci o trajanju psihoze u liječenju rispoleptom i klasičnim antipsihoticima.

Tabela 2.1 – Trajanje psihoze („neto psihoze“) u liječenju rispoleptom i klasičnim antipsihoticima

Kao što proizilazi iz podataka u tabeli, kada se uporedi trajanje psihoze tokom terapije klasičnim antipsihoticima i risperidonom, uočava se skoro dvostruko smanjenje trajanja psihotičnih simptoma pod uticajem rispolepta. Značajno je da ni faktori serijskog broja napada, kao ni priroda slike vodećeg sindroma nisu uticali na ovu vrijednost trajanja psihoze. Drugim riječima, trajanje psihoze određivao je isključivo terapijski faktor, tj. ovisno o vrsti lijeka koji se koristi, bez obzira na serijski broj napada, dužinu trajanja bolesti i prirodu vodećeg psihopatološkog sindroma.

Kako bi se potvrdile dobijene pravilnosti, izvršena je dvofaktorska analiza varijanse. Istovremeno, naizmjence je uzeta u obzir interakcija terapijskog faktora i serijskog broja napada (faza 1) te interakcija terapijskog faktora i prirode vodećeg sindroma (faza 2). Rezultati analize varijanse potvrdili su uticaj faktora terapije na trajanje psihoze (F=18,8) u odsustvu uticaja faktora broja napada (F=2,5) i faktora tipa psihopatološkog sindroma (F=1,7). ). Važno je da je izostao i zajednički uticaj terapijskog faktora i broja napada na trajanje psihoze, kao i zajednički uticaj faktora terapije i faktora psihopatološkog sindroma.

Dakle, rezultati analize varijanse potvrdili su uticaj samo faktora primenjenog antipsihotika. Rispolept je nedvosmisleno doveo do smanjenja trajanja psihotičnih simptoma u odnosu na tradicionalne antipsihotike za oko 2 puta. Važno je da je ovaj efekat postignut uprkos oralnoj primeni rispolepta, dok su klasični antipsihotici kod većine pacijenata korišćeni parenteralno /10/.

2.8 Savijanje fensi niti sa efektom rovinga

Državni tehnološki univerzitet Kostroma razvio je novu strukturu navoja sa promenljivim geometrijskim parametrima. S tim u vezi, javlja se problem prerade fensi pređe u pripremnoj proizvodnji. Ova studija je bila posvećena procesu savijanja na pitanja: izbor tipa zatezača koji daje minimalno širenje zatezanja i poravnanje zatezanja, navoje različite linearne gustine po širini osovine savijanja.

Predmet istraživanja je laneni konac četiri varijante linearne gustoće od 140 do 205 tex. Proučavan je rad zateznih uređaja tri tipa: porculanske podloške, dvozonske NS-1P i jednozonske NS-1P. Eksperimentalno istraživanje napetosti niti savijanja provedeno je na mašini za savijanje SP-140-3L. Brzina savijanja, težina kočionih diskova odgovarala su tehnološkim parametrima savijanja pređe.

Za proučavanje zavisnosti napetosti oblikovane niti od geometrijskih parametara tokom savijanja, izvršena je analiza za dva faktora: X 1 - prečnik efekta, X 2 - dužina efekta. Izlazni parametri su napetost Y 1 i fluktuacija napetosti Y 2 .

Rezultirajuće jednačine regresije su adekvatne eksperimentalnim podacima na nivou značajnosti od 0,95, budući da je izračunati Fišerov kriterijum za sve jednačine manji od tabelarnog.

Da bi se utvrdio stepen uticaja faktora X 1 i X 2 na parametre Y 1 i Y 2, urađena je analiza varijanse koja je pokazala da prečnik efekta ima veći uticaj na nivo i fluktuaciju napetosti. .

Komparativna analiza dobijenih tenzograma pokazala je da minimalno širenje zatezanja pri savijanju ove pređe obezbeđuje dvozonski zatezni uređaj NS-1P.

Utvrđeno je da sa povećanjem linearne gustine sa 105 na 205 tex, uređaj NS-1P daje povećanje nivoa napetosti za samo 23%, dok mašina za pranje porcelana - za 37%, jednozonska NS-1P - za 53%.

Prilikom oblikovanja savijajućih osovina, uključujući oblikovane i "glatke" navoje, potrebno je individualno podesiti zatezač tradicionalnom metodom /11/.

2.9. Popratna patologija s potpunim gubitkom zuba kod starijih i senilnih osoba

Proučavani su epidemiološki potpuni gubitak zuba i prateća patologija kod starije populacije koja živi u staračkim domovima na teritoriji Čuvašije. Pregled je obavljen stomatološkim pregledom i popunjavanjem statističkih kartica 784 osobe. Rezultati analize su pokazali visok procenat potpunog gubitka zuba, pogoršan opštom patologijom organizma. Ovo karakteriše ispitivanu kategoriju stanovništva kao grupu povećanog stomatološkog rizika i zahteva reviziju celokupnog sistema njihove stomatološke zaštite.

Kod starijih osoba stopa incidencije je dva puta, a u starijoj dobi šest puta veća u odnosu na stopu incidencije kod mlađih osoba.

Glavne bolesti starijih i senilnih osoba su bolesti krvožilnog sistema, nervnog sistema i čulnih organa, organa za disanje, organa za varenje, kostiju i organa za kretanje, neoplazme i povrede.

Svrha studije je razvoj i dobijanje informacija o pratećim bolestima, efikasnosti protetike i potrebi ortopedskog lečenja starijih i senilnih osoba sa potpunim gubitkom zuba.

Ukupno su pregledane 784 osobe starosti od 45 do 90 godina. Odnos žena i muškaraca je 2,8:1.

Procjena statističkog odnosa korištenjem koeficijenta korelacije Pearsonovih rangova omogućila je utvrđivanje međusobnog utjecaja nedostajućih zuba na prateći morbiditet sa nivoom pouzdanosti od p=0,0005. Stariji pacijenti sa potpunim gubitkom zuba pate od bolesti karakterističnih za stariju životnu dob, a to su cerebralna ateroskleroza i hipertenzija.

Analiza varijanse pokazala je da specifičnost bolesti igra odlučujuću ulogu u ispitivanim uslovima. Uloga nozoloških oblika u različitim starosnim periodima kreće se od 52-60%. Najveći statistički značajan uticaj na odsustvo zuba imaju bolesti probavnog sistema i dijabetes melitus.

Generalno, grupu pacijenata starosti 75-89 godina karakteriše veliki broj patoloških oboljenja.

U ovoj studiji urađena je komparativna studija učestalosti komorbiditeta kod pacijenata sa potpunim gubitkom zuba starije i senilne dobi koji žive u staračkim domovima. Utvrđen je visok postotak nedostatka zuba kod ljudi ove starosne grupe. Kod pacijenata sa potpunom adentijom primećuju se komorbiditeti karakteristični za ovo doba. Među ispitivanim osobama najčešće su bile ateroskleroza i hipertenzija. Statistički značajan uticaj na stanje usne duplje bolesti kao što su bolesti gastrointestinalnog trakta i dijabetes melitus, udeo ostalih nozoloških oblika bio je u rasponu od 52-60%. Upotreba analize varijanse nije potvrdila značajnu ulogu pola i mjesta stanovanja na pokazatelje stanja usne šupljine.

Dakle, u zaključku treba napomenuti da je analiza distribucije pratećih bolesti kod osoba sa potpunim odsustvom zuba u starijoj i senilnoj dobi pokazala da ova kategorija građana pripada posebnoj grupi stanovništva koja treba da dobije adekvatne stomatološke usluge. njega u okviru postojećih stomatoloških sistema /12/ .

3 Analiza varijanse u kontekstu statističkih metoda

Statističke metode analize su metodologija za mjerenje rezultata ljudske djelatnosti, odnosno pretvaranje kvalitativnih karakteristika u kvantitativne.

Glavni koraci u statističkoj analizi:

Izrada plana za prikupljanje početnih podataka - vrijednosti ulaznih varijabli (X 1 ,...,X p), broj opservacija n. Ovaj korak se izvodi kada se eksperiment aktivno planira.

Dobijanje početnih podataka i njihovo unošenje u računar. U ovoj fazi formiraju se nizovi brojeva (x 1i ,..., x pi ; y 1i ,..., y qi), i=1,..., n, gdje je n veličina uzorka.

Primarna statistička obrada podataka. U ovoj fazi se formira statistički opis razmatranih parametara:

a) konstrukcija i analiza statističkih zavisnosti;

b) korelaciona analiza je dizajnirana da proceni značaj uticaja faktora (X 1 ,...,X p) na odgovor Y;

c) analiza varijanse se koristi za evaluaciju uticaja nekvantitativnih faktora (X 1 ,...,X p) na odgovor Y kako bi se među njima izabrala najvažniji;

d) regresiona analiza je dizajnirana da odredi analitičku zavisnost odgovora Y od kvantitativnih faktora X;

Interpretacija rezultata u smislu postavljenog zadatka /13/.

Tabela 3.1 prikazuje statističke metode kojima se rješavaju analitički problemi. Odgovarajuće ćelije tabele sadrže frekvencije primjene statističkih metoda:

Oznaka "-" - metoda se ne primjenjuje;

Oznaka "+" - metoda je primijenjena;

Oznaka "++" - metoda se široko koristi;

Oznaka "+++" - primjena metode je od posebnog interesa /14/.

Analiza varijanse, kao što je Studentov t-test, omogućava vam da procenite razlike između srednjih vrednosti uzorka; međutim, za razliku od t-testa, on nema ograničenja na broj uspoređenih srednjih vrijednosti. Stoga, umjesto da se pita da li se dva uzorkovana srednje vrijednosti razlikuju, može se procijeniti da li se razlikuju dva, tri, četiri, pet ili k.

ANOVA vam omogućava da se bavite sa dve ili više nezavisnih varijabli (karakteristike, faktori) u isto vreme, procenjujući ne samo efekat svake od njih posebno, već i efekte interakcije između njih /15/.


Tabela 3.1 - Primjena statističkih metoda u rješavanju analitičkih problema

Analitički poslovi koji nastaju u oblasti poslovanja, finansija i menadžmenta

Metode deskriptivne statistike

Metode za provjeru statističkih hipoteza

Metode regresijske analize

Metode analize disperzije

Metode multivarijantne analize

Metode diskriminantne analize

cluster-nogo

Metode analize

preživljavanje

Metode analize

i prognoza

vremenske serije

Zadaci horizontalne (vremenske) analize

Zadaci vertikalne (konstruktivne) analize

Zadaci analize trenda i prognoze

Zadaci analize relativnih indikatora

Zadaci uporedne (prostorne) analize

Zadaci faktorske analize

Za većinu složenih sistema važi Pareto princip prema kojem 20% faktora određuje svojstva sistema za 80%. Stoga je primarni zadatak istraživača simulacionog modela da eliminiše beznačajne faktore, što omogućava smanjenje dimenzije problema optimizacije modela.

Analiza varijanse procjenjuje odstupanje opažanja od ukupne srednje vrijednosti. Zatim se varijacija razlaže na dijelove, od kojih svaki ima svoj uzrok. Preostali dio varijacije, koji se ne može povezati sa uslovima eksperimenta, smatra se njenom slučajnom greškom. Za potvrdu značaja koristi se poseban test - F-statistika.

Analiza varijanse utvrđuje da li postoji efekat. Regresiona analiza vam omogućava da predvidite odgovor (vrijednost ciljne funkcije) u nekom trenutku u prostoru parametara. Neposredni zadatak regresione analize je procjena koeficijenata regresije /16/.

Prevelike veličine uzorka otežavaju statističke analize, pa je logično smanjiti veličinu uzorka.

Primjenom analize varijanse moguće je identificirati značajnost utjecaja različitih faktora na varijablu koja se proučava. Ako se uticaj nekog faktora pokaže beznačajnim, onda se ovaj faktor može isključiti iz dalje obrade.

Makroekonometričari moraju biti u stanju da riješe četiri logički različita problema:

Opis podataka;

Makroekonomska prognoza;

Strukturno zaključivanje;

Analiza politike.

Opisivanje podataka znači opisivanje svojstava jedne ili više vremenskih serija i prenošenje ovih svojstava širokom spektru ekonomista. Makroekonomsko predviđanje znači predviđanje toka ekonomije, obično dvije do tri godine ili manje (uglavnom zato što je previše teško prognozirati na dužim horizontima). Strukturno zaključivanje znači provjeru da li su makroekonomski podaci u skladu s određenom ekonomskom teorijom. Makroekonometrijska analiza politike se odvija u nekoliko pravaca: s jedne strane, procjenjuje se utjecaj na ekonomiju hipotetičke promjene instrumenata politike (na primjer, poreske stope ili kratkoročne kamatne stope), s druge strane, utjecaja na ekonomiju. ocjenjuje se promjena pravila politike (na primjer, prelazak na novi režim monetarne politike). Empirijski makroekonomski istraživački projekat može uključivati ​​jedan ili više od ova četiri zadatka. Svaki problem mora biti riješen na način da se uzmu u obzir korelacije između vremenskih serija.

Sedamdesetih godina 20. vijeka ovi problemi su rješavani različitim metodama, koje su, gledano sa modernih pozicija, bile neadekvatne iz više razloga. Za opisivanje dinamike pojedinačne serije bilo je dovoljno jednostavno koristiti jednodimenzionalne modele vremenskih serija, a za opisivanje zajedničke dinamike dvije serije bilo je dovoljno koristiti spektralnu analizu. Međutim, nije postojao zajednički jezik pogodan za sistematski opis zajedničkih dinamičkih svojstava nekoliko vremenskih serija. Ekonomske prognoze su napravljene ili korištenjem pojednostavljenih modela autoregresivnog pokretnog prosjeka (ARMA) ili korištenjem velikih strukturnih ekonometrijskih modela popularnih u to vrijeme. Strukturno zaključivanje se zasnivalo ili na malim modelima jedne jednadžbe ili na velikim modelima čija je identifikacija postignuta neosnovanim isključivim ograničenjima i koji obično nisu uključivali očekivanja. Analiza politike strukturnog modela zavisila je od ovih identifikacionih pretpostavki.

Konačno, rast cijena 1970-ih mnogi su vidjeli kao veliki zastoj za velike modele koji su se u to vrijeme koristili za davanje preporuka o politici. Odnosno, bilo je pravo vrijeme za pojavu nove makroekonometrijske konstrukcije koja bi mogla riješiti ove mnoge probleme.

Godine 1980. stvorena je takva konstrukcija - vektorske autoregresije (VAR). Na prvi pogled, VAR nije ništa drugo do generalizacija univarijantne autoregresije na multivarijantni slučaj, a svaka jednadžba u VAR-u nije ništa više od jednostavne regresije najmanjih kvadrata jedne varijable na zaostale vrijednosti same sebe i drugih varijabli u VAR-u. Ali ovaj naizgled jednostavan alat omogućio je sistematsko i interno dosljedno snimanje bogate dinamike multivarijatnih vremenskih serija, a statistički alat koji prati VAR pokazao se praktičnim i, što je vrlo važno, lakim za interpretaciju.

Postoje tri različita VAR modela:

Smanjeni VAR obrazac;

Rekurzivni VAR;

Strukturni VAR.

Sva tri su dinamički linearni modela koji povezuju trenutne i prošle vrijednosti vektora Y t n-dimenzionalne vremenske serije. Redukovani oblik i rekurzivni VAR-ovi su statistički modeli koji ne koriste nikakva ekonomska razmatranja osim izbora varijabli. Ovi VAR-ovi se koriste za opisivanje podataka i prognoze. Strukturni VAR uključuje ograničenja izvedena iz makroekonomske teorije i ovaj VAR se koristi za strukturno zaključivanje i analizu politike.

Gornji oblik VAR-a izražava Y t kao distribuirano prošlo kašnjenje plus serijski nekorelirani termin greške, to jest, generalizira univarijantnu autoregresiju na slučaj vektora. Matematički redukovana forma VAR modela je sistem od n jednačina koji se mogu napisati u matričnom obliku na sljedeći način:

gdje je  n l vektor konstanti;

A 1 , A 2 , ..., A p su n n matrica koeficijenata;

 t , je nl vektor serijski nekoreliranih grešaka, za koje se pretpostavlja da imaju srednju vrijednost nula i matricu kovarijanse.

Greške  t , u (17) su neočekivana dinamika u Y t , koja ostaje nakon uzimanja u obzir linearno distribuiranog kašnjenja prošlih vrijednosti.

Procjena parametara smanjene VAR forme je jednostavna. Svaka od jednačina sadrži iste regresore (Y t–1 ,...,Y t–p), a među jednačinama nema međusobnih ograničenja. Dakle, efektivna procjena (metoda maksimalne vjerovatnoće sa punim informacijama) je pojednostavljena na uobičajene najmanje kvadrate primijenjene na svaku od jednačina. Kovarijantna matrica greške može se razumno procijeniti pomoću matrice kovarijanse uzorka dobivene iz LSM reziduala.

Jedina suptilnost je odrediti dužinu kašnjenja p, ali to se može učiniti korištenjem informacijskog kriterija kao što je AIC ili BIC.

Na nivou matričnih jednadžbi, rekurzivni i strukturni VAR izgledaju isto. Ova dva VAR modela eksplicitno uzimaju u obzir istovremene interakcije između elemenata Y t , što znači dodavanje simultanog člana desnoj strani jednačine (17). Prema tome, rekurzivni i strukturni VAR su predstavljeni u sljedećem općem obliku:

gdje je  - vektor konstanti;

B 0 ,..., B p - matrice;

 t - greške.

Prisustvo matrice B 0 u jednačini znači mogućnost istovremene interakcije između n varijabli; to jest, B 0 vam omogućava da ove varijable koje se odnose na istu tačku u vremenu, definišu zajedno.

Rekurzivni VAR se može procijeniti na dva načina. Rekurzivna struktura daje skup rekurzivnih jednačina koje se mogu procijeniti korištenjem metode najmanjih kvadrata. Ekvivalentna metoda procjene je da se jednačine reduciranog oblika (17), koje se posmatraju kao sistem, pomnože s lijeve strane donjom trouglastom matricom.

Metoda procjene strukturnog VAR-a ovisi o tome kako je točno B 0 identificiran. Pristup parcijalnih informacija podrazumijeva korištenje metoda procjene jedne jednadžbe kao što su najmanji kvadrati u dva koraka. Potpuni informacioni pristup podrazumijeva korištenje metoda procjene više jednačina kao što su najmanji kvadrati u tri koraka.

Budite svjesni mnogih različitih tipova VAR-ova. Smanjeni oblik VAR-a je jedinstven. Ovaj red varijabli u Y t odgovara jednom rekurzivnom VAR-u, ali postoji n! takve naredbe, tj. n! razne rekurzivne VAR-ove. Broj strukturalnih VAR-ova – odnosno skupova pretpostavki koji identifikuju istovremene odnose između varijabli – ograničen je samo genijalnošću istraživača.

Budući da je matrice procijenjenih VAR koeficijenata teško direktno interpretirati, rezultati VAR procjene su obično predstavljeni nekom funkcijom ovih matrica. Na takvu statistiku dekompoziciju grešaka prognoze.

Proširenja varijanse greške prognoze izračunavaju se uglavnom za rekurzivne ili strukturne sisteme. Ova dekompozicija varijanse pokazuje koliko je greška u j-toj jednačini važna za objašnjenje neočekivanih promjena u i-toj varijable. Kada su VAR greške ekvacionalno nekorelirane, varijansa greške prognoze za h perioda unaprijed može se napisati kao zbir komponenti koje proizlaze iz svake od ovih grešaka /17/.

3.2 Faktorska analiza

U savremenoj statistici, faktorska analiza se shvata kao skup metoda koje, na osnovu realnih životnih odnosa karakteristika (ili objekata), omogućavaju da se identifikuju latentne generalizirajuće karakteristike organizacione strukture i mehanizma razvoja fenomena i procesi koji se proučavaju.

Koncept latencije u definiciji je ključan. To znači implicitnost karakteristika otkrivenih korištenjem metoda faktorske analize. Prvo, radi se o skupu elementarnih karakteristika X j, njihova interakcija pretpostavlja prisustvo određenih uzroka, posebnih uslova, tj. postojanje nekih skrivenih faktora. Potonji se uspostavljaju kao rezultat generalizacije elementarnih karakteristika i deluju kao integrisane karakteristike, ili karakteristike, ali višeg nivoa. Naravno, ne mogu korelirati samo trivijalne karakteristike X j, već i sami posmatrani objekti N i, pa je traženje latentnih faktora teoretski moguće i prema podacima o osobinama i objektima.

Ako objekte karakteriše dovoljno veliki broj elementarnih karakteristika (m > 3), onda je logična i druga pretpostavka - o postojanju gustog klastera tačaka (obilježja) u prostoru od n objekata. Istovremeno, nove ose generalizuju ne karakteristike X j , već objekte n i , respektivno, a latentni faktori F r će se prepoznati po sastavu posmatranih objekata:

F r = c 1 n 1 + c 2 n 2 + ... + c N n N ,

gdje je c i težina objekta n i u faktoru F r .

U zavisnosti od toga koji se od navedenih tipova korelacije - elementarne karakteristike ili posmatrani objekti - proučava u faktorskoj analizi, razlikuju se R i Q - tehničke metode obrade podataka.

Naziv R-tehnike je volumetrijska analiza podataka po m karakteristikama, kao rezultat čega se dobija r linearnih kombinacija (grupa) karakteristika: F r =f(X j), (r=1..m). Analiza prema blizini (povezanosti) n posmatranih objekata naziva se Q-tehnika i omogućava određivanje r linearnih kombinacija (grupa) objekata: F=f(n i), (i = l.. N).

Trenutno se u praksi više od 90% problema rješava R-tehnikama.

Skup metoda faktorske analize trenutno je prilično velik, uključuje desetine različitih pristupa i tehnika obrade podataka. Da bismo se fokusirali na pravilan izbor metoda u istraživanju, potrebno je predstaviti njihove karakteristike. Sve metode faktorske analize dijelimo u nekoliko klasifikacijskih grupa:

Metoda glavne komponente. Strogo govoreći, nije klasifikovana kao faktorska analiza, iako sa njom ima mnogo zajedničkog. Specifičnost je, prvo, to što se u toku računskih postupaka istovremeno dobijaju sve glavne komponente i njihov broj je u početku jednak broju elementarnih karakteristika. Drugo, postulira se mogućnost potpune dekompozicije disperzije elementarnih osobina, odnosno njeno potpuno objašnjenje kroz latentne faktore (generalizovane karakteristike).

Metode faktorske analize. Varijanca elementarnih karakteristika ovdje nije u potpunosti objašnjena, prepoznato je da dio varijanse ostaje neprepoznat kao karakteristika. Faktori se obično izdvajaju redom: prvi koji objašnjava najveći udio varijacije u elementarnim karakteristikama, zatim drugi koji objašnjava manji dio varijanse, drugi nakon prvog latentnog faktora, treći itd. Proces izdvajanja faktora može se prekinuti u bilo kom koraku ako se donese odluka o dovoljnosti proporcije objašnjene varijanse elementarnih karakteristika ili uzimajući u obzir interpretabilnost latentnih faktora.

Preporučljivo je dalje podijeliti metode faktorske analize u dvije klase: pojednostavljene i moderne metode aproksimacije.

Jednostavne metode faktorske analize su uglavnom povezane sa početnim teorijskim razvojem. Imaju ograničene mogućnosti u identifikaciji latentnih faktora i aproksimaciji faktorskih rješenja. To uključuje:

Model sa jednim faktorom. Omogućava vam da odaberete samo jedan opći latentni i jedan karakterističan faktor. Za eventualno postojeće druge latentne faktore, pretpostavlja se njihova beznačajnost;

bifaktorski model. Omogućava uticaj na varijaciju elementarnih karakteristika ne jednog, već više latentnih faktora (obično dva) i jednog karakterističnog faktora;

centroid metoda. U njemu se korelacije između varijabli posmatraju kao skup vektora, a latentni faktor je geometrijski predstavljen kao balansni vektor koji prolazi kroz centar ove grupe. : Metoda vam omogućava da identifikujete nekoliko latentnih i karakterističnih faktora, po prvi put postaje moguće povezati faktorijalno rješenje s originalnim podacima, tj. riješiti problem aproksimacije u najjednostavnijem obliku.

Moderne metode aproksimacije često pretpostavljaju da je prvo, približno rješenje već pronađeno nekom od metoda, a ovo rješenje se optimizira sljedećim koracima. Metode se razlikuju po složenosti proračuna. Ove metode uključuju:

grupna metoda. Rješenje se zasniva na grupama elementarnih karakteristika koje su na neki način unaprijed odabrane;

Metoda glavnih faktora. Najbliži je metodi glavnih komponenti, razlika je u pretpostavci postojanja karakteristika;

Maksimalna vjerovatnoća, minimalni ostaci, a-faktorska analiza, kanonska faktorska analiza, sve optimizacija.

Ove metode omogućavaju konzistentno poboljšanje prethodno pronađenih rješenja baziranih na korištenju statističkih tehnika za procjenu slučajne varijable ili statističkih kriterija i zahtijevaju veliku količinu dugotrajnih proračuna. Najperspektivniji i najpogodniji za rad u ovoj grupi je metoda maksimalne vjerovatnoće.

Glavni zadatak, koji se rješava različitim metodama faktorske analize, uključujući i metodu glavnih komponenti, je kompresija informacija, prijelaz sa skupa vrijednosti prema m elementarnim karakteristikama s količinom informacija n x m na ograničenu skup elemenata matrice faktorskog mapiranja (m x r) ili matrice faktora latentnih vrijednosti za svaki promatrani objekt dimenzije n x r, a obično r< m.

Metode faktorske analize omogućavaju i vizualizaciju strukture proučavanih pojava i procesa, što znači određivanje njihovog stanja i predviđanje njihovog razvoja. Konačno, podaci faktorske analize daju osnovu za identifikaciju objekta, tj. rješavanje problema prepoznavanja slike.

Metode faktorske analize imaju svojstva koja su veoma atraktivna za njihovu upotrebu u sklopu drugih statističkih metoda, najčešće u korelaciono-regresionoj analizi, klaster analizi, multivarijantnom skaliranju itd. /18/.

3.3 Uparena regresija. Probabilistička priroda regresijskih modela.

Ako uzmemo u obzir problem analize troškova hrane u grupama sa istim prihodom, na primjer 10.000 USD(x), onda je ovo deterministička vrijednost. Ali Y – udio ovog novca potrošenog na hranu – je nasumičan i može se mijenjati iz godine u godinu. Dakle, za svakog i-og pojedinca:

gdje je ε i - slučajna greška;

α i β su konstante (teoretski), iako se mogu razlikovati od modela do modela.

Preduvjeti za parnu regresiju:

X i Y su linearno povezani;

X je neslučajna varijabla sa fiksnim vrijednostima;

- ε - greške su normalno raspoređene N(0,σ 2);

- .

Slika 3.1 prikazuje model parne regresije.

Slika 3.1 - Upareni regresijski model

Ove pretpostavke opisuju klasični model linearne regresije.

Ako greška ima srednju vrijednost različitu od nule, originalni model će biti ekvivalentan novom modelu i drugom presjeku, ali s nultom srednjom vrijednosti za grešku.

Ako su preduvjeti ispunjeni, tada su estimatori najmanjih kvadrata i efikasni linearni nepristrasni estimatori

Ako odredimo:

činjenica da će matematičko očekivanje i disperzija koeficijenata biti sljedeća:

Kovarijansa koeficijenata:

Ako a onda su i oni normalno raspoređeni:

Iz ovoga proizilazi da:

Varijacija β je u potpunosti određena varijacijom ε;

Što je veća varijansa X, to je bolja procjena β.

Ukupna disperzija je određena formulom:

Varijanca odstupanja u ovom obliku je nepristrasna procjena i naziva se standardna greška regresije. N-2 - može se tumačiti kao broj stepeni slobode.

Analiza odstupanja od linije regresije može pružiti korisnu mjeru koliko dobro procijenjena regresija odražava stvarne podatke. Dobra regresija je ona koja objašnjava značajan dio varijanse u Y, i obrnuto, loša regresija ne prati većinu fluktuacija u originalnim podacima. Intuitivno je jasno da će svaka dodatna informacija poboljšati model, odnosno smanjiti neobjašnjivi udio varijacije Y. Za analizu regresionog modela, varijansa se razlaže na komponente i određuje se koeficijent determinacije R 2.

Odnos dvije varijanse raspoređuje se prema F-distribuciji, odnosno ako provjerimo statističku značajnost razlike između varijanse modela i varijanse reziduala, možemo zaključiti da je R 2 značajan.

Testiranje hipoteze o jednakosti varijansi ova dva uzorka:

Ako je hipoteza H 0 (jednakost varijansi nekoliko uzoraka) tačna, t ima F-distribuciju sa (m 1 ,m 2)=(n 1 -1,n 2 -1) stepenima slobode.

Izračunavši F-razmjer kao omjer dvije disperzije i upoređujući ga sa tabelarnom vrijednošću, možemo zaključiti da je R 2 /2/, /19/ statistički značajan.

Zaključak

Savremene primene analize varijanse pokrivaju širok spektar problema u ekonomiji, biologiji i tehnologiji i obično se tumače u smislu statističke teorije otkrivanja sistematskih razlika između rezultata direktnih merenja izvršenih u određenim promenljivim uslovima.

Zahvaljujući automatizaciji analize varijanse, istraživač može provoditi različite statističke studije koristeći kompjutere, trošeći manje vremena i truda na proračune podataka. Trenutno postoji mnogo softverskih paketa koji implementiraju aparat za analizu disperzije. Najčešći softverski proizvodi su:

Većina statističkih metoda implementirana je u moderne statističke softverske proizvode. Razvojem algoritamskih programskih jezika postalo je moguće kreirati dodatne blokove za obradu statističkih podataka.

ANOVA je moćna moderna statistička metoda za obradu i analizu eksperimentalnih podataka u psihologiji, biologiji, medicini i drugim naukama. Vrlo je blisko povezan sa specifičnom metodologijom za planiranje i izvođenje eksperimentalnih studija.

Analiza varijanse se koristi u svim oblastima naučnog istraživanja, gdje je potrebno analizirati uticaj različitih faktora na varijablu koja se proučava.

Bibliografija

1 Kremer N.Sh. Teorija vjerojatnosti i matematička statistika. M.: Jedinstvo - Dana, 2002.-343s.

2 Gmurman V.E. Teorija vjerojatnosti i matematička statistika. - M.: Viša škola, 2003.-523s.

4 www.conf.mitme.ru

5 www.pedklin.ru

6 www.webcenter.ru

7 www.infections.ru

8 www.encycl.yandex.ru

9 www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 Gusev A.N. Analiza disperzije u eksperimentalnoj psihologiji. - M.: Obrazovno-metodički kolekcionar "Psihologija", 2000.-136s.

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru