Biograafiad Omadused Analüüs

Dispersioonkorrelatsioonitabeli ühemõõtmeline analüüs. Mitmekordne võrdlus: Tukey-Krameri protseduur

Oletame, et automaatliinil teevad sama toimingut paralleelselt mitu masinat. Järgneva töötlemise õigeks planeerimiseks on oluline teada, kui ühtlased on paralleelsetel masinatel saadud osade keskmised mõõtmed. Osade suurust mõjutab ainult üks tegur ja see on masinad, millel need on valmistatud. Tuleb välja selgitada, kui oluline on selle teguri mõju osade mõõtmetele. Oletame, et igal masinal toodetud osade suuruste komplektidel on normaaljaotus ja võrdsed dispersioonid.

Meil on m masinat, seega m agregaati või taset, millel n 1, n 2,..., n t tähelepanekuid. Arutlemise lihtsuse huvides oletame, et n 1 \u003d n 2 \u003d ... \u003d jne moodustavate osade mõõtmed n i tähelepanekud peal i-th tase, tähistage x i 1 , x mina 2,..., x in . Siis saab kõiki vaatlusi esitada tabeli kujul, mida nimetatakse vaatluste maatriksiks (tabel 3.1).

Tabel 3.1

Tasemed Vaatlustulemused
1 2 j n
x 11 x 12 x 1 j x 1 n
x 21 x 22 x 2 j x 2 n
x 31 x 32 x 3 j x 3 n
i x i1 x i2 x i j x i n
m x m1 x m2 x mj xmn

Me eeldame, et i-ndal tasemel n vaatlustel on keskmine βi, võrdne summagaüldkeskmine µ ja selle kõikumine i-teguri aste, s.o. βi = µ + γ i. Siis saab esitada ühe vaatluse järgmine vorm:

x i j = µ + γ i. +ε ij= βi + εij (3.1)

kus µ on üldine keskmine; γ i- mõju tingitud i-teguri tase; εij- tulemuste varieerumine teatud taseme piires.

liige εij iseloomustab kõigi mudeliga (3.1) arvestamata tegurite mõju. Dispersioonanalüüsi üldprobleemi kohaselt on vaja hinnata teguri γ mõju olulisust osade mõõtmetele. Üldine variatsioon muutuv x i j saab lagundada osadeks, millest üks iseloomustab teguri γ mõju, teine ​​- arvestamata tegurite mõju. Selleks on vaja leida hinnang üldkeskmise µ kohta ja hinnang tasemete keskmiste kohta βi. On ilmne, et hindamine β on n i-nda taseme vaatluse aritmeetiline keskmine, s.o.

Tärn indeksis punktis x tähendab, et vaatlused on fikseeritud i-ndal tasemel. Kogu vaatluste komplekti aritmeetiline keskmine on üldkeskmise µ hinnang, st.

Leidke hälvete ruudu summa x i j aastast, st.

Esitame seda kujul (3.2)

Ja =

Aga = 0, kuna see on ühe üldkogumi muutujate kõrvalekallete summa sama üldkogumi aritmeetilisest keskmisest, s.o. kogu summa on null. Kirjutame summa (3.2) teise liikme kujul:



Või

Mõiste on kogu vaatluste kogumi keskmiste tasemete ja keskmise vahe ruudus olevate erinevuste summa. Seda summat nimetatakse rühmadevaheliste hälvete ruudu summaks ja see iseloomustab tasemetevahelist lahknevust. Väärtust , nimetatakse ka hajutamiseks tegurite järgi, st. uuritavast tegurist tingitud dispersioon.

Termin on üksikute vaatluste ja i-nda taseme keskmise erinevuste ruudus summa. Seda summat nimetatakse rühmasiseste hälvete ruudu summaks ja see iseloomustab lahknevust i-nda taseme vaatluste vahel. Väärtust nimetatakse ka jääkhajutuseks, s.t. hajumine arvesse võtmata tegurite tõttu.

Väärtust nimetatakse kogu- või kogu summaüksikute vaatluste ruudus kõrvalekalded kogukeskmisest.

Teades ruutude SS, SS 1 ja SS 2 summasid, on võimalik hinnata vastavate dispersioonide - summaarsete, rühmadevahelise ja grupisisese - kõrvalekaldeta hinnanguid (tabel 3.2).

Kui teguri γ kõikide tasemete mõju on sama, siis ja on kogu dispersiooni hinnangud.

Seejärel, et hinnata teguri γ mõju olulisust, piisab nullhüpoteesi H 0: = testimisest.

Selleks arvutage Fisheri kriteerium F B = , mille vabadusastmete arv on k 1 = m - 1 ja k 2 = m (n - 1). Seejärel leitakse F-jaotuse tabeli järgi (vt Fisheri kriteeriumi jaotustabelit) olulisuse taseme α jaoks F cr kriitiline väärtus.

Tabel 3.2

Kui F B > F cr, siis nullhüpotees lükatakse tagasi ja tehakse järeldus teguri γ olulise mõju kohta.

F B juures< F кр нет основания отвергать нулевую гипотезу и можно считать, что влияние фактора γ несущественно.



Võrreldes rühmadevahelisi ja jääkvariante, hinnatakse nende suhte suurust, et hinnata, kui tugevalt avaldub tegurite mõju.

Näide 3.1. Tööriiete kangaid on neli partiid. Igast partiist valiti viis proovi ja katkestuskoormuse suuruse määramiseks viidi läbi katsed. Testi tulemused on toodud tabelis. 3.3.

Tabel 3.3

Partii number, t

Tuleb välja selgitada, kas erinevate toorainepartiide mõju purunemiskoormuse suurusele on oluline.

Otsus.

AT sel juhul m = 4, n = 5. Iga rea ​​aritmeetiline keskmine arvutatakse valemiga

Meil on: =(200+140+170+145+165)/5=164; =170; =202; = 164.

Leidke kogu populatsiooni aritmeetiline keskmine:

Arvutame tabeli koostamiseks vajalikud kogused. 3.4:

rühmade SS 1 vaheliste hälvete ruudu summa, kus k 1 =t –1=

4-1=3 vabadusastet:

rühma SS 2 hälvete ruudu summa, kus k 2 = mp - m = =20-4=16 vabadusastet:

ruutude summa SS k=mn-1=20-1=19 vabadusastmega:

Leitud väärtuste põhjal hindame dispersiooni, valemite (tabel 3.2) järgi koostame (tabel 3.4) vaadeldava näite jaoks.

Tabel 3.4

Teeme statistilise analüüsi Fisheri kriteeriumi järgi. Arvutage F B \u003d \u003d (4980 1/3) / (7270 1/16) \u003d 1660 / 454,4 \u003d 3,65.

F-jaotuse tabeli järgi (vt lisasid) leiame F Kp väärtuse k 2 = 16 ja k 1= 3 vabadusastet ja olulisuse tase α = 0,01. Meil on F Kp = 5,29.

F B arvutuslik väärtus on väiksem kui tabeli väärtus, seega võib väita, et nullhüpoteesi ei lükata tagasi, mis tähendab, et partiide kudede erinevus ei mõjuta purunemiskoormust.

Andmeanalüüsi paketis kasutatakse One-Way ANOVA tööriista, et testida hüpoteesi, et kahe või enama samasse populatsiooni kuuluva valimi keskmised on sarnased. Vaatleme ühesuunalise dispersioonanalüüsi paketi tööd.

Lahendame näite 3.1, kasutades One-Way ANOVA tööriista.

Statistika kasutamist selles märkuses näidatakse läbiva näitega. Oletame, et olete Perfect Parachute'i tootmisjuht. Langevarjud on valmistatud sünteetilistest kiududest, mida tarnivad neli erinevat tarnijat. Langevarju üks peamisi omadusi on selle tugevus. Peate veenduma, et kõik tarnitavad kiud on sama tugevusega. Sellele küsimusele vastamiseks on vaja kavandada eksperiment, mille käigus mõõdetakse erinevate tarnijate sünteetilistest kiududest kootud langevarjude tugevust. Selle katse käigus saadud teave määrab, milline tarnija pakub kõige vastupidavamaid langevarju.

Paljud rakendused on seotud katsetega, milles võetakse arvesse ühe teguri mitut rühma või taset. Mõnel teguril, näiteks keraamika põletustemperatuuril, võib olla mitu numbrilist taset (nt 300°, 350°, 400° ja 450°). Muudel teguritel, nagu kaupade asukoht supermarketis, võivad olla kategoorilised tasemed (nt esimene tarnija, teine ​​tarnija, kolmas tarnija, neljas tarnija). Ühemõõtmelisi katseid, milles eksperimentaalsed üksused jagatakse juhuslikult rühmadesse või faktoritasemetesse, nimetatakse täielikult randomiseeritud.

KasutamineF-mitme matemaatilise ootuse erinevuste hindamise kriteeriumid

Kui teguri numbrilised mõõtmised rühmades on pidevad ja mõned lisatingimused on täidetud, siis võrdluseks matemaatilised ootused mitu rühma, dispersioonanalüüs (ANOVA - An analüüs o f Va riance). Dispersioonanalüüsi täielikult randomiseeritud kavandite abil nimetatakse ühesuunaliseks ANOVAks. Mõnes mõttes on dispersioonanalüüsi termin eksitav, kuna see võrdleb erinevusi rühmade keskmiste väärtuste, mitte dispersioonide vahel. Matemaatiliste ootuste võrdlemine toimub aga just andmete varieerumise analüüsi põhjal. ANOVA protseduuris jagatakse mõõtmistulemuste koguvariatsioon rühmadevaheliseks ja grupisiseseks (joonis 1). Grupisisest varieerumist seletatakse eksperimentaalse veaga, rühmadevahelist varieerumist aga katsetingimuste mõjuga. Sümbol koos tähistab rühmade arvu.

Riis. 1. Variatsiooni eraldamine täielikult randomiseeritud katses

Laadige alla märge vormingus või vormingus, näited vormingus

Teeskleme seda koos rühmad on koostatud sõltumatutest populatsioonidest, millel on normaalne jaotus ja sama dispersioon. Nullhüpotees on, et populatsioonide matemaatilised ootused on samad: H 0: μ 1 = μ 2 = ... = μ s. Alternatiivne hüpotees väidab, et kõik matemaatilised ootused ei ole ühesugused: H 1: mitte kõik μ j ei ole ühesugused j= 1, 2, …, s).

Joonisel fig. 2 esitab tõelise nullhüpoteesi viie võrreldava rühma matemaatiliste ootuste kohta, eeldusel, et üldpopulatsioonidel on normaaljaotus ja sama dispersioon. Viis populatsiooni, mis on seotud erinevad tasemed tegurid on identsed. Seetõttu asetatakse need üksteise peale, neil on samad matemaatilised ootused, varieeruvus ja vorm.

Riis. 2. Viiel populatsioonil on samad matemaatilised ootused: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

Teisest küljest oletagem, et tegelikult on nullhüpotees vale ja neljandal tasemel on suurim matemaatiline ootus, esimesel tasemel on matemaatiline ootus veidi madalam ja ülejäänud tasemetel on samad ja veelgi väiksemad matemaatilised ootused (joonis 1). 3). Pange tähele, et kõik viis populatsiooni, välja arvatud keskmise suurus, on identsed (st neil on sama varieeruvus ja kuju).

Riis. 3. Täheldatakse katsetingimuste mõju: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

Mitme üldpopulatsiooni matemaatiliste ootuste võrdsuse hüpoteesi testimisel jagatakse koguvariatsioon kahte ossa: rühmadevaheline variatsioon, mis tuleneb rühmadevahelistest erinevustest, ja grupisisene variatsioon, mis on tingitud samasse rühma kuuluvate elementide erinevustest. Koguvariatsiooni väljendatakse ruutude kogusummana (SST – summa of squares total). Kuna nullhüpotees on, et kõigi ootus koos rühmad on üksteisega võrdsed, on koguvariatsioon võrdne üksikute vaatluste vaheliste erinevuste ruudu ja kõigi valimite arvutatud kogukeskmise (keskmiste keskmise) summaga. Täielik variatsioon:

kus - üldine keskmine, Xij - i- vaata sisse j- rühm või tase, nj- vaatluste arv j- rühm, n - kokku vaatlused kõigis rühmades (st. n = n 1 + n 2 + … + nc), koos- uuritavate rühmade või tasemete arv.

Gruppidevaheline variatsioon, mida tavaliselt nimetatakse rühmadevaheliseks ruutude summaks (SSA), võrdub iga rühma valimi keskmiste ruutude erinevuste summaga j ja üldine keskmine korrutatuna vastava rühma mahuga nj:

kus koos- uuritud rühmade või tasemete arv, nj- vaatluste arv j- rühm, j- tähendab j- rühm, - üldine keskmine.

Grupisisene variatsioon, mida tavaliselt nimetatakse rühmade ruutude summaks (SSW), on võrdne iga rühma elementide ja selle rühma valimi keskmise ruudu erinevuste summaga. j:

kus Xij - i-th element j- rühm, j- tähendab j- rühm.

Sest neid võrreldakse koos teguritasemed, on rühmadevahelisel ruutude summal s - 1 vabadusastmed. Igaüks neist koos tasemel on nj – 1 vabadusastmeid, seega on rühmasisesel ruutude summal n- koos vabadusastmed ja

Lisaks on ruutude kogusumma n – 1 vabadusastmed, alates igast vaatlusest Xij võrreldes kõigi kohta arvutatud üldise keskmisega n tähelepanekud. Kui kõik need summad jagada vastava arvu vabadusastmetega, tekib kolme tüüpi dispersioon: rühmadevaheline(keskmine ruut – MSA), grupisisene(keskmine ruut piires – MSW) ja täielik(keskmine ruut kogusumma – MST):

Vaatamata sellele, et dispersioonanalüüsi põhieesmärk on võrrelda matemaatilisi ootusi koos rühmad, et paljastada katsetingimuste mõju, on selle nimi tingitud asjaolust, et peamine tööriist on dispersioonide analüüs erinevat tüüpi. Kui nullhüpotees on tõene, ja oodatavate väärtuste vahel koos rühmades olulisi erinevusi pole, kõik kolm dispersiooni - MSA, MSW ja MST - on dispersiooni hinnangud σ2 analüüsitud andmetele omane. Nii et nullhüpoteesi testimiseks H 0: μ 1 = μ 2 = ... = μ s ja alternatiivne hüpotees H 1: mitte kõik μ j ei ole ühesugused j = 1, 2, …, koos), on vaja statistika arvutada F-kriteerium, mis on kahe dispersiooni, MSA ja MSW suhe. katsetada F-statistika ühemõõtmelises dispersioonanalüüsis

Statistika F- kriteeriumid järgivad F- levitamine koos s - 1 lugeja vabadusastmed MSA ja n - koos nimetaja vabadusastmed MSW. Antud olulisuse taseme α korral lükatakse nullhüpotees tagasi, kui arvutatakse F FU omane F- levitamine koos s - 1 n - koos nimetaja vabadusastmed. Seega, nagu on näidatud joonisel fig. 4, otsuse reegel sõnastatakse järgmiselt: nullhüpotees H 0 lükatakse tagasi, kui F > FU; vastasel juhul seda tagasi ei lükata.

Riis. 4. Dispersioonanalüüsi kriitiline valdkond hüpoteesi kontrollimisel H 0

Kui nullhüpotees H 0 on tõsi, arvutatud F-statistika on 1-le lähedane, kuna selle lugeja ja nimetaja on sama väärtuse hinnangud - analüüsitud andmetele omane dispersioon σ 2. Kui nullhüpotees H 0 on vale (ja erinevate rühmade ootusväärtuste vahel on oluline erinevus), arvutatud F-statistika on palju suurem kui üks, kuna selle lugeja MSA hindab lisaks andmete loomulikule varieeruvusele katsetingimuste mõju või rühmadevahelist erinevust, samas kui nimetaja MSW hindab ainult andmete loomulikku varieeruvust. Seega on ANOVA protseduur F on test, kus antud olulisuse tasemel α lükatakse nullhüpotees tagasi, kui arvutatud F- statistika on ülemisest kriitilisest väärtusest suurem FU omane F- levitamine koos s - 1 vabadusastmed lugejas ja n - koos nimetaja vabadusastmed, nagu on näidatud joonisel fig. 4.

Ühesuunalise dispersioonanalüüsi illustreerimiseks pöördume tagasi märkuse alguses kirjeldatud stsenaariumi juurde. Katse eesmärk on välja selgitada, kas erinevatelt tarnijatelt hangitud sünteetilistest kiududest kootud langevarjud on ühesuguse tugevusega. Igal rühmal on kootud viis langevarju. Rühmad on jaotatud tarnija järgi - tarnija 1, tarnija 2, tarnija 3 ja tarnija 4. Langevarjude tugevust mõõdetakse spetsiaalse seadmega, mis testib kangast mõlemalt poolt rebenemist. Langevarju murdmiseks vajalikku jõudu mõõdetakse spetsiaalsel skaalal. Mida suurem on murdejõud, seda tugevam on langevari. Excel võimaldab analüüsida F- Statistika ühe klõpsuga. Minge menüüst läbi AndmedAndmete analüüs ja valige rida Ühesuunaline dispersioonanalüüs, täitke avanenud aken (joon. 5). Katse tulemused (lõhe tugevus), mõningane kirjeldav statistika ja ühesuunalise dispersioonanalüüsi tulemused on näidatud joonistel fig. 6.

Riis. 5. Aken Ühesuunaline ANOVA analüüsipakett excel

Riis. Joonis 6. Erinevatelt tarnijatelt saadud sünteetilistest kiududest kootud langevarjude tugevusnäitajad, kirjeldav statistika ja ühesuunalise dispersioonanalüüsi tulemused

Joonise 6 analüüs näitab, et proovi keskmiste vahel on teatav erinevus. Esimeselt tarnijalt saadud kiudude keskmine tugevus on 19,52, teiselt - 24,26, kolmandalt - 22,84 ja neljandalt - 21,16. Kas see erinevus on statistiliselt oluline? Purustusjõu jaotus on näidatud hajusdiagrammil (joonis 7). See näitab selgelt erinevusi nii rühmade vahel kui ka nende sees. Kui iga rühma maht oleks suurem, saaks neid analüüsida varre- ja lehediagrammi, kastdiagrammi või normaaljaotuse graafiku abil.

Riis. 7. Neljalt tarnijalt saadud sünteetilistest kiududest kootud langevarjude tugevuse leviku diagramm

Nullhüpotees väidab, et keskmiste tugevusväärtuste vahel ei ole olulisi erinevusi: H 0: μ 1 = μ 2 = μ 3 = μ 4. Alternatiivne hüpotees on, et on vähemalt üks tarnija, kelle keskmine kiu tugevus erineb teistest: H 1: mitte kõik μ j ei ole ühesugused ( j = 1, 2, …, koos).

Üldkeskmine (vt joonis 6) = KESKMINE(D12:D15) = 21,945; määramiseks saate ka kõigi 20 algse numbri keskmise arvutada: \u003d AVERAGE (A3: D7). Arvutatakse dispersiooni väärtused Analüüsi pakett ja need kajastuvad tabelis Dispersioonanalüüs(vt joonis 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (vt veergu SS tabelid Dispersioonanalüüs joonis 6). Keskmised arvutatakse, jagades need ruutude summad sobiva arvu vabadusastmetega. Niivõrd kui koos= 4 ja n= 20, saame järgmised väärtused vabadusastmed; SSA jaoks: s - 1= 3; SSW jaoks: n–c= 16; SST jaoks: n - 1= 19 (vt veergu df). Seega: MSA = SSA / ( c - 1)= 21,095; MSW=SSW/( n–c) = 6,094; MST = SST / ( n - 1) = 8,463 (vt veergu PRL). F-statistika = MSA / MSW = 3,462 (vt veergu F).

Ülemine kriitiline väärtus FU, iseloomulik F-jaotus, määratakse valemiga = F. OBR (0,95; 3; 16) = 3,239. Funktsiooni parameetrid =F.OBR(): α = 0,05, lugejal on kolm vabadusastet ja nimetaja on 16. Seega arvutatakse F-statistika, mis on võrdne 3,462-ga, ületab ülemise kriitilise väärtuse FU= 3,239, nullhüpotees lükatakse tagasi (joonis 8).

Riis. 8. Dispersioonanalüüsi kriitiline piirkond olulisuse tasemel 0,05, kui lugejal on kolm vabadusastet ja nimetaja on -16

R-väärtus, st. tõenäosus, et tõelise nullhüpoteesi korral F- statistika vähemalt 3,46, mis võrdub 0,041 või 4,1% (vt veergu p-väärtus tabelid Dispersioonanalüüs joonis 6). Kuna see väärtus ei ületa olulisuse taset α = 5%, lükatakse nullhüpotees tagasi. Lisaks R-väärtus näitab, et tõenäosus leida selline või suur erinevus üldkogumite matemaatiliste ootuste vahel, eeldusel, et need on tegelikult samad, on 4,1%.

Niisiis. Nelja näidis keskmise vahel on erinevus. Nullhüpotees oli, et kõik nelja populatsiooni matemaatilised ootused on võrdsed. Nendes tingimustes arvutatakse kõigi langevarjude tugevuse koguvarieeruvuse (st SST-i koguvariatsiooni) mõõt, liites iga vaatluse ruudu erinevused. Xij ja üldine keskmine . Seejärel jagati kogu variatsioon kaheks komponendiks (vt joonis 1). Esimene komponent oli SSA rühmadevaheline variatsioon ja teine ​​​​komponent oli SSW rühmasisene variatsioon.

Mis seletab andmete varieeruvust? Teisisõnu, miks ei ole kõik vaatlused ühesugused? Üks põhjus on see, et erinevad ettevõtted tarnivad erineva tugevusega kiude. See seletab osaliselt, miks rühmade ootusväärtused on erinevad: mida tugevam on katsetingimuste mõju, seda suurem on erinevus rühmade keskmiste väärtuste vahel. Andmete muutlikkuse teine ​​põhjus on mistahes protsessi, antud juhul langevarjude tootmise loomulik varieeruvus. Isegi kui kõik kiud ostetaks samalt tarnijalt, ei oleks nende tugevus muudel tingimustel sama. võrdsed tingimused. Kuna see efekt ilmneb igas rühmas, nimetatakse seda rühmasiseseks variatsiooniks.

Valimi keskmiste erinevusi nimetatakse SSA rühmadevaheliseks variatsiooniks. Osa rühmasisesest variatsioonist, nagu juba mainitud, on seletatav asjaoluga, et andmed kuuluvad erinevatesse rühmadesse. Kuid isegi kui rühmad oleksid täpselt samad (st nullhüpotees oleks tõsi), oleks siiski rühmadevaheline variatsioon. Selle põhjuseks on langevarju tootmisprotsessi loomulik varieeruvus. Kuna proovid on erinevad, erinevad ka nende valimi keskmised üksteisest. Seega, kui nullhüpotees on tõene, on nii rühmadevaheline kui ka grupisisene varieeruvus kujutavad endast hinnangut populatsiooni varieeruvusele. Kui nullhüpotees on vale, on rühmadevaheline hüpotees suurem. See on asjaolu, mis on aluseks F-kriteeriumid mitme rühma matemaatiliste ootuste erinevuste võrdlemiseks.

Pärast ühesuunalise ANOVA läbiviimist ja oluliste erinevuste leidmist ettevõtete vahel jääb teadmata, milline tarnija on teistest oluliselt erinev. Teame vaid seda, et populatsioonide matemaatilised ootused ei ole võrdsed. Ehk siis vähemalt üks matemaatiline ootus erineb teistest oluliselt. Et teha kindlaks, milline pakkuja teistest erineb, võite kasutada Tukey protseduur, mis kasutab pakkujate paaripõhist võrdlust. Selle protseduuri töötas välja John Tukey. Seejärel muutsid ta ja C. Cramer seda protseduuri iseseisvalt olukordade jaoks, kus valimi suurused erinevad üksteisest.

Mitmekordne võrdlus: Tukey-Krameri protseduur

Meie stsenaariumi kohaselt kasutati langevarjude tugevuse võrdlemiseks ühesuunalist dispersioonanalüüsi. Avastamine olulisi erinevusi nelja rühma matemaatiliste ootuste vahel on vaja kindlaks teha, millised rühmad üksteisest erinevad. Kuigi selle probleemi lahendamiseks on mitu võimalust, kirjeldame ainult Tukey-Krameri mitmekordse võrdluse protseduuri. See meetod on näide post hoc võrdlusprotseduuridest, kuna testitav hüpotees sõnastatakse pärast andmete analüüsi. Tukey-Krameri protseduur võimaldab teil samaaegselt võrrelda kõiki rühmapaare. Esimeses etapis arvutatakse erinevused Xj – Xj, kus j ≠j, matemaatiliste ootuste vahel s(s – 1)/2 rühmad. Kriitiline ulatus Tukey-Krameri protseduur arvutatakse järgmise valemiga:

kus K U- üliõpilaste vahemiku jaotuse ülemine kriitiline väärtus, millel on koos vabadusastmed lugejas ja n - koos nimetaja vabadusastmed.

Kui valimi suurused ei ole samad, arvutatakse kriitiline vahemik iga matemaatiliste ootuste paari jaoks eraldi. Viimases etapis igaüks s(s – 1)/2 matemaatiliste ootuste paari võrreldakse vastava kriitilise vahemikuga. Paari elemente loetakse oluliselt erinevateks, kui erinevuse moodul | Xj – Xj| nende vahel ületab kriitilise piiri.

Rakendame Tukey-Crameri protseduuri langevarjude tugevuse probleemile. Kuna langevarjufirmal on neli tarnijat, tuleks testida 4(4 – 1)/2 = 6 tarnijapaari (joonis 9).

Riis. 9. Valimi keskmiste paaripõhised võrdlused

Kuna kõigil rühmadel on sama maht (st kõik nj = nj), piisab ainult ühe kriitilise vahemiku arvutamisest. Selleks vastavalt tabelile ANOVA(joonis 6) määrame MSW väärtuse = 6,094. Siis leiame väärtuse K Uα = 0,05 juures, koos= 4 (vabadusastmete arv lugejas) ja n- koos= 20 – 4 = 16 (vabadusastmete arv nimetajas). Kahjuks ei leidnud ma Excelis vastavat funktsiooni, mistõttu kasutasin tabelit (joon. 10).

Riis. 10. Üliõpilaste vahemiku kriitiline väärtus K U

Saame:

Kuna ainult 4,74 > 4,47 (vt alumist tabelit joonisel 9), on esimese ja teise tarnija vahel statistiliselt oluline erinevus. Kõigil teistel paaridel on näidisvahendid, mis ei võimalda nende erinevusest rääkida. Järelikult on esimeselt tarnijalt ostetud kiududest kootud langevarjude keskmine tugevus oluliselt väiksem kui teiselt tarnijalt.

Vajalikud tingimused ühesuunaliseks dispersioonanalüüsiks

Langevarjude tugevuse probleemi lahendamisel me ei kontrollinud, kas on täidetud tingimused ühefaktori kasutamiseks F- kriteerium. Kuidas teada saada, kas saate rakendada ühe teguriga F-kriteerium konkreetsete katseandmete analüüsimisel? Üks tegur F-testi saab rakendada ainult siis, kui on täidetud kolm põhieeldust: katseandmed peavad olema juhuslikud ja sõltumatud, normaaljaotusega ning nende dispersioonid peavad olema ühesugused.

Esimene oletus on juhuslikkus ja andmete sõltumatus- tuleks alati teha, kuna iga katse õigsus sõltub valiku juhuslikkusest ja/või randomiseerimisprotsessist. Tulemuste moonutamise vältimiseks on vajalik andmete väljavõte koos populatsioonid juhuslikult ja üksteisest sõltumatult. Samamoodi tuleks andmed juhuslikult jaotada koos meid huvitava teguri tasemed (katserühmad). Nende tingimuste rikkumine võib dispersioonanalüüsi tulemusi tõsiselt moonutada.

Teine oletus on normaalsus- tähendab, et andmed on saadud normaalselt jaotunud populatsioonidest. Nagu t-kriteerium, ühesuunaline dispersioonanalüüs põhineb F-kriteerium on selle tingimuse rikkumise suhtes suhteliselt vähetundlik. Kui jaotus ei ole normaalsest liiga kaugel, siis olulisuse tase F-kriteerium muutub vähe, eriti kui valimi suurus on piisavalt suur. Kui normaaljaotuse tingimust tõsiselt rikutakse, tuleks seda rakendada.

Kolmas oletus on dispersiooni ühtsus- tähendab, et iga üldkogumi dispersioonid on üksteisega võrdsed (st σ 1 2 = σ 2 2 = … = σ j 2). See eeldus võimaldab otsustada, kas eraldada või liita rühmasisesed dispersioonid. Kui rühmade mahud on samad, on dispersiooni homogeensuse tingimusel vähe mõju järeldustele, mis saadakse F- kriteeriumid. Kui aga valimite suurused ei ole samad, võib dispersioonvõrdsuse tingimuse rikkumine dispersioonanalüüsi tulemusi tõsiselt moonutada. Seega tuleks püüda tagada, et valimi suurused oleksid samad. Üks dispersiooni homogeensuse eelduse kontrollimise meetodeid on kriteerium Levenay allpool kirjeldatud.

Kui kõigist kolmest tingimusest rikutakse ainult dispersioonitingimuste ühtlust, toimib analoogne protseduur t-kriteerium, kasutades eraldi dispersiooni (vt üksikasju). Kui aga samaaegselt rikutakse normaaljaotuse ja dispersiooni homogeensuse eeldusi, on vaja andmeid normaliseerida ja dispersioonidevahelisi erinevusi vähendada või rakendada mitteparameetrilist protseduuri.

Leveney kriteerium dispersiooni homogeensuse kontrollimiseks

Vaatamata asjaolule, et F- kriteerium on suhteliselt vastupidav rühmade dispersioonide võrdsuse tingimuse rikkumistele, selle eelduse jäme rikkumine mõjutab oluliselt kriteeriumi olulisuse ja võimsuse taset. Võib-olla üks võimsamaid on kriteerium Levenay. Dispersioonide võrdsuse kontrollimiseks koosüldpopulatsioonide jaoks, testime järgmisi hüpoteese:

H 0: σ 1 2 = σ 2 2 = ... = σj 2

H 1: Mitte kõik σ j 2 on samad ( j = 1, 2, …, koos)

Muudetud Leveney test põhineb väitel, et kui rühmade varieeruvus on sama, saab dispersioonanalüüsi kasutada dispersioonide võrdsuse nullhüpoteesi testimiseks. absoluutväärtused erinevused vaatluste ja grupi mediaanide vahel. Niisiis tuleks kõigepealt arvutada iga rühma vaatluste ja mediaanide vaheliste erinevuste absoluutväärtused ning seejärel teostada saadud erinevuste absoluutväärtuste ühesuunaline dispersioonanalüüs. Levenay kriteeriumi illustreerimiseks pöördume tagasi märkuse alguses kirjeldatud stsenaariumi juurde. Kasutades joonisel fig. 6, viime läbi sarnase analüüsi, kuid iga proovi algandmete ja mediaanide erinevuste moodulite osas eraldi (joonis 11).

Dispersioonanalüüs on hulk statistilised meetodid, mis on mõeldud hüpoteeside kontrollimiseks teatud tunnuste ja uuritavate tegurite vahelise seose kohta, millel puudub kvantitatiivne kirjeldus, samuti tegurite mõju määra ja nende vastastikmõju kindlaksmääramiseks. Erikirjanduses nimetatakse seda sageli ANOVA-ks (ingliskeelsest nimetusest Analysis of Variations). Selle meetodi töötas esmakordselt välja R. Fischer 1925. aastal.

Dispersioonanalüüsi tüübid ja kriteeriumid

Seda meetodit kasutatakse kvalitatiivsete (nominaalsete) tunnuste ja kvantitatiivse (pideva) muutuja vahelise seose uurimiseks. Tegelikult kontrollib see hüpoteesi mitme valimi aritmeetiliste keskmiste võrdsuse kohta. Seega võib seda pidada parameetriliseks kriteeriumiks mitme valimi keskpunktide korraga võrdlemisel. Kui kasutate seda meetodit kahe valimi puhul, on dispersioonanalüüsi tulemused identsed Studenti t-testi tulemustega. Kuid erinevalt teistest kriteeriumidest võimaldab see uuring probleemi üksikasjalikumalt uurida.

Statistika dispersioonanalüüs põhineb seadusel: koondvalimi ruutude hälvete summa võrdub rühmasiseste hälvete ruutude summaga ja rühmadevaheliste hälvete ruutude summaga. Uuringus kasutatakse Fisheri testi, et teha kindlaks erinevus rühmadevaheliste ja rühmadesiseste dispersioonide vahel. Selleks on aga vajalikeks eeldusteks jaotuse normaalsus ja valimite homoskedastilisus (dispersioonide võrdsus). Eristada ühemõõtmelist (ühefaktorilist) dispersioonanalüüsi ja mitmemõõtmelist (mitmefaktorilist). Esimene arvestab uuritava väärtuse sõltuvust ühest atribuudist, teine ​​- paljudest korraga ja võimaldab teil tuvastada ka nendevahelise seose.

tegurid

Tegureid nimetatakse kontrollitud asjaoludeks, mis mõjutavad lõpptulemust. Selle taset või töötlemismeetodit nimetatakse väärtuseks, mis iseloomustab selle seisundi konkreetset ilmingut. Need arvud on tavaliselt esitatud nominaalses või järgulises mõõteskaalas. Sageli mõõdetakse väljundväärtusi kvantitatiivsel või järguskaalal. Siis tekib probleem väljundandmete rühmitamisel vaatluste seeriasse, mis vastavad ligikaudu samale arvväärtusi. Kui rühmade arv on liiga suur, võib nende vaatluste arv olla usaldusväärsete tulemuste saamiseks ebapiisav. Kui see arv on liiga väike, võib see kaasa tuua süsteemi oluliste mõjurite kadumise. Konkreetne andmete rühmitamise meetod sõltub väärtuste kõikumise mahust ja olemusest. Intervallide arv ja suurus määratakse ühemõõtmelises analüüsis kõige sagedamini võrdsete intervallide või võrdsete sageduste põhimõttega.

Dispersioonanalüüsi ülesanded

Seega on juhtumeid, kui peate võrdlema kahte või enamat näidist. Just siis on soovitatav kasutada dispersioonanalüüsi. Meetodi nimetus näitab, et järeldused tehakse dispersiooni komponentide uurimise põhjal. Uuringu olemus seisneb selles, et indikaatori üldine muutus jagatakse komponentideks, mis vastavad iga üksiku teguri toimele. Mõelge mitmele probleemile, mida tüüpiline dispersioonanalüüs lahendab.

Näide 1

Töökojas on hulk tööpinke – automaate, mis toodavad kindlat detaili. Iga detaili suurus on juhuslik väärtus, mis sõltub iga masina seadistustest ja osade tootmisprotsessi käigus tekkivatest juhuslikest kõrvalekalletest. Osade mõõtmete mõõtmiste järgi on vaja kindlaks teha, kas masinad on samamoodi seadistatud.

Näide 2

Elektriaparaadi valmistamisel kasutatakse erinevat tüüpi isoleerpaberit: kondensaator-, elektri- jne. Seadet saab immutada erinevaid aineid: epoksüvaik, lakk, ML-2 vaik jne. Lekkeid saab kõrvaldada vaakumis kõrgendatud rõhul kuumutamisel. Seda saab immutada lakki kastmise teel, pideva lakijoa all jne. Elektriaparaat tervikuna valatakse teatud seguga, mille valikuid on mitu. Kvaliteedinäitajad on isolatsiooni dielektriline tugevus, mähise ülekuumenemise temperatuur töörežiimis ja mitmed teised. Treenimise ajal tehnoloogiline protsess seadmete tootmisel on vaja kindlaks teha, kuidas iga loetletud tegur mõjutab seadme jõudlust.

Näide 3

Trollibussidepoo teenindab mitut trolliliini. Nad juhivad erinevat tüüpi trollibusse ja piletihindu kogub 125 inspektorit. Depoo juhtkonda huvitab küsimus: kuidas võrrelda iga kontrolöri majandustulemust (tulu), arvestades erinevaid marsruute, erinevat tüüpi trollibusse? Kuidas teha kindlaks teatud tüüpi trollibusside konkreetsel liinil käivitamise majanduslik otstarbekus? Kuidas kehtestada mõistlikud nõuded tulu suurusele, mida konduktor eri tüüpi trollibussides igal liinil toob?

Meetodi valimise ülesanne on saada maksimaalset teavet iga teguri mõju kohta lõpptulemusele, määrata sellise mõju arvulised omadused, nende usaldusväärsus minimaalsete kuludega ja maksimaalselt. lühikest aega. Dispersioonanalüüsi meetodid võimaldavad selliseid probleeme lahendada.

Ühemõõtmeline analüüs

Uuringu eesmärk on hinnata konkreetse juhtumi mõju suurust analüüsitavale ülevaatele. Veel üks väljakutse ühemõõtmeline analüüs võib toimuda kahe või enama asjaolu võrdlemine, et teha kindlaks nende mõju tagasikutsumisele. Kui nullhüpotees lükatakse tagasi, on järgmine samm kvantifitseerimine ja koostamine usaldusvahemikud saadud omaduste jaoks. Juhul, kui nullhüpoteesi ei saa ümber lükata, võetakse see tavaliselt vastu ja tehakse järeldus mõju olemuse kohta.

Ühesuunaline dispersioonanalüüs võib saada Kruskal-Wallise auaste meetodi mitteparameetriliseks analoogiks. Selle töötasid välja Ameerika matemaatik William Kruskal ja majandusteadlane Wilson Wallis 1952. aastal. Selle testi eesmärk on kontrollida nullhüpoteesi, et mõju mõju uuritavatele valimitele on võrdne tundmatute, kuid võrdsete keskmiste väärtustega. Sel juhul peab proovide arv olema suurem kui kaks.

Jonkhieri (Jonkhier-Terpstra) kriteeriumi pakkusid iseseisvalt välja Hollandi matemaatik T. J. Terpstrom 1952. aastal ja Briti psühholoog E. R. Jonkhier 1954. aastal. Seda kasutatakse juhul, kui on ette teada, et saadaolevad tulemuste rühmad on järjestatud tulemuste suurenemise järgi. uuritava teguri mõju, mida mõõdetakse ordinaalskaalal.

M – Briti statistiku Maurice Stevenson Bartletti poolt 1937. aastal välja pakutud Bartletti kriteeriumi kasutatakse nullhüpoteesi testimiseks mitme normaalse populatsiooni dispersioonide võrdsuse kohta, millest uuritavad proovid on võetud. üldine juhtum erineva mahuga (iga proovi arv peab olema vähemalt neli).

G on Cochrani test, mille avastas ameeriklane William Gemmel Cochran 1941. aastal. Seda kasutatakse nullhüpoteesi testimiseks normaalsete populatsioonide dispersioonide võrdsuse kohta võrdse suurusega sõltumatute valimite puhul.

Mitteparameetriline Levene test, mille pakkus välja Ameerika matemaatik Howard Levene 1960. aastal, on alternatiiv Bartletti testile tingimustes, kus pole kindlust, et uuritavad proovid järgivad normaaljaotust.

1974. aastal pakkusid Ameerika statistikud Morton B. Brown ja Alan B. Forsyth välja testi (Brown-Forsythi test), mis on Levene testist mõnevõrra erinev.

Kahesuunaline analüüs

Kahesuunalist dispersioonanalüüsi kasutatakse lingitud normaaljaotusega valimite puhul. Praktikas kasutatakse seda sageli keerulised tabelid see meetod, eriti need, mille puhul iga lahter sisaldab andmekogumit (korduvad mõõtmised), mis vastavad fikseeritud taseme väärtustele. Kui kahesuunalise dispersioonanalüüsi rakendamiseks vajalikud eeldused ei ole täidetud, siis kasutatakse mitteparameetrilist Friedmani astmetesti (Friedman, Kendall ja Smith), mille töötas välja Ameerika majandusteadlane Milton Friedman 1930. aasta lõpus. ei sõltu levitamise tüübist.

Eeldatakse vaid, et suuruste jaotus on ühesugune ja pidev ning need ise on üksteisest sõltumatud. Nullhüpoteesi testimisel antakse väljund kujul ristkülikukujuline maatriks, milles read vastavad teguri B tasemetele ja veerud tasemetele A. Iga tabeli (ploki) lahter võib olla ühe objekti või konstantse objektide rühma parameetrite mõõtmise tulemus. mõlema teguri taseme väärtused. Sel juhul esitatakse vastavad andmed teatud parameetri keskmiste väärtustena kõigi uuritava proovi mõõtmiste või objektide kohta. Väljundkriteeriumi rakendamiseks on vaja liikuda otseste mõõtmistulemuste juurest nende järjestusele. Järjestus viiakse läbi iga rea ​​jaoks eraldi, see tähendab, et väärtused tellitakse iga fikseeritud väärtuse jaoks.

Ameerika statistiku E. B. Page'i poolt 1963. aastal välja pakutud Page test (L-test) on loodud nullhüpoteesi kontrollimiseks. Suurte valimite puhul kasutatakse lehekülje lähendust. Nad järgivad standardset normaaljaotust, olenevalt vastavate nullhüpoteeside tegelikkusest. Juhul, kui lähtetabeli ridadel on samad väärtused, on vaja kasutada keskmisi auastmeid. Sel juhul on järelduste täpsus seda halvem, mida suurem on selliste kokkusattumuste arv.

Q – Cochrani kriteerium, mille pakkus välja V. Cochran 1937. aastal. Seda kasutatakse juhtudel, kui homogeensete subjektide rühmad puutuvad kokku rohkem kui kahe mõjuga ja mille puhul on võimalik ülevaatamiseks kaks võimalust - tinglikult negatiivne (0) ja tingimuslikult positiivne (1). ) . Nullhüpotees koosneb mõjuefektide võrdsusest. Kahesuunaline dispersioonanalüüs võimaldab määrata töötlemisefektide olemasolu, kuid ei võimalda kindlaks teha, milliste veergude puhul see efekt eksisteerib. Selle probleemi lahendamiseks meetod mitu võrrandit Scheffe lingitud näidiste jaoks.

Mitmemõõtmeline analüüs

Mitmemõõtmelise dispersioonanalüüsi probleem tekib siis, kui on vaja kindlaks teha kahe või enama tingimuse mõju teatud juhuslikule suurusele. Uuring näeb ette ühe ülalpeetava olemasolu juhuslik muutuja, mõõdetuna erinevuse või suhte skaalal ja mitu sõltumatud kogused, millest igaüks on väljendatud nimede skaalal või astmeskaalal. Andmete dispersioonanalüüs on üsna arenenud osa matemaatiline statistika millel on palju valikuvõimalusi. Uuringu kontseptsioon on ühine nii ühe- kui ka mitmemõõtmeliste uuringute puhul. Selle olemus seisneb selles kogu dispersioon jagatud komponentideks, mis vastab teatud andmete grupeeringule. Igal andmerühmal on oma mudel. Siin käsitleme ainult peamisi sätteid, mis on vajalikud mõistmiseks ja praktiline kasutamine enim kasutatud valikud.

Dispersioonfaktoranalüüs nõuab hoolikat tähelepanu sisendandmete kogumisele ja esitamisele ning eriti tulemuste tõlgendamisele. Vastupidiselt ühefaktorilisele, mille tulemusi saab tinglikult paigutada teatud järjestusse, nõuavad kahefaktori tulemused keerukamat esitust. Rohkem olukord on keerulisem tekib siis, kui on kolm, neli või enam asjaolu. Seetõttu sisaldab mudel harva rohkem kui kolm (neli) tingimust. Näiteks võib tuua resonantsi esinemise elektriringi teatud mahtuvuse ja induktiivsuse väärtusel; keemilise reaktsiooni ilmnemine teatud elementide komplektiga, millest süsteem on ehitatud; anomaalsete mõjude ilmnemine keerulistes süsteemides teatud asjaolude kokkulangemisel. Interaktsiooni olemasolu võib radikaalselt muuta süsteemi mudelit ja mõnikord viia eksperimenteerijaga seotud nähtuste olemuse ümbermõtestamiseni.

Mitmemõõtmeline dispersioonanalüüs korduvate katsetega

Mõõtmisandmeid saab sageli grupeerida mitte kahe, vaid rohkema teguri järgi. Seega, kui võtta arvesse trollirataste rehvide kasutusea dispersioonanalüüsi, võttes arvesse asjaolusid (tootja ja rehvide kasutamise marsruut), siis võib eraldi tingimusena välja tuua hooaja, mil rehve on kasutatud (nimelt: talve- ja suvesõit). Selle tulemusena tekib meil kolmefaktorilise meetodi probleem.

Rohkemate tingimuste olemasolul on lähenemine sama, mis kahesuunalise analüüsi puhul. Kõigil juhtudel püüab mudel lihtsustada. Kahe teguri koosmõju nähtus ei ilmne nii sageli ja kolmekordne koostoime esineb ainult erandjuhtudel. Kaasake need interaktsioonid, mille kohta on olemas varasem teave ja head põhjused, miks seda mudelis arvesse võtta. Üksikute tegurite eraldamise ja nendega arvestamise protsess on suhteliselt lihtne. Seetõttu on sageli soov tuua esile rohkem asjaolusid. Te ei tohiks sellest vaimustuda. Mida rohkem tingimusi, seda vähem usaldusväärne mudel muutub ja seda suurem on vea võimalus. Mudel ise, mis sisaldab suur hulk sõltumatud muutujad muutuvad üsna raskesti tõlgendatavaks ja praktilise kasutamise jaoks ebamugavaks.

Üldine dispersioonanalüüsi idee

Statistika dispersioonanalüüs on meetod erinevatest samaaegsetest asjaoludest sõltuvate vaatlustulemuste saamiseks ja nende mõju hindamiseks. Kontrollitav muutuja, mis vastab uurimisobjekti mõjutamise meetodile ja omandab teatud aja jooksul teatud väärtus, nimetatakse teguriks. Need võivad olla kvalitatiivsed ja kvantitatiivsed. Kvantitatiivsete tingimuste tasemed omandavad arvulisel skaalal teatud väärtuse. Näiteks temperatuur, pressimisrõhk, aine kogus. Kvaliteeditegurid on erinevaid aineid, erinevad tehnoloogilised meetodid, seadmed, täiteained. Nende tasemed vastavad nimede skaalale.

Kvaliteet hõlmab ka pakkematerjali tüüpi, säilitustingimusi annustamisvorm. Samuti on mõistlik lisada tooraine jahvatusaste, graanulite fraktsionaalne koostis kvantitatiivne väärtus, kuid kvantitatiivse skaala kasutamisel on seda raske kontrollida. Kvaliteeditegurite arv sõltub ravimvormi tüübist, samuti ravimainete füüsikalistest ja tehnoloogilistest omadustest. Näiteks saab tablette saada kristallilistest ainetest otsese pressimise teel. Sel juhul piisab libisemis- ja määrdeainete valiku tegemisest.

Erinevat tüüpi ravimvormide kvaliteeditegurite näited

  • Tinktuurid. Ekstraktandi koostis, ekstraktori tüüp, tooraine valmistamise meetod, tootmismeetod, filtreerimismeetod.
  • Ekstraktid (vedelad, paksud, kuivad). Ekstraheerija koostis, ekstraheerimismeetod, paigalduse tüüp, ekstraheerimis- ja ballastainete eemaldamise meetod.
  • Tabletid. Abiainete, täiteainete, lagundavate ainete, sideainete, määrdeainete ja määrdeainete koostis. Tablettide saamise meetod, tehnoloogilise varustuse tüüp. Kesta tüüp ja selle komponendid, kilemoodustajad, pigmendid, värvained, plastifikaatorid, lahustid.
  • süstelahused. Lahusti tüüp, filtreerimismeetod, stabilisaatorite ja säilitusainete olemus, steriliseerimistingimused, ampullide täitmise viis.
  • Suposiidid. Suposiitide aluse koostis, suposiitide, täiteainete, pakendamise saamise meetod.
  • Salvid. põhikoostis, struktuursed komponendid, salvi valmistamise meetod, seadmete tüüp, pakend.
  • Kapslid. Kesta materjali tüüp, kapslite saamise meetod, plastifikaatori tüüp, säilitusaine, värvaine.
  • Liniments. Tootmismeetod, koostis, seadmete tüüp, emulgaatori tüüp.
  • Suspensioonid. Lahusti tüüp, stabilisaatori tüüp, dispersioonimeetod.

Näiteid tahvelarvuti tootmisprotsessis uuritud kvaliteediteguritest ja nende tasemetest

  • Küpsetuspulber. Kartulitärklis, valge savi, naatriumvesinikkarbonaadi ja sidrunhappe segu, aluseline magneesiumkarbonaat.
  • sidumislahus. Vesi, tärklisepasta, suhkrusiirup, metüültselluloosi lahus, hüdroksüpropüülmetüültselluloosi lahus, polüvinüülpürrolidooni lahus, polüvinüülalkoholi lahus.
  • libisev aine. Aerosiil, tärklis, talk.
  • Täiteaine. Suhkur, glükoos, laktoos, naatriumkloriid, kaltsiumfosfaat.
  • Määrdeaine. Steariinhape, polüetüleenglükool, parafiin.

Dispersioonanalüüsi mudelid riigi konkurentsivõime taseme uurimisel

Üheks olulisemaks riigi seisundi hindamise kriteeriumiks, mille alusel hinnatakse riigi heaolu ja sotsiaal-majandusliku arengu taset, on konkurentsivõime ehk rahvamajandusele omaste omaduste kogum, mis määrab riigi majanduse võimekuse. riik konkureerima teiste riikidega. Olles kindlaks määranud riigi koha ja rolli maailmaturul, on võimalik luua selge strateegia majandusliku julgeoleku tagamiseks rahvusvahelisel tasandil, sest see on võti positiivseteks suheteks Venemaa ja kõigi maailmaturul tegutsejate: investorite vahel. , võlausaldajad, osariikide valitsused.

Riikide konkurentsivõime taseme võrdlemiseks järjestatakse riigid keeruliste indeksite abil, mis sisaldavad erinevaid kaalutud näitajaid. Need indeksid põhinevad võtmeteguritel, mis mõjutavad majanduslikku, poliitilist jne olukorda. Riigi konkurentsivõime uurimise mudelite kompleks näeb ette mitmemõõtmelise statistilise analüüsi (eelkõige dispersioonanalüüs (statistika), ökonomeetriline modelleerimine, otsuste tegemine) meetodite kasutamist ja sisaldab järgmisi põhietappe:

  1. Näitajate-näitajate süsteemi moodustamine.
  2. Riigi konkurentsivõime näitajate hindamine ja prognoosimine.
  3. Riikide konkurentsivõime näitajate-näitajate võrdlus.

Ja nüüd kaalume selle kompleksi iga etapi mudelite sisu.

Esimesel etapil kasutades ekspertuuringu meetodeid, moodustatakse riigi konkurentsivõime hindamiseks riigi konkurentsivõime hindamiseks selle arengu spetsiifikat arvestades mõistlik kogum rahvusvaheliste reitingute ja statistikaosakondade andmete põhjal, mis kajastavad süsteemi seisukorda. kui tervik ja selle protsessid. Nende näitajate valik on põhjendatud vajadusega valida need, mis praktika seisukohalt võimaldavad kõige täielikumalt kindlaks teha riigi taseme, investeerimisatraktiivsuse ning olemasolevate potentsiaalsete ja tegelike ohtude suhtelise lokaliseerimise võimaluse.

Rahvusvaheliste reitingusüsteemide peamised näitajad-näitajad on indeksid:

  1. Ülemaailmne konkurentsivõime (GCC).
  2. Majandusvabadus (IES).
  3. Areng inimpotentsiaal(HDI).
  4. Korruptsioonitaju (CPI).
  5. Sise- ja välisohud (IVZZ).
  6. Rahvusvahelise mõju potentsiaal (IPIP).

Teine faas osas on sätestatud riigi konkurentsivõime näitajate hindamine ja prognoosimine rahvusvahelised reitingud uuritud 139 maailma osariigi jaoks.

Kolmas etapp näeb ette riikide konkurentsivõime tingimuste võrdlemise korrelatsiooni- ja regressioonanalüüsi meetodite abil.

Uuringu tulemusi kasutades on võimalik määrata protsesside olemust üldiselt ja riigi konkurentsivõime üksikute komponentide kaupa; testida hüpoteesi tegurite mõju ja nende seoste kohta sobival olulisuse tasemel.

Kavandatava mudelikomplekti rakendamine võimaldab mitte ainult hinnata riikide konkurentsivõime taseme ja investeerimisatraktiivsuse hetkeolukorda, vaid ka analüüsida juhtimise puudujääke, ennetada valede otsuste vigu ja ennetada kriisi teket. osariigis.

Dispersioonanalüüs

1. Dispersioonanalüüsi mõiste

Dispersioonanalüüs- see on tunnuse varieeruvuse analüüs mis tahes kontrollitud muutuva faktori mõjul. Väliskirjanduses nimetatakse dispersioonanalüüsi sageli ANOVA-ks, mis tõlkes tähendab dispersioonanalüüsi (Analysis of Variance).

Dispersioonanalüüsi ülesanne seisneb erinevat tüüpi varieeruvuse eraldamises tunnuse üldisest varieeruvusest:

a) varieeruvus iga uuritud sõltumatu muutuja toimest;

b) uuritud sõltumatute muutujate koostoimest tingitud varieeruvus;

c) kõikidest muudest tundmatutest muutujatest tingitud juhuslik variatsioon.

Uuritud muutujate toimest ja nende vastasmõjust tulenev varieeruvus korreleerub juhusliku varieeruvusega. Selle suhte näitajaks on Fisheri F-test.

Kriteeriumi F arvutamise valem sisaldab dispersioonide hinnanguid ehk tunnuse jaotusparameetreid, seetõttu on kriteerium F parameetriline kriteerium.

Kui sisse rohkem tunnuse muutlikkus on tingitud uuritavatest muutujatest (teguritest) või nende vastasmõjust, seda suurem kriteeriumi empiirilised väärtused.

Null dispersioonanalüüsi hüpotees ütleb, et uuritud efektiivse tunnuse keskmised väärtused kõigis astmetes on samad.

Alternatiivne hüpotees väidab, et efektiivse atribuudi keskmised väärtused uuritava teguri erinevates astmetes on erinevad.

Dispersioonanalüüs võimaldab meil väita tunnuse muutust, kuid ei näita suunas need muudatused.

Alustame dispersioonanalüüsi kõige lihtsama juhtumiga, kui uurime ainult tegevust üks muutuja (üks tegur).

2. Mitteseotud valimite ühesuunaline dispersioonanalüüs

2.1. Meetodi eesmärk

Ühemõõtmelise dispersioonanalüüsi meetodit kasutatakse juhtudel, kui efektiivse atribuudi muutusi uuritakse muutuvate tingimuste või mõne teguri gradatsiooni mõjul. Meetodi selles versioonis on teguri iga gradatsiooni mõju mitmesugused katsealuste näidis. Teguri astmeid peab olema vähemalt kolm. (Astmeid võib olla kaks, kuid sel juhul ei saa me luua mittelineaarseid sõltuvusi ja tundub mõistlikum kasutada lihtsamaid).

Seda tüüpi analüüsi mitteparameetriline variant on Kruskal-Wallis H test.

Hüpoteesid

H 0: erinevused faktorite klasside vahel (erinevad tingimused) ei ole rohkem väljendunud kui juhuslikud erinevused igas rühmas.

H 1: erinevused faktorite gradatsioonide (erinevate tingimuste) vahel on rohkem väljendunud kui juhuslikud erinevused iga rühma sees.

2.2. Sõltumatute valimite ühemõõtmelise dispersioonanalüüsi piirangud

1. Ühemõõtmeline dispersioonanalüüs eeldab vähemalt kolme teguri gradatsiooni ja vähemalt kahte ainet igas astmes.

2. Tulemuseks olev tunnus peab uuritavas valimis olema normaalselt jaotunud.

Tõsi, enamasti ei näidata, kas räägime mingi tunnuse jaotusest kogu uuritavas valimis või selle selles osas, mis moodustab dispersioonikompleksi.

3. Näide probleemi lahendamisest sõltumatute valimite ühefaktorilise dispersioonanalüüsi meetodil, kasutades näidet:

Kolm erinevat kuuest ainest koosnevat rühma said kümnesõnalised nimekirjad. Esimesele rühmale esitati sõnu madala kiirusega 1 sõna 5 sekundis, teisele rühmale keskmiselt 1 sõna 2 sekundis ja kolmandale rühmale suure kiirusega 1 sõna sekundis. Eeldati, et reprodutseerimise jõudlus sõltub sõna esitamise kiirusest. Tulemused on esitatud tabelis. üks.

Reprodutseeritud sõnade arv Tabel 1

teema number

madal kiirus

keskmine kiirus

suur kiirus

kogu summa

H 0: Sõna mahu erinevused vahel rühmad ei ole rohkem väljendunud kui juhuslikud erinevused sees iga rühm.

H1: Erinevused sõnade mahus vahel rühmad on rohkem väljendunud kui juhuslikud erinevused sees iga rühm. Tabelis esitatud eksperimentaalsete väärtuste kasutamine. 1, määrame kindlaks mõned väärtused, mida on vaja kriteeriumi F arvutamiseks.

Ühesuunalise dispersioonanalüüsi põhisuuruste arvutamine on toodud tabelis:

tabel 2

Tabel 3

Toimingute jada lahtiühendatud proovide ühesuunalises ANOVA-s

Selles ja järgmistes tabelites sageli kasutatav tähistus SS on "ruutude summa" lühend. Seda lühendit kasutatakse kõige sagedamini tõlkeallikates.

SS fakt tähendab tunnuse muutlikkust, mis on tingitud uuritava teguri toimest;

SS levinud- tunnuse üldine varieeruvus;

S CA- varieeruvus, mis tuleneb arvesse võtmata teguritest, "juhuslik" või "jääk" varieeruvus.

PRL - "keskmine ruut" ehk ruutude summa keskmine, vastava SS keskmine väärtus.

df - vabadusastmete arv, mida mitteparameetrilisi kriteeriume arvesse võttes tähistasime kreeka tähega v.

Järeldus: H 0 lükatakse tagasi. H 1 on aktsepteeritud. Rühmadevahelised erinevused sõnade reprodutseerimise mahus on selgemad kui juhuslikud erinevused iga rühma sees (α=0,05). Niisiis mõjutab sõnade esituskiirus nende reprodutseerimise mahtu.

Allpool on toodud näide probleemi lahendamisest Excelis:

Algandmed:

Kasutades käsku: Tööriistad->Andmeanalüüs->Ühesuunaline dispersioonanalüüs, saame järgmised tulemused:

Matemaatika kursused

Sissejuhatus

Dispersioonanalüüsi mõiste

Ühesuunaline dispersioonanalüüs (praktiline rakendamine rakenduses IBM SPSS Statistics 20)

Ühesuunaline dispersioonanalüüs (praktiline rakendamine in Microsofti kontor 2013)

Järeldus

Kasutatud allikate loetelu

Sissejuhatus

Teema asjakohasus. Matemaatilise statistika areng algab kuulsa saksa matemaatiku Carl Friedrich Gaussi töödega 1795. aastal ja areneb siiani. AT Statistiline analüüs on olemas parameetriline meetod "Ühefaktoriline dispersioonanalüüs". Praegu kasutatakse seda majandusteaduses turu-uuringute läbiviimisel tulemuste võrreldavuse huvides (näiteks toote tarbimise uuringuid riigi eri piirkondades tehes tuleb teha järeldusi, kui palju küsitlusandmed erinevad või erinevad ei erine üksteisest; psühholoogias, erinevat tüüpi uuringute läbiviimisel), teaduslike võrdlustestide koostamisel või mis tahes uurimisel. sotsiaalsed rühmad ja statistikaprobleemide lahendamiseks.

Eesmärk. Ta tutvub sellise statistilise meetodiga nagu ühesuunaline dispersioonanalüüs, samuti selle rakendamisega arvutis erinevates programmides ja võrdleb neid programme.

Õppida ühesuunalise dispersioonanalüüsi teooriat.

Õppida ühefaktorilise analüüsi ülesannete lahendamise programme.

Käitumine võrdlev analüüs need programmid.

Töö saavutused: Praktiline osa Töö oli täielikult autori poolt tehtud: programmide valik, ülesannete valik, nende lahendamine PC-s, misjärel viidi läbi võrdlev analüüs. Teoreetilises osas viidi läbi ANOVA rühmade klassifitseerimine. see töö testiti aruandena üliõpilaste teaduslikul sessioonil „Valitud küsimused kõrgem matemaatika ja matemaatika õpetamise meetodid"

Töö struktuur ja ulatus. Töö koosneb sissejuhatusest, kokkuvõttest, sisust ja bibliograafiast, sealhulgas 4 pealkirjast. Töö kogumaht on 25 trükilehekülge. Töö sisaldab 1 näidet, mis on lahendatud 2 programmiga.

Dispersioonanalüüsi mõiste

Sageli on vaja uurida ühe või mitme sõltumatu muutuja (teguri) mõju ühele või mitmele sõltuvale muutujale (tulemusmärgid), selliseid probleeme saab lahendada dispersioonanalüüsi meetoditega, mille autoriks on R. Fisher.

ANOVA dispersioonanalüüs – statistiliste andmetöötlusmeetodite kogum, mis võimaldab analüüsida ühe või mitme efektiivse tunnuse varieeruvust kontrollitavate tegurite (sõltumatute muutujate) mõjul. Siin mõistetakse teguri all teatud väärtust, mis määrab uuritava objekti või süsteemi omadused, s.t. lõpptulemuse põhjus. Dispersioonanalüüsi läbiviimisel on oluline valida õige mõjuallikas ja -objekt, s.o. tuvastada sõltuvad ja sõltumatud muutujad.

Sõltuvalt klassifikatsiooni tunnustest eristatakse mitmeid dispersioonanalüüsi klassifikatsioonirühmi (tabel 1).

Arvesse võetavate tegurite arvu järgi: Ühemõõtmeline analüüs - uuritakse ühe teguri mõju; Mitmemõõtmeline analüüs - uuritakse kahe või enama teguri samaaegset mõju Väärtuste valimite vahelise seose olemasolu järgi: Mitteseotud (erinevate) analüüs ) proovid - viiakse läbi juhul, kui uurimisobjektide rühma asub mitu erinevad tingimused. (Kontrollitakse nullhüpoteesi H0: sõltuva muutuja keskmine väärtus on erinevates mõõtmistingimustes sama, st ei sõltu uuritavast faktorist.); Seotud (samade) valimite analüüs - tehakse kahe või enama kohta mõõtmised, mis on tehtud samal uuritud objektide rühmal erinevates tingimustes. Siin on võimalik arvestamata teguri mõju, mida saab ekslikult omistada tingimuste muutumisele.Teguritest mõjutatud sõltuvate muutujate arvu järgi Ühemõõtmeline analüüs (ANOVA või AMCOVA - kovariatsioonianalüüs) - ühte sõltuvat muutujat mõjutavad tegurid ;Mitme muutujaga analüüs (MANOVA - mitme muutujaga dispersioonanalüüs või MANSOVA - mitme muutujaga kovariatsioonianalüüs) - mitmed sõltuvad muutujad on mõjutatud tegurite poolt.Vastavalt uuringu eesmärgile Deterministlik - kõigi tegurite tasemed on eelnevalt fikseeritud ja see on nende mõju. mida kontrollitakse (hüpoteesi H0 kontrollitakse keskmiste tasemete erinevuste puudumise kohta); Juhuslik – iga teguri tasemed saadakse kui suvaline näidis teguritasemete üldisest komplektist (testimisel on hüpotees H0, et teguri erinevate tasemete jaoks arvutatud keskmiste reaktsiooniväärtuste dispersioon on nullist erinev);

Dispersioonkontrollide ühesuunaline analüüs statistiline olulisus erinevused kahe või enama populatsiooni valimi keskmiste vahel, püstitatakse hüpoteesid esialgselt.

Nullhüpotees H0: efektiivse tunnuse keskmised väärtused teguri toime (või teguri gradatsiooni) kõigis tingimustes on samad

Alternatiivne hüpotees H1: efektiivse tunnuse keskmised väärtused teguri kõigis tingimustes on erinevad.

ANOVA meetodeid saab kasutada normaalse jaotusega populatsioonide jaoks (parameetriliste testide mitme muutujaga analoogid) ja kindlate jaotusteta populatsioonide jaoks (mitteparameetriliste testide mitmemõõtmelised analoogid). Esimesel juhul on vaja esmalt kindlaks teha, et saadud tunnuse jaotus on normaalne. Tunnuse jaotuse normaalsuse kontrollimiseks võite kasutada asümmeetrianäitajaid A = , , ja kurtosis E = , , kus , . - efektiivse tunnuse väärtus ja selle keskmine väärtus; - saadud tunnuse standardhälve; .

Vaatluste arv;

Meetmete A ja E representatiivsusvead

Kui kaldsuse ja kurtoosi näitajad ei ületa oma esindusvigu rohkem kui 3 korda, s.o. AGA<3тА и Е <3тЕ, то распределение можно считать нормальным. Для нормальных распределений показатели А и Е равны нулю.

Andmeid, mis on seotud teguri ühe tingimusega (ühe gradatsiooniga), nimetatakse dispersioonikompleksiks. Dispersioonanalüüsi tegemisel tuleb jälgida komplekside dispersioonide võrdsust. Sel juhul tuleks elemendid valida juhuslikult.

Teisel juhul, kui valimipopulatsioonidel on suvalised jaotused, kasutatakse ühesuunalise dispersioonanalüüsi mitteparameetrilisi (aste) analooge (Kruskal-Wallis kriteeriumid, Friedman).

Vaatleme graafilist illustratsiooni aktsiate tulumäära sõltuvusest riigi majanduse olukorrast (joonis 1, a). Siin on uuritavaks teguriks majanduse seisundi tase (täpsemalt kolm selle seisundi taset) ja efektiivne tunnus on tootlus. Ülaltoodud jaotus näitab, et sellel teguril on oluline mõju kasumlikkusele, s.o. Majanduse paranedes paraneb ka aktsiate tootlus, mis ei ole vastuolus terve mõistusega.

Pange tähele, et valitud teguril on gradatsioonid, st. selle väärtus muutus üleminekul ühest astmest teise (ühest majandusseisundist teise).

Riis. 1. Faktori mõju ja grupisisese leviku suhe: a - teguri oluline mõju; b - teguri ebaoluline mõju

Faktori astmete rühm on vaid erijuhtum, lisaks võib teguril olla gradatsioone esitatud isegi nominaalses skaalas. Seetõttu räägivad nad sagedamini mitte teguri astmetest, vaid selle toime erinevatest tingimustest.

Vaatleme nüüd dispersioonanalüüsi ideed, mis põhineb dispersioonide liitmise reeglil: summaarne dispersioon võrdub rühmadevahelise ja grupisiseste dispersioonide keskmise summaga:

Kõigi tegurite mõjust tulenev summaarne dispersioon

Rühmadevaheline hajutamine kõigi muude tegurite mõju tõttu;

Keskmine rühmasisene dispersioon, mis on põhjustatud rühmitamise atribuudi mõjust.

Rühmitatud tunnuse mõju on selgelt näha joonisel 1a, kuna teguri mõju on rühmasisese levikuga võrreldes märkimisväärne, mistõttu on rühmadevaheline dispersioon suurem kui grupisisene ( > ) ja joonisel fig. 1, b on vastupidine pilt: siin domineerib rühmasisene levi ja teguri mõju praktiliselt puudub.

Dispersioonanalüüs on üles ehitatud samal põhimõttel, ainult et selles ei kasutata dispersioone, vaid hälvete ruudu keskmist ( , , ), mis on vastavate dispersioonide erapooletud hinnangud. Need saadakse, jagades hälvete ruudu summad vastava vabadusastmete arvuga

Täitematerjalid tervikuna;

Grupisisesed keskmised;

Gruppidevahelised keskmised;

Kõigi mõõtmiste üldkeskmine (kõikide rühmade puhul);

Rühma keskmine teguri j-nda astme jaoks.

Matemaatilised ootused vastavalt grupisiseste ja rühmadevaheliste ruutude hälvete summa kohta arvutatakse valemitega: (Fikseeritud faktoriga mudel),

.

E ( ) = E ( ) = , siis leiab kinnitust nullhüpotees H0 keskmiste erinevuste puudumise kohta, mistõttu uuritav tegur ei oma olulist mõju (vt joonis 1, b). Kui Fisheri F-testi tegelik väärtus F= E ( ) /E ( ) on suurem kui kriitiline siis nullhüpotees H0 olulisuse tasemel , lükatakse tagasi ja aktsepteeritakse alternatiivne hüpotees H1 – teguri olulise mõju kohta joonisel fig. 1, a. .

Ühesuunaline dispersioonanalüüs

Dispersioonanalüüsi, mis võtab arvesse ainult ühte muutujat, nimetatakse ühesuunaliseks ANOVAks.

Seal on n-st koosnev vaatlusobjekti rühm mõne uuritava muutuja mõõdetud väärtustega . muutuja kohta on mõjutatud mõnest kvaliteedifaktorist Mitmega mõju tasemed (gradatsioonid). Mõõdetud muutuja väärtused teguri erinevatel tasanditel on toodud tabelis 2 (neid saab esitada ka maatriksi kujul).

Tabel 2.

Ühemõõtmelise analüüsi lähteandmete täpsustamise tabelivorm

Vaatlusobjekti number ()Muutuvad väärtused teguri tasemel (gradatsioonil). (madalaim) (lühike)… (kõrgeim)1 2 … n .Siin võib iga tase sisaldada erinevat arvu vastuseid, mida mõõdetakse teguri ühel tasemel, siis on igal veerul oma väärtus . On vaja hinnata selle teguri mõju olulisust uuritavale muutujale. Selle probleemi lahendamiseks saab kasutada dispersioonanalüüsi ühefaktorilist mudelit. Ühefaktoriline dispersioonimudel.

Uuritava muutuja väärtus -nda vaatlusobjekti jaoks at -teguri tase;

Grupi keskmine -teguri tase;

Faktori -nda taseme mõjust tulenev mõju;

Juhuslik komponent ehk häiring, mis on põhjustatud kontrollimatute tegurite mõjust. Toome välja ANOVA kasutamise peamised piirangud:

Juhusliku komponendi matemaatilise ootuse võrdsus nulliga: = 0.

Juhuslik komponent , ja seega ka on normaaljaotusega.

Tegurite astmete arv peab olema vähemalt kolm.

See mudel, olenevalt teguri tasemetest, kasutades Fisheri F-testi, võimaldab testida üht nullhüpoteesist.

Seotud valimite dispersioonanalüüsi tegemisel on võimalik testida veel üht nullhüpoteesi H0(u) - individuaalsed erinevused vaatlusobjektide vahel ei väljendu rohkem kui juhuslikest põhjustest tulenevad erinevused.

Ühesuunaline dispersioonanalüüs

(Praktiline rakendus IBM SPSS Statistics 20-s)

Uurijat huvitab küsimus, kuidas mingi atribuut muutub muutuja (teguri) toime erinevates tingimustes. Uuritakse vaid ühe muutuja (teguri) mõju uuritavale tunnusele. Oleme juba vaatlenud näidet majandusest, nüüd toome näite psühholoogiast, kuidas muutub probleemi lahendamise aeg erinevatel katseisikute motivatsioonitingimustel (madal, keskmine, kõrge motivatsioon) või erinevatel viisidel. ülesande esitamine (suuliselt, kirjalikult või tekstina graafikute ja illustratsioonidega) , ülesandega töötamise erinevates tingimustes (üksi, õpetajaga ruumis, klassiruumis). Esimesel juhul on teguriks motivatsioon, teisel - nähtavuse aste, kolmandal - avalikustamise tegur.

Meetodi selles versioonis avaldatakse iga astme mõjule erinevad katsealuste valimid. Teguri astmeid peab olema vähemalt kolm.

Näide 1. Kolmele erinevale kuuest subjektist koosnevale rühmale anti kümnesõnalised loendid. Esimesele rühmale esitati sõnu madala kiirusega 1 sõna 5 sekundis, teisele rühmale keskmiselt 1 sõna 2 sekundis ja kolmandale rühmale suure kiirusega 1 sõna sekundis. Eeldati, et sõnade esituskiirusest sõltub taasesitamise jõudlus (tabel 3).

Tabel 3

Reprodutseeritud sõnade arv

Teemarühm 1 madal kiirus, 2. keskmine kiirus, 3. suur kiirus

Sõnastame hüpoteesid: rühmadevahelised sõnade reprodutseerimise mahu erinevused ei ole rohkem väljendunud kui juhuslikud erinevused iga rühma sees: Sõnade taasesitamise mahu erinevused rühmade vahel on rohkem väljendunud kui juhuslikud erinevused iga rühma sees.

Lahenduse viime läbi SPSS keskkonnas järgmise algoritmi järgi

Käivitame SPSS programmi

Sisestage aknasse arvväärtused andmeid

Riis. 1. Väärtuste sisestamine SPSS-i

Aknas Muutujad kirjeldame kõiki lähteandmeid, vastavalt tingimusele

Ülesanded

Joonis 2 Muutujate aken

Selguse huvides kirjeldame siltide veerus tabelite nimesid

Graafikus Väärtused kirjeldage iga rühma arvu

Joonis 3 Väärtuste sildid

Seda kõike tehakse selguse huvides, s.t. neid sätteid saab ignoreerida.

Graafikus kaal , teise veergu peate panema nimiväärtuse

Aknas andmeid tellige ühesuunaline dispersioonanalüüs, kasutades menüüd "Analüüs". Keskmine võrdlus

Ühesuunaline dispersioonanalüüs…

Joonis 4 Ühesuunaline ANOVA funktsioon

Avanenud dialoogiboksis Ühesuunaline dispersioonanalüüs valige sõltuv muutuja ja lisage see ülalpeetavate nimekiri ja muutuv tegur aknateguris

Joonis 5, kus on välja toodud ülalpeetavate nimekiri ja tegur

Seadistage kvaliteetse andmeväljundi jaoks mõned parameetrid

Joonis 6 Kvalitatiivsete andmete järeldamise parameetrid

Valitud ühesuunalise ANOVA algoritmi arvutused käivituvad pärast klõpsamist Okei

Arvutuste lõpus kuvatakse vaateaknas arvutuse tulemused.

Kirjeldav statistikarühm NAverage Std. Deviation Std. Viga 95% keskmise miinimumi maksimumi usaldusvahemik Tabel 2. Kirjeldav statistika

Tabel Kirjeldav statistika näitab kiiruste põhinäitajaid rühmades ja nende koguväärtusi.

Vaatluste arv igas rühmas ja kogusumma

Keskmine – vaatluste aritmeetiline keskmine igas rühmas ja kõigi rühmade kohta kokku

Std. Deviation, Std. Viga – standardhälve ja standardhälbed

Keskmise usaldusvahemiku % – need intervallid on täpsemad iga rühma ja kõigi rühmade kohta kokku, selle asemel, et võtta intervalle nendest piiridest alla või üle.

Minimaalne, Maksimaalne - iga rühma minimaalsed ja maksimaalsed väärtused, mida katsealused kuulsid

ühefaktoriline dispersioon juhuslik

Dispersioonirühma homogeensuse kriteerium Statistika Livinast.st.1st.st.

Livini homogeensuse testi kasutatakse dispersioonide homogeensuse (homogeensuse) kontrollimiseks. Sel juhul kinnitab see dispersioonide vaheliste erinevuste ebaolulisust, kuna väärtus = 0,915, st selgelt suurem kui 0,05. Seetõttu tunnistatakse dispersioonanalüüsi abil saadud tulemused õigeteks.

Tabelis 1-suunaline dispersioonanalüüs näitab ühesuunalise DA tulemusi

"Rühmadevaheline" ruutude summa on iga rühma üldise keskmise ja keskmiste erinevuste ruutude summa, mida on kaalutud rühmas olevate objektide arvuga.

"Rühmade sees" on iga rühma keskmise ja selle rühma iga väärtuse ruudu erinevuste summa

Veerg "Püha St." sisaldab vabadusastmete arvu V:

Gruppidevaheline (v = rühmade arv - 1);

Intragroup (v=objektide arv - rühmade arv - 1);

"keskmine ruut" sisaldab ruutude summa ja vabadusastmete arvu suhet.

Veerg "F" näitab keskmise ruudu suhet rühmade vahel ja rühmade keskmise ruudu suhet.

Veerg "Väärtus" sisaldab tõenäosuse väärtust, et täheldatud erinevused on juhuslikud.

Tabel 4 Valemid

Keskmiste graafikud

Graafik näitab, et see väheneb. Tabelist Fk k1=2, k2=15 on võimalik määrata ka statistika tabeliväärtus 3,68. Reegli järgi, kui , siis aktsepteeritakse nullhüpoteesi, vastasel juhul aktsepteeritakse alternatiivset hüpoteesi. Meie näite jaoks (7,45>3,68), seega aktsepteeritakse alternatiivset hüpoteesi. Seega, naastes probleemi olukorra juurde, võime järeldada nullhüpoteesi tagasi lükatud ja alternatiiv vastu võetud. : erinevused sõnade mahus rühmade vahel on rohkem väljendunud kui juhuslikud erinevused iga rühma sees ). See. sõnade esituskiirus mõjutab nende taasesitamise mahtu.

Ühesuunaline dispersioonanalüüs

(Praktiline rakendamine Microsoft Office 2013-s)

Samas näites kaaluge ühesuunalist dispersioonanalüüsi Microsoft Office 2013-s

Probleemi lahendamine Microsoft Excelis

Avame Microsoft Exceli.


Joonis 1. Andmete kirjutamine Excelisse

Teisendame andmed järgmiseks numbri vorming. Selleks on põhivahekaardil üksus Vorming ja sellel on lõik Lahtri vorming . Ekraanile ilmub aken Format Cells. Riis. 2 Valige Numbrivorming ja sisestatud andmed teisendatakse. Nagu on näidatud joonisel 3

Joonis 2 Teisenda numbrivormingusse

Joonis 3 Tulemus pärast teisendamist

Andmete vahekaardil on üksus andmete analüüs klõpsame sellel.

Valime ühesuunalise dispersioonanalüüsi

Joonis 6 Andmete analüüs

Andmete dispersioonanalüüsi läbiviimiseks ilmub ekraanile ühesuunaline dispersioonanalüüsi aken (joonis 7). Seadistame parameetrid

Riis. 7 Parameetrite määramine ühemõõtmelise analüüsi jaoks

Klõpsake hiirt väljal Sisestusintervall. Valige lahtrite vahemik B2::F9, andmed, mida soovite analüüsida. Sisendite juhtrühma väljale Input Spacing kuvatakse määratud vahemik.

Kui sisendandmete juhtrühmas pole ridade kaupa lülitit seadistatud, siis valige see nii, et Exceli programm aktsepteeriks andmerühmi ridade kaupa.

Valikuline Kui valitud andmevahemiku esimene veerg sisaldab ridade nimesid, märkige ruut Sildid esimeses reas rühmas Sisendite juhtelemendid.

Sisendandmete juhtgrupi Alfa sisestusväljal kuvatakse vaikimisi väärtus 0,05, mis on seotud dispersioonanalüüsi vea tõenäosusega.

Kui väljundintervalli lüliti ei ole juhtelementide rühmas Väljundparameetrid seatud, siis määrake see või valige uus töölehe lüliti, et andmed edastataks uuele lehele.

Ühesuunalise ANOVA akna sulgemiseks klõpsake nuppu OK. Ilmuvad dispersioonanalüüsi tulemused (joonis 8).

Joonis 8 Andmete väljund

Lahtrite vahemikus A4:E7 on tulemused kirjeldav statistika. Rida 4 sisaldab parameetrite nimesid, read 5 - 7 - statistilised väärtused arvutatakse partiide kaupa. Veerus "Konto" on mõõtmiste arv, veerus "Summa" - väärtuste summa, veerus "Keskmine" - keskmine. aritmeetilised väärtused, veerus "Dispersioon" - dispersioon.

Saadud tulemused näitavad, et suurim keskmine purunemiskoormus on partiil nr 1 ning suurim purunemiskoormuse hajumine on partiidel nr 2, nr 1.

Lahtrite vahemik A10:G15 kuvab teavet andmerühmade vaheliste lahknevuste olulisuse kohta. Rida 11 sisaldab dispersioonparameetrite analüüsi nimetusi, rida 12 - rühmadevahelise töötlemise tulemusi, rida 13 - rühmasisese töötlemise tulemusi ja rida 15 - nende kahe rea väärtuste summa.

SS veerg sisaldab variatsiooniväärtusi, st. ruutude summad kõigi kõrvalekallete kohta. Variatsioon, nagu hajuvus, iseloomustab andmete levikut.

Veerg df sisaldab vabadusastmete arvu väärtusi. Need numbrid näitavad sõltumatute hälvete arvu, mille alusel dispersioon arvutatakse. Näiteks rühmadevaheline vabadusastmete arv on võrdne andmerühmade arvu ja ühe vahega. Kuidas rohkem numbrit vabadusastmed, seda suurem on dispersiooniparameetrite usaldusväärsus. Tabelis toodud vabadusastmete andmed näitavad, et rühmasisesed tulemused on usaldusväärsemad kui rühmadevahelised parameetrid.

MS veerg sisaldab dispersiooniväärtusi, mis on määratud variatsiooni suhte ja vabadusastmete arvuga. Dispersioon iseloomustab andmete hajumise astet, kuid erinevalt variatsiooni suurusest ei ole sellel otsest kalduvust vabadusastmete arvu suurenemisega suureneda. Tabel näitab, et rühmadevaheline dispersioon on palju suurem kui grupisisene dispersioon.

Veerg F sisaldab F-statistika väärtust, mis on arvutatud rühmadevahelise ja rühmasisese dispersiooni suhte järgi.

F-kriitiline veerg sisaldab F-kriitilist väärtust, mis on arvutatud vabadusastmete arvust ja Alfa väärtusest. F-statistika ja F-kriitiline väärtus kasutavad Fisher-Snedekori testi.

Kui F-statistika on suurem kui F-kriitiline väärtus, siis võib väita, et andmerühmadevahelised erinevused ei ole juhuslikud. need. olulisuse tasemel α = 0 .05 (usaldusväärsusega 0,95), nullhüpotees lükatakse tagasi ja aktsepteeritakse alternatiivi: et sõnade esituskiirus mõjutab nende taasesitamise mahtu. P-väärtuse veerg sisaldab tõenäosust, et rühmade erinevus on juhuslik. Kuna see tõenäosus on tabelis väga väike, ei ole rühmadevaheline hälve juhuslik.

IBM SPSS Statistics 20 ja Microsoft Office 2013 võrdlus

ühefaktorilise dispersiooni juhusliku programmi

Vaatame programmide väljundeid, selleks vaatame uuesti ekraanipilte.

Dispersioonrühma ühesuunaline analüüs Ruudude summa St.Lm Keskmine ruut FZn Rühmade vahel31.444215.7227.447.006 Rühmade sees31.667152.111Kokku63.11117

Seega annab IBM SPSS Statistics 20 programm parema tulemuse, suudab numbreid ümardada, ehitada visuaalne graafik(cm. täielik lahendus), mille abil saate määrata vastuse, see kirjeldab üksikasjalikumalt nii ülesande tingimusi kui ka nende lahendust. Microsoft Office 2013-l on omad eelised, esiteks muidugi levimus, kuna Microsoft Office 2013 on installitud pea igasse arvutisse, kuvab Fcritical, mida SPSS Statistics ei paku ja seal on ka lihtne ja mugav arvutada. Sellegipoolest sobivad mõlemad programmid väga hästi ühesuunalise dispersioonanalüüsi ülesannete lahendamiseks, igal neist on oma plussid ja miinused, kuid kui arvestada suuri ülesandeid rohkemate tingimustega soovitaks SPSS Statisticsit.

Järeldus

Dispersioonanalüüsi rakendatakse kõikides valdkondades teaduslikud uuringud, kus on vaja mõju analüüsida erinevaid tegureid uuritavale muutujale. AT kaasaegne maailmÜhefaktorilise dispersioonanalüüsi jaoks on majanduses, psühholoogias ja bioloogias palju ülesandeid. Õppimise tulemusena teoreetiline materjal leiti, et dispersioonanalüüsi aluseks on dispersioonide liitmise teoreem, paljude tarkvarapakettide hulgast, milles dispersioonanalüüsi aparaati realiseeritakse, valiti välja parimad ja kaasati need töösse. Tänu uute tehnoloogiate tulekule saab igaüks meist teha uuringuid (lahendusi), kulutades samal ajal arvutustele vähem aega ja vaeva, kasutades arvuteid. Töö käigus seati eesmärgid, ülesanded, mis saavutati.

kirjanduse loetelu

Sidorenko, E.V. meetodid matemaatiline töötlemine psühholoogias [Tekst] / Peterburi. 2011. - 256 lk.

Matemaatiline statistika psühholoogidele Ermolaev O.Yu [Tekst] / Moskva_2009 -336s

Loeng 7. Analüütiline statistika [ Elektrooniline ressurss]. , Juurdepääsu kuupäev: 14.05.14

Tõenäosusteooria ja matemaatiline statistika [tekst] / Gmurman V.E. 2010 -479s