Biografier Kjennetegn Analyse

Vilkår for bruk av ANOVA variansanalyse. Problemet med flere sammenligninger

En av måtene å eliminere innflytelsen fra trening på resultatene av vurderingen av N. p. - dannelse av en stabil ferdighet i å arbeide med riktig metodikk før gjennomføring av en ny test. Imidlertid øker antallet repetisjoner av testen uunngåelig, noe som fører til en økning i antall lagrede løsninger. Denne teknikken kan anbefales for metoder som hastighetstester, som inneholder et stort antall testmaterialeelementer.

For andre metoder er åpenbart den eneste akseptable måten å redusere effekten av trening på å øke retestintervallet, som imidlertid, som nevnt ovenfor, er i konflikt med definisjonen av reliabilitet som en testkarakteristikk.

For de fleste tester av generelle evner er forbedring av N.s indikatorer for elv karakteristisk. med forsøkspersonenes alder på grunn av bedre kontroll med vilkårene for gjennomføringen. En annen faktor i økningen i de beregnede indikatorene for N. p. er en relativ nedgang med alderen i hastigheten på mental utvikling i området for de egenskapene som kan bli et mål for mål eller påvirke testresultatet. På grunn av dette, etter en tid som utgjør retestintervallet, blir tilfeldige svingninger i resultatene av undersøkelsen mindre uttalte. Den overvurderer kunstig N.s indikatorer for elv. Dette mønsteret krever separate målinger av N. p. i ulike alderskontingenter av fag, noe som er spesielt viktig for metoder beregnet for undersøkelse i et bredt aldersspekter (se fig. Stanford-Binet Mental Development Scale, Wechsler Intelligence Measurement Scale).

Disse funksjonene og ulempene ved metoden for å bestemme pålitelighet ved retest gjør den kun egnet for et begrenset antall metoder som tillater flere retestinger. Disse inkluderer sensorimotoriske tester, hastighetstester og en rekke andre metoder som er forskjellige på et stort antall punkter (se. Minnesota Multidimensional Personality Inventory).



PÅLITELIGHETSFAKTOR-DISPERJON- metode for å bestemme pålitelighet, basert på Analyse av varianter testresultater. Påliteligheten til testen tilsvarer forholdet mellom den sanne variansen (dvs. variansen til faktoren som studeres) og den faktisk oppnådde empiriske variansen. Sistnevnte er summen av den sanne variansen og variansen av målefeilen (se fig. målefeil). Den faktoranalytiske tilnærmingen til definisjonen av pålitelighet splitter i tillegg spredningen av den sanne indikatoren (J. Gilford, 1956).

Variansen til den sanne poengsummen kan på sin side bestå av variansen til fellesfaktoren for grupper av lignende tester (se nedenfor). G-faktor), spesielle faktorer som gir tester av et spesifikt fokus (se. gruppefaktorer) og spredning av faktorer som er iboende i en bestemt testmetode. Derfor er den totale variansen til testen lik summen av variansene for de generelle, spesifikke og enkeltfaktorene pluss feilvariansen:

hvor σ 2 t- testvarians, - varians av felles-, gruppe- og enkeltfaktorer, - feilvarians. Å dele ligningen med σ 2 t vi får:

som kan skrives som:

hvor er andelen av varians uttrykt av fellesfaktoren en, etc.

Dermed er pålitelighetskoeffisienten til testen lik:

Faktorspredningsmetoden for å bestemme pålitelighet er egnet for å evaluere en allerede faktorisert test (se. Faktoranalytisk prinsipp), men ikke for tester som måler en lang rekke parametere, da noen av dem kanskje ikke er innenfor det etablerte området gyldighet metoder.

PÅLITELIGHETEN TIL TESTDELENE - karakteristisk pålitelighet psykodiagnostisk teknikk oppnådd ved å analysere stabiliteten til resultatene av individuelle sett med testoppgaver eller enkeltelementer (oppgaver) test.

Den enkleste og vanligste måten å bestemme N. h. t. er splittingsmetoden, hvis essens er at emnet utfører oppgaver av to likeverdige deler av testen. Begrunnelsen for metoden er konklusjonen at med en normal eller nær normal fordeling av karakterer på hele testen (se. normal distribusjon)å utføre et tilfeldig sett med deler av testen vil gi en lignende fordeling (forutsatt at delene er homogene i oppgavene i forhold til testen som helhet).

For å vurdere påliteligheten ved splittemetoden, velges to grupper av oppgaver tilsvarende i natur og vanskelighetsgrad (se fig. Intern konsistens, vanskelighetsgrad for testelementer). Inndelingen av volumet av testelementer i sammenlignbare deler oppnås:

Fordelingen av oppgaver i partall og oddetall (i tilfelle oppgavene i testen er strengt rangert i henhold til graden av subjektiv vanskelighetsgrad);

Fordelingen av poeng i henhold til prinsippet om nærhet eller likhet mellom verdiene til vanskelighets- og diskrimineringsindeksene (se. Diskriminativitet av testelementer). Dette separasjonsprinsippet er egnet for prestasjonsprøver, der responsen fra fagene på alle elementer er obligatorisk;

Fordelingen av oppgaver etter tidspunktet for løsning av hver av delene (for hastighetstester).

For forsøkspersonene i r(separat for hver del av testen), beregnes estimatene for suksessen til løsningene, standardavvikene til den første og andre raden med estimater og korrelasjonskoeffisienten til den sammenlignede serien. Naturligvis vil disse koeffisientene karakterisere påliteligheten til bare halvparten av testen.

Spearman-Brown-ligningen reflekterer effekten av å endre antall oppgaver på testpålitelighetskoeffisienten:

hvor r t- pålitelighetskoeffisient for det totale volumet av oppgaver, - verdien etter endring av antall oppgaver, P- forholdet mellom det nye antallet oppgaver og originalen (hvis antall oppgaver for hele testen er 100, og dens del oppnådd ved å dele opp i halvdeler er 50, da n = 0,5). Herfra for hele testen:

Formlene ovenfor er gyldige for tilfeller med like standardavvik for begge halvdelene av testen (σ x1 =σx2). Hvis σ x1 er forskjellig fra σx2, For å bestemme pålitelighetsfaktoren brukes Flanagan-formelen:

Den samme indikatoren for små prøver beregnes ved å bruke Christophs formel:

Når man bestemmer r t av hele testen kan du bruke Rulon-formelen:

hvor er variansen av forskjellene mellom resultatene for hvert emne i to halvdeler av testen, er variansen av de totale resultatene. I dette tilfellet beregnes pålitelighetskoeffisienten som en brøkdel av den "sanne" variansen til testresultatene (se fig. pålitelighet, målefeil).

Ved splitting av hastighetstester brukes en spesiell oppgavegrupperingsprosedyre. Minimumstiden er bestemt (tmin) løsning av hele testen, så telles halvparten og en fjerdedel av denne tiden. Alle forsøkspersonene jobber halvparten av minimumstiden, hvoretter de setter et merke mot oppgaven som utføres på signaltidspunktet, og fortsetter å jobbe i ytterligere en fjerdedel av minimumstiden. Pålitelighetskoeffisienten vil i dette tilfellet tilsvare graden av korrelasjon mellom antall oppgaver løst før det første signalet (0,5 t min) og løst i løpet av tiden mellom første og andre signal (0, 25t mjn).

Inndelingen av testoppgaver i ekvivalente halvdeler er bare et spesialtilfelle av N. h. t. Å dele opp i tre, fire eller flere deler er fullt mulig. I det begrensende tilfellet er antall deler lik antall poeng. Samtidig brukes analyse for å bestemme reliabiliteten indre konsistens.

Når du deler opp hele settet med testoppgaver i et hvilket som helst antall grupper, for riktig bestemmelse av N. h. t., som allerede angitt ovenfor, må kravet om ekvivalens av slike grupper overholdes. Derfor, når man beregner pålitelighetskoeffisienten ved hjelp av metoden for intern konsistensanalyse, bør de valgte testelementene være svært homogene i innhold og vanskelighetsgrad (homogene). For heterogene oppgaver, verdiene r t nedenfor sant.

Den vanligste metoden for å vurdere påliteligheten til individuelle oppgaver er beregningen av Kuder-Richardson-koeffisienten:

hvor er variansen til de primære testresultatene, R- vanskelighetsindeks, uttrykt som en andel - - (se. Vanskeligheter med oppgaver 100 test), q = 1 - p, r pb- diskrimineringskoeffisient (se Diskriminativitet av testelementer).

For å forenkle beregningen kan Guliksen-formelen brukes:

hvor k- antall oppgaver i testen.

Denne ligningen kan forenkles som følger:

I fravær av en diskrimineringskoeffisient, er en variant av Kuder-Richardson-formelen anvendelig:

Regneeksempel r t i henhold til Kuder-Richardson-metoden er gitt i tabell. 17.

Tabell 17

Bestemmelse av pålitelighetsfaktoren ved hjelp av Kuder-Richardson-metoden ( n = 50; = 8,01;k= 16)

Formlene som er foreslått ovenfor for å bestemme pålitelighetskoeffisienten er egnet for tilfeller der oppgaver blir evaluert på en dikotom skala (se. måleskalaer) basert på «gjort eller ikke gjort»-prinsippet. For saker med mer differensiert vurdering er formelen anvendelig alfa koeffisient:

hvor er summen av variansene til resultatene av individuelle oppgaver.

I praksis psykologisk diagnostikk En test anses å være pålitelig hvis r t≥ 0,6.

Pålitelighetskoeffisienten har et konfidensintervall, hvis definisjon er spesielt viktig på grunn av det store antallet faktorer som kan påvirke verdien. Konfidensintervall for r t definert som

hvor er standardfeilen til sikkerhetsfaktoren - Fishers transformasjon (bestemt av statistiske tabeller). I praksis brukes kun den nedre grensen. r t(Z-kritt ved γ = 0,05 er 1,96, ved α = 0,01 -2,58).

Pålitelighetskarakteristikken til typen N. h. t. har alvorlige fordeler i forhold til test pålitelighet på nytt og påliteligheten til parallelle former, hovedsakelig på grunn av manglende behov for omprøve. Dermed fjernes påvirkningen fra mange fremmede faktorer, spesielt trening, huskebeslutninger osv. Denne omstendigheten bestemmer den utbredte bruken av metoder for å karakterisere N. h. t. sammenlignet med andre typer pålitelighet. Ulempene med metoden inkluderer manglende evne til å kontrollere stabiliteten til testresultatene etter en viss tid. Dette krever å kombinere metoden til N. h. t. med andre typer egenskaper for påliteligheten til psykologiske metoder.

"TEGN EN HISTORIE"(Draw-a-Story, DAS)- projektiv teknikk personlighetsforskning. Foreslått av R. Silver i 1987. Designet for tidlig oppdagelse av depresjon, spesielt - latent depresjon.

"N. og." er basert på bestemmelsene som er felles for projektive teknikker: a) barns oppfatning av de samme tegningene er forskjellig; b) persepsjon er påvirket av personlig erfaring; c) tegninger kan gjenspeile personlighetselementer som kan kvantifiseres.

Metodikken kombinerer forskningsprosedyrer av ulike projektive teknikker. I utgangspunktet må forsøkspersonen velge to av de 14 maleriene og bruke dem til å komme med en historie (de tilbudte maleriene inneholder hovedsakelig bilder av mennesker og dyr). Deretter må du lage en tegning basert på en tidligere forestilt historie. Til slutt foreslås det å skrive ned historien. Temaene for tegningen og historien vurderes på en 7-punkts skala (fra «uttrykk negativt» til «ekspressivt positivt»). Negative temaer inneholder indikasjoner på «tristhet», «tristhet», «død», «hjelpeløshet», «en fremtid uten håp om det beste» osv. og anses som tegn på depresjon.

"N. og." Den er beregnet på gruppeundersøkelse av barn og ungdom, fra og med 5 år. Høy pålitelighet metoder. Så, test pålitelighet på nytt(retestintervall - en uke) ved undersøkelse av barn med emosjonelle lidelser - 0,87.

Data om gyldighet er begrenset, men det er holdepunkter for at temaene til deprimerte barn og unge hovedsakelig vurderes som et «negativt uttrykk», som ikke observeres i andre grupper. Det er normative data hentet fra en undersøkelse av 380 barn og unge, men de kan ikke anses som representative.

Det er ingen informasjon om bruk i CIS.

«TEGN EN PERSON»-TEST(Draw-A-Person Test, DAP)- projektiv teknikk personlighetsforskning. Utviklet av K. Mahover i 1948 på grunnlag av F. Goodenough-testen, designet for å bestemme nivået av intellektuell utvikling hos barn og ungdom ved å bruke en tegning av en mann de har laget (se. God nok "Tegn en mann"-test).

"N. h." t. kan brukes til å undersøke både voksne og barn, gruppeeksamen er tillatt.

Emnet tilbys å tegne en person med en blyant på et blankt ark. Etter å ha fullført tegningen får han i oppgave å tegne en person av det motsatte kjønn. Den siste fasen av undersøkelsen er en undersøkelse. K. Makhover satt sammen spesielle lister med spørsmål om de tegnede figurene. Disse spørsmålene er knyttet til alder, utdanning, sivilstatus, vaner osv.

Når forfatteren tolker de innhentede dataene, går forfatteren ut fra ideen om at tegningen er et uttrykk for motivets "jeg". Betydelig oppmerksomhet rettes mot analysen av forskjellige detaljer i tegningen, først og fremst til funksjonene i bildet av hoveddelene av kroppen, som ofte blir evaluert i samsvar med psykoanalytisk symbolikk. Studien gyldighet"N. h." t. Vestlige psykologer førte til motstridende resultater på grunn av den spekulative karakteren til tolkningene foreslått av forfatteren. Det er bevis på at generelle subjektive vurderinger er mer gyldige og pålitelige enn vurderinger for individuelle detaljer i en tegning.

I USSR "N. h." t. ble opprinnelig brukt i klinisk og psykologisk forskning. De formelle aspektene ved tegningene ble hovedsakelig analysert, for eksempel størrelsen på figuren, dens plassering på et papirark, graden av fullstendighet av tegningen osv. (Yu. S. Savenko, 1970). Resultatene oppnådd under undersøkelsen av pasienten korrelerte med det kliniske bildet av sykdommen, og beriket og klargjorde ideen om pasienten. Siden 1990-tallet har omfanget av testen blitt betydelig utvidet, og det er forsket mye innen utviklings- og pedagogisk psykologi.

SPØRRESKJEMA FOR FORORDNINGER AV MENTAL TILPASNING(NPA) - personlighetsspørreskjema, utviklet av A. I. Skorik og L. S. Sverdlov i 1993. Designet for foreløpig diagnose av adaptive lidelser.

Teknikken er screening i naturen (se. sikting). En studie utført ved hjelp av NPA lar deg få en generell ide om tilstedeværelsen eller fraværet av manifestasjoner av mental feiltilpasning, deres hovedtrekk. Kravene til denne typen akselerert diagnostikk avgjorde det lille volumet av spørreskjemaet og enkelheten ved å behandle primærdata.

Norsk Folkehjelps spørreskjema består av 37 utsagn knyttet til fagets personlige egenskaper og psykologiske egenskaper, tilstanden til den somatiske sfæren, ideer om psykisk helse og oppfatningen av enkelte hverdagsproblemer. Spørreskjemaoppgaver krever bare bekreftende eller negative svar ("ja" - "nei", "sant" - "usant", "enig" - "uenig"). «Jeg vet ikke» er ikke tillatt. Spørreskjemaet kan brukes til individuelle og gruppeeksamener. Primærkarakterer beregnes i henhold til "nøkkelen", separat for 6 skalaer i spørreskjemaet. Et trekk ved primærbehandlingen er at ikke bare antall treff med nøkkelen beregnes med en poengsum på 1 poeng for hver kamp, ​​men de spesifikke vektene til hvert av svarene som samsvarer med nøkkelverdien summeres (se fig. indre konsistens). Vektverdien til hver vare ble beregnet basert på definisjonen av faktorbelastningen (se fig. Faktor analyse) gitt svar i tegnet målt med skalaen. Beregningen er gjort på en slik måte at vektene til elementene uttrykkes som heltall fra 1 til 9. Råskårer konverteres til standard T-skårer (se. Karakterskala). Resultatene presenteres grafisk på et spesielt skjema i skjemaet profilvurderinger.

Skalaene til spørreskjemaet ble utviklet på grunnlag av resultatene fra en faktoranalyse av det primære statistiske materialet innhentet i de respektive kliniske forsøksgruppene: 1. (B) Beskriver opplevelsen av generell fysisk og mental komfort. Normalt, i tilpassede fag, har poengsummen på denne skalaen en tendens til å øke. 2. (H) "hypokondri"-skalaen gjenspeiler graden av fiksering på somatisk nød. Ved brudd på tilpasning øker poengsummen på denne skalaen. 3. (M) Skalaen til "hypomanisk" - fikser en følelse av komfort med et snev av eufori, "tvungen velvære", uforsiktighet. Hvis tilpasningen er svekket, reduseres poengsummen. 4. (P) Skalaen beskriver den depressive tilstanden. Resultatet korrelerer negativt med dataene på skalaen M. Normalt er det lav skår. 5. (N) Skalaen for "nevrotisisme" - beskriver tilstanden av effektiv-vegetativ ubalanse som oppstår med følelsesmessig stress, "nervøsitet". Ved brudd på tilpasning øker poengsummen. 6. (S) Skalaen fanger opp krenkelser innen sosiale relasjoner. I ujustert poengsum øker.

Ved tolkning av LPA-data er analysen av "profilen" av primær betydning. Sammen med dette foreslår forfatterne enkle formelle kriterier for diagnostisering av mistilpasning. Den enkleste av disse er kriteriet basert på høyden på profilen. Disadaptation oppstår hvis skårene til minst to skalaer overstiger 70 T eller faller under 30 T, eller en av skalaene overstiger 80 T eller faller under 20 T. I følge forfatterne er sannsynligheten for ikke å oppdage en reell mistilpasning bare 5 %. Sannsynligheten for at tilstrekkelig tilpassede individer vil bli klassifisert som feiltilpassede er imidlertid 22,5 %. Dette gjør dette kriteriet til liten nytte, spesielt når man utfører masseepidemiologiske studier. Mer komplekst og nøyaktig (10 % sannsynlighet for at den tilpassede blir klassifisert som mistilpasset) er et kriterium som tar hensyn til det differensierte resultatet etter «trivselsskalaene» (B, M) og «ulempeskalaene» (H, D) , N, S). Disadaptasjon diagnostiseres når B + M er 79 T eller når summen av H, D, N og S overstiger 255 T. Sammenlignende studier av materialet kontrastgrupper viste en høy korrelasjon av det komplekse kriteriet mistilpasning med en bekreftet diagnose (r= 0,85, R< 0,001).

Test pålitelighet på nytt NPA (med et retestintervall på 1 dag) på ulike skalaer svinger i intervallet r t = 0,74-0,90. Det er informasjon om gyldigheten av strømmen som ble studert ved å sammenligne data fra kontrasterende grupper (grupper av mentalt friske tilstrekkelig tilpasset, mentalt friske med tilpasningsforstyrrelser og pasienter med nevrose-lignende tilstander). Informasjon om påliteligheten og validiteten til NPA-spørreskjemaet gir grunnlag for å anta effektiviteten av teknikken ved individuell og massescreening av tilstander av mental mistilpasning.

IKKE EKSISTERENDE DYR- projektiv teknikk personlighetsstudier; foreslått av M. 3. Drukarevich.

Observanden blir bedt om å finne på og tegne et ikke-eksisterende dyr, samt gi det et navn som ikke fantes tidligere. Fra den tilgjengelige litteraturen kan det ses at undersøkelsesprosedyren ikke er standardisert (ark med tegnepapir i forskjellige størrelser brukes, i noen tilfeller er tegningen utført med fargeblyanter, i andre - med én farge osv.). Det finnes ikke et generelt akseptert system for å vurdere en tegning. De teoretiske forutsetningene som ligger til grunn for etableringen av metodikken, er sammenfallende med andre projektive metoder. Som mange andre tegnetester, N. Zh. Det er rettet mot å diagnostisere personlige egenskaper, noen ganger dets kreative potensialer.

Tilfredsstillende gyldighet konvergent metoder ved å etablere en sammenheng mellom resultatene oppnådd med dens hjelp og dataene fra andre personlige metoder basert på undersøkelse av pasienter i en psykiatrisk klinikk og personer som gjennomgår faglig utvalg i personalet i innenriksdepartementet (P. V. Yanshin, 1988, 1990 ). Gyldighet også bekreftet i differensiering av pasienter med nevrose og friske (T. I. Krasko, 1995). N. - en av de mest populære tegneteknikkene og er mye brukt av CIS-psykologer når de undersøker barn og voksne, syke og friske, oftest som en orienteringsteknikk, det vil si en hvis data lar oss fremsette noen hypoteser om personlighetstrekk.

NORMAL DISTRIBUSJON- type fordeling av variabler. N. r. observert når et tegn (variabel) endres under påvirkning av mange relativt uavhengige faktorer. Graf av ligningen N. r. er en symmetrisk unimodal klokkeformet kurve, hvis symmetriakse er den vertikale (ordinaten) trukket gjennom punktet 0 (Fig. 46).

Ris. 46. ​​Prosentvis fordeling av tilfeller under normalkurven

Kurve N. r. ble konstruert for en enkel omtrentlig løsning på problemet med sannsynlighet for hendelsesfrekvenser. Normalkurven er beskrevet av de Moivre-formelen

U- høyden på kurven over hver gitt verdi x jeg, - gjennomsnitt x i, - standardavvik fra .

Teoretisk sett er det et uendelig sett med normale kurver med konstante verdier av M og σ. På standardisering testresultater og i noen andre tilfeller N. p. med følgende egenskaper: M = 0; σ= 1; arealet under normalkurven er lik enhet. Denne fordelingen kalles standard (enkelt) N. p. For enhver N. r. innenfor x 1 verdier. M + σ ligger ca. 68 %, innenfor M ± 2σ - 95 %, M ± 3σ - 99,7 % av arealet under kurven. Frekvensen av tilfeller som passer inn i intervallene begrenset av verdier fra M ± σ til M ± σ er 68,26%; 95,44%; 99,72%; 99,98 % henholdsvis (fig. 46). Kurvehøyde (U) over M-verdien er omtrent lik 0,3989. Asymmetrien til standarden, som enhver annen normal, kurve er null, kurtosis (Q) er tre (se fig. Estimat av type distribusjon). Fordelingen av indikatorer oppnådd i empiriske psykologiske og psykodiagnostiske studier med et stort antall observasjoner, nærmer seg som regel N. p.

I praksis spiller beregningen av arealet til venstre for ethvert punkt på abscisseaksen, avgrenset av et segment av normalkurven og ordinaten til dette punktet, en viktig rolle. Siden området til en standard N. p. er lik én, så gjenspeiler andelen av dette området hyppigheten av saker med x jeg, mindre enn den gitte verdien på aksen x. Løsning av de Moivre-ligningen for en hvilken som helst verdi X upraktisk derfor å bestemme området til venstre for en gitt verdi i forskjellige N. p. (langs aksen z) det er spesielle tabeller (se tabell 1 i vedlegg III).

Den viktigste kvaliteten til N. elv. er at familien av normalkurver er preget av de samme proporsjonene av områder som ligger under seksjonene avgrenset av like verdier av σ. Dessuten kan enhver normalkurve reduseres til en enkelt og dermed svare på spørsmålet om arealet mellom de valgte punktene på kurven eller høyden på kurven over et hvilket som helst av punktene på aksen x. Formen på normalkurven endres ikke når gjennomsnittet trekkes fra og divideres med σ. Så hvis du trenger å finne ut hvilken del av området som ligger til venstre for verdien x = x l

Området til venstre for z for denne verdien vil være 0,1020 (10,2%). Derfor er antallet personer med en skåre under 8,3 89,8 %, og antallet personer med en skår i området 8,3-10,4 er 97,5-89,8 = 7,7 %.

Antall tilfeller innenfor standardavviket kan enkelt bestemmes uten beregninger. Dermed er 13,6 % av de spurte i estimatområdet tilsvarende -2 og - (se fig. 46).

Variansanalyse er en statistisk metode designet for å vurdere påvirkningen av ulike faktorer på resultatet av et eksperiment, samt for den påfølgende planleggingen av lignende eksperimenter.

Opprinnelig (1918) ble variansanalyse utviklet av den engelske matematikeren og statistikeren R.A. Fisher for å behandle resultatene av agronomiske eksperimenter for å identifisere forholdene for å oppnå maksimalt utbytte av ulike varianter av avlinger.

Når du setter opp et eksperiment, må følgende betingelser være oppfylt:

    Hver variant av eksperimentet må utføres på flere observasjonsenheter (dyregrupper, feltseksjoner, etc.)

    Fordelingen av observasjonsenheter mellom variantene av opplevelsen bør være tilfeldig, ikke tilsiktet.

Bruk av variansanalyse F-kriterium(R.A. Fishers kriterium), som representerer forholdet mellom to varianser:

der d er et faktum, er d henholdsvis den faktorielle (intergruppe) og gjenværende (intragruppe) spredning per en frihetsgrad.

Faktorial- og restavvikene er estimater av populasjonsvariansen, beregnet ut fra utvalgsdata, tatt i betraktning antall frihetsgrader.

Faktor (intergruppe) varians forklarer variasjonen av den resulterende egenskapen under påvirkning av den studerte faktoren.

Residuell (intragruppe) varians forklarer variasjonen av den effektive egenskapen på grunn av påvirkningen fra andre faktorer (med unntak av påvirkningen av den studerte faktoren).

I sum gir faktor- og restvariansene den totale variansen, som uttrykker påvirkningen av alle faktorkarakteristikker på den effektive.

Prosedyren for å utføre variansanalysen:

1. Eksperimentelle data legges inn i beregningstabellen og summene og gjennomsnittsverdiene i hver gruppe av den studerte befolkningen, samt totalmengde og gjennomsnittsverdi for hele populasjonen bestemmes (tabell 1).

Tabell 1

Verdien av det resulterende attributtet for den i-te enheten

i den j-te gruppen, x ij

Antall observasjoner, f j

Gjennomsnitt (gruppe og totalt), x j

x 11, x 12, ..., x 1 n

x 21, x 22, ..., x 2 n

x m 1 , x m 2 , …, x mn

Totalt antall observasjoner n beregnes som summen av antall observasjoner f j i hver gruppe:

Hvis antall elementer i alle grupper er det samme, er det totale gjennomsnittet er funnet fra gruppen betyr som et enkelt aritmetisk gjennomsnitt:

Hvis antall elementer i grupper er forskjellig, er det totale gjennomsnittet beregnet med formelen til det aritmetiske vektede gjennomsnittet:

2. Den totale variansen bestemmes D vanlig som summen av kvadrerte avvik for de individuelle verdiene til det resulterende attributtet fra det totale gjennomsnittet :

3. Den faktorielle (mellom grupper) variansen beregnes D faktum som summen av de kvadrerte avvikene til gruppen betyr fra det totale gjennomsnittet multiplisert med antall observasjoner:

4. Verdien av gjenværende (intragruppe) dispersjon bestemmes D ost som differansen mellom totalen D vanlig og faktoriell D faktum dispersjoner:

5. Antall frihetsgrader for faktoren
varians som forskjellen mellom antall grupper m og enhet:

6. Antall frihetsgrader for restdispersjonen bestemmes
som forskjellen mellom antall individuelle funksjonsverdier n og antall grupper m:

7. Verdien av faktorspredningen per en frihetsgrad beregnes d faktum som forholdet mellom faktoravvik D faktum til antall frihetsgrader for faktorvariansen
:

8. Verdien av restdispersjonen per en frihetsgrad bestemmes d ost som et forhold mellom gjenværende varians D ost til antall frihetsgrader for restdispersjonen
:

9. Den beregnede verdien av F-kriteriet bestemmes F-beregnet som forholdet mellom faktorvarians per frihetsgrad d faktum til restspredning per en frihetsgrad d ost :

10. I henhold til tabellen over Fishers F-kriterium, tatt i betraktning signifikansnivået vedtatt i studien, samt hensyntatt frihetsgradene for faktorial- og residualvariansene, finnes den teoretiske verdien F bord .

5 % signifikansnivå tilsvarer 95 % sannsynlighetsnivå, 1 % - til 99 % sannsynlighetsnivå. I de fleste tilfeller brukes et signifikansnivå på 5 %.

teoretisk verdi F bord på et gitt signifikansnivå bestemmes de fra tabeller i skjæringspunktet mellom en rad og en kolonne som tilsvarer to grader av variansfrihet:

på linjen - gjenværende;

etter kolonne - faktoriell.

11. Resultatene av beregningene er satt opp i en tabell (tabell 2).

Metodene ovenfor for å teste statistiske hypoteser om betydningen av forskjeller mellom to gjennomsnitt i praksis er av begrenset nytte. Dette skyldes det faktum at for å identifisere effekten av alle mulige forhold og faktorer på den resulterende egenskapen, utføres felt- og laboratorieeksperimenter som regel ved å bruke ikke to, men et større antall prøver (1220 eller flere) ).

Ofte sammenligner forskere middelene til flere prøver kombinert til et enkelt kompleks. For eksempel, når man studerer effekten av ulike typer og doser gjødsel på avlinger, gjentas eksperimenter i forskjellige versjoner. I disse tilfellene blir parvise sammenligninger tungvint, og den statistiske analysen av hele komplekset krever bruk av en spesiell metode. Denne metoden, utviklet i matematisk statistikk, kalles variansanalyse. Den ble først brukt av den engelske statistikeren R. Fisher ved behandling av resultatene av agronomiske eksperimenter (1938).

Analyse av varianter- dette er en metode for statistisk vurdering av påliteligheten til manifestasjonen av avhengigheten av den effektive funksjonen av en eller flere faktorer. Ved hjelp av variansanalysemetoden testes statistiske hypoteser angående gjennomsnittene i flere generelle populasjoner som har normalfordeling.

Variansanalyse er en av hovedmetodene for statistisk evaluering av resultatene av et eksperiment. Det brukes også i økende grad i analyse av økonomisk informasjon. Variansanalysen gjør det mulig å fastslå hvordan selektive indikatorer på sammenhengen mellom de effektive tegnene og faktortegnene er tilstrekkelige til å spre data innhentet fra utvalget til den generelle populasjonen. Fordelen med denne metoden er at den gir ganske pålitelige konklusjoner fra små prøver.

Ved å undersøke variasjonen av den resulterende attributten under påvirkning av en eller flere faktorer, ved bruk av variansanalyse, kan man, i tillegg til generelle estimater av betydningen av avhengigheter, også få en vurdering av forskjellene i gjennomsnittsverdiene som dannes på ulike nivåer av faktorer, og betydningen av samspillet mellom faktorer. Dispersjonsanalyse brukes til å studere avhengighetene av både kvantitative og kvalitative egenskaper, samt deres kombinasjon.

Essensen av denne metoden ligger i den statistiske studien av sannsynligheten for påvirkning av en eller flere faktorer, samt deres interaksjon på den effektive funksjonen. Følgelig løses tre hovedoppgaver ved hjelp av variansanalysen: 1) en generell vurdering av betydningen av forskjeller mellom gruppegjennomsnitt; 2) vurdering av sannsynligheten for interaksjon av faktorer; 3) vurdering av betydningen av forskjeller mellom middelpar. Oftest må forskere løse slike problemer når de utfører felt- og zootekniske eksperimenter, når påvirkningen av flere faktorer på den resulterende egenskapen studeres.

Prinsippskjemaet for spredningsanalyse inkluderer etablering av hovedkildene til variasjon av den effektive funksjonen og bestemmelse av volumet av variasjon (summer av kvadrerte avvik) av kildene til dens dannelse; bestemmelse av antall frihetsgrader som tilsvarer komponentene i den totale variasjonen; beregning av varianser som forholdet mellom de tilsvarende variasjonsvolumene og deres antall frihetsgrader; analyse av forholdet mellom dispersjoner; vurdering av påliteligheten av differansen mellom gjennomsnittene og formuleringen av konklusjoner.

Dette skjemaet er bevart både i enkle ANOVA-modeller, når data er gruppert i henhold til én attributt, og i komplekse modeller, når data er gruppert i henhold til to eller flere attributter. Imidlertid, med en økning i antall gruppekarakteristikker, blir prosessen med dekomponering av den generelle variasjonen i henhold til kildene til dens dannelse mer komplisert.

I følge det skjematiske diagrammet kan variansanalysen representeres som fem påfølgende trinn:

1) definisjon og dekomponering av variasjon;

2) fastsettelse av antall grader av variasjonsfrihet;

3) beregning av dispersjoner og deres forhold;

4) analyse av dispersjoner og deres forhold;

5) vurdering av påliteligheten av forskjellen mellom middel og formulering av konklusjoner om testing av nullhypotesen.

Den mest tidkrevende delen av variansanalysen er den første fasen - definisjonen og dekomponeringen av variasjonen av kildene til dens dannelse. Rekkefølgen for utvidelse av det totale variasjonsvolumet ble diskutert i detalj i kapittel 5.

Grunnlaget for å løse problemene med spredningsanalyse er loven om ekspansjon (tillegg) av variasjon, i henhold til hvilken den totale variasjonen (svingninger) av den resulterende egenskapen er delt inn i to: variasjonen på grunn av virkningen av den studerte faktoren (faktorer) ), og variasjonen forårsaket av virkningen av tilfeldige årsaker, det vil si

Anta at populasjonen som studeres er delt inn i flere grupper i henhold til en faktorattributt, som hver er preget av sin gjennomsnittlige verdi av den effektive attributten. Samtidig kan variasjonen av disse verdiene forklares av to typer årsaker: de som virker systematisk på den effektive funksjonen og kan justeres i løpet av eksperimentet, og de som ikke kan justeres. Det er åpenbart at intergruppe (faktoriell eller systematisk) variasjon hovedsakelig avhenger av virkningen av den studerte faktoren, og intragruppe (residuell eller tilfeldig) - på virkningen av tilfeldige faktorer.

For å vurdere betydningen av forskjeller mellom gruppemidler, er det nødvendig å bestemme intergruppe- og intragruppevariasjonene. Hvis intergruppe (faktoriell) variasjon betydelig overstiger intragruppe (rest) variasjonen, påvirket faktoren den resulterende egenskapen, og endret verdiene til gruppegjennomsnittene betydelig. Men spørsmålet oppstår, hva er forholdet mellom intergruppe og intragruppe variasjoner kan anses som tilstrekkelig for konklusjonen om reliabiliteten (signifikansen) av forskjeller mellom gruppemiddelene.

For å vurdere betydningen av forskjeller mellom middelene og formulere konklusjoner om testing av nullhypotesen (H0: x1 = x2 = ... = xn), bruker variansanalysen en slags standard - G-kriteriet, fordelingsloven til som ble etablert av R. Fisher. Dette kriteriet er forholdet mellom to varianser: faktoriell, generert av virkningen av faktoren som studeres, og gjenværende, på grunn av virkningen av tilfeldige årsaker:

Dispersjonsforhold r = t>u : £ * 2 av den amerikanske statistikeren Snedecor foreslått å bli betegnet med bokstaven G til ære for oppfinneren av variansanalysen R. Fisher.

Dispersjoner °2 io2 er estimater av variansen til den generelle befolkningen. Hvis prøver med varianser på °2 °2 er laget fra samme generelle populasjon, hvor variasjonen i verdier var tilfeldig, så er avviket i verdiene på °2 °2 også tilfeldig.

Hvis eksperimentet kontrollerer påvirkningen av flere faktorer (A, B, C, etc.) på den effektive funksjonen samtidig, bør spredningen på grunn av virkningen til hver av dem være sammenlignbar med °f.eks, det er

Hvis verdien av faktoravviket er betydelig større enn restverdien, påvirket faktoren den resulterende attributten betydelig og omvendt.

I multifaktorielle eksperimenter, i tillegg til variasjonen på grunn av virkningen av hver faktor, er det nesten alltid en variasjon på grunn av samspillet mellom faktorer ($av: ^ls ^ss $liіs). Essensen av interaksjonen er at effekten av en faktor endres betydelig på forskjellige nivåer av den andre (for eksempel effektiviteten av jordkvalitet ved forskjellige doser gjødsel).

Samspillet mellom faktorer bør også vurderes ved å sammenligne de respektive variansene 3 ^w.gr:

Ved beregning av den faktiske verdien av B-kriteriet tas den største av variansene i telleren, derfor B > 1. Det er klart at jo større B-kriteriet er, desto større er forskjellene mellom variansene. Hvis B = 1, fjernes spørsmålet om å vurdere betydningen av forskjeller i varians.

For å bestemme grensene for tilfeldige fluktuasjoner utviklet variansforholdet G. Fisher spesielle tabeller over B-fordelingen (vedlegg 4 og 5). Kriterium B er funksjonelt relatert til sannsynlighet og avhenger av antall grader av variasjonsfrihet k1 og k2 av de to sammenlignede variansene. To tabeller brukes vanligvis for å trekke konklusjoner om maksimalverdien av kriteriet for signifikansnivåer på 0,05 og 0,01. Et signifikansnivå på 0,05 (eller 5%) betyr at kun i 5 tilfeller av 100 kan kriterium B få en verdi lik eller høyere enn den som er angitt i tabellen. En reduksjon i signifikansnivået fra 0,05 til 0,01 fører til en økning i verdien av kriteriet B mellom to varianser på grunn av virkningen av kun tilfeldige årsaker.

Verdien av kriteriet avhenger også direkte av antall frihetsgrader til de to sammenlignede dispersjonene. Hvis antallet frihetsgrader har en tendens til uendelig (k-me), så tenderer forholdet mellom ville for to dispersjoner til enhet.

Tabellverdien til kriterium B viser en mulig tilfeldig verdi av forholdet mellom to varianser ved et gitt signifikansnivå og det tilsvarende antall frihetsgrader for hver av de sammenlignede variansene. I disse tabellene er verdien av B gitt for prøver laget fra samme generelle populasjon, der årsakene til endringen i verdiene kun er tilfeldige.

Verdien av G er funnet fra tabellene (vedlegg 4 og 5) i skjæringspunktet mellom den tilsvarende kolonnen (antall frihetsgrader for en større spredning - k1) og raden (antall frihetsgrader for en mindre spredning - k2). Så hvis den største variansen (teller G) k1 = 4, og den minste (nevneren G) k2 = 9, vil Ga på et signifikansnivå a = 0,05 være 3,63 (ca. 4). Så, som et resultat av virkningen av tilfeldige årsaker, siden prøvene er små, kan variansen til en prøve, ved et 5 % signifikansnivå, overstige variansen for den andre prøven med 3,63 ganger. Med en reduksjon i signifikansnivået fra 0,05 til 0,01 vil tabellverdien til kriteriet D, som nevnt ovenfor, øke. Så, med de samme frihetsgradene k1 = 4 og k2 = 9 og a = 0,01, vil tabellverdien til kriteriet G være 6,99 (ca. 5).

Vurder prosedyren for å bestemme antall frihetsgrader i variansanalysen. Antallet frihetsgrader, som tilsvarer den totale summen av kvadrerte avvik, dekomponeres i de tilsvarende komponentene på samme måte som dekomponeringen av summene av kvadrerte avvik (k1) og intragruppe (k2) variasjoner.

Altså hvis en utvalgspopulasjon bestående av N observasjoner delt på t grupper (antall eksperimentalternativer) og P undergrupper (antall repetisjoner), da vil henholdsvis antall frihetsgrader k være:

a) for den totale summen av kvadrerte avvik (dszar)

b) for intergruppesummen av kvadrerte avvik ^m.gP)

c) for intragruppesummen av kvadrerte avvik i w.gr)

I henhold til tilleggsregelen for variasjon:

For eksempel, hvis fire varianter av eksperimentet ble dannet i eksperimentet (m = 4) i fem repetisjoner hver (n = 5), og det totale antallet observasjoner N = = t o p \u003d 4 * 5 \u003d 20, da er antall frihetsgrader, henholdsvis lik:

Når du kjenner summene av kvadrerte avvik av antall frihetsgrader, er det mulig å bestemme objektive (justerte) estimater for tre varianser:

Nullhypotesen H0 etter kriterium B testes på samme måte som ved Students u-test. For å ta en beslutning om å kontrollere H0, er det nødvendig å beregne den faktiske verdien av kriteriet og sammenligne den med tabellverdien Ba for det aksepterte signifikansnivået a og antall frihetsgrader k1 og k2 for to dispersjoner.

Hvis Bfakg > Ba, så, i samsvar med det aksepterte signifikansnivået, kan vi konkludere med at forskjellene i utvalgsvarianser ikke bare bestemmes av tilfeldige faktorer; de er betydelige. I dette tilfellet forkastes nullhypotesen og det er grunn til å tro at faktoren påvirker den resulterende egenskapen betydelig. Hvis< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Bruken av en eller annen ANOVA-modell avhenger både av antall studerte faktorer og av prøvetakingsmetoden.

Avhengig av antall faktorer som bestemmer variasjonen av den effektive funksjonen, kan prøver dannes av én, to eller flere faktorer. I følge denne analysen er variansen delt inn i enkeltfaktor og multifaktor. Ellers kalles det også et enkeltfaktor- og multifaktordispersjonskompleks.

Opplegget for dekomponering av den generelle variasjonen avhenger av dannelsen av gruppene. Det kan være tilfeldig (observasjoner av en gruppe er ikke relatert til observasjonene til den andre gruppen) og ikke-tilfeldige (observasjoner av to prøver er sammenkoblet av de vanlige betingelsene for eksperimentet). Følgelig oppnås uavhengige og avhengige prøver. Uavhengige prøver kan dannes med både like og ujevne tall. Dannelsen av avhengige prøver antar deres like antall.

Hvis gruppene er dannet i en ikke-voldelig rekkefølge, inkluderer den totale mengden variasjon av den resulterende egenskapen, sammen med den faktorielle (intergruppe) og gjenværende variasjonen, variasjonen av repetisjoner, dvs.

I praksis er det i de fleste tilfeller nødvendig å vurdere avhengige utvalg når forholdene for grupper og undergrupper er utjevnet. Så i felteksperimentet er hele området delt inn i blokker, med de mest levedyktige forholdene. Samtidig får hver variant av eksperimentet like muligheter til å være representert i alle blokker, noe som oppnår utjevning av betingelsene for alle testede alternativer, erfaring. Denne metoden for å konstruere erfaring kalles metoden for randomiserte blokker. Eksperimenter med dyr utføres på samme måte.

Ved behandling av sosioøkonomiske data ved hjelp av metoden for spredningsanalyse, må det tas i betraktning at på grunn av det rike antallet faktorer og deres innbyrdes sammenheng, er det vanskelig, selv med den mest omhyggelige tilpasningen av forholdene, å fastslå graden av objektiv påvirkning av hver enkelt faktor på den effektive egenskapen. Derfor bestemmes nivået av gjenværende variasjon ikke bare av tilfeldige årsaker, men også av betydelige faktorer som ikke ble tatt i betraktning ved bygging av ANOVA-modellen. Som et resultat blir restspredningen som sammenligningsgrunnlag noen ganger utilstrekkelig for formålet, den er klart overvurdert i størrelsesorden og kan ikke fungere som et kriterium for betydningen av påvirkning av faktorer. I denne forbindelse, når du bygger modeller for spredningsanalyse, blir problemet med å velge de viktigste faktorene og utjevne betingelsene for manifestasjonen av handlingen til hver av dem relevant. I tillegg. bruken av variansanalyse forutsetter en normal eller nær normalfordeling av de statistiske populasjonene som studeres. Hvis denne betingelsen ikke er oppfylt, vil estimatene som er oppnådd i variansanalysen bli overdrevet.

Analyse av varians - analyse av variasjonen til den resulterende egenskapen under påvirkning av kontrollerte variable faktorer. (I utenlandsk litteratur kalles det ANOVA - "Analisis of Variance").

Den effektive egenskapen kalles også den avhengige egenskapen, og de påvirkningsfaktorene kalles uavhengige funksjoner.

Begrensning av metoden: uavhengige trekk kan måles på en nominell, ordinær eller metrisk skala, avhengige trekk kan kun måles på en metrisk skala. For å utføre variansanalyse skilles det ut flere graderinger av faktorkarakteristikker, og alle prøveelementene er gruppert i samsvar med disse graderingene.

Formulering av hypoteser i variansanalyse.

Nullhypotese: "Gjennomsnittsverdiene for den effektive funksjonen under alle forhold til faktoren (eller faktorgraderingene) er de samme."

Alternativ hypotese: "Gjennomsnittsverdiene for den effektive egenskapen under forskjellige forhold for faktorens handling er forskjellige."

Variansanalyse kan deles inn i flere kategorier avhengig av:

på antall vurderte uavhengige faktorer;

på antall effektive variabler underlagt virkningen av faktorer;

på arten, arten av innhenting og tilstedeværelsen av forholdet til de sammenlignede utvalgene av verdier.

I nærvær av en faktor, hvis påvirkning blir studert, kalles variansanalysen enfaktoranalyse, og er delt inn i to varianter:

- Analyse av urelaterte (det vil si forskjellige) prøver . For eksempel løser en gruppe respondenter problemet i stillhet, den andre - i et støyende rom. (I dette tilfellet vil forresten nullhypotesen høres slik ut: "gjennomsnittlig tid for å løse problemer av denne typen vil være den samme i stillhet og i et støyende rom," det vil si at den ikke avhenger av støyen faktor.)

- Relatert prøveanalyse , det vil si to målinger tatt på samme gruppe respondenter under forskjellige forhold. Samme eksempel: første gang ble oppgaven løst i stillhet, den andre - en lignende oppgave - i nærvær av støyinterferens. (I praksis bør slike eksperimenter behandles med forsiktighet, siden en uoversiktlig «lærbarhet»-faktor kan spille inn, hvis påvirkning forskeren risikerer å tilskrive en endring i forholdene, nemlig støy.)

Hvis samtidig påvirkning av to eller flere faktorer undersøkes, har vi å gjøre med multivariat variansanalyse, som også kan deles inn etter prøvetype.

Hvis flere variabler påvirkes av faktorer, så snakker vi om multivariat analyse . Å utføre multivariat variansanalyse er å foretrekke fremfor endimensjonal bare i tilfellet når de avhengige variablene ikke er uavhengige av hverandre og korrelerer med hverandre.

Generelt er oppgaven med variansanalyse å skille ut tre spesielle varianser fra den generelle variasjonen til en egenskap:

    variabilitet på grunn av virkningen av hver av de studerte uavhengige variablene (faktorer).

    variabilitet på grunn av interaksjonen mellom de studerte uavhengige variablene.

    Variabiliteten er tilfeldig, på grunn av alle uoppdagede omstendigheter.

For å vurdere variabiliteten på grunn av virkningen av de studerte variablene og deres interaksjon, beregnes forholdet mellom den tilsvarende indikatoren for variabilitet og tilfeldig variabilitet. En indikator på dette forholdet er F - Fishers kriterium.

Jo mer variasjonen til en egenskap skyldes virkningen av påvirkningsfaktorer eller deres interaksjon, jo høyere er empiriske verdier av kriteriet .

Til kriterieberegningsformelen estimater av varianser er inkludert, og derfor tilhører denne metoden kategorien parametriske.

En ikke-parametrisk analog av enveis variansanalyse for uavhengige prøver er Kruskal-Wallace-testen. Den ligner på Mann-Whitney-testen for to uavhengige prøver, bortsett fra at den summerer rangeringene for hver av grupper.

I tillegg kan mediankriteriet brukes i variansanalysen. Ved bruk, for hver gruppe, bestemmes antall observasjoner som overstiger medianen beregnet for alle grupper, og antall observasjoner som er mindre enn medianen, hvoretter det bygges en todimensjonal beredskapstabell.

Friedmans test er en ikke-parametrisk generalisering av den sammenkoblede t-testen når det gjelder prøver med gjentatte mål, når antallet sammenlignede variabler er mer enn to.

I motsetning til korrelasjonsanalyse går forskeren i variansanalyse ut fra antakelsen om at noen variabler virker påvirkende (kalt faktorer eller uavhengige variabler), mens andre (resulterende tegn eller avhengige variabler) påvirkes av disse faktorene. Selv om en slik antakelse ligger til grunn for de matematiske beregningsprosedyrene, krever den likevel forsiktighet med å utlede årsak og virkning.

For eksempel, hvis vi legger frem en hypotese om avhengigheten av suksessen til en tjenestemann av faktoren H (sosialt mot ifølge Cattell), så er det motsatte ikke utelukket: det sosiale motet til respondenten kan oppstå (øke) som en resultat av suksessen til arbeidet hans - dette er på den ene siden. På den annen side, bør man være klar over nøyaktig hvordan "suksess" ble målt? Hvis det ikke var basert på objektive egenskaper (nå fasjonable "salgsvolumer", etc.), men på ekspertvurderinger av kolleger, er det en mulighet for at "suksess" kan erstattes av atferdsmessige eller personlige egenskaper (vilje, kommunikativ, ekstern manifestasjoner av aggressivitet etc.).

Analyse av varianter- en metode for statistisk forskning, ved hjelp av hvilken påvirkningen av individuelle faktorer på ytelsesindikatoren studeres. Den lar deg velge én blant mange faktorer og evaluere dens innvirkning på variasjonen av det resulterende attributtet og påvirkningen av alle andre faktorer i aggregatet på variasjonen av det resulterende attributtet.

Hensikten med variansanalysen er å teste betydningen av forskjellen mellom middelene ved å sammenligne variansene. Variansen til det målte attributtet dekomponeres i uavhengige termer, som hver karakteriserer påvirkningen av en bestemt faktor eller deres interaksjon. Den påfølgende sammenligningen av slike termer lar oss vurdere betydningen av hver faktor som studeres, så vel som deres kombinasjon.

Stadier av variansanalyse:

1. Et sett med faktorer som potensielt påvirker Y bestemmes.

2. Av alle faktorene er det én hovedfaktor som skiller seg ut.

3. Grupperingen av hele settet med data utføres i henhold til valgt attributt (nummer, intervall).

4. Den totale variansen Y beregnes (for hele populasjonen): .

5. Intergruppespredningen beregnes - den karakteriserer variasjonen av Y under påvirkning av faktoren som ligger til grunn for grupperingen:
,

hvor: n j er volumet til gruppen; - gjennomsnittsverdien av egenskapen i gruppen.

6. Variasjon Y under påvirkning av andre faktorer estimeres ved å bruke gjennomsnittet av intragruppedispersjoner:
.

7. Verifikasjon: summen av intergruppevariansen og gjennomsnittet av intragruppevariansene må være lik den totale variansen (variansaddisjonsteoremet):
.

8. Riktigheten av valget av faktoren blir evaluert ved å bruke de relative variasjonsindikatorene:

– bestemmelseskoeffisient:
- karakteriserer andelen av variasjonen Y på grunn av faktorens påvirkning (for eksempel 70% - dvs. 70% av variasjonen Y skyldes påvirkningen av faktoren);

– empirisk korrelasjonsrelasjon:
- karakteriserer tettheten til forbindelsen (i henhold til Chaddock-skalaen).

Som regel utføres variansanalyse på en iterativ måte, når påvirkningen av faktorer på Y analyseres sekvensielt inntil de viktigste faktorene er bestemt.

30. Bruke indeksmetoden i analyse av økonomisk informasjon

Indeks- en relativ indikator som karakteriserer endringen i størrelsen på et fenomen i tid, i rom eller i sammenligning med et hvilket som helst stadium.

Indeksmetode- en metode for statistisk forskning, som karakteriserer utviklingen av et fenomen i tid, i rom, sammenlignet med standarden, og studerer også rollen til faktorer i å endre komplekse fenomener.

Statistisk indeks- dette er den relative verdien av å sammenligne komplekse aggregater og deres individuelle enheter ved å sammenligne absolutte verdier.

Grunnlaget for indeksmetoden for å bestemme endringer i produksjon og sirkulasjon av varer er overgangen fra den naturlig-materielle uttrykksformen for varemasser til kostnads- (penge-)målere. Det er gjennom det monetære uttrykket for verdien av individuelle varer at deres uforlignbarhet som forbrukerverdier elimineres og enhet oppnås.

Ved beregning av indekser, alloker:

- sammenlignbart nivå (nivået for inneværende periode, gitt foretak);

- sammenligningsgrunnlaget (nivået på basisperioden, det planlagte nivået, nivået for c.-l. objektet).

Typer indekser:

1. Etter dekningsgrad: individuelt, generelt.

2. I henhold til sammenligningsgrunnlaget: dynamisk (endring i tid), territoriell.

3. Dynamisk: grunnleggende ( Jeg 1 = q 1 / q 0 ;Jeg 2 = q 2 / q 0 ) og kjede ( Jeg 1 = q 1 / q 0 ;Jeg 2 = q 2 / q 1 ).

4. Etter arten av studiens omfang: kvantitativ, kvalitativ.

5. I henhold til dekningen av fenomenet: konstant, variabel sammensetning.

6. Etter beregningsperiode: årlig, kvartalsvis..

Individuell- karakterisere endringen i individuelle enheter av den statistiske populasjonen eller egenskapene til populasjonsenheten. Telleren er det som studeres. Nevneren er basen den sammenlignes med.

,
,
,

Generell- karakterisere sammendragsresultatene av endringer i alle enheter i aggregatet:

For å karakterisere endringen: Jeg Q = Q 1 / Q 0 .

Samlet– telleren og nevneren inneholder sammenkoblede sett med elementer av de studerte populasjonene. Sammenliknbarheten til heterogene enheter oppnås ved å introdusere spesielle faktorer i indeksen - sammålinger. I dette tilfellet er verdien av co-meter både i telleren og i nevneren fast på samme nivå (base eller strøm):

(Paasche),
(Laspeyres) Jeg pq = Jeg R Jeg q. Deretter:
,
.

(Fischer).

Medium(bruker realøkonomiske kategorier som medmålinger):


(gjennomsnittlig harmonisk vektet form);


(aritmetisk vektet gjennomsnitt).

Variabel indeks,permanent sammensetning og strukturelle endringer - gjennomsnittlig lønnsomhet:

,
,

Absolutt endring av indikatorer under påvirkning av faktorer:

Δ pq = ∑ s 1 q 1 – ∑ s 0 q 0 .

Δ s = ∑ s 1 q 1 – ∑ s 0 q 1 .

Δ q = ∑ s 0 q 1 – ∑ s 0 q 0 .