Biografier Kjennetegn Analyse

Enveis variansanalyse på korrelasjonstabellen. Multivariat analyse av varians og strukturell ligningsmodellering

En-faktor variansmodell ser ut som

Hvor Xjj- verdien av variabelen som studeres oppnådd på g-nivå faktor (r = 1, 2,..., T) sååå serienummer (j- 1,2,..., p);/y - effekt på grunn av påvirkningen av faktorens i-te nivå; e^. - tilfeldig komponent, eller forstyrrelse forårsaket av påvirkning av ukontrollerbare faktorer, dvs. variasjon av en variabel innenfor et individnivå.

Under faktornivå refererer til et eller annet mål eller tilstand av det, for eksempel mengden gjødsel som tilføres, typen metallsmelting eller batch-antall deler, etc.

Grunnleggende premisser for variansanalyse.

1. Matematisk forventning om forstyrrelse ? (/ - er lik null for enhver i, de.

  • 2. Forstyrrelsene er gjensidig uavhengige.
  • 3. Dispersjonen av forstyrrelsen (eller variabelen Xy) er konstant for enhver ij> de.

4. Forstyrrelsen e# (eller variabelen Xy) har en normalfordelingslov N( 0; a 2).

Påvirkningen av faktornivåer kan være som fikset, eller systematisk(modell I), og tilfeldig(modell II).

La, for eksempel, det er nødvendig å finne ut om det er betydelige forskjeller mellom partier av produkter i henhold til en kvalitetsindikator, dvs. sjekk innflytelsen på kvaliteten til en faktor - et parti med produkter. Hvis vi inkluderer alle partier av råvarer i studien, er påvirkningen av nivået til en slik faktor systematisk (modell I), og konklusjonene som er oppnådd gjelder bare for de individuelle partiene som var involvert i studien; inkluderer vi kun en tilfeldig valgt del av partene, så er påvirkningen av faktoren tilfeldig (modell II). I multifaktorkomplekser er en blandet modell III mulig, der noen faktorer har tilfeldige nivåer, mens andre har faste nivåer.

La oss vurdere denne oppgaven mer detaljert. La det være T partier av produkter. Valgt fra hver batch tilsvarende p L, s 2 ,p t produkter (for enkelhets skyld antar vi det u = n 2 =... = pt = p). Vi presenterer verdiene til kvalitetsindikatoren til disse produktene i form av en observasjonsmatrise


Det er nødvendig å kontrollere betydningen av påvirkningen av produktpartier på kvaliteten.

Hvis vi antar at elementene i radene i observasjonsmatrisen er numeriske verdier (realiseringer) av tilfeldige variabler Xt, X 2 ,..., X t, uttrykke kvaliteten på produktene og ha en normalfordelingslov med matematiske forventninger, henholdsvis a v a 2, ..., en t og identiske varianser a 2, da denne oppgaven kommer ned til å teste nullhypotese #0: a v = a 2l = ... = EN t, utført i variansanalyse.

La oss betegne gjennomsnitt over en indeks med en stjerne (eller prikk) i stedet for en indeks. gjennomsnittlig kvaliteten på produktene i ith batch, eller gruppegjennomsnitt for ith-nivået til faktoren, tar formen

EN samlet gjennomsnitt -

La oss vurdere summen av kvadrerte avvik av observasjoner fra det totale gjennomsnittet x„:

eller Q = Q, + Q 2+ ?>з Siste termin

siden summen av avvik av verdiene til en variabel fra gjennomsnittet, dvs. ? 1.g y - x) er lik null. ) =x

Det første leddet kan skrives i skjemaet

Som et resultat får vi følgende identitet:

osv. _

Hvor Q = Y, X [ x ij _ x„, I 2 - general, eller full, summen av kvadrerte avvik; 7=1

Q, - n^, hvor Til 1; k (n -1) - frihetsgrader ^ -fordeling, 5 og I 7]- ^ -Fisher-kriterium. Eksempel 6.1. To hundre antakelse om at faktoren for presentasjonshastigheten til ord påvirker ytelsen til deres reproduksjon (data i tabellen Fig. 8.1). Løsningssekvens:

o Formulering av hypoteser.

H 0: hastighetsfaktoren er ikke mer uttalt enn tilfeldig; H 1: hastighetsfaktoren er mer uttalt enn tilfeldig.

o Kontrollere forutsetninger: parameter under utredning normal distribusjon; prøver urelatert identisk volumer; målinger på en forholdsskala.

o Definisjon empirisk kriterium G EMF er basert på å sammenligne kvadratene til kolonnesummene med summen av kvadratene av alle empiriske verdier. Hver kolonne representerer en prøve og tilsvarer en spesifikk gradering av hastighetsfaktoren.

o Introduserte betegnelser:

n= 6 - antall observasjoner (rader)

Til= 3 - antall faktorer (kolonner)

PC = 6-3 = 18 - total mengde individuelle verdier;

7 - radindeks varierer fra 1 til n(7 = 1, 2, ..., n)

Og- kolonneindeks varierer fra 1 til til (og= 1, 2, ..., k).

o Matematiske beregninger(se figur 6.1 6.2):

i = 1 7 = 1 p m kp^u = 1)

Det er 1 = 6 2 + syv 2 + 6 2 + 5 2 + _ + 5 2 + 5 2 = 432; og 2 = - (34 2 + +29 2 + 23 2) = 421;

og 3^^ (34 + 29 + 23) 2 = 410,89; 3 til 6

Ris. 6.1. Resultater Fig. 6.2. Beregningsformler

variansanalyse enveis variansanalyse

o Kritisk verdi^cr kan fås ved å bruke funksjonen

RRIST() for signifikansnivået for a = 0,05 (0,01) og antall frihetsgrader Til 1 = 3-1 = 2 og k (n -1) = 3 (6-1) = 15. G 0u05 ~ 3,68 og G 0u01 ~ 6,36.

o Beslutningstaking. Fordi ¥ GMP> P 0? 01(6,89>6,36), nullhypotese H 0 avvist på signifikansnivået 0,01.

o Formulering av konklusjoner. Forskjeller i volum av ordgjengivelse (hastighetsfaktor) er mer uttalt enn tilfeldig. Denne avhengigheten kan representeres grafisk i fig. 6.3.

Ris. 6.3. Avhengighet av gjennomsnittlig volum av reproduserte ord på presentasjonshastigheten

Beregninger av en enfaktormodell kan utføres ved å bruke pakken «Dataanalyse», avsnitt «Enfaktorvariansanalyse» (fig. 6.4).

Ris. 6.4. Meny for pakken "Dataanalyse" Etter å ha lagt inn de riktige parameterne (fig. 6.5), kan du få resultatene av enveisanalyse av varians (fig. 6.6).

Ris. 6.5. Dialogboks

Ris. 6.6. Resultater av enveis variansanalyse (a = 0,05)

Datapakken «Data Analysis» utfører beregninger av grunnleggende statistikk (summer, gjennomsnitt, varians, verdien av empiriske og teoretiske kriterier osv.), som gir forskeren grunnlag for statistiske konklusjoner.