Biografier Kjennetegn Analyse

Tester hypotesen om at gjennomsnittet er lik en viss verdi. Tester hypotesen om at gjennomsnittet er lik en gitt verdi a

8.1. Konseptet med avhengige og uavhengige utvalg.

Velge et kriterium for å teste en hypotese

bestemmes først og fremst av om prøvene som vurderes er avhengige eller uavhengige. La oss introdusere de tilsvarende definisjonene.

Def. Prøvene kalles selvstendig hvis prosedyren for å velge enheter i den første prøven på ingen måte er forbundet med prosedyren for å velge enheter i den andre prøven.

Et eksempel på to uavhengige utvalg vil være utvalgene diskutert ovenfor av menn og kvinner som jobber i samme virksomhet (i samme bransje osv.).

Merk at uavhengigheten til to utvalg ikke i det hele tatt betyr at det ikke er noe krav om en viss type likhet mellom disse prøvene (deres homogenitet). Når vi studerer inntektsnivået til menn og kvinner, vil vi derfor neppe tillate en situasjon der menn velges blant forretningsmenn fra Moskva og kvinner fra aboriginene i Australia. Kvinner bør også være muskovitter og dessuten «forretningskvinner». Men her snakker vi ikke om avhengigheten av prøver, men om kravet om homogenitet til den studerte populasjonen av objekter, som må tilfredsstilles både når man samler inn og analyserer sosiologiske data.

Def. Prøvene kalles avhengig, eller sammenkoblet, hvis hver enhet av en prøve er "lenket" til en spesifikk enhet i den andre prøven.

Denne siste definisjonen vil trolig bli klarere hvis vi gir et eksempel på avhengige utvalg.

Anta at vi ønsker å finne ut om fars sosiale status i gjennomsnitt er lavere sosial status sønn (vi tror at vi kan måle dette komplekset og tvetydig forstått sosiale egenskaper person). Det virker åpenbart at i en slik situasjon er det tilrådelig å velge par av respondenter (far, sønn) og anta at hvert element i det første utvalget (en av fedrene) er "bundet" til et bestemt element i det andre utvalget (hans sønn). Disse to prøvene vil bli kalt avhengige.

8.2. Hypotesetesting for uavhengige prøver

Til selvstendig prøver, avhenger valg av kriterium av om vi vet generelle avvik s 1 2 og s 2 2 av karakteristikken som vurderes for prøvene som studeres. Vi vil vurdere dette problemet som løst, forutsatt at det utvalgsvariasjoner sammenfaller med de generelle. I dette tilfellet er kriteriet verdien:

Før vi går videre til å diskutere situasjonen når de generelle avvikene (eller i det minste én av dem) er ukjente for oss, noterer vi oss følgende.

Logikken ved å bruke kriteriet (8.1) er lik den vi beskrev når vi vurderte «Chi-square»-kriteriet (7.2). Det er bare én grunnleggende forskjell. Når vi snakker om betydningen av kriteriet (7.2), vurderte vi et uendelig antall utvalg av størrelse n, "trukket" fra vår generelle befolkning. Her, ved å analysere betydningen av kriteriet (8.1), går vi videre til å vurdere et uendelig antall damp prøver av størrelse n 1 og n 2. For hvert par beregnes statistikk av formen (8.1). Totalen av de oppnådde verdiene av slik statistikk, i samsvar med notasjonen vår, tilsvarer normalfordeling(som vi ble enige om, brukes bokstaven z for å betegne et slikt kriterium som normalfordelingen oppfyller).

Så hvis de generelle variasjonene er ukjente for oss, er vi tvunget til å bruke dem i stedet prøveanslag s 1 2 og s 2 2. Men i dette tilfellet må normalfordelingen erstattes av Studentfordelingen - z må erstattes med t (som tilfellet var i en lignende situasjon ved konstruksjon konfidensintervall for matematisk forventning). Men med tilstrekkelig store utvalgsstørrelser (n 1, n 2 ³ 30), som vi allerede vet, faller studentfordelingen praktisk talt sammen med den normale. Med andre ord, for store utvalg kan vi fortsette å bruke kriteriet:

Situasjonen er mer komplisert når variansene er ukjente og størrelsen på minst ett utvalg er liten. Da spiller en annen faktor inn. Typen kriterium avhenger av om vi kan anse de ukjente variansene til karakteristikken som vurderes i de to analyserte prøvene som like. For å finne det ut, må vi teste hypotesen:

H 0: s 1 2 = s 2 2. (8.3)

For å teste denne hypotesen brukes kriteriet

Om detaljene ved bruk av dette kriteriet vi snakkes nedenfor, og nå skal vi fortsette å diskutere algoritmen for å velge et kriterium som brukes til å teste hypoteser om likheten mellom matematiske forventninger.

Hvis hypotese (8.3) forkastes, tar kriteriet som er av interesse for oss formen:

(8.5)

(dvs. at det skiller seg fra kriterium (8.2), som ble brukt for store utvalg, ved at den tilsvarende statistikken ikke har en normalfordeling, men en Studentfordeling). Hvis hypotese (8.3) aksepteres, endres typen kriterium som brukes:

(8.6)

La oss oppsummere hvordan et kriterium velges for å teste hypotesen om likheten mellom generelle matematiske forventninger basert på analysen av to uavhengige utvalg.

kjent

ukjent

prøvestørrelsen er stor

H 0: s 1 = s 2 avvist

Godtatt

8.3. Hypotesetesting for avhengige prøver

La oss gå videre til å vurdere avhengige prøver. La rekkefølgen av tall

Xl, X2, …, Xn;

Y 1 , Y 2 , … , Y n –

dette er verdiene til det aktuelle tilfeldige tallet for elementene i to avhengige utvalg. La oss introdusere notasjonen:

Di = Xi - Yi, i = 1, ..., n.

Til avhengig prøvekriterium som lar deg teste en hypotese

ser slik ut:

Merk at det nettopp gitte uttrykket for s D ikke er noe mer enn et nytt uttrykk for kjent formel, som uttrykker standardavviket. I i dette tilfellet vi snakker om om standardavviket til verdiene til D i . Lignende formel brukes ofte i praksis som en enklere (sammenlignet med "head-on" beregning av summen av kvadrerte avvik av verdiene til verdien som vurderes fra det tilsvarende aritmetiske gjennomsnittet) metode for å beregne spredning.

Hvis vi sammenligner formlene ovenfor med de vi brukte når vi diskuterte prinsippene for å konstruere et konfidensintervall, er det lett å legge merke til at å teste hypotesen om likhet av midler for tilfellet med avhengige utvalg i hovedsak er å teste likheten til den matematiske forventningen til verdiene D i til null. Størrelse

er standardavviket for D i. Derfor er verdien av det nettopp beskrevne kriteriet t n -1 i hovedsak lik verdien av Di uttrykt i brøkdeler av gjennomsnittet kvadratavvik. Som vi sa ovenfor (når vi diskuterer metoder for å konstruere konfidensintervaller), kan denne indikatoren brukes til å bedømme sannsynligheten for den vurderte verdien Di. Forskjellen er at vi ovenfor snakket om et enkelt aritmetisk gjennomsnitt, normalfordelt, og her snakker vi om gjennomsnittsforskjeller, slike gjennomsnitt har en Studentfordeling. Men resonnementet om sammenhengen mellom sannsynligheten for avvik av prøvens aritmetiske gjennomsnitt fra null (med en matematisk forventning lik null) og hvor mange enheter s dette avviket utgjør forblir gyldig.

Å sammenligne midlene til to populasjoner er viktig praktisk betydning. I praksis er det ofte tilfeller når gjennomsnittlig resultat en serie med eksperimenter skiller seg fra gjennomsnittsresultatet av en annen serie. Samtidig oppstår spørsmålet om den oppdagede divergensen av gjennomsnitt kan forklares med uunngåelige tilfeldige feil eksperimentere eller er det forårsaket av visse mønstre. I industrien oppstår ofte oppgaven med å sammenligne gjennomsnitt når man selektivt overvåker kvaliteten på produkter produsert i forskjellige installasjoner eller under forskjellige teknologiske forhold, i finansiell analyse når man sammenligner lønnsomhetsnivået til forskjellige eiendeler, etc.

La oss formulere problemet. La det være to populasjoner preget av generelle midler og og kjente dispersjoner Og. Det er nødvendig å teste hypotesen om likheten mellom generelle midler, dvs. : =. For å teste hypotesen, ble to uavhengige prøver av volumer og tatt fra disse populasjonene, hvorfra de aritmetiske gjennomsnittene og utvalgsvariansene ble funnet Med tilstrekkelig store utvalgsvolumer, har utvalget en tilnærmet normalfordelingslov, henholdsvis hypotesen er sann, forskjellen har en normalfordelingslov med matematisk forventning og spredning.

Derfor, når hypotesen er oppfylt, statistikk

har en standard normalfordeling N (0; 1).

Tester hypoteser om numeriske verdier parametere

Hypoteser om numeriske verdier forekommer i ulike problemer. La være verdiene til en viss parameter av produkter produsert av en automatisk linjemaskin, og la være den spesifiserte nominelle verdien av denne parameteren. Hver separat betydning kan naturligvis på en eller annen måte avvike fra den gitte nominelle verdien. Åpenbart, for å kontrollere de riktige innstillingene til denne maskinen, må du sørge for at gjennomsnittsverdien av parameteren for produktene som produseres på den vil tilsvare den nominelle verdien, dvs. teste en hypotese mot et alternativ, eller, eller

Når du setter opp en maskin tilfeldig, kan det være nødvendig å teste hypotesen om at nøyaktigheten av å produsere produkter for en gitt parameter, spesifisert av variansene, er lik. gitt verdi, dvs. eller for eksempel at andelen av defekte produkter produsert av maskinen er lik en gitt verdi p 0, dvs. osv.

Lignende problemer kan oppstå, for eksempel i finansiell analyse, når det basert på utvalgsdata er nødvendig å avgjøre om avkastningen på en eiendel kan vurderes bestemt type eller en portefølje av verdipapirer, eller dens risiko lik et gitt antall; eller basert på resultatene av en selektiv revisjon av dokumenter av samme type, må du forsikre deg om hvorvidt prosentandelen av feil som er gjort kan anses som lik den nominelle verdien, etc.

I generell sak hypoteser lignende type har formen hvor er en viss parameter for distribusjonen som studeres, og er regionen for dens spesifikke verdier, som i et bestemt tilfelle består av én verdi.

5. november 2012 5. november 2012 5. november 2012 5. november 2012 Forelesning 6. Sammenligning av to utvalg 6-1. Hypotese om likestilling av midler. Sammenkoblede prøver 6-2 Konfidensintervall for forskjellen i gjennomsnitt. Sammenkoblede prøver 6-3. Hypotese om varianslikhet 6-4. Hypotese om likestilling av aksjer 6-5. Konfidensintervall for forskjellen i proporsjoner


2 Ivanov O.V., 2005 I denne forelesningen... I forrige forelesning testet vi hypotesen om likheten mellom gjennomsnittene til to generelle populasjoner og konstruerte et konfidensintervall for forskjellen i gjennomsnitt for tilfellet med uavhengige utvalg. Nå skal vi vurdere kriteriet for å teste hypotesen om likhet av middel og konstruere et konfidensintervall for forskjellen i gjennomsnitt i tilfelle av sammenkoblede (avhengige) prøver. Så i avsnitt 6-3 vil hypotesen om varianslikhet bli testet, i avsnitt 6-4 - hypotesen om likestilling av aksjer. Til slutt konstruerer vi et konfidensintervall for forskjellen i proporsjoner.


5. november 2012 5. november 2012 5. november 2012 5. november 2012 Hypotese om likestilling. Sammenkoblede prøver Redegjørelse av problemet Hypoteser og statistikk Handlingsrekkefølge Eksempel


4 Ivanov O.V., 2005 Sammenkoblede prøver. Beskrivelse av problemet Hva vi har 1. To enkle tilfeldige prøver, hentet fra to generelle populasjoner. Prøvene er paret (avhengig). 2. Begge prøvene har en størrelse på n 30. Hvis ikke, er begge prøvene tatt fra normalfordelte populasjoner. Det vi ønsker er å teste hypotesen om forskjellen mellom gjennomsnittene til to populasjoner:


5 Ivanov O.V., 2005 Statistikk for parede prøver For å teste hypotesen brukes statistikk: hvor er forskjellen mellom to verdier i ett par - det generelle gjennomsnittet for parede forskjeller - utvalgsgjennomsnittet for parede forskjeller - standardavvik forskjeller for utvalget - antall par


6 Ivanov O.V., 2005 Eksempel. Opplæring av elever En gruppe på 15 elever tok en prøve før og etter opplæringen. Testresultatene er i tabellen. La oss sjekke hypotesen for sammenkoblede prøver for fravær av påvirkning av trening på elevenes forberedelse på et signifikansnivå på 0,05. Løsning. La oss beregne forskjellene og kvadratene deres. StudentBeforeAfter Σ= 21 Σ= 145


7 Ivanov O.V., 2005 Løsning Trinn 1. Hoved- og alternative hypoteser: Trinn 2. Signifikansnivå =0,05 settes. Trinn 3. Ved å bruke tabellen for df = 15 – 1=14 finner vi den kritiske verdien t = 2,145 og skriver ned det kritiske området: t > 2,145. 2.145."> 2.145."> 2.145." title="7 Ivanov O.V., 2005 Løsning Trinn 1. Hoved- og alternative hypoteser: Trinn 2. Signifikansnivået settes = 0.05. Trinn 3. Ved tabell for df = 15 – 1=14 finner vi den kritiske verdien t = 2,145 og skriver det kritiske området: t > 2,145."> title="7 Ivanov O.V., 2005 Løsning Trinn 1. Hoved- og alternative hypoteser: Trinn 2. Signifikansnivå =0,05 settes. Trinn 3. Ved å bruke tabellen for df = 15 – 1=14 finner vi den kritiske verdien t = 2,145 og skriver ned det kritiske området: t > 2,145."> !}




9 Ivanov O.V., 2005 Løsningsstatistikk tar verdien: Trinn 5. Sammenlign den oppnådde verdien med det kritiske området. 1.889


5. november 2012 5. november 2012 5. november 2012 5. november 2012 Konfidensintervall for forskjellen i gjennomsnitt. Sammenkoblede prøver Problemstilling Metode for å konstruere et konfidensintervall Eksempel


11 Ivanov O.V., 2005 Beskrivelse av problemet Hva vi har Vi har to tilfeldige parede (avhengige) utvalg av størrelse n fra to generelle populasjoner. Generelle populasjoner har en normalfordelingslov med parametere 1, 1 og 2, 2 eller volumene til begge prøvene er 30. Det vi ønsker er å estimere gjennomsnittsverdien av parede forskjeller for to generelle populasjoner. For å gjøre dette, konstruer et konfidensintervall for gjennomsnittet i skjemaet:






5. november 2012 5. november 2012 5. november 2012 5. november 2012 Hypotese om varianselikhet Problemformulering Hypoteser og statistikk Handlingsrekkefølge Eksempel


15 Ivanov O.V., 2005 Under studien... Forskeren må kanskje sjekke antakelsen om at variansene til de to populasjonene som studeres er like. I tilfellet hvor disse populasjonene har normalfordeling, finnes det en F-test for dette, også kalt Fishers test. I motsetning til Student, jobbet ikke Fischer i et bryggeri.


16 Ivanov O.V., 2005 Beskrivelse av oppgaven Hva vi har 1. To enkle stikkprøver hentet fra to normalfordelte populasjoner. 2. Prøvene er uavhengige. Dette betyr at det ikke er noen sammenheng mellom prøveemnene. Det vi ønsker er å teste hypotesen om likhet i populasjonsvariasjoner:














23 Ivanov O.V., 2005 Eksempel En medisinsk forsker ønsker å sjekke om det er forskjell på hjertefrekvensen til røykende og ikke-røykende pasienter (antall slag per minutt). Resultatene fra to tilfeldig utvalgte grupper vises nedenfor. Bruk α = 0,05, finn ut om legen har rett. Røykere Ikke-røykere


24 Ivanov O.V., 2005 Løsning Trinn 1. Hoved- og alternative hypoteser: Trinn 2. Signifikansnivå =0,05 settes. Trinn 3. Ved å bruke tabellen for antall frihetsgrader for telleren 25 og nevneren 17 finner vi den kritiske verdien f = 2,19 og det kritiske området: f > 2,19. Trinn 4. Ved å bruke prøven beregner vi statistikkverdien: 2.19. Trinn 4. Ved å bruke prøven beregner vi statistikkverdien: ">




5. november 2012 5. november 2012 5. november 2012 5. november 2012 Hypotese om like andeler Problemstilling Hypoteser og statistikk Handlingsrekkefølge Eksempel


27 Ivanov O.V., 2005 Spørsmål Av 100 tilfeldig utvalgte studenter ved det sosiologiske fakultetet går 43 på spesialkurs. Av 200 tilfeldig utvalgte økonomistudenter går 90 på spesialkurs. Er andelen studenter som går på spesialkurs forskjellig mellom sosiologiske og økonomiske avdelinger? Det ser ikke ut til å være nevneverdig annerledes. Hvordan kan jeg sjekke dette? Andelen av de som går på spesialkurs er andelen av attributtet. 43 – antall "suksesser". 43/100 – andel av suksess. Terminologien er den samme som i Bernoullis opplegg.


28 Ivanov O.V., 2005 Beskrivelse av oppgaven Hva vi har 1. To enkle stikkprøver hentet fra to normalfordelte populasjoner. Prøvene er uavhengige. 2. For prøver er np 5 og nq 5 oppfylt. Dette betyr at minst 5 elementer av utvalget har den studerte karakteristiske verdien, og minst 5 ikke. Det vi ønsker er å teste hypotesen om likheten mellom andelene av en egenskap i to generelle populasjoner:






31 Ivanov O.V., 2005 Eksempel. Spesialkurs ved to fakulteter Av 100 tilfeldig utvalgte studenter ved det sosiologiske fakultetet går 43 på spesialkurs. Av de 200 økonomistudentene går 90 på spesialkurs. På signifikansnivået = 0,05 tester du hypotesen om at det ikke er noen forskjell mellom andelen studenter som går på spesialkurs ved disse to fakultetene.


33 Ivanov O.V., 2005 Løsning Trinn 1. Hoved- og alternative hypoteser: Trinn 2. Signifikansnivå =0,05 settes. Trinn 3. Ved hjelp av normalfordelingstabellen finner vi de kritiske verdiene z = – 1,96 og z = 1,96, og konstruerer det kritiske området: z 1,96. Trinn 4. Basert på utvalget beregner vi verdien av statistikken.


5. november 2012 5. november 2012 5. november 2012 5. november 2012 Konfidensintervall for forskjellen i proporsjoner Problemformulering Metode for å konstruere et konfidensintervall Eksempel





Homogeniteten til to prøver kontrolleres ved hjelp av studentens test (eller t– kriterium). La oss vurdere formuleringen av problemet med å kontrollere homogeniteten til to prøver. La to prøver av volum og lages. Må sjekkes nullhypotese at de generelle gjennomsnittene for de to prøvene er like. Det vil si, og. n 1

Før vi vurderer metoden for å løse problemet, la oss vurdere noen teoretiske prinsipper, brukes til å løse problemet. Den kjente matematikeren W.S. Gosset (som publiserte en rekke av hans arbeider under pseudonymet Student) beviste denne statistikken t(6.4) følger en viss distribusjonslov, som senere ble kalt Studentfordelingsloven (det andre navnet på loven er " t– distribusjon").

Gjennomsnittlig verdi av en tilfeldig variabel X;

Forventning tilfeldig variabel X;

Standardavvik for gjennomsnittlig prøvevolum n.

Karakter standardavvik gjennomsnitt beregnes ved hjelp av formel (6.5):

Standardavvik for en tilfeldig variabel X.

Studentfordelingen har én parameter - antall frihetsgrader.

La oss nå gå tilbake til den opprinnelige formuleringen av to-utvalgsproblemet og vurdere tilfeldig variabel lik forskjellen mellom gjennomsnittene av to prøver (6,6):

(6.6)

Forutsatt at hypotesen om likhet av generelle midler er oppfylt, hevder (6.7):

(6.7)

La oss omskrive relasjon (6.4) i forhold til vårt tilfelle:

Estimatet av standardavviket kan uttrykkes i form av estimatet av standardavviket for den kombinerte populasjonen (6,9):

(6.9)

Et estimat av variansen til den samlede populasjonen kan uttrykkes i form av variansestimater beregnet fra to utvalg og:

(6.10)

Ved å ta hensyn til formel (6.10), kan relasjon (6.9) skrives om til (6.11). Relasjon (6.9) er det viktigste beregningsformel problemer med å sammenligne gjennomsnitt:

Når du erstatter verdien i formel (6.8), vil vi ha en prøveverdi t-kriterier. I henhold til Studentfordelingstabeller med antall frihetsgrader og et gitt nivå av betydning kan bestemmes. Nå, hvis , så er hypotesen om likheten mellom de to midlene forkastet.

La oss se på et eksempel på å utføre beregninger for å teste hypotesen om likheten mellom to gjennomsnitt i EXCEL. La oss lage en datatabell (fig. 6.22). Vi vil generere dataene ved hjelp av generasjonsprogrammet tilfeldige tall"Dataanalyse"-pakke:

X1 prøve fra normalfordeling med parametere volum ;

X2 prøve fra en normalfordeling med volumparametere;

X3 prøve fra normalfordeling med parametere volum ;

X4 prøve fra normalfordeling med parametere volum.


La oss sjekke hypotesen om likhet av to gjennomsnitt (X1-X2), (X1-X3), (X1-X4). La oss først beregne parametrene til funksjonsprøvene X1-X4 (fig. 6.23). Deretter beregner vi verdien t- kriterier. Beregninger vil bli utført ved å bruke formlene (6.6) – (6.9) i EXCEL. Vi oppsummerer beregningsresultatene i en tabell (fig. 6.24).

Ris. 6.22. Datatabell

Ris. 6.23. Parametre for funksjonseksempler X1-X4

Ris. 6.24. Sammendragstabell for beregning av verdier t– kriterier for kjennetegnspar (X1-X2), (X1-X3), (X1-X4)

I henhold til resultatene vist i tabellen i fig. 6.24 kan vi konkludere med at for et tegnpar (X1-X2) forkastes hypotesen om likhet mellom gjennomsnittene av to tegn, og for tegnpar (X1-X3), (X1-X4) kan hypotesen anses som gyldig .

De samme resultatene kan oppnås ved å bruke Two-Sample-programmet. t-test med like varianser» av Data Analysis-pakken. Programgrensesnittet er vist i fig. 6,25.

Ris. 6,25. To-eksempler programalternativer t- test med like varianser"

Resultatene av beregninger for å teste hypoteser om likhet av to gjennomsnittlige par av egenskaper (X1-X2), (X1-X3), (X1-X4), oppnådd ved bruk av programmet, er vist i fig. 6,26-6,28.

Ris. 6,26. Beregning av verdi t– kriterium for et par egenskaper (X1-X2)

Ris. 6,27. Beregning av verdi t– kriterium for et par egenskaper (X1-X3)

Ris. 6,28. Beregning av verdi t– kriterium for et par egenskaper (X1-X4)

To-prøve t-test med like varianser kalles ellers t-test med uavhengige prøver. Utbredt også mottatt t-test med avhengige prøver. Situasjonen når det er nødvendig å anvende dette kriteriet oppstår når den samme stokastiske variabelen måles to ganger. Antall observasjoner i begge tilfeller er det samme. La oss introdusere notasjon for to påfølgende målinger av en egenskap til de samme objektene, og betegne forskjellen mellom to påfølgende målinger:

I dette tilfellet har formelen for prøveverdien til kriteriet formen:

, (6.13)

(6.15)

I dette tilfellet er antallet frihetsgrader . Hypotesetesting kan utføres ved å bruke programmet Paired Two-Sample. t-test” dataanalysepakke (Fig. 6.29).

Ris. 6,29. Parametre for "Parrede to-prøver"-programmet t-test"

6.5. Variansanalyse – klassifisering etter ett kriterium (F - kriterium)

I variansanalyse testes en hypotese, som er en generalisering av hypotesen om likheten mellom to midler til tilfellet når hypotesen om likheten til flere midler testes samtidig. Variansanalyse undersøker graden av påvirkning av en eller flere faktoregenskaper på den resulterende karakteristikken. Idé variansanalyse tilhører R. Fischer. Han brukte den til å behandle resultatene av agronomiske eksperimenter. Variansanalyse brukes for å fastslå betydningen av påvirkningen kvalitative faktorer til verdien som studeres. Det engelske forkortede navnet for variansanalyse er ANOVA (analysevariasjon).

Generell form presentasjon av data med klassifisering etter ett kriterium er presentert i tabell 6.1.

Tabell 6.1. Datapresentasjonsskjema med klassifisering etter ett kjennetegn

Tenk på to uavhengige prøver x 1, x 2, ….., x n og y 1, y 2, …, y n, hentet fra normale populasjoner med like varianser, med henholdsvis utvalgsstørrelser n og m, og gjennomsnitt μ x, μ y og varians σ 2 er ukjent. Det kreves å teste hovedhypotesen H 0: μ x = μ y med den konkurrerende H 1: μ x μ y.

Som kjent vil prøvegjennomsnitt ha følgende egenskaper: ~N(μ x, σ 2 /n), ~N(μ y, σ 2 /m).

Deres forskjell er en normal verdi med gjennomsnittet og variasjon, altså

~ (23).

La oss et øyeblikk anta at hovedhypotesen H 0 er riktig: μ x – μ y =0. Da og dividere verdien med standardavviket, får vi standard normal sl. Størrelse ~N(0,1).

Det ble tidligere bemerket at størrelse fordelt etter loven med (n-1) frihetsgrad, a - etter loven med (m-1) frihetsgrad. Tatt i betraktning uavhengigheten til disse to summene, finner vi at de er det totalt beløp fordelt etter loven med n+m-2 frihetsgrader.

Når vi husker trinn 7, ser vi at brøken adlyder t-fordelingen (Student) med ν=m+n-2 frihetsgrader: Z=t. Dette faktum oppstår bare når hypotesen H 0 er sann.

Ved å erstatte ξ og Q med deres uttrykk, får vi en utvidet formel for Z:

(24)

Den neste Z-verdien, kalt kriteriestatistikk, lar deg ta en beslutning med følgende handlingssekvens:

1. Arealet D=[-t β,ν , +t β,ν ] er etablert, som inneholder β=1–α-områder under t ν-fordelingskurven (tabell 10).

2. Den eksperimentelle verdien Z på statistikk Z beregnes ved å bruke formel (24), der verdiene x 1 og y 1 til spesifikke prøver, samt deres prøvemidler og , erstattes i stedet for X 1 og Y 1 .

3. Hvis Z på D, anses hypotesen H 0 å ikke motsi eksperimentelle data og er akseptert.

Hvis Z på D, er hypotese H 1 akseptert.

Hvis hypotesen H 0 er sann, følger Z den kjente t ν -fordelingen med null gjennomsnitt og med høy sannsynlighet faller β = 1–α inn i D-regionen for aksept av hypotesen H 0 . Når den observerte, eksperimentelle verdien av Z på faller inn i D. Vi anser dette som bevis til fordel for hypotesen H 0.

Når Z 0 n ligger utenfor D (som de sier, ligger i det kritiske området K), noe som er naturlig hvis hypotesen H 1 er sann, men usannsynlig hvis H 0 er sann, så kan vi bare forkaste hypotesen H 0 ved å akseptere H 1 .

Eksempel 31.

To kvaliteter bensin sammenlignes: A og B. På 11 kjøretøyer med samme effekt ble bensin av klasse A og B testet én gang på et sirkulært chassis. En bil brøt sammen underveis og det er ingen data for den på bensin B.

Bensinforbruk per 100 km

Tabell 12

jeg
X i 10,51 11,86 10,5 9,1 9,21 10,74 10,75 10,3 11,3 11,8 10,9 n=11
U i 13,22 13,0 11,5 10,4 11,8 11,6 10,64 12,3 11,1 11,6 - m=10

Variansen i forbruket av bensinklasse A og B er ukjent og antas å være den samme. Er det mulig, ved et signifikansnivå på α=0,05, å akseptere hypotesen om at de sanne gjennomsnittskostnadene μ A og μ B for disse typer bensin er de samme?

Løsning. Tester hypotesen H 0: μ A -μ B = 0 med en konkurrerende. H 1:μ 1 μ 2 gjør følgende:

1. Finn utvalgsmiddelverdiene og summen av kvadrerte avvik Q.

;

;

2. Regn ut den eksperimentelle verdien til Z-statistikken

3. Fra tabell 10 i t-fordelingen finner vi grensen t β,ν for antall frihetsgrader ν=m+n–2=19 og β=1–α=0,95. Tabell 10 har t 0.95.20 =2.09 og t 0.95.15 =2.13, men ikke t 0.95.19. Vi finner ved interpolasjon t 0.95.19 =2.09+ =2.10.

4. Sjekk hvilket av de to områdene D eller K som inneholder nummeret Zon. Zon=-2,7 D=[-2,10; -2.10].

Siden den observerte verdien av Z på ligger i det kritiske området, K = R\D, forkaster vi den. H 0 og aksepter hypotesen H 1. I dette tilfellet sier de at forskjellen deres er betydelig. Hvis, under alle betingelsene i dette eksemplet, bare Q hadde endret seg, for eksempel Q hadde doblet seg, ville konklusjonen vår ha endret seg. Dobling av Q vil føre til en reduksjon i verdien av Zon med en faktor, og da vil tallet Zon falle inn gyldig område D, slik at hypotesen H 0 ville bestå testen og bli akseptert. I dette tilfellet vil avviket mellom og forklares av den naturlige spredningen av dataene, og ikke av det faktum at μ A μ B.

Teorien om hypotesetesting er svært omfattende hypoteser kan handle om type distribusjonslov, om prøvers homogenitet, om uavhengighet av neste størrelser, etc.

KRITERIUM c 2 (PEARSON)

Det vanligste kriteriet i praksis for å teste en enkel hypotese. Gjelder når distribusjonsloven er ukjent. Tenk på en tilfeldig variabel X over hvilken n uavhengige tester. Realiseringen x 1, x 2,..., x n oppnås. Det er nødvendig å teste hypotesen om fordelingsloven til denne tilfeldige variabelen.

La oss vurdere tilfellet med en enkel hypotese. En enkel hypotese tester utvalgets konsistens med generell befolkning, som har en normalfordeling (kjent). Vi bygger etter prøver variasjonsserie x (1), x (2), ..., x (n). Vi deler intervallet inn i delintervaller. La disse intervallene være r. Da vil vi finne sannsynligheten for at X, som et resultat av testen, faller inn i intervallet Di, i=1 ,..., r hvis hypotesen som testes er sann.

Kriteriet kontrollerer ikke sannheten av sannsynlighetstettheten, men sannheten til tallene

Med hvert intervall Di vi assosierer tilfeldig hendelse A i - treff i dette intervallet (treff som et resultat av testing over X resultatet av implementering i Di). La oss introdusere tilfeldige variabler. m i er antall tester av n utført der hendelsen A i skjedde. m i er fordelt i henhold til binomialloven og hvis hypotesen er sann

Dm i =np i (1-pi)

Kriterium c 2 har formen

p1 +p2 +...+pr =1

m 1 +m 2 +...+m r =n

Hvis hypotesen som testes er riktig, representerer m i hyppigheten av forekomst av en hendelse som har en sannsynlighet pi i hver av de n forsøkene, derfor kan vi betrakte m i som en tilfeldig variabel underlagt den binomiale loven sentrert ved punktet npi . Når n er stor, så kan vi anta at frekvensen er fordelt asymptotisk normalt med de samme parameterne. Dersom hypotesen stemmer, bør vi forvente at de vil være asymptotisk normalfordelte

sammenkoblet av forhold

Som et mål på avviket mellom prøvedata m 1 +m 2 +...+m r og teoretisk np 1 +np 2 +...+np r, vurdere verdien

c 2 - sum av kvadrater asymptotisk normale verdier relatert lineær avhengighet. Vi har tidligere møtt en lignende sak og vet at tilstedeværelsen lineær forbindelse førte til en nedgang i antall frihetsgrader med én.

Hvis hypotesen som testes er riktig, har kriteriet c 2 en fordeling som tenderer som n®¥ til fordelingen av c 2 med r-1 frihetsgrader.

La oss anta at hypotesen er feil. Da er det en tendens til at sumtermene øker, d.v.s. hvis hypotesen er feil, vil dette beløpet falle inn i et bestemt område store verdier c 2. La oss ta regionen som den kritiske regionen positive verdier kriterier


Når det gjelder ukjente distribusjonsparametere, reduserer hver parameter antallet frihetsgrader for Pearson-kriteriet med én