Biografier Kjennetegn Analyse

Pearson χ2 godhet-of-fit-test (Chi-square). Goodness-of-fit-tester brukes til å teste statistiske hypoteser

Statistiske hypoteser. Samtykkekriterier.

Null(grunnleggende) kall en hypotese fremsatt om formen til en ukjent fordeling, eller om parametrene til kjente fordelinger. Konkurrerer (alternativ) kalt en hypotese som motsier nullhypotesen.

For eksempel hvis nullhypotesen er at den tilfeldige variabelen X er fordelt etter loven, så kan en konkurrerende hypotese være at den tilfeldige variabelen X fordelt etter en annen lov.

Statistisk kriterium(eller ganske enkelt kriterium) kalles en tilfeldig variabel TIL, som tjener til å teste nullhypotesen.

Etter å ha valgt et bestemt kriterium, for eksempel kriterium , er settet med alle dets mulige verdier delt inn i to usammenhengende delsett: en av dem inneholder kriterieverdiene der nullhypotesen forkastes, og den andre - der den er akseptert.

Kritisk område er et sett med kriterieverdier der nullhypotesen forkastes. Hypotese Aksept Area kall settet med kriterieverdier der hypotesen er akseptert. Kritiske punkter De kaller punktene som skiller det kritiske området fra området der nullhypotesen er akseptert.

For vårt eksempel, med en verdi på , tilsvarer verdien beregnet fra utvalget området for aksept av hypotesen: den tilfeldige variabelen er fordelt i henhold til loven. Hvis den beregnede verdien er , faller den inn i det kritiske området, det vil si at hypotesen om fordelingen av den tilfeldige variabelen i henhold til loven forkastes.

Ved fordeling bestemmes den kritiske regionen av ulikheten, regionen der nullhypotesen er akseptert bestemmes av ulikheten.

2.6.3. Avtalekriterium Pearson.

En av oppgavene til husdyrvitenskap og veterinærgenetikk er avl av nye raser og arter med de nødvendige egenskapene. For eksempel øke immunitet, motstand mot sykdom, eller endre pelsens farge.

I praksis, når man analyserer resultatene, viser det seg svært ofte at de faktiske resultatene mer eller mindre samsvarer med en eller annen teoretisk fordelingslov. Det er behov for å vurdere graden av samsvar mellom faktiske (empiriske) data og teoretiske (hypotetiske) data. For å gjøre dette, sett frem en nullhypotese: den resulterende befolkningen er fordelt i henhold til "A"-loven. Hypotesen om forventet distribusjonslov testes ved hjelp av en spesielt valgt tilfeldig variabel – goodness-of-fit-kriteriet.

Avtalekriterium kalles et kriterium for å teste en hypotese om den antatte loven for en ukjent fordeling.

Det er flere avtalekriterier: Pearson, Kolmogorov, Smirnov, etc. Pearsons godhetstesten er den mest brukte.

La oss vurdere anvendelsen av Pearson-kriteriet ved å bruke eksemplet med å teste hypotesen om den normale loven for fordeling av befolkningen. For dette formålet vil vi sammenligne empiriske og teoretiske (beregnet i fortsettelsen av normalfordelingen) frekvenser.

Det er vanligvis en viss forskjell mellom teoretiske og empiriske frekvenser. For eksempel:

Empiriske frekvenser 7 15 41 93 113 84 25 13 5

Teoretiske frekvenser 5 13 36 89 114 91 29 14 6

La oss vurdere to tilfeller:

Avviket mellom teoretiske og empiriske frekvenser er tilfeldig (ubetydelig), dvs. det er mulig å lage et forslag om fordelingen av empiriske frekvenser i henhold til normalloven;

Avviket mellom teoretiske og empiriske frekvenser er ikke tilfeldig (signifikant), dvs. teoretiske frekvenser ble beregnet basert på den feilaktige hypotesen om en normal populasjonsfordeling.

Ved å bruke Pearson goodness-of-fit-testen kan du avgjøre om avviket mellom teoretiske og empiriske frekvenser er tilfeldig eller ikke, dvs. med en gitt konfidenssannsynlighet, bestemme om befolkningen er fordelt etter en normallov eller ikke.

Så la den empiriske fordelingen fås fra et utvalg av størrelse n:

Alternativer......

Empiriske frekvenser…….

La oss anta at teoretiske frekvenser beregnes under forutsetning av en normalfordeling. På signifikansnivå kreves det å teste nullhypotesen: populasjonen er normalfordelt.

Som et kriterium for å teste nullhypotesen vil vi ta en tilfeldig variabel

(*)

Denne mengden er tilfeldig, siden den i forskjellige eksperimenter får forskjellige, tidligere ukjente verdier. Det er klart at jo mindre de empiriske og teoretiske frekvensene er forskjellige, desto mindre er verdien av kriteriet, og derfor karakteriserer det til en viss grad nærheten til de empiriske og teoretiske fordelingene.

Det er bevist at når fordelingsloven til en tilfeldig variabel (*), uavhengig av hvilken fordelingslov den generelle befolkningen er underlagt, tenderer til en fordelingslov med frihetsgrader. Derfor er den tilfeldige variabelen (*) betegnet med , og selve kriteriet kalles "chi-square" godhet-of-fit-testen.

La oss betegne verdien av kriteriet beregnet fra observasjonsdata med . De tabellerte kritiske verdiene for kriteriet for et gitt signifikansnivå og antall frihetsgrader er merket med . I dette tilfellet bestemmes antall frihetsgrader fra likheten , hvor er antall grupper (delintervaller) av utvalget eller klassene; - antall parametere for forventet distribusjon. Normalfordelingen har to parametere - matematisk forventning og standardavvik. Derfor finner man antall frihetsgrader for en normalfordeling fra likheten

Hvis den beregnede verdien og tabellverdien tilfredsstiller ulikheten , aksepteres nullhypotesen om normalfordelingen av befolkningen. Hvis , nullhypotesen forkastes og den alternative hypotesen aksepteres (populasjonen er ikke normalfordelt).

Kommentar. Når du bruker Pearsons godhet-of-fit-test, må prøvestørrelsen være minst 30. Hver gruppe må inneholde minst 5 alternativer. Dersom gruppene inneholder mindre enn 5 frekvenser, kombineres de med nabogrupper.

Generelt er antall frihetsgrader for kjikvadratfordelingen definert som det totale antallet verdier som de tilsvarende indikatorene beregnes ut fra, minus antall tilstander som forbinder disse verdiene, dvs. redusere muligheten for variasjon mellom dem. I de enkleste tilfellene, ved beregning, vil antall frihetsgrader være lik antall klasser redusert med én. Så, for eksempel, med dihybrid-splitting, oppnås 4 klasser, men bare den første klassen er ikke-relatert, de påfølgende er allerede relatert til de forrige. Derfor, for dihybrid-splitting, er antallet frihetsgrader .



Eksempel 1. Bestem graden av samsvar med den faktiske fordelingen av grupper etter antall kyr med tuberkulose med den teoretisk forventede, som ble beregnet når man vurderer normalfordelingen. Kildedataene er oppsummert i tabellen:

Løsning.

Basert på signifikansnivå og antall frihetsgrader fra tabellen over kritiske punkter for fordelingen (se vedlegg 4), finner vi verdien . Fordi det , kan vi konkludere med at forskjellen mellom teoretiske og faktiske frekvenser er tilfeldig. Dermed tilsvarer den faktiske fordelingen av grupper etter antall kyr med tuberkulose det teoretisk forventede.

Eksempel 2. Den teoretiske fordelingen etter fenotype av individer oppnådd i andre generasjon ved dihybrid kryssing av kaniner i henhold til Mendels lov er 9: 3: 3: 1. Det kreves å beregne korrespondansen til den empiriske fordelingen av kaniner fra kryssing av svarte individer med normalt hår med dunete dyr - albino. Ved kryssing i andre generasjon ble det oppnådd 120 etterkommere, inkludert 45 svarte med kort hår, 30 svarte dunkaniner, 25 hvite med kort hår, 20 hvite dunkaniner.

Løsning. Teoretisk sett bør den forventede segregeringen i avkommet tilsvare forholdet mellom de fire fenotypene (9: 3: 3: 1). La oss beregne de teoretiske frekvensene (antall mål) for hver klasse:

9+3+3+1=16, som betyr at vi kan forvente at det blir svarte korthår ; svart dunet - ; hvit korthåret - ; hvit dunet - .

Den empiriske (faktiske) fordelingen av fenotyper var som følger: 45; tretti; 25; 20.

La oss oppsummere alle disse dataene i følgende tabell:

Ved å bruke Pearsons godhetstesten beregner vi verdien:

Antall frihetsgrader ved dihybrid kryssing. For betydningsnivå finne verdien . Fordi det , kan vi konkludere med at forskjellen mellom teoretiske og faktiske frekvenser ikke er tilfeldig. Følgelig avviker den resulterende gruppen av kaniner i fordelingen av fenotyper fra Mendels lov under dihybridkryssing og reflekterer påvirkningen av visse faktorer som endrer typen fenotypisk segregering i andre generasjon av krysninger.

Pearson chi-square goodness-of-fit-testen kan også brukes til å sammenligne to homogene empiriske fordelinger med hverandre, dvs. de som har samme klassegrenser. Nullhypotesen er hypotesen om at to ukjente fordelingsfunksjoner er like. Kjikvadrattesten i slike tilfeller bestemmes av formelen

(**)

hvor og er volumene til distribusjonene som sammenlignes; og - frekvenser for de tilsvarende klassene.

Tenk på en sammenligning av to empiriske fordelinger ved å bruke følgende eksempel.

Eksempel 3. Lengden på gjøkegg ble målt i to territorielle soner. I den første sonen ble en prøve på 76 egg () undersøkt, i den andre på 54 (). Følgende resultater ble oppnådd:

Lengde (mm)
Frekvenser
Frekvenser - - -

På signifikansnivået må vi teste nullhypotesen om at begge prøvene av egg tilhører samme gjøkpopulasjon.

UDDANNELSES- OG VITENSKAPSMINISTERIET I UKRAINA

AZOV REGIONAL INSTITUTT FOR LEDELSE

ZAPORIZHIE NATIONAL TECHNICAL UNIVERSITY

Institutt for matematikk

KURSARBEID

3 disipliner "STATISTIKK"

Om emnet: "KRITERIER FOR SAMTYKKE"

2. års studenter

Gruppe 207 Fakultet for ledelse

Batura Tatyana Olegovna

Vitenskapelig leder

Førsteamanuensis Kosenkov O.I.

Berdyansk - 2009


INTRODUKSJON

1.2 Pearsons χ 2 godhetstester for en enkel hypotese

1.3 Godhetskriterier for en kompleks hypotese

1.4 Fishers χ 2 godhetstester for en kompleks hypotese

1.5 Andre samtykkekriterier. Goodness-of-fit-tester for Poisson-distribusjonen

SEKSJON II. PRAKTISK ANVENDELSE AV AVTALSKRITERIET

APPLIKASJONER

LISTE OVER BRUKTE REFERANSER


INTRODUKSJON

Dette kursarbeidet beskriver de vanligste godhetstestene - omega-square, chi-square, Kolmogorov og Kolmogorov-Smirnov. Spesiell oppmerksomhet rettes mot tilfellet når det er nødvendig å sjekke om datadistribusjonen tilhører en viss parametrisk familie, for eksempel normal. På grunn av sin kompleksitet er denne situasjonen, som er svært vanlig i praksis, ikke fullt ut studert og reflekteres ikke fullt ut i undervisnings- og referanselitteratur.

Goodness-of-fit-kriterier er statistiske kriterier designet for å teste samsvaret mellom eksperimentelle data og en teoretisk modell. Dette spørsmålet utvikles best hvis observasjonene representerer et tilfeldig utvalg. Den teoretiske modellen i dette tilfellet beskriver fordelingsloven.

Den teoretiske fordelingen er sannsynlighetsfordelingen som styrer tilfeldig utvalg. Ikke bare teori kan gi ideer om det. Kunnskapskildene her kan være tradisjon, tidligere erfaringer og tidligere observasjoner. Vi må bare understreke at denne fordelingen bør velges uavhengig av hvilke data vi skal sjekke den mot. Det er med andre ord uakseptabelt først å "passe" en viss distribusjonslov ved å bruke en prøve, og deretter prøve å kontrollere samsvar med den innhentede loven ved å bruke samme prøve.

Enkle og komplekse hypoteser. Når vi snakker om den teoretiske distribusjonsloven, som elementene i en gitt prøve hypotetisk bør følge, må vi skille mellom enkle og komplekse hypoteser om denne loven:

· en enkel hypotese indikerer direkte en viss sannsynlighetslov (sannsynlighetsfordeling) som utvalgsverdiene oppsto i henhold til;

· en kompleks hypotese indikerer en enkelt fordeling, men et sett av dem (for eksempel en parametrisk familie).

Goodness-of-fit-kriterier er basert på bruk av ulike mål på avstander mellom den analyserte empiriske fordelingen og fordelingsfunksjonen til karakteristikken i populasjonen.

Ikke-parametriske godhetstester Kolmogorov, Smirnov og omega square er mye brukt. Imidlertid er de også forbundet med utbredte feil i bruken av statistiske metoder.

Faktum er at de listede kriteriene ble utviklet for å teste samsvar med en fullt kjent teoretisk fordeling. Beregningsformler, fordelinger og kritiske verdier er mye brukt. Hovedideen med Kolmogorov, omega kvadrat og lignende tester er å måle avstanden mellom den empiriske fordelingsfunksjonen og den teoretiske fordelingsfunksjonen. Disse kriteriene er forskjellige i typen avstander i rommet for distribusjonsfunksjoner.

Da jeg begynte å fullføre dette kursarbeidet, satte jeg meg som mål å finne ut hvilke samtykkekriterier som finnes og forstå hvorfor de trengs. For å oppnå dette målet må du fullføre følgende oppgaver:

1. Avslør essensen av konseptet "samtykkekriterier";

2. Bestem hvilke samtykkekriterier som finnes og studer dem separat;

3. Trekk konklusjoner på arbeidet som er utført.


SEKSJON I. TEORETISK BAKGRUNN FOR SAMTYKKEKRITERIET

1.1 Kolmogorov godhetstester og omega-kvadrat i tilfelle av en enkel hypotese

En enkel hypotese. La oss vurdere en situasjon der de målte dataene er tall, med andre ord endimensjonale tilfeldige variabler. Fordelingen av endimensjonale tilfeldige variabler kan beskrives fullstendig ved å spesifisere fordelingsfunksjonene deres. Og mange goodness-of-fit-tester er basert på å sjekke nærhet til de teoretiske og empiriske (utvalgs-) distribusjonsfunksjonene.

La oss anta at vi har et utvalg av n. La oss betegne den sanne fordelingsfunksjonen som observasjonene er underlagt, G(x), den empiriske (utvalgs)fordelingsfunksjonen, Fn(x), og den hypotetiske fordelingsfunksjonen, F(x). Da skrives hypotesen H om at den sanne fordelingsfunksjonen er F(x) på formen H: G(·) = F(·).

Hvordan teste hypotese H? Hvis H er sann, bør F n og F vise en viss likhet, og forskjellen mellom dem bør avta når n øker. På grunn av Bernoullis teorem, F n (x) → F(x) som n → ∞. For å kvantifisere likheten mellom funksjonene F n og F, brukes ulike metoder.

For å uttrykke likheten mellom funksjoner kan en eller annen avstand mellom disse funksjonene brukes. For eksempel kan du sammenligne F n og F i den enhetlige metrikken, dvs. vurdere verdien:

(1.1)

D n-statistikken kalles Kolmogorov-statistikken.

Selvfølgelig er D n en tilfeldig variabel, siden verdien avhenger av det tilfeldige objektet F n. Hvis hypotesen H 0 er sann og n → ∞, så F n (x) → F(x) for enhver x. Derfor er det naturlig at under disse forholdene D n → 0. Hvis hypotesen H 0 er feil, så F n → G og G ≠ F, og derfor sup -∞

Som alltid når vi tester en hypotese, resonnerer vi som om hypotesen var sann. Det er klart at H 0 bør avvises hvis den eksperimentelt oppnådde verdien av statistikken D n virker usannsynlig stor. Men for å gjøre dette, må du vite hvordan statistikken D n er fordelt under hypotese H: F = G for gitt n og G.

En bemerkelsesverdig egenskap ved D n er at hvis G = F, dvs. hvis den hypotetiske fordelingen er spesifisert riktig, så viser fordelingsloven til statistikken D n seg å være den samme for alle kontinuerlige funksjoner G. Det avhenger bare av utvalgsstørrelsen n.

Beviset for dette faktum er basert på det faktum at statistikk ikke endrer sin verdi under monotone transformasjoner av x-aksen. Med denne transformasjonen kan enhver kontinuerlig fordeling G gjøres om til en jevn fordeling på intervallet. I dette tilfellet vil F n (x) bli til fordelingsfunksjonen til prøven fra denne ensartede fordelingen.

For liten n er det satt sammen tabeller med prosentpoeng for statistikk D n under hypotesen H 0. For stor n er fordelingen av D n (under hypotesen H 0) angitt med grensesetningen funnet i 1933 av A.N. Kolmogorov. Hun snakker om statistikk

(siden verdien i seg selv D n → 0 ved H 0, er det nødvendig å multiplisere den med en ubegrenset voksende verdi for at fordelingen skal stabilisere seg). Kolmogorovs teorem sier at hvis H 0 er sann og hvis G er kontinuerlig:
(1.2)

Dette beløpet er veldig enkelt å beregne i Maple. For å teste en enkel hypotese H 0: G = F, er det nødvendig å beregne verdien av statistikken D n fra den opprinnelige prøven. En enkel formel fungerer for dette.

Definisjon 51. Kriterier som lar deg bedømme om verdiene er konsistente X 1 , X 2 ,…, x n tilfeldig variabel X med en hypotese om dens fordelingsfunksjon kalles samtykkekriterier.

Ideen om å bruke samtykkekriterier

La en hypotese testes basert på dette statistiske materialet N, bestående i at SV X overholder en bestemt distribusjonslov. Denne loven kan spesifiseres enten som en fordelingsfunksjon F(x), eller i form av distribusjonstetthet f(x), eller som et sett med sannsynligheter p i. Siden av alle disse former distribusjonsfunksjonen F(x) er den mest generelle (finnes for både DSV og NSV) og bestemmer alle andre, vil vi formulere en hypotese N, som består i at kvantumet X har en distribusjonsfunksjon F(x).

Å akseptere eller avvise en hypotese N, vurder en viss mengde U, som karakteriserer graden av divergens (avvik) av de teoretiske og statistiske fordelingene. OmfangetU kan velges på ulike måter: 1) summen av kvadrerte avvik av teoretiske sannsynligheter p i fra de tilsvarende frekvensene, 2) summen av de samme kvadratene med noen koeffisienter (vekter), 3) det maksimale avviket til den statistiske (empiriske) fordelingsfunksjonen fra den teoretiske F(x).

La verdien U valgt på en eller annen måte. Det er klart at dette er en tilfeldig variabel. Fordelingsloven U avhenger av fordelingsloven til den tilfeldige variabelen X, på hvilke forsøk som ble utført, og på antall forsøk n. Hvis hypotesen N er sant, da loven om fordeling av mengden U bestemt av loven om fordeling av mengden X(funksjon F(x)) og nummer n.

La oss anta at denne fordelingsloven er kjent. Som et resultat av denne serien av eksperimenter ble det oppdaget at det valgte målet for avvik U fikk en viss betydning u. Spørsmål: kan dette forklares av tilfeldige årsaker eller dette avviket er også er stor og indikerer tilstedeværelsen av en signifikant forskjell mellom de teoretiske og statistiske (empiriske) fordelingene og derfor uegnetheten til hypotesen N? For å svare på dette spørsmålet, anta at hypotesen N er korrekt, og under denne forutsetningen beregner vi sannsynligheten for at målet for avvik på grunn av tilfeldige årsaker assosiert med en utilstrekkelig mengde eksperimentelt materiale U vil ikke være mindre enn den eksperimentelt observerte verdien u, det vil si at vi beregner sannsynligheten for hendelsen: .

Hvis denne sannsynligheten er liten, så er hypotesen N bør avvises som lite plausibel, men hvis denne sannsynligheten er signifikant, konkluderer vi med at de eksperimentelle dataene ikke motsier hypotesen N.

Spørsmålet oppstår: hvordan skal måleverdien for avvik (avvik) velges? U? Det viser seg at med noen metoder for å velge det, loven om distribusjon av mengden U har svært enkle egenskaper og med en tilstrekkelig stor n praktisk talt uavhengig av funksjon F(x). Det er nettopp disse målene på avvik som brukes i matematisk statistikk som kriterier for enighet.

Definisjon 51/. Enighetskriteriet er kriteriet for å teste hypotesen om den antatte loven for en ukjent fordeling.

For kvantitative data med fordelinger nær normalen, bruk parametrisk metoder basert på indikatorer som matematisk forventning og standardavvik. Spesielt, for å bestemme påliteligheten til forskjellen i gjennomsnitt for to prøver, brukes Student-metoden (kriteriet), og for å bedømme forskjellene mellom tre eller flere prøver, testen F, eller variansanalyse. Hvis vi har å gjøre med ikke-kvantitative data eller prøvene er for små til å være sikre på at populasjonene de er tatt fra følger en normalfordeling, så bruk ikke-parametrisk metoder - kriterium χ 2(chi-square) eller Pearson for kvalitative data og tegn, rangeringer, Mann-Whitney, Wilcoxon, etc. tester for ordinære data.

I tillegg avhenger valg av statistisk metode av om utvalgene som sammenlignes med gjennomsnitt er uavhengig(dvs. for eksempel hentet fra to forskjellige faggrupper) eller avhengig(dvs. gjenspeiler resultatene fra samme gruppe personer før og etter eksponering eller etter to forskjellige eksponeringer).

s. 1. Pearson-test (- chi-square)

La det produseres n uavhengige eksperimenter, hvor den tilfeldige variabelen X tok en viss verdi, det vil si at et utvalg av observasjoner av den tilfeldige variabelen ble gitt X(generell befolkning) volum n. La oss vurdere oppgaven med å sjekke nærheten til de teoretiske og empiriske fordelingsfunksjonene for en diskret distribusjon, det vil si at det er nødvendig å sjekke om de eksperimentelle dataene er i samsvar med hypotesen N 0, angir at den tilfeldige variabelen X har en distribusjonslov F(x) på signifikansnivå α . La oss kalle denne loven "teoretisk".

Når du oppnår et godhetskriterium for å teste en hypotese, bestemmer du målet D avvik av den empiriske fordelingsfunksjonen til et gitt utvalg fra den estimerte (teoretiske) fordelingsfunksjonen F(x).

Det mest brukte målet er det introduserte av Pearson. La oss vurdere dette tiltaket. La oss dele settet med tilfeldige variabelverdier Xr sett - grupper S 1 , S 2 ,…, Sr, uten felles poeng. I praksis utføres en slik partisjon ved å bruke ( r- 1) tall c 1 < c 2 < … < c r-1 . I dette tilfellet er slutten av hvert intervall ekskludert fra det tilsvarende settet, og det venstre er inkludert.

S 1 S 2 S 3 …. Sr -1 Sr

c 1 c 2 c 3 c r -1

La p i, , - sannsynligheten for at SV X tilhører settet S i(åpenbart ). La n i, , - antall verdier (variant) blant de observerbare som tilhører settet S i(empiriske frekvenser). Deretter treffer den relative frekvensen av SV X i mange S in observasjoner. Det er åpenbart at .

For delingen ovenfor, p i det er en økning F(x) på settet S i, og økningen er på samme sett. La oss oppsummere resultatene av forsøkene i en tabell i form av en gruppert statistisk serie.

Gruppegrenser Relativ frekvens
S 1:x 1 – x 2
S 2: x 2 – x 3
Sr: x rx r +1

Når du kjenner den teoretiske distribusjonsloven, kan du finne de teoretiske sannsynlighetene for at en tilfeldig variabel faller inn i hver gruppe: R 1 , R 2 , …, p r. Når vi sjekker konsistensen av de teoretiske og empiriske (statistiske) fordelingene, vil vi gå ut fra avvikene mellom de teoretiske sannsynlighetene p i og observerte frekvenser.

For mål D avvikene (avvikene) til den empiriske fordelingsfunksjonen fra den teoretiske tar summen av de kvadrerte avvikene til de teoretiske sannsynlighetene p i fra de tilsvarende frekvensene tatt med visse "vekter" c i: .

Odds c i introduseres fordi, i det generelle tilfellet, kan avvik som tilhører ulike grupper ikke anses som like i betydning: et avvik med samme absolutte verdi kan ha liten betydning dersom sannsynligheten i seg selv p i er stor, og veldig merkbar hvis den er liten. Derfor er naturligvis "vektene" c i ta omvendt proporsjonalt med sannsynlighetene. Hvordan velge denne koeffisienten?

K. Pearson viste at hvis vi setter , så for store n loven om fordeling av kvantum U har svært enkle egenskaper: den er praktisk talt uavhengig av fordelingsfunksjonen F(x) og på antall eksperimenter n, men avhenger kun av antall grupper r, nemlig denne loven med økende n nærmer seg den såkalte kjikvadratfordelingen .

Hvis du trenger ytterligere materiale om dette emnet, eller du ikke fant det du lette etter, anbefaler vi å bruke søket i vår database over verk:

Hva skal vi gjøre med det mottatte materialet:

Hvis dette materialet var nyttig for deg, kan du lagre det på siden din på sosiale nettverk:

For å teste hypotesen om samsvar mellom den empiriske fordelingen og den teoretiske distribusjonsloven, brukes spesielle statistiske indikatorer - goodness-of-fit-kriterier (eller samsvarskriterier). Disse inkluderer kriteriene til Pearson, Kolmogorov, Romanovsky, Yastremsky, etc. De fleste avtalekriterier er basert på bruk av avvik av empiriske frekvenser fra teoretiske. Jo mindre disse avvikene er, jo bedre samsvarer den teoretiske fordelingen med den empiriske (eller beskriver den).

Samtykkekriterier- dette er kriterier for å teste hypoteser om samsvar mellom den empiriske fordelingen og den teoretiske sannsynlighetsfordelingen. Slike kriterier er delt inn i to klasser: generelle og spesielle. Generelle godhetstester gjelder for den mest generelle formuleringen av en hypotese, nemlig hypotesen om at observerte resultater stemmer overens med enhver a priori antatt sannsynlighetsfordeling. Spesielle goodness-of-fit-tester involverer spesielle nullhypoteser som angir samsvar med en bestemt form for sannsynlighetsfordeling.

Avtalekriterier, basert på den etablerte distribusjonsloven, gjør det mulig å fastslå når avvik mellom teoretiske og empiriske frekvenser skal anses som ubetydelige (tilfeldig), og når - signifikante (ikke-tilfeldige). Det følger av dette at avtalekriteriene gjør det mulig å forkaste eller bekrefte riktigheten av hypotesen som fremsettes ved innretting av serien om fordelingens art i empirien og å svare på om det er mulig å akseptere for en gitt empirisk fordeling. en modell uttrykt av en eller annen teoretisk distribusjonslov.

Pearson godhet-of-fit test c 2 (kikvadrat) er et av hovedkriteriene for enighet. Foreslått av den engelske matematikeren Karl Pearson (1857-1936) for å vurdere tilfeldigheten (betydningen) av avvik mellom frekvensene til empiriske og teoretiske distribusjoner:

Ordningen for å anvende kriterium c 2 for å vurdere konsistensen av teoretiske og empiriske fordelinger kommer ned til følgende:

1. Det beregnede mål for avvik bestemmes.

2. Antall frihetsgrader bestemmes.

3. Basert på antall frihetsgrader bestemmes n, ved hjelp av en spesiell tabell.

4. Hvis , så for et gitt signifikansnivå α og antall frihetsgrader n, forkastes hypotesen om insignifikansen (tilfeldigheten) av avvikene. Ellers kan hypotesen erkjennes som ikke i motsetning til de eksperimentelle dataene som er oppnådd og med sannsynlighet (1 – α) kan det hevdes at avvikene mellom teoretiske og empiriske frekvenser er tilfeldige.

Signifikansnivå er sannsynligheten for feilaktig å forkaste den fremsatte hypotesen, dvs. sannsynligheten for at en korrekt hypotese vil bli forkastet. I statistiske studier, avhengig av viktigheten og ansvaret for problemene som løses, brukes følgende tre signifikansnivåer:

1) a = 0,1, da R = 0,9;

2) a = 0,05, da R = 0,95;

3) a = 0,01, da R = 0,99.

Ved bruk av avtalekriteriet c 2 må følgende vilkår være oppfylt:

1. Volumet av befolkningen som studeres må være stort nok ( N≥ 50), mens frekvensen eller gruppestørrelsen må være minst 5. Hvis denne betingelsen brytes, er det nødvendig å først kombinere små frekvenser (mindre enn 5).

2. Den empiriske fordelingen skal bestå av data innhentet som følge av stikkprøver, d.v.s. de må være uavhengige.

Ulempen med Pearsons godhet-of-fit-kriteriet er tapet av noe av den opprinnelige informasjonen knyttet til behovet for å gruppere observasjonsresultater i intervaller og kombinere individuelle intervaller med et lite antall observasjoner. I denne forbindelse anbefales det å supplere kontrollen av distribusjonsoverholdelse i henhold til kriteriet med 2 andre kriterier. Dette er spesielt nødvendig med en relativt liten prøvestørrelse ( n ≈ 100).

I statistikk Kolmogorov godhet-of-fit test(også kjent som Kolmogorov-Smirnov goodness-of-fit-testen) brukes til å bestemme om to empiriske fordelinger overholder samme lov, eller for å bestemme om en resulterende fordeling adlyder en antatt modell. Kolmogorov-kriteriet er basert på å bestemme maksimal avvik mellom akkumulerte frekvenser eller frekvenser av empiriske eller teoretiske distribusjoner. Kolmogorov-kriteriet beregnes ved å bruke følgende formler:

Hvor D Og d- følgelig den maksimale forskjellen mellom de akkumulerte frekvensene ( ff¢) og mellom akkumulerte frekvenser ( ss¢) empiriske og teoretiske serier av distribusjoner; N- antall enheter i aggregatet.

Etter å ha beregnet verdien av λ, brukes en spesiell tabell for å bestemme sannsynligheten for at det kan fastslås at avvik av empiriske frekvenser fra teoretiske er tilfeldige. Hvis tegnet tar verdier opp til 0,3, betyr dette at det er et fullstendig sammenfall av frekvenser. Med et stort antall observasjoner er Kolmogorov-testen i stand til å oppdage ethvert avvik fra hypotesen. Dette betyr at enhver forskjell i utvalgsfordelingen fra den teoretiske vil bli oppdaget ved hjelp av den dersom det er et tilstrekkelig stort antall observasjoner. Den praktiske betydningen av denne egenskapen er ikke signifikant, siden det i de fleste tilfeller er vanskelig å regne med å få et stort antall observasjoner under konstante forhold, den teoretiske ideen om distribusjonsloven som prøven skal følge er alltid omtrentlig, og Nøyaktigheten til statistiske tester bør ikke overstige nøyaktigheten til den valgte modellen.

Romanovskys godhet-of-fit-test er basert på bruken av Pearson-kriteriet, dvs. allerede funnet verdier av c 2, og antall frihetsgrader:

hvor n er antall grader av variasjonsfrihet.

Romanovsky-kriteriet er praktisk i fravær av tabeller for. Hvis< 3, то расхождения распределений случайны, если же >3, da er de ikke tilfeldige og den teoretiske fordelingen kan ikke tjene som modell for den empiriske fordelingen som studeres.

B.S. Yastremsky brukte i kriteriet om enighet ikke antall frihetsgrader, men antall grupper ( k), en spesiell verdi på q, avhengig av antall grupper, og en kjikvadratverdi. Yastremskis godhet-of-fit test har samme betydning som Romanovsky-kriteriet og uttrykkes med formelen

hvor c 2 er Pearsons godhet-of-fit-kriterium; - antall grupper; q - koeffisient, for antall grupper mindre enn 20, lik 0,6.

Hvis L faktum > 3, er avvikene mellom teoretiske og empiriske fordelinger ikke tilfeldige, dvs. den empiriske fordelingen oppfyller ikke kravene til en normalfordeling. Hvis L faktum< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Hypotesen som testes kalles vanligvis nullhypotesen. H 0, regelen som en hypotese aksepteres eller forkastes etter kalles et statistisk kriterium. Statistiske kriterier som brukes til å teste hypoteser om typen distribusjonslover kalles goodness-of-fit-kriterier. De. avtalekriteriene fastslår når avvikene som faktisk oppnås mellom de antatte teoretiske og eksperimentelle fordelingene er: ubetydelig - tilfeldig og når signifikant - ikke-tilfeldig.

La oss vurdere en tilfeldig variabel som karakteriserer typen eller funksjonen til avviket mellom den forventede teoretiske og eksperimentelle fordelingen av attributtet, så kan vi ut fra den eksisterende eksperimentelle fordelingen bestemme verdien en, som den tilfeldige variabelen har tatt, hvis dens fordelingslov er kjent, så er det ikke vanskelig å finne sannsynligheten for at den tilfeldige variabelen vil ha en verdi som ikke er mindre enn en. Hvis verdien en oppnådd som et resultat av å observere en tilfeldig variabel x, dvs. når karakteristikken som vurderes er fordelt etter den antatte teoretiske loven, bør sannsynligheten ikke være liten. Hvis sannsynligheten viser seg å være liten, så er dette forklart av det faktum at den faktiske verdien som oppnås ikke er en tilfeldig variabel x, og noen andre med en annen distribusjonslov, dvs. karakteristikken som studeres er ikke fordelt i henhold til forventet lov. Således, i det tilfellet hvor avviket mellom den empiriske og teoretiske fordelingen ikke er liten, bør den anses som ikke signifikant - tilfeldig, og de eksperimentelle og teoretiske fordelingene er ikke motstridende, dvs. konsistente med hverandre.

Hvis sannsynligheten er lav, så er avvikene mellom den eksperimentelle og teoretiske fordelingen betydelige, de kan ikke forklares ved en tilfeldighet, og hypotesen om fordelingen av karakteristikken i henhold til den antatte teoretiske loven bør anses som ikke bekreftet, den stemmer ikke overens med eksperimentelle data. Det er nødvendig, etter å ha studert de eksperimentelle dataene nøye, å prøve å finne en ny lov om kvaliteten på den foreslåtte egenskapen, som bedre og mer fullstendig vil reflektere egenskapene til den eksperimentelle fordelingen; slike sannsynligheter anses som små og tas ikke til overstige 0,1.

Pearsons godhetstester eller -kriterierc 2.

La analysen av eksperimentelle data føre til valg av en viss distribusjonslov som antatt for karakteristikken under vurdering, og i henhold til de eksperimentelle dataene som et resultat av n-observasjoner, ble parametere funnet (hvis de ikke var kjent tidligere). La oss betegne med n i- empiriske frekvenser av en tilfeldig variabel x.

n×P i-teoretiske frekvenser som representerer produktet av antall observasjoner n på sannsynlighet P i- beregnet etter antatt teoretisk fordeling. Samtykkekriterier c 2 målet for avviket mellom den teoretiske og empiriske frekvensserien er tatt for å være


;

c 2- mengden som kalles c 2 distribusjon eller Pearson-distribusjon. Den er lik 0 bare når alle empiriske og teoretiske frekvenser faller sammen; i andre tilfeller er den forskjellig fra 0 og jo større avviket er mellom de angitte frekvensene, desto større er forskjellen. Det er bevist at den valgte egenskapen c 2 eller statistikken for n®¥ har en Pearson-fordeling med frihetsgrader

k=m-s- 1.

Hvor m-antall intervaller av den empiriske fordelingen av variasjonsseriene eller antall grupper.

s-antall parametere for den teoretiske fordelingen bestemt fra eksperimentelle data (for eksempel, i tilfelle av en normalfordeling, er antall parametere estimert fra prøven 2).

Ordningen for å anvende kriteriet er som følger:

1. Basert på eksperimentelle data, velg fordelingsloven for karakteristikken som den forventede og finn dens parametere.

2. Ved å bruke den resulterende fordelingen bestemmes de teoretiske frekvensene som tilsvarer de eksperimentelle frekvensene.

3. Eventuelle små eksperimentelle frekvenser kombineres med nabofrekvenser, deretter bestemmes verdien ved hjelp av formelen c 2 .

4. Bestem antall frihetsgrader k .

5. Fra applikasjonstabellene for det valgte signifikansnivået en finn den kritiske verdien når antallet frihetsgrader er likt k .

6. Vi formulerer en konklusjon, veiledet av det generelle prinsippet om å anvende avtalekriterier, nemlig hvis sannsynligheten er >0,01, så anses de eksisterende avvikene mellom teoretiske og eksperimentelle frekvenser som ubetydelige.

Hvis den faktisk observerte verdien er større enn den kritiske verdien, da H 0 avvist hvis hypotesen ikke motsier eksperimentelle data. Kriterium c 2 gir tilfredsstillende resultater dersom det er tilstrekkelig antall observasjoner i hvert grupperingsintervall n i .

Merk: Hvis i noe intervall antall observasjoner<5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах n i var ikke mindre enn 5. Dessuten, når man beregner antall frihetsgrader k som m- det tas et tilsvarende redusert antall intervaller.

Følgende fordeling på 100 verkstedarbeidere etter produksjon i rapporteringsåret ble oppnådd

(i % av året før).