Biografier Kjennetegn Analyse

Uavhengige tilfeldige variabler. Operasjoner på tilfeldige variabler

For å løse mange praktiske problemer, er det nødvendig å kjenne til et sett med forhold på grunn av hvilke resultatet av den kumulative påvirkningen stor mengde tilfeldige faktorer er nesten uavhengige av tilfeldigheter. Disse forholdene er beskrevet i flere teoremer kalt vanlig navn lov store antall, hvor den tilfeldige variabelen k er lik 1 eller 0 avhengig av om resultatet av den kth forsøket er suksess eller fiasko. Dermed er Sn summen av n gjensidig uavhengig tilfeldige variabler, som hver tar verdiene 1 og 0 med sannsynlighetene p og q.

Den enkleste formen for loven om store tall er Bernoullis teorem, som sier at hvis sannsynligheten for en hendelse er den samme i alle forsøk, vil frekvensen av hendelsen tendere til sannsynligheten for hendelsen når antallet forsøk øker. slutter å være tilfeldig.

Poissons teorem sier at frekvensen av en hendelse i en serie uavhengige tester har en tendens til det aritmetiske gjennomsnittet av sannsynlighetene og slutter å være tilfeldig.

Grensesetninger for sannsynlighetsteori, Moivre-Laplace-teoremet forklarer arten av stabiliteten til frekvensen av forekomst av en hendelse. Denne naturen ligger i det faktum at den begrensende fordelingen av antall forekomster av en hendelse med en ubegrenset økning i antall forsøk (hvis sannsynligheten for hendelsen er den samme i alle forsøk) er en normalfordeling.

Sentral grensesetning forklarer utbredt normalfordelingsloven. Teoremet sier at når en tilfeldig variabel dannes som et resultat av addisjon stort antall uavhengige tilfeldige variabler med endelige varianser, viser fordelingsloven til denne tilfeldige variabelen seg å være en nesten normal lov.

Lyapunovs teorem forklarer den utbredte fordelingen av normalfordelingsloven og forklarer mekanismen for dens dannelse. Teoremet tillater oss å si at når en tilfeldig variabel dannes som et resultat av tillegg av et stort antall uavhengige tilfeldige variabler, hvis varians er små sammenlignet med spredningen av summen, endres fordelingsloven til denne tilfeldige variabelen. ut til å være en nesten normal lov. Og siden tilfeldige variabler alltid genereres av et uendelig antall årsaker og som oftest ingen av dem har en spredning som kan sammenlignes med spredningen av selve tilfeldige variabelen, er de fleste tilfeldige variabler man møter i praksis underlagt normalfordelingsloven.

De kvalitative og kvantitative utsagnene til loven om store tall er basert på Chebyshev ulikhet. Den bestemmer den øvre grensen for sannsynligheten for at avviket til verdien av en tilfeldig variabel fra dens matematiske forventning er større enn et visst spesifisert tall. Det er bemerkelsesverdig at Chebyshevs ulikhet gir et estimat av sannsynligheten for en hendelse for en tilfeldig variabel hvis fordeling er ukjent, bare dens matematisk forventning og spredning.

Chebyshevs ulikhet. Hvis en tilfeldig variabel x har varians, er følgende ulikhet sann for enhver x > 0, hvor M x og D x - matematisk forventning og varians av tilfeldig variabel x.

Bernoullis teorem. La x n være antall suksesser i n Bernoulli-forsøk og p sannsynligheten for suksess i en individuell prøve. Så for enhver s > 0 er det sant.

Lyapunovs teorem. La s 1, s 2, …, s n, … være en ubegrenset sekvens av uavhengige tilfeldige variabler med matematiske forventninger m 1, m 2, …, m n, … og varianser s 1 2, s 2 2, …, s n 2 …. La oss betegne.

Deretter = Ф(b) - Ф(a) for en hvilken som helst reelle tall a og b, hvor Ф(x) er normalfordelingsfunksjonen.

La en diskret tilfeldig variabel gis. La oss vurdere avhengigheten av antall suksesser Sn på antall forsøk n. For hvert forsøk øker Sn med 1 eller 0. Denne uttalelsen kan skrives som:

Sn = 1 +…+ n. (1.1)

Loven om store tall. La (k) være en sekvens av gjensidig uavhengige tilfeldige variabler med identiske fordelinger. Hvis den matematiske forventningen = M(k) eksisterer, så for enhver > 0 for n

Sannsynligheten for at gjennomsnittlig S n /n skiller seg fra den matematiske forventningen med mindre enn en vilkårlig gitt verdi tenderer med andre ord til én.

Sentral grensesetning. La (k) være en sekvens av gjensidig uavhengige tilfeldige variabler med identiske fordelinger. La oss anta at de eksisterer. La Sn = 1 +…+ n , Deretter for enhver fast

F () -- F () (1,3)

Her F (x) -- normal funksjon jeg deler ut. Denne teoremet ble formulert og bevist av Linlberg. Lyapunov og andre forfattere beviste det tidligere, under mer restriktive forhold. Det er nødvendig å forestille seg at teoremet formulert ovenfor bare er et helt spesielt tilfelle av mye mer generell teorem, som igjen er nært knyttet til mange andre grensesetninger. Merk at (1.3) er mye sterkere enn (1.2), siden (1.3) gir et estimat for sannsynligheten for at forskjellen er større enn. På den annen side er loven om store tall (1.2) sann selv om de tilfeldige variablene k ikke har endelig varians, så den gjelder for flere generell sak enn sentralgrensesetningen (1.3). La oss illustrere de to siste teoremene med eksempler.

Eksempler. a) Tenk på en sekvens av uavhengige kast av en symmetrisk terning. La k være antall poeng oppnådd under det kth kastet. Da

M(k)=(1+2+3+4+5+6)/6=3,5,

a D(k)=(1 2 +2 2 +3 2 +4 2 +5 2 +6 2)/6-(3,5) 2 =35/12 og S n /n

er gjennomsnittlig antall poeng fra n kast.

Loven om store tall sier at det er sannsynlig at for store n vil dette gjennomsnittet være nær 3,5. The Central Limit Theorem angir sannsynligheten for at |Sn -- 3,5n |< (35n/12) 1/2 близка к Ф() -- Ф(-). При n = 1000 и а=1 мы находим, что вероятность неравенства 3450 < Sn < 3550 равна примерно 0,68. Выбрав для а значение а 0 = 0,6744, удовлетворяющее соотношению Ф(0)-- Ф(-- 0)=1/2, мы получим, что для Sn шансы находиться внутри или вне интервала 3500 36 примерно одинаковы.

b) Prøvetaking. La oss anta at i befolkning,

bestående av N familier, Nk familier har nøyaktig k barn hver

(k = 0, 1 ...; Nk = N). Hvis en familie er valgt tilfeldig, så er antall barn i den en tilfeldig variabel som tar en verdi med sannsynlighet p = N/N. I rygg-til-rygg-seleksjon kan man se et utvalg av størrelse n som en samling av n uavhengige tilfeldige variabler eller "observasjoner" 1, ..., n som alle har samme fordeling; S n /n er prøvegjennomsnittet. Loven om store tall sier at for en tilstrekkelig stor tilfeldig utvalg dens gjennomsnitt vil trolig være nær, det vil si befolkningsgjennomsnittet. Den sentrale grensesetningen lar en estimere den sannsynlige størrelsen på avviket mellom disse middelene og bestemme prøvestørrelsen som kreves for et pålitelig estimat. I praksis, og og er vanligvis ukjente; men i de fleste tilfeller er det enkelt å få et foreløpig estimat for og kan alltid være innelukket innenfor pålitelige grenser. Hvis vi ønsker en sannsynlighet på 0,99 eller større for at utvalgsgjennomsnittet S n /n avviker fra det ukjente populasjonsmiddelet med mindre enn 1/10, må prøvestørrelsen tas slik at

X-roten av ligningen Ф(x) - Ф(-- x) = 0,99 er lik x = 2,57 ..., og derfor må n være slik at 2,57 eller n > 660. Et nøye foreløpig estimat gjør det mulig å finne ønsket utvalgsstørrelse.

c) Giftfordeling.

Anta at de tilfeldige variablene k har en Poisson-fordeling (p(k;)). Da har Sn en Poisson-fordeling med gjennomsnitt og varians lik n.

Ved å skrive i stedet for n, konkluderer vi med at for n

Summeringen utføres over alle k fra 0 til. Ph-la (1.5) gjelder også når det er på en vilkårlig måte.

La standardavvikene til flere gjensidig uavhengige stokastiske variabler være kjent. Hvordan finne gjennomsnittet standardavvik summen av disse mengdene? Svaret på dette spørsmålet er gitt av følgende teorem.

Teorem. Standardavvik for summen endelig antall gjensidig uavhengige tilfeldige variabler er lik kvadratrot fra summen av kvadratene til standardavvikene til disse mengdene."

Bevis. La oss betegne med X summen av gjensidig betraktet uavhengige mengder:

Variansen av summen av flere av hverandre uavhengige stokastiske variabler er lik summen av variansene til leddene (se § 5, konsekvens 1), derfor

eller til slutt

Identisk fordelte gjensidig uavhengige tilfeldige variabler

Det er allerede kjent at man ifølge distribusjonsloven kan finne numeriske egenskaper tilfeldig variabel. Det følger at hvis flere tilfeldige variabler har identiske fordelinger, så er deres numeriske egenskaper de samme.

La oss vurdere n gjensidig uavhengige tilfeldige variabler X v X v ..., Xfi, som har de samme fordelingene, og derfor de samme egenskapene (matematisk forventning, spredning osv.). Mest interesse representerer studiet av de numeriske egenskapene til det aritmetiske gjennomsnittet av disse størrelsene, som er det vi skal gjøre i denne delen.

La oss betegne det aritmetiske gjennomsnittet av de tilfeldige variablene som vurderes med X:

De følgende tre bestemmelsene etablerer en sammenheng mellom de numeriske egenskapene til det aritmetiske gjennomsnittet X og de tilsvarende egenskapene til hver enkelt mengde.

1. Den matematiske forventningen til det aritmetiske gjennomsnittet av identisk fordelte gjensidig uavhengige tilfeldige variabler er lik den matematiske forventningen a for hver av variablene:

Bevis. Ved å bruke egenskapene til matematisk forventning (den konstante faktoren kan tas ut av tegnet til den matematiske forventningen; den matematiske forventningen til summen er lik summen av de matematiske forventningene til leddene), har vi


Tar i betraktning at den matematiske forventningen til hver av mengdene i henhold til betingelsen er lik EN, får vi

2. Spredningen av det aritmetiske gjennomsnittet av n identisk fordelte gjensidig uavhengige tilfeldige variabler er n ganger mindre enn spredningen D for hver av variablene:

Bevis. Ved å bruke egenskapene til spredning (konstantfaktoren kan tas ut av spredningstegnet ved å kvadrere det; spredningen av summen av uavhengige størrelser er lik summen av spredningen av leddene), har vi

§ 9. Identisk fordelte innbyrdes uavhengige stokastiske variabler 97

Når vi tar i betraktning at spredningen av hver av mengdene etter betingelse er lik D, får vi

3. Standardavvik for det aritmetiske gjennomsnittet av n identisk fordelt gjensidig uavhengig tilfeldig

verdiene er 4n ganger mindre enn standardavviket a for hver av verdiene:

Bevis. Fordi D(X) = D/n deretter standardavviket X lik

Generell konklusjon fra formlene (*) og (**): Når vi husker at spredningen og standardavviket tjener som mål på spredningen av en tilfeldig variabel, konkluderer vi med at det aritmetiske gjennomsnittet av et tilstrekkelig stort antall gjensidig uavhengige tilfeldige variabler har

betydelig mindre spredning enn hver enkelt verdi.

La oss forklare med et eksempel betydningen av denne konklusjonen for praksis.

Eksempel. Vanligvis for å måle noen fysisk mengde gjør flere målinger, og finn deretter det aritmetiske gjennomsnittet av de oppnådde tallene, som tas som en omtrentlig verdi av den målte verdien. Forutsatt at målingene er gjort under de samme forholdene, bevis:

  • a) det aritmetiske gjennomsnittet gir et mer pålitelig resultat enn individuelle målinger;
  • b) med en økning i antall målinger, øker påliteligheten til dette resultatet.

Løsning, a) Det er kjent at individuelle målinger gir ulik verdi av den målte mengden. Resultatet av hver måling avhenger av mange tilfeldige årsaker (temperaturendringer, instrumentsvingninger osv.), som ikke fullt ut kan tas i betraktning på forhånd.

Derfor har vi rett til å vurdere mulige resultater n individuelle målinger som tilfeldige variabler X v X 2,..., X p(indeksen angir målenummeret). Disse størrelsene har samme sannsynlighetsfordeling (målinger gjøres ved hjelp av samme teknikk og samme instrumenter), og derfor de samme numeriske karakteristikkene; i tillegg er de gjensidig uavhengige (resultatet av hver enkelt måling avhenger ikke av andre målinger).

Vi vet allerede at det aritmetiske gjennomsnittet av slike mengder har mindre spredning enn hver enkelt størrelse. Det aritmetiske gjennomsnittet viser seg med andre ord å være nærmere den sanne verdien av den målte verdien enn resultatet av en separat måling. Dette betyr at det aritmetiske gjennomsnittet av flere målinger gir et mer kasusresultat enn en enkelt måling.

b) Vi vet allerede at når antallet individuelle tilfeldige variabler øker, avtar spredningen av det aritmetiske gjennomsnittet. Dette betyr at etter hvert som antall målinger øker, vil det aritmetiske gjennomsnittet av flere målinger avvike mindre og mindre fra sann mening målt mengde. Ved å øke antall målinger oppnås således et mer pålitelig resultat.

For eksempel hvis standardavviket for en individuell måling er a = 6 m, og totalt n= 36 målinger, da er standardavviket for det aritmetiske gjennomsnittet for disse målingene faktisk bare 1 m.

Vi ser at det aritmetiske gjennomsnittet av flere målinger, som man kunne forvente, viste seg å være nærmere den sanne verdien av den målte verdien enn resultatet av en separat måling.

Kursarbeid

om emnet: "Lover om store tall"


Identisk fordelte tilfeldige variabler

For å løse mange praktiske problemer, er det nødvendig å kjenne til et sett med forhold på grunn av hvilke resultatet av den kombinerte påvirkningen av et stort antall tilfeldige faktorer er nesten uavhengig av tilfeldigheter. Disse forholdene er beskrevet i flere teoremer, samlet kalt loven om store tall, der den tilfeldige variabelen k er lik 1 eller 0 avhengig av om resultatet av den k-te forsøket er suksess eller fiasko. Dermed er Sn summen av n gjensidig uavhengige tilfeldige variabler, som hver tar verdiene 1 og 0 med sannsynligheter p og q.

Den enkleste formen for loven om store tall er Bernoullis teorem, som sier at hvis sannsynligheten for en hendelse er den samme i alle forsøk, vil frekvensen av hendelsen tendere til sannsynligheten for hendelsen når antallet forsøk øker. slutter å være tilfeldig.

Poissons teorem sier at frekvensen av en hendelse i en serie uavhengige forsøk har en tendens til det aritmetiske gjennomsnittet av dens sannsynligheter og slutter å være tilfeldig.

Grensesetninger for sannsynlighetsteori, Moivre-Laplace-teoremet forklarer arten av stabiliteten til frekvensen av forekomst av en hendelse. Denne naturen ligger i det faktum at den begrensende fordelingen av antall forekomster av en hendelse med en ubegrenset økning i antall forsøk (hvis sannsynligheten for hendelsen er den samme i alle forsøk) er en normalfordeling.

Sentralgrensesetningen forklarer den utbredte fordelingen av normalfordelingsloven. Teoremet sier at når en tilfeldig variabel dannes som et resultat av tillegg av et stort antall uavhengige tilfeldige variabler med endelige varianser, viser fordelingsloven til denne tilfeldige variabelen seg å være en nesten normal lov.

Lyapunovs teorem forklarer den utbredte fordelingen av normalfordelingsloven og forklarer mekanismen for dens dannelse. Teoremet tillater oss å si at når en tilfeldig variabel dannes som et resultat av tillegg av et stort antall uavhengige tilfeldige variabler, hvis varians er små sammenlignet med spredningen av summen, endres fordelingsloven til denne tilfeldige variabelen. ut til å være en nesten normal lov. Og siden tilfeldige variabler alltid genereres av et uendelig antall årsaker og som oftest ingen av dem har en spredning som kan sammenlignes med spredningen av selve tilfeldige variabelen, er de fleste tilfeldige variabler man møter i praksis underlagt normalfordelingsloven.

De kvalitative og kvantitative utsagnene til loven om store tall er basert på Chebyshev ulikhet. Den bestemmer den øvre grensen for sannsynligheten for at avviket til verdien av en tilfeldig variabel fra dens matematiske forventning er større enn et visst spesifisert tall. Det er bemerkelsesverdig at Chebyshevs ulikhet gir et estimat av sannsynligheten for en hendelse for en tilfeldig variabel hvis fordeling er ukjent, bare dens matematiske forventning og varians er kjent.

Chebyshevs ulikhet. Hvis en tilfeldig variabel x har varians, er ulikheten sann for enhver x > 0, hvor M x og D x - matematisk forventning og varians av tilfeldig variabel x.

Bernoullis teorem. La x n være antall suksesser i n Bernoulli-forsøk og p sannsynligheten for suksess i en individuell prøve. Deretter, for alle s > 0, .

Lyapunovs teorem. La s 1 , s 2 , …, s n , … være en ubegrenset sekvens av uavhengige tilfeldige variabler med matematiske forventninger m 1 , m 2 , …, m n , … og varianser s 1 2 , s 2 2 , …, s n 2 … . La oss betegne , , , .

Da = Ф(b) - Ф(a) for alle reelle tall a og b, hvor Ф(x) er normalfordelingsfunksjonen.

La en diskret tilfeldig variabel gis. La oss vurdere avhengigheten av antall suksesser Sn på antall forsøk n. For hvert forsøk øker Sn med 1 eller 0. Denne uttalelsen kan skrives som:

Sn = 1 +…+ n. (1.1)

Loven om store tall. La (k) være en sekvens av gjensidig uavhengige tilfeldige variabler med identiske fordelinger. Hvis den matematiske forventningen = M(k) eksisterer, så for enhver > 0 for n

Sannsynligheten for at gjennomsnittlig S n /n skiller seg fra den matematiske forventningen med mindre enn en vilkårlig gitt verdi tenderer med andre ord til én.

Sentral grensesetning. La (k) være en sekvens av gjensidig uavhengige tilfeldige variabler med identiske fordelinger. La oss anta at de eksisterer. La Sn = 1 +…+ n , Deretter for enhver fast

F () - F () (1,3)

Her er Ф(х) normalfordelingsfunksjonen. Denne teoremet ble formulert og bevist av Linlberg. Lyapunov og andre forfattere beviste det tidligere, under mer restriktive forhold. Det er nødvendig å forestille seg at teoremet formulert ovenfor kun er et helt spesielt tilfelle av en mye mer generell teorem, som igjen er nært knyttet til mange andre grensesetninger. Merk at (1.3) er mye sterkere enn (1.2), siden (1.3) gir et estimat for sannsynligheten for at forskjellen er større enn . På den annen side er loven om store tall (1.2) sann selv om de tilfeldige variablene k ikke har endelig varians, så den gjelder for et mer generelt tilfelle enn sentralgrensesetningen (1.3). La oss illustrere de to siste teoremene med eksempler.

Eksempler. a) Tenk på en sekvens av uavhengige kast av en symmetrisk terning. La k være antall poeng oppnådd under det kth kastet. Da

M(k)=(1+2+3+4+5+6)/6=3,5,

a D( k)=(1 2 +2 2 +3 2 +4 2 +5 2 +6 2)/6-(3,5) 2 =35/12 og S n /n

er gjennomsnittlig antall poeng fra n kast.

Loven om store tall sier at det er sannsynlig at for store n vil dette gjennomsnittet være nær 3,5. Sentralgrensesetningen angir sannsynligheten for at |Sn - 3,5n |< (35n/12) 1/2 близка к Ф() - Ф(- ). При n = 1000 и а=1 мы находим, что вероятность неравенства 3450 < Sn < 3550 равна примерно 0,68. Выбрав для а значение а 0 = 0,6744, удовлетворяющее соотношению Ф( 0)- Ф(- 0)=1/2, мы получим, что для Sn шансы находиться внутри или вне интервала 3500 36 примерно одинаковы.

b) Prøvetaking. La oss anta at i befolkningen,

bestående av N familier, Nk familier har nøyaktig k barn hver

(k = 0, 1 ...; Nk = N). Hvis en familie er valgt tilfeldig, så er antall barn i den en tilfeldig variabel som tar en verdi med sannsynlighet p = N /N. I rygg-til-rygg-seleksjon kan man se et utvalg av størrelse n som en samling av n uavhengige tilfeldige variabler eller "observasjoner" 1, ..., n som alle har samme fordeling; S n /n er prøvegjennomsnittet. Loven om store tall sier at for et stort nok tilfeldig utvalg vil gjennomsnittet sannsynligvis være nær , det vil si populasjonsgjennomsnittet. Den sentrale grensesetningen lar en estimere den sannsynlige størrelsen på avviket mellom disse middelene og bestemme prøvestørrelsen som kreves for et pålitelig estimat. I praksis, og og er vanligvis ukjente; men i de fleste tilfeller er det enkelt å få et foreløpig estimat for og kan alltid være innelukket innenfor pålitelige grenser. Hvis vi ønsker en sannsynlighet på 0,99 eller større for at utvalgsgjennomsnittet S n /n avviker fra det ukjente populasjonsmiddelet med mindre enn 1/10, må prøvestørrelsen tas slik at

X-roten av ligningen F(x) - F(- x) = 0,99 er x = 2,57..., og derfor må n være slik at 2,57 eller n > 660. Et nøye foreløpig estimat gjør det mulig å finne ønsket utvalgsstørrelse.

c) Giftfordeling.

Anta at de tilfeldige variablene k har en Poisson-fordeling (p(k; )). Da har Sn en Poisson-fordeling med gjennomsnitt og varians lik n.

Når vi skriver i stedet for n, konkluderer vi med at for n


Summeringen utføres over alle k fra 0 til . Ph-la (1.5) gjelder også når det er på en vilkårlig måte.

Ovenfor vurderte vi spørsmålet om å finne PDF-en for summen av statistisk uavhengige tilfeldige variabler. I denne delen vil vi igjen vurdere summen av statistisk uavhengige variabler, men vår tilnærming vil være annerledes og er ikke avhengig av de delvise PDF-ene til de tilfeldige variablene i summen. Anta spesielt at sumleddene er statistisk uavhengige og identisk fordelte tilfeldige variabler, som hver har avgrensede midler og avgrenset varians.

La bli definert som den normaliserte summen, kalt prøvegjennomsnittet

Først vil vi bestemme de øvre grensene for sannsynligheten for haler, og deretter vil vi bevise et veldig viktig teorem som bestemmer PDF-en i grensen når den har en tendens til uendelig.

Den tilfeldige variabelen definert av (2.1.187) støter ofte på når man estimerer gjennomsnittet av en tilfeldig variabel over en rekke observasjoner, . Med andre ord, kan betraktes som uavhengige prøverealiseringer fra en fordeling, og er et estimat av gjennomsnittet.

Den matematiske forventningen er

.

Variansen er

Hvis vi ser på det som et estimat av gjennomsnittet, ser vi at dens matematiske forventning er lik , og spredningen avtar med økende utvalgsstørrelse. Hvis den øker ubegrenset, har variansen en tendens til null. Parameterestimat (in i dette tilfellet), som tilfredsstiller betingelsene om at dens matematiske forventning har en tendens til den sanne verdien av parameteren, og variansen strengt tatt nærmer seg null, kalles et konsistent estimat.

Halesannsynligheten for en tilfeldig variabel kan estimeres ovenfra ved å bruke grensene gitt i avsnitt. 2.1.5. Chebyshevs ulikhet i forhold til har formen

,

. (2.1.188)

I grensen når , fra (2.1.188) følger det

. (2.1.189)

Sannsynligheten for at anslaget av gjennomsnittet avviker fra den sanne verdien med mer enn , har derfor en tendens til null hvis det vokser uten grense. Denne uttalelsen er en form for loven om store tall. Siden den øvre grensen konvergerer til null relativt sakte, dvs. omvendt proporsjonal. uttrykk (2.1.188) kalles svak lov om store tall.

Hvis vi bruker Chernoff-grensen på den tilfeldige variabelen, som inneholder en eksponentiell avhengighet av , får vi en stram øvre grense for enkelthalesannsynligheten. Følg fremgangsmåten skissert i Sect. 2.1.5 finner vi at halesannsynligheten for er bestemt av uttrykket

hvor og. Men , er statistisk uavhengige og identisk fordelt. Derfor,

hvor er en av mengdene. Parameteren , som gir den mest nøyaktige øvre grensen, oppnås ved å differensiere (2.1.191) og likestille den deriverte til null. Dette fører til ligningen

(2.1.192)

La oss betegne løsningen (2.1.192) med . Da er grensen for den øvre hale-sannsynligheten

, . (2.1.193)

På samme måte vil vi finne at den nedre halesannsynligheten har grensen

, . (2.1.194)

Eksempel 2.1.7. La , være en serie statistisk uavhengige tilfeldige variabler definert som følger:

Vi ønsker å definere en stram øvre grense for sannsynligheten for at summen av er større enn null. Siden vil beløpet ha negativ verdi for den matematiske forventningen (gjennomsnitt) vil vi derfor se etter den øvre hale-sannsynligheten. For i (2.1.193) har vi

, (2.1.195)

hvor er løsningen på ligningen

Derfor,

. (2.1.197)

Følgelig får vi for grensen i (2.1.195).

Vi ser at den øvre grensen avtar eksponentielt med , som forventet. I motsetning til dette, ifølge Chebyshev-bundet, synker halesannsynligheten omvendt med .

Sentral grensesetning. I denne delen tar vi for oss et ekstremt nyttig teorem om IDF for en sum av tilfeldige variabler i grensen når antall ledd av summen øker uten grense. Det finnes flere versjoner av denne teoremet. La oss bevise teoremet for tilfellet når de tilfeldige summerbare variablene , , er statistisk uavhengige og identisk fordelt, hver av dem har et begrenset gjennomsnitt og begrenset varians.

For enkelhets skyld definerer vi en normalisert tilfeldig variabel

Dermed har den null gjennomsnitt og enhetsvarians.

La nå

Siden hver summand av summen har null gjennomsnitt og enhetsvarians, har verdien normalisert (med faktoren ) null gjennomsnitt og enhetsvarians. Vi ønsker å definere FMI for grensen når .

Den karakteristiske funksjonen er lik

, (2.1.200).

,

eller tilsvarende,

. (2.1.206)

Men dette er nettopp den karakteristiske funksjonen til en gaussisk tilfeldig variabel med null gjennomsnitt og enhetsvarians. Slik har vi viktig resultat; PDF-en av summen av statistisk uavhengige og identisk distribuerte tilfeldige variabler med begrenset gjennomsnitt og varians nærmer seg Gaussisk ved . Dette resultatet er kjent som sentral grense teorem.

Selv om vi har antatt at de tilfeldige variablene summerer seg til å være likt fordelt, kan denne antakelsen lempes forutsatt at visse ytterligere restriksjoner fortsatt overlapper med egenskapene til tilfeldige summerbare mengder. Det er en variasjon av teoremet, for eksempel når antakelsen om en identisk fordeling av tilfeldige variabler forlates til fordel for en betingelse pålagt det tredje absolutte momentet til de tilfeldige variablene for summen. For en diskusjon av denne og andre versjoner av sentralgrensesetningen henvises leseren til Cramer (1946).

Den sentrale grensesetningen er en gruppe teoremer viet til å etablere forholdene under hvilke normal lov fordelinger, og overtredelsen av disse fører til en annen fordeling enn normalt. Ulike former Den sentrale grensesetningen skiller seg fra hverandre i betingelsene som stilles til fordelingen av de tilfeldige leddene som danner summen. La oss bevise en av de mest enkle former denne teoremet, nemlig den sentrale grensesetningen for uavhengige identisk distribuerte ledd.

Tenk på en sekvens av uavhengige identisk distribuerte tilfeldige variabler som har en matematisk forventning. La oss også anta at variansen eksisterer. La oss introdusere notasjonen. Loven om store tall for denne sekvensen kan representeres i følgende form:

hvor konvergens kan forstås både i betydningen konvergens i sannsynlighet (svak lov av store tall) og i betydningen konvergens med sannsynlighet, lik en(styrket lov om store tall).

Teorem (sentral grensesetning for uavhengige identisk fordelte stokastiske variabler). La være en sekvens av uavhengige identisk distribuerte tilfeldige variabler, . Da er det enhetlig i forhold til () konvergens

hvor er funksjonen til standarden normalfordeling(med parametere):

Hvis betingelsen for slik konvergens er oppfylt, kalles sekvensen asymptotisk normal.

Teoremer av Lyapunov og Lindeberg

La oss vurdere tilfellet når tilfeldige variabler har forskjellige fordelinger - de er uavhengige med forskjellige fordelinger.

Teorem (Lindeberg). La være en sekvens av uavhengige tilfeldige variabler med endelige varianser. Hvis Lindeberg-betingelsen er oppfylt for denne sekvensen:

hvor, så gjelder den sentrale grensesetningen for det.

Siden det er vanskelig å direkte verifisere Lindeberg-tilstanden, vurderer vi en annen betingelse som sentralgrensesetningen gjelder, nemlig betingelsen til Lyapunov-teoremet.

Teorem (Lyapunov). Hvis Lyapunov-betingelsen er oppfylt for en sekvens av tilfeldige variabler:

da er sekvensen asymptotisk normal, dvs. sentralgrensesetningen gjelder.

Oppfyllelsen av Lyapunov-betingelsen innebærer oppfyllelsen av Lindeberg-betingelsen, og fra den følger den sentrale grensesetningen.