Biografije Karakteristike Analiza

Zakon velikih brojeva i granični teoremi. Zakon velikih brojeva

Ako je fenomen održivosti srednji odvija u stvarnosti, onda u matematičkom modelu s kojim proučavamo slučajne pojave, mora postojati teorem koji odražava tu činjenicu.
Pod uvjetima ovog teorema uvodimo ograničenja na slučajne varijable x 1 , x 2 , …, X n:

a) svaka slučajna varijabla H i ima matematičko očekivanje

M(H i) = a;

b) varijanca svake slučajne varijable je konačna, ili možemo reći da su varijance odozgo ograničene istim brojem, npr. S, tj.

D(H i) < C, i = 1, 2, …, n;

c) slučajne varijable su neovisne u paru, tj. bilo koje dvije X i i Xj na i¹ j neovisna.

Onda očito

D(x 1 + x 2 + … + X n)=D(x 1) + D(x 2) + ... + D(X n).

Formulirajmo zakon velikih brojeva u obliku Čebiševa.

Čebiševljev teorem: uz neograničeno povećanje broja n nezavisni testovi" aritmetička sredina promatranih vrijednosti slučajne varijable konvergira po vjerojatnosti njenom matematičkom očekivanju “, tj. za svaku pozitivu ε

R(| a| < ε ) = 1. (4.1.1)

Značenje izraza "aritmetička sredina = konvergira po vjerojatnosti u a" je to vjerojatnost da će se proizvoljno malo razlikovati od a, približava se 1 na neodređeno vrijeme kao broj n.

Dokaz. Za konačan broj n nezavisnim testovima, primjenjujemo Čebiševljevu nejednakost za slučajnu varijablu = :

R(|–M()| < ε ) ≥ 1 – . (4.1.2)

Uzimajući u obzir ograničenja a - b, izračunavamo M( ) i D( ):

M( ) = = = = = = a;

D( ) = = = = = = .

Zamjena M( ) i D( ) u nejednakost (4.1.2), dobivamo

R(| a| < ε )≥1 .

Ako u nejednadžbi (4.1.2) uzmemo proizvoljno mali ε >0i n® ¥, onda dobivamo

= 1,

što dokazuje Čebiševljev teorem.

Iz razmatranog teorema proizlazi važan praktični zaključak: nepoznatu vrijednost matematičkog očekivanja slučajne varijable imamo pravo zamijeniti srednjom aritmetičkom vrijednošću dobivenom iz dovoljno velikog broja pokusa. U ovom slučaju, što je više eksperimenata za izračunavanje, vjerojatnije (pouzdanije) se može očekivati ​​da će pogreška povezana s ovom zamjenom ( - a) neće premašiti zadanu vrijednost ε .

Osim toga, mogu se riješiti i drugi praktični problemi. Na primjer, prema vrijednostima vjerojatnosti (pouzdanosti) R=R(| a|< ε ) i najveća dopuštena pogreška ε odrediti potreban broj pokusa n; na R i P definirati ε; na ε i P odrediti vjerojatnost događaja | a |< ε.

poseban slučaj. Neka na n promatrana ispitivanja n vrijednosti slučajne varijable x, imajući matematičko očekivanje M(x) i disperzija D(x). Dobivene vrijednosti se mogu smatrati slučajnim varijablama x 1 ,x 2 ,x 3 , ... ,X n,. Treba shvatiti kako slijedi: niz od P ispitivanja se provode više puta, pa kao rezultat i th test, i= l, 2, 3, ..., P, u svakoj seriji testova pojavit će se jedna ili druga vrijednost slučajne varijable x, nije poznato unaprijed. Stoga, i-e vrijednost x i slučajna varijabla dobivena u i th test, mijenja se nasumično ako prijeđete s jedne serije testova na drugu. Dakle, svaka vrijednost x i može se smatrati slučajnim X i .


Pretpostavimo da testovi ispunjavaju sljedeće zahtjeve:

1. Testovi su neovisni. To znači da su rezultati x 1 , x 2 ,
x 3 , ..., X n testovi su nezavisne slučajne varijable.

2. Testovi se provode pod istim uvjetima - to znači, sa stajališta teorije vjerojatnosti, da svaka od slučajnih varijabli x 1 ,x 2 ,x 3 , ... ,X n ima isti zakon raspodjele kao i izvorna vrijednost x, Zato M(X i) =M(x)i D(X i) = D(x), i = 1, 2, .... P.

Uzimajući u obzir gore navedene uvjete, dobivamo

R(| a| < ε )≥1 . (4.1.3)

Primjer 4.1.1. x jednaka je 4. Koliko je neovisnih pokusa potrebno da bi se s vjerojatnošću od najmanje 0,9 moglo očekivati ​​da će se aritmetička sredina ove slučajne varijable razlikovati od matematičkog očekivanja za manje od 0,5?

Odluka.Prema stanju problema ε = 0,5; R(| a|< 0,5) 0.9. Primjena formule (4.1.3) za slučajnu varijablu x, dobivamo

P(|–M(x)| < ε ) ≥ 1 .

Iz odnosa

1 = 0,9

definirati

P= = = 160.

Odgovor: potrebno je napraviti 160 neovisnih pokusa.

Uz pretpostavku da je aritmetička sredina normalno raspoređeni, dobivamo:

R(| a|< ε )= 2Φ () 0,9.

Odakle, koristeći tablicu Laplaceove funkcije, dobivamo
1,645, odnosno ≥ 6,58 tj. n ≥49.

Primjer 4.1.2. Varijanca slučajne varijable x je jednako D( x) = 5. Provedeno je 100 neovisnih pokusa prema kojima . Umjesto nepoznate vrijednosti matematičkog očekivanja a usvojeno . Odredite najveći dopušteni iznos pogreške u ovom slučaju s vjerojatnošću od najmanje 0,8.

Odluka. Prema zadatku n= 100, R(| a|< ε ) ≥0,8. Primjenjujemo formulu (4.1.3)

R(| a|< ε ) ≥1 .

Iz odnosa

1 = 0,8

definirati ε :

ε 2 = = = 0,25.

Stoga, ε = 0,5.

Odgovor: maksimalna vrijednost pogreške ε = 0,5.

4.2. Zakon velikih brojeva u Bernoullijevom obliku

Iako je koncept vjerojatnosti temelj svakog statističkog zaključivanja, samo u nekoliko slučajeva možemo izravno odrediti vjerojatnost događaja. Ponekad se ova vjerojatnost može utvrditi iz razmatranja simetrije, jednakih mogućnosti itd., ali ne postoji univerzalna metoda koja bi omogućila da se naznači njezina vjerojatnost za proizvoljan događaj. Bernoullijev teorem omogućuje aproksimaciju vjerojatnosti ako za događaj koji nas zanima ALI mogu se provesti ponovljeni neovisni testovi. Neka se proizvede P nezavisni testovi, u svakom od kojih je vjerojatnost nastanka nekog događaja ALI postojan i jednak R.

Bernoullijev teorem. Uz neograničeno povećanje broja neovisnih ispitivanja P relativna učestalost pojavljivanja događaja ALI konvergira u vjerojatnosti prema vjerojatnosti str pojava događaja ALI,t. e.

P(½ - str½≤ ε) = 1, (4.2.1)

gdje ε je proizvoljno mali pozitivan broj.

Za finale n pod uvjetom da , Čebiševljeva nejednakost za slučajnu varijablu imat će oblik:

P(| –p|< ε ) 1 .(4.2.2)

Dokaz. Primjenjujemo Čebiševljev teorem. Neka bude X i– broj pojavljivanja događaja ALI u i th test, i= 1, 2, . . . , n. Svaka od količina X i može uzeti samo dvije vrijednosti:

X i= 1 (događaj ALI dogodilo) s vjerojatnošću str,

X i= 0 (događaj ALI nije došlo) s vjerojatnošću q= 1–str.

Neka bude Y n= . Iznos x 1 + x 2 + … + X n jednak je broju m pojave događaja ALI u n testovi (0 m n), što znači Y n= – relativna učestalost pojavljivanja događaja ALI u n testovi. Matematičko očekivanje i varijanca X i jednaki su, odnosno:

M( ) = 1∙str + 0∙q = str,

Teorija vjerojatnosti proučava pravilnosti svojstvene masovnim slučajnim pojavama. Kao i svaka druga znanost, teorija vjerojatnosti osmišljena je da predvidi što je točnije rezultat određenog fenomena ili eksperimenta. Ako je fenomen jednostruke prirode, onda je teorija vjerojatnosti u stanju predvidjeti samo vjerojatnost ishoda u vrlo širokom rasponu. Pravilnosti se pojavljuju samo kod velikog broja slučajnih pojava koje se javljaju u homogenim uvjetima.

Skupina teorema kojima se utvrđuje korespondencija između teorijskih i eksperimentalnih karakteristika slučajnih varijabli i slučajnih događaja s velikim brojem testova na njima, kao i zakona o graničnim distribucijama, objedinjuje se pod općim nazivom granični teoremi teorije vjerojatnosti.

Postoje dvije vrste graničnih teorema: zakon velikih brojeva i središnji granični teorem.

Zakon velikih brojeva, koji zauzima važno mjesto u teoriji vjerojatnosti, poveznica je između teorije vjerojatnosti kao matematičke znanosti i zakona slučajnih pojava tijekom masovnih promatranja istih.

Zakon igra vrlo važnu ulogu u praktičnoj primjeni teorije vjerojatnosti na prirodne pojave i tehničke procese povezane s masovnom proizvodnjom.

Zakoni granične raspodjele predmet su skupine teorema – kvantitativnog oblika zakona velikih brojeva. Oni. zakon velikih brojeva je niz teorema od kojih svaki utvrđuje činjenicu da su prosječne karakteristike velikog broja pokusa aproksimirane određenim konstantama, t.j. utvrditi činjenicu konvergencije u vjerojatnosti nekih slučajnih varijabli prema konstantama. To su teoremi Bernoullija, Poissona, Ljapunova, Markova, Čebiševa.

1. a) Bernoullijev teorem - zakon velikih brojeva ( je formuliran i dokazan ranije u odjeljku 3 § 6 kada se razmatra granični integralni teorem Moivre-Laplacea.)

Uz neograničeno povećanje broja homogenih neovisnih pokusa, učestalost događaja će se proizvoljno malo razlikovati od vjerojatnosti događaja u zasebnom eksperimentu. Inače, vjerojatnost da će odstupanje u relativnoj učestalosti događaja ALI iz stalne vjerojatnosti R događaji ALI vrlo malo jer teži 1 za bilo koji : .

b) Čebiševljev teorem.

S neograničenim povećanjem broja neovisnih pokušaja, aritmetička sredina promatranih vrijednosti slučajne varijable s konačnom varijansom konvergira po vjerojatnosti njenom matematičkom očekivanju; inače, ako su neovisne identično raspoređene slučajne varijable s matematičkim očekivanjem i ograničenom varijansom , tada za bilo koje vrijedi: .

Čebiševljev teorem (generaliziran). Ako su slučajne varijable u nizu po parovima neovisne i njihove varijance zadovoljavaju uvjet , tada je za bilo koji pozitivan ε > 0 tvrdnja istinita:


ili što je isto .

c) Markovljev teorem. (zakon velikih brojeva u općoj formulaciji)

Ako varijance proizvoljnih slučajnih varijabli u nizu zadovoljavaju uvjet: , tada za bilo koji pozitivan ε > 0 vrijedi izjava Čebiševljevog teorema: .

d) Poissonov teorem.

Uz neograničeno povećanje broja neovisnih eksperimenata pod promjenjivim uvjetima, učestalost događaja ALI konvergira po vjerojatnosti s aritmetičkom sredinom svojih vjerojatnosti pod ovim testovima.

Komentar. Ni u jednom od oblika zakona velikih brojeva ne bavimo se zakonima raspodjele slučajnih varijabli. Pitanje koje se odnosi na pronalaženje zakona granične raspodjele za zbroj kada se broj članova neograničeno povećava razmatra središnji granični teorem. identično su raspoređeni, tada dolazimo do Moivre-Laplaceovog integralnog teorema (odjeljak 3. § 6.), koji je najjednostavniji poseban slučaj središnjeg graničnog teorema.

Na početku kolegija već smo rekli da se matematički zakoni teorije vjerojatnosti dobivaju apstrahiranjem stvarnih statističkih pravilnosti svojstvenih masovnim slučajnim pojavama. Prisutnost ovih zakonitosti povezana je upravo s masovnošću pojava, odnosno s velikim brojem izvedenih homogenih eksperimenata ili s velikim brojem slučajnih utjecaja koji u svojoj ukupnosti generiraju slučajnu varijablu podvrgnutu dobro definiranom zakonu. Svojstvo stabilnosti masovnih slučajnih pojava poznato je čovječanstvu od davnina. U kojem god području se pojavila, njegova se bit svodi na sljedeće: specifične značajke svake pojedinačne slučajne pojave gotovo da nemaju utjecaja na prosječni rezultat masa i takvih pojava; slučajna odstupanja od prosjeka, neizbježna u svakoj pojedinoj pojavi, u masi se međusobno poništavaju, izravnavaju, izravnavaju. Upravo je ta stabilnost prosjeka fizički sadržaj "zakona velikih brojeva", shvaćenog u širem smislu riječi: s vrlo velikim brojem slučajnih pojava njihov prosječni rezultat praktički prestaje biti slučajan i može se predvidjeti. s visokim stupnjem sigurnosti.

U užem smislu riječi, "zakon velikih brojeva" u teoriji vjerojatnosti shvaća se kao niz matematičkih teorema, u svakom od kojih je, za određene uvjete, činjenica aproksimacije prosječnih karakteristika velikog broja eksperimenata na neke specifične konstante se uspostavlja.

U 2.3 smo već formulirali najjednostavniji od ovih teorema, teorem J. Bernoullija. Ona tvrdi da se s velikim brojem eksperimenata učestalost događaja približava (točnije, konvergira u vjerojatnosti) vjerojatnosti ovog događaja. Drugi, općenitiji oblici zakona velikih brojeva bit će predstavljeni u ovom poglavlju. Svi oni utvrđuju činjenicu i uvjete za konvergenciju vjerojatnosti određenih slučajnih varijabli stalnim, neslučajnim varijablama.

Zakon velikih brojeva igra važnu ulogu u praktičnoj primjeni teorije vjerojatnosti. Svojstvo slučajnih varijabli da se pod određenim uvjetima ponašaju praktički kao neslučajne omogućuje nam pouzdano djelovanje s tim veličinama, predviđanje rezultata masovnih slučajnih pojava s gotovo potpunom sigurnošću.

Mogućnosti takvih predviđanja u području slučajnih pojava mase dodatno su proširene prisutnošću druge grupe graničnih teorema, koji se više ne odnose na granične vrijednosti slučajnih varijabli, već na zakone granične distribucije. Ovo je skupina teorema poznata kao "teorem središnje granice". Već smo rekli da se pri zbrajanju dovoljno velikog broja slučajnih varijabli zakon distribucije zbroja neograničeno približava normalnom, pod uvjetom da su ispunjeni određeni uvjeti. Ovi uvjeti, koji se matematički mogu formulirati na različite načine - u manje-više općenitom obliku - u biti se svode na zahtjev da utjecaj na zbroj pojedinačnih članova bude jednoliko mali, tj. da zbroj ne uključuje članove koji jasno prevladavaju nad skupom ostali svojim utjecajem na disperziju iznosa. Različiti oblici središnjeg graničnog teorema međusobno se razlikuju po uvjetima za koje se utvrđuje ovo granično svojstvo zbroja slučajnih varijabli.

Različiti oblici zakona velikih brojeva, zajedno s različitim oblicima središnjeg graničnog teorema, čine skup takozvanih graničnih teorema teorije vjerojatnosti. Granični teoremi omogućuju ne samo izradu znanstvenih prognoza u području slučajnih pojava, već i procjenu točnosti tih prognoza.

U ovom poglavlju razmatramo samo neke od najjednostavnijih oblika graničnih teorema. Najprije će se razmatrati teoremi vezani uz grupu "zakon velikih brojeva", zatim - teoremi vezani uz grupu "teorema središnje granice".

Sasvim je prirodno potrebno kvantificirati tvrdnju da je u "velikim" serijama testova učestalost pojavljivanja događaja "bliska" njegovoj vjerojatnosti. Mora se jasno razumjeti određena delikatnost ovog zadatka. U najtipičnijim slučajevima za teoriju vjerojatnosti situacija je takva da u proizvoljno dugim serijama testova obje ekstremne vrijednosti frekvencije ostaju teoretski moguće

\frac(\mu)(n)=\frac(n)(n)=1 i \frac(\mu)(n)=\frac(0)(n)=0

Stoga, bez obzira na broj pokušaja n, nemoguće je s potpunom sigurnošću tvrditi da je, recimo, nejednakost

<\frac{1}{10}

Na primjer, ako se događaj A sastoji od bacanja šestice prilikom bacanja kocke, tada nakon n bacanja s vjerojatnošću (\lijevo(\frac(1)(6)\desno)\^n>0 !} uvijek ćemo dobiti samo šestice, tj. s vjerojatnošću (\lijevo(\frac(1)(6)\desno)\^n !} dobivamo učestalost pojavljivanja šestica jednaku jedan, i to s vjerojatnošću (\lijevo(1-\frac(1)(6)\desno)\^n>0 !}šestica ne ispadne niti jednom, tj. učestalost pojavljivanja šestica bit će jednaka nuli.

U svim takvim problemima, svaka netrivijalna procjena blizine između frekvencije i vjerojatnosti ne djeluje s potpunom sigurnošću, već samo s nekom vjerojatnošću manjom od jedinice. Može se dokazati, na primjer, da u slučaju neovisnih ispitivanja sa konstantnom vjerojatnošću p pojave događaja, nejednakost

\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02

za frekvenciju \frac(\mu)(n) će se izvršiti na n=10\,000 (i bilo koji p) s vjerojatnošću

P>0,\!9999.

Ovdje prije svega želimo naglasiti da je u gornjoj formulaciji kvantitativna procjena blizine frekvencije \frac(\mu)(n) vjerojatnosti p povezana s uvođenjem nove vjerojatnosti P.

Pravo značenje procjene (8) je sljedeće: ako napravimo N niza od n testova i izbrojimo broj M nizova u kojima je zadovoljena nejednakost (7), tada je za dovoljno veliki N približno

\frac(M)(N)\približno P>0,\!9999.

Ali ako želimo precizirati odnos (9) iu smislu stupnja bliskosti \frac(M)(N) s vjerojatnošću P i u smislu pouzdanosti s kojom se može tvrditi da će se takva bliskost dogoditi, tada ćemo se morati obratiti na razmatranja slična onima koja smo već radili s blizinom \frac(\mu)(n) i p . Po želji, takvo se razmišljanje može ponoviti neograničen broj puta, ali je sasvim jasno da nam to neće omogućiti da se u potpunosti oslobodimo potrebe da se u posljednjoj fazi okrenemo vjerojatnostima u primitivnom grubom smislu te riječi.

Ne treba misliti da su takve poteškoće neka značajka teorije vjerojatnosti. U matematičkom proučavanju stvarnih pojava uvijek ih shematiziramo. Odstupanja tijeka stvarnih pojava od teorijske sheme mogu se, pak, podvrgnuti matematičkom proučavanju. Ali za to se sama ta odstupanja moraju smjestiti u određenu shemu, a ovu potonju treba koristiti već bez formalne matematičke analize odstupanja od nje.

Međutim, imajte na umu da u stvarnoj primjeni procjene

P\!\lijevo\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}>0,\!9999.


za jednu seriju od n testova također se oslanjamo na neka razmatranja simetrije: nejednakost (10) pokazuje da će za vrlo velik broj N serija relacija (7) biti zadovoljena u najmanje 99,99% slučajeva; prirodno je s velikom sigurnošću očekivati ​​da će se, posebice, nejednakost (7) ostvariti u određenom nizu n pokusa koji nas zanima, ako imamo razloga vjerovati da ovaj niz zauzima običnu, neoznačenu poziciju u nizu druge serije.

Vjerojatnosti koje se obično zanemaruju u različitim praktičnim pozicijama različite su. Gore je već napomenuto da se u grubim proračunima potrošnje ljuski, koja jamči ispunjenje zadatka, zadovoljavaju stopom potrošnje školjki, pri kojoj se zadatak rješava s vjerojatnošću od 0,95, tj. zanemariti vjerojatnosti koje ne prelaze 0,05. To se objašnjava činjenicom da bi prijelaz na proračune polazeći od zanemarivanja, recimo, samo vjerojatnosti manjih od 0,01, doveo do velikog povećanja stopa potrošnje projektila, tj. u gotovo mnogim slučajevima do zaključka da je nemoguće izvršiti postavljeni zadatak u tom kratkom vremenskom razdoblju koje je za to na raspolaganju, odnosno sa stvarnom opskrbom granata koje se mogu koristiti.

Ponekad su, čak iu znanstvenim istraživanjima, ograničeni na statističke metode izračunate na temelju zanemarivanja vjerojatnosti od 0,05. Ali to treba učiniti samo u slučajevima kada je prikupljanje opsežnijeg materijala vrlo teško. Razmotrite sljedeći problem kao primjer takvih metoda. Pretpostavimo da pod određenim uvjetima uobičajeni lijek za liječenje bolesti daje pozitivan rezultat u 50%, tj. s vjerojatnošću od 0,5. Predlaže se novi lijek, a kako bi se ispitale njegove prednosti u odnosu na stari, planira se njegova primjena u deset slučajeva, nepristrano odabranih među pacijentima u istom položaju kao i oni za koje je utvrđeno da je stari lijek učinkovit 50%. Istodobno, utvrđeno je da će se prednost novog lijeka smatrati dokazanom ako daje pozitivan rezultat u najmanje osam od deset slučajeva. Lako je izračunati da je takva odluka povezana s zanemarivanjem vjerojatnosti dobivanja pogrešnog zaključka (tj. zaključka da je dobrobit novog lijeka dokazana, dok je jednaka ili čak gora od starog) samo reda od 0,05. Doista, ako je u svakom od deset ispitivanja vjerojatnost pozitivnog ishoda jednaka p, tada su vjerojatnosti dobivanja 10,9 odnosno 8 pozitivnih ishoda u deset ispitivanja jednake, respektivno.

P_(10)=p^(10),\qquad P_9=10p^9(1-p),\qquad P_8=45p^8(1-p)^2.

Ukratko, za slučaj p=\frac(1)(2) dobivamo P=P_(10)+P_9+P_8=\frac(56)(1024)\cca0,\!05.

Dakle, uz pretpostavku da je novi lijek zapravo točno ekvivalent starom, riskiramo izvlačenje pogrešnog zaključka da je novi lijek superiorniji od starog s vjerojatnošću od oko 0,05. Da bi se ova vjerojatnost smanjila na oko 0,01, bez povećanja broja ispitivanja n=10, trebalo bi ustanoviti da bi se korist od novog lijeka smatrala dokazanom samo ako njegova uporaba daje pozitivan rezultat u najmanje devet od deset slučajeva. . Ako se ovaj zahtjev čini prestrog za zagovornike novog lijeka, tada će se broj ispitivanja n morati postaviti na značajno veći od 10. Ako se, na primjer, pri n=100 utvrdi da su prednosti novog lijeka lijek će se smatrati dokazanim kada \mu>65 , tada će vjerojatnost pogreške biti samo P\pribl0,\!0015 .

Ako je norma od 0,05 očito nedostatna za ozbiljna znanstvena istraživanja, onda je vjerojatnost pogreške od 0,001 ili 0,003 najvećim dijelom zanemarena čak i u takvim akademskim i detaljnim studijama kao što je obrada astronomskih promatranja. Međutim, ponekad znanstveni zaključci temeljeni na primjeni vjerojatnosnih zakona također imaju mnogo veću pouzdanost (odnosno, izgrađeni su na zanemarivanju mnogo nižih vjerojatnosti). O tome će biti više riječi kasnije.

U razmatranim primjerima više puta smo koristili posebne slučajeve binomske formule (6)

P_m=C_n^mp^m(1-p)^(n-m)

za vjerojatnost P_m da dobije točno m pozitivnih ishoda u n neovisnih ispitivanja, od kojih svaki pozitivan ishod ima vjerojatnost p. Upotrijebimo ovu formulu da razmotrimo pitanje o vjerojatnosti postavljeno na početku ovog odjeljka

<\varepsilon\right\},

gdje je \mu stvarni broj pozitivnih ishoda. Očito se ova vjerojatnost može napisati kao zbroj onih P_m za koje m zadovoljava nejednakost

\vline\,\frac(m)(n)-p\,\vline\,<\varepsilon,


odnosno u obliku

P=\zbroj_(m=m_1)^(m_2)P_m,

gdje je m_1 najmanja od m vrijednosti koje zadovoljavaju nejednakost (12), a m_2 je najveća od takvih m .

Formula (13) za bilo koji veliki n nije od velike koristi za izravne izračune. Stoga je Moivreovo otkriće za slučaj p=\frac(1)(2) i Laplaceovo, za bilo koje p, asimptotske formule, što olakšava pronalaženje i proučavanje ponašanja vjerojatnosti P_m za velike n , bio je od velike važnosti. Ova formula izgleda kao

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\exp\!\left[-\frac((m-np)^2)(2np(1-p)) \pravo].

Ako p nije preblizu nuli ili jedan, onda je dovoljno točan već za n reda 100. Ako stavimo

T=\frac(m-np)(\sqrt(np(1-p))),

Tada će formula (14) poprimiti oblik

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\,e^(-t^2/2).


Iz (13) i (16) možemo izvesti približan prikaz vjerojatnosti (11)

P\sim\frac(1)(\sqrt(2\pi))\int\limits_(-T)^(T)e^(-t^2/2)\,dt=F(T),


gdje

T=\varepsilon\sqrt(\frac(n)(p(1-p)))

Razlika između lijevog i desnog dijela u (17) pri konstanti i različitoj od nule i jedan p teži ravnomjerno nuli u odnosu na \varepsilon na n\do\infty. Za funkciju F(T) sastavljene su detaljne tablice. Evo kratkog izvatka iz njih

\begin(niz)(c|c|c|c|c)T&1&2&3&4\\\hline F&0,\!68269&0,\!95450&0,\!99730&0,\!99993\end(niz)


Na T\to\infty vrijednost funkcije F(T) teži jedinici.

Za procjenu vjerojatnosti upotrijebimo formulu (17).

P=\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}\approx F\!\left(\frac{2}{\sqrt{p(1-p)}}\right) na n=10\,000,~\varepsilon=0,\!02, kao T=\frac(2)(\sqrt(p(1-p))).

Budući da funkcija F(T) monotono raste s povećanjem T , za p-neovisnu procjenu P odozdo moramo uzeti najmanju moguću (za različiti p ) vrijednost T . Ova najmanja vrijednost će se dobiti s p=\frac(1)(2) , i bit će jednaka 4. Prema tome, približno

P\geqslant F(4)=0,\!99993.

Nejednakost (19) ne uzima u obzir pogrešku zbog aproksimativne prirode formule (17). Procjenom pogreške povezane s ovom okolnošću može se u svakom slučaju utvrditi da je P>0,\!9999 .

U vezi s razmatranim primjerom primjene formule (17), treba napomenuti da su procjene ostatka člana formule (17), dane u teorijskim radovima iz teorije vjerojatnosti, dugo vremena ostajale slabo zadovoljavajuće. Stoga se primjena formule (17) i sličnih na izračune za ne baš velik n ili za vjerojatnosti p koje su vrlo blizu 0 ili 1 (a takve su vjerojatnosti u mnogim slučajevima posebno važne) često temeljila samo na iskustvu provjeravajući takve rezultate.za ograničen broj primjera, a ne na dobro utvrđenim procjenama moguće pogreške. Nadalje, detaljnije istraživanje pokazalo je da u mnogim praktički važnim slučajevima gore navedene asimptotske formule ne zahtijevaju samo procjenu ostatka člana, već i doradu (jer je bez takvog preciziranja preostali član prevelik). U oba smjera, za najpotpunije rezultate zaslužan je S. N. Bernshtein.

Relacije (11), (17) i (18) mogu se prepisati kao

\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,

Za dovoljno veliki t, desna strana formule (20), koja ne sadrži n, proizvoljno je bliska jedinici, tj. vrijednosti vjerojatnosti koja odgovara punoj sigurnosti. Vidimo, dakle, da u pravilu, odstupanja frekvencije \frac(\mu)(n) od vjerojatnosti p su reda \frac(1)(\sqrt(n)). Takva proporcionalnost točnosti djelovanja probabilističkih pravilnosti s kvadratnim korijenom broja opažanja tipična je i za mnoga druga pitanja. Ponekad čak govore, radi donekle pojednostavljene popularizacije, o "zakonu kvadratnog korijena od n" kao osnovnom zakonu teorije vjerojatnosti. Ova ideja je dobila potpunu jasnoću zahvaljujući uvođenju velikog ruskog matematičara P. L. Čebiševa u sustavnu upotrebu metode svođenja različitih vjerojatnosnih problema na izračune “matematičkih očekivanja” i “varijansi” za zbrojeve i aritmetičke sredine “slučajnih varijabli”.

Nasumična varijabla je veličina koja pod datim uvjetima S može poprimiti različite vrijednosti s određenim vjerojatnostima. Dovoljno je da razmotrimo slučajne varijable koje mogu uzeti samo konačan broj različitih vrijednosti. Da naznači kako kažu raspodjela vjerojatnosti takve slučajne varijable \xi , dovoljno je naznačiti njezine moguće vrijednosti x_1,x_2,\ldots,x_r i vjerojatnosti

P_r=\mathbf(P)\(\xi=x_r\).


Sve u svemu, ove vjerojatnosti za sve različite moguće vrijednosti \xi uvijek su jednake jedan:

\zbroj_(r=1)^(s)P_r=1.

Primjer slučajne varijable je broj \mu pozitivnih ishoda koji su gore proučavani u n pokusa.

matematičko očekivanje vrijednost \xi naziva se izraz

M(\xi)=\suma_(r=1)^(s)P_rx_r,


a disperzija veličine \xi odnose se na srednju vrijednost kvadratne devijacije \xi-M(\xi) , tj. izraz

D(\xi)=\suma_(r=1)^(s)P_r(x_r-M(\xi))^2.


Kvadratni korijen varijance

\sigma_(\xi)=\sqrt(D(\xi))=\sqrt(\sum_(r=1)^(s)P_r(x_r-M(\xi))^2)


pozvao standardna devijacija(vrijednosti iz njegovog matematičkog očekivanja M(\xi)).

Najjednostavnije primjene varijansi i standardnih devijacija temelje se na poznatim Čebiševljeva nejednakost

\mathbf(P)\(|\xi-M(\xi)|\leqslant t_(\sigma_(\xi))\)\geqslant1-\frac(1)(t^2),

Pokazuje da su odstupanja slučajne varijable \xi od njenog matematičkog očekivanja M(\xi) , koja su mnogo veća od standardne devijacije \sigma_(\xi) , rijetka.

U formiranju zbroja slučajnih varijabli \xi=\xi^((1))+ \xi^((2))+\cdots+\xi^((n)) za njihova matematička očekivanja jednakost uvijek vrijedi

M(\xi)=M(\xi^((1)))+M(\xi^((2)))+\cdots+M(\xi^((n))).


Slična jednakost za varijance

D(\xi)=D(\xi^((1)))+D(\xi^((2)))+\cdots+D(\xi^((n))).

istinito samo uz određena ograničenja. Da bi jednakost (23) bila valjana, dovoljno je, na primjer, da veličine \xi^((i)) i \xi^((j)) s različitim brojevima nisu, kako kažu, "korelirane" sa svakim drugo, tj. da kod i\ne j

M\Bigl\((\xi^((i))-M(\xi^((i))))(\xi^((j))-M(\xi^((j))))\ Bigl\)=0

Koeficijent korelacije između slučajnih varijabli \xi^((i)) i \xi^((j)) je izraz

R=\frac(M\Bigl\(\Bigl(\xi^((i))-M(\xi^((i)))\Bigl)\Bigl(\xi^((j))-M( \xi^((j)))\Bigl)\Bigl\))(\sigma_(\xi^((i)))\,\sigma_(\xi^((j)))).

Ako je a \sigma_(\xi^((i)))>0 u \sigma_(\xi^((j)))>0, tada je uvjet (24) ekvivalentan R=0 .

Koeficijent korelacije R karakterizira stupanj ovisnosti između slučajnih varijabli. Uvijek |R|\leqslant1 , a R=\pm1 samo ako postoji linearna veza

\eta=a\xi+b\quad(a\ne0).

Za nezavisne vrijednosti R=0.

Konkretno, jednakost (24) je zadovoljena ako su veličine \xi^((i)) i \xi^((j)) međusobno neovisne. Dakle, jednakost (23) uvijek vrijedi za međusobno nezavisne članove. Za aritmetičke prosjeke

\zeta=\frac(1)(n)\Bigl(\xi^((1))+\xi^((2))+\cdots+\xi^((n))\Bigl) iz (23) slijedi

D(\zeta_=\frac(1)(n^2)\Bigl(D(\xi^((1)))+ D(\xi^((2)))+\cdots+ D(\xi^( (n)))\Bigl).

Pretpostavimo sada da za sve članove varijance ne prelaze neku konstantu

D(\xi^((i)))\leqslant C^2. Zatim prema (25) D(\zeta)\leqslant\frac(C^2)(n),


a zbog Čebiševske nejednakosti za bilo koji t

\mathbf(P)\!\left\(|\zeta-M(\zeta)|\leqslant\frac(tC)(\sqrt(n))\desno\)\geqslant1-\frac(1)(t^ 2)

Nejednakost (26) sadrži takozvani zakon velikih brojeva u obliku koji je ustanovio Čebišev: ako su veličine \xi^((i)) međusobno neovisne i imaju ograničene varijanse, tada kako n raste, njihovi aritmetički prosjek \zeta , sve manje zamjetno odstupaju od svojih matematičkih očekivanja M(\zeta) .

Točnije, tako kažu slijed slučajnih varijabli

\xi^((1)),\,\xi^((2)),\,\ldots\,\xi^((n)),\,\ldots


poštuje zakon velikih brojeva ako za odgovarajuće aritmetičke prosjeke \zeta i za bilo koju konstantu \varepsilon>0

\mathbf(P)\(|\zeta-M(\zeta)|\leqslant \varepsilon\)\to1\quad (n\to\infty).

Za dobivanje granične relacije (27) iz nejednakosti (26), dovoljno je postaviti

T=\varepsilon\cdot\frac(\sqrt(n))(C).

Veliki broj studija A.A. Markova, S.N. Bernstein, A.Ya. Khinchin i drugi posvećen je pitanju mogućeg proširenja uvjeta za primjenjivost granične relacije (27), odnosno uvjeta za primjenjivost zakona velikih brojeva. Ove studije su od temeljne važnosti. Međutim, još važnije je točno proučavanje distribucije vjerojatnosti odstupanja \zeta-M(\zeta) .

Velika zasluga ruske klasične škole u teoriji vjerojatnosti je utvrđivanje činjenice da je, pod vrlo širokim uvjetima, jednakost

\mathbf(P)\!\lijevo\(t_1\sigma_(\zeta)<\zeta-M(\zeta)

Čebišev je dao gotovo potpuni dokaz ove formule za slučaj neovisnih i ograničenih članova. Markov je popunio kariku koja nedostaje u Čebiševljevom obrazloženju i proširio uvjete za primjenjivost formule (28). Još općenitije uvjete dao je Ljapunov. Pitanje proširenja formule (28) na zbrojeve zavisnih članova s ​​posebnom je potpunosti proučavao S. N. Bernshtein.

Formula (28) pokrivala je tako velik broj posebnih problema da se dugo vremena nazivala središnjim graničnim teoremom teorije vjerojatnosti. Iako se najnovijim razvojem teorije vjerojatnosti pokazalo da je uključena u niz općenitijih zakona, njezina se važnost ni danas ne može precijeniti.

Vrijeme.

Ako su pojmovi neovisni i njihove varijance su iste i jednake: D(\xi^((i)))=\sigma^2, tada je prikladno da formula (28), uzimajući u obzir relaciju (25), da oblik

\mathbf(P)\!\lijevo\(\frac(t_1\sigma)(\sqrt(n))<\zeta-M(\zeta)<\frac{t_2\sigma}{\sqrt{n}}\right\}\sim\frac{1}{\sqrt{2\pi}}\int\limits_{t_1}^{t_2}e^{-t^2/2}\,dt\,.

Pokažimo da relacija (29) sadrži rješenje problema odstupanja frekvencije \frac(\mu)(n) od vjerojatnosti p , kojim smo se ranije bavili. Da bismo to učinili, uvodimo slučajne varijable \xi^((i)) definirajući ih sljedećim uvjetom:

\xi^((i))=0 ako je i -o ispitivanje imalo negativan ishod,

\xi^((i))=1 ako je i -o ispitivanje imalo pozitivan ishod.

Lako je to tada provjeriti


a formula (29) daje

\mathbf(P)\!\left\(t_1\sqrt(\frac(p(1-p))(n))<\frac{\mu}{n}-p
što za t_1=-t,~t_2=t opet dovodi do formule (20).
Također pogledajte Granične teoreme u teoriji vjerojatnosti Javascript je onemogućen u vašem pregledniku.
ActiveX kontrole moraju biti omogućene za izračune!

Lema Čebišev. Ako je slučajna varijabla x, za koje postoji matematičko očekivanje M[x], može uzeti samo nenegativne vrijednosti, tada za bilo koji pozitivan broj a imamo nejednakost

Čebiševljeva nejednakost. Ako je a x je slučajna varijabla s matematičkim očekivanjem M[x] i disperzija D[x], tada za bilo koje pozitivno e ​​imamo nejednakost

. (2)

Čebiševljev teorem.(zakon velikih brojeva). Neka bude x 1 , x 2 , …, x n,… - niz neovisnih slučajnih varijabli s istim matematičkim očekivanjem m i varijance ograničene istom konstantom s

. (3)

Dokaz teorema temelji se na nejednakosti

, (4)

slijedeći iz Čebiševske nejednakosti. Iz Čebiševljevog teorema, kao posljedicu, može se dobiti

Bernoullijev teorem. Neka se proizvodi n nezavisni pokusi, u svakom od kojih s vjerojatnošću R može se dogoditi neki događaj ALI, Pusti to v n je slučajna varijabla jednaka broju pojavljivanja događaja ALI u ovim n eksperimenti. Tada za bilo koje e > 0 imamo graničnu jednakost

. (5)

Imajte na umu da nejednakost (4) primijenjena na uvjete Bernoullijevog teorema daje:

. (6)

Čebiševljev teorem može se formulirati u nešto općenitijem obliku:

Generalizirani Čebiševljev teorem. Neka bude x 1, x 2, …, x n,… - niz neovisnih slučajnih varijabli s matematičkim očekivanjima M[x 1 ] = m 1, M[x2] = m 2,… a disperzije ograničene istom konstantom s. Tada za bilo koji pozitivan broj e imamo graničnu jednakost

. (7)

Neka je x broj pojavljivanja od 6 bodova u 3600 bacanja kocke. Tada M[ x] = 3600 = 600. Koristimo sada nejednakost (1) za a = 900: .

Koristimo nejednakost (6) za n = 10000, p = , q = . Zatim

Primjer.

Vjerojatnost pojave događaja A u svakom od 1000 neovisnih pokusa je 0,8. Pronađite vjerojatnost da će broj pojavljivanja događaja A u ovih 1000 eksperimenata odstupiti od svog matematičkog očekivanja u apsolutnoj vrijednosti za manje od 50.

Neka je x broj pojavljivanja događaja A u specificiranih 1000 eksperimenata. Tada M[ x] = 1000 × 0,8 = 800 i D[ x] = 1000 × 0,8 × 0,2 = 160. Sada nejednakost (2) daje:


Primjer.

Varijanca svake od 1000 neovisnih slučajnih varijabli x k (k = 1, 2,..., 1000) je 4. Procijenite vjerojatnost da će odstupanje aritmetičke sredine ovih varijabli od aritmetičke sredine njihovih matematičkih očekivanja u apsolutnoj vrijednosti neće prelaziti 0,1.

Prema nejednadžbi (4), za c = 4 i e = 0,1 imamo