Biografije Karakteristike Analiza

Zakon velikih brojeva i granične teoreme. Zakon velikih brojeva

Ako je fenomen održivosti srednje se odvija u stvarnosti, onda u matematičkom modelu sa kojim proučavamo slučajne pojave, mora postojati teorema koja odražava ovu činjenicu.
Pod uslovima ove teoreme, uvodimo ograničenja na slučajne varijable X 1 , X 2 , …, X n:

a) svaka slučajna varijabla H i ima matematička očekivanja

M(H i) = a;

b) varijansa svake slučajne varijable je konačna, ili možemo reći da su varijanse odozgo ograničene istim brojem, npr. With, tj.

D(H i) < C, i = 1, 2, …, n;

c) slučajne varijable su nezavisne u paru, odnosno bilo koje dvije X i i Xj at i¹ j nezavisni.

Onda očigledno

D(X 1 + X 2 + … + X n)=D(X 1) + D(X 2) + ... + D(X n).

Formulirajmo zakon velikih brojeva u obliku Čebiševa.

Čebiševljeva teorema: uz neograničeno povećanje broja n nezavisni testovi" aritmetička sredina posmatranih vrijednosti slučajne varijable konvergira po vjerovatnoći njenom matematičkom očekivanju “, odnosno za bilo koju pozitivu ε

R(| a| < ε ) = 1. (4.1.1)

Značenje izraza "aritmetička sredina = konvergira vjerovatnoćom u a" da li je to verovatnoća da će se proizvoljno malo razlikovati od a, približava se 1 neograničeno kao broj n.

Dokaz. Za konačan broj n nezavisnim testovima, primjenjujemo Čebiševljevu nejednakost za slučajnu varijablu = :

R(|–M()| < ε ) ≥ 1 – . (4.1.2)

Uzimajući u obzir ograničenja a - b, izračunavamo M( ) i D( ):

M( ) = = = = = = a;

D( ) = = = = = = .

Zamena M( ) i D( ) u nejednakost (4.1.2), dobijamo

R(| a| < ε )≥1 .

Ako u nejednakosti (4.1.2) uzmemo proizvoljno malu ε >0 i n® ¥, onda dobijamo

= 1,

što dokazuje Čebiševljevu teoremu.

Iz razmatrane teoreme slijedi važan praktični zaključak: imamo pravo zamijeniti nepoznatu vrijednost matematičkog očekivanja slučajne varijable srednjom aritmetičkom vrijednošću dobivenom iz dovoljno velikog broja eksperimenata. U ovom slučaju, što je više eksperimenata za izračunavanje, vjerovatnije (pouzdanije) se može očekivati ​​da će greška povezana s ovom zamjenom ( - a) neće premašiti datu vrijednost ε .

Osim toga, mogu se riješiti i drugi praktični problemi. Na primjer, prema vrijednostima vjerovatnoće (pouzdanosti) R=R(| a|< ε ) i maksimalnu dozvoljenu grešku ε odrediti potreban broj eksperimenata n; on R i P definisati ε; on ε i P odrediti vjerovatnoću događaja | a |< ε.

poseban slučaj. Neka u n posmatrana ispitivanja n vrijednosti slučajne varijable x, imajući matematička očekivanja M(X) i disperzija D(X). Dobijene vrijednosti se mogu smatrati slučajnim varijablama X 1 ,X 2 ,X 3 , ... ,X n,. To treba shvatiti na sljedeći način: niz P testovi se provode više puta, pa kao rezultat i th test, i= l, 2, 3, ..., P, u svakoj seriji testova pojavit će se jedna ili druga vrijednost slučajne varijable X, nije poznato unaprijed. dakle, i-e vrijednost x i slučajna varijabla dobijena u i th test, mijenja se nasumično ako prelazite s jedne serije testova na drugu. Dakle, svaka vrijednost x i može se smatrati slučajnim X i .


Pretpostavimo da testovi ispunjavaju sljedeće zahtjeve:

1. Testovi su nezavisni. To znači da su rezultati X 1 , X 2 ,
X 3 , ..., X n testovi su nezavisne slučajne varijable.

2. Testovi se izvode pod istim uslovima - to znači, sa stanovišta teorije verovatnoće, da svaka od slučajnih varijabli X 1 ,X 2 ,X 3 , ... ,X n ima isti zakon raspodjele kao i originalna vrijednost X, Zbog toga M(X i) =M(X)i D(X i) = D(X), i = 1, 2, .... P.

Uzimajući u obzir gore navedene uslove, dobijamo

R(| a| < ε )≥1 . (4.1.3)

Primjer 4.1.1. X je jednako 4. Koliko je nezavisnih eksperimenata potrebno da bi se sa vjerovatnoćom od najmanje 0,9 moglo očekivati ​​da će se aritmetička sredina ove slučajne varijable razlikovati od matematičkog očekivanja za manje od 0,5?

Odluka.Prema stanju problema ε = 0,5; R(| a|< 0,5) 0.9. Primjena formule (4.1.3) za slučajnu varijablu X, dobijamo

P(|–M(X)| < ε ) ≥ 1 .

Iz odnosa

1 = 0,9

definisati

P= = = 160.

Odgovori: potrebno je napraviti 160 nezavisnih eksperimenata.

Pod pretpostavkom da je aritmetička sredina normalno raspoređeni, dobijamo:

R(| a|< ε )= 2Φ () 0,9.

Odakle, koristeći tablicu Laplaceove funkcije, dobijamo
1,645, odnosno ≥ 6,58 tj. n ≥49.

Primjer 4.1.2. Varijanca slučajne varijable X je jednako D( X) = 5. Izvedeno je 100 nezavisnih eksperimenata prema kojima . Umjesto nepoznate vrijednosti matematičkog očekivanja a prihvaćeno . Odredite maksimalnu dozvoljenu količinu greške u ovom slučaju sa vjerovatnoćom od najmanje 0,8.

Odluka. Prema zadatku n= 100, R(| a|< ε ) ≥0,8. Primjenjujemo formulu (4.1.3)

R(| a|< ε ) ≥1 .

Iz odnosa

1 = 0,8

definisati ε :

ε 2 = = = 0,25.

dakle, ε = 0,5.

Odgovori: maksimalna vrijednost greške ε = 0,5.

4.2. Zakon velikih brojeva u Bernoullijevom obliku

Iako je koncept vjerovatnoće osnova svakog statističkog zaključivanja, samo u nekoliko slučajeva možemo direktno odrediti vjerovatnoću događaja. Ponekad se ova vjerovatnoća može utvrditi iz razmatranja simetrije, jednakih mogućnosti, itd., ali ne postoji univerzalna metoda koja bi omogućila da se ukaže na njenu vjerovatnoću za proizvoljan događaj. Bernulijeva teorema omogućava da se aproksimira vjerovatnoća ako za događaj koji nas zanima ALI mogu se izvršiti ponovljeni nezavisni testovi. Neka proizvedeno P nezavisni testovi, u svakom od kojih je vjerovatnoća nastanka nekog događaja ALI konstantan i jednak R.

Bernulijeva teorema. Uz neograničeno povećanje broja nezavisnih ispitivanja P relativna učestalost pojavljivanja događaja ALI konvergira u vjerovatnoći do vjerovatnoće str pojava događaja ALI,t. e.

P(½ - str½≤ ε) = 1, (4.2.1)

gdje ε je proizvoljno mali pozitivan broj.

Za finale n pod uslovom da , Čebiševljeva nejednakost za slučajnu varijablu imat će oblik:

P(| –p|< ε ) 1 .(4.2.2)

Dokaz. Primjenjujemo Čebiševljevu teoremu. Neka bude X i– broj pojavljivanja događaja ALI in i th test, i= 1, 2, . . . , n. Svaka od količina X i može uzeti samo dvije vrijednosti:

X i= 1 (događaj ALI dogodilo) sa vjerovatnoćom str,

X i= 0 (događaj ALI nije došlo) sa vjerovatnoćom q= 1–str.

Neka bude Y n= . Suma X 1 + X 2 + … + X n jednak je broju m pojave događaja ALI in n testovi (0 m n), što znači Y n= – relativna učestalost pojavljivanja događaja ALI in n testovi. Matematičko očekivanje i varijansa X i jednaki su redom:

M( ) = 1∙str + 0∙q = str,

Teorija vjerovatnoće proučava pravilnosti svojstvene masovnim slučajnim pojavama. Kao i svaka druga nauka, teorija vjerovatnoće je osmišljena da predvidi što je preciznije moguće rezultat određenog fenomena ili eksperimenta. Ako je fenomen jednostruke prirode, onda je teorija vjerovatnoće u stanju da predvidi samo vjerovatnoću ishoda u vrlo širokom rasponu. Pravilnosti se javljaju samo kod velikog broja slučajnih pojava koje se javljaju u homogenim uslovima.

Grupa teorema kojima se utvrđuje korespondencija između teorijskih i eksperimentalnih karakteristika slučajnih varijabli i slučajnih događaja sa velikim brojem testova na njima, kao i zakona o graničnim distribucijama, objedinjuje se pod opštim nazivom granične teoreme teorije vjerovatnoće.

Postoje dvije vrste graničnih teorema: zakon velikih brojeva i centralna granična teorema.

Zakon velikih brojeva, koji zauzima važno mjesto u teoriji vjerovatnoće, je veza između teorije vjerovatnoće kao matematičke nauke i zakona slučajnih pojava tokom masovnog posmatranja istih.

Zakon igra veoma važnu ulogu u praktičnim primenama teorije verovatnoće na prirodne pojave i tehničke procese povezane sa masovnom proizvodnjom.

Zakoni granične raspodjele su predmet grupe teorema - kvantitativnog oblika zakona velikih brojeva. One. zakon velikih brojeva je niz teorema, od kojih svaka utvrđuje činjenicu da su prosječne karakteristike velikog broja pokušaja aproksimirane određenim konstantama, tj. utvrditi činjenicu konvergencije u vjerovatnoći nekih slučajnih varijabli prema konstantama. To su teoreme Bernulija, Poissona, Ljapunova, Markova, Čebiševa.

1. a) Bernulijeva teorema - zakon velikih brojeva ( je formulisan i dokazan ranije u odeljku 3 § 6 kada se razmatra granična integralna teorema Moivre-Laplacea.)

Uz neograničeno povećanje broja homogenih nezavisnih eksperimenata, učestalost događaja će se proizvoljno malo razlikovati od vjerovatnoće događaja u zasebnom eksperimentu. Inače, vjerovatnoća da je odstupanje u relativnoj učestalosti događaja ALI iz konstantne vjerovatnoće R događaji ALI vrlo malo jer teži 1 za bilo koji : .

b) Čebiševljeva teorema.

Sa neograničenim povećanjem broja nezavisnih pokušaja, aritmetička sredina posmatranih vrednosti slučajne varijable sa konačnom varijansom konvergira po verovatnoći njenom matematičkom očekivanju; u suprotnom, ako su nezavisne identično raspoređene slučajne varijable sa matematičkim očekivanjem i ograničenom varijansom , tada je za bilo koje tačno: .

Čebiševljev teorem (generalizovan). Ako su slučajne varijable u nizu po parovima nezavisne i njihove varijanse zadovoljavaju uslov , tada je za bilo koji pozitivan ε > 0 tvrdnja tačna:


ili šta je isto .

c) Markova teorema. (zakon velikih brojeva u opštoj formulaciji)

Ako varijanse proizvoljnih slučajnih varijabli u nizu zadovoljavaju uvjet: , tada za bilo koje pozitivno ε > 0 vrijedi izjava Čebiševljeve teoreme: .

d) Poissonova teorema.

Uz neograničeno povećanje broja nezavisnih eksperimenata pod varijabilnim uvjetima, učestalost događaja ALI konvergira po vjerovatnoći sa aritmetičkom sredinom svojih vjerovatnoća pod ovim testovima.

Komentar. Ni u jednom od oblika zakona velikih brojeva se ne bavimo zakonima raspodjele slučajnih varijabli. Centralna granična teorema razmatra pitanje koje se odnosi na pronalaženje zakona granične raspodjele za zbir kada se broj članova neograničeno povećava. su podjednako raspoređeni, onda dolazimo do Moivre-Laplaceove integralne teoreme (§ 6 § 3), koja je najjednostavniji poseban slučaj centralne granične teoreme.

Na početku kursa smo već rekli da se matematički zakoni teorije vjerovatnoće dobijaju apstrahovanjem stvarnih statističkih pravilnosti svojstvenih masovnim slučajnim pojavama. Prisutnost ovih pravilnosti povezuje se upravo sa masovnošću fenomena, odnosno sa velikim brojem izvedenih homogenih eksperimenata ili sa velikim brojem slučajnih uticaja koji u svojoj ukupnosti generišu slučajnu varijablu podložnu dobro definisanom zakonu. Svojstvo stabilnosti masovnih nasumičnih pojava poznato je čovječanstvu od davnina. U kojoj god oblasti da se manifestuje, njena suština se svodi na sledeće: specifičnosti svake pojedinačne slučajne pojave gotovo da nemaju uticaja na prosečan rezultat masa i takvih pojava; slučajna odstupanja od proseka, neizbežna u svakoj pojedinačnoj pojavi, u masi se međusobno poništavaju, izravnavaju, izravnavaju. Upravo ta stabilnost prosjeka je fizički sadržaj "zakona velikih brojeva", shvaćenog u širem smislu riječi: s vrlo velikim brojem slučajnih pojava, njihov prosječni rezultat praktično prestaje biti slučajan i može se predvidjeti. sa visokim stepenom sigurnosti.

U užem smislu riječi, "zakon velikih brojeva" u teoriji vjerovatnoće podrazumijeva se kao niz matematičkih teorema, u svakoj od kojih je, za određene uvjete, činjenica aproksimacije prosječnih karakteristika velikog broja eksperimenata. na neke specifične konstante se uspostavlja.

U 2.3 smo već formulisali najjednostavniju od ovih teorema, J. Bernoullijevu teoremu. Ona tvrdi da se sa velikim brojem eksperimenata, učestalost događaja približava (tačnije, konvergira u vjerovatnoći) vjerovatnoći ovog događaja. Drugi, opštiji oblici zakona velikih brojeva biće predstavljeni u ovom poglavlju. Svi oni utvrđuju činjenicu i uslove za konvergenciju vjerovatnoće određenih slučajnih varijabli konstantnim, neslučajnim varijablama.

Zakon velikih brojeva igra važnu ulogu u praktičnoj primjeni teorije vjerovatnoće. Svojstvo slučajnih varijabli pod određenim uslovima da se ponašaju praktično kao neslučajne omogućava nam da pouzdano operišemo sa ovim veličinama, da predvidimo rezultate masovnih slučajnih pojava sa skoro potpunom sigurnošću.

Mogućnosti ovakvih predviđanja u oblasti slučajnih pojava mase dodatno su proširene prisustvom druge grupe graničnih teorema, koje se više ne odnose na granične vrednosti slučajnih varijabli, već na zakone granične distribucije. Ovo je grupa teorema poznatih kao "teorema središnje granice". Već smo rekli da pri sabiranju dovoljno velikog broja slučajnih varijabli, zakon raspodjele sume se neograničeno približava normalnom, pod uslovom da su ispunjeni određeni uvjeti. Ovi uslovi, koji se mogu matematički formulisati na različite načine - u manje-više opštem obliku - u suštini se svode na zahtev da uticaj na zbir pojedinačnih članova bude jednolično mali, odnosno da zbir ne uključuje članove koji jasno prevladavaju nad skupom ostali svojim uticajem na disperziju iznosa. Različiti oblici centralne granične teoreme razlikuju se jedni od drugih po uslovima za koje se uspostavlja ovo granično svojstvo zbira slučajnih varijabli.

Različiti oblici zakona velikih brojeva, zajedno sa različitim oblicima centralne granične teoreme, čine skup takozvanih graničnih teorema teorije vjerovatnoće. Granične teoreme omogućavaju ne samo da se prave naučne prognoze u oblasti slučajnih pojava, već i da se proceni tačnost ovih prognoza.

U ovom poglavlju razmatramo samo neke od najjednostavnijih oblika graničnih teorema. Prvo će se razmatrati teoreme vezane za grupu "zakon velikih brojeva", zatim - teoreme vezane za grupu "teorema centralne granice".

Sasvim je prirodno potreba da se kvantifikuje izjava da je u „velikim“ serijama testova učestalost pojave događaja „bliska“ njegovoj verovatnoći. Mora se jasno shvatiti određena delikatnost ovog zadatka. U najtipičnijim slučajevima za teoriju vjerovatnoće situacija je takva da u proizvoljno dugim serijama testova obje ekstremne vrijednosti frekvencije ostaju teoretski moguće

\frac(\mu)(n)=\frac(n)(n)=1 i \frac(\mu)(n)=\frac(0)(n)=0

Stoga, bez obzira na broj pokušaja n, nemoguće je sa potpunom sigurnošću tvrditi da je, recimo, nejednakost

<\frac{1}{10}

Na primjer, ako se događaj A sastoji od bacanja šestice prilikom bacanja kocke, onda nakon n bacanja s vjerovatnoćom (\lijevo(\frac(1)(6)\desno)\^n>0 !} uvijek ćemo dobiti samo šestice, tj. sa vjerovatnoćom (\lijevo(\frac(1)(6)\desno)\^n !} dobijamo frekvenciju pojavljivanja šestica jednaku jedan, i to sa vjerovatnoćom (\lijevo(1-\frac(1)(6)\desno)\^n>0 !}šestica ne ispadne ni jednom, tj. učestalost pojavljivanja šestica će biti jednaka nuli.

U svim takvim problemima, svaka netrivijalna procjena blizine između frekvencije i vjerovatnoće ne djeluje s potpunom sigurnošću, već samo s nekom vjerovatnoćom manjom od jedinice. Može se dokazati, na primjer, da u slučaju nezavisnih ispitivanja sa konstantnom vjerovatnoćom p pojave događaja, nejednakost

\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02

za frekvenciju \frac(\mu)(n) će se izvršiti na n=10\,000 (i bilo koji p) sa vjerovatnoćom

P>0,\!9999.

Ovdje prije svega želimo naglasiti da je u gornjoj formulaciji kvantitativna procjena blizine frekvencije \frac(\mu)(n) vjerovatnoći p povezana sa uvođenjem nove vjerovatnoće P.

Pravo značenje procjene (8) je sljedeće: ako napravimo N serija od n testova i izbrojimo broj M serija u kojima je nejednakost (7) zadovoljena, tada za dovoljno veliki N približno

\frac(M)(N)\približno P>0,\!9999.

Ali ako želimo precizirati odnos (9) iu smislu stepena bliskosti \frac(M)(N) sa vjerovatnoćom P, iu smislu pouzdanosti s kojom se može tvrditi da će se takva bliskost dogoditi, tada ćemo se morati okrenuti razmatranjima sličnim onima koje smo već radili s blizinom \frac(\mu)(n) i p . Po želji, takvo razmišljanje se može ponoviti neograničen broj puta, ali je sasvim jasno da nam to neće dozvoliti da se potpuno oslobodimo potrebe da se u posljednjoj fazi okrenemo vjerojatnostima u primitivnom grubom smislu te riječi.

Ne treba misliti da su takve poteškoće neka karakteristika teorije vjerovatnoće. U matematičkom proučavanju stvarnih pojava mi ih uvijek shematiziramo. Odstupanja toka stvarnih pojava od teorijske sheme mogu se, zauzvrat, podvrgnuti matematičkom proučavanju. Ali za to se sama ova odstupanja moraju smjestiti u određenu shemu, a ovu drugu treba koristiti već bez formalne matematičke analize odstupanja od nje.

Imajte na umu, međutim, da u stvarnoj primjeni procjene

P\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}>0,\!9999.


za jednu seriju od n testova, takođe se oslanjamo na neka razmatranja simetrije: nejednakost (10) ukazuje da će za veoma veliki broj N serija relacija (7) biti zadovoljena u najmanje 99,99% slučajeva; prirodno je sa velikom sigurnošću očekivati ​​da će se, posebno, nejednakost (7) ostvariti u određenoj seriji n ispitivanja koja nas zanima, ako imamo razloga vjerovati da ovaj niz zauzima običnu, neoznačenu poziciju u nizu druge serije.

Vjerovatnoće koje se obično zanemaruju u različitim praktičnim pozicijama su različite. Gore je već napomenuto da se u grubim proračunima potrošnje školjki, koja garantuje ispunjenje zadatka, zadovoljavaju stopom potrošnje školjki, pri kojoj je zadatak riješen sa vjerovatnoćom od 0,95, tj. zanemariti vjerovatnoće koje ne prelaze 0,05. To se objašnjava činjenicom da bi prelazak na proračune polazeći od zanemarivanja, recimo, samo vjerovatnoća manjih od 0,01, doveo do velikog povećanja stopa potrošnje projektila, odnosno u gotovo velikom broju slučajeva, do zaključka da je nemoguće izvršiti postavljeni zadatak u tom kratkom vremenskom periodu koji je za to na raspolaganju, ili sa stvarnim zalihama školjki koje se mogu iskoristiti.

Ponekad su, čak iu naučnim istraživanjima, ograničeni na statističke metode izračunate na osnovu zanemarenih vjerovatnoća od 0,05. Ali to bi trebalo učiniti samo u slučajevima kada je prikupljanje većeg materijala veoma teško. Razmotrite sljedeći problem kao primjer takvih metoda. Pretpostavimo da pod određenim uslovima uobičajeni lijek za liječenje bolesti daje pozitivan rezultat u 50%, odnosno sa vjerovatnoćom od 0,5. Predlaže se novi lijek, a kako bi se ispitale njegove prednosti u odnosu na stari, planirano je da se koristi u deset slučajeva, nepristrasno odabranih među pacijentima u istom položaju kao i oni za koje je utvrđeno da je stari lijek 50% efikasan. Istovremeno, utvrđeno je da će se prednost novog lijeka smatrati dokazanom ako daje pozitivan rezultat u najmanje osam od deset slučajeva. Lako je izračunati da je takva odluka povezana sa zanemarivanjem vjerovatnoće dobijanja pogrešnog zaključka (tj. zaključka da je dobrobit novog lijeka dokazana, a da je ekvivalentan ili čak gori od starog) samo red od 0,05. Zaista, ako je u svakom od deset ispitivanja vjerovatnoća pozitivnog ishoda jednaka p, tada su vjerovatnoće da se dobije 10,9 odnosno 8 pozitivnih ishoda u deset ispitivanja jednake, respektivno.

P_(10)=p^(10),\qquad P_9=10p^9(1-p),\qquad P_8=45p^8(1-p)^2.

Sve u svemu, za slučaj p=\frac(1)(2) dobijamo P=P_(10)+P_9+P_8=\frac(56)(1024)\cca0,\!05.

Dakle, pod pretpostavkom da je novi lijek zapravo potpuno ekvivalentan starom, rizikujemo da pogrešno zaključimo da je novi lijek superiorniji od starog s vjerovatnoćom od oko 0,05. Da bi se ova vjerovatnoća smanjila na oko 0,01, bez povećanja broja ispitivanja n=10, moralo bi se utvrditi da bi se korist od novog lijeka smatrala dokazanom samo ako njegova upotreba daje pozitivan rezultat u najmanje devet od deset slučajeva. . Ako se ovaj zahtjev čini prestrog za zagovornike novog lijeka, tada će se broj ispitivanja n morati postaviti na značajno veći od 10. Ako se, na primjer, pri n=100 utvrdi da su prednosti novog lijeka lijek će se smatrati dokazanim kada \mu>65 , tada će vjerovatnoća greške biti samo P\pribl0,\!0015 .

Ako je norma od 0,05 očito nedovoljna za ozbiljna naučna istraživanja, onda je vjerovatnoća greške od 0,001 ili 0,003 najvećim dijelom zanemarena čak iu takvim akademskim i detaljnim studijama kao što je obrada astronomskih opservacija. Međutim, ponekad naučni zaključci zasnovani na primjeni vjerojatnosnih zakona također imaju mnogo veću pouzdanost (odnosno, izgrađeni su na zanemarivanju mnogo nižih vjerovatnoća). O tome će biti više reči kasnije.

U razmatranim primjerima više puta smo koristili posebne slučajeve binomske formule (6)

P_m=C_n^mp^m(1-p)^(n-m)

za vjerovatnoću P_m da dobije tačno m pozitivnih ishoda u n nezavisnih ispitivanja, od kojih svaki pozitivan ishod ima vjerovatnoću p. Upotrijebimo ovu formulu da razmotrimo pitanje koje je postavljeno na početku ovog odjeljka o vjerovatnoći

<\varepsilon\right\},

gdje je \mu stvarni broj pozitivnih ishoda. Očigledno, ova vjerovatnoća se može napisati kao zbir onih P_m za koje m zadovoljava nejednakost

\vline\,\frac(m)(n)-p\,\vline\,<\varepsilon,


odnosno u formi

P=\sum_(m=m_1)^(m_2)P_m,

gdje je m_1 najmanja od m vrijednosti koje zadovoljavaju nejednakost (12), a m_2 je najveća od takvih m .

Formula (13) za bilo koje veliko n je od male koristi za direktne proračune. Stoga je Moivreovo otkriće za slučaj p=\frac(1)(2) i Laplacea, za bilo koje p, asimptotske formule, što olakšava pronalaženje i proučavanje ponašanja vjerovatnoća P_m za velike n , bio je od velike važnosti. Ova formula izgleda

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\exp\!\left[-\frac((m-np)^2)(2np(1-p)) \desno].

Ako p nije preblizu nuli ili jedan, onda je dovoljno tačno već za n reda 100. Ako stavimo

T=\frac(m-np)(\sqrt(np(1-p))),

Tada će formula (14) poprimiti oblik

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\,e^(-t^2/2).


Iz (13) i (16) možemo izvesti približan prikaz vjerovatnoće (11)

P\sim\frac(1)(\sqrt(2\pi))\int\limits_(-T)^(T)e^(-t^2/2)\,dt=F(T),


gdje

T=\varepsilon\sqrt(\frac(n)(p(1-p)))

Razlika između lijevog i desnog dijela u (17) pri konstanti i različitoj od nule i jedinice teži nuli na n\do\infty ravnomjerno u odnosu na \varepsilon. Detaljne tabele su sastavljene za F(T) funkciju. Evo kratkog izvoda iz njih

\begin(array)(c|c|c|c|c)T&1&2&3&4\\\hline F&0,\!68269&0,\!95450&0,\!99730&0,\!99993\end(niz)


Na T\to\infty vrijednost funkcije F(T) teži jedinici.

Koristimo formulu (17) za procjenu vjerovatnoće

P=\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}\approx F\!\left(\frac{2}{\sqrt{p(1-p)}}\right) at n=10\,000,~\varepsilon=0,\!02, as T=\frac(2)(\sqrt(p(1-p))).

Budući da funkcija F(T) monotono raste sa povećanjem T, za p-nezavisnu procjenu P odozdo, mora se uzeti najmanja moguća (za različite p) vrijednost T. Ova najmanja vrijednost će se dobiti sa p=\frac(1)(2) , i bit će jednaka 4. Dakle, približno

P\geqslant F(4)=0,\!99993.

Nejednakost (19) ne uzima u obzir grešku zbog aproksimativne prirode formule (17). Procjenom greške povezane s ovom okolnošću, može se u svakom slučaju utvrditi da je P>0,\!9999 .

U vezi sa razmatranim primjerom primjene formule (17), treba napomenuti da su procjene preostalog člana formule (17), date u teorijskim radovima iz teorije vjerovatnoće, dugo ostajale slabo zadovoljavajuće. Stoga se primjena formule (17) i sličnih na proračune za ne baš veliko n ili za vjerovatnoće p koje su vrlo blizu 0 ili 1 (a takve su vjerovatnoće u mnogim slučajevima posebno važne) često zasnovane samo na iskustvu provjeravajući takve rezultate.za ograničen broj primjera, a ne na dobro utvrđenim procjenama moguće greške. Štaviše, detaljnija studija je pokazala da u mnogim praktično važnim slučajevima gore navedene asimptotske formule ne zahtijevaju samo procjenu ostatka člana, već i preciziranje (jer je bez takvog preciziranja preostali član prevelik). U oba smjera, za najpotpunije rezultate zaslužan je S. N. Bernshtein.

Relacije (11), (17) i (18) se mogu prepisati kao

\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,

Za dovoljno veliki t, desna strana formule (20), koja ne sadrži n, proizvoljno je bliska jedinici, odnosno vrijednosti vjerovatnoće koja odgovara punoj sigurnosti. Vidimo, dakle, to po pravilu, odstupanja frekvencije \frac(\mu)(n) od vjerovatnoće p su reda \frac(1)(\sqrt(n)). Ovakva proporcionalnost tačnosti delovanja verovatnosnih pravilnosti sa kvadratnim korenom broja opažanja tipična je i za mnoga druga pitanja. Ponekad čak govore, u cilju donekle pojednostavljene popularizacije, o "zakonu kvadratnog korena od n" kao osnovnom zakonu teorije verovatnoće. Ova ideja je dobila potpunu jasnoću zahvaljujući uvođenju velikog ruskog matematičara P. L. Čebiševa u sistematsku upotrebu metode svođenja različitih probabilističkih problema na proračune „matematičkih očekivanja“ i „varijansi“ za sume i aritmetičke sredine „slučajnih varijabli“.

Slučajna varijabla je veličina koja pod datim uslovima S može poprimiti različite vrijednosti sa određenim vjerovatnoćama. Dovoljno je da razmotrimo slučajne varijable koje mogu uzeti samo konačan broj različitih vrijednosti. Da naznači kako kažu raspodjela vjerovatnoće takva slučajna varijabla \xi, dovoljno je naznačiti njene moguće vrijednosti x_1,x_2,\ldots,x_r i vjerovatnoće

P_r=\mathbf(P)\(\xi=x_r\).


Sve u svemu, ove vjerovatnoće za sve različite moguće vrijednosti \xi su uvijek jednake jedan:

\sum_(r=1)^(s)P_r=1.

Primjer slučajne varijable je broj \mu pozitivnih ishoda proučavanih iznad u n ispitivanja.

matematičko očekivanje vrijednost \xi se naziva izrazom

M(\xi)=\sum_(r=1)^(s)P_rx_r,


a disperzija veličine \xi se odnose na srednju vrijednost kvadratne devijacije \xi-M(\xi) , tj. izraz

D(\xi)=\sum_(r=1)^(s)P_r(x_r-M(\xi))^2.


Kvadratni korijen varijanse

\sigma_(\xi)=\sqrt(D(\xi))=\sqrt(\sum_(r=1)^(s)P_r(x_r-M(\xi))^2)


pozvao standardna devijacija(vrijednosti iz njegovog matematičkog očekivanja M(\xi)).

Najjednostavnije primjene varijansi i standardnih devijacija baziraju se na poznatim Čebiševljeva nejednakost

\mathbf(P)\(|\xi-M(\xi)|\leqslant t_(\sigma_(\xi))\)\geqslant1-\frac(1)(t^2),

Pokazuje da su odstupanja slučajne varijable \xi od njenog matematičkog očekivanja M(\xi) , koja su mnogo veća od standardne devijacije \sigma_(\xi) , rijetka.

U formiranju suma slučajnih varijabli \xi=\xi^((1))+ \xi^((2))+\cdots+\xi^((n)) za njihova matematička očekivanja, jednakost uvijek vrijedi

M(\xi)=M(\xi^((1)))+M(\xi^((2)))+\cdots+M(\xi^((n))).


Slična jednakost za varijanse

D(\xi)=D(\xi^((1)))+D(\xi^((2)))+\cdots+D(\xi^((n))).

istinito samo pod određenim ograničenjima. Da bi jednakost (23) bila važeća, dovoljno je, na primjer, da veličine \xi^((i)) i \xi^((j)) s različitim brojevima nisu, kako kažu, "korelirane" sa međusobno, tj. da kod i\ne j

M\Bigl\((\xi^((i))-M(\xi^((i))))(\xi^((j))-M(\xi^((j))))\ Bigl\)=0

Koeficijent korelacije između slučajnih varijabli \xi^((i)) i \xi^((j)) je izraz

R=\frac(M\Bigl\(\Bigl(\xi^((i))-M(\xi^((i)))\Bigl)\Bigl(\xi^((j))-M( \xi^((j)))\Bigl)\Bigl\))(\sigma_(\xi^((i)))\,\sigma_(\xi^((j)))).

Ako a \sigma_(\xi^((i)))>0 in \sigma_(\xi^((j)))>0, tada je uvjet (24) ekvivalentan R=0 .

Koeficijent korelacije R karakteriše stepen zavisnosti između slučajnih varijabli. Uvijek |R|\leqslant1 , i R=\pm1 samo ako postoji linearna veza

\eta=a\xi+b\quad(a\ne0).

Za nezavisne vrijednosti R=0.

Konkretno, jednakost (24) je zadovoljena ako su veličine \xi^((i)) i \xi^((j)) nezavisne jedna od druge. Dakle, jednakost (23) uvijek vrijedi za međusobno nezavisne članove. Za aritmetičke prosjeke

\zeta=\frac(1)(n)\Bigl(\xi^((1))+\xi^((2))+\cdots+\xi^((n))\Bigl) iz (23) slijedi

D(\zeta_=\frac(1)(n^2)\Bigl(D(\xi^((1)))+ D(\xi^((2)))+\cdots+ D(\xi^( (n)))\Bigl).

Pretpostavimo sada da za sve članove varijanse ne prelaze neku konstantu

D(\xi^((i)))\leqslant C^2. Zatim prema (25) D(\zeta)\leqslant\frac(C^2)(n),


i zbog Čebiševe nejednakosti za bilo koji t

\mathbf(P)\!\left\(|\zeta-M(\zeta)|\leqslant\frac(tC)(\sqrt(n))\right\)\geqslant1-\frac(1)(t^ 2)

Nejednakost (26) sadrži takozvani zakon velikih brojeva u obliku koji je ustanovio Čebišev: ako su veličine \xi^((i)) međusobno nezavisne i imaju ograničene varijanse, onda kako se n povećava, njihovi aritmetički prosjeki \zeta , sve manje primjetno odstupaju od svojih matematičkih očekivanja M(\zeta) .

Tačnije, tako kažu niz slučajnih varijabli

\xi^((1)),\,\xi^((2)),\,\ldots\,\xi^((n)),\,\ldots


poštuje zakon velikih brojeva ako za odgovarajuće aritmetičke prosjeke \zeta i za bilo koju konstantu \varepsilon>0

\mathbf(P)\(|\zeta-M(\zeta)|\leqslant \varepsilon\)\to1\quad (n\to\infty).

Da bismo dobili graničnu relaciju (27) iz nejednakosti (26), dovoljno je postaviti

T=\varepsilon\cdot\frac(\sqrt(n))(C).

Veliki broj studija A.A. Markova, S.N. Bernstein, A.Ya. Khinčin i drugi posvećen je pitanju mogućeg proširenja uslova za primenljivost granične relacije (27), odnosno uslova za primenljivost zakona velikih brojeva. Ove studije su od fundamentalnog značaja. Međutim, još važnije je precizno proučavanje distribucije vjerovatnoće devijacije \zeta-M(\zeta) .

Velika zasluga ruske klasične škole u teoriji vjerovatnoće je utvrđivanje činjenice da je, pod vrlo širokim uslovima, jednakost

\mathbf(P)\!\left\(t_1\sigma_(\zeta)<\zeta-M(\zeta)

Čebišev je dao gotovo potpun dokaz ove formule za slučaj nezavisnih i ograničenih članova. Markov je popunio kariku koja nedostaje u Čebiševljevom rezonovanju i proširio uslove za primenljivost formule (28). Još opštije uslove dao je Ljapunov. Pitanje proširenja formule (28) na sume zavisnih članova s ​​posebnom potpunošću proučavao je S. N. Bernshtein.

Formula (28) je pokrivala tako veliki broj posebnih problema da se dugo vremena nazivala središnjom graničnom teoremom teorije vjerovatnoće. Iako se najnovijim razvojem teorije vjerovatnoće pokazalo da je uključena u niz opštijih zakona, njen značaj se ni danas ne može precijeniti.

Vrijeme.

Ako su termini nezavisni i njihove varijanse su iste i jednake: D(\xi^((i)))=\sigma^2, onda je pogodno da formula (28), uzimajući u obzir relaciju (25), da oblik

\mathbf(P)\!\left\(\frac(t_1\sigma)(\sqrt(n))<\zeta-M(\zeta)<\frac{t_2\sigma}{\sqrt{n}}\right\}\sim\frac{1}{\sqrt{2\pi}}\int\limits_{t_1}^{t_2}e^{-t^2/2}\,dt\,.

Pokažimo da relacija (29) sadrži rješenje problema odstupanja frekvencije \frac(\mu)(n) od vjerovatnoće p, kojim smo se ranije bavili. Da bismo to učinili, uvodimo slučajne varijable \xi^((i)) definirajući ih sljedećim uvjetom:

\xi^((i))=0 ako je i -o ispitivanje imalo negativan ishod,

\xi^((i))=1 ako je i -o ispitivanje imalo pozitivan ishod.

Tada je to lako provjeriti


a formula (29) daje

\mathbf(P)\!\left\(t_1\sqrt(\frac(p(1-p))(n))<\frac{\mu}{n}-p
što za t_1=-t,~t_2=t opet dovodi do formule (20).
Također pogledajte Granične teoreme u teoriji vjerovatnoće Javascript je onemogućen u vašem pretraživaču.
ActiveX kontrole moraju biti omogućene da bi se izvršili proračuni!

Lemma Chebyshev. Ako je slučajna varijabla X, za koje postoji matematičko očekivanje M[x], može uzeti samo nenegativne vrijednosti, tada za bilo koji pozitivan broj a imamo nejednakost

Čebiševljeva nejednakost. Ako a X je slučajna varijabla sa matematičkim očekivanjem M[x] i disperzija D[x], tada za bilo koje pozitivno e ​​imamo nejednakost

. (2)

Čebiševljeva teorema.(zakon velikih brojeva). Neka bude X 1 , X 2 , …, x n,… - niz nezavisnih slučajnih varijabli sa istim matematičkim očekivanjem m i varijanse ograničene istom konstantom sa

. (3)

Dokaz teoreme zasniva se na nejednakosti

, (4)

proizilazeći iz nejednakosti Čebiševa. Iz Čebiševljeve teoreme, kao posledica, može se dobiti

Bernulijeva teorema. Neka se proizvede n nezavisni eksperimenti, u svakom od kojih sa vjerovatnoćom R može doći do nekog događaja ALI, pusti to v n je slučajna varijabla jednaka broju pojavljivanja događaja ALI u ovim n eksperimenti. Tada za bilo koje e > 0 imamo graničnu jednakost

. (5)

Imajte na umu da nejednakost (4) primijenjena na uslove Bernoullijeve teoreme daje:

. (6)

Čebiševljeva teorema se može formulirati u nešto opštijem obliku:

Generalizovana Čebiševljeva teorema. Neka bude x 1, x 2, …, x n,… - niz nezavisnih slučajnih varijabli sa matematičkim očekivanjima M[x 1 ] = m 1 , M[x2] = m 2 ,… i disperzije ograničene istom konstantom sa. Tada za bilo koji pozitivan broj e imamo graničnu jednakost

. (7)

Neka je x broj pojavljivanja od 6 poena u 3600 bacanja kockice. Tada M[ x] = 3600 = 600. Koristimo sada nejednakost (1) za a = 900: .

Koristimo nejednakost (6) za n = 10000, p = , q = . Onda

Primjer.

Vjerovatnoća pojave događaja A u svakom od 1000 nezavisnih eksperimenata je 0,8. Pronađite vjerovatnoću da će broj pojavljivanja događaja A u ovih 1000 eksperimenata odstupiti od svog matematičkog očekivanja u apsolutnoj vrijednosti za manje od 50.

Neka je x broj pojavljivanja događaja A u specificiranih 1000 eksperimenata. Tada M[ x] = 1000 × 0,8 = 800 i D[ x] = 1000 × 0,8 × 0,2 = 160. Sada nejednakost (2) daje:


Primjer.

Varijanca svake od 1000 nezavisnih slučajnih varijabli x k (k = 1, 2,..., 1000) je 4. Procijenite vjerovatnoću da će odstupanje aritmetičke sredine ovih varijabli od aritmetičke sredine njihovih matematičkih očekivanja u apsolutnoj vrijednosti neće prelaziti 0,1.

Prema nejednakosti (4), za c = 4 i e = 0,1 imamo