Biografije Karakteristike Analiza

Centralna granična teorema za lutke. Statistički model jediničnih procesa

Pored teorema koje se odnose na zakon velikih brojeva, postoji još jedna grupa teorema koje formiraju takozvanu centralnu graničnu teoremu. Ova grupa teorema određuje uslove pod kojima nastaje zakon normalne distribucije. Ovakvi uslovi su prilično česti u praksi, što je, zapravo, objašnjenje činjenice da se normalni zakon najčešće koristi u slučajnim pojavama u praksi. Razlika između oblika centralne granične teoreme sastoji se u formulaciji različitih uslova nametnutih zbiru razmatranih slučajnih varijabli. Najvažnije mjesto među svim ovim oblicima pripada Ljapunovljevoj teoremi.

Ljapunovljeva teorema. Ako a X 1 , X 2 , … , X n su nezavisne slučajne varijable sa konačnim matematičkim očekivanjima i varijacijama, dok se nijedna od vrijednosti ne razlikuje od svih ostalih po svojoj vrijednosti, tj. ima zanemariv uticaj na zbir ovih veličina, tada uz neograničeno povećanje broja slučajnih varijabli n, zakon distribucije njihovog zbira se neograničeno približava normalnom.

Posljedica. Ako su sve slučajne varijable X 1 , X 2 , … , X n su jednako raspoređeni, onda se zakon raspodjele njihovog zbira neograničeno približava normalnom uz neograničeno povećanje broja članova.

Ljapunovljeva teorema je od velike praktične važnosti. Empirijski je ustanovljeno da je aproksimacija normalnom zakonu prilično brza. Pod uslovima Ljapunovljeve teoreme, zakon raspodele zbira čak deset članova već se može smatrati normalnim.

Postoji složeniji i opštiji oblik Ljapunovljeve teoreme.

Opća teorema Ljapunova. Ako a X 1 , X 2 , … , X n su nezavisne slučajne varijable sa matematičkim očekivanjima a i , varijanse σ 2 i , centralni momenti trećeg reda t ja i

zatim zakon raspodjele sume X 1 + X 2 + … + X n at n približava se normalnom neograničeno sa očekivanjima i disperzija .

Značenje uslova (2.1) je da u zbiru slučajnih varijabli ne bi postojao niti jedan član čiji bi uticaj na disperziju zbira varijabli bio nadmoćno veliki u poređenju sa uticajem svih drugih slučajnih varijabli. Pored toga, ne bi trebalo da postoji veliki broj pojmova čiji je uticaj na disperziju sume veoma mali u poređenju sa ukupnim uticajem ostalih.

Jedan od najranijih oblika središnje granične teoreme bila je Laplaceova teorema.

Laplaceov teorem. Neka se proizvede n nezavisni eksperimenti, od kojih svaki događaj ALI pojavljuje se sa vjerovatnoćom R, zatim za velike n približnu jednakost

(2.2)

gdje Y n je broj pojavljivanja događaja ALI in n eksperimenti; q=1-str; F( X) je Laplaceova funkcija.

Laplaceov teorem omogućava da se pronađu približne vjerovatnoće vrijednosti binomno raspoređenih slučajnih varijabli za velike vrijednosti veličine n. Međutim, u isto vrijeme, vjerovatnoća R ne bi trebao biti ni dovoljno mali ni dovoljno velik.

Za praktične probleme, formula (2.2) se često piše u drugom obliku, naime

(2.3)

Primjer 2.1. Mašina daje na smjenu n=1000 artikala, od kojih je 3% u prosjeku neispravno. Naći približnu vjerovatnoću da će se tokom smjene proizvesti najmanje 950 dobrih (bez grešaka) proizvoda, ako se ispostavi da su proizvodi neovisno jedan o drugom.

Rješenje . Neka Y- broj dobrih proizvoda. Prema zadatku R= 1-0,03=0,97; broj nezavisnih eksperimenata n=1000. Primjenjujemo formulu (2.3):

Primjer 2.2, U uvjetima prethodnog primjera saznajte koliko dobrih proizvoda k mora sadržavati kutiju tako da vjerovatnoća njenog prelivanja u jednoj smjeni ne prelazi 0,02.

Rješenje . Iz uslova je jasno da . Nađite iz ovog uslova broj k. Imamo
, tj. .

Prema tabeli Laplaceove funkcije, po vrijednosti 0,48 nalazimo argument jednak 2,07. Dobijamo
. ■

Primjer 2.3. U banci 16 ljudi stoji na određenoj blagajni kako bi primili određene sume novca. U ovoj blagajni trenutno ima 4.000 den. jedinice Sume X i , koji se mora platiti svakom od 20 ljudi, su slučajne varijable sa matematičkim očekivanjima t= 160 gotovinskih jedinica i standardnu ​​devijaciju σ = 70 den.un. Pronađite vjerovatnoću da nema dovoljno novca u ladici za gotovinu da platite sve u redu.

Rješenje . Ljapunovljev teorem primjenjujemo za identično distribuirane slučajne varijable. vrijednost n= 20 može se smatrati prilično velikim, dakle, ukupan iznos plaćanja Y= X 1 + X 2 + … + X 16 se može smatrati slučajnom varijablom distribuiranom prema normalnom zakonu s matematičkim očekivanjem t y= nt= 20 160= 3200 i standardna devijacija .

Granične teoreme teorije vjerovatnoće

Čebiševljeva nejednakost

Razmotrimo niz tvrdnji i teorema iz velike grupe takozvanih graničnih teorema teorije vjerovatnoće, uspostavljajući vezu između teorijskih i eksperimentalnih karakteristika slučajnih varijabli sa velikim brojem testova na njima. Oni čine osnovu matematičke statistike. Granične teoreme se konvencionalno dijele u dvije grupe. Prva grupa teorema, tzv zakon velikih brojeva, uspostavlja stabilnost srednjih vrijednosti, tj. sa velikim brojem pokušaja, njihov prosječni rezultat prestaje biti slučajan i može se predvidjeti sa dovoljnom tačnošću. Druga grupa teorema, tzv centralna granica, uspostavlja uslove pod kojima se zakon distribucije zbira velikog broja slučajnih varijabli približava normalnom neograničeno.

Prvo, razmotrimo Čebiševljevu nejednakost, koja se može koristiti za: a) grubu procjenu vjerovatnoća događaja povezanih sa slučajnim varijablama čija je distribucija nepoznata; b) dokazi brojnih teorema zakona velikih brojeva.

Teorema 7.1. Ako je slučajna varijabla X ima matematičko očekivanje i varijansu DX, zatim nejednakost Čebiševa

. (7.1)

Imajte na umu da se nejednakost Čebiševa može napisati u drugom obliku:

za frekvencije ili događaji u n nezavisna ispitivanja, u svakom od kojih se može dogoditi sa vjerovatnoćom , čija je varijansa , Čebiševljeva nejednakost ima oblik

Nejednakost (7.5) se može prepisati kao

. (7.6)

Primjer 7.1. Koristeći Čebiševljevu nejednakost, procijenite vjerovatnoću da će odstupanje slučajne varijable X od njegovog matematičkog očekivanja bit će manje od tri standardne devijacije, tj. manje .

Rješenje:

Uz pretpostavku formule (7.2), dobijamo

Ova procjena se zove tri sigma pravilo.

Čebiševljeva teorema

Glavna izjava zakona velikih brojeva sadržana je u Čebiševovoj teoremi. U njemu i drugim teoremama zakona velikih brojeva koristi se koncept "konvergencije slučajnih varijabli u vjerovatnoći".

slučajne varijable konvergiraju u vjerovatnoći na vrijednost A (slučajna ili neslučajna), ako za bilo koje vjerovatnoća događaja na teži jedinici, tj.

(ili ). Konvergencija u vjerovatnoći se simbolički zapisuje na sljedeći način:

Treba napomenuti da konvergencija u vjerovatnoći zahtijeva da nejednakost vrijedi za veliku većinu članova sekvence (u matematičkoj analizi - za sve n > N, gdje N- određeni broj), a za gotovo sve članove niza mora spadati ε- susjedstvo ALI.

Teorema 7.3 (Zakon velikih brojeva u obliku P.L. Čebiševa). Ako su slučajne varijable su nezavisni i postoji broj C> 0, što , zatim za bilo koje

, (7.7)

one. aritmetička sredina ovih slučajnih varijabli konvergira po vjerovatnoći sa aritmetičkom sredinom njihovih matematičkih očekivanja:

.

Dokaz. Od tada

.

Zatim, primjenom Čebiševljeve nejednakosti (7.2) na slučajnu varijablu, imamo

one. aritmetička sredina slučajnih varijabli konvergira po vjerovatnoći matematičkom očekivanju a:

Dokaz. Jer

a varijanse slučajnih varijabli , tj. ograničene su, a onda primjenom Čebiševljeve teoreme (7.7) dobijamo tvrdnju (7.9).

Posljedica Čebiševljeve teoreme opravdava princip "aritmetičke sredine" slučajnih varijabli H i stalno koristi u praksi. Da, neka se uradi n nezavisna mjerenja neke veličine, čija je prava vrijednost a(nepoznato je). Rezultat svakog mjerenja je slučajna varijabla H i. Prema posljedici, kao približna vrijednost količine a možete uzeti aritmetičku sredinu rezultata mjerenja:

.

Jednakost je što tačnija, to više n.

Čebiševljeva teorema se takođe zasniva na široko korišćenom u statistici metoda uzorkovanja, čija je suština da se o kvalitetu velike količine homogenog materijala može suditi po njegovom malom uzorku.

Čebiševljev teorem potvrđuje vezu između slučajnosti i nužnosti: prosječna vrijednost slučajne varijable se praktično ne razlikuje od neslučajne varijable.

Bernulijeva teorema

Bernulijeva teorema je istorijski prvi i najjednostavniji oblik zakona velikih brojeva. Teorijski potkrepljuje svojstvo stabilnosti relativne frekvencije.

Teorema 7.4 (Zakon velikih brojeva u obliku J. Bernoullija). Ako je vjerovatnoća da će se neki događaj dogoditi ALI u jednom testu je R, broj pojavljivanja ovog događaja u n nezavisni pokušaji je jednako , tada za bilo koji broj imamo jednakost

, (7.10)

odnosno relativna učestalost događaja ALI konvergira vjerovatnoća prema vjerovatnoći R razvoj događaja ALI: .

Dokaz. Uvodimo slučajne varijable na sljedeći način: ako je in i-th suđenje dogodio se događaj ALI, a ako se ne pojavi, onda . Zatim broj ALI(broj uspjeha) može se predstaviti kao

Matematičko očekivanje i varijansa slučajnih varijabli su: , . Zakon raspodjele slučajnih varijabli X i ima oblik

H i
R R

za bilo koji i. Dakle, slučajne varijable X i neovisne, njihove varijanse su ograničene na isti broj , budući da

.

Stoga se Čebiševljev teorem može primijeniti na ove slučajne varijable

.

,

shodno tome, .

Bernulijeva teorema teoretski potkrepljuje mogućnost približnog izračuna vjerovatnoće događaja koristeći njegovu relativnu frekvenciju. Tako se, na primjer, relativna učestalost ovog događaja može uzeti kao vjerovatnoća rođenja djevojčice, koja je, prema statističkim podacima, približno jednaka 0,485.

Čebiševljeva nejednakost (7.2) za slučajne varijable

poprima oblik

gdje pi- vjerovatnoća događaja ALI in ja- m test.

Primjer 7.2. Vjerovatnoća štamparske greške na jednoj stranici rukopisa je 0,2. Procijenite vjerovatnoću da se u rukopisu koji sadrži 400 stranica učestalost pojavljivanja greške u otisku razlikuje od odgovarajuće vjerovatnoće po modulu manjem od 0,05.

Rješenje:

Koristimo formulu (7.11). U ovom slučaju , , , . Imamo , tj. .

Centralna granična teorema

Centralna granična teorema je druga grupa graničnih teorema koje uspostavljaju vezu između zakona raspodjele sume slučajne varijable i njenog graničnog oblika - zakona normalne distribucije.

Formulirajmo središnju graničnu teoremu za slučaj kada članovi sume imaju istu distribuciju. Ova teorema se najčešće koristi u praksi. U matematičkoj statistici, slučajne varijable uzorka imaju iste distribucije, pošto su dobijene iz iste opšte populacije.

Teorema 7.5. Neka su slučajne varijable nezavisne, jednako raspoređene, imaju konačno matematičko očekivanje i varijansu , . Tada funkcija distribucije centrirane i normalizirane sume ovih slučajnih varijabli teži prema funkciji distribucije standardne normalne slučajne varijable.

Budući da se mnoge slučajne varijable u aplikacijama formiraju pod utjecajem nekoliko slabo zavisnih slučajnih faktora, njihova se raspodjela smatra normalnom. U ovom slučaju mora se uzeti u obzir uslov da nijedan od faktora nije dominantan. Centralne granične teoreme u ovim slučajevima opravdavaju primjenu normalne distribucije.

Enciklopedijski YouTube

  • 1 / 5

    Neka postoji beskonačan niz nezavisnih identično raspoređenih slučajnih varijabli sa konačnim matematičkim očekivanjem i varijansom. Označite posljednju µ (\displaystyle \mu ) i σ 2 (\displaystyle \sigma ^(2)), odnosno. Neka takođe

    . S n − μ n σ n → N (0 , 1) (\displaystyle (\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))\to N(0,1) ) distribucijom na ,

    gdje N (0 , 1) (\displaystyle N(0,1))- normalna distribucija sa nultim matematičkim očekivanjem i standardnom devijacijom jednakim jedan. Označavanje uzorka sredina prvog n (\displaystyle n) količine, tj X ¯ n = 1 n ∑ i = 1 n X i (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i=1)^( n)X_(i)), možemo prepisati rezultat središnje granične teoreme u sljedećem obliku:

    n X ¯ n − μ σ → N (0 , 1) (\displaystyle (\sqrt (n))(\frac ((\bar (X))_(n)-\mu )(\sigma ))\to N(0,1)) distribucijom na n → ∞ (\displaystyle n\to \infty ).

    Stopa konvergencije može se procijeniti korištenjem Berry-Esseenove nejednakosti.

    Napomene

    • Neformalno govoreći, klasična centralna granična teorema kaže da je zbir n (\displaystyle n) nezavisne identično distribuirane slučajne varijable imaju distribuciju blisku N (n μ , n σ 2) (\displaystyle N(n\mu,n\sigma ^(2))). Ekvivalentno, X¯n (\displaystyle (\bar(X))_(n)) ima distribuciju blizu N (μ , σ 2 / n) (\displaystyle N(\mu,\sigma ^(2)/n)).
    • Budući da je funkcija distribucije standardne normalne distribucije kontinuirana, konvergencija ovoj distribuciji je ekvivalentna tačkastoj konvergenciji funkcija distribucije funkciji distribucije standardne normalne distribucije. Stavljanje Z n = S n − μ n σ n (\displaystyle Z_(n)=(\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))), dobijamo F Z n (x) → Φ (x) , ∀ x ∈ R (\displaystyle F_(Z_(n))(x)\to \Phi (x),\;\forall x\in \mathbb (R) ), gdje Φ (x) (\displaystyle \Phi (x)) je funkcija distribucije standardne normalne distribucije.
    • Klasična formulacija središnje granične teoreme dokazana je metodom karakterističnih funkcija (Levijeva teorema kontinuiteta).
    • Općenito govoreći, konvergencija gustoća ne slijedi iz konvergencije funkcija raspodjele. Ipak, u ovom klasičnom slučaju to je slučaj.

    Lokalni C.P.T.

    Pod pretpostavkama klasične formulacije, pretpostavimo dodatno da je distribucija slučajnih varijabli ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty )) apsolutno kontinuirano, odnosno ima gustinu. Tada je distribucija takođe apsolutno kontinuirana, i štaviše,

    f Z n (x) → 1 2 π e − x 2 2 (\displaystyle f_(Z_(n))(x)\to (\frac (1)(\sqrt (2\pi )))\,e^ (-(\frac (x^(2))(2)))) at n → ∞ (\displaystyle n\to \infty ),

    gdje f Z n (x) (\displaystyle f_(Z_(n))(x))- gustina slučajne varijable Z n (\displaystyle Z_(n)), a na desnoj strani je gustina standardne normalne distribucije.

    Generalizacije

    Rezultat klasične središnje granične teoreme vrijedi za situacije mnogo općenitije od potpune nezavisnosti i jednake distribucije.

    C. P. T. Lindeberg

    Neka su nezavisne slučajne varijable X 1 , … , X n , … (\displaystyle X_(1),\ldots ,X_(n),\ldots) definirani su na istom prostoru vjerovatnoće i imaju konačna matematička očekivanja i varijanse: E [ X i ] = μ i , D [ X i ] = σ i 2 (\displaystyle \mathbb (E) =\mu _(i),\;\mathrm (D) =\sigma _(i)^( 2)).

    Neka S n = ∑ i = 1 n X i (\displaystyle S_(n)=\suma \limits _(i=1)^(n)X_(i)).

    Onda E [ S n ] = m n = ∑ i = 1 n μ i , D [ S n ] = s n 2 = ∑ i = 1 n σ i 2 (\displaystyle \mathbb (E) =m_(n)=\sum \ granice _(i=1)^(n)\mu _(i),\;\mathrm (D) =s_(n)^(2)=\suma \ograničenja _(i=1)^(n)\ sigma _(i)^(2)).

    I pusti da radi Lindeberg stanje:

    ∀ ε > 0 , lim n → ∞ ∑ i = 1 n E [ (X i − μ i) 2 s n 2 1 ( | X i − μ i | > ε s n ) ] = 0 , (\displaystyle \forall \varepsilon >0,\;\lim \limits _(n\to \infty )\suma \limits _(i=1)^(n)\mathbb (E) \left[(\frac ((X_(i)-\ mu _(i))^(2))(s_(n)^(2)))\,\mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_ (n)\))\desno]=0,)

    gdje 1 ( | X i − μ i | > ε s n ) (\displaystyle \mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_(n)\))) funkcija - indikator.

    distribucijom na n → ∞ (\displaystyle n\to \infty ).

    Ts. P. T. Lyapunova

    Neka se ispune osnovne pretpostavke Ts. P. T. Lindeberga. Neka slučajne varijable ( X i ) (\displaystyle \(X_(i)\)) imaju konačan treći trenutak. Zatim sekvenca

    r n 3 = ∑ i = 1 n E [ | X i − μ i | 3 ] (\displaystyle r_(n)^(3)=\suma _(i=1)^(n)\mathbb (E) \left[|X_(i)-\mu _(i)|^(3 )\desno]).

    Ako limit

    lim n → ∞ r n s n = 0 (\displaystyle \lim \limits _(n\to \infty )(\frac (r_(n))(s_(n)))=0) (Stanje Ljapunova), S n − m n s n → N (0 , 1) (\displaystyle (\frac (S_(n)-m_(n))(s_(n)))\to N(0,1)) distribucijom na n → ∞ (\displaystyle n\to \infty ).

    C.P.T. za martingale

    Pustite proces (X n) n ∈ N (\displaystyle (X_(n))_(n\in \mathbb (N) )) je martingal sa ograničenim inkrementima. Konkretno, pretpostavimo to

    E [ X n + 1 − X n ∣ X 1 , … , X n ] = 0 , n ∈ N , X 0 ≡ 0 , (\displaystyle \mathbb (E) \left=0,\;n\in \mathbb (N) ,\;X_(0)\ekviv. 0,)

    a priraštaji su jednoliko ograničeni, tj

    ∃ C > 0 ∀ n ∈ N | X n + 1 − X n | ≤ C (\displaystyle \exists C>0\,\forall n\in \mathbb (N) \;|X_(n+1)-X_(n)|\leq C) τ n = min ( k | ∑ i = 1 k σ i 2 ≥ n ) (\displaystyle \tau _(n)=\min \left\(k\left\vert \;\sum _(i=1)^ (k)\sigma _(i)^(2)\geq n\desno.\desno\)). X τ n n → N (0 , 1) (\displaystyle (\frac (X_(\tau _(n)))(\sqrt (n)))\to N(0,1)) distribucijom na n → ∞ (\displaystyle n\to \infty ).

    Charles Whelan Poglavlje iz knjige
    Izdavačka kuća "Mann, Ivanov i Ferber"

    Konačno, vrijeme je da sumiramo ono što je rečeno. Budući da su srednje vrijednosti uzorka normalno raspoređene (zahvaljujući središnjoj graničnoj teoremi), možemo iskoristiti prednosti bogatog potencijala zvonaste krive. Očekujemo da će približno 68% srednjih vrijednosti svih uzoraka biti unutar jedne standardne greške srednje vrijednosti populacije; 95% - na udaljenosti koja ne prelazi dvije standardne greške; i 99,7% - na udaljenosti koja ne prelazi tri standardne greške.

    Vratimo se sada odstupanju (scatteru) u primjeru sa autobusom koji nedostaje - međutim, ovoga puta u pomoć ćemo pozvati ne intuiciju, već brojeve. (Sam po sebi, ovaj primjer ostaje apsurdan; u sljedećem poglavlju ćemo se osvrnuti na mnogo realnijih slučajeva.) Pretpostavimo da su organizatori američke studije „Changing Lives“ pozvali sve njene učesnike u Boston na vikend da se zabave i istovremeno dajte neke podatke koji nedostaju: Učesnici su nasumično raspoređeni u autobuse i odvedeni u centar za testiranje, gdje će biti izvagani, izmjereni visina itd. Na zaprepaštenje organizatora događaja, jedan od autobusa negdje nestane na putu do centra za testiranje.otprilike u isto vrijeme, vraćajući se svojim automobilom sa Festivala kobasica, primjećujete autobus koji se pokvario sa strane puta, izgleda kao da je njegov vozač bio primoran da skrene u pokušaju da izbjegavati losa koji se iznenada pojavio na cesti Od ovako oštrog manevra svi su putnici izgubili svijest ili dar govora, iako niko od njih, nažalost astya, nije zadobio teže povrede. (Treba da iznesem ovu pretpostavku isključivo radi jasnoće u ovom primjeru, a nadu da putnici neće biti teže povrijeđeni je zbog moje urođene filantropije.) Ljekari Hitne pomoći koji su odmah stigli na lice mjesta rekli su vam da je liječnica hitne pomoći. prosječna težina 62 putnika u autobusu je 194 funte. Osim toga, pokazalo se (na veliko olakšanje svih ljubitelja životinja) da los, od kojeg je vozač autobusa pokušao da se izbjegne, praktički nije ozlijeđen (osim blage modrice zadnje noge), ali je i izgubio svijest od jak strah i leži pored autobusa.

    Srećom, znate prosječnu težinu putnika autobusa, kao i standardnu ​​devijaciju za cjelokupnu populaciju Amerikanaca "Promjena života. Osim toga, imamo opće razumijevanje središnje granične teoreme i znamo kako pružiti prvu pomoć povrijeđena životinja. Prosječna težina učesnika američke studije „Promjena života je 162 funte; standardna devijacija je 36. Na osnovu ovih informacija, možete izračunati standardnu ​​grešku za uzorak od 62 osobe (broj putnika autobusa koji su se onesvijestili): .

    Razlika između srednje vrijednosti ovog uzorka (194 funte) i prosječne vrijednosti populacije (162 funte) je 32 funte, znatno više od tri standardne greške. Iz središnje granične teoreme znate da će 99,7% srednjih vrijednosti svih uzoraka biti unutar tri standardne greške srednje vrijednosti populacije. Stoga je malo vjerovatno da autobus na koji naiđete prevozi grupu učesnika studije Americans' Changing Lives. Kao istaknuti društveni aktivista u gradu, zovete organizatore događaja kako biste prijavili da je neka druga grupa ljudi najvjerovatnije na autobusu na koji naiđete. Međutim, u ovom slučaju možete se osloniti na statističke rezultate, a ne na svoja "intuitivna nagađanja". Organizatorima kažete da poričete vjerovatnoću da je autobus koji ste pronašli onaj koji traže , sa nivoom pouzdanosti od 99,7%. u ovom slučaju razgovarate sa ljudima koji su upoznati sa statistikom, onda možete biti sigurni da razumeju da ste u pravu. (Uvek je lepo imati posla sa pametnim ljudima!)

    Vaša otkrića su dodatno potkrijepljena kada bolničari uzmu uzorke krvi od putnika autobusa i otkriju da je njihov srednji nivo holesterola pet standardnih grešaka veći od srednjeg nivoa holesterola učesnika studije Americans' Changing Lives. nesvesni putnici - učesnici Festivala kobasica Ljubavnici. (Kasnije je to nepobitno dokazano.)

    [Ova priča je imala srećan kraj. Kada su se putnici autobusa osvijestili, organizatori američke studije „Changing Lives“ savjetovali su im da se posavjetuju s nutricionistima o opasnostima konzumiranja hrane bogate zasićenim mastima. Nakon takvih konsultacija, mnogi od ljubitelja kobasica odlučili su da raskinu sa svojom sramotnom prošlošću i povratak zdravijoj ishrani.Povrijeđeni los je izvađen u lokalnu veterinarsku kliniku i pušten na slobodu uz odobravajuće uzvike članova lokalnog Društva za zaštitu životinja.Da, iz nekog razloga istorija šuti o sudbini vozač autobusa.Možda zato što se statistika ne bavi sudbinama pojedinih ljudi Elk - Sasvim je druga stvar,neće se moći ućutkati njegovu sudbinu!

    U ovom poglavlju pokušao sam da govorim samo o osnovama. Možda ste primijetili da se središnja granična teorema primjenjuje samo kada je veličina uzorka dovoljno velika (obično najmanje 30). Također, potreban nam je relativno veliki uzorak ako ćemo pretpostaviti da će njegova standardna devijacija biti otprilike ista kao standardna devijacija populacije.

    Postoji dosta statističkih korekcija koje se mogu primijeniti ako ovi uvjeti nisu ispunjeni, ali sve je to kao šlag na tortu (a možda čak i komadići čokolade koji se posipaju po vrhu ove glazure). "Velika slika" ovdje je jednostavna i izuzetno efikasna.

    1. Ako formirate velike (po obimu) nasumične uzorke na osnovu bilo koje populacije, tada će njihovi prosjeci biti raspoređeni prema normalnom zakonu blizu prosjeka odgovarajuće populacije (bez obzira na distribuciju originalne populacije).
    2. Većina srednjih vrijednosti uzorka bit će locirana dovoljno blizu srednje vrijednosti populacije (što bi se tačno trebalo smatrati "dovoljno bliskim" u svakom datom slučaju određeno je standardnom greškom).
    3. Centralna granična teorema nam govori o vjerovatnoći da će srednja vrijednost uzorka biti unutar određene udaljenosti od srednje vrijednosti populacije. Relativno je malo vjerovatno da će srednja vrijednost uzorka biti udaljena više od dvije standardne greške od srednje vrijednosti populacije, a vrlo je malo vjerovatno da će srednja vrijednost uzorka biti udaljena više od tri standardne greške od srednje vrijednosti populacije.
    4. Što je manje vjerovatno da je neki ishod bio čisto slučajan, to više možemo biti sigurni da nije bez utjecaja nekog drugog faktora.

    Ovo je, uglavnom, suština statističkog zaključivanja. Centralna granična teorema u osnovi sve ovo čini mogućim. I dok Lebron Džejms ne osvoji onoliko NBA šampiona koliko i Majkl Džordan (šest), centralna granična teorema će nas impresionirati mnogo više od slavnog košarkaša.

    LeBron Raymone James je američki profesionalni košarkaš koji igra kao mali i moćni napadač za NBA Cleveland Cavalierse. Bilješka. transl.

    Obratite pažnju na vrlo genijalnu upotrebu lažne preciznosti u ovom slučaju.

    Kada se standardna devijacija odgovarajuće populacije izračuna na osnovu manjeg uzorka, formula koju smo dali je malo izmijenjena: Ovo pomaže da se objasni činjenica da varijansa u malom uzorku može "potcijeniti" varijansu cijele populacije. Ovo nema mnogo veze sa univerzalnijim odredbama o kojima se govori u ovom poglavlju.

    Moj kolega sa Univerziteta u Čikagu, Jim Sally, iznio je vrlo važnu kritiku primjera nestalih autobusa. On je istakao da je nestanak autobusa ovih dana izuzetno rijedak. Dakle, ako moramo da tražimo neki nestali autobus, onda će svaki autobus na koji naiđemo, a koji se ispostavi da nedostaje ili pokvaren, najverovatnije biti onaj koji nas zanima, bez obzira na težinu putnika u ovom autobusu. Možda je Jim u pravu. (Da koristimo ovu analogiju: ako izgubite svoje dijete u supermarketu i uprava radnje javi da nečije izgubljeno dijete stoji blizu blagajne broj šest, tada ćete vjerovatno odmah odlučiti da je to vaše dijete.) Stoga, nemamo drugog izbora osim da našim primjerima dodamo još jedan element apsurda, vjerujući da je gubitak autobusa sasvim običan događaj.

    Plan:

    1. Koncept centralne granične teoreme (Ljapunovljev teorem)

    2. Zakon velikih brojeva, vjerovatnoće i frekvencije (teoreme Čebiševa i Bernulija)

    1. Koncept centralne granične teoreme.

    Normalna raspodjela vjerovatnoća je od velike važnosti u teoriji vjerovatnoće. Normalni zakon poštuje vjerovatnoću prilikom gađanja mete, mjerenja itd. Posebno se ispostavlja da je zakon raspodjele za sumu dovoljno velikog broja nezavisnih slučajnih varijabli sa proizvoljnim zakonima raspodjele blizak normalnoj raspodjeli. Ova činjenica se naziva središnja granična teorema ili Ljapunovljeva teorema.

    Poznato je da se normalno raspoređene slučajne varijable široko koriste u praksi. Šta ovo objašnjava? Na ovo pitanje je odgovoreno

    Centralna granična teorema. Ako je slučajna varijabla X zbir vrlo velikog broja međusobno nezavisnih slučajnih varijabli, od kojih je utjecaj svake na cijeli zbir zanemarljiv, tada X ima distribuciju blisku normalnoj.

    Primjer. Neka se izmjeri neka fizička veličina. Svako mjerenje daje samo približnu vrijednost mjerene veličine, budući da mnogi nezavisni slučajni faktori (temperatura, fluktuacije instrumenta, vlažnost, itd.) utiču na rezultat mjerenja. Svaki od ovih faktora stvara zanemarljivu "djelimičnu grešku". Međutim, kako je broj ovih faktora vrlo velik, njihov kumulativni učinak stvara već primjetnu „totalnu grešku“.

    Uzimajući u obzir ukupnu grešku kao zbir veoma velikog broja međusobno nezavisnih parcijalnih grešaka, možemo zaključiti da ukupna greška ima distribuciju blisku normalnoj. Iskustvo potvrđuje valjanost ovog zaključka.

    Razmotrimo uslove pod kojima je zadovoljena "teorema centralne granice".

    x1,X2, ..., Xn je niz nezavisnih slučajnih varijabli,

    M(X1),M(X2), ...,M(Xn) su konačna matematička očekivanja ovih veličina, odnosno jednaka M(Xk)= ak

    D (X1),D(X2), ...,D(Xn) - njihove konačne varijanse, odnosno jednake D(X k)= bk2

    Uvodimo oznaku: S= X1+X2 + ...+Xn;

    A k= X1+X2 + ...+Xn=; B2=D (X1)+D(X2)+ ...+D(Xn) =

    Zapisujemo funkciju distribucije normalizirane sume:

    Kažu na sekvencu x1,X2, ..., Xn središnja granična teorema je primjenjiva ako, za bilo koji x funkcija distribucije normalizirane sume kao n ® ¥ teži normalnoj funkciji distribucije:

    Desno "style="border-collapse:collapse;border:none;margin-left:6.75pt;margin-right: 6.75pt">

    Razmotrimo diskretnu slučajnu varijablu X, dato tabelom distribucije:

    Postavimo sebi zadatak da procijenimo vjerovatnoću da odstupanje slučajne varijable od njenog matematičkog očekivanja ne premašuje u apsolutnoj vrijednosti pozitivan broj ε

    Ako a ε dovoljno mali, tako ćemo procijeniti vjerovatnoću da Xće uzeti vrijednosti dovoljno bliske njegovom matematičkom očekivanju. dokazala nejednakost koja nam omogućava da damo procjenu koja nas zanima.

    Lemma Chebyshev. Zadata je slučajna varijabla X koja uzima samo nenegativne vrijednosti sa očekivanjem M(X). Za bilo koji broj α>0, izraz se odvija:

    Čebiševljeva nejednakost. Vjerovatnoća da je odstupanje slučajne varijable X od njenog matematičkog očekivanja u apsolutnoj vrijednosti manje od pozitivnog broja ε , ne manje od 1 – D(X) / ε 2:

    P(|X-M(X)|< ε ) ³ 1 - D (X) / ε 2.

    Komentar.Čebiševljeva nejednakost ima ograničenu praktičnu vrijednost, jer često daje grubu i ponekad trivijalnu (bez interesa) procjenu.

    Teorijski značaj Čebiševske nejednakosti je veoma velik. U nastavku ćemo koristiti ovu nejednakost da izvedemo Čebiševljevu teoremu.

    2.2. Čebiševljeva teorema

    Ako su X1, X2, ..., Xn.. parno nezavisne slučajne varijable, a njihove varijanse su ujednačeno ograničene (ne prelaze konstantan broj C), tada, bez obzira koliko je mali pozitivan broj ε , vjerovatnoća nejednakosti

    ÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε

    će biti proizvoljno blizu jedinice ako je broj slučajnih varijabli dovoljno velik.

    P (÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε )=1.

    Čebiševljev teorem glasi:

    1. Razmatramo dovoljno veliki broj nezavisnih slučajnih varijabli sa ograničenim varijacijama,

    Kada smo formulisali Čebiševljevu teoremu, pretpostavili smo da slučajne varijable imaju različita matematička očekivanja. U praksi se često dešava da slučajne varijable imaju ista matematička očekivanja. Očigledno, ako opet pretpostavimo da su disperzije ovih veličina ograničene, onda će Čebiševljev teorem biti primjenjiv na njih.

    Označimo matematičko očekivanje svake od slučajnih varijabli kroz a;

    U slučaju koji se razmatra, aritmetička sredina matematičkih očekivanja, kao što je lako vidjeti, također je jednaka a.

    Može se formulisati Čebiševljev teorem za konkretan slučaj koji se razmatra.

    "Ako su X1, X2, ..., Xn.. parovi nezavisne slučajne varijable koje imaju isto matematičko očekivanje a, i ako su disperzije ovih varijabli ujednačeno ograničene, tada, bez obzira koliko je mali broj ε > Oh, vjerovatnoća nejednakosti

    ÷ (X1+X2 + ...+Xn) / n - a | < ε

    će biti proizvoljno blizu jedinice ako je broj slučajnih varijabli dovoljno velik" .

    Drugim riječima, pod uslovima teoreme

    P (÷ (X1+X2 + ...+Xn) / n - a |< ε ) = 1.

    2.3. Suština Čebiševljeve teoreme

    Iako pojedinačne nezavisne slučajne varijable mogu imati vrijednosti koje su daleko od njihovih matematičkih očekivanja, aritmetička sredina dovoljno velikog broja slučajnih varijabli s velikom vjerovatnoćom uzima vrijednosti bliske određenom konstantnom broju, odnosno broju

    (M(Xj) + M (X2)+... + M (Xn))/n ili na broj i u konkretan slučaj.

    Drugim riječima, pojedinačne slučajne varijable mogu imati značajno širenje, a njihova aritmetička sredina je mala.

    Dakle, ne može se pouzdano predvidjeti koju će moguću vrijednost uzeti svaka od slučajnih varijabli, ali se može predvidjeti koju će vrijednost imati njihova aritmetička sredina.

    Dakle, aritmetička sredina dovoljno velikog broja nezavisnih slučajnih varijabli (čije su varijanse ujednačeno ograničene) gubi karakter slučajne varijable.

    To se objašnjava činjenicom da odstupanja svake od veličina od njihovih matematičkih očekivanja mogu biti i pozitivna i negativna, a u aritmetičkoj sredini se međusobno poništavaju.

    Čebiševljeva teorema vrijedi ne samo za diskretne, već i za kontinuirane slučajne varijable; to je primjer koji potvrđuje valjanost doktrine o povezanosti slučajnosti i nužnosti.

    2.4. Značaj Čebiševljeve teoreme za praksu

    Navedimo primjere primjene Čebiševljeve teoreme na rješavanje praktičnih problema.

    Obično se za mjerenje određene fizičke veličine izvrši nekoliko mjerenja i njihova aritmetička sredina se uzima kao željena veličina. Pod kojim uslovima se ovaj metod merenja može smatrati ispravnim? Odgovor na ovo pitanje daje Čebiševljev teorem (njen poseban slučaj).

    Zaista, razmotrite rezultate svakog mjerenja kao slučajne varijable

    X1, X2, ..., Xn

    Na ove veličine, Čebiševljeva teorema se može primijeniti ako:

    1) Nezavisni su u parovima.

    2) imaju ista matematička očekivanja,

    3) njihova disperzija je jednoliko ograničena.

    Prvi zahtjev je zadovoljen ako rezultat svakog mjerenja ne zavisi od rezultata ostalih.

    Drugi uslov je ispunjen ako se mjerenja vrše bez sistematskih (jednoznačnih) grešaka. U ovom slučaju, matematička očekivanja svih slučajnih varijabli su ista i jednaka pravoj veličini a.

    Treći uslov je ispunjen ako uređaj obezbeđuje određenu tačnost merenja. Iako su rezultati pojedinačnih mjerenja različiti, njihovo raspršivanje je ograničeno.

    Ako su svi ovi zahtjevi ispunjeni, imamo pravo primijeniti Čebiševljevu teoremu na rezultate mjerenja: za dovoljno veliku P vjerovatnoća nejednakosti

    | (X1 + Xa+...+Xn)/n - a |< ε proizvoljno blizu jedinstva.

    Drugim riječima, uz dovoljno veliki broj mjerenja, gotovo je sigurno da se njihova aritmetička sredina proizvoljno malo razlikuje od prave vrijednosti mjerene veličine.

    Čebiševljeva teorema ukazuje na uslove pod kojima se može primeniti opisana metoda merenja. Međutim, pogrešno je misliti da se povećanjem broja mjerenja može postići proizvoljno visoka tačnost. Činjenica je da sam uređaj daje očitanja samo s točnošću od ± α, stoga će se svaki od rezultata mjerenja, a time i njihova aritmetička sredina, dobiti samo s točnošću koja ne prelazi tačnost uređaja.

    Metoda uzorkovanja koja se široko koristi u statistici zasniva se na Čebiševovoj teoremi, čija je suština da se relativno mali slučajni uzorak koristi za suđenje cjelokupne populacije (opće populacije) objekata koji se proučavaju.

    Na primjer, kvalitet bale pamuka se ocjenjuje prema malom snopu koji se sastoji od nasumično odabranih vlakana iz različitih dijelova bale. Iako je broj vlakana u snopu mnogo manji nego u bali, sam snop sadrži prilično veliki broj vlakana, koji se broje na stotine.

    Kao drugi primjer može se ukazati na određivanje kvaliteta zrna iz malog uzorka. I u ovom slučaju, broj nasumično odabranih zrna je mali u odnosu na cjelokupnu masu zrna, ali je sam po sebi prilično velik.

    Već iz navedenih primjera može se zaključiti da je za praksu Čebiševljeva teorema od neprocjenjive važnosti.

    2.5. TeoremaBernoulli

    Proizvedeno P nezavisni testovi (ne događaji, već testovi). U svakom od njih je vjerovatnoća nastanka događaja A je jednako R.

    postavlja se pitanje, koja će biti relativna učestalost pojavljivanja događaja? Na ovo pitanje odgovara teorema koju je dokazao Bernoulli, koja je nazvana "zakon velikih brojeva" i koja je postavila temelje teoriji vjerovatnoće kao nauke.

    Bernulijeva teorema. Ako u svakom od P verovatnoća nezavisnog testa R pojava događaja ALI je konstantna, onda je vjerovatnoća da je odstupanje relativne frekvencije od vjerovatnoće Rće biti proizvoljno male apsolutne vrijednosti ako je broj pokušaja dovoljno velik.

    Drugim riječima, ako je ε >0 proizvoljno mali broj, tada pod uslovima teoreme imamo jednakost

    P(|m / n - p|< ε)= 1

    Komentar. Bilo bi pogrešno, na osnovu Bernoullijeve teoreme, zaključiti da s povećanjem broja pokušaja relativna frekvencija stalno teži vjerovatnoći R; drugim riječima, Bernoullijeva teorema ne implicira jednakost (t/n) = p,

    AT Teorema se bavi samo vjerovatnoćom da će se, uz dovoljno veliki broj pokušaja, relativna frekvencija proizvoljno malo razlikovati od konstantne vjerovatnoće pojave događaja u svakom pokušaju.

    Zadatak 7-1.

    1. Procijenite vjerovatnoću da će nakon 3600 bacanja kockice broj ponavljanja od 6 biti najmanje 900.

    Rješenje. Neka je x broj pojavljivanja od 6 poena u 3600 bacanja novčića. Verovatnoća da dobijete 6 poena u jednom bacanju je p=1/6, zatim M(x)=3600 1/6=600. Koristimo Čebiševljevu nejednakost (lemu) za dato α = 900

    = P(x³ 900) £ 600 / 900 =2 / 3

    Odgovori 2 / 3.

    2. Urađeno je 1000 nezavisnih testova, p=0,8. Pronađite vjerovatnoću da će broj pojavljivanja događaja A u ovim testovima odstupiti od njegovog matematičkog očekivanja po modulu manjem od 50.

    Rješenje. x je broj pojavljivanja događaja A u n - 1000 pokušaja.

    M (X) = 1000 0,8 \u003d 800. D(x)=100 0,8 0,2=160

    Koristimo Čebiševljevu nejednakost za dato ε = 50

    P(|x-M(x)|< ε) ³ 1 - D (x) / ε 2

    R(|x-800|< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

    Odgovori. 0,936

    3. Koristeći Čebiševljevu nejednakost, procijenite vjerovatnoću da |X - M(X)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

    4. Dato: P(|X- M(X)\< ε) ³ 0,9; D (X)= 0,004. Koristeći Čebiševljevu nejednakost, pronađite ε . Odgovori. 0,2.

    Kontrolna pitanja i zadaci

    1. Svrha središnje granične teoreme

    2. Uslovi primenljivosti Ljapunovljeve teoreme.

    3. Razlika između leme i Čebiševe teoreme.

    4. Uslovi za primenljivost Čebiševljeve teoreme.

    5. Uslovi za primjenjivost Bernoullijeve teoreme (zakon velikih brojeva)

    Zahtjevi za znanjem i vještinama

    Student mora znati opštu semantičku formulaciju centralne granične teoreme. Biti sposoban formulirati parcijalne teoreme za nezavisne identično distribuirane slučajne varijable. Razumjeti Čebiševljevu nejednakost i zakon velikih brojeva u Čebiševljevom obliku. Imajte ideju o učestalosti događaja, odnosu između pojmova "vjerovatnost" i "učestalost". Razumjeti zakon velikih brojeva u obliku Bernoullija.

    (1857-1918), istaknuti ruski matematičar