Biografije Karakteristike Analiza

Zakon velikih brojeva i granični teoremi. Zakon velikih brojeva

Lema Čebišev. Ako je slučajna varijabla x, za koje postoji matematičko očekivanje M[x], može imati samo nenegativne vrijednosti, tada za svaki pozitivan broj a vrijedi nejednakost

Čebiševljeva nejednakost. Ako a x je slučajna varijabla s matematičkim očekivanjem M[x] i disperzija D[x], tada za bilo koje pozitivno e ​​imamo nejednakost

. (2)

Čebiševljev teorem.(zakon velikih brojeva). Neka x 1 , x 2 , …, x n,… - niz nezavisnih slučajnih varijabli s istim matematičkim očekivanjem m a varijance ograničene istom konstantom S

. (3)

Dokaz teorema temelji se na nejednakosti

, (4)

slijedeći iz Čebiševljeve nejednakosti. Iz Chebyshevljevog teorema, kao korolar, može se dobiti

Bernoullijev teorem. Neka se proizvodi n nezavisni eksperimenti, u svakom od njih s vjerojatnošću R može se dogoditi neki događaj ALI, Pusti to v n je slučajna varijabla jednaka broju pojavljivanja događaja ALI u ovim n eksperimenti. Tada za svaki e > 0 imamo graničnu jednakost

. (5)

Imajte na umu da nejednakost (4) primijenjena na uvjete Bernoullijevog teorema daje:

. (6)

Čebiševljev teorem može se formulirati u nešto općenitijem obliku:

Generalizirani Čebiševljev teorem. Neka x 1, x 2, …, x n,… - niz nezavisnih slučajnih varijabli s matematičkim očekivanjima M[x 1 ] = m 1, M[x2] = m 2 ,… a disperzije ograničene istom konstantom S. Tada za bilo koji pozitivan broj e imamo graničnu jednakost

. (7)

Neka je x broj pojavljivanja 6 bodova u 3600 bacanja kocke. Zatim M[ x] = 3600 = 600. Iskoristimo sada nejednadžbu (1) za a = 900: .

Koristimo nejednadžbu (6) za n = 10000, p = , q = . Zatim

Primjer.

Vjerojatnost pojavljivanja događaja A u svakom od 1000 neovisnih pokusa je 0,8. Odredite vjerojatnost da će broj pojavljivanja događaja A u ovih 1000 eksperimenata odstupati od njegovog matematičkog očekivanja u apsolutnoj vrijednosti za manje od 50.

Neka je x broj pojavljivanja događaja A u navedenih 1000 eksperimenata. Zatim M[ x] = 1000 × 0,8 = 800 i D[ x] = 1000 × 0,8 × 0,2 = 160. Sada nejednadžba (2) daje:


Primjer.

Varijanca svake od 1000 neovisnih slučajnih varijabli x k (k = 1, 2,..., 1000) je 4. Procijenite vjerojatnost da će odstupanje aritmetičke sredine ovih varijabli od aritmetičke sredine njihovih matematičkih očekivanja u apsolutnoj vrijednosti neće prelaziti 0,1.

Prema nejednakosti (4), za c = 4 i e = 0,1, imamo

Plan:

1. Pojam središnjeg graničnog teorema (Ljapunovljev teorem)

2. Zakon velikih brojeva, vjerojatnosti i frekvencije (teoremi Chebysheva i Bernoullija)

1. Pojam središnjeg graničnog teorema.

Normalna raspodjela vjerojatnosti ima veliki značaj u teoriji vjerojatnosti. Normalni zakon pokorava se vjerojatnosti pri gađanju mete, pri mjerenjima itd. Posebno se ispostavlja da je zakon distribucije za zbroj dovoljno velikog broja neovisnih slučajnih varijabli s proizvoljnim zakonima distribucije blizak normalnoj distribuciji. Ta se činjenica naziva centralni granični teorem ili Ljapunovljev teorem.

Poznato je da se normalno distribuirane slučajne varijable široko koriste u praksi. Što ovo objašnjava? Na ovo pitanje je odgovoreno

Centralni granični teorem. Ako je slučajna varijabla X zbroj vrlo velikog broja međusobno neovisnih slučajnih varijabli, od kojih je utjecaj svake na cijeli zbroj zanemariv, tada X ima distribuciju blisku normalnoj distribuciji.

Primjer. Neka se izmjeri neka fizikalna veličina. Svako mjerenje daje samo približnu vrijednost izmjerene veličine, jer mnogi neovisni slučajni čimbenici (temperatura, kolebanje instrumenta, vlažnost itd.) utječu na rezultat mjerenja. Svaki od ovih čimbenika stvara zanemarivu "djelomičnu pogrešku". Međutim, budući da je broj ovih čimbenika vrlo velik, njihov kumulativni učinak generira već primjetnu "totalnu pogrešku".

Promatrajući ukupnu pogrešku kao zbroj vrlo velikog broja međusobno neovisnih parcijalnih pogrešaka, možemo zaključiti da ukupna pogreška ima distribuciju blisku normalnoj distribuciji. Iskustvo potvrđuje valjanost ovog zaključka.

Razmotrimo uvjete pod kojima je zadovoljen "teorem središnje granice".

x1,X2, ..., Xn je niz nezavisnih slučajnih varijabli,

M(X1),M(X2), ...,M(Xn) su konačna matematička očekivanja tih veličina, odnosno jednaka M(Xk)= ak

D (X1),D(X2), ...,D(Xn) - njihove konačne varijance, odnosno jednake D(x k)= bk2

Uvodimo oznaku: S= X1+X2 + ...+Xn;

A k= X1+X2 + ...+Xn=; B2=D (X1)+D(X2)+ ...+D(Xn) =

Zapisujemo funkciju distribucije normaliziranog zbroja:

Kažu slijedu x1,X2, ..., Xn središnji granični teorem je primjenjiv ako, za bilo koji x funkcija distribucije normaliziranog zbroja kako n ® ¥ teži funkciji normalne distribucije:

Desno "style="border-collapse:collapse;border:none;margin-left:6.75pt;margin-right: 6.75pt">

Razmotrimo diskretnu slučajnu varijablu x, dano distribucijskom tablicom:

Postavimo si zadatak procijeniti vjerojatnost da odstupanje slučajne varijable od njenog matematičkog očekivanja ne premaši u apsolutnoj vrijednosti pozitivan broj ε

Ako a ε dovoljno mali, procijenit ćemo vjerojatnost da xće uzeti vrijednosti dovoljno blizu svom matematičkom očekivanju. dokazao nejednakost koja nam omogućuje da damo procjenu koja nas zanima.

Lema Čebišev. Dana je slučajna varijabla X koja uzima samo nenegativne vrijednosti s očekivanjem M(X). Za bilo koji broj α>0 vrijedi izraz:

Čebiševljeva nejednakost. Vjerojatnost da je odstupanje slučajne varijable X od njenog matematičkog očekivanja u apsolutnoj vrijednosti manje od pozitivnog broja ε , ne manje od 1 – D(X) / ε 2:

P(|X-M(X)|< ε ) ³ 1 - D (X) / ε 2.

Komentar.Čebiševljeva nejednakost ima ograničenu praktičnu vrijednost, budući da često daje grubu i ponekad trivijalnu (bez interesa) procjenu.

Teorijski značaj Čebiševljeve nejednakosti je vrlo velik. U nastavku ćemo koristiti ovu nejednakost za izvođenje Čebiševljevog teorema.

2.2. Čebiševljev teorem

Ako su X1, X2, ..., Xn.. po parovima neovisne slučajne varijable, a njihove varijance su jednoliko ograničene (ne prelaze konstantan broj C), tada, bez obzira koliko je mali pozitivan broj ε , vjerojatnost nejednakosti

÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε

bit će proizvoljno blizu jedinici ako je broj slučajnih varijabli dovoljno velik.

P (÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε )=1.

Čebiševljev teorem kaže:

1. Razmatramo dovoljno velik broj neovisnih slučajnih varijabli s ograničenim varijancama,

Kada smo formulirali Čebiševljev teorem, pretpostavili smo da slučajne varijable imaju različita matematička očekivanja. U praksi se često događa da slučajne varijable imaju isto matematičko očekivanje. Očito, ako ponovno pretpostavimo da su disperzije ovih veličina ograničene, tada će Čebiševljev teorem biti primjenjiv na njih.

Označimo matematičko očekivanje svake od slučajnih varijabli kroz a;

U slučaju koji razmatramo, aritmetička sredina matematičkih očekivanja, kao što je lako vidjeti, također je jednaka a.

Može se formulirati Čebiševljev teorem za određeni slučaj koji razmatramo.

"Ako su X1, X2, ..., Xn.. po parovima neovisne slučajne varijable koje imaju isto matematičko očekivanje a, i ako su disperzije ovih varijabli jednoliko ograničene, tada, bez obzira koliko mali broj ε > Oh, vjerojatnost nejednakosti

÷ (X1+X2 + ...+Xn) / n - a | < ε

bit će proizvoljno blizu jedinici ako je broj slučajnih varijabli dovoljno velik" .

Drugim riječima, pod uvjetima iz teorema

P (÷ (X1+X2 + ...+Xn) / n - a |< ε ) = 1.

2.3. Bit Čebiševljevog teorema

Iako pojedinačne neovisne slučajne varijable mogu poprimiti vrijednosti koje su daleko od njihovih matematičkih očekivanja, aritmetička sredina dovoljno velikog broja slučajnih varijabli s velikom vjerojatnošću poprima vrijednosti blizu određenog konstantnog broja, odnosno broja

(M(Xj) + M (X2)+... + M (Xn))/n ili na broj i u poseban slučaj.

Drugim riječima, pojedinačne slučajne varijable mogu imati značajan raspon, a njihova aritmetička sredina je malo raspršena.

Stoga se ne može pouzdano predvidjeti koju će moguću vrijednost poprimiti svaka od slučajnih varijabli, ali se može predvidjeti koju će vrijednost poprimiti njihova aritmetička sredina.

Dakle, aritmetička sredina dovoljno velikog broja nezavisnih slučajnih varijabli (čije su varijance jednoliko ograničene) gubi karakter slučajne varijable.

To se objašnjava činjenicom da odstupanja svake od veličina od njihovih matematičkih očekivanja mogu biti i pozitivna i negativna, te se u aritmetičkoj sredini međusobno poništavaju.

Čebiševljev teorem vrijedi ne samo za diskretne, već i za kontinuirane slučajne varijable; to je primjer koji potvrđuje valjanost doktrine o povezanosti slučajnosti i nužnosti.

2.4. Značenje Čebiševljevog teorema za praksu

Navedimo primjere primjene Čebiševljevog teorema na rješavanje praktičnih problema.

Obično se za mjerenje određene fizikalne veličine provodi više mjerenja i njihova aritmetička sredina se uzima kao željena veličina. Pod kojim se uvjetima ova metoda mjerenja može smatrati ispravnom? Odgovor na ovo pitanje daje Čebiševljev teorem (njegov poseban slučaj).

Doista, rezultate svakog mjerenja smatrajte slučajnim varijablama

X1, X2, ..., Xn

Na te se količine može primijeniti Chebyshevljev teorem ako:

1) Neovisni su u paru.

2) imaju isto matematičko očekivanje,

3) njihova disperzija je jednoliko ograničena.

Prvi zahtjev je zadovoljen ako rezultat svakog mjerenja ne ovisi o rezultatima ostalih.

Drugi zahtjev je ispunjen ako se mjerenja izvode bez sustavnih grešaka (jedan znak). U ovom slučaju, matematička očekivanja svih slučajnih varijabli su ista i jednaka stvarnoj veličini a.

Treći zahtjev je ispunjen ako uređaj osigurava određenu točnost mjerenja. Iako su rezultati pojedinih mjerenja različiti, njihova je raspršenost ograničena.

Ako su svi ovi zahtjevi ispunjeni, imamo pravo primijeniti Čebiševljev teorem na rezultate mjerenja: za dovoljno veliki P vjerojatnost nejednakosti

| (X1 + Xa+...+Xn)/n - a |< ε proizvoljno blizu jedinici.

Drugim riječima, kod dovoljno velikog broja mjerenja gotovo je sigurno da se njihova aritmetička sredina proizvoljno malo razlikuje od prave vrijednosti mjerene veličine.

Čebiševljev teorem ukazuje na uvjete pod kojima se može primijeniti opisana metoda mjerenja. Međutim, pogrešno je misliti da se povećanjem broja mjerenja može postići proizvoljno visoka točnost. Činjenica je da sam uređaj daje očitanja samo s točnošću od ± α, stoga će se svaki od rezultata mjerenja, a time i njihova aritmetička sredina, dobiti samo s točnošću koja ne prelazi točnost uređaja.

Metoda uzorkovanja koja se naširoko koristi u statistici temelji se na Chebyshevljevom teoremu, čija je bit da se koristi relativno mali slučajni uzorak za procjenu cijele populacije (opće populacije) objekata koji se proučavaju.

Na primjer, kvaliteta bale pamuka ocjenjuje se malim snopom koji se sastoji od vlakana nasumično odabranih iz različitih dijelova bale. Iako je broj vlakana u snopu mnogo manji nego u bali, sam snop sadrži prilično velik broj vlakana, koji se broji u stotinama.

Kao drugi primjer može se navesti određivanje kvalitete zrna iz malog uzorka. I u ovom slučaju, broj nasumično odabranih zrna je mali u usporedbi s cjelokupnom masom zrna, ali sam po sebi je prilično velik.

Već iz navedenih primjera može se zaključiti da je za praksu Čebiševljev teorem od neprocjenjive važnosti.

2.5. TeoremaBernoulli

Proizvedeno P neovisni testovi (ne događaji, već testovi). U svakom od njih, vjerojatnost pojave događaja A jednako je R.

Postavlja se pitanje, koja će biti relativna učestalost pojavljivanja događaja? Na to pitanje odgovara teorem koji je dokazao Bernoulli, a koji je nazvan "zakon velikih brojeva" i postavio je temelje teorije vjerojatnosti kao znanosti.

Bernoullijev teorem. Ako u svakom od P neovisni test vjerojatnosti R pojava događaja ALI je konstantna, onda je vjerojatnost da je odstupanje relativne frekvencije od vjerojatnosti R bit će proizvoljno mala u apsolutnoj vrijednosti ako je broj pokušaja dovoljno velik.

Drugim riječima, ako je ε >0 proizvoljno mali broj, tada pod uvjetima iz teorema vrijedi jednakost

P(|m / n - p|< ε)= 1

Komentar. Bilo bi pogrešno na temelju Bernoullijevog teorema zaključiti da s povećanjem broja pokušaja relativna frekvencija postojano teži vjerojatnosti R; drugim riječima, Bernoullijev teorem ne implicira jednakost (t/n) = p,

NA Teorem se bavi samo vjerojatnošću da će se, s dovoljno velikim brojem pokušaja, relativna učestalost proizvoljno malo razlikovati od konstantne vjerojatnosti pojavljivanja događaja u svakom pokušaju.

Zadatak 7-1.

1. Procijenite vjerojatnost da će nakon 3600 bacanja kocke broj pojavljivanja 6 biti najmanje 900.

Riješenje. Neka je x broj pojavljivanja 6 bodova u 3600 bacanja novčića. Vjerojatnost dobivanja 6 bodova u jednom bacanju je p=1/6, zatim M(x)=3600 1/6=600. Koristimo Čebiševljevu nejednakost (lemu) za zadano α = 900

= P(x³ 900) £ 600 / 900 =2 / 3

Odgovor 2 / 3.

2. Provedeno je 1000 neovisnih testova, p=0,8. Nađite vjerojatnost da broj pojavljivanja događaja A u ovim testovima odstupa od svog matematičkog očekivanja modulo manji od 50.

Riješenje. x je broj pojavljivanja događaja A u n - 1000 pokušaja.

M (X) \u003d 1000 0,8 \u003d 800. D(x)=100 0,8 0,2=160

Koristimo Chebyshevljevu nejednadžbu za zadani ε = 50

P(|x-M(x)|< ε) ³ 1 - D (x) / ε 2

R(|x-800|< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

Odgovor. 0,936

3. Koristeći Chebyshovljevu nejednakost, procijenite vjerojatnost da |X - M(X)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

4. Zadano: P(|X- M(X)\< ε) ³ 0,9; D (x)= 0,004. Koristeći Chebyshevljevu nejednadžbu, pronađite ε . Odgovor. 0,2.

Kontrolna pitanja i zadaci

1. Svrha središnjeg graničnog teorema

2. Uvjeti primjenjivosti Ljapunovljevog teorema.

3. Razlika između leme i Čebiševljevog teorema.

4. Uvjeti primjenjivosti Chebyshevljevog teorema.

5. Uvjeti primjenjivosti Bernoullijevog teorema (zakon velikih brojeva)

Zahtjevi za znanjem i vještinama

Student mora znati opću semantičku formulaciju središnjeg graničnog teorema. Biti u stanju formulirati parcijalne teoreme za neovisne identično distribuirane slučajne varijable. Razumjeti Čebiševljevu nejednakost i zakon velikih brojeva u Čebiševljevom obliku. Imati predodžbu o učestalosti događaja, odnos između pojmova "vjerojatnost" i "učestalost". Imati razumijevanje zakona velikih brojeva u obliku Bernoullija.

(1857-1918), istaknuti ruski matematičar

Na početku kolegija već smo rekli da se matematički zakoni teorije vjerojatnosti dobivaju apstrahiranjem stvarnih statističkih pravilnosti svojstvenih masovnim slučajnim pojavama. Prisutnost ovih obrazaca povezana je upravo s masovnom prirodom fenomena, odnosno s velikim brojem izvedenih homogenih eksperimenata ili s velikim brojem slučajnih učinaka koji u svojoj ukupnosti generiraju slučajnu varijablu podložnu točno definiranom zakonu. Svojstvo stabilnosti masovnih slučajnih pojava poznato je čovječanstvu od davnina. U kojem god području da se manifestira, njegova se bit svodi na sljedeće: specifičnosti svake pojedine slučajne pojave nemaju gotovo nikakvog utjecaja na prosječni rezultat masa i takvih pojava; slučajna odstupanja od prosjeka, neizbježna u svakoj pojedinoj pojavi, u masi se međusobno poništavaju, izravnavaju, izravnavaju. Upravo je ta stabilnost prosjeka fizički sadržaj "zakona velikih brojeva", shvaćenog u širem smislu riječi: s vrlo velikim brojem slučajnih pojava njihov prosječni rezultat praktički prestaje biti slučajan i može se predvidjeti s visokim stupnjem sigurnosti.

U užem smislu riječi, "zakon velikih brojeva" u teoriji vjerojatnosti shvaćen je kao niz matematičkih teorema, u svakom od njih, za određene uvjete, činjenica aproksimacije prosječnih karakteristika velikog broja eksperimenata na neke specifične konstante se uspostavlja.

U 2.3 već smo formulirali najjednostavniji od ovih teorema, J. Bernoullijev teorem. Ona tvrdi da se s velikim brojem eksperimenata učestalost događaja približava (točnije, konvergira u vjerojatnosti) vjerojatnosti tog događaja. Drugi, općenitiji oblici zakona velikih brojeva bit će predstavljeni u ovom poglavlju. Svi oni utvrđuju činjenicu i uvjete za konvergenciju u vjerojatnosti određenih slučajnih varijabli prema konstantnim, neslučajnim varijablama.

Zakon velikih brojeva igra važnu ulogu u praktičnim primjenama teorije vjerojatnosti. Svojstvo slučajnih varijabli da se pod određenim uvjetima ponašaju praktički kao neslučajne omogućuje nam da pouzdano operiramo s tim veličinama, da predvidimo rezultate masovnih slučajnih pojava s gotovo potpunom sigurnošću.

Mogućnosti takvih predviđanja u području masovnih slučajnih pojava dodatno su proširene prisutnošću druge skupine graničnih teorema, koji se više ne tiču ​​graničnih vrijednosti slučajnih varijabli, već graničnih zakona distribucije. Ovo je skupina teorema poznatih kao "središnji granični teorem". Već smo rekli da se kod zbrajanja dovoljno velikog broja slučajnih varijabli zakon raspodjele zbroja neograničeno približava normalnom, uz ispunjenje određenih uvjeta. Ovi uvjeti, koji se matematički mogu formulirati na različite načine - u više ili manje općenitom obliku - svode se u biti na zahtjev da utjecaj na zbroj pojedinačnih članova bude jednoliko malen, tj. da u zbroju ne budu članovi koji jasno prevladavaju nad postavljenim ostalim svojim utjecajem na disperziju količine. Razni oblici središnjeg graničnog teorema međusobno se razlikuju po uvjetima za koje se utvrđuje ovo granično svojstvo zbroja slučajnih varijabli.

Različiti oblici zakona velikih brojeva, zajedno s različitim oblicima središnjeg graničnog teorema, čine skup takozvanih graničnih teorema teorije vjerojatnosti. Granični teoremi omogućuju ne samo izradu znanstvenih prognoza u području slučajnih pojava, već i procjenu točnosti tih prognoza.

U ovom poglavlju razmatramo samo neke od najjednostavnijih oblika graničnih teorema. Najprije će se razmatrati teoremi koji se odnose na skupinu "zakon velikih brojeva", zatim - teoremi koji se odnose na skupinu "centralni granični teorem".

1. /PB-MS-teorija/Predavanja-1(4s.).doc
2. /PB-MS-teorija/Predavanja-2(4s.).doc
3. /PB-MS-teorija/Predavanja-3(4s.).doc
4. /PB-MS-teorija/Predavanja-4(4s.).doc
5. /PB-MS-teorija/Sadržaj.doc
Predavanje 1
Predavanje 19. Statistička provjera statističkih hipoteza. Opća načela za testiranje hipoteza. Koncepti statističke hipoteze (jednostavne i složene), nulte i konkurentske hipoteze,
Zakon velikih brojeva. Čebiševljeva nejednakost. Čebiševljev i Bernoullijev teorem
Predavanje Osnovne numeričke karakteristike diskretnih i kontinuiranih slučajnih varijabli: matematičko očekivanje, varijanca i standardna devijacija. Njihova svojstva i primjeri
Predavanje Predmet teorije vjerojatnosti. Slučajni događaji. Algebra događaja. Relativna učestalost i vjerojatnost slučajnog događaja. Kompletna grupa događaja. Klasična definicija vjerojatnosti. Osnovna svojstva vjerojatnosti. Osnovne formule kombinatorike

Predavanje 13

Zakon velikih brojeva. Čebiševljeva nejednakost. Teoremi Chebysheva i Bernoullija.
Proučavanje statističkih pravilnosti omogućilo je utvrđivanje da, pod određenim uvjetima, ukupno ponašanje velikog broja slučajnih varijabli gotovo gubi svoj slučajni karakter i postaje regularno (drugim riječima, slučajna odstupanja od nekog prosječnog ponašanja međusobno se poništavaju) . Konkretno, ako je utjecaj na zbroj pojedinih članova jednolično malen, zakon raspodjele zbroja približava se normalnom. Matematička formulacija ove tvrdnje dana je u skupini teorema tzv zakon velikih brojeva.

Čebiševljeva nejednakost.
Čebiševljeva nejednakost, koja se koristi za dokazivanje daljnjih teorema, vrijedi i za kontinuirane i za diskretne slučajne varijable. Dokažimo to za diskretne slučajne varijable.
Teorem 13.1 (Čebiševljeva nejednakost). str( | xM(x)| D( x) / ε². (13.1)

Dokaz. Neka x dano distribucijskim brojem


x

x 1

x 2



x P

R

R 1

R 2



R P

Od događaja | xM(x)| x M(x)| ≥ ε su suprotne, dakle R (|xM(x)| p(| xM(x)| ≥ ε) = 1, dakle, R (|xM(x)| p(| xM(x)| ≥ ε). Nađimo R (|xM(x)| ≥ ε).

D(x) = (x 1 – M(x))² str 1 + (x 2 – M(x))² str 2 + … + (x n M(x))² str n . Iz ovog zbroja isključujemo one pojmove za koje | xM(x)| k Pojmovi. Zatim

D(x) ≥ (x k + 1 – M(x))² str k + 1 + (x k + 2 – M(x))² str k +2 + … + (x n M(x))² str n ≥ ε² ( str k + 1 + str k + 2 + … + str n).

Imajte na umu da str k + 1 + str k + 2 + … + str n postoji mogućnost da | xM(x)| ≥ ε, budući da je to zbroj vjerojatnosti svih mogućih vrijednosti x za koje ova nejednakost vrijedi. Posljedično, D(x) ≥ ε² R(|xM(x)| ≥ ε), ili R (|xM(x)| ≥ ε) ≤ D(x) / ε². Zatim vjerojatnost suprotnog događaja str( | xM(x)| D( x) / ε², što je trebalo dokazati.
Teoremi Chebysheva i Bernoullija.

Teorem 13.2 (Čebiševljev teorem). Ako a x 1 , x 2 ,…, x P su u paru neovisne slučajne varijable čije su varijance jednoliko ograničene ( D(x ja) ≤ C), tada je za proizvoljno mali broj ε vjerojatnost nejednakosti

bit će proizvoljno blizu 1 ako je broj slučajnih varijabli dovoljno velik.

Komentar. Drugim riječima, ako su ti uvjeti ispunjeni

Dokaz. Razmotrimo novu slučajnu varijablu
i pronaći njegovo matematičko očekivanje. Koristeći svojstva matematičkog očekivanja, dobivamo da . Primjenjivo na Čebiševljeva nejednakost: Budući da su razmatrane slučajne varijable neovisne, tada, uzimajući u obzir uvjet teorema, imamo: Koristeći ovaj rezultat, prethodnu nejednakost prikazujemo u obliku:

Prijeđimo do granice na
: Budući da vjerojatnost ne može biti veća od 1, može se tvrditi da

Teorem je dokazan.
Posljedica.

Ako a x 1 , x 2 , …, x P- u parovima neovisne slučajne varijable s jednoliko ograničenim varijancama, koje imaju isto matematičko očekivanje jednako a, tada je za bilo koje proizvoljno malo ε > 0 vjerojatnost nejednakosti
bit će proizvoljno blizu 1 ako je broj slučajnih varijabli dovoljno velik. Drugim riječima,
.

Zaključak: aritmetička sredina dovoljno velikog broja slučajnih varijabli poprima vrijednosti bliske zbroju njihovih matematičkih očekivanja, odnosno gubi karakter slučajne varijable. Na primjer, ako se provodi niz mjerenja bilo koje fizikalne veličine i: a) rezultat svakog mjerenja ne ovisi o rezultatima drugih, to jest, svi su rezultati u parovima neovisne slučajne varijable; b) mjerenja se provode bez sustavnih pogrešaka (njihova matematička očekivanja su međusobno jednaka i jednaka stvarnoj vrijednosti a izmjerena vrijednost); c) osigurana je određena točnost mjerenja, dakle, disperzije razmatranih slučajnih varijabli jednoliko su ograničene; tada će za dovoljno veliki broj mjerenja njihova aritmetička sredina biti proizvoljno blizu prave vrijednosti mjerene veličine.
Bernoullijev teorem.
Teorem 13.3 (Bernoullijev teorem). Ako u svakom od P neovisna iskustva probability R pojava događaja ALI konstantan, tada s dovoljno velikim brojem testova, vjerojatnost da modul odstupanja relativne učestalosti pojavljivanja ALI u P iskustva iz R bit će proizvoljno mali, proizvoljno blizu 1:

(13.2)

Dokaz. Uvodimo slučajne varijable x 1 , x 2 , …, x P, gdje x ja broj pojavljivanja ALI u ja-m iskustvo. pri čemu x ja može imati samo dvije vrijednosti: 1 (s vjerojatnošću R) i 0 (s vjerojatnošću q = 1 – str). Osim toga, razmatrane slučajne varijable su neovisne u parovima i njihove varijance su uniformno ograničene (jer D(x ja) = pq, str + q = 1, odakle pq ≤ ¼). Stoga se na njih može primijeniti Čebiševljev teorem M ja = str:

.

Ali
, jer x ja poprima vrijednost 1 kada ALI u ovom eksperimentu i vrijednost jednaka 0 if ALI Nije se dogodilo. Na ovaj način,

Q.E.D.
Komentar. Iz Bernoullijevog teorema to ne slijedi, što
Radi se samo o vjerojatnosti da razlika između relativne frekvencije i vjerojatnosti po modulu može postati proizvoljno mala. Razlika je u sljedećem: s uobičajenom konvergencijom koja se razmatra u matematičkoj analizi, za sve P, polazeći od neke vrijednosti, nejednakosti
uvijek se izvršava; u našem slučaju možda postoje takve vrijednosti P za koje je ova nejednakost lažna. Ova vrsta konvergencije naziva se konvergencija u vjerojatnosti.

Predavanje 14

Središnji granični teorem Ljapunova. Moivre-Laplaceov granični teorem.
Zakon velikih brojeva ne istražuje oblik zakona granične distribucije za zbroj slučajnih varijabli. Ovo se pitanje razmatra u skupini teorema tzv središnji granični teorem. Oni tvrde da se zakon distribucije zbroja slučajnih varijabli, od kojih svaka može imati različite distribucije, približava normalnom s dovoljno velikim brojem članova. Ovo objašnjava važnost normalnog zakona za praktične primjene.
Karakteristične funkcije.

Metodom karakterističnih funkcija dokazuje se središnji granični teorem.
Definicija 14.1.karakteristična funkcija nasumična varijabla x naziva se funkcija

g(t) = M (e itX ) (14.1)

Na ovaj način, g (t) je matematičko očekivanje neke složene slučajne varijable U = e itX povezan s vrijednošću x. Konkretno, ako x je diskretna slučajna varijabla dana nizom distribucije, dakle

. (14.2)

Za kontinuiranu slučajnu varijablu s gustoćom distribucije f(x)

(14.3)

Primjer 1. Neka x- broj ispadanja 6 bodova s ​​jednim bacanjem kocke. Tada po formuli (14.2) g(t) =

Primjer 2. Pronađite karakterističnu funkciju za normaliziranu kontinuiranu slučajnu varijablu raspodijeljenu prema normalnom zakonu
. Prema formuli (14.3) (koristili smo formulu
i što ja² = -1).

Svojstva karakterističnih funkcija.
1. Funkcija f(x) može se pronaći iz poznate funkcije g(t) prema formuli

(14.4)

(transformacija (14.3) se zove Fourierova transformacija, a transformacija (14.4) je inverzna Fourierova transformacija).

2. Ako slučajne varijable x i Y povezani omjerom Y = sjekira, tada su njihove karakteristične funkcije povezane relacijom

g g (t) = g x (na). (14.5)

3. Karakteristična funkcija zbroja nezavisnih slučajnih varijabli jednaka je umnošku karakterističnih funkcija članova: za

(14.6)
Teorem 14.1 (središnji granični teorem za identično raspodijeljene članove). Ako a x 1 , x 2 ,…, x P,… - nezavisne slučajne varijable s istim zakonom raspodjele, matematičko očekivanje t i disperzija σ 2 , zatim uz neograničeno povećanje P zakon distribucije zbroja
neograničeno se približava normali.

Dokaz.

Dokažimo teorem za kontinuirane slučajne varijable x 1 , x 2 ,…, x P(dokaz za diskretne veličine je sličan). Prema uvjetu teorema, karakteristične funkcije članova su iste:
Zatim, po svojstvu 3, karakteristična funkcija zbroja Y n bit će
Proširite funkciju g x (t) u seriji Maclaurin:

, gdje
na
.

Ako to pretpostavimo t= 0 (to jest, pomaknite ishodište u točku t), zatim
.

(jer t= 0). Zamjenom dobivenih rezultata u Maclaurinovu formulu nalazimo da

.

Razmotrimo novu slučajnu varijablu
, različito od Y n činjenica da je njegova disperzija za bilo koji P jednako 0. Budući da Y n i Z n linearno povezana, dovoljno je to dokazati Z n raspodijeljena prema normalnom zakonu, ili, što je isto, da se njegova karakteristična funkcija približava karakterističnoj funkciji normalnog zakona (vidi primjer 2). Po svojstvu karakterističnih funkcija

Uzimamo logaritam dobivenog izraza:

gdje

Idemo se razgraditi
u nizu na P→ ∞, ograničavajući se na dva člana proširenja, tada ln(1 - k) ≈ - k. Odavde

Gdje je zadnja granica 0, jer na . Posljedično,
, to je
je karakteristična funkcija normalne distribucije. Dakle, s neograničenim povećanjem broja članova, karakteristična funkcija količine Z n neograničeno se približava karakterističnoj funkciji normalnog zakona; dakle, zakon raspodjele Z n (i Y n) neograničeno se približava normalnoj vrijednosti. Teorem je dokazan.

A.M. Lyapunov dokazao je središnji granični teorem za općenitije uvjete:
Teorem 14.2 (Ljapunovljev teorem). Ako je slučajna varijabla x je zbroj vrlo velikog broja međusobno neovisnih slučajnih varijabli za koje je zadovoljen sljedeći uvjet:

, (14.7)

gdje b k je treći apsolutni središnji moment količine x do, a D k je njegova varijanca, dakle x ima raspodjelu blisku normalnoj (Ljapunovljev uvjet znači da je utjecaj svakog člana na zbroj zanemariv).
U praksi je moguće koristiti središnji granični teorem s dovoljno malim brojem članova, budući da probabilistički izračuni zahtijevaju relativno nisku točnost. Iskustvo pokazuje da se za zbroj čak deset ili manje članova zakon njihove raspodjele može zamijeniti normalnim.

Poseban slučaj središnjeg graničnog teorema za diskretne slučajne varijable je de Moivre-Laplaceov teorem.

Teorem 14.3 (Moivre-Laplaceov teorem). Ako se proizvodi P nezavisni eksperimenti, u svakom od njih događaj ALI pojavljuje se s vjerojatnošću R, tada vrijedi relacija:

(14.8)

gdje Y – broj pojavljivanja događaja ALI u P eksperimenti, q = 1 – str.

Dokaz.

Pretpostavit ćemo da
, gdje x ja– broj pojavljivanja događaja ALI u ja-m iskustvo. Zatim slučajna varijabla
(vidi teorem 14.1) može se pretpostaviti da je distribuiran prema normalnom zakonu i normaliziran, stoga se vjerojatnost njegovog pada u interval (α, β) može pronaći formulom

Jer Y ima binomnu distribuciju, . Zatim
. Zamjenom ovog izraza u prethodnu formulu dobivamo jednakost (14.8).

Posljedica.

U uvjetima Moivre-Laplaceovog teorema, vjerojatnost
da je događaj ALI pojavit će se u P eksperimenti točno k puta, s velikim brojem eksperimenata može se pronaći formulom:

(14.9)

gdje
, a
(vrijednosti ove funkcije dane su u posebnim tablicama).

Primjer 3. Odredite vjerojatnost da nakon 100 bacanja novčića broj grbova padne u rasponu od 40 do 60.

Primijenimo formulu (14.8) uzimajući u obzir da P= 0,5. Zatim itd= 100 0,5 = 50, Onda ako
Posljedično,

Primjer 4. Pod uvjetima iz prethodnog primjera pronađite vjerojatnost da će ispasti 45 grbova.

Nađimo
, onda

Predavanje 15

Osnovni pojmovi matematičke statistike. Opća populacija i uzorak. Varijacijski nizovi, statistički nizovi. Grupirani odabir. Grupirane statističke serije. Frekvencijski poligon. Funkcija distribucije uzorka i histogram.
Matematička statistika bavi se utvrđivanjem zakonitosti kojima podliježu masovne slučajne pojave na temelju obrade statističkih podataka dobivenih promatranjem. Dvije glavne zadaće matematičke statistike su:

Odrediti kako se ti statistički podaci prikupljaju i grupiraju;

Razvoj metoda za analizu dobivenih podataka, ovisno o ciljevima istraživanja, koji uključuju:

a) procjena nepoznate vjerojatnosti događaja; procjena nepoznate funkcije distribucije; procjena parametara raspodjele, čiji je oblik poznat; procjena ovisnosti o drugim slučajnim varijablama itd.;

b) testiranje statističkih hipoteza o obliku nepoznate distribucije ili o vrijednostima parametara poznate distribucije.

Da bi se ovi problemi riješili, potrebno je iz velikog skupa homogenih objekata odabrati ograničeni broj objekata, na temelju čijih je rezultata proučavanja moguće predvidjeti proučavana svojstva tih objekata.

Definirajmo osnovne pojmove matematičke statistike.

Populacija - sav skup dostupnih objekata.

Uzorak- skup objekata nasumično odabranih iz opće populacije.

Veličina opće populacijeN i veličina uzorkan - broj objekata u razmatranom skupu.

Vrste uzoraka:

Ponavlja se- svaki odabrani objekt vraća se općoj populaciji prije odabira sljedećeg;

Neponavljanje- odabrani objekt se ne vraća općoj populaciji.
Komentar. Da bi se proučavanjem uzorka moglo zaključiti o ponašanju obilježja opće populacije koje nas zanima, potrebno je da uzorak ispravno predstavlja omjere opće populacije, tj. predstavnik(predstavnik). Uzimajući u obzir zakon velikih brojeva, može se tvrditi da je ovaj uvjet zadovoljen ako je svaki objekt odabran slučajno, a za svaki objekt je vjerojatnost da bude uključen u uzorak ista.
Primarna obrada rezultata.

Neka slučajna varijabla koja nas zanima x uzima vrijednost u uzorku x 1 P 1 put, x 2 – P 2 puta, …, x do - str do puta, i
gdje P je veličina uzorka. Zatim promatrane vrijednosti slučajne varijable x 1 , x 2 ,…, x do nazvao opcije, a P 1 , P 2 ,…, P dofrekvencije. Ako svaku frekvenciju podijelimo s veličinom uzorka, dobit ćemo relativne frekvencije
Poziva se niz opcija napisanih uzlaznim redoslijedom varijacijski jednu pored druge, te popis opcija i njihove odgovarajuće frekvencije ili relativne frekvencije - statističke serije:


x ja

x 1

x 2



x k

n ja

n 1

n 2



n k

w ja

w 1

w 2



w k

Prilikom izvođenja 20 serija od 10 bacanja kockica, broj od šest bodova ispao je 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2,2 ,3 ,4,1.Napravimo varijacijski niz: 0,1,2,3,4,5. Statistička serija za apsolutne i relativne frekvencije ima oblik:


x ja

0

1

2

3

4

5

n ja

3

6

5

3

2

1

w ja

0,15

0,3

0,25

0,15

0,1

0,05

Ako se istražuje neka kontinuirana značajka, tada se varijacijski niz može sastojati od vrlo velikog broja brojeva. U ovom slučaju prikladnije je koristiti grupirani uzorak. Da bi se to dobilo, interval, koji sadrži sve promatrane vrijednosti obilježja, dijeli se na nekoliko jednakih parcijalnih intervala duljine h, a zatim pronađite za svaki parcijalni interval n ja je zbroj učestalosti varijante koja je upala u ja-ti interval. Tablica sastavljena iz ovih rezultata zove se grupirane statističke serije:

Frekvencijski poligon. Funkcija distribucije uzorka i histogram.
Za vizualni prikaz ponašanja slučajne varijable koja se proučava u uzorku mogu se izgraditi različiti grafikoni. Jedan od njih - frekvencijski poligon: polilinija čiji segmenti povezuju točke s koordinatama ( x 1 , n 1), (x 2 , n 2),…, (x k , n k), gdje x ja ucrtavaju se na x-osi, i n ja - na y-osi. Ako na y-os ucrtamo neapsolutne ( n ja), i relativno ( w ja) frekvencija, tada dobivamo poligon relativne frekvencije(Sl. 1) . Riža. jedan.

Po analogiji s funkcijom distribucije slučajne varijable, možete postaviti određenu funkciju, relativnu učestalost događaja x x.

Definicija 15.1.Funkcija uzorka (empirijske) distribucije pozvati funkciju F* (x), koji određuje za svaku vrijednost x relativna učestalost događaja x x. Na ovaj način,

, (15.1)

gdje P x– broj opcija, manji x, P je veličina uzorka.
Komentar. Za razliku od empirijske funkcije raspodjele koja se nalazi empirijski, funkcija raspodjele F(x) opće populacije naziva se teorijska funkcija distribucije. F(x) određuje vjerojatnost događaja x x, a F* (x) je njegova relativna frekvencija. Za dovoljno velike P, kao što slijedi iz Bernoullijeve teoreme, F* (x) teži u vjerojatnosti da F(x).

Iz definicije empirijske funkcije distribucije vidljivo je da se njezina svojstva podudaraju sa svojstvima F(x), naime:


  1. 0 ≤F* (x) ≤ 1.

  2. F* (x) je neopadajuća funkcija.

  3. Ako a x 1 je onda najmanja opcija F* (x) = 0 za xx jedan ; ako x do je najveća opcija, dakle F* (x) = 1 for x> x do .
Za kontinuiranu značajku, grafička ilustracija je Grafikon, odnosno stepenasta figura koja se sastoji od pravokutnika čije su osnovice djelomični intervali dužine h, i visine dužinske segmente n ja / h(histogram učestalosti) ili w ja / h (histogram relativnih frekvencija). U prvom slučaju površina histograma jednaka je veličini uzorka, u drugom slučaju jednaka je jedinici (slika 2). sl.2.

Predavanje 16

Numeričke karakteristike statističke distribucije: srednja vrijednost uzorka, procjene varijance, procjene moda i medijana, procjene početnog i središnjeg trenutka. Statistički opis i izračun ocjena za parametre dvodimenzionalnog slučajnog vektora.
Jedan od zadataka matematičke statistike je procjena vrijednosti numeričkih karakteristika slučajne varijable koja se proučava na temelju postojećeg uzorka.

Definicija 16.1.srednja vrijednost uzorka naziva se aritmetička sredina vrijednosti slučajne varijable uzete u uzorku:

, (16.1)

gdje x ja– opcije, n ja- frekvencije.

Komentar. Srednja vrijednost uzorka koristi se za procjenu matematičkog očekivanja slučajne varijable koja se proučava. O tome koliko je takva procjena točna bit će riječi kasnije.

Definicija 16.2.Varijanca uzorka nazvao

, (16.2)

a standardna devijacija uzorka

(16.3)

Baš kao u teoriji slučajnih varijabli, može se dokazati da je sljedeća formula valjana za izračun varijance uzorka:

. (16.4)

Primjer 1. Nađimo numeričke karakteristike uzorka zadanog statističkim nizom


x ja

2

5

7

8

n ja

3

8

7

2

Ostale karakteristike serije varijacija su:

- modaM 0 - varijanta s najvećom frekvencijom (u prethodnom primjeru M 0 = 5).

- medijant e - varijanta koja dijeli niz varijacija na dva dijela jednaka broju varijanti. Ako je opcija broja neparna ( n = 2k+ 1), zatim m e = x k + 1 , i za par n = 2k
. Konkretno, u primjeru 1

Procjene početnih i središnjih momenata (tzv. empirijski momenti) definiraju se slično odgovarajućim teorijskim momentima:

- početni empirijski moment redak nazvao

. (16.5)

Posebno,
, odnosno početni empirijski moment prvog reda jednak je srednjoj vrijednosti uzorka.

- središnji empirijski trenutak redak nazvao

. (16.6)

Posebno,
, odnosno središnji empirijski moment drugog reda jednak je varijanci uzorka.
Statistički opis i izračun karakteristika

dvodimenzionalni slučajni vektor.
U statističkoj studiji dvodimenzionalnih slučajnih varijabli, glavni zadatak je obično identificirati odnos između komponenti.

Dvodimenzionalni uzorak je skup slučajnih vektorskih vrijednosti: ( x 1 , na 1), (x 2 , na 2), …, (x P , g P). Za njega možete odrediti uzorke prosjeka komponenti:

te odgovarajuće varijance uzorka i standardne devijacije. Osim toga, može se izračunati uvjetni prosjeci: - aritmetička sredina promatranih vrijednosti Y odgovara X = x, i - srednja vrijednost promatranih vrijednosti x odgovara Y = g.

Ako postoji ovisnost između komponenti dvodimenzionalne slučajne varijable, ona može imati drugačiji oblik: funkcionalna ovisnost, ako svaka moguća vrijednost x odgovara jednoj vrijednosti Y, i statistički, u kojem promjena u jednoj količini dovodi do promjene u distribuciji druge. Ako se istodobno, kao rezultat promjene jedne vrijednosti, promijeni prosječna vrijednost druge, tada se statistička ovisnost između njih naziva korelacijom.

Predavanje 17

Glavna svojstva statističkih karakteristika parametara distribucije: nepristranost, konzistentnost, učinkovitost. Nepristranost i konzistentnost uzorka kao procjena matematičkog očekivanja. Pristranost varijance uzorka. Primjer nepristrane procjene varijance. Asimptotski nepristrane procjene. Metode konstruiranja procjena: metoda maksimalne vjerojatnosti, metoda momenata, metoda kvantila, metoda najmanjih kvadrata, Bayesov pristup dobivanju procjena.
Nakon što ste dobili statističke procjene parametara distribucije (srednja vrijednost uzorka, varijanca uzorka itd.), morate se uvjeriti da one dovoljno služe kao aproksimacija odgovarajućih karakteristika opće populacije. Definiramo zahtjeve koji moraju biti ispunjeni u ovom slučaju.

Neka je Θ* statistička procjena nepoznatog parametra Θ teorijske distribucije. Iz opće populacije izdvajamo nekoliko uzoraka iste veličine P i za svaki od njih izračunajte procjenu parametra Θ:
Tada se procjena Θ* može smatrati slučajnom varijablom koja poprima moguće vrijednosti. M(Θ*) >Θ, a s nedostatkom ako M(Θ*) M (Θ*) = Θ.
Definicija 17.2. Statistička procjena Θ* naziva se nepristran, ako je njegovo matematičko očekivanje jednako procijenjenom parametru Θ za bilo koju veličinu uzorka:

M(Θ*) = Θ. (17.1)

Raseljeni naziva se procjena, čije matematičko očekivanje nije jednako procijenjenom parametru.

Međutim, nepristranost nije dovoljan uvjet za dobru aproksimaciju stvarne vrijednosti procijenjenog parametra. Ako u ovom slučaju moguće vrijednosti Θ* mogu značajno odstupati od prosječne vrijednosti, odnosno varijanca Θ* je velika, tada se vrijednost pronađena iz podataka jednog uzorka može značajno razlikovati od procijenjenog parametra . Stoga je potrebno nametnuti ograničenja na varijancu.
Definicija 17.2. Statistička procjena se zove učinkovit ako je za određenu veličinu uzorka P ima najmanju moguću varijancu.
Kada se razmatraju uzorci velikog volumena, statističke procjene također podliježu zahtjevu dosljednosti.
Definicija 17.3.Imućni naziva se statistička procjena, koja P→∞ teži u vjerojatnosti procijenjenom parametru (ako je ova procjena nepristrana, tada će biti dosljedna ako, za P→∞ njegova varijanca teži 0).
Uvjerimo se u to je nepristrana procjena očekivanja M(x).

Smatrat ćemo ga slučajnom varijablom, i x 1 , x 2 ,…, x P, odnosno vrijednosti slučajne varijable koja se proučava koja čini uzorak, – kao neovisne, identično raspoređene slučajne varijable x 1 , x 2 ,…, x P, imajući matematičko očekivanje a. Iz svojstava matematičkog očekivanja proizlazi da

Ali, budući da svaka od količina x 1 , x 2 ,…, x P ima istu distribuciju kao i opća populacija, a = M(x), to je M(
) = M(x), što je trebalo dokazati. Srednja vrijednost uzorka nije samo nepristrana, već i dosljedna procjena matematičkog očekivanja. Ako to pretpostavimo x 1 , x 2 ,…, x P imaju ograničene varijance, onda iz Čebiševljevog teorema slijedi da je njihova aritmetička sredina, tj. s porastom P teži u vjerojatnosti matematičkom očekivanju a svaka njihova vrijednost, odnosno do M(x). Stoga je srednja vrijednost uzorka dosljedna procjena matematičkog očekivanja.

Za razliku od srednje vrijednosti uzorka, varijanca uzorka je pristrana procjena varijance populacije. Može se dokazati da

, (17.2)

gdje D G je prava vrijednost varijance populacije. Možemo ponuditi drugu procjenu varijance - ispravljena varijancas ² , izračunato formulom

. (17.3)

Takva će procjena biti nepristrana. To odgovara ispravljena standardna devijacija

. (17.4)

Definicija 17.4. Procjena neke značajke naziva se asimptotski nepristran, ako za uzorak x 1 , x 2 , …, x P

, (17.5)

gdje x je prava vrijednost ispitivane veličine.
Metode za izradu procjena.
1. Metoda najveće vjerojatnosti.
Neka x je diskretna slučajna varijabla, koja kao rezultat P testovi su uzeli vrijednosti x 1 , x 2 , …, x P. Pretpostavimo da znamo zakon raspodjele ove veličine, određen parametrom Θ, ali je brojčana vrijednost tog parametra nepoznata. Nađimo njegovu točkastu procjenu.

Neka R(x ja, Θ) je vjerojatnost da će, kao rezultat testa, vrijednost x poprimit će značenje x ja. Nazovimo funkcija vjerojatnosti diskretna slučajna varijabla x funkcija argumenta Θ, određena formulom:

L (x 1 , x 2 , …, x P ; Θ) = str(x 1 ,Θ) str(x 2 ,Θ)… str(x n ,Θ).

Zatim, kao točkasta procjena parametra Θ, njegova vrijednost Θ* = Θ( x 1 , x 2 , …, x P) na kojoj funkcija vjerojatnosti doseže svoj maksimum. Procjena Θ* se zove procjena najveće vjerojatnosti.

Budući da funkcije L i ln L dosegnu maksimum pri istoj vrijednosti Θ, prikladnije je tražiti maksimum ln Llog-likelihood funkcija. Za ovo vam je potrebno:


Prednosti metode maksimalne vjerojatnosti: dobivene procjene su dosljedne (iako mogu biti pristrane), asimptotski normalno distribuirane za velike vrijednosti P i imaju najmanju varijancu u usporedbi s drugim asimptotski normalnim procjenama; ako za procijenjeni parametar Θ postoji učinkovita procjena Θ*, tada jednadžba vjerojatnosti ima jedinstveno rješenje Θ*; metoda najpotpunije koristi podatke uzorka i stoga je osobito korisna u slučaju malih uzoraka.

Nedostatak metode najveće vjerojatnosti: složenost izračuna.
Za kontinuiranu slučajnu varijablu s poznatom gustoćom distribucije f(x) i nepoznatog parametra Θ, funkcija vjerojatnosti ima oblik:

L (x 1 , x 2 , …, x P ; Θ) = f(x 1 ,Θ) f(x 2 ,Θ)… f(x n ,Θ).

Procjena najveće vjerojatnosti nepoznatog parametra provodi se na isti način kao i za diskretnu slučajnu varijablu.
2. Metoda momenata.
Metoda momenata temelji se na činjenici da su početni i središnji empirijski momenti konzistentne procjene početnog odnosno središnjeg teorijskog momenta, stoga se teoretski momenti mogu izjednačiti s odgovarajućim empirijskim momentima istog reda.

Ako je zadan tip gustoće distribucije f(x, Θ) određena jednim nepoznatim parametrom Θ, tada je za procjenu tog parametra dovoljna jedna jednadžba. Na primjer, mogu se izjednačiti početni momenti prvog reda:

,

čime se dobiva jednadžba za određivanje Θ. Njegovo rješenje Θ* bit će točkasta procjena parametra, koja je funkcija srednje vrijednosti uzorka, a time i uzorka:

Θ = ψ ( x 1 , x 2 , …, x P).

Ako je poznat oblik gustoće raspodjele f(x, Θ 1 , Θ 2) određuju dva nepoznata parametra Θ 1 i Θ 2 , tada su potrebne dvije jednadžbe, na primjer

v 1 = M 1 , μ 2 = t 2 .

Odavde
- sustav dviju jednadžbi s dvije nepoznanice Θ 1 i Θ 2 . Njegova će rješenja biti bodovne procjene Θ 1 * i Θ 2 * - funkcije opcije uzorkovanja:

Θ 1 = ψ 1 ( x 1 , x 2 , …, x P),

Θ 2 = ψ 2 ( x 1 , x 2 , …, x P).
3. Metoda najmanjih kvadrata.

Ako je potrebno ocijeniti ovisnost veličina na i x, a oblik funkcije koja ih povezuje je poznat, ali su vrijednosti koeficijenata uključenih u nju nepoznate, njihove vrijednosti mogu se procijeniti iz dostupnog uzorka metodom najmanjih kvadrata. Za ovu funkciju na = φ ( x) bira se tako da zbroj kvadrata odstupanja promatranih vrijednosti na 1 , na 2 ,…, na P od φ( x ja) je bio minimalan:

U tom slučaju potrebno je pronaći stacionarnu točku funkcije φ( x; a, b, c), odnosno riješiti sustav:

(rješenje je, naravno, moguće samo u slučaju kada je poznat konkretan oblik funkcije φ).

Razmotrimo, kao primjer, izbor parametara linearne funkcije metodom najmanjih kvadrata.

Kako bi se ocijenili parametri a i b u funkciji g = sjekira + b, pronaći
Zatim
. Odavde
. Dijeleći obje dobivene jednadžbe s P a sjećajući se definicija empirijskih momenata, mogu se dobiti izrazi za a i b kao:

. Prema tome, odnos između x i na može se postaviti u obliku:


4. Bayesov pristup dobivanju procjena.
Neka ( Y, x) je slučajni vektor čija je gustoća poznata R(na|x) uvjetna raspodjela Y za svaku vrijednost X = x. Ako kao rezultat pokusa samo vrijednosti Y, i odgovarajuće vrijednosti x nepoznato, zatim procijeniti neku zadanu funkciju φ( x) kao njegovu približnu vrijednost predlaže se tražiti uvjetno matematičko očekivanje M (φ‌‌( x)‌‌‌‌‌‌|Y) izračunava se po formuli:

, gdje , R(x x, q(g) je bezuvjetna gustoća distribucije Y. Problem se može riješiti samo kada se zna R(x). Ponekad je, međutim, moguće konstruirati dosljednu procjenu za q(g), što ovisi samo o vrijednostima dobivenim u uzorku Y.

Predavanje 18

Intervalna estimacija nepoznatih parametara. Točnost procjene, vjerojatnost (pouzdanost) pouzdanosti, interval pouzdanosti. Konstrukcija intervala pouzdanosti za procjenu matematičkog očekivanja normalne distribucije s poznatom i nepoznatom varijancom. Intervali pouzdanosti za procjenu standardne devijacije normalne distribucije.
Pri uzorkovanju male količine, procjena točke može se značajno razlikovati od procijenjenog parametra, što dovodi do velikih pogrešaka. Stoga je u ovom slučaju bolje koristiti intervalne procjene, odnosno označavaju interval u koji prava vrijednost procijenjenog parametra pada sa zadanom vjerojatnošću. Naravno, što je duljina ovog intervala kraća, to je procjena parametra točnija. Prema tome, ako procjena Θ* nekog parametra Θ zadovoljava nejednakost | Θ* - Θ | 0 karakterizira točnost procjene(što je manji δ, to je procjena točnija). Ali statističke metode dopuštaju nam reći samo da je ta nejednakost zadovoljena s određenom vjerojatnošću.

Definicija 18.1.Pouzdanost (vjerojatnost povjerenja) procjena Θ* parametra Θ je vjerojatnost γ da nejednakost | Θ* - Θ |
str (Θ* - δ
Dakle, γ je vjerojatnost da Θ padne unutar intervala (Θ* - δ, Θ* + δ).

Definicija 18.2.Pouzdan je interval u kojem nepoznati parametar pada sa zadanom pouzdanošću γ.
Konstrukcija intervala povjerenja.
1. Interval pouzdanosti za procjenu matematičkog očekivanja normalne distribucije s poznatom varijancom.

Neka slučajna varijabla koja se proučava x raspodijeljen prema normalnom zakonu s poznatim srednjim kvadratom σ, te je potrebno procijeniti njegovo matematičko očekivanje vrijednošću uzorka srednje vrijednosti a. Srednju vrijednost uzorka smatrat ćemo slučajnom varijablom i vrijednosti varijanti uzorka x 1 , x 2 ,…, x P kao jednako raspoređene nezavisne slučajne varijable x 1 , x 2 ,…, x P, od kojih svaki ima matematičko očekivanje a i standardna devijacija σ. pri čemu M() = a,
(koristimo svojstva matematičkog očekivanja i varijance zbroja nezavisnih slučajnih varijabli). Procijenimo vjerojatnost ispunjenja nejednakosti
. Primjenjujemo formulu za vjerojatnost da normalno raspodijeljena slučajna varijabla padne u zadani interval:

R (
) = 2F
. Zatim, uzimajući u obzir činjenicu da R() = 2F
=

2F( t), gdje
. Odavde
, a prethodna jednakost se može prepisati kao:

. (18.1)

Dakle, vrijednost matematičkog očekivanja a s vjerojatnošću (pouzdanošću) γ spada u interval
, gdje je vrijednost t određuje se iz tablica za Laplaceovu funkciju tako da vrijedi jednakost 2F( t) = γ.
Primjer. Odredite interval pouzdanosti za matematičko očekivanje normalno raspodijeljene slučajne varijable ako je veličina uzorka P = 49,
σ = 1,4, a razina pouzdanosti γ = 0,9.

Idemo definirati t, pri čemu je F( t) = 0,9:2 = 0,45: t= 1,645. Zatim

, odnosno 2,471 a a s pouzdanošću od 0,9.
2. Interval pouzdanosti za procjenu matematičkog očekivanja normalne distribucije s nepoznatom varijancom.

Ako je poznato da slučajna varijabla koja se proučava x raspodijeljen prema normalnom zakonu s nepoznatom standardnom devijacijom, a zatim da bismo pronašli interval pouzdanosti za njegovo matematičko očekivanje, konstruiramo novu slučajnu varijablu

, (18.2)

gdje - srednja vrijednost uzorka, s je ispravljena varijanca, P je veličina uzorka. Ova slučajna varijabla, čije će moguće vrijednosti biti označene t, ima Studentovu distribuciju (vidi predavanje 12) sa k = n– 1 stupanj slobode.

Budući da je Studentova gustoća distribucije
, gdje
, ne ovisi izričito o a i σ, možete postaviti vjerojatnost njegovog pada u određeni interval (- t γ , t γ ), uzimajući u obzir ravnomjernost gustoće raspodjele, kako slijedi:
. Odavde dobivamo:

(18.3)

Dakle, interval pouzdanosti za a, gdje t γ mogu se pronaći u odgovarajućoj tablici za dano P i g.

Primjer. Neka veličina uzorka P = 25, = 3, s= 1,5. Pronađite interval pouzdanosti za a kod γ = 0,99. Iz tablice nalazimo da t γ (P= 25, γ = 0,99) = 2,797. Zatim
, odnosno 2.161a s vjerojatnošću od 0.99.
3. Intervali pouzdanosti za procjenu standardne devijacije normalne distribucije.

Za standardnu ​​devijaciju normalno distribuirane slučajne varijable, tražit ćemo interval pouzdanosti oblika ( s – δ, s), gdje s je ispravljena standardna devijacija uzorka, a za δ je zadovoljen sljedeći uvjet: str (|σ – s|
Ovu nejednakost zapisujemo u obliku:
ili, označavajući
,

Promotrimo slučajnu varijablu χ definiranu formulom

,

koji je raspoređen prema hi-kvadrat zakonu sa P-1 stupnjeva slobode (vidi predavanje 12). Gustoća njegove distribucije

ne ovisi o procijenjenom parametru σ, već ovisi samo o veličini uzorka P. Transformirajmo nejednadžbu (18.4) tako da poprimi oblik χ 1 Pretpostavimo da q

,

ili, nakon množenja sa
,
. Posljedično,
. Zatim
Postoje tablice za hi-kvadrat distribuciju iz kojih se može pronaći q prema danom P i γ bez rješavanja ove jednadžbe. Dakle, izračunavši iz uzorka vrijednost s i određivanje iz tablice vrijednosti q, može se pronaći interval pouzdanosti (18.4) u koji vrijednost σ pada sa danom vjerojatnošću γ.
Komentar. Ako a q> 1, tada će, uzimajući u obzir uvjet σ > 0, interval pouzdanosti za σ imati granice

. (18.5)

Neka P = 20, s= 1,3. Nađimo interval pouzdanosti za σ za zadanu pouzdanost γ = 0,95. Iz odgovarajuće tablice nalazimo q (n= 20, γ = 0,95) = 0,37. Dakle, granice intervala pouzdanosti: 1,3(1-0,37) = 0,819 i 1,3(1+0,37) = 1,781. Dakle, 0,819

Ovaj dokaz provodimo u dvije faze. Pretpostavimo najprije da postoji i primijetimo da je u ovom slučaju D(Sn) prema teoremu o disperziji zbroja. Prema Čebiševljevoj nejednakosti, za svako t > 0

Za t > n, lijeva strana je manja od, a potonja vrijednost teži nuli. Time je prvi dio dokaza završen.

Sada odbacujemo restriktivni uvjet za postojanje D(). Ovaj se slučaj skraćivanjem svodi na prethodni.

Definiramo dva nova skupa slučajnih varijabli ovisno o sljedećem:

U k =, V k =0, ako je (2.2)

U k =0, V k = if

Ovdje je k=1,… , n i fiksan. Zatim

za sve k.

Neka je (f(j)) distribucija vjerojatnosti slučajnih varijabli (ista za sve j). Pretpostavili smo da = M() postoji, pa je zbroj

konačan. Onda postoji

pri čemu se zbrajanje vrši po svim onim j za koje. Imajte na umu da iako ovisi o n, isti je za

U 1 , U 2 , ..., U n . Štoviše, za i, prema tome, za proizvoljno > 0 i sve dovoljno velike n

U k su međusobno neovisni, a s njihovim zbrojem U 1 +U 2 +…+U n možete učiniti potpuno isto što i s X k u slučaju konačne varijance, primjenom Chebyshevljeve nejednakosti dobivamo slično (2.1)


Zbog (2.6) to implicira da

Budući da niz (2.4) konvergira, zadnji zbroj teži nuli kako n raste. Dakle, za dovoljno veliki n

i stoga

P(V 1 +...+V n 0). (2.12)

Ali, i iz (2.9) i (2.12) dobivamo

Budući da su i proizvoljni, desna strana se može učiniti proizvoljno malom, što dovršava dokaz.

Teorija "bezopasnih" igara

U daljnjoj analizi suštine zakona velikih brojeva koristit ćemo se tradicionalnom terminologijom igrača, iako naša razmatranja dopuštaju jednako ozbiljnije primjene, a naše dvije glavne pretpostavke stvarnije su u statistici i fizici nego u kockanju. Prvo, pretpostavimo da igrač ima neograničen kapital, tako da nikakav gubitak ne može dovesti do završetka igre. (Napuštanje ove pretpostavke dovodi do problema uništenja igrača, koji uvijek intrigira proučavatelje vjerojatnosti.) Drugo, pretpostavimo da igrač nema pravo prekinuti igru ​​po vlastitom nahođenju: broj n pokušaja mora biti fiksiran unaprijed i ne smije ovisiti o pokretnim igrama. Inače bi igrač, sretan s neograničenim kapitalom, čekao niz uspjeha i zaustavio bi igru ​​u pravom trenutku. Takvog igrača ne zanima vjerojatna fluktuacija u određenom trenutku, već maksimalne fluktuacije u dugom nizu igara, koje su više opisane zakonom ponovljenog logaritma nego zakonom velikih brojeva.

Uvodimo slučajnu varijablu k kao (pozitivnu ili negativnu) isplatu za k-tu iteraciju igre. Tada je zbroj S n = 1 +…+ k ukupni dobitak za n ponavljanja igre. Ako prije svakog ponavljanja igrač plati (ne nužno pozitivnu) naknadu za pravo sudjelovanja u igri, tada je n ukupna naknada koju je platio, a S n je n ukupni neto dobitak. Zakon velikih brojeva vrijedi ako postoji p=M(k). Grubo govoreći, za veliko n sasvim je vjerojatno da će se razlika S n -- činiti malom u usporedbi s n. Stoga, ako je manja od p, tada će za veliko n igrač vjerojatno imati isplatu reda veličine. Iz istih razloga doprinos gotovo sigurno rezultira gubitkom. Ukratko, prilika je dobra za igrača, a prilika je loša.

Imajte na umu da još nismo ništa rekli o slučaju. U ovom slučaju, jedini mogući zaključak je da će, za dovoljno velik, ukupni dobitak ili gubitak od S n -- n biti vrlo vjerojatno mali u usporedbi s n. Ali nije poznato je li S n -- n pozitivan ili negativan , tj. hoće li igra biti profitabilna ili propast. To nije uzela u obzir klasična teorija koja je bezopasnu cijenu nazivala i igru ​​s "bezopasnim". Morate shvatiti da "bezopasna" igra zapravo može biti jasno profitabilna i pogubna.

Jasno je da u "normalnom slučaju" ne postoji samo M(k), već i D(k). U ovom slučaju, zakon velikih brojeva nadopunjuje se teoremom o središnjoj granici, a potonji kaže, sasvim vjerojatno, da će u "bezopasnoj" igri neto dobitak kao rezultat duge igre S n -- n biti reda veličine n 1/2 i da će za dovoljno veliko n ova isplata biti pozitivna ili negativna s približno jednakim izgledima. Dakle, ako je središnji granični teorem primjenjiv, onda se termin "bezopasna" igra pokazuje opravdanim, iako se iu ovom slučaju radi o graničnom teoremu, što je naglašeno riječima "kao rezultat duge igre ." Pažljiva analiza pokazuje da se konvergencija u (1.3) pogoršava kako se varijanca povećava. Ako je velik, tada će normalna aproksimacija biti učinkovita samo za ekstremno velike n.

Definicije radi, zamislimo stroj u kojem, spuštanjem rublja, igrač može osvojiti (10 - 1) rublja s vjerojatnošću 10, au drugim slučajevima izgubi spuštenu rublju. Ovdje imamo Bernoullijeve oglede i igra je "bezopasna". Nakon što je napravio milijun testova, igrač će za to platiti milijun rubalja. Za to vrijeme može pobijediti 0, 1, 2,... puta. Prema Poissonovoj aproksimaciji za binomnu distribuciju, do nekoliko decimala, vjerojatnost dobitka točno k puta jednaka je e -1 /k!. Dakle, s vjerojatnošću od 0,368 . . . igrač će izgubiti milijun, a s istom vjerojatnošću samo će nadoknaditi svoje troškove; on ima vjerojatnost od 0,184... da dobije točno jedan milijun, itd. Ovdje je 10 6 pokušaja ekvivalentno jednom pokušaju u Poissonovoj igri isplate.

Očito je da je u takvim situacijama besmisleno primjenjivati ​​zakon velikih brojeva. Ova shema uključuje osiguranje od požara, prometnih nesreća, itd. Veliki iznos je u opasnosti, ali je odgovarajuća vjerojatnost vrlo mala. Međutim, obično postoji samo jedan pokus godišnje, tako da broj n pokusa nikada ne postane velik. Za osiguranike igra nije nužno "bezazlena", iako može biti ekonomski prilično isplativa. Zakon velikih brojeva nema nikakve veze s tim. Što se tiče osiguravajućeg društva, ono se bavi velikim brojem igara, ali zbog velike varijance ipak se pojavljuju slučajne fluktuacije. Premije osiguranja moraju biti postavljene tako da spriječe velike gubitke u pojedinim godinama, pa je tvrtka više zainteresirana za problem propasti nego za zakon velikih brojeva.

Kada je varijanca beskonačna, izraz "bezopasna" igra postaje besmislen; nema razloga vjerovati da ukupni neto dobitak S n -- n fluktuira oko nule. Stvarno. postoje primjeri "bezopasnih" igara u kojima vjerojatnost da će igrač pretrpjeti neto gubitak kao rezultat teži jedinici. Zakon velikih brojeva tvrdi samo da će taj gubitak biti manjeg reda veličine od n. Međutim, ne može se reći ništa više. Ako n tvori proizvoljan niz, a n / n0 tada možete organizirati "bezopasnu" igru ​​u kojoj vjerojatnost da ukupni neto gubitak kao rezultat n ponavljanja igre premaši a n teži jedinici.