biografieën Kenmerken Analyse

De wet van de grote getallen en limietstellingen. Wet van de grote getallen

Als het fenomeen duurzaamheid medium in werkelijkheid plaatsvindt, dan moet er in het wiskundige model waarmee we willekeurige verschijnselen bestuderen, een stelling zijn die dit feit weerspiegelt.
Onder de voorwaarden van deze stelling introduceren we beperkingen op willekeurige variabelen X 1 , X 2 , …, X n:

a) elke willekeurige variabele ik heeft wiskundige verwachting

M(ik) = a;

b) de variantie van elke willekeurige variabele is eindig, of we kunnen zeggen dat de varianties van bovenaf worden begrensd door hetzelfde getal, bijvoorbeeld VAN, d.w.z.

D(ik) < C, i = 1, 2, …, n;

c) willekeurige variabelen zijn paarsgewijs onafhankelijk, d.w.z. elke twee X i en Xj Bij i¹ j onafhankelijk.

dan natuurlijk

D(X 1 + X 2 + … + X n)=D(X 1) + D(X 2) + ... + D(X n).

Laten we de wet van de grote getallen formuleren in de vorm van Chebyshev.

Stelling van Chebyshev: met een onbeperkte toename van het aantal n onafhankelijke testen " het rekenkundig gemiddelde van de waargenomen waarden van een willekeurige variabele convergeert in waarschijnlijkheid naar zijn wiskundige verwachting ”, d.w.z. voor elke positieve ε

R(| een| < ε ) = 1. (4.1.1)

De betekenis van de uitdrukking "rekenkundig gemiddelde = convergeert in waarschijnlijkheid naar een" is dat de kans dat zal willekeurig weinig verschillen van a, benadert 1 oneindig als het getal n.

Een bewijs. Voor een eindig getal n onafhankelijke tests, passen we de ongelijkheid van Chebyshev toe voor een willekeurige variabele = :

R(|–M()| < ε ) ≥ 1 – . (4.1.2)

Rekening houdend met de beperkingen a - b, berekenen we M( ) en D( ):

M( ) = = = = = = a;

D( ) = = = = = = .

vervangen M( ) en D( ) in ongelijkheid (4.1.2), verkrijgen we

R(| een| < ε )≥1 .

Als we in ongelijkheid (4.1.2) een willekeurig kleine ε >0en n® ¥, dan krijgen we

= 1,

wat de stelling van Chebyshev bewijst.

Een belangrijke praktische conclusie volgt uit de overwogen stelling: we hebben het recht om de onbekende waarde van de wiskundige verwachting van een willekeurige variabele te vervangen door het rekenkundig gemiddelde verkregen uit een voldoende groot aantal experimenten. In dit geval geldt: hoe meer experimenten er moeten worden berekend, hoe waarschijnlijker (betrouwbaarder) het is dat de fout in verband met deze vervanging ( - a) zal de opgegeven waarde niet overschrijden ε .

Daarnaast kunnen andere praktische problemen worden opgelost. Bijvoorbeeld volgens de waarden van waarschijnlijkheid (betrouwbaarheid) R=R(| een|< ε ) en de maximaal toegestane fout ε bepaal het benodigde aantal experimenten n; Aan R en P definiëren ε; Aan ε en P de waarschijnlijkheid van een gebeurtenis bepalen | een |< ε.

speciaal geval. laat staan n proeven waargenomen n waarden van een willekeurige variabele x, wiskundige verwachting hebben M(X) en dispersie D(X). De verkregen waarden kunnen worden beschouwd als willekeurige variabelen X 1 ,X 2 ,X 3 , ... ,X n,. Het moet als volgt worden begrepen: een reeks van P tests worden herhaaldelijk uitgevoerd, met als resultaat: i de test, i= l, 2, 3, ..., P, in elke reeks tests zal een of andere waarde van een willekeurige variabele verschijnen X, vooraf niet bekend. Vervolgens, i-e waarde x ik willekeurige variabele verkregen in i De test verandert willekeurig als u van de ene reeks tests naar de andere gaat. Dus elke waarde x ik kan als willekeurig worden beschouwd X ik.


Ga ervan uit dat de testen aan de volgende eisen voldoen:

1. Tests zijn onafhankelijk. Dit betekent dat de resultaten X 1 , X 2 ,
X 3 , ..., X n tests zijn onafhankelijke willekeurige variabelen.

2. Tests worden uitgevoerd onder dezelfde omstandigheden - dit betekent, vanuit het oogpunt van waarschijnlijkheidstheorie, dat elk van de willekeurige variabelen X 1 ,X 2 ,X 3 , ... ,X n heeft dezelfde distributiewet als de oorspronkelijke waarde X, Dat is waarom M(X i) = M(X)en D(X i) = D(X), i = 1, 2, .... P.

Gezien de bovenstaande voorwaarden, krijgen we:

R(| een| < ε )≥1 . (4.1.3)

Voorbeeld 4.1.1. X is gelijk aan 4. Hoeveel onafhankelijke experimenten zijn er nodig zodat met een kans van minimaal 0,9 verwacht mag worden dat het rekenkundig gemiddelde van deze willekeurige variabele minder dan 0,5 zal afwijken van de wiskundige verwachting?

Oplossing.Volgens de toestand van het probleem ε = 0,5; R(| een|< 0,5) 0,9. Formule (4.1.3) toepassen voor de willekeurige variabele X, we krijgen

P(|–M(X)| < ε ) ≥ 1 .

Van de relatie

1 = 0,9

definiëren

P= = = 160.

Antwoorden: het is nodig om 160 onafhankelijke experimenten uit te voeren.

Ervan uitgaande dat het rekenkundig gemiddelde normaal verdeeld krijgen we:

R(| een|< ε )= 2Φ () 0,9.

Van waar, met behulp van de tabel van de Laplace-functie, krijgen we
1.645, of ≥ 6.58, d.w.z. n ≥49.

Voorbeeld 4.1.2. Variantie van een willekeurige variabele X is gelijk aan D( X) = 5. 100 onafhankelijke experimenten werden uitgevoerd, volgens welke . In plaats van de onbekende waarde van de wiskundige verwachting a geadopteerd . Bepaal de maximaal toegestane fout in dit geval met een kans van minimaal 0,8.

Oplossing. Volgens de taak n= 100, R(| een|< ε ) ≥0,8. We passen de formule (4.1.3) toe

R(| een|< ε ) ≥1 .

Van de relatie

1 = 0,8

definiëren ε :

ε 2 = = = 0,25.

Vervolgens, ε = 0,5.

Antwoorden: maximale foutwaarde ε = 0,5.

4.2. Wet van grote getallen in Bernoulli-vorm

Hoewel het concept van waarschijnlijkheid de basis is van elke statistische gevolgtrekking, kunnen we slechts in enkele gevallen de waarschijnlijkheid van een gebeurtenis direct bepalen. Soms kan deze waarschijnlijkheid worden vastgesteld op basis van overwegingen van symmetrie, gelijke kansen, enz., maar er is geen universele methode waarmee iemand de kans op een willekeurige gebeurtenis kan aangeven. De stelling van Bernoulli maakt het mogelijk om de waarschijnlijkheid te benaderen als voor de gebeurtenis die voor ons van belang is MAAR herhaalde onafhankelijke tests kunnen worden uitgevoerd. Laat geproduceerd P onafhankelijke tests, in elk waarvan de waarschijnlijkheid van optreden van een gebeurtenis MAAR constant en gelijk R.

Stelling van Bernoulli. Met een onbeperkte toename van het aantal onafhankelijke proeven P relatieve frequentie van optreden van de gebeurtenis MAAR convergeert in waarschijnlijkheid naar waarschijnlijkheid p optreden van een gebeurtenis MAAR,t. e.

P(½ - p½≤ ε) = 1, (4.2.1)

waar ε is een willekeurig klein positief getal.

voor de finale n mits , zal de Chebyshev-ongelijkheid voor een willekeurige variabele de vorm hebben:

P(| –p|< ε ) 1 .(4.2.2)

Een bewijs. We passen de stelling van Chebyshev toe. Laten X i– aantal keren dat de gebeurtenis voorkomt MAAR in i de test, i= 1, 2, . . . , n. Elk van de hoeveelheden: X i kan maar twee waarden aannemen:

X i= 1 (gebeurtenis MAAR gebeurde) met een waarschijnlijkheid p,

X i= 0 (gebeurtenis MAAR niet voorgekomen) met een waarschijnlijkheid q= 1-p.

Laten ja nee= . Som X 1 + X 2 + … + X n is gelijk aan het getal m gebeurtenis gebeurtenissen MAAR in n testen (0 m n), wat betekent ja nee= – relatieve frequentie van voorkomen van de gebeurtenis MAAR in n testen. Wiskundige verwachting en variantie X i zijn respectievelijk gelijk:

M( ) = 1∙p + 0∙q = p,

Waarschijnlijkheidstheorie bestudeert de regelmatigheden die inherent zijn aan massale willekeurige verschijnselen. Net als elke andere wetenschap is de waarschijnlijkheidstheorie ontworpen om het resultaat van een bepaald fenomeen of experiment zo nauwkeurig mogelijk te voorspellen. Als het fenomeen van een enkele aard is, kan de kanstheorie alleen de waarschijnlijkheid van de uitkomst in een zeer breed bereik voorspellen. Regelmaat treedt alleen op bij een groot aantal willekeurige verschijnselen die zich voordoen in homogene omstandigheden.

De groep stellingen die de overeenkomst vaststelt tussen de theoretische en experimentele kenmerken van willekeurige variabelen en toevallige gebeurtenissen met een groot aantal tests erop, evenals met betrekking tot de limietverdelingswetten, worden gecombineerd onder de algemene naam limietstellingen van kansrekening.

Er zijn twee soorten limietstellingen: de wet van de grote getallen en de centrale limietstelling.

Wet van de grote getallen, die een belangrijke plaats inneemt in de waarschijnlijkheidstheorie, is het verband tussen de waarschijnlijkheidstheorie als wiskundige wetenschap en de wetten van willekeurige verschijnselen tijdens massale waarnemingen ervan.

De wet speelt een zeer belangrijke rol in de praktische toepassingen van kansrekening op natuurlijke fenomenen en technische processen die verband houden met massaproductie.

Limietverdelingswetten zijn het onderwerp van een groep stellingen - een kwantitatieve vorm van de wet van grote getallen. Die. de wet van de grote getallen is een reeks stellingen, die elk het feit vaststellen dat de gemiddelde kenmerken van een groot aantal proeven bepaalde constanten benaderen, d.w.z. vaststellen van het feit van convergentie in waarschijnlijkheid van sommige willekeurige variabelen naar constanten. Dit zijn de stellingen van Bernoulli, Poisson, Lyapunov, Markov, Chebyshev.

1. a) Stelling van Bernoulli - de wet van grote getallen ( werd eerder geformuleerd en bewezen in sectie 3 van § 6 bij het beschouwen van de limietintegraalstelling van Moivre-Laplace.)

Bij een onbeperkte toename van het aantal homogene onafhankelijke experimenten zal de frequentie van een gebeurtenis willekeurig weinig verschillen van de waarschijnlijkheid van een gebeurtenis in een afzonderlijk experiment. Anders is de kans dat de afwijking in de relatieve frequentie van de gebeurtenis MAAR van een constante waarschijnlijkheid R ontwikkelingen MAAR heel weinig zoals neigt naar 1 voor elk: .

b) Stelling van Chebyshev.

Met een onbeperkte toename van het aantal onafhankelijke proeven, convergeert het rekenkundig gemiddelde van de waargenomen waarden van een willekeurige variabele met een eindige variantie in waarschijnlijkheid naar zijn wiskundige verwachting; anders, indien onafhankelijk identiek verdeelde willekeurige variabelen met wiskundige verwachting en beperkte variantie , dan is het voor elk waar: .

Stelling van Chebyshev (gegeneraliseerd). Als de willekeurige variabelen in de reeks paarsgewijs onafhankelijk zijn en hun varianties voldoen aan de voorwaarde , dan is voor elke positieve ε > 0 de bewering waar:


of wat is hetzelfde? .

c) De stelling van Markov. (de wet van de grote getallen in een algemene formulering)

Als de varianties van willekeurige willekeurige variabelen in de reeks voldoen aan de voorwaarde: , dan geldt voor elke positieve ε > 0 de verklaring van de stelling van Chebyshev: .

d) De stelling van Poisson.

Met een onbeperkte toename van het aantal onafhankelijke experimenten onder variabele omstandigheden, de frequentie van de gebeurtenis MAAR convergeert in waarschijnlijkheid naar het rekenkundig gemiddelde van zijn kansen onder deze tests.

Opmerking. In geen van de vormen van de wet van de grote getallen hebben we te maken met de wetten van de verdeling van willekeurige variabelen. De vraag met betrekking tot het vinden van de limietverdelingswet voor de som wanneer het aantal termen oneindig toeneemt, wordt beschouwd door de centrale limietstelling. identiek zijn verdeeld, komen we tot de Moivre-Laplace integraalstelling (§ 6 § 3), wat het eenvoudigste specifieke geval is van de centrale limietstelling.

Aan het begin van de cursus hebben we al gezegd dat de wiskundige wetten van de kanstheorie worden verkregen door het abstraheren van de werkelijke statistische regelmatigheden die inherent zijn aan massale willekeurige verschijnselen. De aanwezigheid van deze regelmatigheden hangt precies samen met het massakarakter van verschijnselen, dat wil zeggen met een groot aantal uitgevoerde homogene experimenten of met een groot aantal willekeurige invloeden die in hun totaliteit een willekeurige variabele genereren die onderworpen is aan een goed gedefinieerde wet. De stabiliteitseigenschap van massale willekeurige verschijnselen is al sinds de oudheid bekend bij de mensheid. Op welk gebied het zich ook manifesteert, de essentie ervan komt op het volgende neer: de specifieke kenmerken van elk afzonderlijk willekeurig fenomeen hebben bijna geen effect op het gemiddelde resultaat van de massa's en dergelijke verschijnselen; willekeurige afwijkingen van het gemiddelde, onvermijdelijk in elk afzonderlijk fenomeen, in de massa worden wederzijds tenietgedaan, genivelleerd, genivelleerd. Het is deze stabiliteit van gemiddelden die de fysieke inhoud is van de "wet van de grote getallen", opgevat in de brede zin van het woord: bij een zeer groot aantal willekeurige verschijnselen is hun gemiddelde resultaat praktisch niet meer willekeurig en kan worden voorspeld met een hoge mate van zekerheid.

In de enge zin van het woord wordt de "wet van de grote getallen" in de kanstheorie opgevat als een aantal wiskundige stellingen, in elk waarvan, onder bepaalde voorwaarden, het feit van benadering van de gemiddelde kenmerken van een groot aantal experimenten tot een aantal specifieke constanten wordt vastgesteld.

In 2.3 hebben we al de eenvoudigste van deze stellingen geformuleerd, de stelling van J. Bernoulli. Ze beweert dat met een groot aantal experimenten de frequentie van een gebeurtenis in de buurt komt van (meer precies, convergeert in waarschijnlijkheid) tot de waarschijnlijkheid van deze gebeurtenis. Andere, meer algemene vormen van de wet van de grote getallen zullen in dit hoofdstuk worden geïntroduceerd. Ze stellen allemaal het feit en de voorwaarden vast voor de convergentie in waarschijnlijkheid van bepaalde willekeurige variabelen naar constante, niet-willekeurige variabelen.

De wet van de grote getallen speelt een belangrijke rol in de praktische toepassingen van de kansrekening. De eigenschap van willekeurige variabelen om zich onder bepaalde omstandigheden praktisch als niet-willekeurige variabelen te gedragen, stelt ons in staat om vol vertrouwen met deze grootheden te werken, om de resultaten van massale willekeurige verschijnselen met bijna volledige zekerheid te voorspellen.

De mogelijkheden van dergelijke voorspellingen op het gebied van massa-toevalsverschijnselen worden verder uitgebreid door de aanwezigheid van een andere groep limietstellingen, die niet langer de grenswaarden van willekeurige variabelen betreffen, maar limietverdelingswetten. Dit is een groep stellingen die bekend staat als de "centrale limietstelling". We hebben al gezegd dat bij het optellen van een voldoende groot aantal willekeurige variabelen, de verdelingswet van de som voor onbepaalde tijd de normale benadert, mits aan bepaalde voorwaarden wordt voldaan. Deze voorwaarden, die wiskundig op verschillende manieren - in min of meer algemene vorm - wiskundig kunnen worden geformuleerd, komen in wezen neer op de eis dat de invloed op de som van afzonderlijke termen uniform klein moet zijn, d.w.z. dat de som geen termen mag bevatten die duidelijk prevaleren boven de set de rest door hun invloed op de spreiding van het bedrag. Verschillende vormen van de centrale limietstelling verschillen van elkaar in de voorwaarden waarvoor deze limieteigenschap van de som van willekeurige variabelen is vastgesteld.

Verschillende vormen van de wet van de grote getallen vormen samen met verschillende vormen van de centrale limietstelling een set van zogenaamde limietstellingen van de kansrekening. Limietstellingen maken het niet alleen mogelijk om wetenschappelijke voorspellingen te doen op het gebied van toevallige verschijnselen, maar ook om de nauwkeurigheid van deze voorspellingen te evalueren.

In dit hoofdstuk beschouwen we slechts enkele van de eenvoudigste vormen van limietstellingen. Eerst zullen stellingen met betrekking tot de groep "wet van de grote getallen" worden beschouwd, daarna - stellingen die verband houden met de groep "centrale limietstelling".

Het is heel natuurlijk om de bewering te kwantificeren dat in "grote" reeks tests de frequentie van optreden van een gebeurtenis "dichtbij" de waarschijnlijkheid ligt. De zekere delicatesse van deze taak moet duidelijk worden begrepen. In de meest typische gevallen voor de waarschijnlijkheidstheorie is de situatie zodanig dat in willekeurig lange reeksen tests beide extreme waarden van de frequentie theoretisch mogelijk blijven

\frac(\mu)(n)=\frac(n)(n)=1 en \frac(\mu)(n)=\frac(0)(n)=0

Daarom is het, ongeacht het aantal proeven n, onmogelijk om met volledige zekerheid te stellen dat, laten we zeggen, de ongelijkheid

<\frac{1}{10}

Als de gebeurtenis A bijvoorbeeld bestaat uit het werpen van een zes bij het werpen van een dobbelsteen, dan na n worpen met waarschijnlijkheid (\links(\frac(1)(6)\rechts)\^n>0 !} we zullen altijd alleen zessen krijgen, d.w.z. met waarschijnlijkheid (\links(\frac(1)(6)\rechts)\^n !} we krijgen de verschijningsfrequentie van zessen gelijk aan één, en met een waarschijnlijkheid (\links(1-\frac(1)(6)\rechts)\^n>0 !} de zes valt niet één keer uit, d.w.z. de frequentie van het verschijnen van zessen zal gelijk zijn aan nul.

Bij al dergelijke problemen werkt elke niet-triviale schatting van de nabijheid tussen frequentie en waarschijnlijkheid niet met volledige zekerheid, maar alleen met een waarschijnlijkheid kleiner dan één. Zo kan worden bewezen dat bij onafhankelijke proeven met een constante kans p op het optreden van een gebeurtenis, de ongelijkheid

\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02

voor frequentie \frac(\mu)(n) wordt uitgevoerd op n=10\,000 (en elke p ) met waarschijnlijkheid

P>0,\!9999.

Hier willen we allereerst benadrukken dat in de bovenstaande formulering de kwantitatieve schatting van de nabijheid van de frequentie \frac(\mu)(n) tot de kans p wordt geassocieerd met de introductie van een nieuwe kans P .

De werkelijke betekenis van schatting (8) is als volgt: als we N reeksen van n tests maken en het aantal M reeksen tellen waarin aan ongelijkheid (7) is voldaan, dan geldt voor een voldoende grote N ongeveer

\frac(M)(N)\ongeveer P>0,\!9999.

Maar als we relatie (9) willen verfijnen, zowel in termen van de mate van nabijheid \frac(M)(N) tot de kans P , als in termen van de betrouwbaarheid waarmee kan worden beargumenteerd dat een dergelijke nabijheid zal plaatsvinden, dan zullen we ons moeten wenden tot overwegingen die vergelijkbaar zijn met die we al hebben gedaan met de nabijheid van \frac(\mu)(n) en p . Desgewenst kan een dergelijke redenering een onbeperkt aantal keren worden herhaald, maar het is duidelijk dat dit ons niet in staat zal stellen ons volledig te bevrijden van de noodzaak om in het laatste stadium naar waarschijnlijkheden in de primitieve ruwe zin van dit woord te gaan.

Men moet niet denken dat dergelijke moeilijkheden een kenmerk van de waarschijnlijkheidstheorie zijn. Bij de wiskundige studie van reële verschijnselen schematiseren we ze altijd. Afwijkingen van het verloop van reële verschijnselen van het theoretische schema kunnen op hun beurt weer aan wiskundige studie worden onderworpen. Maar hiervoor moeten deze afwijkingen zelf in een bepaald schema worden geplaatst, en dit laatste moet al worden gebruikt zonder een formele wiskundige analyse van afwijkingen ervan.

Merk echter op dat bij de daadwerkelijke toepassing van de schatting

P\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}>0,\!9999.


voor een enkele reeks van n-toetsen vertrouwen we ook op enkele overwegingen van symmetrie: ongelijkheid (10) geeft aan dat voor een zeer groot aantal N reeksen aan relatie (7) zal worden voldaan in ten minste 99,99% van de gevallen; het is natuurlijk om met grote zekerheid te verwachten dat met name ongelijkheid (7) zal worden gerealiseerd in een bepaalde reeks van n proeven die ons interesseren, als we reden hebben om aan te nemen dat deze reeks een gewone, ongemarkeerde positie inneemt in een aantal van andere serie.

De kansen die meestal worden verwaarloosd in verschillende praktijkposities zijn verschillend. Hierboven is al opgemerkt dat ze bij ruwe berekeningen van het verbruik van schelpen, die de vervulling van de taak garanderen, tevreden zijn met het verbruik van schelpen, waarbij de taak wordt opgelost met een waarschijnlijkheid van 0,95, d.w.z. ze verwaarloos kansen die niet groter zijn dan 0,05. Dit wordt verklaard door het feit dat de overgang naar berekeningen die uitgaan van het verwaarlozen van bijvoorbeeld alleen kansen kleiner dan 0,01, zou leiden tot een grote toename van de consumptiesnelheid van projectielen, d.w.z. in bijna veel gevallen tot de conclusie dat het onmogelijk om de gestelde taak te voltooien in die korte tijd die daarvoor beschikbaar is, of met de daadwerkelijke levering van shells die kunnen worden gebruikt.

Soms, zelfs in wetenschappelijk onderzoek, zijn ze beperkt tot statistische methoden berekend op basis van verwaarlozing van kansen van 0,05. Maar dit moet alleen worden gedaan in gevallen waarin het verzamelen van uitgebreider materiaal erg moeilijk is. Beschouw het volgende probleem als een voorbeeld van dergelijke methoden. Laten we aannemen dat een veelgebruikt medicijn voor de behandeling van een ziekte onder bepaalde omstandigheden een positief resultaat geeft van 50%, dus met een kans van 0,5. Er wordt een nieuw medicijn voorgesteld en om de voordelen ervan ten opzichte van het oude te testen, is het de bedoeling om het in tien gevallen te gebruiken, onpartijdig gekozen uit patiënten in dezelfde positie als degenen voor wie het oude medicijn 50% effectief bleek te zijn. Tegelijkertijd staat vast dat het voordeel van een nieuw medicijn bewezen wordt geacht als het in minimaal acht op de tien gevallen een positief resultaat geeft. Het is gemakkelijk te berekenen dat een dergelijke beslissing gepaard gaat met het negeren van de kans op het krijgen van een verkeerde conclusie (d.w.z. de conclusie dat het voordeel van een nieuw geneesmiddel is bewezen, terwijl het gelijkwaardig of zelfs slechter is dan het oude) van alleen de orde van 0,05. Inderdaad, als in elk van de tien proeven de kans op een positieve uitkomst gelijk is aan p, dan zijn de kansen om respectievelijk 10,9 of 8 positieve uitkomsten te krijgen in tien proeven gelijk.

P_(10)=p^(10),\qquad P_9=10p^9(1-p),\qquad P_8=45p^8(1-p)^2.

Samengevat krijgen we voor het geval p=\frac(1)(2) P=P_(10)+P_9+P_8=\frac(56)(1024)\circa0,\!05.

Dus, aangenomen dat het nieuwe medicijn in feite precies gelijk is aan het oude, lopen we het risico ten onrechte te concluderen dat het nieuwe medicijn superieur is aan het oude met een waarschijnlijkheid van ongeveer 0,05. Om deze kans terug te brengen tot ongeveer 0,01, zonder het aantal onderzoeken n=10 te vergroten, zou men moeten vaststellen dat het voordeel van een nieuw geneesmiddel alleen als bewezen wordt beschouwd als het gebruik ervan in ten minste negen van de tien gevallen een positief resultaat oplevert. . Als deze eis te streng lijkt voor de voorstanders van het nieuwe medicijn, dan zal het aantal onderzoeken n beduidend groter dan 10 moeten worden gesteld. Als bijvoorbeeld bij n=100 wordt vastgesteld dat de voordelen van het nieuwe geneesmiddel wordt als bewezen beschouwd wanneer \mu>65 , dan is de foutkans slechts P\circa0,\!0015 .

Als de norm van 0,05 duidelijk onvoldoende is voor serieus wetenschappelijk onderzoek, dan wordt de kans op een fout van 0,001 of 0,003 grotendeels verwaarloosd, zelfs in academische en gedetailleerde studies als de verwerking van astronomische waarnemingen. Soms zijn wetenschappelijke conclusies gebaseerd op de toepassing van waarschijnlijkheidswetten echter ook veel betrouwbaarder (dat wil zeggen, ze zijn gebaseerd op de verwaarlozing van veel lagere kansen). Hierover wordt later meer verteld.

In de beschouwde voorbeelden hebben we herhaaldelijk speciale gevallen van de binominale formule (6) gebruikt

P_m=C_n^mp^m(1-p)^(n-m)

voor de kans P_m om precies m positieve uitkomsten te krijgen in n onafhankelijke proeven, waarbij een positieve uitkomst een kans p heeft. Laten we deze formule gebruiken om de vraag die aan het begin van deze sectie is gesteld over de waarschijnlijkheid te beschouwen:

<\varepsilon\right\},

waarbij \mu het werkelijke aantal positieve uitkomsten is. Het is duidelijk dat deze kans kan worden geschreven als de som van die P_m waarvoor m voldoet aan de ongelijkheid

\vline\,\frac(m)(n)-p\,\vline\,<\varepsilon,


dat wil zeggen, in de vorm

P=\sum_(m=m_1)^(m_2)P_m,

waarbij m_1 de kleinste is van m-waarden die voldoen aan ongelijkheid (12), en m_2 de grootste is van dergelijke m .

Formule (13) voor elke grote n is van weinig nut voor directe berekeningen. Daarom is de ontdekking door Moivre voor het geval p=\frac(1)(2) en door Laplace, voor elke p, van een asymptotische formule, waardoor het heel gemakkelijk is om het gedrag van de kansen P_m voor grote n te vinden en te bestuderen , was van groot belang. Deze formule ziet eruit als:

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\exp\!\left[-\frac((m-np)^2)(2np(1-p)) \Rechtsaf].

Als p niet te dicht bij nul of één ligt, dan is het al voldoende nauwkeurig voor n in de orde van 100. Als we

T=\frac(m-np)(\sqrt(np(1-p))),

Dan krijgt formule (14) de vorm

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\,e^(-t^2/2).


Uit (13) en (16) kunnen we een benadering afleiden van de kans (11)

P\sim\frac(1)(\sqrt(2\pi))\int\limits_(-T)^(T)e^(-t^2/2)\,dt=F(T),


waar

T=\varepsilon\sqrt(\frac(n)(p(1-p)))

Het verschil tussen de linker- en rechterdelen in (17) bij constant en verschillend van nul en eenheid neigt naar nul op n\tot\infty uniform ten opzichte van \varepsilon. Voor de functie F(T) zijn gedetailleerde tabellen samengesteld. Hier is een kort fragment van hen

\begin(array)(c|c|c|c|c)T&1&2&3&4\\\hline F&0,\!68269&0,\!95450&0,\!99730&0,\!99993\end(array)


Bij T\to\infty neigt de waarde van de functie F(T) naar één.

Laten we formule (17) gebruiken om de kans te schatten

P=\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}\approx F\!\left(\frac{2}{\sqrt{p(1-p)}}\right) Bij n=10\,000,~\varepsilon=0,\!02, omdat T=\frac(2)(\sqrt(p(1-p))).

Aangezien de functie F(T) monotoon toeneemt met toenemende T , moeten we voor een p-onafhankelijke schatting van P van onderaf de kleinst mogelijke (voor verschillende p ) waarde van T nemen. Deze kleinste waarde wordt verkregen met p=\frac(1)(2) , en is gelijk aan 4. Daarom is ongeveer

P\geqslant F(4)=0,\!99993.

Ongelijkheid (19) houdt geen rekening met de fout vanwege de benaderende aard van formule (17). Door de fout in te schatten die met deze omstandigheid gepaard gaat, kan men in ieder geval vaststellen dat P>0,\!9999 .

In verband met het weloverwogen voorbeeld van de toepassing van formule (17), moet worden opgemerkt dat de schattingen van de restterm van formule (17), gegeven in theoretische werken over kansrekening, lange tijd weinig bevredigend bleven. Daarom was de toepassing van formule (17) en soortgelijke formules op berekeningen voor niet erg grote n of voor kansen p die zeer dicht bij 0 of 1 liggen (en dergelijke kansen zijn in veel gevallen bijzonder belangrijk) vaak alleen gebaseerd op de ervaring van het controleren van dergelijke resultaten voor een beperkt aantal voorbeelden, in plaats van op goed vastgestelde schattingen van mogelijke fouten. Een meer gedetailleerde studie toonde bovendien aan dat in veel praktisch belangrijke gevallen de bovenstaande asymptotische formules niet alleen een schatting van de restterm nodig hebben, maar ook een verfijning (omdat zonder een dergelijke verfijning de restterm te groot is). In beide richtingen zijn de meest complete resultaten te danken aan S. N. Bernshtein.

Relaties (11), (17) en (18) kunnen worden herschreven als

\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,

Voor voldoende grote t is de rechterkant van formule (20), die geen n bevat, willekeurig dicht bij de eenheid, d.w.z. bij een waarschijnlijkheidswaarde die overeenkomt met volledige zekerheid. We zien dus dat in de regel zijn de afwijkingen van de frequentie \frac(\mu)(n) van de kans p van de orde \frac(1)(\sqrt(n)). Een dergelijke evenredigheid van de nauwkeurigheid van de actie van probabilistische regelmatigheden met de vierkantswortel van het aantal waarnemingen is ook typerend voor veel andere kwesties. Soms spreken ze zelfs, in volgorde van een enigszins vereenvoudigde popularisering, over de "wet van de vierkantswortel van n" als de basiswet van de kansrekening. Dit idee kreeg volledige duidelijkheid dankzij de introductie door de grote Russische wiskundige P.L. Chebyshev in het systematische gebruik van de methode om verschillende probabilistische problemen te herleiden tot berekeningen van "wiskundige verwachtingen" en "varianties" voor sommen en rekenkundige middelen van "willekeurige variabelen".

Willekeurige variabele is een grootheid die onder gegeven omstandigheden S met bepaalde waarschijnlijkheden verschillende waarden kan aannemen. Het volstaat voor ons om willekeurige variabelen te beschouwen die slechts een eindig aantal verschillende waarden kunnen aannemen. Om aan te geven hoe ze zeggen kansverdeling zo'n willekeurige variabele \xi is het voldoende om de mogelijke waarden aan te geven x_1,x_2,\ldots,x_r en kansen

P_r=\mathbf(P)\(\xi=x_r\).


Samengevat zijn deze kansen over alle verschillende mogelijke waarden \xi altijd gelijk aan één:

\sum_(r=1)^(s)P_r=1.

Een voorbeeld van een willekeurige variabele is het aantal positieve uitkomsten dat hierboven is bestudeerd in n onderzoeken.

wiskundige verwachting de waarde \xi heet de uitdrukking

M(\xi)=\sum_(r=1)^(s)P_rx_r,


a spreiding de grootheden \xi verwijzen naar het gemiddelde van de kwadratische afwijking \xi-M(\xi) , d.w.z. de uitdrukking

D(\xi)=\sum_(r=1)^(s)P_r(x_r-M(\xi))^2.


De vierkantswortel van de variantie

\sigma_(\xi)=\sqrt(D(\xi))=\sqrt(\sum_(r=1)^(s)P_r(x_r-M(\xi))^2)


genaamd standaardafwijking(waarden uit zijn wiskundige verwachting M(\xi) ).

De eenvoudigste toepassingen van varianties en standaarddeviaties zijn gebaseerd op de beroemde De ongelijkheid van Chebyshev

\mathbf(P)\(|\xi-M(\xi)|\leqslant t_(\sigma_(\xi))\)\geqslant1-\frac(1)(t^2),

Het laat zien dat afwijkingen van de willekeurige variabele \xi van zijn wiskundige verwachting M(\xi) , die veel groter zijn dan de standaarddeviatie \sigma_(\xi) , zeldzaam zijn.

Bij de vorming van sommen van willekeurige variabelen \xi=\xi^((1))+ \xi^((2))+\cdots+\xi^((n)) voor hun wiskundige verwachtingen geldt de gelijkheid altijd

M(\xi)=M(\xi^((1)))+M(\xi^((2)))+\cdots+M(\xi^((n))).


Vergelijkbare gelijkheid voor varianties

D(\xi)=D(\xi^((1)))+D(\xi^((2)))+\cdots+D(\xi^((n))).

alleen waar onder bepaalde beperkingen. Om gelijkheid (23) geldig te laten zijn, volstaat het bijvoorbeeld dat de grootheden \xi^((i)) en \xi^((j)) met verschillende getallen niet, zoals ze zeggen, "gecorreleerd" zijn met elk andere, d.w.z. dat op i\ne j

M\Bigl\((\xi^((i))-M(\xi^((i))))(\xi^((j))-M(\xi^((j))))\ Bigl\)=0

De correlatiecoëfficiënt tussen de willekeurige variabelen \xi^((i)) en \xi^((j)) is de uitdrukking

R=\frac(M\Bigl\(\Bigl(\xi^((i))-M(\xi^((i)))\Bigl)\Bigl(\xi^((j))-M( \xi^((j)))\Bigl)\Bigl\))(\sigma_(\xi^((i)))\,\sigma_(\xi^((j)))).

Als een \sigma_(\xi^((i)))>0 in \sigma_(\xi^((j)))>0, dan is voorwaarde (24) gelijk aan R=0 .

De correlatiecoëfficiënt R kenmerkt de mate van afhankelijkheid tussen willekeurige variabelen. Altijd |R|\leqslant1 , en R=\pm1 alleen als er een lineair verband is

\eta=a\xi+b\quad(a\ne0).

Voor onafhankelijke waarden R=0 .

In het bijzonder is aan gelijkheid (24) voldaan als de grootheden \xi^((i)) en \xi^((j)) onafhankelijk van elkaar zijn. Gelijkwaardigheid (23) is dus altijd van toepassing op onderling onafhankelijke termen. Voor rekenkundige gemiddelden

\zeta=\frac(1)(n)\Bigl(\xi^((1))+\xi^((2))+\cdots+\xi^((n))\Bigl) vanaf (23) volgt

D(\zeta_=\frac(1)(n^2)\Bigl(D(\xi^((1)))+ D(\xi^((2)))+\cdots+ D(\xi^( (n)))\Bigl).

Laten we nu aannemen dat voor alle termen de varianties niet groter zijn dan een constante

D(\xi^((i)))\leqslant C^2. Dan door (25) D(\zeta)\leqslant\frac(C^2)(n),


en vanwege de ongelijkheid van Chebyshev voor elke t

\mathbf(P)\!\left\(|\zeta-M(\zeta)|\leqslant\frac(tC)(\sqrt(n))\right\)\geqslant1-\frac(1)(t^ 2)

Ongelijkheid (26) bevat de zogenaamde wet van grote getallen in de vorm die is vastgesteld door Chebyshev: als de grootheden \xi^((i)) onderling onafhankelijk zijn en beperkte varianties hebben, dan zullen naarmate n toeneemt, hun rekenkundige gemiddelden \zeta , steeds minder merkbaar afwijken van hun wiskundige verwachtingen M(\zeta) .

Meer precies, ze zeggen dat reeks willekeurige variabelen

\xi^((1)),\,\xi^((2)),\,\ldots\,\xi^((n)),\,\ldots


gehoorzaamt aan de wet van de grote getallen als voor de bijbehorende rekenkundige gemiddelden \zeta en voor elke constante \varepsilon>0

\mathbf(P)\(|\zeta-M(\zeta)|\leqslant \varepsilon\)\to1\quad (n\to\infty).

Om de limietrelatie (27) uit ongelijkheid (26) te verkrijgen, volstaat het om te stellen

T=\varepsilon\cdot\frac(\sqrt(n))(C).

Een groot aantal onderzoeken van A.A. Markova, SN. Bernstein, A.Ya. Khinchin en anderen wijden aan de kwestie van de mogelijke verruiming van de voorwaarden voor de toepasselijkheid van de limietrelatie (27), d.w.z. de voorwaarden voor de toepasselijkheid van de wet van de grote getallen. Deze onderzoeken zijn van fundamenteel belang. Nog belangrijker is echter de exacte studie van de afwijkingskansverdeling \zeta-M(\zeta) .

De grote verdienste van de Russische klassieke school in de kansrekening is de vaststelling van het feit dat, onder zeer ruime omstandigheden, de gelijkheid

\mathbf(P)\!\left\(t_1\sigma_(\zeta)<\zeta-M(\zeta)

Chebyshev gaf een bijna volledig bewijs van deze formule voor het geval van onafhankelijke en begrensde termen. Markov vulde de ontbrekende schakel in de redenering van Chebyshev aan en breidde de voorwaarden voor de toepasbaarheid van formule (28) uit. Nog meer algemene voorwaarden werden gegeven door Lyapunov. De kwestie van het uitbreiden van formule (28) tot sommen van afhankelijke termen werd met bijzondere volledigheid bestudeerd door S.N. Bernshtein.

Formule (28) omvatte zo'n groot aantal specifieke problemen dat het lange tijd de centrale limietstelling van de kansrekening werd genoemd. Hoewel het met de laatste ontwikkeling van de waarschijnlijkheidstheorie bleek te zijn opgenomen in een aantal meer algemene wetten, kan het belang ervan zelfs vandaag de dag niet worden overschat.

Tijd.

Als de termen onafhankelijk zijn en hun varianties gelijk en gelijk zijn: D(\xi^((i)))=\sigma^2, dan is het handig om formule (28), rekening houdend met relatie (25), de vorm te geven

\mathbf(P)\!\left\(\frac(t_1\sigma)(\sqrt(n))<\zeta-M(\zeta)<\frac{t_2\sigma}{\sqrt{n}}\right\}\sim\frac{1}{\sqrt{2\pi}}\int\limits_{t_1}^{t_2}e^{-t^2/2}\,dt\,.

Laten we laten zien dat relatie (29) een oplossing bevat voor het probleem van afwijkingen van de frequentie \frac(\mu)(n) van de kans p , die we eerder hebben behandeld. Om dit te doen, introduceren we willekeurige variabelen \xi^((i)) die ze definiëren door de volgende voorwaarde:

\xi^((i))=0 als de i -de proef een negatief resultaat had,

\xi^((i))=1 als de i -de proef een positief resultaat had.

Het is dan gemakkelijk om dat te controleren


en formule (29) geeft

\mathbf(P)\!\left\(t_1\sqrt(\frac(p(1-p))(n))<\frac{\mu}{n}-p
wat voor t_1=-t,~t_2=t weer leidt tot formule (20).
Zie ook Limietstellingen in kansrekening Javascript is uitgeschakeld in uw browser.
ActiveX-besturingselementen moeten zijn ingeschakeld om berekeningen te kunnen maken!

Lemma Chebyshev. Als de willekeurige variabele X, waarvoor een wiskundige verwachting bestaat M[x], kan alleen niet-negatieve waarden aannemen, dan hebben we voor elk positief getal a de ongelijkheid

De ongelijkheid van Chebyshev. Als een X is een willekeurige variabele met wiskundige verwachting M[x] en verspreiding D[x], dan hebben we voor elke positieve e de ongelijkheid

. (2)

Stelling van Chebyshev.(wet van de grote getallen). Laten X 1 , X 2 , …, x nee,... - een reeks onafhankelijke willekeurige variabelen met dezelfde wiskundige verwachting m en varianties beperkt door dezelfde constante Met

. (3)

Het bewijs van de stelling is gebaseerd op de ongelijkheid

, (4)

als gevolg van de ongelijkheid van Chebyshev. Uit de stelling van Chebyshev, als een uitvloeisel, kan men afleiden:

Stelling van Bernoulli. Laat het geproduceerd worden n onafhankelijke experimenten, in elk met een waarschijnlijkheid R er kan een gebeurtenis plaatsvinden MAAR, laat het gaan v n is een willekeurige variabele gelijk aan het aantal keren dat de gebeurtenis voorkomt MAAR in deze n experimenten. Dan hebben we voor elke e > 0 de limietgelijkheid

. (5)

Merk op dat ongelijkheid (4) zoals toegepast op de voorwaarden van de stelling van Bernoulli geeft:

. (6)

De stelling van Chebyshev kan in een wat algemenere vorm worden geformuleerd:

Gegeneraliseerde stelling van Chebyshev. Laten x 1, x 2, …, x nee,... - reeks van onafhankelijke willekeurige variabelen met wiskundige verwachtingen M[x 1 ] = m 1 , M[x2] = m2 ,… en dispersies beperkt door dezelfde constante Met. Dan hebben we voor elk positief getal e de limietgelijkheid

. (7)

Laat x het aantal keren zijn van 6 punten in 3600 worpen met de dobbelsteen. dan M[ x] = 3600 = 600. Laten we nu ongelijkheid (1) gebruiken voor a = 900: .

We gebruiken ongelijkheid (6) voor n = 10000, p = , q = . Dan

Voorbeeld.

De kans op optreden van gebeurtenis A in elk van 1000 onafhankelijke experimenten is 0,8. Bereken de kans dat het aantal keren dat gebeurtenis A in deze 1000 experimenten voorkomt, met minder dan 50 afwijkt van de wiskundige verwachting in absolute waarde.

Laat x het aantal keren zijn dat gebeurtenis A in de gespecificeerde 1000 experimenten voorkomt. dan M[ x] = 1000 × 0,8 = 800 en D[ x] = 1000 × 0,8 × 0,2 = 160. Nu geeft ongelijkheid (2):


Voorbeeld.

De variantie van elk van 1000 onafhankelijke willekeurige variabelen x k (k = 1, 2,..., 1000) is 4. Schat de kans dat de afwijking van het rekenkundig gemiddelde van deze variabelen van het rekenkundig gemiddelde van hun wiskundige verwachtingen in absolute waarde zal niet hoger zijn dan 0,1.

Volgens ongelijkheid (4), voor c = 4 en e = 0,1, hebben we