Биографии Характеристики Анализ

Законът за големите числа и гранични теореми. Закон за големите числа

Ако явлението устойчивост среденсе случва в действителност, тогава в математическия модел, с който изучаваме случайни явления, трябва да има теорема, отразяваща този факт.
При условията на тази теорема въвеждаме ограничения върху случайните променливи х 1 , х 2 , …, X n:

а) всяка случайна променлива Х iима математическо очакване

М(Х i) = а;

б) дисперсията на всяка случайна променлива е крайна или можем да кажем, че дисперсиите са ограничени отгоре с едно и също число, напр. ОТ, т.е.

д(Х i) < C, i = 1, 2, …, н;

в) случайните променливи са независими по двойки, т.е. произволни две X iи Xjпри аз¹ йнезависима.

Тогава очевидно

д(х 1 + х 2 + … + X n)=д(х 1) + D(х 2) + ... + D(X n).

Нека формулираме закона за големите числа във формата на Чебишев.

Теорема на Чебишев:с неограничено увеличаване на броя ннезависими тестове" средноаритметичната стойност на наблюдаваните стойности на случайна променлива се сближава по вероятност с нейното математическо очакване ”, т.е. за всеки положителен ε

Р(| a| < ε ) = 1. (4.1.1)

Значението на израза "средно аритметично = се сближава по вероятност до " е, че вероятността, че ще се различава произволно малко от а, се доближава до 1 неограничено като число н.

Доказателство.За краен брой ннезависими тестове прилагаме неравенството на Чебишев за случайна променлива = :

Р(|–М()| < ε ) ≥ 1 – . (4.1.2)

Като вземем предвид ограниченията a - b, изчисляваме М( ) и д( ):

М( ) = = = = = = а;

д( ) = = = = = = .

Заместване М( ) и д( ) в неравенство (4.1.2), получаваме

Р(| a| < ε )≥1 .

Ако в неравенството (4.1.2) вземем произволно малък ε >0 и н® ¥, тогава получаваме

= 1,

което доказва теоремата на Чебишев.

От разгледаната теорема следва важен практически извод: ние имаме право да заменим неизвестната стойност на математическото очакване на случайна величина със средноаритметичната стойност, получена от достатъчно голям брой експерименти. В този случай колкото повече експерименти трябва да се изчислят, толкова по-вероятно (надеждно) може да се очаква грешката, свързана с тази замяна ( - а) няма да надвишава дадената стойност ε .

Освен това могат да бъдат решени и други практически проблеми. Например, според стойностите на вероятността (надеждността) Р=Р(| a|< ε ) и максимално допустимата грешка ε определя необходимия брой експерименти н; На Ри Пдефинирам ε; На ε и Попределяне на вероятността от събитие | a |< ε.

специален случай. Нека при ннаблюдавани опити нстойности на случайна променлива х,има математическо очакване М(х) и дисперсия д(х). Получените стойности могат да се разглеждат като случайни променливи х 1 ,х 2 ,х 3 , ... ,X n,. Трябва да се разбира, както следва: поредица от Птестовете се провеждат многократно, така че като резултат азти тест, аз= l, 2, 3, ..., П, във всяка серия от тестове ще се появи една или друга стойност на случайна променлива х, не е известно предварително. Следователно, аз-e стойност x iслучайна променлива, получена в аз th тест, се променя на случаен принцип, ако преминете от една серия тестове към друга. Така че всяка стойност x iможе да се счита за случаен X i .


Да приемем, че тестовете отговарят на следните изисквания:

1. Тестовете са независими. Това означава, че резултатите х 1 , х 2 ,
х 3 , ..., X nтестовете са независими случайни променливи.

2. Тестовете се провеждат при едни и същи условия - това означава, от гледна точка на теорията на вероятностите, че всяка от случайните променливи х 1 ,х 2 ,х 3 , ... ,X nима същия закон на разпределение като първоначалната стойност х, Ето защо М(X i) = М(хд(X i) = д(х), аз = 1, 2, .... П.

Имайки предвид горните условия, получаваме

Р(| a| < ε )≥1 . (4.1.3)

Пример 4.1.1. хе равно на 4. Колко независими експеримента са необходими, за да може с вероятност най-малко 0,9 да се очаква, че средноаритметичното на тази случайна променлива ще се различава от математическото очакване с по-малко от 0,5?

Решение.Според условието на проблема ε = 0,5; Р(| a|< 0,5) 0,9. Прилагане на формула (4.1.3) за случайната величина х, получаваме

П(|–М(х)| < ε ) ≥ 1 .

От връзката

1 = 0,9

дефинирам

П= = = 160.

Отговор: необходимо е да се направят 160 независими експеримента.

Ако приемем, че средната аритметична нормално разпределени, получаваме:

Р(| a|< ε )= 2Φ () 0,9.

Откъде, използвайки таблицата на функцията на Лаплас, получаваме
1,645, или ≥ 6,58 т.е. н ≥49.

Пример 4.1.2.Дисперсия на случайна променлива хе равно на D( х) = 5. Проведени са 100 независими експеримента, според които . Вместо неизвестната стойност на математическото очакване априет . Определете максималната допустима грешка в този случай с вероятност най-малко 0,8.

Решение.Според задачата н= 100, Р(| a|< ε ) ≥0,8. Прилагаме формулата (4.1.3)

Р(| a|< ε ) ≥1 .

От връзката

1 = 0,8

дефинирам ε :

ε 2 = = = 0,25.

Следователно, ε = 0,5.

Отговор: максимална стойност на грешката ε = 0,5.

4.2. Закон за големите числа във формата на Бернули

Въпреки че понятието за вероятност е в основата на всяко статистическо заключение, ние можем само в няколко случая да определим директно вероятността за събитие. Понякога тази вероятност може да се установи от съображения за симетрия, равни възможности и т.н., но няма универсален метод, който би позволил да се посочи нейната вероятност за произволно събитие. Теоремата на Бернули дава възможност да се определи приблизително вероятността, ако за събитието, което ни интересува НОмогат да се извършват повторни независими тестове. Нека произведени Пнезависими тестове, във всеки от които вероятността за настъпване на някакво събитие НОпостоянен и равен Р.

Теорема на Бернули.С неограничено увеличение на броя на независимите изпитания Потносителна честота на възникване на събитието НОсе сближава от вероятност към вероятност стрнастъпване на събитие НО,T. д.

П(½ - стр½≤ ε) = 1, (4.2.1)

където ε е произволно малко положително число.

За финал нпри условие че , неравенството на Чебишев за случайна променлива ще има формата:

П(| –p|< ε ) 1 .(4.2.2)

Доказателство.Прилагаме теоремата на Чебишев. Позволявам X i– брой появявания на събитието НОв азти тест, аз= 1, 2, . . . , н. Всяко от количествата X iможе да приема само две стойности:

X i= 1 (събитие НОслучи) с вероятност стр,

X i= 0 (събитие НОне се случи) с вероятност р= 1–стр.

Позволявам Y n= . Сума х 1 + х 2 + … + X nе равно на числото мсъбития НОв нтестове (0 м н), което означава Y n= – относителна честота на възникване на събитието НОв нтестове. Математическо очакване и дисперсия X iса равни съответно:

М( ) = 1∙стр + 0∙р = стр,

Теорията на вероятностите изучава закономерностите, присъщи на масовите случайни явления. Както всяка друга наука, теорията на вероятностите е предназначена да предскаже възможно най-точно резултата от определено явление или експеримент. Ако явлението е от едно естество, тогава теорията на вероятността е в състояние да предскаже само вероятността от резултата в много широк диапазон. Закономерностите се появяват само при голям брой случайни явления, протичащи в хомогенни условия.

Групата от теореми, установяващи съответствието между теоретичните и експерименталните характеристики на случайни променливи и случайни събития с голям брой тестове върху тях, както и относно законите за пределно разпределение, са обединени под общо наименование гранични теореми на теорията на вероятностите.

Има два вида гранични теореми: законът за големите числа и централната гранична теорема.

Закон за големите числа, който заема важно място в теорията на вероятностите, е връзката между теорията на вероятностите като математическа наука и законите на случайните явления при масовите им наблюдения.

Законът играе много важна роля в практическите приложения на теорията на вероятностите за природни явления и технически процеси, свързани с масовото производство.

Законите за пределно разпределение са предмет на група теореми - количествена форма на закона за големите числа. Тези. законът за големите числа е поредица от теореми, всяка от които установява факта, че средните характеристики на голям брой опити се доближават до определени константи, т.е. установи факта на сходимост на вероятността на някои случайни променливи към константи. Това са теоремите на Бернули, Поасон, Ляпунов, Марков, Чебишев.

1. а) Теорема на Бернули - законът за големите числа (е формулирана и доказана по-рано в раздел 3 на § 6 при разглеждане на пределната интегрална теорема на Моавр-Лаплас.)

При неограничено увеличаване на броя на хомогенните независими експерименти, честотата на дадено събитие ще се различава произволно малко от вероятността за събитие в отделен експеримент. В противен случай, вероятността, че отклонението в относителната честота на събитието НОот постоянна вероятност Рразработки НОмного малко като клони към 1 за всяко: .

б) теорема на Чебишев.

При неограничено увеличаване на броя на независимите опити, средноаритметичната стойност на наблюдаваните стойности на случайна променлива с крайна вариация се сближава по вероятност с нейното математическо очакване; в противен случай, ако независими идентично разпределени случайни променливи с математическо очакване и ограничена вариация , тогава за всеки е вярно: .

Теорема на Чебишев (обобщена).Ако случайните променливи в последователността са по двойки независими и техните дисперсии удовлетворяват условието , тогава за всяко положително ε > 0 твърдението е вярно:


или какво е същото .

в) теорема на Марков. (законът за големите числа в обща формулировка)

Ако дисперсиите на произволни случайни променливи в последователността отговарят на условието: , тогава за всяко положително ε > 0 твърдението на теоремата на Чебишев е валидно: .

г) теорема на Поасон.

С неограничено увеличаване на броя на независимите експерименти при променливи условия, честотата на събитието НОсе свежда по вероятност до средноаритметичната стойност на своите вероятности при тези тестове.

Коментирайте.В нито една от формите на закона за големите числа не се занимаваме със законите за разпределение на случайни променливи. Въпросът, свързан с намирането на пределния закон за разпределение на сумата, когато броят на членовете нараства неограничено, се разглежда от централната гранична теорема. са еднакво разпределени, тогава стигаме до интегралната теорема на Moivre-Laplace (раздел 3 от § 6), която е най-простият частен случай на централната гранична теорема.

В началото на курса вече казахме, че математическите закони на теорията на вероятностите се получават чрез абстрахиране на реалните статистически закономерности, присъщи на масовите случайни явления. Наличието на тези закономерности се свързва именно с масовия характер на явленията, тоест с голям брой проведени хомогенни експерименти или с голям брой случайни ефекти, които генерират в своята съвкупност случайна величина, подчинена на точно определен закон. Свойството за стабилност на масовите случайни явления е известно на човечеството от древни времена. В каквато и област да се проявява, същността му се свежда до следното: специфичните особености на всяко отделно случайно явление почти не влияят върху средния резултат на масите и такива явления; случайните отклонения от средното, неизбежни във всяко отделно явление, в масата взаимно се компенсират, изравняват, изравняват. Именно тази стабилност на средните стойности е физическото съдържание на "закона за големите числа", разбиран в широкия смисъл на думата: при много голям брой случайни явления техният среден резултат практически престава да бъде случаен и може да бъде предвиден с висока степен на сигурност.

В тесния смисъл на думата „законът за големите числа“ в теорията на вероятностите се разбира като редица математически теореми, във всяка от които при определени условия фактът на сближаване на средните характеристики на голям брой експерименти до някои специфични константи се установява.

В 2.3 вече сме формулирали най-простата от тези теореми, теоремата на Дж. Бернули. Тя твърди, че при голям брой експерименти честотата на дадено събитие се доближава (по-точно се сближава по вероятност) с вероятността за това събитие. Други, по-общи форми на закона за големите числа ще бъдат въведени в тази глава. Всички те установяват факта и условията за сходимостта по вероятност на определени случайни величини към постоянни, неслучайни величини.

Законът за големите числа играе важна роля в практическите приложения на теорията на вероятностите. Свойството на случайните величини при определени условия да се държат практически като неслучайни ни позволява уверено да оперираме с тези величини, да прогнозираме резултатите от масови случайни явления с почти пълна сигурност.

Възможностите на такива прогнози в областта на масовите случайни явления се разширяват допълнително от наличието на друга група гранични теореми, които вече не засягат граничните стойности на случайни променливи, а граничните закони за разпределение. Това е група от теореми, известни като "теорема за централната граница". Вече казахме, че при сумиране на достатъчно голям брой случайни променливи, законът на разпределение на сумата се приближава неограничено до нормалния, ако са изпълнени определени условия. Тези условия, които могат да бъдат формулирани математически по различни начини - в повече или по-малко обща форма - по същество се свеждат до изискването влиянието върху сумата на отделните членове да бъде равномерно малко, т.е. сумата да не включва членове, които ясно преобладават над множеството останали чрез влиянието си върху дисперсията на количеството. Различните форми на централната гранична теорема се различават една от друга в условията, за които е установено това гранично свойство на сумата от случайни променливи.

Различни форми на закона за големите числа, заедно с различни форми на централната гранична теорема, образуват набор от така наречените гранични теореми на теорията на вероятностите. Граничните теореми позволяват не само да се правят научни прогнози в областта на случайните явления, но и да се оцени точността на тези прогнози.

В тази глава разглеждаме само някои от най-простите форми на гранични теореми. Първо ще бъдат разгледани теореми, свързани с групата "закон за големите числа", след това - теореми, свързани с групата "централна пределна теорема".

Съвсем естествено е да се наложи количествено да се изрази твърдението, че в "големи" серии от тестове честотата на възникване на дадено събитие е "близка" до неговата вероятност. Определената деликатност на тази задача трябва да бъде ясно разбрана. В най-типичните случаи за теорията на вероятността ситуацията е такава, че при произволно дълги серии от тестове и двете екстремни стойности на честотата остават теоретично възможни

\frac(\mu)(n)=\frac(n)(n)=1и \frac(\mu)(n)=\frac(0)(n)=0

Следователно, какъвто и да е броят на опитите n, е невъзможно да се твърди с пълна сигурност, че, да речем, неравенството

<\frac{1}{10}

Например, ако събитието A се състои в хвърляне на шестица при хвърляне на зар, тогава след n хвърляния с вероятност (\ляво(\frac(1)(6)\дясно)\^n>0 !}винаги ще получаваме само шестици, т.е. с вероятност (\ляво(\frac(1)(6)\дясно)\^n !}получаваме честотата на поява на шестици, равна на единица, и с вероятност (\ляво(1-\frac(1)(6)\дясно)\^n>0 !}шестицата не изпада нито веднъж, т.е. честотата на появата на шестици ще бъде равна на нула.

Във всички подобни проблеми всяка нетривиална оценка на близостта между честота и вероятност не работи с пълна сигурност, а само с известна вероятност, по-малка от единица. Може да се докаже например, че в случай на независими опити с постоянна вероятност p за настъпване на събитие, неравенството

\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02

за честота \frac(\mu)(n) ще се изпълни при n=10\,000 (и всяко p ) с вероятност

P>0,\!9999.

Тук на първо място искаме да подчертаем, че в горната формулировка количествената оценка на близостта на честотата \frac(\mu)(n) до вероятността p е свързана с въвеждането на нова вероятност P .

Истинското значение на оценката (8) е следното: ако направим N серии от n теста и преброим броя M серии, в които неравенството (7) е изпълнено, тогава за достатъчно голямо N, приблизително

\frac(M)(N)\приблизително P>0,\!9999.

Но ако искаме да прецизираме връзката (9) както по отношение на степента на близост \frac(M)(N) с вероятността P , така и по отношение на надеждността, с която може да се твърди, че такава близост ще се осъществи, тогава ще трябва да се обърнем към съображения, подобни на тези, които вече направихме с близостта на \frac(\mu)(n) и p. При желание подобни разсъждения могат да се повтарят неограничен брой пъти, но е съвсем ясно, че това няма да ни позволи напълно да се освободим от необходимостта да се обърнем на последния етап към вероятностите в примитивния груб смисъл на този термин.

Не трябва да се мисли, че подобни трудности са част от теорията на вероятностите. При математическото изследване на реални явления ние винаги ги схематизираме. Отклоненията на хода на реалните явления от теоретичната схема могат от своя страна да бъдат подложени на математическо изследване. Но за това самите тези отклонения трябва да бъдат поставени в определена схема и тази последна трябва да се използва вече без формален математически анализ на отклоненията от нея.

Имайте предвид обаче, че при реалното прилагане на оценката

P\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}>0,\!9999.


за единична серия от n тестове, ние също разчитаме на някои съображения за симетрия: неравенство (10) показва, че за много голям брой N серии, връзката (7) ще бъде изпълнена в най-малко 99,99% от случаите; естествено е да очакваме с голяма сигурност, че по-специално неравенството (7) ще се реализира в определена серия от n интересни за нас опити, ако имаме основание да смятаме, че тази серия заема обикновена, немаркирана позиция в число от други серии.

Вероятностите, които обикновено се пренебрегват в различни практически позиции, са различни. Вече беше отбелязано по-горе, че при предварителни изчисления на потреблението на черупки, което гарантира изпълнението на задачата, те са доволни от скоростта на потребление на черупки, при която задачата се решава с вероятност от 0,95, т.е. пренебрегнете вероятностите, които не надвишават 0,05. Това се обяснява с факта, че преходът към изчисления, въз основа на пренебрегване, да речем, само на вероятности, по-малки от 0,01, би довел до голямо увеличение на скоростите на потребление на снаряди, т.е. в почти много случаи до заключението, че е невъзможно е да се изпълни поставената задача за този кратък период от време, който е наличен за това, или с действителното количество снаряди, които могат да бъдат използвани.

Понякога, дори в научните изследвания, те са ограничени до статистически методи, изчислени на базата на пренебрегване на вероятности от 0,05. Но това трябва да се прави само в случаите, когато събирането на по-обширен материал е много трудно. Разгледайте следния проблем като пример за такива методи. Да приемем, че при определени условия едно широко използвано лекарство за лечение на дадено заболяване дава положителен резултат в 50%, т.е. с вероятност 0,5. Предлага се ново лекарство и за да се тестват предимствата му пред старото, се планира да се използва в десет случая, избрани безпристрастно измежду пациенти в същата позиция като тези, за които старото лекарство е било установено, че е 50% ефективно. В същото време се установява, че предимството на ново лекарство ще се счита за доказано, ако даде положителен резултат в най-малко осем случая от десет. Лесно е да се изчисли, че подобно решение е свързано с пренебрегване на вероятността да се получи погрешно заключение (т.е. заключение, че ползата от ново лекарство е доказана, докато то е еквивалентно или дори по-лошо от старото) само на от порядъка на 0,05. Наистина, ако във всяко от десетте опита вероятността за положителен резултат е равна на p, тогава вероятностите за получаване на 10,9 или 8 положителни резултата в десет опита са съответно равни

P_(10)=p^(10),\qquad P_9=10p^9(1-p),\qquad P_8=45p^8(1-p)^2.

В обобщение, за случая p=\frac(1)(2) получаваме P=P_(10)+P_9+P_8=\frac(56)(1024)\приблизително 0,\!05.

По този начин, ако приемем, че новото лекарство всъщност е точно еквивалентно на старото, рискуваме погрешно да заключим, че новото лекарство е по-добро от старото с вероятност от около 0,05. За да се намали тази вероятност до около 0,01, без да се увеличава броят на опитите n=10, трябва да се установи, че ползата от ново лекарство ще се счита за доказана само ако употребата му даде положителен резултат в поне девет от десет случая . Ако това изискване изглежда твърде сурово за привържениците на новото лекарство, тогава броят на опитите n ще трябва да бъде значително по-голям от 10. Ако например при n=100 се установи, че ползите от новото лекарство лекарството ще се счита за доказано, когато \mu>65 , тогава вероятността за грешка ще бъде само P\approx0,\!0015 .

Ако нормата от 0,05 е явно недостатъчна за сериозни научни изследвания, тогава вероятността за грешка от 0,001 или 0,003 в по-голямата си част се пренебрегва дори в такива академични и подробни изследвания като обработката на астрономически наблюдения. Понякога обаче научните заключения, основани на прилагането на вероятностни закони, също имат много по-голяма надеждност (т.е. те са изградени върху пренебрегването на много по-ниски вероятности). Повече за това ще бъде казано по-късно.

В разглежданите примери многократно сме използвали специални случаи на биномната формула (6)

P_m=C_n^mp^m(1-p)^(n-m)

за вероятността P_m да получи точно m положителни резултата в n независими опити, във всяко от които положителен резултат има вероятност p. Нека използваме тази формула, за да разгледаме въпроса, зададен в началото на този раздел за вероятността

<\varepsilon\right\},

където \mu е действителният брой положителни резултати. Очевидно тази вероятност може да бъде записана като сбор от тези P_m, за които m удовлетворява неравенството

\vline\,\frac(m)(n)-p\,\vline\,<\varepsilon,


тоест във формата

P=\sum_(m=m_1)^(m_2)P_m,

където m_1 е най-малката от m стойности, удовлетворяващи неравенство (12), а m_2 е най-голямата от такива m.

Формула (13) за всяко голямо n е малко полезна за директни изчисления. Следователно откритието от Moivre за случая p=\frac(1)(2) и от Laplace, за всяко p, на асимптотична формула, което прави много лесно намирането и изследването на поведението на вероятностите P_m за големи n , беше от голямо значение. Тази формула изглежда така

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\exp\!\left[-\frac((m-np)^2)(2np(1-p)) \вдясно].

Ако p не е твърде близо до нула или единица, то вече е достатъчно точно за n от порядъка на 100. Ако поставим

T=\frac(m-np)(\sqrt(np(1-p))),

Тогава формула (14) ще приеме формата

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\,e^(-t^2/2).


От (13) и (16) можем да извлечем приблизително представяне на вероятността (11)

P\sim\frac(1)(\sqrt(2\pi))\int\limits_(-T)^(T)e^(-t^2/2)\,dt=F(T),


където

T=\varepsilon\sqrt(\frac(n)(p(1-p)))

Разликата между лявата и дясната част в (17) при константа и различна от нула и единица клони към нула при n\to\infty равномерно по отношение на \varepsilon. За функцията F(T) са съставени подробни таблици. Ето кратък откъс от тях

\begin(масив)(c|c|c|c|c)T&1&2&3&4\\\hline F&0,\!68269&0,\!95450&0,\!99730&0,\!99993\край (масив)


При T\to\infty стойността на функцията F(T) клони към единица.

Нека използваме формула (17), за да оценим вероятността

P=\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}\approx F\!\left(\frac{2}{\sqrt{p(1-p)}}\right) при n=10\,000,~\varepsilon=0,\!02, защото T=\frac(2)(\sqrt(p(1-p))).

Тъй като функцията F(T) монотонно нараства с увеличаване на T, за p-независима оценка на P отдолу, трябва да се вземе най-малката възможна (за различно p) стойност на T. Тази най-малка стойност ще бъде получена с p=\frac(1)(2) и ще бъде равна на 4. Следователно приблизително

P\geqslant F(4)=0,\!99993.

Неравенството (19) не отчита грешката поради приблизителния характер на формула (17). Чрез оценяване на грешката, свързана с това обстоятелство, във всеки случай може да се установи, че P>0,\!9999.

Във връзка с разглеждания пример за прилагане на формула (17) трябва да се отбележи, че оценките на остатъчния член на формула (17), дадени в теоретичните трудове по теория на вероятностите, остават малко задоволителни за дълго време. Следователно прилагането на формула (17) и подобни формули за изчисления за не много голямо n или за вероятности p, които са много близки до 0 или 1 (и такива вероятности в много случаи са особено важни) често се основава само на опита на проверка на такива резултати за ограничен брой примери, а не върху добре установени оценки за възможна грешка. Освен това по-подробно изследване показа, че в много практически важни случаи горните асимптотични формули се нуждаят не само от оценка на остатъчния член, но и от уточнение (тъй като без такова уточнение остатъчният член е твърде голям). И в двете посоки най-пълните резултати се дължат на S. N. Bernshtein.

Релациите (11), (17) и (18) могат да бъдат пренаписани като

\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,

За достатъчно голямо t дясната страна на формула (20), която не съдържа n, е произволно близка до единица, т.е. до стойност на вероятността, която съответства на пълна сигурност. Виждаме, следователно, че като правило, отклоненията на честотата \frac(\mu)(n) от вероятността p са от порядъка \frac(1)(\sqrt(n)). Такава пропорционалност на точността на действието на вероятностните закономерности спрямо корен квадратен от броя на наблюденията е характерна и за много други въпроси. Понякога те дори говорят, с цел донякъде опростена популяризация, за "закона за квадратния корен от n" като основен закон на теорията на вероятностите. Тази идея придоби пълна яснота благодарение на въвеждането от великия руски математик П. Л. Чебишев в систематичното използване на метода за редуциране на различни вероятностни проблеми до изчисления на „математически очаквания“ и „дисперсии“ ​​за суми и средни аритметични стойности на „случайни променливи“.

Случайна величинае количество, което при дадени условия S може да приема различни стойности с определени вероятности. За нас е достатъчно да разгледаме случайни променливи, които могат да приемат само краен брой различни стойности. Да се ​​посочи как казват разпределение на вероятноститетакава случайна променлива \xi , достатъчно е да посочите нейните възможни стойности x_1,x_2,\lточки,x_rи вероятности

P_r=\mathbf(P)\(\xi=x_r\).


Обобщено, тези вероятности за всички различни възможни стойности \xi винаги са равни на едно:

\sum_(r=1)^(s)P_r=1.

Пример за случайна променлива е броят \mu положителни резултати, изследвани по-горе в n проучвания.

математическо очакванестойността \xi се нарича израз

M(\xi)=\sum_(r=1)^(s)P_rx_r,


а дисперсияколичествата \xi се отнасят до средната стойност на квадратното отклонение \xi-M(\xi) , т.е. изразът

D(\xi)=\sum_(r=1)^(s)P_r(x_r-M(\xi))^2.


Корен квадратен от дисперсията

\sigma_(\xi)=\sqrt(D(\xi))=\sqrt(\sum_(r=1)^(s)P_r(x_r-M(\xi))^2)


Наречен стандартно отклонение(стойности от неговото математическо очакване M(\xi) ).

Най-простите приложения на дисперсии и стандартни отклонения се основават на известните Неравенството на Чебишев

\mathbf(P)\(|\xi-M(\xi)|\leqslant t_(\sigma_(\xi))\)\geqslant1-\frac(1)(t^2),

Това показва, че отклоненията на случайната променлива \xi от нейното математическо очакване M(\xi) , които значително надвишават стандартното отклонение \sigma_(\xi) , са редки.

При образуването на суми от случайни величини \xi=\xi^((1))+ \xi^((2))+\cdots+\xi^((n))за техните математически очаквания равенството винаги е в сила

M(\xi)=M(\xi^((1)))+M(\xi^((2)))+\cdots+M(\xi^((n))).


Подобно равенство за дисперсии

D(\xi)=D(\xi^((1)))+D(\xi^((2)))+\cdots+D(\xi^((n))).

вярно само при определени ограничения. За да бъде валидно равенството (23), достатъчно е например величините \xi^((i)) и \xi^((j)) с различни числа да не са, както се казва, "корелирани" с един друг, т.е. че при i\ne j

M\Bigl\((\xi^((i))-M(\xi^((i))))(\xi^((j))-M(\xi^((j))))\ Bigl\)=0

Коефициентът на корелация между случайните променливи \xi^((i)) и \xi^((j)) е изразът

R=\frac(M\Bigl\(\Bigl(\xi^((i))-M(\xi^((i)))\Bigl)\Bigl(\xi^((j))-M( \xi^((j)))\Bigl)\Bigl\))(\sigma_(\xi^((i)))\,\sigma_(\xi^((j)))).

Ако \sigma_(\xi^((i)))>0в \sigma_(\xi^((j)))>0, тогава условие (24) е еквивалентно на R=0 .

Коефициентът на корелация R характеризира степента на зависимост между случайните величини. Винаги |R|\leqslant1 и R=\pm1 само ако има линейна връзка

\eta=a\xi+b\quad(a\ne0).

За независими стойности R=0.

По-специално, равенство (24) е изпълнено, ако величините \xi^((i)) и \xi^((j)) са независими едно от друго. Следователно равенството (23) винаги се прилага за взаимно независими членове. За средни аритметични

\zeta=\frac(1)(n)\Bigl(\xi^((1))+\xi^((2))+\cdots+\xi^((n))\Bigl)от (23) следва

D(\zeta_=\frac(1)(n^2)\Bigl(D(\xi^((1)))+ D(\xi^((2)))+\cdots+ D(\xi^( (n)))\Bigl).

Нека сега приемем, че за всички членове дисперсиите не превишават някаква константа

D(\xi^((i)))\leqslant C^2.След това чрез (25) D(\zeta)\leqslant\frac(C^2)(n),


и поради неравенството на Чебишев за всяко t

\mathbf(P)\!\left\(|\zeta-M(\zeta)|\leqslant\frac(tC)(\sqrt(n))\right\)\geqslant1-\frac(1)(t^ 2)

Неравенство (26) съдържа така наречения закон на големите числа във формата, установена от Чебишев: ако количествата \xi^((i)) са взаимно независими и имат ограничени дисперсии, тогава с нарастването на n техните средни аритметични \zeta , все по-малко забележимо се отклоняват от своите математически очаквания M(\zeta) .

По-точно така казват последователност от случайни променливи

\xi^((1)),\,\xi^((2)),\,\ldots\,\xi^((n)),\,\ldots


се подчинява на закона за големите числа, ако за съответните средни аритметични \zeta и за всяка константа \varepsilon>0

\mathbf(P)\(|\zeta-M(\zeta)|\leqslant \varepsilon\)\to1\quad (n\to\infty).

За да се получи граничното отношение (27) от неравенството (26), е достатъчно да се зададе

T=\varepsilon\cdot\frac(\sqrt(n))(C).

Голям брой изследвания на A.A. Маркова, С.Н. Бернстейн, А.Я. Хинчин и др. е посветен на въпроса за възможното разширяване на условията за приложимост на граничното отношение (27), т.е. условията за приложимост на закона за големите числа. Тези изследвания са от фундаментално значение. Но още по-важно е точното изследване на разпределението на вероятността за отклонение \zeta-M(\zeta) .

Голямата заслуга на руската класическа школа в теорията на вероятностите е установяването на факта, че при много широки условия равенството

\mathbf(P)\!\наляво\(t_1\sigma_(\zeta)<\zeta-M(\zeta)

Чебишев дава почти пълно доказателство на тази формула за случая на независими и ограничени членове. Марков попълни липсващото звено в разсъжденията на Чебишев и разшири условията за приложимост на формула (28). Още по-общи условия са дадени от Ляпунов. Въпросът за разширяване на формула (28) до суми от зависими членове е изследван със специална пълнота от S. N. Bernshtein.

Формула (28) покриваше толкова голям брой специфични проблеми, че дълго време беше наричана централната гранична теорема на теорията на вероятностите. Въпреки че с най-новото развитие на теорията на вероятностите тя се оказа включена в редица по-общи закони, нейното значение не може да бъде надценено дори и днес.

време.

Ако членовете са независими и техните вариации са еднакви и равни: D(\xi^((i)))=\sigma^2,тогава е удобно формула (28), като вземе предвид връзката (25), да даде формата

\mathbf(P)\!\left\(\frac(t_1\sigma)(\sqrt(n))<\zeta-M(\zeta)<\frac{t_2\sigma}{\sqrt{n}}\right\}\sim\frac{1}{\sqrt{2\pi}}\int\limits_{t_1}^{t_2}e^{-t^2/2}\,dt\,.

Нека покажем, че съотношението (29) съдържа решение на проблема с отклоненията на честотата \frac(\mu)(n) от вероятността p , с който се занимавахме по-рано. За да направим това, въвеждаме случайни променливи \xi^((i)), дефинирайки ги чрез следното условие:

\xi^((i))=0 ако i -тото изпитване е с отрицателен резултат,

\xi^((i))=1, ако i -тото изпитване има положителен резултат.

Лесно е да проверите това тогава


и формула (29) дава

\mathbf(P)\!\left\(t_1\sqrt(\frac(p(1-p))(n))<\frac{\mu}{n}-p
което за t_1=-t,~t_2=t отново води до формула (20).
Вижте също гранични теореми в теорията на вероятностите Javascript е деактивиран във вашия браузър.
ActiveX контролите трябва да са активирани, за да се правят изчисления!

Лема Чебишев. Ако случайната променлива х, за което има математическо очакване М[х], може да приема само неотрицателни стойности, тогава за всяко положително число a имаме неравенството

Неравенството на Чебишев.Ако хе случайна променлива с математическо очакване М[х] и дисперсия д[х], тогава за всяко положително e имаме неравенството

. (2)

Теорема на Чебишев.(закон за големите числа). Позволявам х 1 , х 2 , …, x n,… - поредица от независими случайни променливи с едно и също математическо очакване ми дисперсии, ограничени от същата константа с

. (3)

Доказателството на теоремата се основава на неравенството

, (4)

следвайки неравенството на Чебишев. От теоремата на Чебишев, като следствие, може да се получи

Теорема на Бернули.Нека се произвежда ннезависими експерименти, във всеки от които с вероятност Рможе да се случи някакво събитие НО, остави v nе случайна променлива, равна на броя повторения на събитието НОв тези нексперименти. Тогава за всяко e > 0 имаме гранично равенство

. (5)

Обърнете внимание, че неравенство (4), приложено към условията на теоремата на Бернули, дава:

. (6)

Теоремата на Чебишев може да се формулира в малко по-обща форма:

Обобщена теорема на Чебишев.Позволявам х 1, х 2, …, x n,… - последователност от независими случайни променливи с математически очаквания М[х 1 ] = m 1, М[x2] = m 2 ,…и дисперсии, ограничени от същата константа с. Тогава за всяко положително число e имаме гранично равенство

. (7)

Нека x е броят на срещанията на 6 точки за 3600 хвърляния на зара. Тогава M[ х] = 3600 = 600. Нека сега използваме неравенство (1) за a = 900: .

Използваме неравенство (6) за n = 10000, p = , q = . Тогава

Пример.

Вероятността за възникване на събитие А във всеки от 1000 независими експеримента е 0,8. Намерете вероятността броят на случванията на събитие А в тези 1000 експеримента да се отклони от математическото си очакване по абсолютна стойност с по-малко от 50.

Нека x е броят на появяванията на събитие A в посочените 1000 експеримента. Тогава M[ х] = 1000 × 0,8 = 800 и D[ х] = 1000 × 0,8 × 0,2 = 160. Сега неравенството (2) дава:


Пример.

Дисперсията на всяка от 1000 независими случайни променливи x k (k = 1, 2,..., 1000) е 4. Оценете вероятността отклонението на средното аритметично на тези променливи от средното аритметично на техните математически очаквания по абсолютна стойност няма да надвишава 0,1.

Съгласно неравенство (4), за c = 4 и e = 0,1 имаме