Биографии Характеристики Анализ

Централна гранична теорема за манекени. Статистически модел на единичен процес

В допълнение към теоремите, свързани със закона за големите числа, има друга група теореми, които образуват така наречената централна гранична теорема. Тази група теореми определя условията, при които възниква нормалният закон на разпределение. Такива условия са доста често срещани в практиката, което всъщност е обяснението, че нормалният закон най-често се използва при случайни явления в практиката. Разликата между формите на централната гранична теорема се състои във формулирането на различни условия, наложени върху сумата от разглежданите случайни променливи. Най-важното място сред всички тези форми принадлежи на теоремата на Ляпунов.

Теорема на Ляпунов.Ако х 1 , х 2 , … , х n са независими случайни променливи с крайни математически очаквания и дисперсии, като нито една от стойностите не се различава рязко от всички останали по своята стойност, т.е. има незначителен ефект върху сумата от тези количества, след това с неограничено увеличаване на броя на случайните променливи н, законът за разпределение на сбора им неограничено се доближава до нормалния.

Последица.Ако всички случайни променливи х 1 , х 2 , … , х n са равномерно разпределени, то законът за разпределение на сбора им неограничено се доближава до нормалния с неограничено нарастване на броя на членовете.

Теоремата на Ляпунов е от голямо практическо значение. Емпирично беше установено, че приближаването до нормалния закон е доста бързо. При условията на теоремата на Ляпунов законът за разпределение на сумата от дори десет члена вече може да се счита за нормален.

Има по-сложна и по-обща форма на теоремата на Ляпунов.

Теорема на генерал Ляпунов.Ако х 1 , х 2 , … , х n са независими случайни променливи с математически очаквания а i , вариации σ 2 i , централни моменти от трети ред Tаз и

тогава законът за разпределение на сумата х 1 + х 2 + … + х n при нсе доближава до нормалното за неопределено време с очакване и дисперсия .

Значението на условие (2.1) е, че в сумата от случайни променливи няма да има нито един член, чието влияние върху дисперсията на сумата от променливи би било изключително голямо в сравнение с влиянието на всички други случайни променливи. Освен това не трябва да има голям брой членове, чието влияние върху дисперсията на сбора е много малко в сравнение с общото влияние на останалите.

Една от най-ранните форми на централната гранична теорема е теоремата на Лаплас.

Теорема на Лаплас.Нека се произвежда ннезависими експерименти, във всеки от които събитие НОсе появява с вероятност Р, след това за големи нприблизителното равенство

(2.2)

където Y n е броят на повторенията на събитието НОв нексперименти; р=1-стр; F( х) е функцията на Лаплас.

Теоремата на Лаплас позволява да се намерят приблизително вероятностите на стойностите на биномиално разпределени случайни променливи за големи стойности на количеството н. В същото време обаче вероятността Рне трябва да бъде нито достатъчно малък, нито достатъчно голям.

За практически задачи формула (2.2) често се записва в друга форма, а именно

(2.3)

Пример 2.1. Машината дава за смяна н=1000 артикула, от които средно 3% са дефектни. Намерете приблизителната вероятност най-малко 950 добри (без дефекти) продукта да бъдат произведени по време на смяна, ако продуктите се окажат добри независимо един от друг.

Решение . Позволявам Y- броят на добрите продукти. Според задачата Р= 1-0,03=0,97; брой независими експерименти н=1000. Прилагаме формула (2.3):

Пример 2.2, В условията на предишния пример разберете колко добри продукти ктрябва да съдържа кутията, така че вероятността от нейното препълване в една смяна да не надвишава 0,02.

Решение . От условието става ясно, че . Намерете от това условие числото к. Ние имаме
, т.е. .

Според таблицата на функцията на Лаплас, със стойност 0,48 намираме аргумента, равен на 2,07. Получаваме
. ■

Пример 2.3. В една банка 16 души стоят на определена каса, за да получат определени суми пари. В момента в тази каса има 4000 den. единици Суми х i , които трябва да бъдат платени на всеки от 20 души, са случайни променливи с математическо очакване T= 160 парични единици и стандартно отклонение σ = 70 den.un. Намерете вероятността в касата да няма достатъчно пари, за да платите на всички на опашката.

Решение . Прилагаме теоремата на Ляпунов за еднакво разпределени случайни променливи. стойността н= 20 може да се счита за доста голям, следователно общата сума на плащанията Y= х 1 + х 2 + … + х 16 може да се счита за случайна променлива, разпределена според нормалния закон с математическо очакване T y= nt= 20 160= 3200 и стандартно отклонение .

Пределни теореми на теорията на вероятностите

Неравенството на Чебишев

Нека разгледаме редица твърдения и теореми от голяма група от така наречените гранични теореми на теорията на вероятностите, установяващи връзка между теоретични и експериментални характеристики на случайни променливи с голям брой тестове върху тях. Те формират основата на математическата статистика. Граничните теореми условно се разделят на две групи. Първата група теореми, т.нар закон на големите числа, установява стабилността на средните стойности, т.е. с голям брой опити средният им резултат престава да бъде случаен и може да бъде предвиден с достатъчна точност. Втората група теореми, т.нар централна граница, установява условията, при които законът за разпределение на сумата от голям брой случайни променливи се доближава до нормалния за неопределено време.

Първо, разгледайте неравенството на Чебишев, което може да се използва за: а) груба оценка на вероятностите за събития, свързани със случайни променливи, чието разпределение е неизвестно; б) доказателства на редица теореми от закона за големите числа.

Теорема 7.1. Ако случайната променлива хима математическо очакване и дисперсия DX, тогава неравенството на Чебишев

. (7.1)

Обърнете внимание, че неравенството на Чебишев може да бъде написано в друга форма:

за честотиили събития в ннезависими опити, във всяко от които може да се случи с вероятност , чиято дисперсия е , неравенството на Чебишев има формата

Неравенството (7.5) може да се пренапише като

. (7.6)

Пример 7.1.Използвайки неравенството на Чебишев, оценете вероятността, че отклонението на случайна променлива хот неговото математическо очакване ще бъде по-малко от три стандартни отклонения, т.е. по-малко .

Решение:

Приемайки във формула (7.2), получаваме

Тази оценка се нарича правило три сигма.

Теорема на Чебишев

Основното твърдение на закона за големите числа се съдържа в теоремата на Чебишев. В него и други теореми на закона за големите числа се използва понятието "сходимост на случайни променливи по вероятност".

случайни променливи се сближават по вероятносткъм стойността A (случайна или неслучайна), ако за всяко вероятността от събитие при клони към единица, т.е.

(или ). Конвергенцията във вероятността се записва символично, както следва:

трябва да бъде отбелязано че конвергенция във вероятносттаизисква неравенството да е в сила за по-голямата част от членоветепоследователности (в математическия анализ - за всички n > N, където н- определен брой), и за почти всички членове на последователността трябва да попаднат в ε- квартал НО.

Теорема 7.3 (Закон за големите числа във формата на P.L. Chebyshev). Ако случайни променливи са независими и има брой C> 0, което , тогава за всяко

, (7.7)

тези. средното аритметично на тези случайни променливи се сближава по вероятност със средното аритметично на техните математически очаквания:

.

Доказателство. От тогава

.

След това, прилагайки неравенството на Чебишев (7.2) към случайната променлива, имаме

тези. средноаритметичното на случайните променливи се сближава по вероятност с математическото очакване а:

Доказателство. защото

и дисперсиите на случайни променливи , т.е. са ограничени, тогава прилагайки теоремата на Чебишев (7.7), получаваме твърдението (7.9).

Следствието от теоремата на Чебишев оправдава принципа на "средно аритметично" на случайни променливи Х iпостоянно използвани в практиката. Да, нека бъде направено ннезависими измервания на някаква величина, чиято истинска стойност а(не е известно). Резултатът от всяко измерване е случайна променлива Х i. Съгласно следствието, като приблизителна стойност на количеството аможете да вземете средноаритметичната стойност на резултатите от измерването:

.

Равенството е колкото по-точно, толкова повече н.

Теоремата на Чебишев също се основава на широко използваната в статистиката метод на вземане на проби, чиято същност е, че качеството на голямо количество хомогенен материал може да се съди по неговата малка проба.

Теоремата на Чебишев потвърждава връзката между случайността и необходимостта: средната стойност на случайна променлива практически не се различава от неслучайната променлива.

Теорема на Бернули

Теоремата на Бернули е исторически първата и най-проста форма на закона за големите числа. Той теоретично обосновава свойството стабилност на относителната честота.

Теорема 7.4 (Закон за големите числа във формата на Й. Бернули). Ако вероятността за настъпване на събитие НОв един тест е Р, броят на появата на това събитие в ннезависими опити е равно на , тогава за всяко число имаме равенство

, (7.10)

т.е. относителната честота на събитието НОсе сближава от вероятност към вероятност Рразработки НО: .

Доказателство. Въвеждаме случайни променливи, както следва: ако в аз-тото изпитание е настъпило събитие НО, а ако не се появи, тогава . След това числото НО(брой успехи) може да бъде представен като

Математическото очакване и дисперсията на случайните променливи са: , . Законът за разпределение на случайните променливи X i има формата

Х i
Р Р

за всякакви аз. По този начин, случайни променливи X iнезависими, техните вариации са ограничени до същия брой, тъй като

.

Следователно теоремата на Чебишев може да се приложи към тези случайни променливи

.

,

Следователно, .

Теоремата на Бернули теоретично обосновава възможността за приблизително изчисляване на вероятността от събитие, като се използва неговата относителна честота. Така например относителната честота на това събитие може да се приеме като вероятността да имате момиче, което според статистическите данни е приблизително равно на 0,485.

Неравенство на Чебишев (7.2) за случайни величини

приема формата

където пи- вероятност за събитие НОв аз- m тест.

Пример 7.2.Вероятността за типографска грешка на една страница от ръкописа е 0,2. Оценете вероятността в ръкопис, съдържащ 400 страници, честотата на поява на печатна грешка да се различава от съответната вероятност по модул по-малък от 0,05.

Решение:

Използваме формула (7.11). В такъв случай , , , . Имаме, т.е. .

Централна гранична теорема

Централната гранична теорема е втората група гранични теореми, които установяват връзка между закона за разпределение на сумата от случайна променлива и неговата ограничаваща форма - нормалния закон за разпределение.

Нека формулираме централната гранична теорема за случая, когато членовете на сумата имат еднакво разпределение. Тази теорема се използва най-често в практиката. В математическата статистика примерните случайни променливи имат еднакви разпределения, тъй като са получени от една и съща обща съвкупност.

Теорема 7.5. Нека случайните променливи са независими, равномерно разпределени, имат крайно математическо очакване и дисперсия , . Тогава функцията на разпределение на центрираната и нормализирана сума от тези случайни променливи клони към функцията на разпределение на стандартната нормална случайна променлива.

Тъй като много случайни променливи в приложенията се формират под въздействието на няколко слабо зависими случайни фактора, тяхното разпределение се счита за нормално. В този случай трябва да се спазва условието нито един от факторите да не е доминиращ. Централните гранични теореми в тези случаи оправдават прилагането на нормалното разпределение.

Енциклопедичен YouTube

  • 1 / 5

    Нека има безкрайна последователност от независими еднакво разпределени случайни променливи с крайно математическо очакване и дисперсия. Обозначете последното µ (\displaystyle \mu )и σ 2 (\displaystyle \sigma ^(2)), съответно. Нека също

    . S n − μ n σ n → N (0 , 1) (\displaystyle (\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))\до N(0,1) )чрез разпространение в ,

    където N (0 , 1) (\displaystyle N(0,1))- нормално разпределение с нулево математическо очакване и стандартно отклонение равно на единица. Означаване на извадката средна стойност на първото n (\displaystyle n)количества, т.е X ¯ n = 1 n ∑ i = 1 n X i (\displaystyle (\bar (X))_(n)=(\frac (1)(n))\sum \limits _(i=1)^( n)X_(i)), можем да пренапишем резултата от централната гранична теорема в следната форма:

    n X ¯ n − μ σ → N (0 , 1) (\displaystyle (\sqrt (n))(\frac ((\bar (X))_(n)-\mu )(\sigma ))\до N(0,1))чрез разпространение при n → ∞ (\displaystyle n\to \infty ).

    Степента на конвергенция може да се оцени с помощта на неравенството на Бери-Есеен.

    Забележки

    • Неформално казано, класическата централна гранична теорема гласи, че сумата n (\displaystyle n)независими еднакво разпределени случайни променливи има разпределение, близко до N (n μ , n σ 2) (\displaystyle N(n\mu ,n\sigma ^(2))). еквивалентно, X¯n (\displaystyle (\bar(X))_(n))има разпространение близко до N (μ , σ 2 / n) (\displaystyle N(\mu ,\sigma ^(2)/n)).
    • Тъй като функцията на разпределение на стандартното нормално разпределение е непрекъсната, сходимостта към това разпределение е еквивалентна на точкова сходимост на функциите на разпределение към функцията на разпределение на стандартното нормално разпределение. Поставяне Z n = S n − μ n σ n (\displaystyle Z_(n)=(\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))), получаваме F Z n (x) → Φ (x) , ∀ x ∈ R (\displaystyle F_(Z_(n))(x)\to \Phi (x),\;\forall x\in \mathbb (R) ), където Φ (x) (\displaystyle \Phi (x))е функцията на разпределение на стандартното нормално разпределение.
    • Класическата формулировка на централната пределна теорема се доказва чрез метода на характеристичните функции (теорема за непрекъснатостта на Леви).
    • Най-общо казано, сходимостта на плътностите не следва от сходимостта на функциите на разпределение. Въпреки това в този класически случай това е така.

    Местен C.P.T.

    При предположенията на класическата формулировка, да предположим в допълнение, че разпределението на случайни променливи ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty ))абсолютно непрекъснато, тоест има плътност. Тогава разпределението също е абсолютно непрекъснато и освен това,

    f Z n (x) → 1 2 π e − x 2 2 (\displaystyle f_(Z_(n))(x)\to (\frac (1)(\sqrt (2\pi )))\,e^ (-(\frac (x^(2))(2))))при n → ∞ (\displaystyle n\to \infty ),

    където f Z n (x) (\displaystyle f_(Z_(n))(x))- плътност на случайната променлива Z n (\displaystyle Z_(n)), а от дясната страна е плътността на стандартното нормално разпределение.

    Обобщения

    Резултатът от класическата централна гранична теорема е валиден за ситуации, много по-общи от пълната независимост и равното разпределение.

    C. P. T. Lindeberg

    Нека независими случайни променливи X 1 , … , X n , … (\displaystyle X_(1),\ldots ,X_(n),\ldots )са дефинирани в едно и също вероятностно пространство и имат крайни математически очаквания и отклонения: E [ X i ] = μ i, D [ X i ] = σ i 2 (\displaystyle \mathbb (E) =\mu _(i),\;\mathrm (D) =\sigma _(i)^( 2)).

    Позволявам S n = ∑ i = 1 n X i (\displaystyle S_(n)=\sum \limits _(i=1)^(n)X_(i)).

    Тогава E [ S n ] = m n = ∑ i = 1 n μ i , D [ S n ] = s n 2 = ∑ i = 1 n σ i 2 (\displaystyle \mathbb (E) =m_(n)=\sum \ граници _(i=1)^(n)\mu _(i),\;\mathrm (D) =s_(n)^(2)=\сума \граници _(i=1)^(n)\ сигма _(i)^(2)).

    И го остави да тече състояние на Линдеберг:

    ∀ ε > 0 , lim n → ∞ ∑ i = 1 n E [ (X i − μ i) 2 s n 2 1 ( | X i − μ i | > ε s n ) ] = 0 , (\displaystyle \forall \varepsilon >0,\;\lim \limits _(n\to \infty )\sum \limits _(i=1)^(n)\mathbb (E) \left[(\frac ((X_(i)-\ mu _(i))^(2))(s_(n)^(2)))\,\mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_ (n)\))\right]=0,)

    където 1 ( | X i − μ i | > ε s n ) (\displaystyle \mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_(n)\)))функция - индикатор.

    чрез разпространение при n → ∞ (\displaystyle n\to \infty ).

    Ц. П. Т. Ляпунова

    Нека се изпълнят основните предположения на Ц. П. Т. Линдеберг. Нека случайни променливи ( X i ) (\displaystyle \(X_(i)\))имат краен трети момент. След това последователността

    r n 3 = ∑ i = 1 n E [ | X i − μ i | 3 ] (\displaystyle r_(n)^(3)=\sum _(i=1)^(n)\mathbb (E) \left[|X_(i)-\mu _(i)|^(3 )\надясно]).

    Ако лимит

    lim n → ∞ r n s n = 0 (\displaystyle \lim \limits _(n\to \infty )(\frac (r_(n))(s_(n)))=0) (Състояние на Ляпунов), S n − m n s n → N (0 , 1) (\displaystyle (\frac (S_(n)-m_(n))(s_(n)))\до N(0,1))чрез разпространение при n → ∞ (\displaystyle n\to \infty ).

    C.P.T. за мартингали

    Оставете процеса (X n) n ∈ N (\displaystyle (X_(n))_(n\in \mathbb (N) ))е мартингал с ограничени нараствания. По-специално, нека приемем, че

    E [ X n + 1 − X n ∣ X 1 , … , X n ] = 0 , n ∈ N , X 0 ≡ 0 , (\displaystyle \mathbb (E) \left=0,\;n\in \mathbb (N) ,\;X_(0)\equiv 0,)

    и увеличенията са равномерно ограничени, т.е

    ∃ C > 0 ∀ n ∈ N | X n + 1 − X n | ≤ C (\displaystyle \exists C>0\,\forall n\in \mathbb (N) \;|X_(n+1)-X_(n)|\leq C) τ n = min ( k | ∑ i = 1 k σ i 2 ≥ n ) (\displaystyle \tau _(n)=\min \left\(k\left\vert \;\sum _(i=1)^ (k)\sigma _(i)^(2)\geq n\right.\right\)). X τ n n → N (0 , 1) (\displaystyle (\frac (X_(\tau _(n)))(\sqrt (n)))\до N(0,1))чрез разпространение при n → ∞ (\displaystyle n\to \infty ).

    Чарлз УилънГлава от книга
    Издателство "Ман, Иванов и Фербер"

    Накрая е време да обобщим казаното. Тъй като извадковите средни са нормално разпределени (благодарение на централната гранична теорема), можем да се възползваме от богатия потенциал на камбанообразната крива. Очакваме, че приблизително 68% от средните стойности на всички проби ще бъдат в рамките на една стандартна грешка от средната стойност на популацията; 95% - на разстояние не повече от две стандартни грешки; и 99,7% - на разстояние не повече от три стандартни грешки.

    Сега да се върнем на отклонението (скатера) в примера с липсващата шина – този път обаче ще викаме на помощ не интуицията, а числата. (Сам по себе си този пример остава абсурден; в следващата глава ще разгледаме много по-реалистични случаи.) Да предположим, че организаторите на американското проучване „Changing Lives” са поканили всичките си участници в Бостън за един уикенд, за да се забавляват и в същото време предоставя някои липсващи данни: Участниците се разпределят на случаен принцип в автобуси и се отвеждат до тестовия център, където ще бъдат претеглени, измерени за височина и т.н. За ужас на организаторите на събитието един от автобусите изчезва някъде по пътя към тестовия център горе-долу по същото време, връщайки се с колата си от фестивала на колбасите, забелязвате автобус, който се е повредил отстрани на пътя, изглежда, че шофьорът му е бил принуден да завие в опит да избягвайте внезапно появилия се на пътя лос От такава рязка маневра всички пътници загубиха съзнание или загубиха дар слово, въпреки че никой от тях, за съжаление astya, не е получила сериозни наранявания. (Трябва да направя това предположение само за по-голяма яснота в примера тук и надеждата, че пътниците няма да бъдат сериозно наранени, се дължи на моята вродена филантропия.) Лекарите от линейката, които пристигнаха веднага на мястото, ви казаха, че средното тегло на 62 пътници в автобуса е 194 паунда. Освен това се оказа (за голямо облекчение на всички любители на животните), че лосът, от който шофьорът на автобуса се опита да избегне, практически не е пострадал (с изключение на леко натъртване на задния крак), но също така е загубил съзнание от силно се уплаши и лежи до автобуса.

    За щастие вие ​​знаете средното тегло на пътниците в автобуса, както и стандартното отклонение за цялата популация на американците "Промяна на живота". В допълнение, ние имаме общо разбиране на теоремата за централната граница и знаем как да окажем първа помощ на ранено животно.Средното тегло на участниците в американското изследване „Changing Lives” е 162 паунда; стандартното отклонение е 36. Въз основа на тази информация можете да изчислите стандартната грешка за извадка от 62 души (брой пътници в автобуса, които са припаднали): .

    Разликата между тази средна стойност на извадката (194 паунда) и средната стойност на популацията (162 паунда) е 32 паунда, доста над три стандартни грешки. От централната гранична теорема знаете, че 99,7% от средните стойности на всички извадки ще бъдат в рамките на три стандартни грешки на средната генерална съвкупност. По този начин е много малко вероятно автобусът, който срещате, да превозва група участници в проучването "Промяна на живота на американците. Като виден обществен активист в града, вие се обаждате на организаторите на събитието, за да съобщите, че друга група хора е най-вероятно в автобуса, който срещате. В този случай обаче можете да разчитате на статистически резултати, а не на вашите "интуитивни предположения. " Казвате на организаторите, че отричате вероятността автобусът, който сте намерили, да е този, който търсят , с 99,7% ниво на увереност. в този случай говорите с хора, които са запознати със статистиката, тогава можете да сте сигурни, че те разбират, че сте прав. (Винаги е приятно да се работи с умни хора!)

    Вашите констатации се подкрепят допълнително, когато парамедиците вземат кръвни проби от пътници в автобуса и установяват, че техните средни нива на холестерол са с пет стандартни грешки по-високи от средните нива на холестерол на участниците в проучването Changing Lives на американците. пътници в безсъзнание - участници във Фестивала на колбасите Любовници (по-късно това беше неопровержимо доказано.)

    [Тази история имаше щастлив край. Когато пътниците в автобуса дойдоха в съзнание, организаторите на американското проучване "Changing Lives" ги посъветваха да се консултират с диетолози за опасностите от консумацията на храни с високо съдържание на наситени мазнини. След такива консултации много от любителите на колбаси решиха да скъсат със срамното си минало и връщане към по-здравословна диета.Раненият лос беше изваден в местна ветеринарна клиника и пуснат на свобода под одобрителните възгласи на членове на местното дружество за защита на животните.Да, по някаква причина историята мълчи за съдбата на шофьор на автобус.Може би защото статистиката не се занимава със съдбата на отделните хора.Елк - Това е съвсем друго нещо, няма да може да се премълчи съдбата му!

    В тази глава се опитах да говоря само за основите. Може би сте забелязали, че централната гранична теорема е приложима само когато размерът на извадката е достатъчно голям (обикновено поне 30). Освен това се нуждаем от относително голяма извадка, ако смятаме да приемем, че нейното стандартно отклонение ще бъде приблизително същото като стандартното отклонение на популацията.

    Има доста статистически корекции, които могат да бъдат приложени, ако тези условия не са изпълнени, но всичко е като черешка върху торта (и може би дори парченца шоколад, които са поръсени върху тази глазура). „Голямата картина“ тук е проста и изключително ефективна.

    1. Ако формирате големи (по обем) произволни извадки на базата на която и да е популация, тогава техните средни стойности ще бъдат разпределени според нормалния закон близо до средната стойност на съответната популация (каквото и да е разпределението на първоначалната популация).
    2. Повечето от средните стойности на извадката ще бъдат разположени достатъчно близо до средната стойност на популацията (кое точно трябва да се счита за „достатъчно близо“ във всеки даден случай се определя от стандартната грешка).
    3. Централната гранична теорема ни казва за вероятността средната стойност на извадката да бъде в рамките на определено разстояние от средната стойност на съвкупността. Сравнително малко вероятно е средната стойност на извадката да бъде на повече от две стандартни грешки от средната популация и е много малко вероятно средната на извадката да бъде на повече от три стандартни грешки от средната популация.
    4. Колкото по-малко вероятно е даден резултат да е бил чисто случаен, толкова по-сигурни можем да бъдем, че той не е бил без влиянието на някакъв друг фактор.

    Това като цяло е същността на статистическите изводи. Централната гранична теорема по същество прави всичко това възможно. И докато ЛеБрон Джеймс не спечели толкова шампиони на НБА, колкото Майкъл Джордан (шест), теоремата за централната граница ще ни впечатлява много повече от известния баскетболист.

    ЛеБрон Реймоун Джеймс е американски професионален баскетболист, който играе като малък и мощен нападател за Кливланд Кавалиърс от НБА. Забележка. превод

    Обърнете внимание на много гениалното използване на фалшива точност в този случай.

    Когато стандартното отклонение на съответната съвкупност се изчислява въз основа на по-малка извадка, формулата, която сме дали, е донякъде модифицирана: Това помага да се отчете фактът, че дисперсията в малка извадка може да „подценява“ дисперсията на цялата популация. Това няма много общо с по-универсалните разпоредби, обсъдени в тази глава.

    Моят колега от Чикагския университет, Джим Сали, направи много важна критика на примерите за липсващи автобуси. Той посочи, че в наши дни изчезнал автобус е изключителна рядкост. Следователно, ако трябва да търсим някакъв липсващ автобус, тогава всеки автобус, който срещнем и който се окаже липсващ или повреден, най-вероятно ще бъде автобусът, който ни интересува, независимо от теглото на пътниците в този автобус. Може би Джим е прав. (За да използваме тази аналогия: ако загубите детето си в супермаркет и ръководството на магазина съобщи по радиото, че нечие изгубено дете стои близо до каса номер шест, тогава вероятно веднага ще решите, че това е вашето дете.) Следователно, нямаме друг избор, освен за да добавим още един елемент на абсурд към нашите примери, смятайки, че загубата на автобуса е съвсем обикновено събитие.

    план:

    1. Концепцията за централната гранична теорема (теорема на Ляпунов)

    2. Закон за големите числа, вероятност и честота (теореми на Чебишев и Бернули)

    1. Концепцията за централната пределна теорема.

    Нормалното разпределение на вероятностите е от голямо значение в теорията на вероятностите. Нормалният закон се подчинява на вероятността при стрелба по цел, при измервания и т.н. По-специално се оказва, че законът за разпределение на сумата от достатъчно голям брой независими случайни променливи с произволни закони за разпределение е близък до нормалното разпределение. Този факт се нарича централна гранична теорема или теорема на Ляпунов.

    Известно е, че нормално разпределените случайни променливи се използват широко в практиката. Какво обяснява това? На този въпрос е отговорено

    Централна гранична теорема.Ако една случайна променлива X е сбор от много голям брой взаимно независими случайни променливи, влиянието на всяка от които върху цялата сума е незначително, тогава X има разпределение, близко до нормалното разпределение.

    Пример.Нека се измери някакво физическо количество. Всяко измерване дава само приблизителна стойност на измереното количество, тъй като много независими случайни фактори (температура, колебания на инструмента, влажност и т.н.) влияят върху резултата от измерването. Всеки от тези фактори генерира незначителна "частична грешка". Въпреки това, тъй като броят на тези фактори е много голям, тяхното кумулативно въздействие генерира вече забележима "обща грешка".

    Разглеждайки общата грешка като сума от много голям брой взаимно независими частични грешки, можем да заключим, че общата грешка има разпределение, близко до нормалното разпределение. Опитът потвърждава валидността на това заключение.

    Разгледайте условията, при които е изпълнена "теоремата за централната граница".

    х1,X2, ..., Xне последователност от независими случайни променливи,

    М(X1),М(X2), ...,Мн) са крайните математически очаквания на тези величини, съответно равни на М(Xk)= ак

    д (X1),д(X2), ...,дн) - крайните им дисперсии, съответно равни на д(х к)= кн2

    Въвеждаме обозначението: S= X1+X2 + ...+Xn;

    A k= X1+X2 + ...+Xn=; B2=D (X1)+д(X2)+ ...+дн) =

    Записваме функцията на разпределение на нормализираната сума:

    Казват на последователността х1,X2, ..., Xнцентралната гранична теорема е приложима, ако за всяко хфункцията на разпределение на нормализираната сума като n ® ¥ клони към функцията на нормалното разпределение:

    Дясно "style="border-collapse:collapse;border:none;margin-left:6.75pt;margin-right: 6.75pt">

    Да разгледаме дискретна случайна променлива х, дадено от таблицата за разпределение:

    Нека си поставим задачата да оценим вероятността отклонението на случайна променлива от нейното математическо очакване да не надвишава по абсолютна стойност положително число ε

    Ако ε достатъчно малък, по този начин ще оценим вероятността, че хще вземе стойности достатъчно близки до математическото си очакване. доказа неравенство, което ни позволява да дадем оценката, която ни интересува.

    Лема Чебишев.Дадена е случайна променлива X, която приема само неотрицателни стойности с очакване M(X). За всяко число α>0 се изпълнява изразът:

    Неравенството на Чебишев.Вероятността отклонението на случайна променлива X от нейното математическо очакване по абсолютна стойност да е по-малко от положително число ε , не по-малко от 1 – D(X) / ε 2:

    P(|X-M(X)|< ε ) ³ 1 - D (X) / ε 2.

    Коментирайте.Неравенството на Чебишев има ограничена практическа стойност, тъй като често дава груба и понякога тривиална (без интерес) оценка.

    Теоретичното значение на неравенството на Чебишев е много голямо. По-долу ще използваме това неравенство, за да изведем теоремата на Чебишев.

    2.2. Теорема на Чебишев

    Ако X1, X2, ..., Xn.. са по двойки независими случайни променливи и техните дисперсии са равномерно ограничени (не надвишават постоянно число C), тогава, независимо колко малко е положителното число ε , вероятността от неравенство

    ÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε

    ще бъде произволно близо до единица, ако броят на случайните променливи е достатъчно голям.

    P (÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε )=1.

    Теоремата на Чебишев гласи:

    1. Разглеждаме достатъчно голям брой независими случайни променливи с ограничени дисперсии,

    Когато формулирахме теоремата на Чебишев, ние приехме, че случайните променливи имат различни математически очаквания. На практика често се случва случайните променливи да имат едно и също математическо очакване. Очевидно, ако отново приемем, че дисперсиите на тези величини са ограничени, тогава теоремата на Чебишев ще бъде приложима към тях.

    Нека означим математическото очакване на всяка от случайните променливи през а;

    В разглеждания случай средноаритметичното на математическите очаквания, както е лесно да се види, също е равно на а.

    Може да се формулира теоремата на Чебишев за конкретния разглеждан случай.

    „Ако X1, X2, ..., Xn.. са по двойки независими случайни променливи, имащи едно и също математическо очакване a и ако дисперсиите на тези променливи са равномерно ограничени, тогава, без значение колко малко е числото ε > О, вероятността от неравенство

    ÷ (X1+X2 + ...+Xn) / n - а | < ε

    ще бъде произволно близо до единица, ако броят на случайните променливи е достатъчно голям" .

    С други думи, при условията на теоремата

    P (÷ (X1+X2 + ...+Xn) / n - a |< ε ) = 1.

    2.3. Същност на теоремата на Чебишев

    Въпреки че отделните независими случайни променливи могат да приемат стойности, които са далеч от техните математически очаквания, средната аритметична стойност на достатъчно голям брой случайни променливи с голяма вероятност приема стойности, близки до определено постоянно число, а именно числото

    (М(Xj) + M (X2)+... + М (Xn))/nили към номера и вчастен случай.

    С други думи, отделните случайни променливи могат да имат значително разпространение и тяхното средно аритметично е разпръснато малко.

    По този начин не може с увереност да се предвиди каква възможна стойност ще приеме всяка от случайните променливи, но може да се предвиди каква стойност ще приеме тяхната средна аритметична стойност.

    Така средноаритметичната стойност на достатъчно голям брой независими случайни променливи (чиито дисперсии са равномерно ограничени) губи характера на случайна променлива.

    Това се обяснява с факта, че отклоненията на всяка от величините от техните математически очаквания могат да бъдат както положителни, така и отрицателни, като в средноаритметичното те взаимно се компенсират.

    Теоремата на Чебишев е валидна не само за дискретни, но и за непрекъснати случайни променливи; това е пример, потвърждаващ валидността на доктрината за връзката между случайността и необходимостта.

    2.4. Значение на теоремата на Чебишев за практиката

    Нека дадем примери за приложението на теоремата на Чебишев за решаване на практически задачи.

    Обикновено за измерване на определена физическа величина се правят няколко измервания и тяхната средна аритметична се приема за желана величина. При какви условия този метод на измерване може да се счита за правилен? Отговор на този въпрос дава теоремата на Чебишев (нейният частен случай).

    Наистина, разглеждайте резултатите от всяко измерване като случайни променливи

    X1, X2, ..., Xn

    Към тези количества теоремата на Чебишев може да се приложи, ако:

    1) Те са независими по двойки.

    2) имат същото математическо очакване,

    3) техните дисперсии са равномерно ограничени.

    Първото изискване е изпълнено, ако резултатът от всяко измерване не зависи от резултатите от останалите.

    Второто изискване е изпълнено, ако измерванията са направени без систематични (един знак) грешки. В този случай математическите очаквания на всички случайни променливи са еднакви и равни на истинския размер а.

    Третото изискване е изпълнено, ако устройството осигурява определена точност на измерване. Въпреки че резултатите от отделните измервания са различни, тяхното разсейване е ограничено.

    Ако всички тези изисквания са изпълнени, имаме право да приложим теоремата на Чебишев към резултатите от измерването: за достатъчно голям Пвероятност за неравенство

    | (X1 + Xa+...+Xn)/n - a |< ε произволно близо до единица.

    С други думи, при достатъчно голям брой измервания е почти сигурно, че тяхната средна аритметична стойност се различава произволно малко от истинската стойност на измерваната величина.

    Теоремата на Чебишев показва условията, при които може да се приложи описаният метод на измерване. Грешка е обаче да се мисли, че чрез увеличаване на броя на измерванията може да се постигне произволно висока точност. Факт е, че самото устройство дава показания само с точност ± α, следователно всеки от резултатите от измерването и следователно тяхното средно аритметично ще бъде получено само с точност, която не надвишава точността на устройството.

    Методът на вземане на проби, широко използван в статистиката, се основава на теоремата на Чебишев, чиято същност е, че се използва относително малка произволна извадка, за да се прецени цялата популация (генерална популация) на изследваните обекти.

    Например, качеството на една бала памук се оценява по малък сноп, състоящ се от произволно избрани влакна от различни части на балата. Въпреки че броят на влакната в един сноп е много по-малък, отколкото в една бала, самият сноп съдържа доста голям брой влакна, наброяващи стотици.

    Като друг пример може да се посочи определянето на качеството на зърното от малка проба. И в този случай броят на произволно избраните зърна е малък в сравнение с цялата маса на зърното, но сам по себе си е доста голям.

    Още от цитираните примери може да се заключи, че за практиката теоремата на Чебишев е от неоценимо значение.

    2.5. ТеоремаБернули

    Произведено Пнезависими тестове (не събития, а тестове). Във всеки от тях, вероятността за настъпване на събитие Ае равно на Р.

    Възниква въпросът,каква ще бъде относителната честота на възникване на събитието? На този въпрос отговаря теоремата, доказана от Бернули, наречена „закон за големите числа“ и поставила основата на теорията на вероятностите като наука.

    Теорема на Бернули.Ако във всяка от Пнезависим тест вероятност Рнастъпване на събитие НОе постоянна, тогава вероятността, че отклонението на относителната честота от вероятността Рще бъде произволно малък по абсолютна стойност, ако броят на опитите е достатъчно голям.

    С други думи, ако ε >0 е произволно малко число, тогава при условията на теоремата имаме равенството

    P(|м / n - p|< ε)= 1

    Коментирайте.Би било погрешно въз основа на теоремата на Бернули да се заключи, че с увеличаване на броя на опитите относителната честота постоянно клони към вероятността R;с други думи, теоремата на Бернули не предполага равенството (t/n) = p,

    ATТеоремата се занимава само с вероятността, че при достатъчно голям брой опити относителната честота ще се различава произволно малко от постоянната вероятност за настъпване на събитие във всеки опит.

    Задача 7-1.

    1. Оценете вероятността след 3600 хвърляния на зара броят на повторенията на 6 да бъде най-малко 900.

    Решение.Нека x е броят на срещанията на 6 точки в 3600 хвърляния на монети. Вероятността да получите 6 точки при едно хвърляне е p=1/6, тогава M(x)=3600 1/6=600. Използваме неравенството на Чебишев (лема) за дадено α = 900

    = П(х³ 900) £ 600 / 900 =2 / 3

    Отговор 2 / 3.

    2. Проведени са 1000 независими теста, p=0,8. Намерете вероятността броят на появяванията на събитие А в тези тестове да се отклонява от математическото си очакване по модул по-малко от 50.

    Решение. x е броят на появяванията на събитие А в n - 1000 опита.

    M (X) \u003d 1000 0,8 \u003d 800. D(x)=100 0,8 0,2=160

    Използваме неравенството на Чебишев за дадено ε = 50

    P(|x-M(x)|< ε) ³ 1 - D (x) / ε 2

    R(|x-800|< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

    Отговор. 0,936

    3. Използвайки неравенството на Чебишев, оценете вероятността, че |X - M(X)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

    4. Дадено: P(|X- M(X)\< ε) ³ 0,9; д (х)= 0,004. Използвайки неравенството на Чебишев, намерете ε . Отговор. 0,2.

    Контролни въпроси и задачи

    1. Цел на централната гранична теорема

    2. Условия за приложимост на теоремата на Ляпунов.

    3. Разликата между лемата и теоремата на Чебишев.

    4. Условия за приложимост на теоремата на Чебишев.

    5. Условия за приложимост на теоремата на Бернули (законът за големите числа)

    Изисквания за знания и умения

    Студентът трябва да знае общата семантична формулировка на централната пределна теорема. Да може да формулира частични теореми за независими еднакво разпределени случайни променливи. Разберете неравенството на Чебишев и закона за големите числа във формата на Чебишев. Имайте представа за честотата на събитието, връзката между понятията "вероятност" и "честота". Имайте разбиране за закона за големите числа под формата на Бернули.

    (1857-1918), изключителен руски математик