Біографії Характеристики Аналіз

Центральна гранична теорема для чайників. Поодинокий процес статистичної моделі

Крім теорем, які стосуються закону великих чисел, існує ще одна група теорем, які утворюють так звану центральну граничну теорему. Ця група теорем визначає умови, у яких виникає нормальний закон розподілу. Такі умови досить часто зустрічаються на практиці, що, по суті, є поясненням того, що нормальний закон найчастіше використовується у випадкових явищах на практиці. Відмінність форм центральної граничної теореми полягає у формулюванні різних умов, що накладаються у сумі аналізованих випадкових величин. Найважливіше місце серед усіх цих форм належить теоремі Ляпунова.

Теорема Ляпунова.Якщо Х 1 , Х 2 , … , Х n – незалежні випадкові величини, мають кінцеві математичні очікування і дисперсії, у своїй жодна з величин за своїм значенням різко відрізняється від інших, тобто. надає на суму цих величин мізерно малий вплив, то при необмеженому збільшенні числа випадкових величин n, Закон розподілу їхньої суми необмежено наближається до нормального.

Слідство.Якщо всі випадкові величини Х 1 , Х 2 , … , Х n однаково розподілено, то закон розподілу їх суми необмежено наближається до нормального при необмеженому збільшенні числа доданків.

Теорема Ляпунова має велике практичного значення. Досвідченим шляхом було встановлено, що наближення до нормального закону йде досить швидко. За виконання умов теореми Ляпунова закон розподілу суми навіть десяти доданків вже вважатимуться нормальним.

Існує складніша і більш загальна форма теореми Ляпунова.

Загальна теорема Ляпунова.Якщо Х 1 , Х 2 , … , Х n – незалежні випадкові величини, що мають математичні очікування а i , дисперсії σ 2 i , центральні моменти третього порядку т i та

то закон розподілу суми Х 1 + Х 2 + … + Х n при nнеобмежено наближається до нормального з математичним очікуванням та дисперсією .

Сенс умови (2.1) полягає в тому, щоб у сумі випадкових величин не було б жодного доданку, вплив якого на розсіювання суми величин було б величезно порівняно з впливом всіх інших випадкових величин. Крім цього, не повинно бути великої кількості доданків, вплив яких на розсіювання суми дуже мало порівняно із сумарним впливом інших.

Однією з перших форм центральної граничної теореми було доведено теорема Лапласа.

Теорема Лапласа.Нехай проводиться nнезалежних дослідів, у кожному з яких подія Аз'являється з ймовірністю ртоді при великих nсправедливо наближена рівність

(2.2)

де Y n – кількість появи події Ав nдослідах; q=1-p; Ф( х) – функція Лапласа.

Теорема Лапласа дозволяє знаходити приблизно ймовірності значень біноміально розподілених випадкових величин при великих значеннях величини n. Однак при цьому, ймовірність рне має бути ні досить маленькою, ні досить великою.

Для практичних завдань часто використовується інша форма запису формули (2.2), а саме

(2.3)

приклад 2.1. Верстат видає за зміну n=1000 виробів, у тому числі у середньому 3% дефектних. Знайти приблизно ймовірність того, що за зміну буде виготовлено не менше 950 хороших (без дефекту) виробів, якщо вироби виявляються хорошими незалежно один від одного.

Рішення . Нехай Y- Число хороших виробів. За умовою завдання р= 1-0,03 = 0,97; кількість незалежних дослідів n=1000. Застосуємо формулу (2.3):

приклад 2.2, В умовах попереднього прикладу з'ясувати скільки хороших виробів kповинен вміщувати ящик, щоб ймовірність його переповнення за зміну не перевищила 0,02.

Рішення . З умови ясно, що . Знайдемо з цієї умови число k. Маємо
, тобто. .

По таблиці функції Лапласа за значенням 0,48 знаходимо аргумент, що дорівнює 2,07. Отримуємо
. ■

приклад 2.3. У банку певну касу отримання деяких грошових сум стоять 16 людина. Нині у цій касі є 4000 ден. од. Суми Х i , які необхідно виплатити кожному з 20 осіб – це випадкові величини з математичним очікуванням т= 160 ден. та середнім квадратичним відхиленням σ = 70 ден. Знайти ймовірність того, що грошей, що є в касі, не вистачить для виплати всім, хто стоїть у черзі.

Рішення . Застосуємо теорему Ляпунова однаково розподілених випадкових величин. Величину n= 20 вважатимуться досить великий, отже, загальну суму виплат Y= Х 1 + Х 2 + … + Х 16 можна вважати випадковою величиною розподіленою за нормальним законом з математичним очікуванням ту = = 20 160 = 3200 та середньоквадратичним відхиленням .

Граничні теореми теорії ймовірностей

Нерівність Чебишева

Розглянемо ряд тверджень і теорем з великої групи про граничних теорем теорії ймовірностей, встановлюють зв'язок між теоретичними і експериментальними характеристиками випадкових величин за великої кількості випробувань з них. Вони становлять основу математичної статистики. Граничні теореми умовно поділяють на дві групи. Перша група теорем, звана законом великих чисел, Встановлює стійкість середніх значень, тобто. при великій кількості випробувань їхній середній результат перестає бути випадковим і може бути передбачений з достатньою точністю. Друга група теорем, звана центральної граничної, Встановлює умови, за яких закон розподілу суми великої кількості випадкових величин необмежено наближається до нормального.

На початку розглянемо нерівність Чебишева, що можна використовувати для: а) грубої оцінки ймовірностей подій, що з випадковими величинами, розподіл яких невідомо; б) докази низки теорем закону великих чисел.

Теорема 7.1. Якщо випадкова величина Xмає математичне очікування та дисперсію DX, то для будь-якого справедлива нерівність Чебишева

. (7.1)

Зазначимо, що нерівність Чебишева можна записати в іншій формі:

для частостіабо події в nнезалежних випробуваннях, у кожному з яких воно може статися з ймовірністю , дисперсія яких , нерівність Чебишева має вигляд

Нерівність (7.5) можна переписати у вигляді

. (7.6)

Приклад 7.1.Оцінити за допомогою нерівності Чебишева ймовірність того, що відхилення випадкової величини Хвід свого математичного очікування менше трьох середньо квадратичних відхилень, тобто. менше.

Рішення:

Вважаючи у формулі (7.2), отримуємо

Ця оцінка називається правилом трьох сигм.

Теорема Чебишева

Основне твердження закону великих чисел міститься у теоремі Чебишева. У ньому та інших теоремах закону великих чисел використовується поняття «збіжності випадкових величин за ймовірністю».

Випадкові величини сходяться ймовірнодо величини А (випадкової чи невипадкової), якщо будь-якого ймовірність події при прагне до одиниці, тобто.

(або ). Східність, ймовірно, символічно записують так:

Варто зазначити, що збіжність за ймовірністювимагає, щоб нерівність виконувалася для переважної кількості членівпослідовності (у математичному аналізі – для всіх n > N, де N- деяке число), а при практично всі члени послідовності повинні потрапити в ε- околиця А.

Теорема 7.3 (Закон великих чисел у формі П.Л. Чебишева). Якщо випадкові величини незалежні і існує таке число З> 0, що , то для будь-якого

, (7.7)

тобто. середнє арифметичне цих випадкових величин сходиться за ймовірністю до середнього арифметичного їх математичних очікувань:

.

Доведення. Оскільки , то

.

Тоді, застосовуючи до випадкової величини, нерівність Чебишева (7.2) маємо

тобто. середнє арифметичне випадкових величин сходиться за ймовірністю до математичного очікування а:

Доведення. Так як

а дисперсії випадкових величин, тобто обмежені, то застосувавши теорему Чебишева (7.7), отримаємо твердження (7.9).

Наслідок теореми Чебишева доводить принцип «середнього арифметичного» випадкових величин Х i, що постійно використовується на практиці. Так, нехай зроблено nнезалежних вимірів деякої величини, дійсне значення якої а(Вона невідома). Результат кожного виміру є випадковою величиною Х i. Відповідно до слідства, як наближене значення величини аможна взяти середнє арифметичне результатів вимірів:

.

Рівність тим точніше, чим більше n.

На теоремі Чебишева заснований також широко застосовуваний у статистиці вибірковий метод, Суть якого в тому, що про якість великої кількості однорідного матеріалу можна судити по невеликій його пробі.

Теорема Чебишева підтверджує зв'язок між випадковістю та необхідністю: середнє значення випадкової величини практично не відрізняється від невипадкової величини.

Теорема Бернуллі

Теорема Бернуллі історично є першою та найпростішою формою закону великих чисел. Вона теоретично доводить якість стійкості відносної частоти.

Теорема 7.4 (Закон великих чисел у формі Я. Бернуллі). Якщо ймовірність появи події Ав одному випробуванні дорівнює р, число настання цієї події при nнезалежних випробуваннях дорівнює , то для будь-якого числа має місце рівність

, (7.10)

тобто відносна частота події Асходиться ймовірно до ймовірності рподії А: .

Доведення. Введемо випадкові величини так: , якщо в i-м випробуванні з'явилася подія Аа якщо не з'явилося, то . Тоді число А(число успіхів) можна подати у вигляді

Математичне очікування та дисперсія випадкових величин рівні: , . Закон розподілу випадкових величин X i має вигляд

Х i
Р р

за будь-якого i. Таким чином, випадкові величини X iнезалежні, їх дисперсії обмежені одним і тим же числом, оскільки

.

Тому до цих випадкових величин можна застосувати теорему Чебишева

.

,

Отже, .

Теорема Бернуллі теоретично доводить можливість наближеного обчислення ймовірності події за допомогою його відносної частоти. Так, наприклад, за ймовірність народження дівчинки можна взяти відносну частоту цієї події, яка, згідно зі статистичними даними, приблизно дорівнює 0,485.

Нерівність Чебишева (7.2) для випадкових величин

набуває вигляду

де p i- ймовірність події Ав i-м випробуванні.

Приклад 7.2.Імовірність наявності друкарської помилки на одній сторінці рукопису дорівнює 0,2. Оцінити ймовірність того, що в рукописі, що містить 400 сторінок, частота появи друкарської помилки відрізняється від відповідної ймовірності по модулю менше, ніж 0,05.

Рішення:

Скористайтеся формулою (7.11). В даному випадку , , , . Маємо, тобто. .

Центральна гранична теорема

Центральна гранична теорема є другою групою граничних теорем, які встановлюють зв'язок між законом розподілу суми випадкової величини та її граничною формою - нормальним законом розподілу.

Сформулюємо центральну граничну теорему випадку, коли члени суми мають однаковий розподіл. Ця теорема найчастіше використовується практично. У математичній статистиці вибіркові випадкові величини мають однакові розподіли, оскільки отримані з однієї й тієї генеральної сукупності.

Теорема 7.5. Нехай випадкові величини незалежні, однаково розподілені, мають кінцеві математичне очікування та дисперсію. Тоді функція розподілу центрованої та нормованої суми цих випадкових величин прагне до функції розподілу стандартної нормальної випадкової величини.

Так як багато випадкових величин у додатках формуються під впливом декількох слабко залежних випадкових факторів, їх розподіл вважають нормальним. При цьому має дотримуватися умова, що жоден із факторів не є домінуючим. Центральні граничні теореми у випадках обгрунтовують застосування нормального розподілу.

Енциклопедичний YouTube

  • 1 / 5

    Нехай є нескінченна послідовність незалежних однаково розподілених випадкових величин, що мають кінцеве математичне очікування та дисперсію. Позначимо останні μ (\displaystyle \mu)і σ 2 (\displaystyle \sigma ^(2))відповідно. Нехай також

    . S n − μ n σ n → N (0 , 1) (\displaystyle (\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))\to N(0,1) )по розподілу при ,

    де N (0 , 1) (\displaystyle N(0,1))- нормальний розподіл з нульовим математичним очікуванням і стандартним відхиленням, рівним одиниці. Позначивши символом вибіркове середнє перших n (\displaystyle n)величин, тобто X n = 1 n ∑ i = 1 n X i (\displaystyle (\bar(X))_(n)=(\frac(1)(n))\sum \limits n) X_(i)), ми можемо переписати результат центральної граничної теореми у такому вигляді:

    n X n − μ σ → N (0 , 1) (\displaystyle (\sqrt (n)) N(0,1))по розподілу при n → ∞ (\displaystyle n\to \infty ).

    Швидкість збіжності можна оцінити за допомогою нерівності Беррі-Ессеєна.

    Зауваження

    • Неформально кажучи, класична центральна гранична теорема стверджує, що сума n (\displaystyle n)незалежних однаково розподілених випадкових величин має розподіл, близький до N (n μ , n σ 2) (\displaystyle N(n\mu ,n\sigma ^(2))). Еквівалентно, X n (\displaystyle (\bar (X))_(n))має розподіл близький до N (μ , σ 2 / n) (\displaystyle N(\mu ,\sigma ^(2)/n)).
    • Так як функція розподілу стандартного нормального розподілу безперервна, збіжність до цього розподілу еквівалентна поточковій збіжності функцій розподілу до функції розподілу стандартного нормального розподілу. Поклавши Z n = S n − μ n σ n (\displaystyle Z_(n)=(\frac (S_(n)-\mu n)(\sigma (\sqrt (n))))), отримуємо F Z n (x) → Φ (x) , ∀ x ∈ R (\displaystyle F_(Z_(n))(x)\Phi (x),\;\forall x\in \mathbb (R) ), де Φ (x) (\displaystyle \Phi (x))- Функція розподілу стандартного нормального розподілу.
    • Центральна гранична теорема в класичному формулюванні доводиться методом характеристичних функцій (теорема-Леві-о-безперервності).
    • Взагалі, зі збіжності функцій розподілу не випливає збіжність щільностей. Проте у цьому класичному випадку це має місце.

    Локальна Ц. П. Т.

    У припущеннях класичної формулювання, допустимо на додаток, що розподіл випадкових величин ( X i ) i = 1 ∞ (\displaystyle \(X_(i)\)_(i=1)^(\infty ))абсолютно безперервно, тобто воно має густину. Тоді розподіл також абсолютно безперервний, і більше того,

    f Z n (x) → 1 2 π e − x 2 2 (\displaystyle f_(Z_(n))(x)\to (\frac (1)(\sqrt (2\pi )))\,e^ (-(\frac (x^(2))(2))))при n → ∞ (\displaystyle n\to \infty ),

    де f Z n (x) (\displaystyle f_(Z_(n))(x))- Щільність випадкової величини Z n (\displaystyle Z_(n)), а правої частини стоїть щільність стандартного нормального розподілу.

    Узагальнення

    Результат класичної центральної граничної теореми справедливий для ситуацій набагато загальніших, ніж повна незалежність та однакова розподіленість.

    Ц. П. Т. Ліндеберга

    Нехай незалежні випадкові величини X 1 , … , X n , … (\displaystyle X_(1),\ldots ,X_(n),\ldots )визначені на тому самому імовірнісному просторі і мають кінцеві математичні очікування та дисперсії : E [ X i ] = μ i , D [ X i ] = i 2 (\displaystyle \mathbb (E) =\mu _(i),\;\mathrm (D) =\sigma _(i)^( 2)).

    Нехай S n = ∑ i = 1 n X i (\displaystyle S_(n)=\sum \limits _(i=1)^(n)X_(i)).

    Тоді E [ S n ] = m n = ∑ i = 1 n μ i , D [ S n ] = s n 2 = ∑ i = 1 n σ i 2 (\displaystyle \mathbb(E) =m_(n)=\sum \ limits _(i=1)^(n)\mu _(i),\;\mathrm (D) =s_(n)^(2)=\sum \limits _(i=1)^(n)\ sigma _(i)^(2)).

    І нехай виконується умова Ліндеберга:

    ∀ ε > 0 , lim n → ∞ ∑ i = 1 n E [ (X i − μ i) 2 s n 2 1 ( | X i − μ i | > ε s n ]] = 0 , (\displaystyle \forall \varepsilon >0,\;\lim \limits _(n\to \infty )\sum \limits _(i=1)^(n)\mathbb (E) \left[(\frac ((X_(i)-\) mu _(i))^(2))(s_(n)^(2)))\,\mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_ (n) \)) \ right] = 0,)

    де 1 ( | X i − μ i | > ε s n ) (\displaystyle \mathbf (1) _(\(|X_(i)-\mu _(i)|>\varepsilon s_(n)\))))функція - індикатор.

    за розподілом при n → ∞ (\displaystyle n\to \infty ).

    Ц. П. Т. Ляпунова

    Нехай виконано базові припущення Ц. П. Т. Ліндеберга. Нехай випадкові величини ( X i ) (\displaystyle \(X_(i)\))мають кінцевий третій момент. Тоді визначено послідовність

    r n 3 = ∑ i = 1 n E [| X i − μ i | 3 ] (\displaystyle r_(n)^(3)=\sum _(i=1)^(n)\mathbb (E) \left[|X_(i)-\mu _(i)|^(3 )\right]).

    Якщо межа

    lim n → ∞ r ns n = 0 (\displaystyle \lim \limits _(n\to \infty )(\frac (r_(n))(s_(n)))=0) (умова Ляпунова), S n − m ns n → N (0 , 1) (\displaystyle (\frac (S_(n)-m_(n))(s_(n)))\to N(0,1))за розподілом при n → ∞ (\displaystyle n\to \infty ).

    Ц. П. Т. для мартингалів

    Нехай процес (X n) n ∈ N (\displaystyle (X_(n))_(n\in \mathbb (N) ))є мартингалом з обмеженими збільшеннями. Зокрема, припустимо, що

    E [ X n + 1 − X n ∣ X 1 , … , X n ] = 0 , n ∈ N , X 0 ≡ 0 (\displaystyle \mathbb (E) \left=0,\;n\in \mathbb (N) ,\;X_(0)\equiv 0,)

    і збільшення рівномірно обмежені, тобто

    ∃ C > 0 ∀ n ∈ N | X n + 1 - X n | ≤ C (\displaystyle \exists C>0\,\forall n\in \mathbb (N) \;|X_(n+1)-X_(n)|\leq C) τ n = min ( k | ∑ i = 1 k σ i 2 ≥ n ) (k)\sigma _(i)^(2)\geq n\right.\right\)). X τ n n → N (0 , 1) (\displaystyle (\frac (X_(\tau _(n))))за розподілом при n → ∞ (\displaystyle n\to \infty ).

    Чарльз ВіланГлава з книги
    Видавництво «Манн, Іванов та Фербер»

    Нарешті, настав час підбити підсумок сказаному. Оскільки середні значення вибірок розподілені за нормальним законом (завдяки центральній граничній теоремі), ми можемо скористатися багатим потенціалом кривої нормального розподілу. Ми розраховуємо, що приблизно 68% середніх значень всіх вибірок відстоятимуть від середнього значення сукупності на відстані, яка не перевищує однієї стандартної помилки; 95% - на відстані, що не перевищує двох стандартних помилок; і 99,7% - на відстані, що не перевищує трьох стандартних помилок.

    Тепер повернемося до відхилення (розкиду) у прикладі зі зниклим автобусом - правда, цього разу покличемо на допомогу не інтуїцію, а числа. (Сам собою цей приклад залишається абсурдним; в наступному розділі ми розглянемо безліч ближчих до реальності випадків.) Припустимо, що організатори дослідження Americans" Changing Lives запросили всіх його учасників на вихідні в Бостон, щоб весело провести час і заодно надати деякі відсутні дані Учасників розподіляють довільним чином по автобусах і відвозять до тестового центру, де їх зважать, визначать зростання тощо. новин місцевого радіо та телебачення Повертаючись приблизно в той же час у своєму автомобілі з Фестивалю любителів сосисок, ви помічаєте на узбіччі дороги автобус, що зламався, схоже, його водій був змушений різко звернути вбік, намагаючись ухилитися від зіткнення з лосем, що несподівано з'явилося на дорозі. Від такого різкого маневру всі пасажири втратили свідомість або втратили дар мови, хоча ніхто з них, на рахунок не отримав серйозних травм. (Таке припущення знадобилося мені виключно для чистоти наведеного тут прикладу, а надія на відсутність у пасажирів серйозних травм пояснюється моєю вродженою людинолюбністю.) Лікарі карети швидкої допомоги, які оперативно прибули на місце події, повідомили вам, що середня вага 62 пасажирів автобуса становить 194 фунти. Крім того, виявилося (на величезне полегшення всіх любителів тварин), що лось, від зіткнення з яким намагався ухилитися водій автобуса, практично не постраждав (якщо не вважати легкого забиття задньої ноги), але від сильного переляку теж знепритомнів і лежить поряд з автобусом .

    На щастя, вам відома середня вага пасажирів автобуса, а також серед-неквадратичне відхилення для всієї сукупності Americans" Changing Lives. Крім того, ми маємо загальне уявлення про центральну граничну теорему і знаємо, як надати першу допомогу постраждалій тварині. Середня вага учасників дослідження Americans Changing Lives складає 162 фунти; середньоквадратичне відхилення дорівнює 36. На основі цієї інформації ви можете обчислити стандартну помилку для вибірки з 62 осіб (кількість пасажирів автобуса, що знепритомніли): .

    Різниця між середнім значенням цієї вибірки (194 фунти) і середнім значенням сукупності (162 фунти) дорівнює 32 фунти, тобто значно більше трьох стандартних помилок. З центральної граничної теореми вам відомо, що 99,7% середніх значень всіх вибірок відстоятимуть від середнього значення сукупності на відстані, що не перевищує трьох стандартних помилок. Таким чином, вкрай малоймовірно, що автобус, що зустрівся, перевозить групу учасників дослідження Americans" Changing Lives. Будучи видним громадським активістом міста, ви телефонуєте організаторам заходу, щоб повідомити, що в автобусі, що зустрівся вам, швидше за все, знаходиться якась інша група людей. Щоправда, у цьому випадку ви можете спиратися на статистичні результати, а не свої «інтуїтивні здогади», повідомляєте організаторам, що заперечуєте ймовірність того, що знайдений вами автобус саме той, який вони розшукують, з 99,7% довірчим рівнем. в даному випадку ви розмовляєте з людьми, знайомими зі статистикою, то можете не сумніватися, вони розуміють, що ви маєте рацію.(Завжди приємно мати справу з розумними людьми!)

    Зроблені вами висновки знаходять подальше підтвердження, коли лікарі швидкої допомоги беруть проби крові у пасажирів автобуса і виявляють, що середній рівень холестерину в їхній крові перевищує середній рівень холестерину в крові учасників дослідження Americans Changing Lives на п'ять стандартних помилок. у несвідомий стан пасажири - учасники Фестивалю аматорів сосисок.(Згодом це було незаперечно доведено.)

    [У цій історії виявився щасливий кінець. Коли до пасажирів автобуса повернулася свідомість, організатори дослідження Americans" Changing Lives порадили їм проконсультуватися у фахівців-дієтологів щодо небезпеки вживання продуктів з високим вмістом насичених жирів. Після таких консультацій багато хто з любителів сосисок вирішив порвати зі своїм ганебним минулим і повернутися до більш здорового раціону харчування.Потерпілого лося виходили у місцевій ветеринарній клініці і випустили на волю під схвальні вигуки членів місцевого Товариства захисту тварин.Так, історія чомусь замовчує долю водія автобуса.Можливо, тому, що статистика не займається долями окремо взятих людей. зовсім інша справа, замовкнути його долю не вдасться!

    У цьому розділі я намагався говорити лише про основи. Ви, напевно, звернули увагу, що центральна гранична теорема застосовна лише у випадках, коли розмір вибірки досить великий (зазвичай не менше 30). Крім того, нам потрібна відносно велика вибірка, якщо ми маємо намір припустити, що її середньоквадратичне відхилення буде приблизно таким самим, як і середньоквадратичне відхилення генеральної сукупності.

    Існує чимало статистичних поправок, які можна застосовувати у разі недотримання зазначених умов, але все це схоже на цукрову глазур на торті (і, можливо навіть на шоколадні крихти, якими присипають цю глазур зверху). "Загальна картина" тут проста і надзвичайно ефективна.

    1. Якщо ви формуєте на основі будь-якої сукупності великі (за обсягом) випадкові вибірки, то їх середні значення будуть розподілені за нормальним законом поблизу середнього значення відповідної сукупності (хоч би який вигляд мало розподіл вихідної сукупності).
    2. Більшість середніх значень вибірок буде розташовано досить близько до середнього значення сукупності (що саме слід у тому чи іншому випадку вважати «досить близьким», визначається стандартною помилкою).
    3. Центральна гранична теорема говорить нам про ймовірність того, що середнє значення вибірки буде не далі певної відстані від середнього значення сукупності. Відносно малоймовірно, що середнє значення вибірки відстоятиме від середнього значення сукупності далі, ніж на відстань двох стандартних помилок, і вкрай малоймовірно, що середнє значення вибірки відстоятиме від середнього значення сукупності далі, ніж на відстань трьох і більше стандартних помилок.
    4. Чим менша ймовірність того, що якийсь результат виявився суто випадковим, тим більше ми можемо бути впевнені в тому, що тут не обійшлося без впливу якогось іншого чинника.

    У цьому за великим рахунком і є сутність статистичного висновку. Центральна гранична теорема переважно робить усе це можливим. І доки Леброн Джеймс не стане стільки разів чемпіоном НБА, скільки Майкл Джордан (шість), центральна гранична теорема справлятиме на нас набагато більше враження, ніж знаменитий баскетболіст.

    Леброн Реймон Джеймс (LeBron Raymone James) – американський професійний баскетболіст, який грає на позиції легкого та важкого форварда за команду НБА «Клівленд Кавальєрс». Прим. перев.

    Зверніть увагу на дуже дотепне використання в даному випадку помилкової точності.

    Коли середньоквадратичне відхилення відповідної сукупності обчислюється на підставі меншої вибірки, наведена формула дещо видозмінюється: Це допомагає врахувати ту обставину, що дисперсія у малій вибірці може «недооцінювати» дисперсію всієї сукупності. Це не має особливого відношення до більш універсальних положень, про які йдеться у цьому розділі.

    Мій колега з університету Чикаго, Джим Селлі, зробив дуже важливе критичне зауваження з приводу прикладів зі зниклим автобусом. Він зазначив, що зниклий автобус - надзвичайно велика рідкість у наш час. Тому якщо нам доведеться шукати якийсь зниклий автобус, то будь-який автобус, що зустрівся нам, який виявиться зниклим або зламаним, напевно буде саме тим автобусом, який нас цікавить, якою б не була вага пасажирів у цьому автобусі. Мабуть, Джим має рацію. (Скористаюсь такою аналогією: якщо ви втратили в супермаркеті свою дитину і дирекція цього магазину повідомляє по радіо, що біля каси номер шість стоїть чия дитина, що загубилася, то ви напевно відразу ж вирішите, що йдеться саме про вашу дитину.) Отже, нам не залишається нічого іншого, як доповнити наші приклади ще одним елементом абсурду, вважаючи, що зникнення автобуса є цілком пересічною подією.

    План:

    1. Поняття центральної граничної теореми (теорема Ляпунова)

    2. Закон великих чисел, ймовірність та частота (теореми Чебишева та Бернуллі)

    1. Поняття центральної граничної теореми.

    Нормальний розподіл ймовірностей має теоретично ймовірностей велике значення. Нормальному закону підпорядковується ймовірність при стрільбі за метою, у вимірах тощо. п. Зокрема, виявляється, що закон розподілу суми досить великої кількості незалежних випадкових величин із довільними законами розподілу близький до нормального розподілу. Цей факт називається центральною граничною теоремою або теоремою Ляпунова.

    Відомо, що нормально розподілені випадкові величини поширені практично. Чим це пояснюється? Відповідь на це питання було дано

    Центральна гранична теорема.Якщо випадкова величина X являє собою суму дуже великої кількості взаємно незалежних випадкових величин, вплив кожної з яких на всю суму мізерно мало, то X має розподіл, близький до нормального розподілу.

    приклад.Нехай проводиться вимір деякої фізичної величини. Будь-який вимір дає лише наближене значення вимірюваної величини, тому що на результат вимірювання впливають дуже багато незалежних випадкових факторів (температура, коливання приладу, вологість та ін.). Кожен із цих чинників породжує нікчемну "приватну помилку". Однак, оскільки кількість цих факторів дуже велика, їхня сукупна дія породжує вже помітну «сумарну помилку».

    Розглядаючи сумарну помилку як суму дуже великої кількості взаємно незалежних приватних помилок, ми маємо право зробити висновок, що сумарна помилка має розподіл, близьке до нормального розподілу. Досвід підтверджує справедливість такого висновку.

    Розглянемо умови, за яких виконується "центральна гранична теорема"

    Х1,Х2, ..., Хn- Послідовність незалежних випадкових величин,

    M(Х1),M(Х2), ...,Mn) - кінцеві математичні очікування цих величин відповідно рівні М(Xk)= ak

    D (Х1),D(Х2), ...,Dn) - кінцеві дисперсії їх, відповідно рівні D(X k)= bk2

    Введемо позначення: S = Х1 + Х2 + ... + Хn;

    A k = Х1 + Х2 + ... + Хn =; B2 = D (Х1)+D(Х2)+...+Dn) =

    Запишемо функцію розподілу нормованої суми:

    Говорять, що до послідовності Х1,Х2, ..., Хnзастосовна центральна гранична теорема, якщо за будь-якого xфункція розподілу нормованої суми при n ® ¥ прагне нормальної функції розподілу:

    Right " style="border-collapse:collapse;border:none;margin-left:6.75pt;margin-right: 6.75pt">

    Розглянемо дискретну випадкову величину X, задану таблицею розподілу:

    Поставимо собі завдання оцінити ймовірність того, що відхилення випадкової величини від її математичного очікування не перевищує за абсолютною величиною позитивного числа ε

    Якщо ε досить мало, то ми оцінимо, таким чином, ймовірність того, що Xприйме значення, досить близькі до свого математичного очікування. довів нерівність, що дозволяє дати цікаву для нас оцінку.

    Лемма Чебишева.Дано випадкову величину X, що приймає лише невід'ємні значення з математичним очікуванням M(X). Для будь-якого числа α>0 має місце вираз:

    Нерівність Чебишева.Імовірність того, що відхилення випадкової величини X від її математичного очікування за абсолютною величиною менше позитивного числа ε , не менше ніж 1 – D(X) / ε 2:

    Р(|X-M(X) |< ε ) ³ 1 - D (Х) / ε 2.

    Зауваження.Нерівність Чебишева має практики обмежене значення, оскільки часто дає грубу, котрий іноді тривіальну (що не становить інтересу) оцінку.

    Теоретичне значення нерівності Чебишева дуже велике. Нижче скористаємося цією нерівністю для виведення теореми Чебишева.

    2.2. Теорема Чебишева

    Якщо Х1, Х2, ...,Хn..- попарно незалежні випадкові величини, причому дисперсії їх рівномірно обмежені (не перевищують постійного числа С), то, як мало не було позитивне число ε , ймовірність нерівності

    ÷ (Х1 + Х2 + ... + Хn) / n - (M (Х1) + M (Х2) + ... + M (Хn)) / n |< ε

    буде як завгодно близька до одиниці, якщо кількість випадкових величин досить велика.

    P (÷ (Х1 + Х2 + ... + Хn) / n - (M (Х1) + M (Х2) + ... + M (Хn)) / n |< ε )=1.

    Теорема Чебишева стверджує:

    1. Розглядається досить велика кількість незалежних випадкових величин, що мають обмежені дисперсії,

    Формулюючи теорему Чебишева, ми припускали, що випадкові величини мають різні математичні очікування. Насправді часто буває, що випадкові величини мають те саме математичне очікування. Очевидно, якщо знову припустити, що дисперсії цих величин обмежені, то до них буде застосовна теорема Чебишева.

    Позначимо математичне очікування кожної з випадкових величин через а;

    У цьому випадку середнє арифметичне математичних очікувань, як легко бачити, також дорівнює а.

    Можна сформулювати теорему Чебишева для окремого випадку.

    "Якщо Х1, Х2, ..., Хn ..- попарно незалежні випадкові величини, що мають одне й те саме математичне очікування а, і якщо дисперсії цих величин рівномірно обмежені, то, як би мало не було число ε > О, ймовірність нерівності

    ÷ (Х1 + Х2 + ... + Хn) / n - a | < ε

    буде як завгодно близька до одиниці, якщо кількість випадкових величин досить велика. .

    Іншими словами, в умовах теореми

    P (÷ (Х1 + Х2 + ... + Хn) / n - a |< ε ) = 1.

    2.3. Сутність теореми Чебишева

    Хоча окремі незалежні випадкові величини можуть приймати значення, далекі від своїх математичних очікувань, середнє арифметичне досить великої кількості випадкових величин з великою ймовірністю приймає значення, близькі до певного постійного числа, а саме до

    (М (Xj) + М (Х2)+... + М (Х„))/пабо до числа а вокремому випадку.

    Інакше кажучи, окремі випадкові величини може мати значний розкид, які середнє арифметичне розсіяно мало.

    Таким чином, не можна впевнено передбачити, яке можливе значення набуде кожна з випадкових величин, але можна передбачити, яке значення прийме їхнє середнє арифметичне.

    Отже, середнє арифметичне досить великої кількості незалежних випадкових величин (дисперсії яких рівномірно обмежені) втрачає характер випадкової величини.

    Пояснюється це тим, що відхилення кожної з величин від своїх математичних очікувань може бути як позитивними, і негативними, а середньому арифметичному вони взаємно погашаються.

    Теорема Чебишева справедлива як дискретних, але й безперервних випадкових величин; вона є прикладом, що підтверджує справедливість вчення про зв'язок між випадковістю та необхідністю.

    2.4. Значення теореми Чебишева для практики

    Наведемо приклади застосування теореми Чебишева до вирішення практичних завдань.

    Зазвичай для вимірювання деякої фізичної величини виробляють кілька вимірювань і їх середнє арифметичне приймають як шуканий розмір. За яких умов цей спосіб виміру можна вважати правильним? Відповідь це питання дає теорема Чебишева (її окремий випадок).

    Справді, розглянемо результати кожного виміру як випадкові величини

    Х1, Х2, ..., Хn

    цим величинам можна застосувати теорему Чебишева, якщо:

    1) Вони попарно незалежні.

    2) мають те саме математичне очікування,

    3) дисперсії їх рівномірно обмежені.

    Перша вимога виконується, якщо результат кожного виміру залежить від результатів інших.

    Друга вимога виконується, якщо виміри зроблено без систематичних (одного знаку) помилок. У цьому випадку математичні очікування всіх випадкових величин однакові і дорівнюють істинному розміру а.

    Третя вимога виконується, якщо прилад забезпечує певну точність вимірів. Хоча у своїй результати окремих вимірів різні, але розсіювання їх обмежено.

    Якщо всі зазначені вимоги виконані, ми маємо право застосувати до результатів вимірювань теорему Чебишева: за досить великого пймовірність нерівності

    | (Х1 + Хя + ... + Х„) / п - а |< ε як завгодно близька до одиниці.

    Іншими словами, при досить великій кількості вимірів майже достовірно, що їхнє середнє арифметичне як завгодно мало відрізняється від справжнього значення вимірюваної величини.

    Теорема Чебишева вказує умови, за яких описаний спосіб виміру може бути застосований. Однак помилково думати, що, збільшуючи кількість вимірювань, можна досягти як завгодно великої точності. Справа в тому, що сам прилад дає показання лише з точністю ± α, тому кожен з результатів вимірювань, а отже, і їхнє середнє арифметичне будуть отримані лише з точністю, яка не перевищує точності приладу.

    На теоремі Чебишева заснований широко застосовуваний у статистиці вибірковий метод, суть якого у тому, що у порівняно невеликий випадкової вибірці судять про всієї сукупності (генеральної сукупності) досліджуваних об'єктів.

    Наприклад, про якість стосу бавовни укладають по невеликому пучку, що складається з волокон, навмання відібраних з різних місць стосу. Хоча число волокон у пучку значно менше, ніж у стосі, сам пучок містить досить велику кількість волокон, що обчислюється сотнями.

    Як інший приклад можна зазначити визначення якості зерна по невеликий його пробі. І в цьому випадку число навмання відібраних зерен мало порівняно з усією масою зерна, але саме по собі воно досить велике.

    Вже з наведених прикладів можна зробити висновок, що для практики теорема Чебишева має неоціненне значення.

    2.5. ТеоремаБернуллі

    Виготовляється пнезалежних випробувань (не подій, а випробувань). У кожному їх ймовірність появи події Aдорівнює нар.

    Виникає питання,якою буде приблизно відносна частота появи події? На це питання відповідає теорема, доведена Бернуллі, яка отримала назву "закону великих чисел" і започаткувала теорію ймовірностей як науці.

    Теорема Бернуллі.Якщо у кожному з пнезалежних випробувань ймовірність рпояви події Апостійна, то як завгодно близька до одиниці ймовірність того, що відхилення відносної частоти від ймовірності рпо абсолютній величині буде як завгодно малим, якщо кількість випробувань досить велика.

    Іншими словами, якщо ε >0 скільки завгодно мале число, то при дотриманні умов теореми має місце рівність

    Р(|m / п - р |< ε)= 1

    Зауваження.Було б неправильним на підставі теореми Бернуллі зробити висновок, що зі зростанням числа випробувань відносна частота неухильно прагне ймовірності р;іншими словами, з теореми Бернуллі не випливає рівність (Т/п) = р,

    Утеоремі йдеться лише про ймовірність того, що при досить великій кількості випробувань відносна частота буде, як завгодно мало відрізнятиметься від постійної ймовірності появи події у кожному випробуванні.

    Завдання 7-1.

    1. Оцінити ймовірність того, що при 3600 киданнях кістки кількість появи 6 очок буде не меншою за 900.

    Рішення.Нехай x - Число появи 6 очок при 3600 кидання монети. Імовірність появи 6 очок за одного кидання дорівнює p=1/6, тоді M(x)=3600·1/6=600. Скористаємося нерівністю (лемою) Чебишева за заданого α = 900

    = P(x³ 900) £ 600 / 900 = 2 / 3

    Відповідь 2 / 3.

    2. Проведено 1000 незалежних випробувань p=0,8. Знайти ймовірність числа наступів події A у цих випробуваннях відхилиться від свого математичного очікування за модулем менше, ніж 50.

    Рішення. x – число настань події A у n – 1000 випробуваннях.

    М (Х) = 1000 · 0,8 = 800. D(x)=100·0,8·0,2=160

    Скористаємося нерівністю Чебишева за заданого ε = 50

    Р(|х-M(X) |< ε) ³ 1 - D(х) / ε 2

    Р(|х-800 |< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

    Відповідь. 0,936

    3. Використовуючи нерівність Чебишева, оцінити ймовірність того, що |Х - М(Х)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

    4. Дано: Р(|Х- М(Х)\< ε) ³ 0,9; D (X)= 0,004. Використовуючи нерівність Чебишева, знайти ε . Відповідь. 0,2.

    Контрольні питання та завдання

    1. Призначення центральної граничної теореми

    2. Умови застосування теореми Ляпунова.

    3. Відмінність леми та теореми Чебишева.

    4. Умови застосування теореми Чебишева.

    5. Умови застосування теореми Бернуллі (закону великих чисел)

    Вимоги до знань умінь та навичок

    Студент повинен знати загальносмислове формулювання центральної граничної теореми. Вміти формулювати приватні теореми для незалежних однаково розподілених випадкових величин. Розуміти нерівність Чебишева та закон великих чисел у формі Чебишева. Мати уявлення про частоту події, взаємовідносини між поняттями "ймовірність" та "частота". Мати уявлення про закон великих чисел у формі Бернуллі.

    (1857-1918), видатний російський математик