Біографії Характеристики Аналіз

Математична дисперсія формула. Дисперсія дискретної випадкової величини

Обчислимо вMSEXCELдисперсію та стандартне відхилення вибірки. Також обчислимо дисперсію випадкової величини, якщо відомий її розподіл.

Спочатку розглянемо дисперсію, потім стандартне відхилення.

Дисперсія вибірки

Дисперсія вибірки (вибіркова дисперсія,samplevariance) характеризує розкид значень у масиві щодо .

Усі 3 формули математично еквівалентні.

З першої формули видно, що дисперсія вибіркице сума квадратів відхилень кожного значення в масиві від середнього, Поділена на розмір вибірки мінус 1.

дисперсії вибіркивикористовується функція ДИСП(), англ. назва VAR, тобто. VARiance. З версії MS EXCEL 2010 рекомендується використовувати аналог ДИСП.В() , англ. назва VARS, тобто. Sample VARiance. Крім того, починаючи з версії MS EXCEL 2010 є функція ДИСП.Г(), англ. назва VARP, тобто. Population VARiance, яка обчислює дисперсіюдля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у ДИСП.В(), у ДИСП.Г() у знаменнику просто n. До MS EXCEL 2010 для обчислення дисперсії генеральної сукупності використовувалась функція ДИСПР().

Дисперсію вибірки
=КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1)
=(СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/ (РАХУНОК(Вибірка)-1)- Звичайна формула
= СУМ((Вибірка-СРЗНАЧ(Вибірка))^2)/ (РАХУНОК(Вибірка)-1) –

Дисперсія вибіркидорівнює 0, тільки в тому випадку, якщо всі значення рівні між собою і відповідно рівні середнього значення. Зазвичай, чим більша величина дисперсіїтим більше розкид значень у масиві.

Дисперсія вибіркиє точковою оцінкою дисперсіїрозподілу випадкової величини, з якої було зроблено вибірка. Про побудову довірчих інтервалівпри оцінці дисперсіїможна прочитати у статті.

Дисперсія випадкової величини

Щоб обчислити дисперсіювипадкової величини необхідно знати її .

Для дисперсіївипадкової величини Х часто використовують позначення Var(Х). Дисперсіядорівнює квадрату відхилення від середнього E(X): Var(Х)=E[(X-E(X)) 2 ]

дисперсіяобчислюється за такою формулою:

де x i – значення, яке може набувати випадкова величина, а μ – середнє значення (), р(x) – ймовірність, що випадкова величина прийме значення х.

Якщо випадкова величина має, то дисперсіяобчислюється за такою формулою:

Розмірність дисперсіївідповідає квадрату одиниці виміру вихідних значень. Наприклад, якщо значення у вибірці є вимірювання ваги деталі (в кг), то розмірність дисперсії буде кг 2 . Це буває складно інтерпретувати, тому для характеристики розкиду значень частіше використовують величину рівну квадратному кореню. дисперсіїстандартне відхилення.

Деякі властивості дисперсії:

Var(Х + a) = Var (Х), де Х - випадкова величина, а - константа.

Var(aХ)=a 2 Var(X)

Var(Х)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ця властивість дисперсії використовується в статті про лінійну регресію.

Var(Х+Y)=Var(Х) + Var(Y) + 2*Cov(Х;Y), де Х та Y - випадкові величини, Cov(Х;Y) - коваріація цих випадкових величин.

Якщо випадкові величини незалежні (independent), їх коваріаціядорівнює 0, отже, Var(Х+Y)=Var(Х)+Var(Y). Ця властивість дисперсії використовується при виведенні.

Покажемо, що з незалежних величин Var(Х-Y)=Var(Х+Y). Справді, Var(Х-Y)=Var(Х-Y)=Var(Х+(-Y))=Var(Х)+Var(-Y)=Var(Х)+Var(-Y)=Var( Х)+(-1) 2 Var(Y)=Var(Х)+Var(Y)=Var(Х+Y). Ця властивість дисперсії використовується для побудови.

Стандартне відхилення вибірки

Стандартне відхилення вибірки- це міра того, наскільки широко розкидані значення у вибірці щодо них.

За визначенням, стандартне відхиленняодно квадратному кореню з дисперсії:

Стандартне відхиленняне враховує величину значень у вибірці, а тільки ступінь розсіювання значень навколо них середнього. Щоб проілюструвати це наведемо приклад.

Обчислимо стандартне відхилення для 2-х вибірок: (1; 5; 9) та (1001; 1005; 1009). В обох випадках s=4. Очевидно, що відношення величини стандартного відхилення до значень масиву вибірок істотно відрізняється. Для таких випадків використовується Коефіцієнт варіації(Coefficient of Variation, CV) - ставлення Стандартне відхиленнядо середнього арифметичному, Вираженого у відсотках.

У MS EXCEL 2007 та більш ранніх версіях для обчислення Стандартне відхилення вибіркивикористовується функція = СТАНДОТКЛОН (), англ. назва STDEV, тобто. STandard DEViation. З версії MS EXCEL 2010 рекомендується використовувати її аналог = СТАНДОТКЛОН.В(), англ. назва STDEV.S, тобто. Sample STandard DEViation.

Крім того, починаючи з версії MS EXCEL 2010 є функція СТАНДОТКЛОН.Г() , англ. назва STDEV.P, тобто. Population STandard DEViation, яка обчислює стандартне відхиленнядля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у СТАНДОТКЛОН.В() , у СТАНДОТКЛОН.Г() у знаменнику просто n.

Стандартне відхиленняможна також обчислити безпосередньо за нижченаведеними формулами (див. файл прикладу)
=КОРІНЬ(КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1))
=КОРІНЬ((СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/(РАХУНОК(Вибірка)-1))

Інші заходи розкиду

Функція КВАДРОТКЛ() обчислює з умму квадратів відхилень значень від них середнього. Ця функція поверне той самий результат, як і формула =ДИСП.Г( Вибірка)*РАХУНОК( Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки (). Обчислення функції КВАДРОТКЛ() проводяться за формулою:

Функція СРОТКЛ() є мірою розкиду безлічі даних. Функція СРОТКЛ() обчислює середнє абсолютних значень відхилень значень від середнього. Ця функція поверне той самий результат, що й формула =СУМПРОВИЗВ(ABS(Вибірка-СРЗНАЧ(Вибірка)))/РАХУНОК(Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки.

Обчислення функції СРОТКЛ () проводяться за формулою:

Варіаційний розмах (або розмах варіації)це різниця між максимальним та мінімальним значеннями ознаки:

У прикладі розмах варіації змінної вироблення робочих становить: у першій бригаді R=105-95=10 дет., у другій бригаді R=125-75=50 дет. (У 5 разів більше). Це свідчить, що вироблення 1-ї бригади більш «стійка», але резервів зростання вироблення більше в другій бригади, т.к. у разі досягнення всіма робітниками максимальної для цієї бригади виробітку, нею може бути виготовлено 3*125=375 деталей, а в 1-й бригаді лише 105*3=315 деталей.
Якщо крайні значення ознаки не типові для сукупності, використовують квартильний або децильний розмахи. Квартильний розмах RQ = Q3-Q1 охоплює 50% обсягу сукупності, децильний розмах перший RD1 = D9-D1охоплює 80% даних, другий децильний розмах RD2 = D8-D2 - 60%.
Недоліком показника варіаційного розмаху є, але його величина не відображає всі коливання ознаки.
Найпростішим узагальнюючим показником, що відображає всі коливання ознаки, є середнє лінійне відхилення, що являє собою середню арифметичну абсолютних відхилень окремих варіантів від їх середньої величини:

,
для згрупованих даних
,
де хi - значення ознаки в дискретному ряду або середина інтервалу в інтервальному розподілі.
У вищенаведених формулах різниці в чисельнику взяті за модулем, інакше, згідно з властивістю середньої арифметичної, чисельник завжди дорівнюватиме нулю. Тому середнє лінійне відхилення у статистичній практиці застосовують рідко, лише у випадках, коли підсумовування показників без урахування знака має економічний сенс. З його допомогою, наприклад, аналізується склад працюючих, рентабельність виробництва, оборот зовнішньої торгівлі.
Дисперсія ознаки- Це середній квадрат відхилень варіант від їх середньої величини:
проста дисперсія
,
зважена дисперсія
.
Формулу для розрахунку дисперсії можна спростити:

Таким чином, дисперсія дорівнює різниці середньої з квадратів варіант і квадрата середньої з варіант сукупності:
.
Однак, внаслідок підсумовування квадратів відхилень дисперсія дає спотворене уявлення про відхилення, тому її на основі розраховують середнє квадратичне відхиленнящо показує, наскільки в середньому відхиляються конкретні варіанти ознаки від їхнього середнього значення. Обчислюється шляхом вилучення квадратного кореня з дисперсії:
для несгрупованих даних
,
для варіаційного ряду

Чим менше значення дисперсії та середнього квадратичного відхилення, тим однорідніша сукупність, тим більш надійною (типовою) буде середня величина.
Середнє лінійне та середнє квадратичне відхилення - іменовані числа, тобто виражаються в одиницях виміру ознаки, ідентичні за змістом та близькі за значенням.
Розраховувати абсолютні показники варіації рекомендується з допомогою таблиць.
Таблиця 3 - Розрахунок показників варіації (на прикладі терміну даних про змінну вироблення робочих бригади)


Число робітників,

Середина інтервалу,

Розрахункові значення

Разом:

Середнє зміна вироблення робітників:

Середнє лінійне відхилення:

Дисперсія виробітку:

Середнє квадратичне відхилення виробітку окремих робітників від середнього виробітку:
.

1 Розрахунок дисперсії способом моментів

Обчислення дисперсій пов'язані з громіздкими розрахунками (особливо якщо середня величина виражена великим числом із кількома десятковими знаками). Розрахунки можна спростити, якщо використовувати спрощену формулу та властивості дисперсії.
Дисперсія має такі властивості:

  1. якщо всі значення ознаки зменшити або збільшити на ту саму величину А, то дисперсія від цього не зменшиться:

,

, то чи
Використовуючи властивості дисперсії і спочатку зменшивши всі варіанти сукупності на величину А, а потім розділивши величину інтервалу h, отримаємо формулу обчислення дисперсії в варіаційних рядах з рівними інтервалами способом моментів:
,
де - Дисперсія, обчислена за способом моментів;
h – величина інтервалу варіаційного ряду;
- Нові (перетворені) значення варіант;
А - постійна величина, в якості якої використовують середину інтервалу, що має найбільшу частоту; або варіант, що має максимальну частоту;
- Квадрат моменту першого порядку;
- Момент другого порядку.
Виконаємо розрахунок дисперсії способом моментів на основі даних про змінне вироблення робітників бригади.
Таблиця 4 - Розрахунок дисперсії за способом моментів


Групи робітників з вироблення, шт.

Число робітників,

Середина інтервалу,

Розрахункові значення

Порядок розрахунку:


  1. розраховуємо дисперсію:

2 Розрахунок дисперсії альтернативної ознаки

Серед ознак, що вивчаються статистикою, є такі, яким властиві лише два взаємно виключають значення. Це альтернативні ознаки. Їм надається відповідно два кількісні значення: варіанти 1 і 0. Частиною варіанти 1, яка позначається p, є частка одиниць, що мають дану ознаку. Різниця 1-р=q є частотою варіанти 0. Таким чином,


хі

Середня арифметична альтернативна ознака
, Оскільки p+q=1.

Дисперсія альтернативної ознаки
, т.к. 1-р = q
Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що володіють даною ознакою, і частки одиниць, що не мають цієї ознаки.
Якщо значення 1 і 0 зустрічаються однаково часто, тобто p = q, дисперсія досягає свого максимуму pq = 0,25.
Дисперсія альтернативної ознаки використовується у вибіркових обстеженнях, наприклад, якості продукції.

3 Міжгрупова дисперсія. Правило складання дисперсій

Дисперсія, на відміну інших характеристик варіації, є адитивної величиною. Тобто в сукупності, яка поділена на групи за факторною ознакою х , дисперсія результативної ознаки yможе бути розкладена на дисперсію у кожній групі (внутрішньогрупову) та дисперсію між групами (міжгрупову). Тоді, поряд із вивченням варіації ознаки по всій сукупності загалом, стає можливим вивчення варіації у кожній групі, а також між цими групами.

Загальна дисперсіявимірює варіацію ознаки упо всій сукупності під впливом всіх факторів, що спричинили цю варіацію (відхилення). Вона дорівнює середньому квадрату відхилень окремих значень ознаки увід загальної середньої та може бути обчислена як проста або зважена дисперсія.
Міжгрупова дисперсіяхарактеризує варіацію результативної ознаки у, спричинену впливом ознаки-фактора х, покладеного в основу угруповання. Вона характеризує варіацію групових середніх і дорівнює середньому квадрату відхилень групових середніх від загальної середньої.
,
де – середня арифметична i-та група;
– чисельність одиниць у i-тій групі (частота i-тої групи);
- Загальна середня сукупності.
Внутрішньогрупова дисперсіявідбиває випадкову варіацію, т. е. ту частину варіації, що викликана впливом неврахованих чинників і залежить від ознаки-фактора, покладеного основою угруповання. Вона характеризує варіацію індивідуальних значень щодо групових середніх, дорівнює середньому квадрату відхилень окремих значень ознаки увсередині групи від середньої арифметичної цієї групи (групової середньої) та обчислюється як проста або зважена дисперсія для кожної групи:
або ,
де – число одиниць групи.
На підставі внутрішньогрупових дисперсій з кожної групи можна визначити загальну середню із внутрішньогрупових дисперсій:
.
Взаємозв'язок між трьома дисперсіями отримав назву правила складання дисперсій, згідно з яким загальна дисперсія дорівнює сумі міжгрупової дисперсії та середньої з внутрішньогрупових дисперсій:

приклад. При вивченні впливу тарифного розряду (кваліфікації) робітників на рівень продуктивності їхньої праці отримані такі дані.
Таблиця 5 - Розподіл робітників по середньогодинному виробітку.



п/п

Робочі 4-го розряду

Робочі 5-го розряду

Вироблення
робітника, шт.,

Вироблення
робітника, шт.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

У цьому прикладі робітники розділені на дві групи за факторною ознакою х- кваліфікації, що характеризується їх розрядом. Результативна ознака – вироблення – варіюється як під його впливом (міжгрупова варіація), так і за рахунок інших випадкових факторів (внутрішньогрупова варіація). Завдання полягає у вимірі цих варіацій за допомогою трьох дисперсій: загальної, міжгрупової та внутрішньогрупової. Емпіричний коефіцієнт детермінації показує частку варіації результативної ознаки упід впливом факторної ознаки х. Решта загальної варіації увикликана зміною інших чинників.
У прикладі емпіричний коефіцієнт детермінації дорівнює:
або 66,7%,
Це означає, що у 66,7% варіація продуктивність праці робочих зумовлена ​​відмінностями у кваліфікації, але в 33,3% – впливом інших чинників.
Емпіричне кореляційне ставленняпоказує тісноту зв'язку між групувальною та результативними ознаками. Розраховується як квадратний корінь з емпіричного коефіцієнта детермінації:

Емпіричне кореляційне відношення, як і може приймати значення від 0 до 1.
Якщо зв'язок немає, то =0. І тут =0, тобто групові середні рівні між собою міжгрупової варіації немає. Значить групувальний ознака – чинник впливає освіту загальної варіації.
Якщо зв'язок функціональний, то =1. І тут дисперсія групових середніх дорівнює загальної дисперсії (), тобто внутригрупповой варіації немає. Це означає, що групувальна ознака повністю визначає варіацію результативної ознаки, що вивчається.
Чим ближче значення кореляційного ставлення до одиниці, тим більше, ближче до функціональної залежності зв'язок між ознаками.
Для якісної оцінки тісноти зв'язок між ознаками користуються співвідношеннями Чеддока.

У прикладі , що свідчить про тісний зв'язок між продуктивністю праці робітників та його кваліфікацією.

Поряд із вивченням варіації ознаки по всій по всій сукупності в цілому часто буває необхідно простежити кількісні зміни ознаки по групах, на які поділяється сукупність, а також між групами. Таке вивчення варіації досягається за допомогою обчислення та аналізу різних видів дисперсії.
Виділяють дисперсію загальну, міжгрупову та внутрішньогрупову.
Загальна дисперсія σ 2вимірює варіацію ознаки у всій сукупності під впливом всіх чинників, що зумовили цю варіацію, .

Міжгрупова дисперсія (δ) характеризує систематичну варіацію, тобто. відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки-фактора, покладеного в основу угруповання. Вона розраховується за такою формулою:
.

Внутрішньогрупова дисперсія (σ)відбиває випадкову варіацію, тобто. частина варіації, що відбувається під впливом неврахованих факторів і не залежить від ознаки-фактора, покладеного в основу угруповання. Вона обчислюється за такою формулою:
.

Середня із внутрішньогрупових дисперсій: .

Існує закон, що пов'язує 3 види дисперсії. Загальна дисперсія дорівнює сумі середньої з внутрішньогрупової та міжгрупової дисперсії: .
Дане співвідношення називають правилом складання дисперсій.

В аналізі широко використовується показник, що є частиною міжгрупової дисперсії в загальній дисперсії. Він має назву емпіричного коефіцієнта детермінації (? 2): .
Корінь квадратний з емпіричного коефіцієнта детермінації зветься емпіричного кореляційного відношення (η):
.
Воно характеризує вплив ознаки, покладеної в основу угруповання, на варіацію результативної ознаки. Емпіричне кореляційне відношення змінюється не більше від 0 до 1.
Покажемо його практичне використання на прикладі (табл. 1).

Приклад №1. Таблиця 1 – Продуктивність праці двох груп робітників одного з цехів НВО «Циклон»

Розрахуємо загальну та групові середні та дисперсії:




Вихідні дані для обчислення середньої внутрішньогрупової та міжгрупової дисперсії представлені в табл. 2.
Таблиця 2
Розрахунок і 2 по двох групах робочих.


Групи робітників
Чисельність робітників, чол. Середня, дет./змін. Дисперсія

Пройшли технічне навчання

5 95 42,0

Не пройшли технічне навчання

5 81 231,2

Усі робітники

10 88 185,6
Розрахуємо показники. Середня із внутрішньогрупових дисперсій:
.
Міжгрупова дисперсія

Загальна дисперсія:
Отже, емпіричне кореляційне співвідношення: .

Поряд із варіацією кількісних ознак може спостерігатися і варіація якісних ознак. Таке вивчення варіації досягається у вигляді обчислення наступних видів дисперсій:

Внутрішньогрупова дисперсія частки визначається за формулою

де n i- Чисельність одиниць в окремих групах.
Частка ознаки, що вивчається, у всій сукупності, яка визначається за формулою:
Три види дисперсії пов'язані між собою так:
.

Це співвідношення дисперсій називається теоремою складання дисперсій частки ознаки.

Теорія ймовірності – особливий розділ математики, який вивчають лише студенти вищих навчальних закладів. Ви любите розрахунки та формули? Вас не лякають перспективи знайомства з нормальним розподілом, ентропією ансамблю, математичним очікуванням та дисперсією дискретної випадкової величини? Тоді цей предмет вам буде дуже цікавим. Познайомимося з кількома найважливішими базовими поняттями цього розділу науки.

Згадаймо основи

Навіть якщо ви пам'ятаєте найпростіші поняття теорії ймовірності, не зневажайте перших абзаців статті. Справа в тому, що без чіткого розуміння основ ви не зможете працювати з формулами, що розглядаються далі.

Отже, відбувається деяка випадкова подія, якийсь експеримент. Через війну вироблених дій ми можемо отримати кілька результатів - одні зустрічаються частіше, інші - рідше. Імовірність події - це відношення кількості реально отриманих наслідків одного типу до загального числа можливих. Тільки знаючи класичне визначення даного поняття, ви зможете розпочати вивчення математичного очікування та дисперсії безперервних випадкових величин.

Середнє арифметичне

Ще в школі на уроках математики ви починали працювати із середнім арифметичним. Це поняття широко використовується в теорії ймовірності, і тому його не можна обминути. Головним для нас зараз є те, що ми зіткнемося з ним у формулах математичного очікування та дисперсії випадкової величини.

Ми маємо послідовність чисел і хочемо знайти середнє арифметичне. Все, що від нас вимагається - підсумувати все існуюче та розділити на кількість елементів у послідовності. Нехай ми маємо числа від 1 до 9. Сума елементів дорівнюватиме 45, і це значення ми розділимо на 9. Відповідь: - 5.

Дисперсія

Говорячи науковою мовою, дисперсія – це середній квадрат відхилень отриманих значень ознаки від середньої арифметичної. Позначається одна заголовною латинською літерою D. Що потрібно, щоб її розрахувати? Для кожного елемента послідовності порахуємо різницю між наявним числом та середнім арифметичним і зведемо у квадрат. Значень вийде рівно стільки, скільки може бути результатів у події, що ми розглядаємо. Далі ми підсумовуємо все отримане та ділимо на кількість елементів у послідовності. Якщо у нас можливі п'ять наслідків, то ділимо на п'ять.

У дисперсії є й властивості, які потрібно запам'ятати, щоб застосовувати під час вирішення завдань. Наприклад, зі збільшенням випадкової величини у X разів, дисперсія збільшується у X у квадраті разів (т. е. X*X). Вона ніколи не буває менше нуля і не залежить від зсуву значень на рівне значення у більшу чи меншу сторону. Крім того, для незалежних випробувань дисперсія суми дорівнює сумі дисперсій.

Тепер нам обов'язково слід розглянути приклади дисперсії дискретної випадкової величини та математичного очікування.

Припустимо, що ми провели 21 експеримент та отримали 7 різних результатів. Кожен із них ми спостерігали, відповідно, 1,2,2,3,4,4 та 5 разів. Чому дорівнюватиме дисперсія?

Спочатку порахуємо середнє арифметичне: сума елементів, зрозуміло, дорівнює 21. Ділимо її на 7, отримуючи 3. Тепер із кожного числа вихідної послідовності віднімемо 3, кожне значення зведемо в квадрат, а результати складемо разом. Вийде 12. Тепер нам залишається розділити число на кількість елементів, і, начебто, все. Але є проблема! Давайте її обговоримо.

Залежність кількості експериментів

Виявляється, при розрахунку дисперсії у знаменнику може стояти одне з двох чисел: або N або N-1. Тут N - це число проведених експериментів або число елементів у послідовності (що, по суті, те саме). Від чого це залежить?

Якщо кількість випробувань вимірюється сотнями, ми повинні ставити в знаменник N. Якщо одиницями, то N-1. Кордон вчені вирішили провести досить символічно: на сьогоднішній день вона проходить за цифрою 30. Якщо експериментів ми провели менше 30, то ділити суму будемо на N-1, а якщо більше – то на N.

Завдання

Давайте повернемося до нашого прикладу розв'язання задачі на дисперсію та математичне очікування. Ми отримали проміжне число 12, яке потрібно було поділити на N чи N-1. Оскільки експериментів ми провели 21, що менше 30 виберемо другий варіант. Отже, відповідь: дисперсія дорівнює 12/2 = 2.

Математичне очікування

Перейдемо до другого поняття, яке ми обов'язково маємо розглянути цій статті. Математичне очікування - це результат складання всіх можливих наслідків, помножених на відповідні ймовірності. Важливо розуміти, що отримане значення, як і результат розрахунку дисперсії, виходить лише один раз для цілого завдання, скільки результатів у ній не розглядалося.

Формула математичного очікування досить проста: беремо результат, множимо з його ймовірність, додаємо те саме для другого, третього результату тощо. буд. Усе, що з цим поняттям, розраховується нескладно. Наприклад, сума матожиданий дорівнює маточку суми. Для твору актуально те саме. Такі прості операції дозволяє із собою виконувати далеко не кожна величина теорії ймовірності. Давайте візьмемо завдання і порахуємо значення одразу двох вивчених понять. Крім того, ми відволікалися на теорію - настав час попрактикуватися.

Ще один приклад

Ми провели 50 випробувань і отримали 10 видів результатів – цифри від 0 до 9 – які з'являються у різному відсотковому відношенні. Це відповідно: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Нагадаємо, що для отримання ймовірностей потрібно розділити значення у відсотках на 100. Таким чином отримаємо 0,02; 0,1 і т.д. Представимо для дисперсії випадкової величини та математичного очікування приклад розв'язання задачі.

Середнє арифметичне розрахуємо за такою формулою, яку пам'ятаємо з молодшої школи: 50/10 = 5.

Тепер переведемо ймовірність у кількість наслідків «в штуках», щоб було зручніше рахувати. Отримаємо 1, 5, 2, 7, 1, 9, 3, 8, 5 і 9. З кожного отриманого значення віднімемо середнє арифметичне, після чого кожен із отриманих результатів зведемо в квадрат. Подивіться, як це зробити, з прикладу першого елемента: 1 - 5 = (-4). Далі: (-4) * (-4) = 16. Для решти значень проробіть ці операції самостійно. Якщо ви все зробили правильно, то після додавання всіх ви отримаєте 90.

Продовжимо розрахунок дисперсії та математичного очікування, розділивши 90 на N. Чому ми вибираємо N, а не N-1? Правильно тому, що кількість проведених експериментів перевищує 30. Отже: 90/10 = 9. Дисперсію ми отримали. Якщо у вас вийшло інше число, не засмучуйтесь. Швидше за все, ви припустилися банальної помилки при розрахунках. Перевірте ще раз написане, і напевно все встане на свої місця.

Зрештою, згадаємо формулу математичного очікування. Не будемо наводити всіх розрахунків, напишемо лише відповідь, з якою ви зможете звіритися, закінчивши всі необхідні процедури. Матоожидання дорівнюватиме 5,48. Нагадаємо лише, як здійснювати операції, з прикладу перших елементів: 0*0,02 + 1*0,1… тощо. Як бачите, ми просто множимо значення результату з його ймовірність.

Відхилення

Ще одне поняття, тісно пов'язане з дисперсією та математичним очікуванням – середнє квадратичне відхилення. Позначається воно або латинськими літерами sd, або грецькою «сигмою». Це поняття показує, наскільки у середньому відхиляються значення від центральної ознаки. Щоб знайти її значення, потрібно розрахувати квадратне коріння з дисперсії.

Якщо ви збудуєте графік нормального розподілу і захочете побачити безпосередньо на ньому квадратичного відхилення, це можна зробити в кілька етапів. Візьміть половину зображення зліва або праворуч від моди (центрального значення), проведіть перпендикуляр до горизонтальної осі так, щоб площі фігур були рівні. Величина відрізка між серединою розподілу і проекцією, що вийшла, на горизонтальну вісь і буде середнім квадратичним відхиленням.

Програмне забезпечення

Як видно з описів формул і наведених прикладів, розрахунки дисперсії та математичного очікування - не найпростіша процедура з арифметичної точки зору. Щоб не витрачати час, є сенс скористатися програмою, яка використовується у вищих навчальних закладах - вона називається «R». У ній є функції, що дозволяють розраховувати значення для багатьох понять із статистики та теорії ймовірності.

Наприклад, ви задаєте вектор значень. Робиться це так: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

На закінчення

Дисперсія та математичне очікування - це без яких складно надалі щось розрахувати. В основному курсі лекцій у вишах вони розглядаються вже у перші місяці вивчення предмета. Саме через нерозуміння цих найпростіших понять та невміння їх розрахувати багато студентів відразу починають відставати за програмою і пізніше отримують погані позначки за результатами сесії, що позбавляє їх стипендії.

Потренуйтесь хоча б один тиждень по півгодини на день, вирішуючи завдання, схожі на представлені в цій статті. Тоді на будь-якій контрольній теорії ймовірності ви впораєтеся з прикладами без сторонніх підказок і шпаргалок.

Основними узагальнюючими показниками варіації у статистиці є дисперсії та середнє квадратичне відхилення.

Дисперсія це середня арифметична квадратів відхилень кожного значення ознаки від загальної середньої. Дисперсія називається середнім квадратом відхилень і позначається  2 . Залежно від вихідних даних дисперсія може обчислюватися за середньою арифметичною простою або зваженою:

 дисперсія незважена (проста);

 дисперсія зважена.

Середнє квадратичне відхилення це узагальнююча характеристика абсолютних розмірів варіації ознаки у сукупності. Виражається воно у тих самих одиницях виміру, як і ознака (в метрах, тоннах, відсотках, гектарах тощо. буд.).

Середнє квадратичне відхилення являє собою квадратний корінь з дисперсії і позначається :

 середнє квадратичне відхилення незважене;

 середнє квадратичне відхилення зважене.

Середнє квадратичне відхилення є мірилом середньої надійності. Чим менше середнє квадратичне відхилення, тим краще середня арифметична відбиває всю сукупність, що представляється.

Обчислення середнього квадратичного відхилення передує розрахунок дисперсії.

Порядок розрахунку дисперсії зваженої наступний:

1) визначають середню арифметичну зважену:

2) розраховують відхилення варіантів від середньої:

3) зводять у квадрат відхилення кожного варіанта від середньої:

4) множать квадрати відхилень на ваги (частоти):

5) підсумовують отримані твори:

6) отриману суму ділять на суму ваг:

Приклад 2.1

Обчислимо середню арифметичну зважену:

Значення відхилень від середньої та його квадратів представлені у таблиці. Визначимо дисперсію:

Середнє квадратичне відхилення дорівнюватиме:

Якщо вихідні дані представлені у вигляді інтервального ряду розподілу , спочатку потрібно визначити дискретне значення ознаки, а потім застосувати викладений метод.

Приклад 2.2

Покажемо розрахунок дисперсії для інтервального ряду даних про розподіл посівної площі колгоспу за врожайністю пшениці.

Середня арифметична дорівнює:

Обчислимо дисперсію:

6.3. Розрахунок дисперсії за формулою за індивідуальними даними

Техніка обчислення дисперсії складна, а при великих значеннях варіантів та частот може бути громіздкою. Розрахунки можна спростити, використовуючи властивості дисперсії.

Дисперсія має такі властивості.

1. Зменшення або збільшення ваг (частот) варіюючої ознаки в кілька разів дисперсію не змінює.

2. Зменшення або збільшення кожного значення ознаки на ту саму постійну величину Адисперсію не змінює.

3. Зменшення або збільшення кожного значення ознаки в якесь число разів kвідповідно зменшує або збільшує дисперсію в k 2 рази середнє квадратичне відхилення  в kразів.

4. Дисперсія ознаки щодо довільної величини завжди більше дисперсії щодо середньої арифметичної на квадрат різниці між середньою та довільною величинами:

Якщо А 0, то приходимо до наступної рівності:

тобто дисперсія ознаки дорівнює різниці між середнім квадратом значень ознаки та квадратом середньої.

Кожна властивість при розрахунку дисперсії може бути застосована самостійно або у поєднанні з іншими.

Порядок розрахунку дисперсії простий:

1) визначають середню арифметичну :

2) зводять у квадрат середню арифметичну:

3) зводять у квадрат відхилення кожного варіанта ряду:

х i 2 .

4) знаходять суму квадратів варіантів:

5) ділять суму квадратів варіантів з їхньої число, т. е. визначають середній квадрат:

6) визначають різницю між середнім квадратом ознаки та квадратом середньої:

Приклад 3.1Є такі дані про продуктивність праці робочих:

Зробимо такі розрахунки: