Біографії Характеристики Аналіз

Дисперсія пара. Розрахунок дисперсії у Microsoft Excel

Дисперсія у статистицізнаходиться як індивідуальних значеньознаки у квадраті від . Залежно від вихідних даних вона визначається за формулами простої та зваженої дисперсій:

1. (Для несгрупованих даних) обчислюється за формулою:

2. Зважена дисперсія (для варіаційного ряду):

де n - Частота (повторюваність фактора Х)

Приклад знаходження дисперсії

На цій сторінці описано стандартний прикладзнаходження дисперсії, також Ви можете переглянути інші завдання на її знаходження

Приклад 1. Є такі дані щодо групи з 20 студентів заочного відділення. Потрібно побудувати інтервальний ряд розподілу ознаки, розрахувати середнє значення ознаки та вивчити його дисперсію

Побудуємо інтервальне угруповання. Визначимо розмах інтервалу за формулою:

де X max - максимальне значення групувального ознаки;
X min-мінімальне значення групувальної ознаки;
n – кількість інтервалів:

Приймаємо n=5. Крок дорівнює: h = (192 - 159) / 5 = 6,6

Складемо інтервальне угруповання

Для подальших розрахунків збудуємо допоміжну таблицю:

X'i - середина інтервалу. (наприклад, середина інтервалу 159 – 165,6 = 162,3)

Середню величину зростання студентів визначимо за формулою середньої арифметичної зваженої:

Визначимо дисперсію за такою формулою:

Формулу дисперсії можна перетворити так:

З цієї формули випливає, що дисперсія дорівнює різниці середньої з квадратів варіантів і квадрата та середньої.

Дисперсія у варіаційних рядах з рівними інтерваламиза способом моментів може бути розрахована наступним способомпри використанні другої властивості дисперсії (розділивши всі варіанти на величину інтервалу). Визначення дисперсії, обчисленої за способом моментів, за такою формулою менш трудомісткий:

де i – величина інтервалу;
А - умовний нуль, як який зручно використовувати середину інтервалу, що володіє найбільшою частотою;
m1 - квадрат моменту першого порядку;
m2 - момент другого порядку

(якщо в статистичній сукупності ознака змінюється так, що є тільки два варіанти, що взаємно виключають один одного, то така мінливість називається альтернативною) може бути обчислена за формулою:

Підставляючи в цю формулудисперсії q =1-р, отримуємо:

Види дисперсії

Загальна дисперсіявимірює варіацію ознаки у всій сукупності загалом під впливом всіх чинників, що зумовлюють цю варіацію. Вона дорівнює середньому квадрату відхилень окремих значеньознаки х від загального середнього значення х може бути визначена як проста дисперсія або зважена дисперсія.

характеризує випадкову варіацію, тобто. частина варіації, яка обумовлена ​​впливом неврахованих факторів і не залежить від ознаки-фактора, покладеної в основу угруповання. Така дисперсія дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи X від середньої арифметичної групи і може бути обчислена як проста дисперсія або зважена дисперсія.

Таким чином, внутрішньогрупова дисперсія вимірюєваріацію ознаки всередині групи та визначається за формулою:

де хі - групова середня;
ni – число одиниць у групі.

Наприклад, внутрішньогрупові дисперсії, які треба визначити в задачі вивчення впливу кваліфікації робітників на рівень продуктивності праці в цеху показують варіації виробітку в кожній групі, викликані всіма можливими факторами (технічний стан обладнання, забезпеченість інструментами та матеріалами, вік робітників, інтенсивність праці і т.д.), крім відмінностей у кваліфікаційному розряді (всередині групи всі робітники мають одну й ту саму кваліфікацію).

Середня з усередині групових дисперсійвідбиває випадкову , т. е. ту частину варіації, що відбувалася під впливом всіх інших чинників, крім чинника угруповання. Вона розраховується за такою формулою:

Характеризує систематичну варіацію результативної ознаки, яка обумовлена ​​впливом ознаки-фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових середніх від загальної середньої. Міжгрупова дисперсія розраховується за такою формулою:

Правило складання дисперсії у статистиці

Згідно правилу складання дисперсійзагальна дисперсія дорівнює сумі середньої із внутрішньогрупових та міжгрупових дисперсій:

Сенс цього правилаполягає в тому, що загальна дисперсія, яка виникає під впливом всіх факторів, дорівнює сумі дисперсій, що виникають під впливом всіх інших факторів, та дисперсії, що виникає за рахунок угруповання.

Користуючись формулою дисперсій, можна визначити по двох відомим дисперсіямтретю невідому, а також судити про силу впливу групувальної ознаки.

Властивості дисперсії

1. Якщо всі значення ознаки зменшити (збільшити) на одну й ту саму постійну величину, то дисперсія від цього не зміниться.
2. Якщо всі значення ознаки зменшити (збільшити) в те саме число разів n, то дисперсія відповідно зменшиться (збільшити) в n^2 разів.

Часто у статистиці під час аналізу будь-якого явища чи процесу необхідно враховувати як інформацію про середні рівні досліджуваних показників, а й розкид чи варіацію значень окремих одиниць , Яка є важливою характеристикоюдосліджуваної сукупності.

Найбільшою мірою варіації піддаються курси акцій, обсяги попиту та пропозиції, процентні ставки в різні періодичасу та у різних місцях.

Основними показниками, що характеризують варіацію , є розмах, дисперсія, середнє квадратичне відхилення та коефіцієнт варіації.

Розмах варіації є різницею максимального і мінімального значеньознаки: R = Xmax - Xmin. Недоліком цього показника є те, що він оцінює лише межі варіювання ознаки і не відображає його коливання усередині цих кордонів.

Дисперсія позбавлена ​​цього недоліку. Вона розраховується як середній квадратвідхилень значень ознаки від їхньої середньої величини:

Спрощений спосіб розрахунку дисперсії здійснюється за допомогою наступних формул (простий та зваженої):

Приклади застосування даних формул представлені задачах 1 і 2.

Широко поширеним на практиці показником є середнє квадратичне відхилення :

Середнє квадратичне відхиленнявизначається як квадратний коріньз дисперсії і має ту ж розміреність, що і ознака, що вивчається.

Розглянуті показники дозволяють отримати абсолютне значенняваріації, тобто. оцінюють її в одиницях виміру досліджуваної ознаки. На відміну від них, коефіцієнт варіації вимірює коливання у відносному вираженні - щодо середнього рівня, що у багатьох випадках є кращим.

Формула до розрахунку коефіцієнта варіації.

Приклади розв'язання задач на тему «Показники варіації у статистиці»

Завдання 1 . При вивченні впливу реклами на розмір середньомісячного вкладу у банках району обстежено 2 банки. Отримано такі результати:

Визначити:
1) для кожного банку: а) середній розмірвкладу протягом місяця; б) дисперсію вкладу;
2) середній розмір вкладу за місяць для двох банків разом;
3) Дисперсію вкладу для 2-х банків, що залежить від реклами;
4) Дисперсію вкладу для 2-х банків, що залежить від усіх факторів, крім реклами;
5) Загальну дисперсію використовуючи правило додавання;
6) Коефіцієнт детермінації;
7) Кореляційне ставлення.

Рішення

1) Складемо розрахункову таблицю для банку з рекламою . Для визначення середнього розміру вкладу протягом місяця знайдемо середини інтервалів. При цьому величина відкритого інтервалу (першого) умовно дорівнює величині інтервалу, що примикає до нього (другого).

Середній розмір вкладу знайдемо за формулою середньої арифметичної виваженої:

29000/50 = 580 руб.

Дисперсію вкладу знайдемо за формулою:

23 400/50 = 468

Аналогічні дії зробимо для банку без реклами :

2) Знайдемо середній розмір вкладу двох банків разом. Хср = (580 × 50 +542,8 × 50) / 100 = 561,4 руб.

3) Дисперсію вкладу для двох банків, що залежить від реклами знайдемо за формулою: σ 2 =pq (формула дисперсії альтернативної ознаки). Тут р = 0,5 - частка факторів, що залежать від реклами; q=1-0,5, тоді 2 =0,5*0,5=0,25.

4) Оскільки частка інших чинників дорівнює 0,5, то дисперсія вкладу двох банків, залежить від усіх чинників крім реклами теж 0,25.

5) Визначимо загальну дисперсію, використовуючи правило додавання.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04

6) Коефіцієнт детермінації η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% – розмір вкладу на 39% залежить від реклами.

7) Емпіричне кореляційне відношення η = √η 2 = √0,39 = 0,62 – зв'язок досить тісний.

Завдання 2 . Є угруповання підприємств за величиною товарної продукції:

Визначити: 1) дисперсію величини товарної продукції; 2) середнє квадратичне відхилення; 3) коефіцієнт варіації.

Рішення

1) За умовою подано інтервальний ряд розподілу. Його необхідно висловити дискретно, тобто знайти середину інтервалу (х"). У групах закритих інтервалів середину знайдемо за простою середньою арифметичною. -200): 2 = 100).

У групах із нижнім кордоном – сумою цього нижнього кордону та половини розміру попереднього інтервалу (800+(800-600):2=900).

Розрахунок середньої величини товарної продукції робимо за такою формулою:

Хср = k×((Σ((х"-a):k)×f):Σf) + a. Тут а = 500 - розмір варіанта при найбільшій частоті k = 600-400 = 200 - розмір інтервалу при найбільшій частоті. Результат помістимо до таблиці:

Отже, середня величинатоварної продукції за період, що вивчається в цілому дорівнює Хср = (-5:37) × 200 +500 = 472,97 тис. руб.

2) Дисперсію знайдемо за такою формулою:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) середнє квадратичне відхилення: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тис. руб.

4) коефіцієнт варіації: V = (σ / Хср) * 100 = (186,94 / 472,97) * 100 = 39,52%

Теорія ймовірності - особливий розділматематики, яку вивчають лише студенти вищих навчальних закладів. Ви любите розрахунки та формули? Вас не лякають перспективи знайомства з нормальним розподілом, ентропією ансамблю, математичним очікуванням та дисперсією дискретною випадкової величини? Тоді цей предмет вам буде дуже цікавим. Давайте познайомимося з кількома найважливішими базовими поняттямицього розділу науки.

Згадаймо основи

Навіть якщо ви пам'ятаєте самі прості поняттятеорії ймовірності, не нехтуйте першими абзацами статті. Справа в тому, що без чіткого розуміння основ ви не зможете працювати з формулами, що розглядаються далі.

Отже, відбувається деяке випадкова подія, якийсь експеримент. Через війну вироблених дій ми можемо отримати кілька результатів - одні зустрічаються частіше, інші - рідше. Імовірність події - це відношення кількості реально отриманих наслідків одного типу до загальному числуможливих. Тільки знаючи класичне визначенняданого поняття, ви зможете приступити до вивчення математичного очікуваннята дисперсії безперервних випадкових величин.

Середнє арифметичне

Ще в школі на уроках математики ви починали працювати із середнім арифметичним. Це поняття широко використовується в теорії ймовірності, і тому його не можна обминути. Головним для нас на Наразіє те, що ми зіткнемося з ним у формулах математичного очікування та дисперсії випадкової величини.

Ми маємо послідовність чисел і хочемо знайти середнє арифметичне. Все, що від нас вимагається - підсумувати все існуюче та розділити на кількість елементів у послідовності. Нехай ми маємо числа від 1 до 9. Сума елементів дорівнюватиме 45, і це значення ми розділимо на 9. Відповідь: - 5.

Дисперсія

Говорячи науковою мовоюдисперсія - це середній квадрат відхилень отриманих значень ознаки від середнього арифметичного. Позначається одна заголовною латинською літерою D. Що потрібно, щоб її розрахувати? Для кожного елемента послідовності порахуємо різницю між наявним числом та середнім арифметичним і зведемо у квадрат. Значень вийде рівно стільки, скільки може бути результатів у події, що ми розглядаємо. Далі ми підсумовуємо все отримане та ділимо на кількість елементів у послідовності. Якщо у нас можливі п'ять наслідків, то ділимо на п'ять.

У дисперсії є й властивості, які потрібно запам'ятати, щоб застосовувати під час вирішення завдань. Наприклад, зі збільшенням випадкової величини у X разів, дисперсія збільшується у X у квадраті разів (т. е. X*X). Вона ніколи не буває менше нуля і не залежить від зсуву значень на рівне значенняу більшу чи меншу сторону. Крім того, для незалежних випробуваньдисперсія суми дорівнює сумі дисперсій.

Тепер нам обов'язково слід розглянути приклади дисперсії дискретної випадкової величини та математичного очікування.

Припустимо, що ми провели 21 експеримент та отримали 7 різних результатів. Кожен із них ми спостерігали, відповідно, 1,2,2,3,4,4 та 5 разів. Чому дорівнюватиме дисперсія?

Спочатку порахуємо середнє арифметичне: сума елементів, зрозуміло, дорівнює 21. Ділимо її на 7, отримуючи 3. Тепер із кожного числа вихідної послідовності віднімемо 3, кожне значення зведемо в квадрат, а результати складемо разом. Вийде 12. Тепер нам залишається розділити число на кількість елементів, і, начебто, все. Але є проблема! Давайте її обговоримо.

Залежність кількості експериментів

Виявляється, при розрахунку дисперсії у знаменнику може стояти одне з двох чисел: або N або N-1. Тут N - це число проведених експериментів або число елементів у послідовності (що, по суті, те саме). Від чого це залежить?

Якщо кількість випробувань вимірюється сотнями, ми повинні ставити в знаменник N. Якщо одиницями, то N-1. Кордон вчені вирішили провести досить символічно: на сьогоднішній день вона проходить за цифрою 30. Якщо експериментів ми провели менше 30, то ділити суму будемо на N-1, а якщо більше – то на N.

Завдання

Давайте повернемося до нашого прикладу розв'язання задачі на дисперсію та математичне очікування. Ми отримали проміжне число 12, яке потрібно було поділити на N чи N-1. Оскільки експериментів ми провели 21, що менше 30 виберемо другий варіант. Отже, відповідь: дисперсія дорівнює 12/2 = 2.

Математичне очікування

Перейдемо до другого поняття, яке ми обов'язково маємо розглянути цій статті. Математичне очікування - це результат складання всіх можливих наслідків, помножених на відповідні ймовірності. Важливо розуміти, що отримане значення, як і результат розрахунку дисперсії, виходить лише один раз для цілого завданняскільки б результатів у ній не розглядалося.

Формула математичного очікування досить проста: беремо результат, множимо з його ймовірність, додаємо те саме для другого, третього результату тощо. буд. Усе, що з цим поняттям, розраховується нескладно. Наприклад, сума матожиданий дорівнює маточку суми. Для твору актуально те саме. Такі прості операціїдозволяє із собою виконувати далеко ще не кожна величина теорії ймовірності. Давайте візьмемо завдання і порахуємо значення одразу двох вивчених понять. Крім того, ми відволікалися на теорію - настав час попрактикуватися.

Ще один приклад

Ми провели 50 випробувань і отримали 10 видів результатів - цифри від 0 до 9 - які з'являються у різному процентному відношенні. Це відповідно: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Нагадаємо, що для отримання ймовірностей потрібно розділити значення у відсотках на 100. Таким чином отримаємо 0,02; 0,1 і т.д. Представимо для дисперсії випадкової величини та математичного очікування приклад розв'язання задачі.

Середнє арифметичне розрахуємо за формулою, яку пам'ятаємо з молодшої школи: 50/10 = 5.

Тепер переведемо ймовірність у кількість наслідків «в штуках», щоб було зручніше рахувати. Отримаємо 1, 5, 2, 7, 1, 9, 3, 8, 5 і 9. З кожного отриманого значення віднімемо середнє арифметичне, після чого кожен із отриманих результатів зведемо в квадрат. Подивіться, як це зробити, з прикладу першого елемента: 1 - 5 = (-4). Далі: (-4) * (-4) = 16. Для решти значень проробіть ці операції самостійно. Якщо ви все зробили правильно, то після додавання всіх ви отримаєте 90.

Продовжимо розрахунок дисперсії та математичного очікування, розділивши 90 на N. Чому ми вибираємо N, а не N-1? Правильно тому, що кількість проведених експериментів перевищує 30. Отже: 90/10 = 9. Дисперсію ми отримали. Якщо у вас вийшло інше число, не засмучуйтесь. Швидше за все, ви припустилися банальної помилки при розрахунках. Перевірте ще раз написане, і напевно все встане на свої місця.

Зрештою, згадаємо формулу математичного очікування. Не будемо наводити всіх розрахунків, напишемо лише відповідь, з якою ви зможете звіритися, закінчивши всі необхідні процедури. Матоожидання дорівнюватиме 5,48. Нагадаємо лише, як здійснювати операції, з прикладу перших елементів: 0*0,02 + 1*0,1… тощо. Як бачите, ми просто множимо значення результату з його ймовірність.

Відхилення

Ще одне поняття, тісно пов'язане з дисперсією та математичним очікуванням – середнє квадратичне відхилення. Позначається воно або латинськими літерами sd, або грецькою малої «сигмою». Це поняттяпоказує, як у середньому відхиляються значення від центрального ознаки. Щоб знайти її значення, потрібно розрахувати квадратне коріння з дисперсії.

Якщо ви збудуєте графік нормального розподілуі захочете побачити безпосередньо на ньому квадратичного відхиленняЦе можна зробити в кілька етапів. Візьміть половину зображення зліва або праворуч від моди (центрального значення), проведіть перпендикуляр до горизонтальної осі так, щоб площі фігур були рівні. Величина відрізка між серединою розподілу і проекцією, що вийшла, на горизонтальну вісь і буде середнім квадратичним відхиленням.

Програмне забезпечення

Як видно з описів формул і наведених прикладів, розрахунки дисперсії та математичного очікування - не найпростіша процедура з арифметичної точки зору. Щоб не витрачати час, є сенс скористатися програмою, яка використовується у вищих навчальних закладах- вона називається "R". У ній є функції, що дозволяють розраховувати значення для багатьох понять із статистики та теорії ймовірності.

Наприклад, ви задаєте вектор значень. Робиться це так: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

На закінчення

Дисперсія та математичне очікування - це без яких складно надалі щось розрахувати. В основному курсі лекцій у вишах вони розглядаються вже у перші місяці вивчення предмета. Саме через нерозуміння цих найпростіших понять та невміння їх розрахувати багато студентів відразу починають відставати за програмою і пізніше отримують погані позначки за результатами сесії, що позбавляє їх стипендії.

Потренуйтесь хоча б один тиждень по півгодини на день, вирішуючи завдання, схожі на представлені в цій статті. Тоді на будь-якій контрольній теорії ймовірності ви впораєтеся з прикладами без сторонніх підказок і шпаргалок.

Дисперсія у статистиці визначається як середнє квадратичне відхилення індивідуальних значень ознаки у квадраті від середньої арифметичної. Поширений спосіб розрахунку квадратів відхилень варіантів від середньої зі своїми подальшим усередненням.

В економічно-статистичному аналізі варіацію ознаки прийнято оцінювати найчастіше за допомогою середнього квадратичного відхилення, воно є коренем квадратним з дисперсії.

(3)

Характеризує абсолютну коливання значень варіюючого ознаки виявляється у тих самих одиницях виміру, як і варіанти. У статистиці часто виникає необхідність порівняння варіації різних ознак. Для таких порівнянь використовують відносний показник варіації, коефіцієнт варіації.

Властивості дисперсії:

1)якщо з усіх варіант відняти якесь число, то дисперсія від цього не зміниться;

2) якщо всі значення варіант розділити на якесь число b, то дисперсія зменшиться в b^2 разів, тобто.

3) якщо обчислити середній квадрат відхилень від будь-якого числа з нерівного середнього арифметичного, то він буде більше дисперсії . При цьому цілком певну величину на квадрат різниці між середньою величиною поc.

Дисперсію можна визначити як різницю між середнім квадратом та середньою у квадраті.

17. Групова та міжгрупова варіації. Правило складання дисперсії

Якщо статистична сукупність розбита на групи або частини за ознакою, що вивчається, то для такої сукупності можуть бути обчислені такі види дисперсії: групові (приватні), середньо групові (приватних), і міжгрупова.

Загальна дисперсія- Відображає варіацію ознаки за рахунок всіх умов і причин, що діють у даній статистичній сукупності.

Групова дисперсія- Дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи від середньої арифметичної цієї групи, званої групової середньої. При цьому групова середня не збігається із загальною середньою для всієї сукупності.

Групова дисперсія відображає варіацію ознаки лише за рахунок умов та причин, що діють усередині групи.

Середня групова дисперсія- визначається як середнє зважене арифметичне з групових дисперсій, причому вагами є обсяги груп.

Міжгрупова дисперсія- дорівнює середньому квадрату відхилень групових середніх від загальної середньої.

Міжгрупова дисперсія характеризує варіацію результативної ознаки за рахунок групувальної ознаки.

Між розглянутими видами дисперсій існує певне співвідношення: загальна дисперсія дорівнює сумі середньої групової та міжгрупової дисперсії.

Це співвідношення називається правилом складання дисперсії.

18. Динамічний ряд та його складові елементи. Види динамічних рядів.

Ряд у статистиці- це цифрові дані, що показують, зміна явища у часі чи просторі і дають можливість виробляти статистичне порівняння явищ як у процесі їх розвитку у часі, і за різними форм і видів процесів. Завдяки цьому можна виявити взаємну залежність явищ.

Процес розвитку руху соціальних явищ у часі у статистиці прийнято називати динамікою. Для відображення динаміки будують ряди динаміки (хронологічні, тимчасові), які є рядами значень статистичного показника, що змінюються в часі (наприклад, кількість засуджених за 10 років), розташованих у хронологічному порядку. Їх складовими елементами є цифрові значення даного показника та періоди чи моменти часу, до яких вони відносяться.

Найважливіша характеристика рядів динаміки- їх розмір (обсяг, величина) того чи іншого явища, досягнутих у певний період або до певного моменту. Відповідно, величина членів низки динаміки - його рівень. Розрізняютьпочатковий, середній та кінцевий рівні динамічного ряду. Початковий рівеньпоказує величину першого, кінцевий – величину останнього члена ряду. Середній рівеньявляє собою середню хронологічну варіаційну раду і обчислюється в залежності від того, чи динамічний ряд є інтервальним або моментним.

Ще одна важлива характеристика динамічного ряду- час, що минув від початкового до кінцевого спостереження, чи кількість таких спостережень.

Існують різні види рядів динаміки, їх можна класифікувати за такими ознаками.

1) Залежно від способу вираження рівнів ряди динаміки поділяються на ряди абсолютних та похідних показників (відносних та середніх величин).

2) Залежно від того, як виражають рівні ряду стан явища на певні моменти часу (на початок місяця, кварталу, року тощо) або його величину за певні інтервали часу (наприклад, за добу, місяць, рік тощо). п.), розрізняють відповідно моментні та інтервальні ряди динаміки. Моментні лави в аналітичній роботі правоохоронних органів використовуються порівняно рідко.

Теоретично статистики виділяють раді динаміки і з інших класифікаційних ознак: залежно від відстані між рівнями - з рівнозначними рівнями і нерівними рівнями у часі; залежно від наявності основної тенденції досліджуваного процесу – стаціонарні та не стаціонарні. При аналізі динамічних рядів виходять з наступного рівні ряду у вигляді складових:

Y t = TP + Е(t)

де ТР – детермінована складова, що визначає загальну тенденцію зміни в часі або тренд.

Е (t) - випадкова компонента, що викликає коливання рівнів.

Обчислимо вMSEXCELдисперсію та стандартне відхилення вибірки. Також обчислимо дисперсію випадкової величини, якщо відомий її розподіл.

Спочатку розглянемо дисперсію, потім стандартне відхилення.

Дисперсія вибірки

Дисперсія вибірки (вибіркова дисперсія,samplevariance) характеризує розкид значень у масиві щодо .

Усі 3 формули математично еквівалентні.

З першої формули видно, що дисперсія вибіркице сума квадратів відхилень кожного значення в масиві від середнього, Поділена на розмір вибірки мінус 1.

дисперсії вибіркивикористовується функція ДИСП(), англ. назва VAR, тобто. VARiance. З версії MS EXCEL 2010 рекомендується використовувати аналог ДИСП.В() , англ. назва VARS, тобто. Sample VARiance. Крім того, починаючи з версії MS EXCEL 2010 є функція ДИСП.Г(), англ. назва VARP, тобто. Population VARiance, яка обчислює дисперсіюдля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у ДИСП.В(), у ДИСП.Г() у знаменнику просто n. До MS EXCEL 2010 для обчислення дисперсії генеральної сукупності використовувалась функція ДИСПР().

Дисперсію вибірки
=КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1)
=(СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/ (РАХУНОК(Вибірка)-1)- Звичайна формула
= СУМ((Вибірка-СРЗНАЧ(Вибірка))^2)/ (РАХУНОК(Вибірка)-1) –

Дисперсія вибіркидорівнює 0, тільки в тому випадку, якщо всі значення рівні між собою і відповідно рівні середнього значення. Зазвичай, чим більша величина дисперсіїтим більше розкид значень у масиві.

Дисперсія вибіркиє точковою оцінкою дисперсіїрозподілу випадкової величини, з якої було зроблено вибірка. Про побудову довірчих інтервалівпри оцінці дисперсіїможна прочитати у статті.

Дисперсія випадкової величини

Щоб обчислити дисперсіювипадкової величини необхідно знати її .

Для дисперсіївипадкової величини Х часто використовують позначення Var(Х). Дисперсіядорівнює квадрату відхилення від середнього E(X): Var(Х)=E[(X-E(X)) 2 ]

дисперсіяобчислюється за такою формулою:

де x i – значення, яке може набувати випадкова величина, а μ – середнє значення (), р(x) – ймовірність, що випадкова величина прийме значення х.

Якщо випадкова величина має, то дисперсіяобчислюється за такою формулою:

Розмірність дисперсіївідповідає квадрату одиниці виміру вихідних значень. Наприклад, якщо значення у вибірці є вимірювання ваги деталі (в кг), то розмірність дисперсії буде кг 2 . Це буває складно інтерпретувати, тому для характеристики розкиду значень частіше використовують величину рівну квадратному кореню. дисперсіїстандартне відхилення.

Деякі властивості дисперсії:

Var(Х + a) = Var (Х), де Х - випадкова величина, а - константа.

Var(aХ)=a 2 Var(X)

Var(Х)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Ця властивість дисперсії використовується в статті про лінійну регресію.

Var(Х+Y)=Var(Х) + Var(Y) + 2*Cov(Х;Y), де Х та Y - випадкові величини, Cov(Х;Y) - коваріація цих випадкових величин.

Якщо випадкові величини незалежні (independent), їх коваріаціядорівнює 0, отже, Var(Х+Y)=Var(Х)+Var(Y). Ця властивість дисперсії використовується при виведенні.

Покажемо, що з незалежних величин Var(Х-Y)=Var(Х+Y). Справді, Var(Х-Y)=Var(Х-Y)=Var(Х+(-Y))=Var(Х)+Var(-Y)=Var(Х)+Var(-Y)=Var( Х)+(-1) 2 Var(Y)=Var(Х)+Var(Y)=Var(Х+Y). Ця властивість дисперсії використовується для побудови.

Стандартне відхилення вибірки

Стандартне відхилення вибірки- це міра того, наскільки широко розкидані значення у вибірці щодо них.

За визначенням, стандартне відхиленняодно квадратному кореню з дисперсії:

Стандартне відхиленняне враховує величину значень у вибірці, а тільки ступінь розсіювання значень навколо них середнього. Щоб проілюструвати це наведемо приклад.

Обчислимо стандартне відхилення для 2-х вибірок: (1; 5; 9) та (1001; 1005; 1009). В обох випадках s=4. Очевидно, що відношення величини стандартного відхилення до значень масиву вибірок істотно відрізняється. Для таких випадків використовується Коефіцієнт варіації(Coefficient of Variation, CV) - ставлення Стандартне відхиленнядо середнього арифметичному, Вираженого у відсотках.

У MS EXCEL 2007 та більш ранніх версіях для обчислення Стандартне відхилення вибіркивикористовується функція = СТАНДОТКЛОН (), англ. назва STDEV, тобто. STandard DEViation. З версії MS EXCEL 2010 рекомендується використовувати її аналог = СТАНДОТКЛОН.В(), англ. назва STDEV.S, тобто. Sample STandard DEViation.

Крім того, починаючи з версії MS EXCEL 2010 є функція СТАНДОТКЛОН.Г() , англ. назва STDEV.P, тобто. Population STandard DEViation, яка обчислює стандартне відхиленнядля генеральної сукупності. Вся відмінність зводиться до знаменника: замість n-1 як у СТАНДОТКЛОН.В() , у СТАНДОТКЛОН.Г() у знаменнику просто n.

Стандартне відхиленняможна також обчислити безпосередньо за нижченаведеними формулами (див. файл прикладу)
=КОРІНЬ(КВАДРОТКЛ(Вибірка)/(РАХУНОК(Вибірка)-1))
=КОРІНЬ((СУММКВ(Вибірка)-РАХУНОК(Вибірка)*СРЗНАЧ(Вибірка)^2)/(РАХУНОК(Вибірка)-1))

Інші заходи розкиду

Функція КВАДРОТКЛ() обчислює з умму квадратів відхилень значень від них середнього. Ця функція поверне той самий результат, як і формула =ДИСП.Г( Вибірка)*РАХУНОК( Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки (). Обчислення функції КВАДРОТКЛ() проводяться за формулою:

Функція СРОТКЛ() є мірою розкиду безлічі даних. Функція СРОТКЛ() обчислює середнє абсолютних значень відхилень значень від середнього. Ця функція поверне той самий результат, що й формула =СУМПРОВИЗВ(ABS(Вибірка-СРЗНАЧ(Вибірка)))/РАХУНОК(Вибірка), де Вибірка- Посилання на діапазон, що містить масив значень вибірки.

Обчислення функції СРОТКЛ () проводяться за формулою: