Біографії Характеристики Аналіз

Знайти середнє квадратичне відхилення. Дисперсія

Стандартне відхилення – класичний індикатор мінливості з описової статистики.

Стандартне відхиленнясередньоквадратичне відхилення, СКО, вибіркове стандартне відхилення (англ. standard deviation, STD, STDev) - дуже поширений показник розсіювання в описовій статистиці. Проте, т.к. технічний аналіз схожий на статистику, даний показник можна (і потрібно) використовувати в технічному аналізі для виявлення ступеня розсіювання ціни аналізованого інструменту в часі. Позначається грецьким символом Сігма "σ".

Дякую Карлам Гаусс і Пірсон за те, що ми маємо можливість користуватися стандартним відхиленням.

Використовуючи стандартне відхилення у технічному аналізі, ми перетворюємо цей «показник розсіювання» в «індикатор волатильності«, Зберігаючи сенс, але змінюючи терміни.

Що являє собою стандартне відхилення

Але крім проміжних допоміжних обчислень, стандартне відхилення цілком прийнятне для самостійного обчисленнята застосування у технічному аналізі. Як зазначив активний читач нашого журналу burdock, « досі не зрозумію, чому СКО не входить до набору стандартних індикаторів вітчизняних дилінгових центрів«.

Справді, стандартне відхилення може класичним та «чистим» способом виміряти мінливість інструменту. Але на жаль, цей індикатор негаразд поширений у аналізі цінних паперів .

Застосування стандартного відхилення

Вручну обчислити стандартне відхилення не дуже цікавоале корисно для досвіду. Стандартне відхилення можна виразитиформулою STD=√[(∑(x-x ) 2)/n] , що звучить як корінь із суми квадратів різниць між елементами вибірки та середнім, поділеної на кількість елементів у вибірці.

Якщо кількість елементів у вибірці перевищує 30, то знаменник дробу під коренем набуває значення n-1. Інакше використовується n.

Покроково обчислення стандартного відхилення:

  1. обчислюємо середнє арифметичне вибірки даних
  2. забираємо це середнє від кожного елемента вибірки
  3. всі отримані різниці зводимо у квадрат
  4. сумуємо всі отримані квадрати
  5. ділимо отриману суму на кількість елементів у вибірці (або на n-1, якщо n>30)
  6. обчислюємо квадратний корінь з отриманого приватного (названого дисперсією)

За даними вибіркового обстеження проведено угруповання вкладників за розміром вкладу в Ощадбанку міста:

Визначте:

1) розмах варіації;

2) середній розмір вкладу;

3) середнє лінійне відхилення;

4) дисперсію;

5) середнє квадратичне відхилення;

6) коефіцієнт варіації вкладів.

Рішення:

Цей ряд розподілу містить відкриті інтервали. У таких рядах умовно приймається величина інтервалу першої групи дорівнює величині інтервалу наступної, а величина інтервалу останньої групи дорівнює величині інтервалу попередньої.

Величина інтервалу другої групи дорівнює 200, отже, і величина першої групи також дорівнює 200. Величина інтервалу передостанньої групи дорівнює 200, отже останній інтервал матиме величину, рівну 200.

1) Визначимо розмах варіації як різницю між найбільшим та найменшим значенням ознаки:

Розмах варіації обсягу вкладу дорівнює 1000 рублів.

2) Середній розмір вкладу визначимо за формулою середньої арифметичної зваженої.

Попередньо визначимо дискретну величину ознаки у кожному інтервалі. Для цього за формулою середньої арифметичної простий знайдемо середини інтервалів.

Середнє значення першого інтервалу дорівнюватиме:

другого - 500 і т.д.

Занесемо результати обчислень до таблиці:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, хxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Разом 400 - 312000

Середній розмір вкладу в Ощадбанку міста дорівнюватиме 780 рублів:

3) Середнє лінійне відхилення є середня арифметична з абсолютних відхилень окремих значень ознаки від загальної середньої:

Порядок розрахунку середнього лінійного відхилення в інтервальному ряду розподілу наступний:

1. Обчислюється середня арифметична зважена, як показано у п. 2).

2. Визначаються абсолютні відхилення варіантів від середньої:

3. Отримані відхилення множаться на частоти:

4. Знаходиться сума зважених відхилень без урахування знака:

5. Сума зважених відхилень ділиться на суму частот:

Зручно користуватися таблицею розрахункових даних:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Разом 400 - - - 81280

Середнє лінійне відхилення обсягу вкладу клієнтів Ощадбанку становить 203,2 рубля.

4) Дисперсія – це середня арифметична квадратів відхилень кожного значення ознаки від середньої арифметичної.

Розрахунок дисперсії в інтервальних рядах розподілу провадиться за формулою:

Порядок розрахунку дисперсії у разі наступний:

1. Визначають середню арифметичну зважену, як показано у п. 2).

2. Знаходять відхилення варіант від середньої:

3. Зводять у квадрат відхилення кожної варіанти від середньої:

4. Помножують квадрати відхилень на ваги (частоти):

5. Підсумовують отримані твори:

6. Отримана сума поділяється на суму ваг (частот):

Розрахунки оформимо до таблиці:

Розмір внеску, руб.Число вкладників, fСередина інтервалу, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Разом 400 - - - 23040000

Заняття №4

Тема: «Описова статистика. Показники різноманітності ознаки у сукупності»

Основними критеріями різноманітності ознаки у статистичній сукупності є: ліміт, амплітуда, середнє квадратичне відхилення, коефіцієнт осциляції та коефіцієнт варіації. На попередньому занятті обговорювалося, що середні величини дають лише узагальнюючу характеристику ознаки, що вивчається, в сукупності і не враховують значення окремих його варіант: мінімальне і максимальне значення, вище середнього, нижче середнього і т.д.

приклад. Середні величини двох різних числових послідовностей: -100; -20; 100; 20 та 0,1; -0,2; 0,1 абсолютно однакові та рівніО.Однак діапазони розкиду даних цих послідовностей відносного середнього значення дуже різні.

Визначення перелічених критеріїв розмаїття ознаки передусім здійснюється з урахуванням його значення окремих елементів статистичної сукупності.

Показники виміру варіації ознаки бувають абсолютніі відносні. До абсолютних показників варіації відносять: розмах варіації, ліміт, середнє відхилення, дисперсію. Коефіцієнт варіації та коефіцієнт осциляції відносяться до відносних показників варіації.

Ліміт (lim) -це критерій, який визначається крайніми значеннями варіант у варіаційному ряду. Іншими словами, даний критерій обмежується мінімальною та максимальною величинами ознаки:

Амплітуда (Am)або розмах варіації –це різниця крайніх варіантів. Розрахунок даного критерію здійснюється шляхом віднімання з максимального значення ознаки його мінімального значення, що дозволяє оцінити ступінь розкиду варіант:

Недоліком ліміту та амплітуди як критеріїв варіабельності є те, що вони повністю залежать від крайніх значень ознаки варіаційного ряду. У цьому не враховуються коливання значень ознаки всередині ряду.

Найбільш повну характеристику різноманітності ознаки у статистичній сукупності дає середнє квадратичне відхилення(сигма), яке є загальним заходом відхилення варіант від своєї середньої величини. Середнє квадратичне відхилення часто називають також стандартним відхиленням.

У основі середнього квадратичного відхилення лежить зіставлення кожної варіанти із середньої арифметичної цієї сукупності. Оскільки в сукупності завжди будуть варіанти як менше, і більше, ніж вона, то сума відхилень , мають знак " " , погашатиметься сумою відхилень, мають знак " " , тобто. сума всіх відхилень дорівнює нулю. А, щоб уникнути впливу символів різниць беруть відхилення варіант від середнього арифметичного у квадраті, тобто. . Сума квадратів відхилень не дорівнює нулю. Щоб отримати коефіцієнт, здатний виміряти мінливість, беруть середнє від суми квадратів – це величина називається дисперсії:

За змістом дисперсія – це середній квадрат відхилень індивідуальних значень ознаки від його середньої величини. Дисперсія квадрат середнього квадратичного відхилення.

Дисперсія є розмірною величиною (іменованою). Так, якщо варіанти числового ряду виражені в метрах, дисперсія дає квадратні метри; якщо варіанти виражені у кілограмах, то дисперсія дає квадрат цього заходу (кг 2), і т.д.

Середнє квадратичне відхилення- Квадратний корінь з дисперсії:

, то при розрахунку дисперсії та середнього квадратичного відхилення у знаменнику дробу замістьнеобхідно ставити.

Розрахунок середнього квадратичного відхилення можна розбити на шість етапів, які необхідно здійснити у певній послідовності:

Застосування середньоквадратичного відхилення:

а) для судження про коливання варіаційних рядів та порівняльної оцінки типовості (представницькості) середніх арифметичних величин. Це необхідно в диференціальній діагностиці щодо стійкості ознак.

б) на реконструкцію варіаційного ряду, тобто. відновлення його частотної характеристики на основі правила «трьох сигм». В інтервалі (М±3σ) знаходиться 99,7% всіх варіантів ряду, в інтервалі (М±2σ) - 95,5% та в інтервалі (М±1σ) - 68,3% варіант ряду(Рис.1).

в) для виявлення «вискакуючих» варіант

г) для визначення параметрів норми та патології за допомогою сигмальних оцінок

д) для розрахунку коефіцієнта варіації

е) до розрахунку середньої помилки середньої арифметичної величини.

Для характеристики будь-якої генеральної сукупності, що маєнормальний тип розподілу , достатньо знати два параметри: середню арифметичну та середнє квадратичне відхилення.

Малюнок 1. Правило «трьох сигм»

приклад.

У педіатрії середньоквадратичне відхилення використовують для оцінки фізичного розвитку дітей шляхом порівняння даних конкретної дитини з відповідними стандартними показниками. За стандарт беруться середні арифметичні показники фізичного розвитку здорових дітей. Порівняння показників зі стандартами проводять за спеціальними таблицями, в яких стандарти наводяться разом із відповідними їм сигмальними шкалами. Вважається, що якщо показник фізичного розвитку дитини знаходиться в межах стандарту (середнє арифметичне) ±σ, то фізичний розвиток дитини (за цим показником) відповідає нормі. Якщо показник знаходиться в межах стандарту ±2σ, то є незначне відхилення від норми. Якщо показник виходить за ці межі, то фізичний розвиток дитини різко відрізняється від норми (можлива патологія).

Крім показників варіації, що у абсолютних величинах, у статистичному дослідженні використовуються показники варіації, виражені у відносних величинах. Коефіцієнт осциляції -це відношення розмаху варіації до середньої величини ознаки. Коефіцієнт варіації -це відношення середнього квадратичного відхилення до середньої величини ознаки. Як правило, ці величини виражаються у відсотках.

Формули розрахунку відносних показників варіації:

З наведених формул видно, що чим більший коефіцієнт V наближений до нуля, тим менша варіація значень ознаки. Чим більше V, тим паче мінливий ознака.

У статистичній практиці найчастіше застосовується коефіцієнт варіації. Він використовується як для порівняльної оцінки варіації, але й характеристики однорідності сукупності. Сукупність вважається однорідною, якщо коефіцієнт варіації вбирається у 33% (для розподілів, близьких до нормального). Арифметично ставлення і середньої арифметичної нівелює вплив абсолютної величини цих характеристик, а відсоткове співвідношення робить коефіцієнт варіації величиною безрозмірною (неіменованою).

Отримане значення коефіцієнта варіації оцінюється відповідно до орієнтовних градацій ступеня різноманітності ознаки:

Слабке - до 10%

Середнє - 10 - 20%

Сильне – понад 20 %

Використання коефіцієнта варіації є доцільним у випадках, коли доводиться порівнювати ознаки різні за своєю величиною та розмірністю.

Відмінність коефіцієнта варіації з інших критеріїв розкиду наочно демонструє приклад.

Таблиця 1

Склад працівників промислового підприємства

З наведених у прикладі статистичних показників можна дійти невтішного висновку щодо відносної однорідності вікового складу та освітнього рівня працівників підприємства за низької професійної стійкості обстеженого контингенту. Неважко помітити, що спроба судити про ці соціальні тенденції за середнім квадратичним відхиленням призвела б до помилкового висновку, а спроба порівняння облікових ознак «стаж роботи» та «вік» з обліковою ознакою «освіта» взагалі була б некоректною через різнорідність цих ознак.

Медіана та перцентілі

Для порядкових (рангових) розподілів, де критерієм середини ряду є медіана, середньоквадратичне відхилення та дисперсія не можуть бути характеристиками розсіювання варіант.

Те саме властиво і для відкритих варіаційних рядів. Зазначена обставина пов'язана з тим, що відхилення, за якими обчислюються дисперсія та σ, відраховуються від середнього арифметичного, яке не обчислюється у відкритих варіаційних рядах та у рядах розподілів якісних ознак. Тому для стисненого опису розподілів використовується інший параметр розкиду – квантиль(синонім - «nерцентиль»), придатний для опису якісних та кількісних ознак за будь-якої форми їх розподілу. Цей параметр може використовуватися і для переведення кількісних ознак у якісні. І тут такі оцінки присвоюються залежно від цього, якому порядку квантилю відповідає та чи інша конкретна варіанта.

У практиці медико-біологічних досліджень найчастіше використовуються такі кванти:

- Медіана;

, – квартили (чверті), де – нижній квартиль, верхній квартиль.

Квантилі ділять область можливих змін варіантів у варіаційному ряду на певні інтервали. Медіана (квантиль) - це варіанта, яка знаходиться в середині варіаційного ряду і ділить цей ряд навпіл, на дві рівні частини ( 0,5 і 0,5 ). Квартиль ділить ряд на чотири частини: перша частина (нижній квартиль) - це варіанти, що відокремлює варіанти, числові значення яких не перевищують 25% максимально можливого в даному ряду, квартиль відокремлює варіанти з числовим значенням до 50% максимально можливого. Верхній квартиль () відокремлює варіанти завбільшки до 75% від максимально можливих значень.

У разі асиметричності розподілу змінної щодо середнього арифметичного для його характеристики використовуються медіана та квартилі.І тут використовується наступна форма відображення середньої величини – Ме (;). Наприклад, Досліджуваний ознака – «термін, у якому дитина почав самостійно ходити» - у досліджуваній групі має асиметричний розподіл. При цьому нижньому квартилю () відповідає термін початку ходьби – 9,5 місяців, медіані – 11 місяців, верхньому квартилю () – 12 місяців. Відповідно, характеристика середньої тенденції зазначеної ознаки буде представлена ​​як 11 (9,5; 12) місяців.

Оцінка статистичної значущості результатів дослідження

Під статистичної значимістю даних розуміють ступінь відповідності відображуваної дійсності, тобто. статистично значимими даними вважаються ті, які спотворюють і правильно відбивають об'єктивну реальність.

Оцінити статистичну значимість результатів дослідження – означає визначити, з якою ймовірністю можна перенести результати, отримані на вибірковій сукупності, всю генеральну сукупність. Оцінка статистичної значущості необхідна розуміння того, наскільки щодо явища можна будувати висновки про явище загалом і його закономірностях.

Оцінка статистичної значущості результатів дослідження складається з:

1. помилок репрезентативності (помилок середніх та відносних величин) - m;

2. довірчих меж середніх чи відносних величин;

3. достовірності різниці середніх чи відносних величин за критерієм t.

Стандартна помилка середньої арифметичноїабо помилка репрезентативностіхарактеризує коливання середньої. При цьому необхідно відзначити, що чим більший обсяг вибірки, тим менше розкид середніх величин. Стандартна помилка середнього обчислюється за такою формулою:

У сучасній науковій літературі середня арифметична записується разом із помилкою репрезентативності:

або разом із середньоквадратичним відхиленням:

Як приклад розглянемо дані щодо 1500 міських поліклінік країни (генеральна сукупність). Середня кількість пацієнтів, які обслуговуються в поліклініці, дорівнює 18150 осіб. Випадковий відбір 10% об'єктів (150 поліклінік) дає середню кількість пацієнтів, що дорівнює 20051 чоловік. Помилка вибірки, очевидно пов'язана з тим, що не всі 1500 поліклінік потрапили у вибірку, дорівнює різниці між цими середніми – генеральним середнім ( Mген) та вибірковим середнім ( Мвиб). Якщо сформувати іншу вибірку того самого обсягу з нашої генеральної сукупності, то вона дасть іншу величину помилки. Всі ці вибіркові середні за досить великих вибірках розподілені нормально навколо генеральної середньої за досить великої кількості повторень вибірки однієї й тієї кількості об'єктів з генеральної сукупності. Стандартна помилка середнього m- це неминучий розкид вибіркових середніх довкола генеральної середньої.

У разі коли результати дослідження представлені відносними величинами (наприклад, відсотковими частками) – розраховується стандартна помилка частки:

де P – показник %, n – кількість спостережень.

Результат відображається у вигляді (P±m)%. Наприклад,відсоток одужання серед хворих становив (95,2±2,5)%.

У тому випадку, якщо кількість елементів сукупності, то при розрахунку стандартних помилок середнього та частки у знаменнику дробу замістьнеобхідно ставити.

Для нормального розподілу (розподіл вибіркових середніх є нормальним) відомо, яка частина сукупності потрапляє у будь-який інтервал навколо середнього значення. Зокрема:

Насправді проблема полягає в тому, що характеристики генеральної сукупності нам невідомі, а вибірка робиться саме з метою їх оцінки. Це означає, що якщо ми робитимемо вибірки одного і того ж обсягу nіз генеральної сукупності, то в 68,3% випадків на інтервалі буде знаходитись значення M(воно ж у 95,5% випадків перебуватиме на інтервалі та у 99,7% випадків – на інтервалі).

Оскільки реально робиться лише одна вибірка, то формулюється це твердження у термінах ймовірності: з ймовірністю 68,3% середнє значення ознаки у генеральній сукупності укладено в інтервалі, з ймовірністю 95,5% - в інтервалі та ін.

На практиці навколо вибіркового значення будується такий інтервал, який із заданою (досить високою) ймовірністю – довірчою ймовірністю –«накривав» справжнє значення цього параметра в генеральній сукупності. Цей інтервал називається довірчим інтервалом.

Довірча ймовірністьP це ступінь упевненості в тому, що довірчий інтервал справді міститиме справжнє (невідоме) значення параметра в генеральній сукупності.

Наприклад, якщо довірча ймовірність Рдорівнює 90%, це означає, що 90 вибірок зі 100 дадуть правильну оцінку параметра в генеральній сукупності. Відповідно, можливість помилки, тобто. неправильної оцінки генерального середнього за вибіркою, що дорівнює у відсотках: . Для цього це означає, що 10 вибірок зі 100 дадуть неправильну оцінку.

Очевидно, що ступінь впевненості (довірча ймовірність) залежить від величини інтервалу: чим ширший інтервал, тим вища впевненість, що до нього потрапить невідоме значення для генеральної сукупності. Насправді для побудови довірчого інтервалу береться, як мінімум, подвоєна помилка вибірки, щоб забезпечити впевненість щонайменше 95,5%.

Визначення довірчих меж середніх і відносних величин дозволяє знайти два їх крайніх значення - мінімально можливе і максимально можливе, в межах яких показник може зустрічатися у всій генеральній сукупності. Виходячи з цього, довірчі межі (або довірчий інтервал)- це межі середніх чи відносних величин, вихід межі яких унаслідок випадкових коливань має незначну ймовірність.

Довірчий інтервал може бути переписаний у вигляді: , де t- Довірчий критерій.

Довірчі межі середньої арифметичної величини в генеральній сукупності визначають за такою формулою:

М ген = М виб + t m M

для відносної величини:

Р ген = Р виб + t m Р

де М гені Р ген- значення середньої та відносної величини для генеральної сукупності; М вибі Р виб- значення середньої та відносної величини, отримані на вибірковій сукупності; m Mі m P- помилки середньої та відносної величин; t- довірчий критерій (критерій точності, який встановлюється при плануванні дослідження і може дорівнювати 2 або 3); t m- це довірчий інтервал або Δ – гранична помилка показника, отриманого під час вибіркового дослідження.

Слід зазначити, що величина критерію tПевною мірою пов'язана з ймовірністю безпомилкового прогнозу (р), вираженої в %. Її обирає сам дослідник, керуючись необхідністю отримати результат із потрібним ступенем точності. Так, для ймовірності безпомилкового прогнозу 95,5% величина критерію tстановить 2, для 99,7% – 3.

Наведені оцінки довірчого інтервалу прийнятні лише статистичних сукупностей із кількістю спостережень понад 30. При меншому обсязі сукупності (малих вибірках) визначення критерію t користуються спеціальними таблицями. У даних таблицях шукане значення перебуває на перетині рядка, відповідної чисельності сукупності (n-1), та стовпця, що відповідає рівню ймовірності безпомилкового прогнозу (95,5%; 99,7%), обраному дослідником. У медичних дослідженнях при встановленні довірчих кордонів будь-якого показника прийнято можливість безпомилкового прогнозу 95,5% і більше. Це означає, що величина показника, отримана на вибірковій сукупності, повинна зустрічатися в генеральній сукупності як мінімум у 95,5% випадків.

    Запитання по темі заняття:

    Актуальність показників різноманітності ознаки у статистичній сукупності.

    Загальна характеристика абсолютних показників варіації.

    Середнє квадратичне відхилення, розрахунок, застосування.

    Відносні показники варіації.

    Медіана, квартильна оцінка.

    Оцінка статистичної значущості результатів дослідження.

    Стандартна помилка середньої арифметичної, формула розрахунку, приклад використання.

    Розрахунок частки та її стандартної помилки.

    Концепція довірчої ймовірності, приклад використання.

10. Поняття довірчого інтервалу, його застосування.

    Тестові завдання на тему з зразками відповідей:

1. ДО АБСОЛЮТНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) коефіцієнт варіації

2) коефіцієнт осциляції

4) медіана

2. ДО ВІДНОСНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) дисперсія

4) коефіцієнт варіації

3. КРИТЕРІЙ, ЯКИЙ ВИЗНАЧАЄТЬСЯ КРАЙНІМИ ЗНАЧЕННЯМИ ВАРІАНТ У ВАРІАЦІЙНОМУ РЯДУ

2) амплітуда

3) дисперсія

4) коефіцієнт варіації

4. РІЗНІСТЬ КРАЙНІХ ВАРІАНТ - ЦЕ

2) амплітуда

3) середнє квадратичне відхилення

4) коефіцієнт варіації

5. СЕРЕДНІЙ КВАДРАТ ВІДКЛОНЕНЬ ІНДИВІДУАЛЬНИХ ЗНАЧЕНЬ ОЗНАКУ ВІД ЙОГО СЕРЕДНЬОЇ ВЕЛИЧИНИ – ЦЕ

1) коефіцієнт осциляції

2) медіана

3) дисперсія

6. ВІДНОСИННЯ РОЗМАХУ ВАРІАЦІЇ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ПРИЗНАКУ – ЦЕ

1) коефіцієнт варіації

2) середнє квадратичне відхилення

4) коефіцієнт осциляції

7. ВІДНОСІННЯ СЕРЕДНЬОГО КВАДРАТИЧНОГО ВІДКЛОНЕННЯ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ОЗНАКУ – ЦЕ

1) дисперсія

2) коефіцієнт варіації

3) коефіцієнт осциляції

4) амплітуда

8. ВАРІАНТА, ЯКА ЗНАХОДИТЬСЯ В СЕРЕДИНІ ВАРІАЦІЙНОГО РЯДУ І ДІЛИТЬ ЙОГО НА ДВІ РІВНІ ЧАСТИНИ – ЦЕ

1) медіана

3) амплітуда

9. У МЕДИЧНИХ ДОСЛІДЖЕННЯХ ПРИ ВСТАНОВЛЕННІ ДОВЕРЧИХ КОРДОНІВ БУДЬ-ЯКОГО ПОКАЗНИКА ПРИЙНЯТА ІМОВІТНІСТЬ БЕЗПРИМИЛНОГО ПРОГНОЗУ

10. ЯКЩО 90 ВИБІРОК ЗІ 100 ДАЮТЬ ПРАВИЛЬНУ ОЦІНКУ ПАРАМЕТРА В ГЕНЕРАЛЬНІЙ СУКУПНОСТІ, ТО ЦЕ ОЗНАЧАЄ, ЩО ДОВЕРЧА ІМОВІРНІСТЬ PРІВНА

11. У РАЗІ, ЯКЩО 10 ВИБІРОК З 100 ДАЮТЬ НЕВЕРНУ ОЦІНКУ, ІМОВІТНІСТЬ ПОМИЛКИ РІВНА

12. КОРДОНИ СЕРЕДНІХ АБО ВІДНОСНИХ ВЕЛИЧИН, ВИХІД ЗА МЕЖИ ЯКИХ ВСЛІДСТВО ВИПАДКОВИХ КОЛИВАНЬ МАЄ НЕЗНАЧНУ ІМОВІРНІСТЬ – ЦЕ

1) довірчий інтервал

2) амплітуда

4) коефіцієнт варіації

13. МАЛИЙ ВИБІРКОЮ ВВАЖАЄТЬСЯ ТА СУКУПНІСТЬ, У ЯКІЙ

1) n менше або дорівнює 100

2) n менше або дорівнює 30

3) n менше або дорівнює 40

4) n близько до 0

14. ДЛЯ ймовірності безпомилкового прогнозу 95% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

15. ДЛЯ ймовірності безпомилкового прогнозу 99% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

16. ДЛЯ РОЗПОДІЛ, БЛИЗЬКИХ ДО НОРМАЛЬНОГО, СУКУПНІСТЬ ВВАЖАЄТЬСЯ ОДНОРІДНОЮ, ЯКЩО КОЕФІЦІЄНТ ВАРІАЦІЇ НЕ ПЕРЕВИЩУЄ

17. ВАРІАНТА, ЩО ВІДДІЛЮЄ ВАРІАНТИ, ЧИСЛОВІ ЗНАЧЕННЯ ЯКИХ НЕ ПЕРЕВИЩУЮТЬ 25% МАКСИМАЛЬНО МОЖЛИВОГО У ДАНОМУ РЯДУ – ЦЕ

2) нижній квартиль

3) верхній квартиль

4) квартиль

18. ДАНІ, ЯКІ НЕ СПОКАЖУЮТЬ І ПРАВИЛЬНО ВІДБИЛЯЮТЬ ОБ'ЄКТИВНУ РЕАЛЬНІСТЬ, НАЗИВАЮТЬСЯ

1) неможливі

2) рівноможливі

3) достовірні

4) випадкові

19. ЗГОДНО ПРАВИЛУ "ТРОХ СИГМ", ПРИ НОРМАЛЬНОМУ РОЗПОДІЛІ ОЗНАКУ У МЕЖАХ
БУДЕ ЗНАХОДИТИСЯ

1) 68,3% варіант

Мудрі математики та статистики вигадали більш надійний показник, хоча й дещо іншого призначення – середнє лінійне відхилення. Цей показник характеризує міру розкиду значень сукупності даних навколо їхнього середнього значення.

Для того, щоб показати міру розкиду даних потрібно спочатку визначитися, щодо чого цей самий розкид буде вважатися - зазвичай це середня величина. Далі потрібно порахувати, наскільки значення аналізованої сукупності даних далеко від середньої. Зрозуміло, що кожному значенню відповідає деяка величина відхилення, але нас цікавить загальна оцінка, що охоплює всю сукупність. Тому розраховують середнє відхилення за формулою звичайної середньої арифметичної. Але! Але для того, щоб розрахувати середнє відхилення, їх потрібно спочатку скласти. І якщо ми складемо позитивні та негативні числа, то вони взаємознищаться і їхня сума буде прагнути до нуля. Щоб цього уникнути, всі відхилення беруться за модулем, тобто всі негативні числа стають позитивними. Ось тепер середнє відхилення показуватиме узагальнену міру розкиду значень. У результаті середньо лінійне відхилення буде розраховуватися за формулою:

a- Середнє лінійне відхилення,

x– аналізований показник, з рисою зверху – середнє значення показника,

n– кількість значень у аналізованій сукупності даних,

оператор підсумовування, сподіваюся, нікого не лякає.

Розраховане за зазначеною формулою середнє лінійне відхилення відбиває середнє абсолютне відхилення від середньої величини за цією сукупністю.

На малюнку червона лінія – це середнє значення. Відхилення кожного спостереження середнього вказані маленькими стрілочками. Саме вони беруться за модулем і підсумовуються. Потім усе поділяється на кількість значень.

Для повноти картини слід навести ще й приклад. Припустимо, є фірма з виробництва живців для лопат. Кожен черешок має бути 1,5 метра завдовжки, але, що ще важливіше, усі мають бути однаковими або, принаймні, плюс-мінус 5 см. Проте недбайливі працівники то 1,2 м відпилять, то 1,8 м. Дачники незадоволені . Вирішив директор фірми провести статистичний аналіз довжини живців. Відібрав 10 штук і заміряв їх довжину, знайшов середню та розрахував середнє лінійне відхилення. Середня вийшла якраз, що треба - 1,5 м. А ось середнє лінійне відхилення вийшло 0,16 м. Ось і виходить, що кожен живець довший або коротший, ніж потрібно в середньому на 16 см. Є, про що поговорити з працівниками . Насправді я не зустрічав реального використання цього показника, тому приклад вигадав сам. Проте у статистиці є такий показник.

Дисперсія

Як і середнє лінійне відхилення, дисперсія також відбиває міру розкиду даних навколо середньої величини.

Формула для розрахунку дисперсії виглядає так:

(Для варіаційних рядів (зважена дисперсія))

(Для несгрупованих даних (проста дисперсія))

Де: σ 2 – дисперсія, Xi- аналізований показник (значення ознаки), - середнє значення показника, fi - кількість значень в аналізованій сукупності даних.

Дисперсія – це середній квадрат відхилень.

Спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат, множиться на частоту відповідного значення ознаки, складається і потім ділиться на кількість значень у даній сукупності.

Однак у чистому вигляді, як, наприклад, середня арифметична, або індекс, дисперсія не використовується. Це скоріше допоміжний та проміжний показник, який використовується для інших видів статистичного аналізу.

Спрощений спосіб розрахунку дисперсії

Середньоквадратичне відхилення

Щоб використовувати дисперсію для аналізу даних з неї витягують квадратний корінь. Виходить так зване середньоквадратичне відхилення.

До речі, стандартне відхилення ще називають сигмою – від грецької літери, якою його означають.

Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними. Як правило, середньоквадратичні показники у статистиці дають точніші результати, ніж лінійні. Отже, середньоквадратичне відхилення є точнішим показником міри розсіювання даних, ніж середнє лінійне відхилення.

Математичне очікування та дисперсія

Нехай ми вимірюємо випадкову величину Nразів, наприклад, десять разів вимірюємо швидкість вітру та хочемо знайти середнє значення. Як пов'язане середнє значення із функцією розподілу?

Кидатимемо гральний кубик велику кількість разів. Кількість очок, що випаде на кубику при кожному кидку, є випадковою величиною і може набувати будь-яких натуральних значень від 1 до 6. Середнє арифметичне випалих очок, підрахованих за всі кидки кубика, теж є випадковою величиною, проте при великих Nвоно прагне цілком конкретного числа – математичного очікування M x. В даному випадку M x = 3,5.

Як вийшла ця величина? Нехай у Nвипробуваннях разів випало 1 очко, разів – 2 очки і так далі. Тоді При N→ ∞ кількість наслідків, в яких випало одне очко, Аналогічно, Звідси

Модель 4.5. Гральні кубики

Припустимо тепер, що ми знаємо закон розподілу випадкової величини xтобто знаємо, що випадкова величина xможе приймати значення x 1 , x 2 , ..., x kз ймовірностями p 1 , p 2 , ..., p k.

Математичне очікування M xвипадкової величини xодно:

Відповідь. 2,8.

Математичне очікування який завжди є розумною оцінкою якоїсь випадкової величини. Так, для оцінки середньої заробітної плати розумніше використовувати поняття медіани, тобто такої величини, що кількість людей, які отримують меншу, ніж медіана, зарплату та більшу, збігаються.

Медіаноювипадкової величини називають число x 1/2 таке, що p (x < x 1/2) = 1/2.

Іншими словами, ймовірність p 1 того, що випадкова величина xвиявиться меншою x 1/2 , і ймовірність p 2 того, що випадкова величина xвиявиться більшою x 1/2, однакові та рівні 1/2. Медіана визначається однозначно задля всіх розподілів.

Повернемося до випадкової величини xяка може приймати значення x 1 , x 2 , ..., x kз ймовірностями p 1 , p 2 , ..., p k.

Дисперсієювипадкової величини xназивається середнє значення квадрата відхилення випадкової величини від її математичного очікування:

Приклад 2

В умовах попереднього прикладу обчислити дисперсію та середньоквадратичне відхилення випадкової величини x.

Відповідь. 0,16, 0,4.

Модель 4.6. Стрілянина в ціль

Приклад 3

Знайти розподіл ймовірності числа очок, що випали на кубику з першого кидка, медіану, математичне очікування, дисперсію та середньоквадратичне відхилення.

Випадання будь-якої грані рівноймовірне, так що розподіл виглядатиме так:

Середньоквадратичне відхилення Видно, що відхилення від середнього значення величини дуже велике.

Властивості математичного очікування:

  • Математичне очікування суми незалежних випадкових величин дорівнює сумі їх математичних очікувань:

Приклад 4

Знайти математичне очікування суми та твори очок, що випала на двох кубиках.

У прикладі 3 ми виявили, що для одного кубика M (x) = 3,5. Значить, для двох кубиків

Властивості дисперсії:

  • Дисперсія суми незалежних випадкових величин дорівнює сумі дисперсій:

D x + y = D x + D y.

Нехай за Nкидків на кубику випало yокулярів. Тоді

Цей результат є вірним не тільки для кидків кубика. Він у багатьох випадках визначає точність виміру математичного очікування досвідченим шляхом. Видно, що при збільшенні кількості вимірів Nрозкид значень навколо середнього, тобто середньоквадратичне відхилення, зменшується пропорційно

Дисперсія випадкової величини пов'язана з математичним очікуванням квадрата цієї випадкової величини наступним співвідношенням:

Знайдемо математичні очікування обох частин цієї рівності. За визначенням,

Математичне ж очікування правої частини рівності за якістю математичних очікувань дорівнює

Середнє квадратичне відхилення

Середньоквадратичне відхиленнядорівнює квадратному кореню з дисперсії:
При визначенні середнього квадратичного відхилення при досить великому обсязі сукупності, що вивчається (n > 30) застосовуються формули:

Подібна інформація.