Біографії Характеристики Аналіз

Середньоквадратичне відхилення середнього значення. Розрахуємо величину моди

Середнє квадратичне відхилення

Найбільш досконалою характеристикою варіації є середнє квадратичне відкладення, яке називають стандартом (або стандартним відхилення). Середнє квадратичне відхилення() дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від середньої арифметичної:

Середнє квадратичне відхилення просте:

Середнє зважене квадратичне відхилення застосовується для згрупованих даних:

Між середнім квадратичним і середнім лінійним відхиленнями в умовах нормального розподілу має місце наступне співвідношення: ~ 1,25.

Середнє квадратичне відхилення, будучи основною абсолютною мірою варіації, використовується при визначенні значень ординат кривої нормального розподілу, в розрахунках, пов'язаних з організацією вибіркового спостереження та встановленням точності вибіркових характеристик, а також при оцінці меж варіації ознаки в однорідній сукупності.

18. Дисперсія, її види, середньоквадратичне відхилення.

Дисперсія випадкової величини- міра розкиду цієї випадкової величини, т. е. її відхилення від математичного очікування. У статистиці часто використовується позначення чи . Квадратний корінь із дисперсії прийнято називати середньоквадратичним відхиленням, стандартним відхиленнямабо стандартним розкидом.

Загальна дисперсія (σ 2) вимірює варіацію ознаки у всій сукупності під впливом всіх факторів, що зумовили цю варіацію. Разом з тим, завдяки методу угруповань можна виділити та виміряти варіацію, зумовлену групувальною ознакою, та варіацію, що виникає під впливом неврахованих факторів.

Міжгрупова дисперсія (σ 2 м.гр) характеризує систематичну варіацію, тобто відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки - фактора, покладеного в основу угруповання.

Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - Теоретично ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середнє арифметичне сукупності вибірок.

Середньоквадратичне відхилення вимірюється в одиницях вимірювання самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірюванні лінійного взаємозв'язку між випадковими величинами. Визначається як квадратний корінь з дисперсії випадкової величини.

Середньоквадратичне відхилення:

Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування з урахуванням незміщеної оцінки її дисперсії):

де – дисперсія; - i-й елемент вибірки; - Обсяг вибірки; - середнє арифметичне вибірки:

Слід зазначити, що обидві оцінки є зміщеними. Загалом незміщену оцінку побудувати неможливо. При цьому оцінка на основі оцінки незміщеної дисперсії є заможною.

19. Сутність, сфера застосування та порядок визначення моди та медіани.

Крім статечних середніх у статистиці для відносної характеристики величини варіює ознаки та внутрішньої будови рядів розподілу користуються структурними середніми, які представлені, в основному, модою та медіаною.

Мода- це варіант ряду, що найчастіше зустрічається. Мода застосовується, наприклад, при визначенні розміру одягу, взуття, що користується найбільшим попитом у покупцем. Модою для дискретного ряду є варіанти, що володіє найбільшою частотою. При обчисленні моди для інтервального варіаційного ряду дуже важливо спочатку визначити модальний інтервал (за максимальною частотою), а потім значення модальної величини ознаки за формулою:

§ - значення моди

§ - нижня межа модального інтервалу

§ - величина інтервалу

§ - частота модального інтервалу

§ - частота інтервалу, що передує модальному

§ - частота інтервалу, наступного за модальним

Медіана -це значення ознаки, ĸᴏᴛᴏᴩᴏᴇ лежить в основі ранжованого ряду і ділить цей ряд на дві рівні за чисельністю частини.

Для визначення медіани у дискретному рядуза наявності частот спочатку обчислюють напівсуму частот, а потім визначають, яке значення варіанта припадає на неї. (Якщо відсортований ряд містить непарну кількість ознак, то номер медіани обчислюють за формулою:

М е = (n (число ознак у сукупності) + 1)/2,

у разі парного числа ознак медіана дорівнюватиме середній з двох ознак що знаходяться в середині ряду).

При обчисленні медіани для інтервального варіаційного рядуспочатку визначають медіанний інтервал, у межах якого знаходиться медіана, а потім - значення медіани за формулою:

§ - шукана медіана

§ - нижня межа інтервалу, що містить медіану

§ - величина інтервалу

§ - сума частот або число членів ряду

§ - сума накопичених частот інтервалів, що передують медіанному

§ - частота медіанного інтервалу

приклад. Знайти моду та медіану.

Рішення: У цьому прикладі модальний інтервал знаходиться в межах вікової групи 25-30 років, так як на даний інтервал припадає найбільша частота (1054).

Розрахуємо величину моди:

Це означає, що модальний вік студентів дорівнює 27 рокам.

Обчислимо медіану. Медіанний інтервал знаходиться у віковій групі 25-30 років, тому що в межах цього інтервалу розташована варіанта, яка ділить сукупність на дві рівні частини (?f i /2 = 3462/2 = 1731). Далі підставляємо у формулу необхідні числові дані та отримуємо значення медіани:

Це означає, що одна половина студентів має вік до 27,4 року, а інша понад 27,4 роки.

Крім моди та медіани бувають використані такі показники, як квартілі, що ділять ранжований ряд на 4 рівні частини, децилі -10 частин та перцентілі - на 100 частин.

20. Поняття вибіркового спостереження та сфера його застосування.

Вибіркове спостереженнязастосовується, коли застосування суцільного спостереження фізично неможливочерез великий масив даних або економічно нецільово. Фізична неможливість має місце, наприклад, щодо пасажиропотоків, ринкових цін, сімейних бюджетів. Економічна нецелесообразность має місце в оцінці якості товарів, що з їх знищенням, наприклад, дегустація, випробування цегли на міцність тощо.

Статистичні одиниці, відібрані для спостереження, становлять вибіркову сукупністьабо вибірку, а весь їх масив - генеральну сукупність(ДС). При цьому кількість одиниць у вибірціпозначають n, а у всій ГС - N. Ставлення n/Nприйнято називати відносний розмірабо частка вибірки.

Якість результатів вибіркового спостереження залежить від репрезентативності вибіркитобто від того, наскільки вона представницька в ГС. Для забезпечення репрезентативності вибірки вкрай важливо дотримуватися принцип випадковості відбору одиниць, який передбачає, що у включення одиниці ГС у вибірку неспроможна вплинути якийсь інший чинник крім випадку.

Існує 4 способи випадкового відборуу вибірку:

  1. Власне випадковийвідбір або «метод лото», коли статистичним величинам присвоюються порядкові номери, що заносяться на певні предмети (наприклад, барильця), які потім перемішуються в деякій ємності (наприклад, в мішку) і вибираються навмання. Насправді даний спосіб здійснюють за допомогою генератора випадкових чисел або математичних таблиць випадкових чисел.
  2. Механічнийвідбір, за яким відбирається кожна ( N/n)-я величина генеральної сукупності. Наприклад, якщо вона містить 100 000 величин, а потрібно вибрати 1 000, то вибірку потрапить кожна 100 000 / 1000 = 100-а величина. Причому якщо вони не ранжовані, то перша вибирається навмання з першої сотні, а номери інших будуть на сотню більше. Наприклад, якщо першою виявилася одиниця № 19, то наступною має бути № 119, потім № 219, потім № 319 і т.д. Якщо одиниці генеральної сукупності ранжовані, то першої вибирається № 50, потім № 150, потім № 250 і так далі.
  3. Відбір величин із неоднорідного масиву даних ведеться стратифікованим(Розшарованим) способом, коли генеральна сукупність попередньо розбивається на однорідні групи, до яких застосовується випадковий або механічний відбір.
  4. Особливий спосіб складання вибірки є серійнийвідбір, у якому випадково чи механічно вибирають окремі величини, які серії (послідовності з якогось номера за якийсь поспіль), всередині яких ведуть суцільне спостереження.

Якість вибіркових спостережень залежить і від типу вибірки: повторнаабо безповторна.При повторному відборістатистичні величини, що потрапили у вибірку, або їх серії після використання повертаються в генеральну сукупність, маючи шанс потрапити в нову вибірку. При цьому у всіх величин генеральної сукупності однакова ймовірність включення у вибірку. Неповторний відбірозначає, що статистичні величини, що потрапили у вибірку, або їх серії після використання не повертаються в генеральну сукупність, а тому для інших величин останньої підвищується ймовірність потрапляння в наступну вибірку.

Безповторний відбір дає більш точні результати, тому застосовується частіше. Але є ситуації, коли його не можна застосувати (вивчення пасажиропотоків, споживчого попиту тощо) і тоді ведеться повторний відбір.

21. Гранична помилка вибірки спостереження, середня помилка вибірки, порядок їх розрахунку.

Розглянемо докладно перераховані вище способи формування вибіркової сукупності і помилки репрезентативності, що виникають при цьому. Власне-випадковаВибірка ґрунтується на відборі одиниць з генеральної сукупності навмання без будь-яких елементів системності. Технічно власне-випадковий відбір проводять шляхом жеребкування (наприклад, розіграші лотерей) або за таблицею випадкових чисел.

Власне-випадковий відбір «у чистому вигляді» у практиці вибіркового спостереження застосовується рідко, але він є вихідним серед інших видів відбору, у ньому реалізуються основні принципи вибіркового спостереження. Розглянемо деякі питання теорії вибіркового методу та формули помилок для простої випадкової вибірки.

Помилка вибіркового спостереження- Це різниця між величиною параметра в генеральній сукупності, та її величиною, обчисленої за результатами вибіркового спостереження. Важливо зауважити, що для середньої кількісної ознаки помилка вибірки визначається

Показник прийнято називати граничною помилкою вибірки. Вибіркова середня є випадковою величиною, яка може набувати різних значень виходячи з того, які одиниці потрапили у вибірку. Отже, помилки вибірки є випадковими величинами і можуть приймати різні значення. З цієї причини визначають середню із можливих помилок – середню помилку вибірки, яка залежить від:

· Обсягу вибірки: чим більше чисельність, тим менше величина середньої помилки;

· ступеня зміни досліджуваного ознаки: що менше варіація ознаки, отже, і дисперсія, тим менше середня помилка вибірки.

При випадковому повторному відборісередня помилка розраховується. Практично генеральна дисперсія точно не відома, але теоретично ймовірності доведено, що . Оскільки величина за досить великих n близька до 1, вважатимуться, що . Тоді середня помилка вибірки має бути розрахована: . Але у випадках малої вибірки (при n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

При випадковій безповторній вибірцінаведені формули коригуються на величину. Тоді середня помилка безповторної вибірки: і . Т.к. завжди менше , то множник () завжди менше 1. Це означає, що середня помилка при безповторному відборі завжди менше, ніж при повторному. Механічна вибірказастосовується, коли генеральна сукупність у будь-який спосіб упорядкована (наприклад, списки виборців за алфавітом, телефонні номери, номери будинків, квартир). Відбір одиниць здійснюється через певний інтервал, що дорівнює зворотному значенню відсотка вибірки. Так за 2% вибірці відбирається кожна 50 одиниця =1/0,02 , при 5% кожна 1/0,05=20 одиниця генеральної сукупності.

Початок відліку вибирається різними способами: випадковим чином, із середини інтервалу, зі зміною початку відліку. Головне у своїй – уникнути систематичної помилки. Наприклад, при 5% вибірці, якщо першою одиницею обрана 13-та, то наступні 33, 53, 73 і т.д.

За точністю механічний відбір близький до власно-випадкової вибірки. З цієї причини для визначення середньої помилки механічної вибірки використовують формули власне-випадкового відбору.

При типовому відборіобстежувана сукупність попередньо розбивається на однорідні, однотипні групи. Наприклад, під час обстеження підприємств це бувають галузі, підгалузі, щодо населення – райони, соціальні чи вікові групи. Далі здійснюється незалежний вибір із кожної групи механічним або власне-випадковим способом.

Типова вибірка дає більш точні результати проти іншими способами. Типізація генеральної сукупності забезпечує представництво у вибірці кожної типологічної групи, що дозволяє виключити вплив міжгрупової дисперсії на середню помилку вибірки. Отже, при знаходженні помилки типової вибірки згідно з правилом складання дисперсій () дуже важливо врахувати лише середню з групових дисперсій. Тоді середня помилка вибірки: при повторному відборі, при неповторному відборі , де - Середня з внутрішньогрупових дисперсій у вибірці.

Серійний (або гніздовий) відбірзастосовується у разі, коли генеральна сукупність розбита на серії чи групи на початок вибіркового обстеження. Цими серіями бувають упаковки готової продукції, студентські групи, бригади. Серії для обстеження вибираються механічним чи власне-випадковим способом, а всередині серії проводиться суцільне обстеження одиниць. Тому середня помилка вибірки залежить тільки від міжгрупової (міжсерійної) дисперсії, яка обчислюється за формулою: де r - Число відібраних серій; - Середня і-тої серії. Середня помилка серійної вибірки розраховується: при повторному відборі, при неповторному відборі , де R - загальна кількість серій. Комбінованийвідбір є поєднанням розглянутих способів відбору.

Середня помилка вибірки за будь-якого способу відбору залежить головним чином абсолютної чисельності вибірки й у меншою мірою – від відсотка вибірки. Припустимо, що проводиться 225 спостережень у першому випадку з генеральної сукупності 4500 одиниць і у другому – 225000 одиниць. Дисперсії в обох випадках дорівнюють 25. Тоді в першому випадку при 5% відборі помилка вибірки складе: У другому випадку при 0,1%-ному відборі вона дорівнюватиме:

Τᴀᴋᴎᴎᴩᴀᴈᴏᴍ, при зменшенні відсотка вибірки в 50 разів, помилка вибірки збільшилася незначно, оскільки чисельність вибірки не змінилася. Припустимо, що кількість вибірки збільшили до 625 спостережень. У цьому випадку помилка вибірки дорівнює: Збільшення вибірки в 2,8 разу за однієї й тієї ж чисельності генеральної сукупності знижує розміри помилки вибірки більш як 1,6 разу.

22.Методи та способи формування вибіркової сукупності.

У статистиці застосовуються різні способи формування вибіркових сукупностей, що обумовлюється завданнями дослідження та залежить від специфіки об'єкта вивчення.

Основною умовою проведення вибіркового обстеження є запобігання виникненню систематичних помилок, що виникають внаслідок порушення принципу рівних можливостей потрапляння у вибірку кожної одиниці генеральної сукупності. Попередження систематичних помилок досягається внаслідок застосування науково обґрунтованих способів формування вибіркової сукупності.

Існують такі способи відбору одиниць із генеральної сукупності: 1) індивідуальний відбір - у вибірку відбираються окремі одиниці; 2) груповий відбір - у вибірку потрапляють якісно однорідні групи або серії одиниць, що вивчаються; 3) комбінований відбір - це комбінація індивідуального та групового відбору. Способи відбору визначаються правилами формування вибіркової сукупності.

Вибірка має бути:

  • власне-випадковаполягає в тому, що вибіркова сукупність утворюється в результаті випадкового (ненавмисного) відбору окремих одиниць із генеральної сукупності. При цьому кількість відібраних у вибіркову сукупність одиниць зазвичай визначається, виходячи з прийнятої частки вибірки. Частка вибірки є відношення числа одиниць вибіркової сукупності n до чисельності одиниць генеральної сукупності N, н.
  • механічнаполягає в тому, що відбір одиниць у вибіркову сукупність виробляється з генеральної сукупності, розбитої на рівні інтервали (групи). При цьому розмір інтервалу в генеральній сукупності дорівнює зворотній величині частки вибірки. Так, при 2% вибірці відбирається кожна 50-а одиниця (1:0,02), при 5% вибірці - кожна 20 одиниця (1:0,05) і т.д. Τᴀᴋᴎᴎᴩᴀᴈᴏᴍ, відповідно до прийнятої часткою відбору, генеральна сукупність механічно розбивається на рівновеликі групи. З кожної групи у вибірку відбирається лише одна одиниця.
  • типова -при якій генеральна сукупність спочатку розчленовується на однорідні типові групи. Далі з кожної типової групи власне-випадковою або механічною вибіркою проводиться індивідуальний відбір одиниць у вибіркову сукупність. Важливою особливістю типової вибірки і те, що вона дає точніші результати проти іншими способами відбору одиниць у вибіркову сукупність;
  • серійна- за якої генеральну сукупність ділять на однакові за обсягом групи - серії. У вибіркову сукупність відбираються серії. Усередині серій проводиться суцільне спостереження одиниць, що потрапили до серії;
  • комбінована- вибірка має бути двоступінчастою. У цьому генеральна сукупність спочатку розбивається групи. Далі здійснюють відбір груп, а всередині останніх здійснюється відбір окремих одиниць.

У статистиці розрізняють такі методи відбору одиниць у вибіркову сукупність:

  • одноступінчаставибірка - кожна відібрана одиниця відразу ж піддається вивченню за заданою ознакою (власне-випадкова та серійна вибірки);
  • багатоступінчаставибірка - виробляють підбір з генеральної сукупності окремих груп, та якщо з груп вибираються окремі одиниці (типова вибірка з механічним способом відбору одиниць у вибіркову сукупність).

Крім того розрізняють:

  • повторний відбір- За схемою повернутої кулі. При цьому кожна одиниця, що потрапила у вибірку, іди серія повертається в генеральну сукупність і у зв'язку з цим має шанс знову потрапити у вибірку;
  • безповторний відбір- За схемою неповернутої кулі. Він має більш точні результати при тому самому об'ємі вибірки.

23. Визначення вкрай важливого обсягу вибірки (використання таблиці Стьюдента).

Одним із наукових принципів у теорії вибіркового методу є забезпечення достатньої кількості відібраних одиниць. Теоретично вкрай важливість дотримання цього принципу представлена ​​в доказах граничних теорем теорії ймовірностей, які дозволяють встановити, який обсяг одиниць слід вибрати з генеральної сукупності, щоб він був достатнім і забезпечував репрезентативність вибірки.

Зменшення стандартної помилки вибірки, а отже, збільшення точності оцінки завжди пов'язане зі збільшенням обсягу вибірки, у зв'язку з цим вже на стадії організації вибіркового спостереження доводиться вирішувати питання про те, яким має бути обсяг вибіркової сукупності, щоб була забезпечена необхідна точність результатів спостережень. . Розрахунок вкрай важливого обсягу вибірки будується за допомогою формул, виведених з формул граничних помилок вибірки (А), відповідних тому чи іншому виду та способу відбору. Так, для випадкового повторного обсягу вибірки (n) маємо:

Суть цієї формули - у тому, що при випадковому повторному відборі вкрай важливою чисельністю обсяг вибірки прямо пропорційний квадрату коефіцієнта довіри. (t2)і дисперсії варіаційної ознаки (?2) і обернено пропорційний квадрату граничної помилки вибірки (?2). Зокрема, зі збільшенням граничної помилки вдвічі необхідна чисельність вибірки має бути зменшена вчетверо. З трьох параметрів два (t і?) задаються дослідником. У цьому дослідник з мети

та завдань вибіркового обстеження має вирішити питання: у якому кількісному поєднанні краще включити ці параметри для забезпечення оптимального варіанта? В одному випадку його може більше влаштовувати надійність отриманих результатів (t), ніж міра точності (?), В іншому – навпаки. Складніше вирішити питання щодо величини граничної помилки вибірки, оскільки цим показником дослідник на стадії проектування вибіркового спостереження не має, у зв'язку з цим у практиці прийнято ставити величину граничної помилки вибірки, як правило, в межах до 10% передбачуваного середнього рівня ознаки . До встановлення передбачуваного середнього рівня можна підходити по-різному: використовувати дані подібних раніше проведених обстежень або скористатися даними основи вибірки і зробити невелику пробну вибірку.

Найбільш складно встановити під час проектування вибіркового спостереження третій параметр у формулі (5.2) – дисперсію вибіркової сукупності. У цьому випадку дуже важливо використовувати всю інформацію, наявну в розпорядженні дослідника, отриману в раніше проведених подібних та пробних обстеженнях.

Питання про визначення вкрай важливої ​​чисельності вибірки ускладнюється, якщо вибіркове обстеження передбачає вивчення кількох ознак одиниць відбору. У цьому випадку середні рівні кожної з ознак та їх варіація, як правило, різні, і у зв'язку з цим вирішити питання про те, дисперсії якої з ознак віддати перевагу, можливо лише з урахуванням мети та завдань обстеження.

При проектуванні вибіркового спостереження передбачаються заздалегідь задана величина припустимої помилки вибірки відповідно до завдань конкретного дослідження та ймовірність висновків за результатами спостереження.

Загалом формула граничної помилки вибіркової середньої величини дозволяє визначати:

‣‣‣ величину можливих відхилень показників генеральної сукупності від показників вибіркової сукупності;

‣‣‣ необхідну чисельність вибірки, що забезпечує необхідну точність, коли межі можливої ​​помилки не перевищать деякої заданої величини;

‣‣‣ ймовірність того, що у проведеній вибірці помилка матиме задану межу.

Розподіл Стьюдентатеоретично ймовірностей - це однопараметричне сімейство абсолютно безперервних розподілів.

24. Ряди динаміки (інтервальні, моментні), змикання рядів динаміки.

Ряди динаміки- це значення статистичних показників, які представлені в певній хронологічній послідовності.

Кожен динамічний ряд містить дві складові:

1) показники періодів часу(Роки, квартали, місяці, дні або дати);

2) показники, що характеризують досліджуваний об'єктза тимчасові періоди або на відповідні дати, які називають рівнями ряду.

Рівні низки виражаються як абсолютними, і середніми чи відносними величинами. Враховуючи залежність від характеру показників будують динамічні ряди абсолютних, відносних та середніх величин. Ряди динаміки з відносних і середніх величин будують з урахуванням похідних рядів абсолютних величин. Розрізняють інтервальні та моментні ряди динаміки.

Динамічний інтервальний рядмістить значення показників за певні періоди часу. В інтервальному ряду рівні можна підсумовувати, одержуючи обсяг явища за триваліший період, або звані накопичені результати.

Динамічний моментний рядвідображає значення показників на певний момент часу (дату часу). У моментних рядах дослідника може цікавити тільки різниця явищ, що відображає зміну рівня ряду між певними датами, оскільки сума рівнів тут не має реального змісту. Накопичені результати тут не розраховуються.

Найважливішою умовою правильної побудови динамічних рядів є сумісність рівнів рядів, що належать до різних періодів. Рівні повинні бути представлені в однорідних величинах, повинна мати місце однакова повнота охоплення різних частин явища.

Щоб уникнути спотворення реальної динаміки, у статистичному дослідженні проводяться попередні розрахунки (змикання рядів динаміки), які передують статистичного аналізу динамічних рядів. Під змиканням рядів динамікиприйнято розуміти об'єднання в один ряд двох і більше рядів, рівні яких розраховані за різною методологією або не відповідають територіальним кордонам тощо. Змикання рядів динаміки може припускати також приведення абсолютних рівнів рядів динаміки до загальної основи, що нівелює непорівнянність рівнів динаміки.

25. Поняття сумісності рядів динаміки, коефіцієнти, темпи зростання та приросту.

Ряди динаміки- це ряди статистичних показників, що характеризують розвиток явищ природи та суспільства в часі. Статистичні збірники, що публікуються Держкомстатом Росії, містять велику кількість рядів динаміки в табличній формі. Ряди динаміки дозволяють виявити закономірності розвитку явищ, що вивчаються.

Ряди динаміки містять два види показників. Показники часу(Роки, квартали, місяці та ін) або моменти часу (на початок року, на початок кожного місяця і т.п.). Показники рівнів ряду. Показники рівнів рядів динаміки бувають виражені абсолютними величинами (виробництво продукту в тоннах або рублях), відносними величинами (питома вага міського населення в %) та середніми величинами (середня зарплата працівників галузі за роками тощо). У табличній формі ряд динаміки містить два стовпці або два рядки.

Правильне побудова рядів динаміки передбачає виконання низки вимог:

  1. усі показники низки динаміки мають бути науково обґрунтованими, достовірними;
  2. показники низки динаміки мають бути зіставні за часом, тобто. мають бути обчислені за однакові періоди часу чи однакові дати;
  3. показники низки динаміки мають бути зіставні територією;
  4. показники низки динаміки мають бути зіставні за змістом, тобто. обчислені за єдиною методологією, однаковим способом;
  5. показники низки динаміки мають бути зіставні по колу господарств, що враховуються. Усі показники низки динаміки повинні бути наведені в одних і тих самих одиницях вимірювання.

Статистичні показники можуть характеризувати або результати досліджуваного процесу за період часу, або стан досліджуваного явища на певний момент часу, тобто. показники бувають інтервальними (періодичними) та моментними. Відповідно спочатку ряди динаміки бувають або інтервальними, або моментними. Моментні ряди динаміки у свою чергу бувають з рівними та нерівними проміжками часу.

Початкові ряди динаміки бувають перетворені на ряд середніх величин і відносних величин (ланцюговий і базисний). Такі ряди динаміки називають похідними рядами динаміки.

Методика розрахунку середнього рівня серед динаміки різна, обумовлена ​​виглядом низки динаміки. На прикладах розглянемо види рядів динаміки та формули для розрахунку середнього рівня.

Абсолютні прирости (Δy) показують, скільки одиниць змінився наступний рівень низки проти попереднім (гр.3. - ланцюгові абсолютні прирости) чи порівняно з початковим рівнем (гр.4. - базисні абсолютні прирости). Формули розрахунку можна записати так:

При зменшенні абсолютних значень ряду буде відповідно "зменшення", "зниження".

Показники абсолютного приросту свідчать, що, наприклад, 1998 року. виробництво товару " А " збільшилося проти 1997 року. на 4 тис. т, а проти 1994 року. - на 34 тис. т; за рештою років див. табл. 11.5 гр.
Розміщено на реф.
3 та 4.

Коефіцієнт зростанняпоказує, скільки разів змінився рівень низки проти попереднім (гр.5 - ланцюгові коефіцієнти зростання чи зниження) чи проти початковим рівнем (гр.6 - базисні коефіцієнти зростання чи зниження). Формули розрахунку можна записати так:

Темпи зростанняпоказують, скільки відсотків становить наступний рівень низки проти попереднім (гр.7 - ланцюгові темпи зростання) чи проти початковим рівнем (гр.8 - базисні темпи зростання). Формули розрахунку можна записати так:

Приміром, 1997 року. обсяг виробництва товару " А " проти 1996 року. становив 105,5 % (

Темпи прироступоказують, скільки відсотків збільшився рівень звітного періоду проти попереднім (гр.9- ланцюгові темпи приросту) чи проти початковим рівнем (гр.10- базисні темпи приросту). Формули розрахунку можна записати так:

Т пр = Т р - 100% або Т пр = абсолютний приріст / рівень попереднього періоду * 100%

Приміром, 1996 року. проти 1995 року. товару " А " вироблено на 3,8 % (103,8 %- 100%) чи (8:210)х100%, а проти 1994 год. - на 9% (109% – 100%).

Якщо абсолютні рівні в ряду зменшуються, то темп буде менше 100% і відповідно буде темп зниження (темп приросту зі знаком мінус).

Абсолютне значення 1% приросту(Гр.
Розміщено на реф.
11) показує, скільки одиниць необхідно зробити у цьому періоді, щоб рівень попереднього періоду збільшився на 1 %. У прикладі, в 1995 року. Треба було зробити 2,0 тис. т., а 1998 року. - 2,3 тис. т., н. значно більше.

Визначити величину абсолютного значення 1% приросту можна двома способами:

§ рівень попереднього періоду розділити на 100;

§ абсолютні ланцюгові прирости розділити на відповідні ланцюгові темпи приросту.

Абсолютне значення 1% приросту =

У динаміці, особливо протягом тривалого періоду, важливий спільний аналіз темпів приросту зі змістом кожного відсотка приросту чи зниження.

Зауважимо, що розглянута методика аналізу рядів динаміки застосовна як для рядів динаміки, рівні яких виражені абсолютними величинами (т, тис. руб., Число працівників і т.д.), так і для рядів динаміки, рівні яких виражені відносними показниками (% шлюбу , % Зольність вугілля та ін) або середніми величинами (середня врожайність у ц/га, середня зарплата і т.п.).

Поряд з розглянутими аналітичними показниками, що обчислюються за кожен рік у порівнянні з попереднім або початковим рівнем, при аналізі рядів динаміки вкрай важливо обчислити середні за період аналітичні показники: середній рівень ряду, середній річний абсолютний приріст (зменшення) та середній річний темп зростання та темп .

Методи розрахунку середнього рівня низки динаміки було розглянуто вище. У аналізованому нами інтервальному ряду динаміки середній рівень ряду обчислюється за формулою середньої арифметичної простий:

Середньорічний обсяг виробництва товару за 1994-1998 р. становив 218,4 тис. т.

Середньорічний абсолютний приріст обчислюється також за формулою середньої арифметичної

Середнє квадратичне відхилення - поняття та види. Класифікація та особливості категорії "Середнє квадратичне відхилення" 2017, 2018.

Одним із основних інструментів статистичного аналізу є розрахунок середнього квадратичного відхилення. Даний показник дозволяє зробити оцінку стандартного відхилення за вибіркою або генеральною сукупністю. Давайте дізнаємося, як використовувати формулу визначення середньоквадратичного відхилення в Excel.

Відразу визначимо, що являє собою середньоквадратичне відхилення і як виглядає його формула. Ця величина є коренем квадратним із середнього арифметичного числа квадратів різниці всіх величин ряду та їхнього середнього арифметичного. Існує тотожне найменування цього показника - стандартне відхилення. Обидві назви цілком рівнозначні.

Але, природно, що в Екселі користувачеві не доводиться це вираховувати, оскільки за нього робить програма. Давайте дізнаємося, як порахувати стандартне відхилення в Excel.

Розрахунок у Excel

Розрахувати вказану величину в Екселі можна за допомогою двох спеціальних функцій СТАНДОТКЛОН.(за вибірковою сукупністю) та СТАНДОТКЛОН.Г(за генеральною сукупністю). Принцип їхньої дії абсолютно однаковий, але викликати їх можна трьома способами, про які ми поговоримо нижче.

Спосіб 1: майстер функцій


Спосіб 2: вкладка "Формули"


Спосіб 3: ручне введення формули

Існує також спосіб, коли взагалі не потрібно буде викликати вікно аргументів. Для цього слід запровадити формулу вручну.


Як бачимо, механізм розрахунку середньоквадратичного відхилення в Excel дуже простий. Користувачеві потрібно лише ввести числа із сукупності або посилання на комірки, які їх містять. Усі розрахунки виконує сама програма. Набагато складніше усвідомити, що ж є показник, що розраховується, і як результати розрахунку можна застосувати на практиці. Але розуміння цього вже належить більше до сфери статистики, ніж навчання роботи з програмним забезпеченням.

Стандартне відхилення – класичний індикатор мінливості з описової статистики.

Стандартне відхиленнясередньоквадратичне відхилення, СКО, вибіркове стандартне відхилення (англ. standard deviation, STD, STDev) - дуже поширений показник розсіювання в описовій статистиці. Проте, т.к. технічний аналіз схожий на статистику, даний показник можна (і потрібно) використовувати в технічному аналізі для виявлення ступеня розсіювання ціни аналізованого інструменту в часі. Позначається грецьким символом Сігма "σ".

Дякую Карлам Гаусс і Пірсон за те, що ми маємо можливість користуватися стандартним відхиленням.

Використовуючи стандартне відхилення у технічному аналізі, ми перетворюємо цей «показник розсіювання» в «індикатор волатильності«, Зберігаючи сенс, але змінюючи терміни.

Що являє собою стандартне відхилення

Але крім проміжних допоміжних обчислень, стандартне відхилення цілком прийнятне для самостійного обчисленнята застосування у технічному аналізі. Як зазначив активний читач нашого журналу burdock, « досі не зрозумію, чому СКО не входить до набору стандартних індикаторів вітчизняних дилінгових центрів«.

Справді, стандартне відхилення може класичним та «чистим» способом виміряти мінливість інструменту. Але на жаль, цей індикатор негаразд поширений у аналізі цінних паперів .

Застосування стандартного відхилення

Вручну обчислити стандартне відхилення не дуже цікавоале корисно для досвіду. Стандартне відхилення можна виразитиформулою STD=√[(∑(x-x ) 2)/n] , що звучить як корінь із суми квадратів різниць між елементами вибірки та середнім, поділеної на кількість елементів у вибірці.

Якщо кількість елементів у вибірці перевищує 30, то знаменник дробу під коренем набуває значення n-1. Інакше використовується n.

Покроково обчислення стандартного відхилення:

  1. обчислюємо середнє арифметичне вибірки даних
  2. забираємо це середнє від кожного елемента вибірки
  3. всі отримані різниці зводимо у квадрат
  4. сумуємо всі отримані квадрати
  5. ділимо отриману суму на кількість елементів у вибірці (або на n-1, якщо n>30)
  6. обчислюємо квадратний корінь з отриманого приватного (названого дисперсією)

Дисперсія. Середнє квадратичне відхилення

Дисперсія- це середня арифметична квадратів відхилень кожного значення ознаки від загальної середньої. Залежно від вихідних даних дисперсія може бути незваженою (простою) або зваженою.

Дисперсія розраховується за такими формулами:

· Для несгрупованих даних

· Для згрупованих даних

Порядок розрахунку дисперсії зважену:

1. визначають середню арифметичну зважену

2. визначаються відхилення варіант від середньої

3. зводять у квадрат відхилення кожної варіанти від середньої

4. множать квадрати відхилень на ваги (частоти)

5. підсумовують отримані твори

6. отриману суму ділять на суму ваг

Формула для визначення дисперсії може бути перетворена на таку формулу:

- проста

Порядок розрахунку дисперсії простий:

1. визначають середню арифметичну

2. зводять у квадрат середню арифметичну

3. зводять у квадрат кожну варіанту ряду

4. знаходимо суму квадратів варіант

5. ділять суму квадратів варіант з їхньої число, тобто. визначають середній квадрат

6. визначають різницю між середнім квадратом ознаки та квадратом середньої

Також формула для визначення зваженої дисперсії може бути перетворена в наступну формулу:

тобто. дисперсія дорівнює різниці середньої з квадратів значень ознаки та квадрата середньої арифметичної. При користуванні перетвореною формулою виключається додаткова процедура з розрахунку відхилень індивідуальних значень ознаки від х та виключається помилка у розрахунку, пов'язана із округленням відхилень

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1) дисперсія постійної величини дорівнює нулю;

2) якщо всі варіанти значень ознаки зменшити на те саме число, то дисперсія не зменшиться;

3) якщо всі варіанти значень ознаки зменшити в те саме число раз (раз), то дисперсія зменшиться в раз

Середнє квадратичне відхилення S- являє собою квадратний корінь з дисперсії:

· Для несгрупованих даних:

;

· Для варіаційного ряду:

Розмах варіації, середнє лінійне та середнє квадратичне відхилення є іменованими величинами. Вони мають самі одиниці виміру, як і індивідуальні значення ознаки.

Дисперсія та середнє квадратичне відхилення найбільш широко застосовуваних показників варіації. Пояснюється це тим, що вони входять до більшості теорем теорії ймовірності, яка є фундаментом математичної статистики. Крім того, дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних факторів, що зумовлюють варіацію ознаки.

Розрахунок показників варіації для банків, згрупованих за розміром прибутку, показано у таблиці.

Розмір прибутку, млн. руб. Число банків розрахункові показники
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Разом: 121,70 17,640 23,126

Середнє лінійне та середнє квадратичне відхилення показують на скільки в середньому коливається величина ознаки у одиниць та досліджуваної сукупності. Так, у разі середня величина коливання розміру прибутку становить: по середньому лінійному відхилення 0,882 млн. крб.; за середнім квадратичним відхиленням - 1,075 млн. руб. Середнє квадратичне відхилення завжди більше середнього лінійного відхилення. Якщо розподіл ознаки, близький до нормального, між S і d існує взаємозв'язок: S=1,25d, або d=0,8S. Середнє квадратичне відхилення показує, як розташована основна маса одиниць сукупності щодо середньої арифметичної. Незалежно від форми розподілу 75 значень ознаки потрапляють в інтервал х 2S, а принаймні 89 всіх значень потрапляють в інтервал х 3S (теорема П.Л.Чебишева).

Х i -випадкові (поточні) величини;

середнє значення випадкових величин за вибіркою, розраховується за такою формулою:

Отже, дисперсія – це середній квадрат відхилень . Тобто спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат , Складається і потім ділиться на кількість значень в даній сукупності.

Різниця між окремим значенням та середньою відображає міру відхилення. У квадрат зводиться для того, щоб усі відхилення стали виключно позитивними числами і щоб уникнути взаємознищення позитивних та негативних відхилень при їхньому сумуванні. Потім, маючи квадрати відхилень, ми просто розраховуємо середню арифметичну.

Розгадка магічного слова «дисперсія» полягає у цих трьох словах: середній – квадрат – відхилень.

Середнє квадратичне відхилення (СКО)

Витягуючи з дисперсії квадратний корінь, отримуємо так зване « середньоквадратичне відхилення".Зустрічаються назви "стандартне відхилення" або "сигма" (від назви грецької літери σ .). Формула середнього квадратичного відхилення має вигляд:

Отже, дисперсія – це сигма у квадраті, або – середнє квадратичне відхилення у квадраті.

Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними, так як одиниці виміру у них однакові (це випливає з формули розрахунку). Розмах варіації – це різниця між крайніми значеннями. Середньоквадратичне відхилення як міра невизначеності також бере участь у багатьох статистичних розрахунках. З її допомогою встановлюють ступінь точності різних оцінок та прогнозів. Якщо варіація дуже велика, то стандартне відхилення теж вийде великим, отже, і прогноз буде неточним, що висловиться, наприклад, у дуже широких інтервалах довірчих.

Тому в методах статистичної обробки даних в оцінках об'єктів нерухомості залежно від необхідної точності поставленого завдання використовують правило двох або трьох сигм.

Для порівняння правила двох сигм та правила трьох сигм використовуємо формулу Лапласа:

Ф - Ф ,

де Ф(x) – функція Лапласа;



Мінімальне значення

β = максимальне значення

s = значення сигми (середнє квадратичне відхилення)

a = середнє значення

У цьому випадку використовується приватний вид формули Лапласа, коли межі α і β значень випадкової величини X одно відстоять від центру розподілу a = M(X) на деяку величину d: a = a-d, b = a+d. Або (1) Формула (1) визначає можливість заданого відхилення d випадкової величини X з нормальним законом розподілу від її математичного очікування М(X) = a. Якщо у формулі (1) прийняти послідовно d = 2s та d = 3s, то отримаємо: (2), (3).

Правило двох сигм

Майже достовірно (з довірчою ймовірністю 0,954) можна стверджувати, що всі значення випадкової величини X з нормальним законом розподілу відхиляються від її математичного очікування M(X) = a на величину невелику 2s (двох середніх квадратичних відхилень). Довірчою ймовірністю (Pд) називають ймовірність подій, що умовно приймаються за достовірні (їх ймовірність близька до 1).

Проілюструємо правило двох сигм геометрично. На рис. 6 зображена крива Гауса з центром розподілу а. Площа, обмежена всією кривою та віссю Оx, дорівнює 1 (100%), а площа криволінійної трапеції між абсцисами а–2s та а+2s, згідно з правилом двох сигм, дорівнює 0,954 (95,4% від усієї площі). Площа заштрихованих ділянок дорівнює 1-0,954 = 0,046 (5% від всієї площі). Ці ділянки називають критичною областю значень випадкової величини. Значення випадкової величини, які у критичну область, малоймовірні і практично умовно приймаються за неможливі.

Імовірність умовно неможливих значень називають рівнем важливості випадкової величини. Рівень значущості пов'язаний із довірчою ймовірністю формулою:

де q – рівень значимості, виражений у відсотках.

Правило трьох сигм

При вирішенні питань, що вимагають більшої надійності, коли довірчу ймовірність (Pд) приймають рівною 0,997 (точніше - 0,9973), замість правила двох сигм, згідно з формулою (3), використовують правило трьох сигм.



Згідно правилу трьох сигмпри довірчій ймовірності 0,9973 критичною областю буде область значень ознаки поза інтервалом (а-3s, а+3s). Рівень значущості складає 0,27%.

Інакше кажучи, ймовірність те, що абсолютна величина відхилення перевищить потрійне середнє квадратичне відхилення, дуже мала, саме дорівнює 0,0027=1-0,9973. Це означає, що лише 0,27% випадків може статися. Такі події, з принципу неможливості малоймовірних подій, вважатимуться практично неможливими. Тобто. Вибірка високоточна.

У цьому полягає сутність правила трьох сигм:

Якщо випадкова величина розподілена нормально, то абсолютна величина її відхилення від математичного очікування вбирається у потрійного середнього квадратичного відхилення (СКО).

На практиці правило трьох сигм застосовують так: якщо розподіл досліджуваної випадкової величини невідомо, але умова, зазначена в наведеному правилі, виконується, тобто підстава припускати, що величина, що вивчається, розподілена нормально; в іншому випадку вона не розподілена нормально.

Рівень значимості приймають залежно від дозволеного ступеня ризику та поставленого завдання. Для оцінки нерухомості зазвичай приймається менш точна вибірка, дотримуючись правила двох сигм.