Біографії Характеристики Аналіз

Статистичні лави розподілу. Дискретний статистичний ряд

Найбільш простим способом узагальнення статистичного матеріалу є побудова рядів. Результатом зведення статистичного дослідження може бути ряди розподілу.

Після визначення групувальної ознаки, кількості груп та інтервалів угруповання дані зведення та угруповання подаються у вигляді рядів розподілу та оформляються у вигляді статистичних таблиць.

Ряд розподілу одна із видів угруповань.

Поруч розподілу у статистиці називається упорядкований розподіл одиниць сукупності на групи за якоюсь однією ознакою: за якісною чи кількісною.

  1. Види рядів розподілу

Залежно від ознаки, покладеної в основу утворення ряду розподілу, розрізняють атрибутивні та варіаційні ряди розподілу:

    атрибутивними називають ряди розподілу, побудовані за якісними ознаками;

    Варіаційними називають ряди розподілу, побудовані в порядку зростання або зменшення значень кількісної ознаки.

Варіаційний ряд розподілу складається із двох стовпців. У першому стовпці наводяться кількісні значення ознаки, що варіюються, які називаються варіантами і позначаються. Дискретна варіанта - виражається цілим числом. Інтервальний варіант знаходиться в межах від і до. Залежно від типу варіанти, можна побудувати дискретний або інтервальний варіаційний ряд. У другому стовпці міститься кількість конкретних варіантів, виражених через частоти або частоти:

    частоти - це абсолютні числа, що показують стільки разів у сукупності зустрічається дане значення ознаки; сума всіх частот повинна дорівнювати чисельності одиниць всієї сукупності;

    частоти - це частоти виражені у відсотках до результату; сума всіх частостей виражених у відсотках повинна дорівнювати 100% у частках одиниці.

Варіаційний ряд характеризується двома елементами: варіантом (Х) та частотою (f). Варіанта – це окреме значення ознаки окремої одиниці чи групи сукупності. Число, що показує, скільки разів зустрічається те чи інше значення ознаки, називається частотою. Якщо частота виражена відносним числом, вона називається частотою.

Варіаційний ряд може бути:

    інтервальним, коли визначено межі «від» і «до», інтервальні ряди розподілу можна подати графічно як гістограми;

    дискретним, коли досліджуваний ознака характеризується певним числом.

  1. Графічне зображення рядів розподілу

Наочно ряди розподілу надаються за допомогою графічних зображень.

Ряди розподілу зображуються у вигляді:

    полігону;

    гістограми;

    кумуляти;

При побудові полігону на горизонтальній осі (вісь абсцис) відкладають значення ознаки, що варіює, а на вертикальній осі (вісь ординат) - частоти або частоти.

Для побудови гістограми по осі абсцис вказують значення меж інтервалів і на їх підставі будують прямокутники, висота яких пропорційна до частот (або частот).

Розподіл ознаки у варіаційному ряду за накопиченими частотами (частинами) зображується за допомогою кумуляти.

Кумулята або кумулятивна крива, на відміну від полігону, будується за накопиченими частотами або частотами. У цьому на осі абсцис поміщають значення ознаки, але в осі ординат - накопичені частоти чи частоти.

Огіва будується аналогічно кумуляті з тією різницею, що накопичені частоти поміщають на осі абсцис, а значення ознаки - на осі ординат.

Різновидом кумуляти є крива концентрації чи графік Лоренца. Для побудови кривої концентрації на обидві осі прямокутної системи координат наноситься масштабна шкала у відсотках від 0 до 100. При цьому осі абсцис вказують накопичені частоти, а на осі ординат - накопичені значення частки (у відсотках) за обсягом ознаки.

Тема 9. Ряди розподілу

Статистичні ряди розподілу– це первинна характеристика масової статистичної сукупності, впорядковане розкладання одиниць сукупності, що вивчається, на групи за групувальною ознакою. Будь-який статистичний ряд розподілу складається із двох елементів:

1) окремих значень варіюючої ознаки ( варіантів );

2) величин, які показують, скільки разів повторюється цей варіант ( частот ).

Примітка. Частоти, виражені у частках одиниці або у відсотках до підсумку, називаються частостями ; це чисельність ряду розподілу виражається сумою частот.

Якщо за основу угруповання взято якісну ознаку, то такий ряд розподілу називають атрибутивним(розподіл за видами праці, за статтю, за професією, за релігійною ознакою, національною належністю тощо). Якщо ряд розподілу побудований за кількісною ознакою, то такий ряд називають варіаційним. Побудувати варіаційний ряд - отже впорядкувати кількісний розподіл одиниць сукупності за значеннями ознаки, та був підрахувати числа одиниць сукупності із цими значеннями (побудувати групову таблицю).

Виділяють три форми варіаційного ряду:

1) ранжований ряд- це розподіл окремих одиниць сукупності в порядку зростання або зменшення досліджуваної ознаки; ранжування дозволяє легко розділити кількісні дані по групам, відразу виявити найменше та найбільше значення ознаки, виділити значення, які найчастіше повторюються; інші форми варіаційного ряду - групові таблиціскладені за характером варіації значень досліджуваної ознаки;

2) дискретний ряд- це такий варіаційний ряд, в основу побудови якого покладено ознаки із перервною зміною, між якими немає проміжних значень (дискретні ознаки – тарифний розряд, кількість дітей у сім'ї, кількість працівників на підприємстві тощо); ці ознаки можуть набувати лише кінцеве число певних значень;

Дискретний ряд являє собою групову таблицю, Що складається з двох граф: у першій графі вказується конкретне значення ознаки, а в другій - число одиниць сукупності з певним значенням ознаки;

3) якщо ознака має безперервну зміну (розмір доходу, стаж роботи, вартість основних фондів підприємства тощо, які у певних межах можуть набувати будь-яких значень), то для цієї ознаки потрібно будувати інтервальний ряд (З рівними або нерівними інтервалами).

Групова таблицятут має дві графи. У першій вказується значення ознаки в інтервалі від - до (варіанти), у другій - число одиниць, що входять в інтервал (частота). Дуже часто таблиця доповнюється графою, в якій підраховуються накопичені частоти S, які показують, скільки одиниць сукупності має значення ознаки не більше, ніж дане значення. Частоти ряду f можуть замінюватись частками w, Вираженими у відносних числах (частках або відсотках). Вони є відношення частот кожного інтервалу до їх загальної суми (9.1):



(9.1)

При побудові варіаційного ряду з інтервальними значеннями, перш за все, необхідно встановити величину інтервалу i, яка визначається як відношення розмаху варіації R до груп n (9.2):

де R = x max - x min; n = 1 + 3,322 lgN( формула Стерджесу); N – загальна кількість одиниць сукупності.

Інтервальні варіаційні ряди можуть бути побудовані для ознак з дискретною варіацією. Нерідко у статистичному дослідженні вказувати окреме значення дискретного ознаки недоцільно, т.к. це, як правило, ускладнює розгляд варіації ознаки. Тому можливі дискретні значення ознаки розподіляються за групами та підраховуються відповідні їм частоти (зокрема). При побудові інтервального ряду за дискретною ознакою межі суміжних інтервалів не повторюють один одного: наступний інтервал починається з наступного порядку (після верхнього значення попереднього інтервалу) дискретного значення ознаки.

При порівнянні частот ряду з нерівними інтервалами для характеристики їхньої наповненості розраховують щільність розподілу. Середня щільність в інтервалі- Це окреме від поділу частоти і зокрема на величину інтервалу. У першому випадку щільність абсолютна, у другому – відносна. Середня щільність показує, скільки одиниць чи їх відсотків посідає одиницю виміру варіанти. Частота, зокрема, щільність і накопичена частота - це різні функції від величини варіанти.

В процесі аналізу статистичних даних, представлених рядами розподілу, крім знання про характер розподілу (або структуру сукупності) можуть обчислюватися різні статистичні показники (числові характеристики), які в узагальненому вигляді відображають особливості розподілу ознак, що вивчаються. Ці характеристики (показники) можуть бути поділені на 3 основні групи

1) характеристики центру розподілу(Середня, мода, медіана);

2) Показники ступеня варіації(варіаційний розмах, середнє лінійне відхилення, дисперсія, середнє квадратичне відхилення, коефіцієнт варіації);

3) характеристики форми (типу) розподілу(Показники ексцесу та асиметрії, рангові характеристики, криві розподіли).

Найбільш надійний шлях виявлення закономірності розподілу полягає в наступному:
1) збільшити кількість випадків, що спостерігаються (відповідно до закону великих чисел, у таких рядах випадкові відхилення від загальної закономірності в індивідуальних значень взаємно погашатимуться);

2) спочатку сукупність розбити на максимальну можливу кількість груп, потім, поступово скорочуючи число груп, оптимізувати угруповання з погляду виявлення закономірності розподілу.

При реалізації такого підходу закономірність, характерна для даного розподілу виступатиме все більш і більш ясно, а ламана лінія, що зображує полігон, наближатиметься до деякої плавної лінії і в межах повинна перетворитися на криву лінію.

Нехай із генеральної сукупності вилучено вибірку, причому х 1 спостерігалося п 1 раз, х 2 - п 2 рази, х до - п дораз і – обсяг вибірки. Значення, що спостерігаються х 1 називають варіантами, а послідовність варіант, записаних у зростаючому порядку - Варіаційним рядом .

Число спостережень варіанти називають частотою, а її відношення до обсягу вибірки – відносною частотою.

Визначення. Статистичним (емпіричним) законом розподілу вибірки, або просто статистичним розподілом вибіркиназивають послідовність варіант та відповідних їм частот п iабо відносних частот.

Статистичне розподілення вибірки зручно представляти у формі таблиці розподілу частот, званої статистичним дискретним рядом розподілу:

(Сума всіх відносних частот дорівнює одиниці ).

Приклад 1. При вимірах в однорідних групах обстежуваних отримані такі вибірки: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,7 частота пульсу). Скласти за цими результатами статистичний ряд розподілу частот та відносних частот.

Рішення. 1) Статистичний ряд розподілу частот:

Контроль: 0,1+0,2+0,4+0,1+0,2=1.

Полігоном частотназивають ламану, відрізки, якою з'єднують точки Для побудови полігону частот на осі абсцис відкладають варіанти х 2 , але в осі ординат - відповідні їм частоти п i.Крапки з'єднують відрізками та отримують полігон частот.

Полігоном відносних частотназивають ламану, відрізки, якою з'єднують точки . Для побудови полігону відносних частот на осі абсцис відкладають варіанти х i , але в осі ординат відповідні їм частоти w i. Крапки з'єднують відрізками та отримують полігон відносних частот

приклад 2.Побудуйте полігон частот та полігон відносних частот за даними прикладу 1.

Рішення:Використовуючи дискретний статистичний ряд розподілу, складений у прикладі 1, побудуємо полігон частот і полігон відносних частот:


2. Статистичний інтервальний ряд розподілу. Гістограма.

Статистичним дискретним рядом (або емпіричною функцією розподілу) зазвичай користуються в тому випадку, коли відмінних один від одного варіант у вибірці не дуже багато, або тоді, коли дискретність з тих чи інших причин істотна для дослідника. Якщо ж ознака генеральної сукупності Х, що нас цікавить, розподілений безперервно або його дискретність недоцільно (або неможливо) враховувати, то варіанти групуються в інтервали.


Статистичне розподіл можна задати також як послідовності інтервалів і відповідних їм частот (як частоти, відповідної інтервалу, приймають суму частот, які у цей інтервал).

1. R(розмах) = X max -X ​​min

2. k-кількість груп

3. (Формула Стерджеса)

4. a = x min, b = x max

Отримане угруповання зручно подати у формі частотної таблиці, яка носить назву статистичний інтервальний ряд розподілу:

Інтервали угруповання ...
Частоти ...

Аналогічну таблицю можна утворити, замінюючи частоти n iвідносними частотами.

Найважливішим етапом дослідження соціально-економічних явищ та процесів є систематизація первинних даних та отримання на цій основі зведеної характеристики всього об'єкта за допомогою узагальнюючих показників, що досягається шляхом зведення та угруповання первинного статистичного матеріалу.

Статистичне зведення - це комплекс послідовних операцій із узагальнення конкретних одиничних фактів, що утворюють сукупність, виявлення типових рис і закономірностей, властивих досліджуваному явище загалом. Проведення статистичного зведення включає наступні етапи :

  • вибір групувального ознаки;
  • визначення порядку формування груп;
  • розробка системи статистичних показників для характеристики груп та об'єкта загалом;
  • розробка макетів статистичних таблиць для представлення результатів зведення.

Статистичним угрупованням називається розчленування одиниць сукупності, що вивчається, на однорідні групи за певними істотними для них ознаками. Угруповання є найважливішим статистичним методом узагальнення статистичних даних, основою правильного обчислення статистичних показників.

Розрізняють такі види угруповань: типологічні, структурні, аналітичні. Всі ці угруповання поєднує те, що одиниці об'єкта поділені на групи за якоюсь ознакою.

Групувальною ознакою називається ознака, яким проводиться розбиття одиниць сукупності деякі групи. Від правильного вибору групувального ознаки залежить висновки статистичного дослідження. Як основу угруповання необхідно використовувати суттєві, теоретично обґрунтовані ознаки (кількісні чи якісні).

Кількісні ознаки угруповання мають числове вираження (обсяг торгів, вік людини, дохід сім'ї тощо), а якісні ознаки угруповання відображають стан одиниці сукупності (стаття, сімейний стан, галузева приналежність підприємства, його форма власності тощо).

Після того, як визначено підставу угруповання, слід вирішити питання про кількість груп, на які треба розбити досліджувану сукупність. Число груп залежить від завдань дослідження та виду показника, покладеного в основу угруповання, обсягу сукупності, ступеня варіації ознаки.

Наприклад, угруповання підприємств за формами власності враховує муніципальну, федеральну та власність суб'єктів федерації. Якщо угруповання проводиться за кількісною ознакою, тоді необхідно звернути особливу увагу на кількість одиниць досліджуваного об'єкта і ступінь коливання групувального ознаки.

Коли визначено кількість груп, слід визначити інтервали угруповання. Інтервал - Це значення варіює ознаки, що лежать у певних межах. Кожен інтервал має свою величину, верхню та нижню межі або хоча б одну з них.

Нижнім кордоном інтервалу називається найменше значення ознаки в інтервалі, а верхнім кордоном - Найбільше значення ознаки в інтервалі. Величина інтервалу є різницею між верхньою та нижньою межами.

Інтервали угруповання залежно від їхньої величини бувають: рівні та нерівні. Якщо варіація ознаки проявляється у порівняно вузьких межах і розподіл має рівномірний характер, то будують угруповання з рівними інтервалами. Величина рівного інтервалу визначається за такою формулою :

де Хmax, Хmin - максимальне та мінімальне значення ознаки в сукупності; n – число груп.

Найпростіше угруповання, у якому кожна виділена група характеризується одним показником є ​​ряд розподілу.

Статистичний ряд розподілу - це упорядкований розподіл одиниць сукупності на групи за певною ознакою. Залежно від ознаки, покладеної основою освіти низки розподілу, розрізняють атрибутивні і варіаційні ряди розподілу.

Атрибутивними називають ряди розподілу, побудовані за якісними ознаками, тобто ознаками, що не мають числового виразу (розподіл за видами праці, за статтю, за професією тощо). Атрибутивні ряди розподілу характеризують склад сукупності за тими чи іншими суттєвими ознаками. Взяті за кілька періодів ці дані дозволяють досліджувати зміну структури.

Варіаційними рядами називають ряди розподілу, побудовані за кількісним ознакою. Будь-який варіаційний ряд складається з двох елементів: варіантів та частот. Варіантами називаються окремі значення ознаки, які він приймає в варіаційному ряду, тобто конкретне значення ознаки, що варіює.

Частотами називаються чисельності окремих варіантів або кожної групи варіаційного ряду, тобто це числа, які показують, як часто зустрічаються ті чи інші варіанти у ряді розподілу. Сума всіх частот визначає чисельність усієї сукупності, її обсяг. Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 чи 100%.

Залежно від характеру варіації ознаки розрізняють три форми варіаційного ряду: ранжований ряд, дискретний ряд та інтервальний ряд.

Ранжований варіаційний ряд - це розподіл окремих одиниць сукупності у порядку зростання чи спадання досліджуваного ознаки. Ранжування дозволяє легко розділити кількісні дані по групам, відразу виявити найменше та найбільше значення ознаки, виділити значення, які найчастіше повторюються.

Дискретний варіаційний ряд характеризує розподіл одиниць сукупності за дискретною ознакою, що приймає лише цілі значення. Наприклад, тарифний розряд, кількість дітей у сім'ї, кількість працівників для підприємства та інших.

Якщо ознака має безперервну зміну, які в певних межах можуть набувати будь-яких значень («від - до»), то для цієї ознаки потрібно будувати інтервальний варіаційний ряд . Наприклад, розмір доходу, стаж роботи, вартість основних фондів підприємства та ін.

Приклади розв'язання задач на тему «Статистичне зведення та угруповання»

Завдання 1 . Є інформація про кількість книг, отриманих студентами за абонементом за минулий навчальний рік.

Побудувати ранжований та дискретний варіаційні ряди розподілу, позначивши елементи ряду.

Рішення

Ця сукупність є безліч варіантів кількості одержуваних студентами книг. Підрахуємо кількість таких варіантів та упорядкуємо у вигляді варіаційного ранжованого та варіаційного дискретного рядів розподілу.

Завдання 2 . Є дані про вартість основних фондів у 50 підприємств, тис. руб.

Побудувати низку розподілу, виділивши 5 груп підприємств (з рівними інтервалами).

Рішення

Для вирішення оберемо найбільше та найменше значення вартості основних фондів підприємств. Це 30,0 та 10,2 тис. руб.

Знайдемо розмір інтервалу: h = (30,0-10,2): 5 = 3,96 тис. руб.

Тоді до першої групи входитимуть підприємства, розмір основних фондів яких становить від 10,2 тис. руб. до 10,2 +3,96 = 14,16 тис. руб. Таких підприємств буде 9. До другої групи увійдуть підприємства, розмір основних фондів яких складе від 14,16 тис. руб. до 14,16 +3,96 = 18,12 тис. руб. Таких підприємств буде 16. Аналогічно знайдемо кількість підприємств, що входять до третьої, четвертої та п'ятої групи.

Отриманий ряд розподілу помістимо до таблиці.

Завдання 3 . По ряду підприємств легкої промисловості отримано такі дані:

Здійсніть угруповання підприємств за кількістю робітників, утворюючи 6 груп з рівними інтервалами. Підрахуйте по кожній групі:

1. кількість підприємств
2. число робітників
3. обсяг виробленої продукції протягом року
4. середнє фактичне вироблення одного робітника
5. обсяг основних засобів
6. середній розмір основних засобів одного підприємства
7. середню величину виробленої продукції одним підприємством

Результати розрахунку оформіть у таблиці. Зробіть висновки.

Рішення

Для вирішення виберемо найбільше та найменше значення середньооблікового числа робітників на підприємстві. Це 43 та 256.

Знайдемо розмір інтервалу: h = (256-43): 6 = 35,5

Тоді до першої групи входитимуть підприємства, середньооблікова кількість робітників на яких становить від 43 до 43 +35,5 = 78,5 чоловік. Таких підприємств буде 5. До другої групи увійдуть підприємства, середньооблікова кількість робітників на яких складе від 78,5 до 78,5 +35,5 = 114 осіб. Таких підприємств буде 12. Аналогічно знайдемо кількість підприємств, що входять до третьої, четвертої, п'ятої та шостої групи.

Отриманий ряд розподілу помістимо до таблиці та обчислимо необхідні показники по кожній групі:

Висновок : Як видно з таблиці, друга група підприємств є найчисленнішою До неї входять 12 підприємств. Найменшими є п'ята і шоста групи (по два підприємства). Це найбільші підприємства (за кількістю робітників).

Оскільки друга група найчисленніша, обсяг виробленої продукції за рік підприємствами цієї групи та обсяг основних засобів значно вищий за інші. Водночас середній фактичний вироблення одного робітника на підприємствах цієї групи найбільшого не є. Тут лідирують підприємства четвертої групи. На цю групу припадає досить великий обсяг основних засобів.

У висновку зазначимо, що середній розмір основних засобів та середня величина виробленої продукції одного підприємства прямо пропорційні розмірам підприємства (за кількістю робітників).

Угруповання- Це розбиття сукупності на групи, однорідні за якоюсь ознакою.

Призначення сервісу. За допомогою онлайн-калькулятора Ви зможете:

  • побудувати варіаційний ряд, побудувати гістограму та полігон;
  • знайти показники варіації (середню, моду (зокрема і графічним способом), медіану, розмах варіації, квартили, децили, квартильний коефіцієнт диференціації, коефіцієнт варіації та інші показники);

Інструкція. Для групування ряду необхідно вибрати вид варіаційного ряду, що отримується (дискретний або інтервальний) і вказати кількість даних (кількість рядків). Отримане рішення зберігається у файлі Word (див. приклад угруповання статистичних даних).

Кількість вихідних даних
",0);">

Якщо угруповання вже здійснено та задані дискретний варіаційний рядабо інтервальний ряд, то необхідно скористатися онлайн-калькулятором Показники варіації. Перевірка гіпотези про вид розподілупроводиться за допомогою сервісу Вивчення форми розподілу.

Види статистичних угруповань

Варіаційний ряд. У разі спостережень дискретної випадкової величини те саме значення можна зустріти кілька разів. Такі значення x i випадкової величини записують із зазначенням n i числа разів його появи в n спостереженнях, і є частота даного значення.
У разі безперервної випадкової величини практично застосовують угруповання.
  1. Типологічне угруповання- Це поділ досліджуваної якісно різнорідної сукупності на класи, соціально-економічні типи, однорідні групи одиниць. Для побудови цього угруповання використовуйте параметр Дискретний варіаційний ряд.
  2. Структурним називається угруповання, в якій відбувається поділ однорідної сукупності на групи, що характеризують її структуру за якою-небудь ознакою, що варіює. Для побудови цього угруповання використовуйте параметр Інтервальний ряд.
  3. Угруповання, що виявляє взаємозв'язки між досліджуваними явищами та їх ознаками, називається аналітичним угрупованням(Див. аналітичне угруповання ряду).

Принципи побудови статистичних угруповань

Ряд спостережень, упорядкованих за зростанням, називається варіаційним рядом. Групувальною ознакоюназивається ознака, яким виробляється розбивка сукупності деякі групи. Його називають основою угруповання. В основі угруповання можуть бути покладені як кількісні, так і якісні ознаки.
Після визначення підстави угруповання слід вирішити питання кількості груп, куди треба розбити досліджувану сукупність.

У разі використання персональних комп'ютерів для обробки статистичних даних групування одиниць об'єкта здійснюється за допомогою стандартних процедур.
Одна з таких процедур базується на використанні формули Стерджесу для визначення оптимальної кількості груп:

k = 1+3,322*lg(N)

Де k – кількість груп, N – число одиниць сукупності.

Довжину часткових інтервалів обчислюють як h=(x max -x min)/k

Потім підраховують числа попадань спостережень у ці інтервали, які приймають за частоти n i . Нечисленні частоти, значення яких менше 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В якості нових значень варіант беруть середини інтервалів x i = (c i-1 + c i) /2.