Біографії Характеристики Аналіз

Побудова інтервального варіаційного ряду. Ряди розподілу

Подаються у вигляді рядів розподілу та оформляються у вигляді.

Ряд розподілу одна із видів угруповань.

Ряд розподілу— є впорядкованим розподілом одиниць досліджуваної сукупності на групи за певною ознакою, що варіює.

Залежно від ознаки, покладеної в основу освіти, ряду розподілу розрізняють атрибутивні та варіаційніряди розподілу:

  • Атрибутивними- Називають ряди розподілу, побудовані за якісними ознаками.
  • Ряди розподілу, побудовані в порядку зростання або зменшення значень кількісної ознаки називаються варіаційними.
Варіаційний ряд розподілу складається із двох стовпців:

У першому стовпці наводяться кількісні значенняваріюється ознаки, які називаються варіантамиі позначаються. Дискретна варіанта - виражається цілим числом. Інтервальний варіант знаходиться в межах від і до. Залежно від типу варіанти, можна побудувати дискретний або інтервальний варіаційний ряд.
У другому стовпці міститься кількість конкретних варіант, Виражене через частоти або частоти:

Частоти- це абсолютні числа, що показують стільки разів у сукупності зустрічається дане значенняознаки, що позначають . Сума всіх частот дорівнює повинна дорівнювати чисельності одиниць всієї сукупності.

Частини() - Це частоти виражені у відсотках до підсумку. Сума всіх частостей виражених у відсотках повинна дорівнювати 100% у частках одиниці.

Графічне зображення рядів розподілу

Наочно ряди розподілу надаються за допомогою графічних зображень.

Ряди розподілу зображуються у вигляді:
  • Полігона
  • Гістограми
  • Кумуляти
  • Огіви

Полігон

При побудові полігону на горизонтальній осі (вісь абсцис) відкладають значення ознаки, що варіює, а на вертикальної осі(вісь ординат) - частоти чи частоти.

Полігон на рис. 6.1 побудований за даними мікроперепису населення Росії у 1994 р.

6.1. Розподіл домогосподарств за розміром

Умова: Наводяться дані про розподіл 25 працівників одного з підприємств за тарифними розрядами:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Завдання: Побудувати дискретний варіаційний ряд та зобразити його графічно у вигляді полігону розподілу
Рішення:
У даному прикладіВипадками є тарифний розряд працівника. Для визначення частот необхідно розрахувати кількість працівників, які мають відповідний тарифний розряд.

Полігон використовують для дискретних варіаційних рядів.

Для побудови полігону розподілу (рис 1) по осі абсцис (X) відкладаємо кількісні значення ознаки, що варіює, - варіанти, а по осі ординат - частоти або частоти.

Якщо значення ознаки виражені як інтервалів, такий ряд називається інтервальним.
Інтервальні рядирозподіли зображують графічно у вигляді гістограми, кумуляти або огива.

Статистична таблиця

Умова: Наведено дані про розміри вкладів 20 фізичних осібв одному банку (тис.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Завдання: Побудувати інтервальний варіаційний ряд з рівними інтервалами.
Рішення:

  1. Вихідна сукупність складається з 20 одиниць (N = 20).
  2. За формулою Стерджеса визначимо необхідна кількістьвикористовуваних груп: n=1+3,322*lg20=5
  3. Обчислимо величину рівного інтервалу: i = (152 - 2) / 5 = 30 тис.руб
  4. Розчленуємо вихідну сукупність на 5 груп з величиною інтервалу в 30 тис. руб.
  5. Результати угруповання подаємо у таблиці:

При такому записі безперервної ознаки, коли та сама величина зустрічається двічі (як верхня межа одного інтервалу і нижня межа іншого інтервалу), то ця величина відноситься до тієї групи, де ця величина виступає в ролі верхньої межі.

Гістограма

Для побудови гістограми по осі абсцис вказують значення меж інтервалів і на їх підставі будують прямокутники, висота яких пропорційна до частот (або частот).

На рис. 6.2. зображено гістограму розподілу населення Росії у 1997 р. за віковими групами.

Рис. 6.2. Розподіл населення Росії за віковими групами

Умова: Наводиться розподіл 30 працівників фірми за розміром місячної заробітної плати

Завдання: Зобразити інтервальний варіаційний ряд графічно у вигляді гістограми та кумуляти.
Рішення:

  1. Невідома межа відкритого (першого) інтервалу визначається за величиною другого інтервалу: 7000 - 5000 = 2000 руб. З тією ж величиною знаходимо нижню межу першого інтервалу: 5000 - 2000 = 3000 руб.
  2. Для побудови гістограми прямокутної системі координат по осі абсцис відкладаємо відрізки, величини яких відповідають інтервалам варицонного ряду.
    Ці відрізки служать нижньою основою, а відповідна частота (частина) - висотою прямокутників, що утворюються.
  3. Побудуємо гістограму:

Для побудови кумуляти необхідно розрахувати накопичені частоти (частини). Вони визначаються шляхом послідовного підсумовування частот (частин) попередніх інтервалів і позначаються S. Накопичені частоти показують, скільки одиниць сукупності мають значення ознаки не більше, ніж аналізоване.

Кумулята

Розподіл ознаки у варіаційному ряду за накопиченими частотами (частинами) зображується за допомогою кумуляти.

Кумулятаабо кумулятивна крива, на відміну від полігону, будується за накопиченими частотами або частотами. У цьому на осі абсцис поміщають значення ознаки, але в осі ординат — накопичені частоти чи частоти (рис. 6.3).

Рис. 6.3. Кумулята розподілу домогосподарств за розміром

4. Розрахуємо накопичені частоти:
Наколінна частота першого інтервалу розраховується так: 0 + 4 = 4, для другого: 4 + 12 = 16; для третього: 4+12+8=24 і т.д.

При побудові кумуляти накопичена частота (частина) відповідного інтервалу присвоюється його верхній межі:

Огіва

Огівабудується аналогічно кумуляті з тією різницею, що накопичені частоти поміщають на осі абсцис, а значення ознаки - на осі ординат.

Різновидом кумуляти є крива концентрації чи графік Лоренца. Для побудови кривої концентрації на обидві осі прямокутної системикоординат наноситься масштабна шкала у відсотках від 0 до 100. У цьому осі абсцис вказують накопичені частоти, але в осі ординат — накопичені значення частки (у відсотках) за обсягом ознаки.

Рівномірному розподілу ознаки відповідає графік діагональ квадрата (рис. 6.4). При нерівномірному розподілі графік є увігнутою кривою залежно від рівня концентрації ознаки.

6.4. Крива концентрації

Найважливішим етапом дослідження соціально-економічних явищ та процесів є систематизація первинних даних та отримання на цій основі зведеної характеристики всього об'єкта за допомогою узагальнюючих показників, що досягається шляхом зведення та угруповання первинного статистичного матеріалу.

Статистичне зведення - це комплекс послідовних операцій із узагальнення конкретних одиничних фактів, що утворюють сукупність, для виявлення типових риста закономірностей, властивих досліджуваному явищу загалом. Проведення статистичного зведення включає наступні етапи :

  • вибір групувального ознаки;
  • визначення порядку формування груп;
  • розробка системи статистичних показниківдля характеристики груп та об'єкта в цілому;
  • розробка макетів статистичних таблиць для представлення результатів зведення.

Статистичним угрупованням називається розчленування одиниць сукупності, що вивчається на однорідні групиза певними суттєвими для них ознаками. Угруповання є найважливішим статистичним методомузагальнення статистичних даних, основою правильного обчислення статистичних показників

Розрізняють наступні видиугруповань: типологічні, структурні, аналітичні. Всі ці угруповання поєднує те, що одиниці об'єкта поділені на групи за якоюсь ознакою.

Групувальною ознакою називається ознака, яким проводиться розбиття одиниць сукупності деякі групи. Від правильного виборугрупувальної ознаки залежать висновки статистичного дослідження. Як основу угруповання необхідно використовувати суттєві, теоретично обґрунтовані ознаки (кількісні чи якісні).

Кількісні ознаки угруповання мають числове вираження (обсяг торгів, вік людини, дохід сім'ї тощо), а якісні ознаки угруповання відображають стан одиниці сукупності (підлога, сімейний стан, галузева приналежність підприємства, його форма власності тощо).

Після того, як визначено підставу угруповання, слід вирішити питання про кількість груп, на які треба розбити досліджувану сукупність. Число груп залежить від завдань дослідження та виду показника, покладеного в основу угруповання, обсягу сукупності, ступеня варіації ознаки.

Наприклад, угруповання підприємств за формами власності враховує муніципальну, федеральну та власність суб'єктів федерації. Якщо угруповання проводиться за кількісною ознакоютоді необхідно звернути особливу увагуна число одиниць досліджуваного об'єкта та ступінь коливання групувального ознаки.

Коли визначено кількість груп, слід визначити інтервали угруповання. Інтервал - Це значення варіює ознаки, що лежать у певних межах. Кожен інтервал має свою величину, верхню та нижню межі або хоча б одну з них.

Нижнім кордоном інтервалу називається найменше значення ознаки в інтервалі, а верхнім кордоном - Найбільше значення ознаки в інтервалі. Величина інтервалу є різницею між верхньою та нижньою межами.

Інтервали угруповання залежно від їхньої величини бувають: рівні та нерівні. Якщо варіація ознаки проявляється у порівняно вузьких межах і розподіл має рівномірний характер, то будують угруповання з рівними інтервалами. Величина рівного інтервалу визначається за такою формулою :

де Хmax, Хmin - максимальне та мінімальне значення ознаки в сукупності; n – число груп.

Найпростіше угруповання, у якому кожна виділена група характеризується одним показником є ​​ряд розподілу.

Статистичний рядрозподілу - це упорядкований розподіл одиниць сукупності на групи за певною ознакою. Залежно від ознаки, покладеної основою освіти низки розподілу, розрізняють атрибутивні і варіаційні ряди розподілу.

Атрибутивними називають ряди розподілу, побудовані за якісним ознакамтобто ознаками, що не мають числового виразу(Розподіл за видами праці, за статтю, за професією і т.д.). Атрибутивні ряди розподілу характеризують склад сукупності за тими чи іншими суттєвими ознаками. Взяті за кілька періодів ці дані дозволяють досліджувати зміну структури.

Варіаційними рядами називають ряди розподілу, побудовані за кількісним ознакою. Будь-який варіаційний ряд складається з двох елементів: варіантів та частот. Варіантами називаються окремі значенняознаки, які він приймає в варіаційному ряду, тобто конкретне значення ознаки, що варіює.

Частотами називаються чисельності окремих варіантів або кожної групи варіаційного рядутобто це числа, які показують, як часто зустрічаються ті чи інші варіанти в ряду розподілу. Сума всіх частот визначає чисельність усієї сукупності, її обсяг. Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 чи 100%.

Залежно від характеру варіації ознаки розрізняють три форми варіаційного ряду: ранжований ряд, дискретний ряд інтервальний ряд.

Ранжований варіаційний ряд - це розподіл окремих одиниць сукупності у порядку зростання чи спадання досліджуваного ознаки. Ранжування дозволяє легко розділити кількісні дані по групах, відразу виявити найменше та найбільше значенняознаки, виділити значення, які найчастіше повторюються.

Дискретний варіаційний ряд характеризує розподіл одиниць сукупності за дискретною ознакою, що приймає лише цілі значення. Наприклад, тарифний розряд, кількість дітей у сім'ї, кількість працівників для підприємства та інших.

Якщо ознака має безперервну зміну, які в певних межах можуть набувати будь-яких значень («від - до»), то для цієї ознаки потрібно будувати інтервальний варіаційний ряд . Наприклад, розмір доходу, стаж роботи, вартість основних фондів підприємства та ін.

Приклади розв'язання задач на тему «Статистичне зведення та угруповання»

Завдання 1 . Є інформація про кількість книг, отриманих студентами за абонементом за минулий навчальний рік.

Побудувати ранжований та дискретний варіаційні ряди розподілу, позначивши елементи ряду.

Рішення

Ця сукупністьє безліч варіантів кількості одержуваних студентами книг. Підрахуємо кількість таких варіантів та упорядкуємо у вигляді варіаційного ранжованого та варіаційного дискретного рядів розподілу.

Завдання 2 . Є дані про вартість основних фондів у 50 підприємств, тис. руб.

Побудувати низку розподілу, виділивши 5 груп підприємств (з рівними інтервалами).

Рішення

Для рішення виберемо найбільше та найменше значеннявартість основних фондів підприємств. Це 30,0 та 10,2 тис. руб.

Знайдемо розмір інтервалу: h = (30,0-10,2): 5 = 3,96 тис. руб.

Тоді до першої групи входитимуть підприємства, розмір основних фондів яких становить від 10,2 тис. руб. до 10,2 +3,96 = 14,16 тис. руб. Таких підприємств буде 9. До другої групи увійдуть підприємства, розмір основних фондів яких складе від 14,16 тис. руб. до 14,16 +3,96 = 18,12 тис. руб. Таких підприємств буде 16. Аналогічно знайдемо числопідприємств, що входять до третьої, четвертої та п'ятої групи.

Отриманий ряд розподілу помістимо до таблиці.

Завдання 3 . По ряду підприємств легкої промисловості отримано такі дані:

Здійсніть угруповання підприємств за кількістю робітників, утворюючи 6 груп з рівними інтервалами. Підрахуйте по кожній групі:

1. кількість підприємств
2. число робітників
3. обсяг виробленої продукції протягом року
4. середнє фактичне вироблення одного робітника
5. обсяг основних засобів
6. середній розміросновних засобів одного підприємства
7. середню величину виробленої продукції одним підприємством

Результати розрахунку оформіть у таблиці. Зробіть висновки.

Рішення

Для вирішення виберемо найбільше та найменше значення середньооблікового числа робітників на підприємстві. Це 43 та 256.

Знайдемо розмір інтервалу: h = (256-43): 6 = 35,5

Тоді до першої групи входитимуть підприємства, середньооблікова кількість робітників на яких становить від 43 до 43 +35,5 = 78,5 чоловік. Таких підприємств буде 5. До другої групи увійдуть підприємства, середньооблікова кількість робітників на яких складе від 78,5 до 78,5 +35,5 = 114 осіб. Таких підприємств буде 12. Аналогічно знайдемо кількість підприємств, що входять до третьої, четвертої, п'ятої та шостої групи.

Отриманий ряд розподілу помістимо до таблиці та обчислимо необхідні показники по кожній групі:

Висновок : Як видно з таблиці, друга група підприємств є найчисленнішою До неї входять 12 підприємств. Найменшими є п'ята і шоста групи (по два підприємства). Це найбільші підприємства (за кількістю робітників).

Оскільки друга група найчисленніша, обсяг виробленої продукції за рік підприємствами цієї групи та обсяг основних засобів значно вищий за інші. Водночас середній фактичний вироблення одного робітника на підприємствах цієї групи найбільшого не є. Тут лідирують підприємства четвертої групи. На цю групу припадає досить великий обсяг основних засобів.

У висновку зазначимо, що середній розмір основних засобів та середня величина виробленої продукції одного підприємства прямо пропорційні розмірам підприємства (за кількістю робітників).

Число груп (інтервалів)приблизно визначається за формулою Стерджесса:

m = 1 + 3,322 × lg(n)

де n - загальне числоодиниць спостереження (загальна кількість елементів у сукупності тощо), lg(n) – десятковий логарифмвід n.

Отриману за формулою Стерджес величину округлюють зазвичай до цілого більшогочисла, оскільки кількість груп може бути дробовим числом.

Якщо ряд інтервальний ряд з такою кількістю груп за якимись критеріями не влаштовує, можна побудувати інший інтервальний ряд, округливши mдо цілого меншого числаі вибрати з двох рядів більш підходящий.

Кількість груп не повинна перевищувати 15.

Також можна скористатися наступною таблицею, якщо немає можливості обчислити десятковий логарифм.

    Визначаємо ширину інтервалу

Ширина інтервалудля інтервального варіаційного ряду з рівними інтервалами визначається за такою формулою:

де X макс - максимальне із значень x i , X хв - мінімальне із значень x i ; m – число груп (інтервалів).

Величину інтервалу (i ) зазвичай округляють до цілого числа,виняток становлять лише випадки, коли вивчаються найменші коливання ознаки (наприклад, при угрупованні деталей за величиною розміру відхилень від номіналу, що вимірюється у частках міліметра).

Часто застосовується таке правило:

Кількість знаків до коми

Кількість знаків після коми

Приклад ширини інтервалу за формулою

До якого знаку округляємо

Приклад округленої ширини інтервалу

    Визначаємо межі інтервалів

Нижній кордон першого інтервалуприймають рівною мінімального значення ознаки (найчастіше його попередньо округляють до цілого меншого числа з таким же розрядом як ширина інтервалу). Наприклад, х хв = 15, i = 130, х н першого інтервалу = 10.

х н1 ≈ х хв

Верхня межапершого інтервалу відповідає значенню (Хmin + i).

Нижня межа другого інтервалу завжди дорівнює верхній межі першого інтервалу. Для наступних груп кордону визначаються аналогічно, тобто послідовно додається величина інтервалу.

x в i = x н i + i

x н i = x в i-1

    Визначаємо частоти інтервалів.

Вважаємо, скільки значень потрапило до кожного інтервалу. При цьому пам'ятаємо, що якщо одиниця має значення ознаки, що дорівнює величині верхньої межі інтервалу, то її слід відносити до наступного інтервалу.

    Будуємо інтервальний ряд у вигляді таблиці.

    Визначаємо середини інтервалів.

Для подальшого аналізу інтервального ряду потрібно вибрати значення ознаки для кожного інтервалу. Це значення ознаки буде загальним всім одиниць спостереження, які у цей інтервал. Тобто. окремі елементи «втрачають» свої індивідуальні значення ознаки і їм надається одне загальне значення ознаки. Таким загальним значеннямє середина інтервалуяка позначається x" i .

Розглянемо з прикладу зі зростанням дітей, як побудувати інтервальний ряд із рівними інтервалами.

Є початкові дані.

90, 91, 92, 93, 94, 95, 96, 97, 98, 99 , 92, 93, 94, 95, 96, 98 , , 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 , 100, 101, 102, 104 , 110, 112, 114, 116, 117, 120, 122, 123, 124, 129, 110, 111, 113, 115, 116, 117, 121, 125, 126, 127 , 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 , 111, 113, 116, 127 , 123, 122, 130, 131, 132, 133, 134, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150 , 131, 133, 135, 136, 138, 139, 140, 141, 142, 143, 145, 146, 147, 148

Якщо досліджувана випадкова величина є безперервною, то ранжування і угруповання значень, що спостерігаються, часто не дозволяють виділити характерні рисиваріювання її значень. Це пояснюється тим, що окремі значення випадкової величиниможуть як завгодно мало відрізнятися один від одного і тому в сукупності даних даних однакові значення величини можуть зустрічатися рідко, а частоти варіантів мало відрізняються один від одного.

Недоцільною є також побудова дискретного рядудля дискретної випадкової величини, число можливих значень якої велике. У таких випадках слід будувати інтервальний варіаційний ряд розподілу.

Для побудови такого ряду весь інтервал варіювання значень випадкової величини, що спостерігаються, розбивають на ряд часткових інтервалів і підраховують частоту влучення значень величини в кожен частковий інтервал.

Інтервальним варіаційним рядом називають упорядковану сукупність інтервалів варіювання значень випадкової величини з відповідними частотами або відносними частотами попадань у кожен із них значень величини.

Для побудови інтервального ряду необхідно:

  1. визначити величину часткових інтервалів;
  2. визначити ширину інтервалів;
  3. встановити для кожного інтервалу його верхню і нижню межі ;
  4. згрупувати результати спостереження.

1 . Питання про вибір числа та ширини інтервалів угруповання доводиться вирішувати в кожному конкретному випадку виходячи з цілей дослідження, обсягу вибірки та ступеня варіювання ознаки у вибірці.

Приблизно кількість інтервалів k можна оцінити виходячи лише з обсягу вибірки n одним із наступних способів:

  • за формулою Стержеса : k = 1 + 3,32 lg n ;
  • з допомогою таблиці 1.

Таблиця 1

2 . Зазвичай кращі інтервали однакової ширини. Для визначення ширини інтервалів h обчислюють:

  • розмах варіювання R - значень вибірки: R = x max - x min ,

де x max і x min - максимальна та мінімальна варіанти вибірки;

  • ширину кожного з інтервалів h визначають за такою формулою: h = R/k .

3 . Нижня границя першого інтервалу x h1 вибирається так, щоб мінімальна варіанта вибірки x min потрапляла приблизно в середину цього інтервалу: x h1 = x min - 0,5 · h .

Проміжні інтервалиотримують додаючи до кінця попереднього інтервалу довжину часткового інтервалу h :

x hi = x hi-1 + h.

Побудова шкали інтервалів на основі обчислення меж інтервалів продовжується доти, доки величина x hi задовольняє співвідношення:

x hi< x max + 0,5·h .

4 . Відповідно до шкали інтервалів проводиться групування значень ознаки - для кожного часткового інтервалу обчислюється сума частот n i варіант, що потрапили в i -і інтервал. При цьому в інтервал включають значення випадкової величини, більші або рівні нижній межі та менші верхньої межі інтервалу.

Полігон та гістограма

Для наочності будують різні графіки статистичного розподілу.

За даними дискретного варіаційного ряду будують полігон частот чи відносних частот.

Полігоном частот x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Для побудови полігону частот на осі абсцис відкладають варіанти x i , але в осі ординат - відповідні їм частоти n i . Крапки ( x i ; n i ) з'єднують відрізками прямих і одержують полігон частот (Рис. 1).

Полігоном відносних частотназивають ламану, відрізки якої з'єднують точки ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; W k ). Для побудови полігону відносних частот на осі абсцис відкладають варіанти x i , але в осі ординат - відповідні їм відносні частоти W i . Крапки ( x i ; W i ) з'єднують відрізками прямих і одержують полігон відносних частот.

В разі безперервної ознаки доцільно будувати гістограму .

Гістограмою частотназивають ступінчасту фігуру, що складається з прямокутників, основами яких є часткові інтервали довжиною h , а висоти дорівнюють n i / h (Щільність частоти).

Для побудови гістограми частот осі абсцис відкладають часткові інтервали, а над ними проводять відрізки, паралельні осі абсцис на відстані n i / h .

Результати угруповання зібраних статистичних даних, зазвичай, представляються як рядів розподілу. Ряд розподілу - це впорядкований розподіл одиниць сукупності на групи за ознакою, що вивчається.

Ряди розподілу поділяються на атрибутивні та варіаційні, залежно від ознаки, покладеної в основу угруповання. Якщо ознака якісна, то ряд розподілу називається атрибутивним. прикладом атрибутивного рядує розподіл підприємств та організацій за формами власності (див. табл. 3.1).

Якщо ознака, яким будується ряд розподілу, кількісний, то ряд називається варіаційним.

Варіаційний ряд розподілу завжди складається з двох частин: варіант і відповідних частот (або частостей). Варіантою називається значення , яке може набувати ознаки в одиниць сукупності, частотою - кількість одиниць спостереження, що мають дане значення ознаки. Сума частот завжди дорівнює обсягу сукупності. Іноді замість частот розраховують частоти - це частоти, виражені або у частках одиниці (тоді сума всіх частостей дорівнює 1), або у відсотках до обсягу сукупності (сума частостей дорівнюватиме 100%).

Варіаційні ряди бувають дискретними та інтервальними. У дискретних рядів (табл. 3.7) варіанти виражені конкретними числами, Найчастіше цілими.

Таблиця 3.8. Розподіл працівників за часом роботи у страховій компанії
Час роботи в компанії повних років(варіанти) Число працюючих
Чоловік (частоти) у % до підсумку (частини)
до року 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Разом 129 100,0

У інтервальних рядах (див. табл. 3.2) значення показника задаються як інтервалів. Інтервали мають дві межі: нижню та верхню. Інтервали можуть бути відкритими та закритими. У відкритих немає жодної з кордонів, так, у табл. 3.2 перший інтервал немає нижньої межі, а в останнього - верхньої. При побудові інтервального ряду в залежності від характеру розкиду значень ознаки використовують як рівні інтервальні проміжки, так і нерівні (табл. 3.2 представлений варіаційний ряд з рівними інтервалами).

Якщо ознака приймає обмежену кількість значень, зазвичай трохи більше 10, будують дискретні ряди розподілу. Якщо варіант більше, дискретний ряд втрачає свою наочність; у цьому випадку доцільно використати інтервальну форму варіаційного ряду. При безперервній варіації ознаки, коли його значення в певних межах відрізняються один від одного на скільки завгодно малу величину, також будують ряд інтервалу розподілу.

3.3.1. Побудова дискретних варіаційних рядів

Розглянемо методику побудови дискретних варіаційних рядів з прикладу.

Приклад 3.2. Є такі дані про кількісний склад 60 сімей:

Щоб отримати уявлення про розподіл сімей за кількістю їх членів, слід побудувати варіаційний ряд. Оскільки ознака приймає обмежену кількість цілих значень будуємо дискретний варіаційний ряд. Для цього спочатку рекомендується виписати всі значення ознаки (число членів у сім'ї) у порядку зростання (тобто провести ранжування статистичних даних):

Потім необхідно підрахувати кількість сімей, які мають однаковий склад. Число членів сімей (значення варіюючої ознаки) - це варіанти (будемо їх позначати через х), число сімей, що мають однаковий склад, - це частоти (будемо їх позначати через f). Результати угруповання подаємо у вигляді наступного дискретного варіаційного ряду розподілу:

Таблиця 3.11.
Число членів сім'ї (х) Число сімей (y)
1 8
2 14
3 20
4 9
5 5
6 4
Разом 60

3.3.2. Побудова інтервальних варіаційних рядів

Покажемо методику побудови інтервальних варіаційних рядів розподілу на прикладі.

приклад 3.3. В результаті статистичного спостереженняотримані такі дані про середній величинівідсоткової ставки 50 комерційних банків (%):

Таблиця 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Як бачимо, переглядати такий масив даних дуже незручно, крім того, не видно закономірностей зміни показника. Побудуємо інтервальний ряд розподілу.

  1. Визначимо кількість інтервалів.

    Число інтервалів практично часто задається самим дослідником з завдань кожного конкретного спостереження. Водночас його можна вирахувати і математично за формулою Стерджеса

    n = 1 + 3,322lgN,

    де n – число інтервалів;

    N – обсяг сукупності (число одиниць спостереження).

    Для нашого прикладу отримаємо: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6"7.

  2. Визначимо величину інтервалів (i) за формулою

    де х max - максимальне значенняознаки;

    х min – мінімальне значення ознаки.

    Для нашого прикладу

    Інтервали варіаційного ряду наочні, якщо їх межі мають "круглі" значення, тому округлим розмір інтервалу 1,9 до 2, а мінімальне значення ознаки 12,3 до 12,0.

  3. Визначимо межі інтервалів.

    Інтервали, як правило, записують таким чином, щоб верхня межа одного інтервалу була одночасно нижньою межею наступного інтервалу. Так, для нашого прикладу отримаємо: 120-140; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.

    Подібний запис означає, що ознака безперервна. Якщо ж варіанти ознаки приймають суворо певні значеннянаприклад, тільки цілі, але їх кількість занадто велика для побудови дискретного ряду, то можна створити інтервальний ряд, де нижня межа інтервалу не збігатиметься з верхньою межею наступного інтервалу (це означатиме, що ознака дискретна). Наприклад, у розподілі працівників підприємства за віком можна створити такі інтервальні групи років: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 та більше.

    Крім того, у нашому прикладі ми могли б зробити перший та останній інтервали відкритими, тощо. записати: до 14,0; 24,0 та вище.

  4. За вихідними даними збудуємо ранжований ряд. Для цього запишемо в порядку зростання значення, які набуває ознаки. Результати подаємо у таблиці: Таблиця 3.13. Ранжований ряд величин процентної ставки комерційних банків
    Ставка банку % (варіанти)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Підрахуємо частоти.

    При підрахунку частот може виникнути ситуація, коли значення ознаки потрапить на межу якогось інтервалу. У такому разі можна керуватися правилом: ця одиниця приписується до того інтервалу, для якого її значення є верхнім кордоном. Так, значення 16,0 у нашому прикладі ставитиметься до другого інтервалу.

Результати угруповання, отримані в прикладі, оформимо в таблиці.

Таблиця 3.14. Розподіл комерційних банків за величиною кредитної ставки
Коротка ставка, % Кількість банків, од. (Частоти) Накопичені частоти
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Разом 50 -

В останній графі таблиці представлені накопичені частоти, які отримують шляхом послідовного підсумовування частот, починаючи з першої (наприклад, для першого інтервалу - 5, другого інтервалу 5 + 9 = 14, для третього інтервалу 5 + 9 + 4 = 18 і т.д. .). Накопичена частота, наприклад, 33, показує, що з 33 банків кредитна ставка вбирається у 20% (верхня межа відповідного інтервалу).

У процесі угруповання даних під час побудови варіаційних рядів іноді використовуються нерівні інтервали. Це стосується тих випадків, коли значення ознаки підкоряються правилу арифметичної або геометричній прогресіїабо коли застосування формули Стерджес приводить до появи "порожніх" інтервальних груп, що не містять жодної одиниці спостереження. Тоді межі інтервалів задаються довільно самим дослідником виходячи з здорового глуздута цілей обстеження або за формулами. Так, для даних, що змінюються в арифметичної прогресії, Розмір інтервалів обчислюється наступним чином.