Біографії Характеристики Аналіз

Побудова дискретного ряду. Побудова дискретного варіаційного ряду

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

гарну роботуна сайт">

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http://www.allbest.ru/

ЗАВДАННЯ1

Є такі дані про заробітної платипрацівників на підприємстві:

Таблиця 1.1

Розмір заробітної плати за ум. ден. од.

Потрібно побудувати інтервальний ряд розподілу, яким знайти;

1) середню заробітну плату;

2) середнє лінійне відхилення;

4) середнє квадратичне відхилення;

5) розмах варіації;

6) коефіцієнт осциляції;

7) лінійний коефіцієнтваріації;

8) простий коефіцієнт варіації;

10) медіану;

11) коефіцієнт асиметрії;

12) показник асиметрії Пірсона;

13) коефіцієнт ексцесу.

Рішення

Як відомо, варіанти (значення визнано) розташовані у порядку зростання утворюють дискретний варіаційний ряд. При великій кількості Варіант (більше 10) навіть у разі дискретної варіації будуються інтервальні ряди.

Якщо складається інтервальний ряд із рівними інтервалами, то розмах варіації поділяється на вказане числоінтервалів. При цьому якщо отримане значення ціле і однозначне (що буває рідко), то довжина інтервалу приймається рівною цьому числу. В інших випадках Виготовляється округлення обов'язково в бік збільшення, так щоб остання цифра, що залишилася, була парною. Очевидно, зі збільшенням довжини інтервалу розширюється розмах варіації на величину, рівною добуткучисла інтервалів: на різницю розрахункової та первісної довжини інтервалу

а) Якщо величина розширення розмаху варіації незначна, її або додають до найбільшого або віднімають з найменшого значення ознаки;

б) Якщо величина розширення розмаху варіації відчутна, те, щоб не відбулося змішування центру розмаху, її приблизно ділять навпіл одночасно додаючи до найбільшого та віднімаючи з найменшого значень ознаки.

Якщо складається інтервальний ряд з нерівними інтервалами, то процес спрощується, але, як і раніше, довжина інтервалів повинна виражатися числом з останньою парною цифрою, що значно спрощує наступні розрахунки. числових характеристик.

30 – обсяг вибірки.

Складемо інтервальний ряд розподілу, використовуючи формулу Стерджесу:

K = 1 + 3.32 * lg n,

K – число груп;

K = 1 + 3.32 * lg 30 = 5,91 = 6

Знаходимо розмах ознаки - заробітна плата працівників на підприємстві - (х) за формулою

R = xmaх - xmin і ділимо на 6; R = 195-112 = 83

Тоді довжина інтервалу буде lпер = 83: 6 = 13.83

Початком першого інтервалу буде 112. Додаючи до 112 lрас=13,83, отримаємо його кінцеве значення 125,83, яке є початком другого інтервалу і т.д. кінець п'ятого інтервалу – 195.

При знаходженні частот слід керуватися правилом: «якщо значення ознаки збігається з межею внутрішнього інтервалу, його слід відносити до попереднього інтервалу».

Отримаємо інтервальний ряд частот та накопичувальних частот.

Таблиця 1.2

Отже, 3 працівники мають зар. плату від 112 до 125,83 ум.ден.од. Найбільша зар. плата від 181,15 до 195 ум.ден.од. лише у 6-ти працівників.

Для розрахунку числових характеристик інтервальний ряд перетворимо на дискретний, взявши як варіант середини інтервалів:

Таблиця 1.3

14131,83

За формулою виваженого середнього арифметичного

ум.ден.ед.

Середнє лінійне відхилення:

де xi - значення ознаки, що вивчається, у i-тої одиниці сукупності,

Середня величина ознаки, що вивчається.

Розміщено на http://www.allbest.ru/

LРозміщено на http://www.allbest.ru/

Усл.ден.ед.

Середнє квадратичне відхилення:

Дисперсія:

Відносний розмах варіації (коефіцієнт осциляції): з = R:,

Відносне лінійне відхилення: q = L:

Коефіцієнт варіації: V = у:

Коефіцієнт осциляції показує відносну коливання крайніх значеньознаки у середньої арифметичної, а коефіцієнт варіації характеризує рівень і однорідності сукупності.

з = R: = 83 / 159,485 * 100% = 52,043%

Таким чином, різниця між крайніми значеннями на 5,16% (=94,84%-100%) менша за середнє значення заробітної плати працівників на підприємстві.

q = L: = 17,765 / 159,485 * 100% = 11,139%

V = у: = 21,704 / 159,485 * 100% = 13,609%

Коефіцієнт варіації менше 33%, що говорить про слабку варіацію заробітної плати працівників для підприємства, тобто. про те, що середня величинає типовою характеристикою заробітної плати працівників (сукупність однорідна).

В інтервальних рядах розподілу модавизначається за формулою -

Частота модального інтервалу, тобто інтервалу, що містить найбільша кількістьрізновид;

Частота інтервалу, що передує модальному;

Частота інтервалу, наступного за модальним;

Довжина модального інтервалу;

Нижня межа модального інтервалу.

Для визначення медіанив інтервальному ряду скористаємося формулою

де - кумулятивна (накопичена) частота інтервалу, що передує медіанному;

Нижня межа медіанного інтервалу;

Частота медіанного інтервалу;

Довжина медіанного інтервалу.

Медіанний інтервал- інтервал, накопичена частота якого (=3+3+5+7) перевищує половину суми частот – (153,49; 167,32).

Розрахуємо асиметрію та ексцес для чого складемо нову робочу таблицю:

Таблиця 1.4

Фактичні дані

Розрахункові дані

Розрахуємо момент третього порядку

Отже, асиметрія дорівнює

Оскільки 0,3553 0,25, то асиметрія визнається значною.

Розрахуємо момент четвертого порядку

Отже, ексцес дорівнює

Так як< 0, то эксцесс является плосковершинным.

Ступінь асиметрії може бути визначений за допомогою коефіцієнта асиметрії Пірсона (Аs): осциляція вибірка вартість товарообіг

де - Середня арифметична ряду розподілу; - Мода; - Середнє квадратичне відхилення.

При симетричному (нормальному) розподілі = Мо, отже, коефіцієнт асиметрії дорівнює нулю. Якщо Аs > 0, то більше моди, отже є правостороння асиметрія.

Якщо As< 0, то менше модиотже, є лівостороння асиметрія. Коефіцієнт асиметрії може змінюватися від -3 до +3.

Розподіл не є симетричним, а має лівосторонню асиметрію.

ЗАВДАННЯ 2

Яка має бути чисельність вибірки, щоб із ймовірністю 0,954 помилка вибірки не перевищувала 0,04, якщо на основі попередніх обстежень відомо, що дисперсія дорівнює 0,24?

Рішення

Обсяг вибірки при безповторному відборірозраховується за формулою:

t - коефіцієнт довіри (при ймовірності 0,954 він дорівнює 2,0; визначається за таблицями інтегралів ймовірності),

у2 = 0,24 - середнє квадратичне відхилення;

10000 чол. - чисельність вибірки;

Дх = 0,04 - гранична помилкавибіркової середньої.

Імовірно 95,4% можна стверджувати, що чисельність вибірки, що забезпечує відносну похибкуне більше 0,04, має становити не менше 566 сімей.

ЗАВДАННЯ3

Є такі дані про доходи від основної діяльності підприємства, млн. руб.

Для аналізу низки динаміки визначте такі показники:

1) ланцюгові та базисні:

Абсолютні прирости;

Темпи зростання;

Темпи приросту;

2) середній

Рівень низки динаміки;

Абсолютний приріст;

Темп зростання;

Темп приросту;

3) абсолютне значення 1% приросту.

Рішення

1. Абсолютний приріст (Ду)- це різниця між наступним рівнем ряду та попереднім (або базисним):

ланцюговий: Ду = уi - yi-1,

базисний: Ду = уi - y0,

уi - рівень ряду,

i - номер рівня ряду,

y0 – рівень базисного року.

2. Темп зростання (Ту)- це відношення наступного рівня ряду та попереднього (або базисного 2001 р.):

ланцюговий: Ту =;

базисний: Ту =

3. Темп приросту (ТД) - це відношення абсолютного приросту до попереднього рівня, виражене у %.

ланцюговий: Ту =;

базисний: Ту =

4. Абсолютне значення 1% приросту (А)- Це ставлення ланцюгового абсолютного приросту до темпу приросту, вираженому в %.

А =

Середній рівень рядурозраховується за формулою середньої арифметичної.

Середній рівень доходів від основної діяльності за 4 роки:

Середній абсолютний прирістрозраховується за формулою:

де n – число рівнів ряду.

У середньому протягом року доходи від основної діяльності зросли на 3,333 млн. крб.

Середньорічний темп зростаннярозраховується за формулою середньої геометричної:

уn - кінцевий рівень ряду,

у0 - початковий рівеньряду.

Ту = 100% = 102,174%

Середньорічний темп приростурозраховується за формулою:

Т? = Ту - 100% = 102,74% - 100% = 2,74%.

Таким чином, у середньому протягом року доходи від основної діяльності підприємства збільшувалися на 2,74%.

ЗАДАЧА4

Обчислити:

1. Індивідуальні індекси цін;

2. Загальний індекс товарообігу;

3. Агрегатний індекс цін;

4. Агрегатний індекс фізичного обсягу продажу товарів;

5. Абсолютний приріст вартості товарообігу та розкладіть за факторами (за рахунок зміни цін та кількості проданих товарів);

6. Зробити короткі висновкиза всіма отриманими показниками.

Рішення

1. За умовою, індивідуальні індекси цін за виробами А, Б, В склали

iрA=1.20; iрБ = 1,15; iрВ = 1.00.

2. Загальний індекс товарообігу розрахуємо за такою формулою:

I w = = 1470/1045 * 100% = 140,67%

Товарообіг зріс на 40,67% (140,67%-100%).

У середньому, ціни на товари зросли на 10,24%.

Сума додаткових витрат покупців від зростання цін:

w(p) =? p1q1 -? p0q1 = 1470 – 1333,478 = 136,522 млн. руб.

Через війну зростання цін покупцям довелося додатково витратити 136,522 млн. крб.

4. Загальний індекс фізичного обсягу товарообігу:

Фізичний обсяг товарообігу становило 27,61 %.

5. Визначимо загальна змінатоварообігу у другому періоді порівняно з першим періодом:

w = 1470-1045 = 425 млн.руб.

за рахунок зміни цін:

W(р) = 1470 – 1333,478 = 136,522 млн. руб.

за рахунок зміни фізичного обсягу:

w(q) = 1333,478 - 1045 = 288,478 млн. руб.

Товарообіг товарів збільшився на 40,67%. Ціни в середньому за 3 товарами зросли на 10,24%. Фізичний обсяг товарообігу збільшився на 27,61%.

У цілому нині обсяг реалізації збільшився на 425 млн.руб., зокрема з допомогою зростання цін він зріс на 136,522 млн. крб., а рахунок збільшення обсягів продажу - на 288,478 млн. крб.

ЗАВДАННЯ5

По 10 заводах однієї галузі є такі дані.

№ заводу

Випуск продукції, тис. прим. (Х)

На основі наведених даних:

I) для підтвердження положень логічного аналізу про наявність кореляційної прямолінійної залежності між факторною ознакою (обсягом випуску продукції) та результативною ознакою (витратою електроенергії) нанесіть вихідні дані на графік кореляційного поля та зробіть висновки про форму зв'язку, вкажіть її формулу;

2) визначте параметри рівняння зв'язку та нанесіть отриману при цьому теоретичну лінію на графік кореляційного поля;

3) обчисліть лінійний коефіцієнт кореляції,

4) поясніть значення показників, отриманих у пунктах 2) та 3);

5) використовуючи отриману модель, зробіть прогноз про можливу витрату електроенергії на заводі з обсягом виробництва 4,5 тис. шт.

Рішення

Дані ознаки – обсяг випуску продукції (фактор), позначимо через хi; ознаки – витрата електроенергії (результат) через уi; крапки з координатами (х, у) наносимо на кореляційне поле ОХУ.

Крапки кореляційного поля розташовані вздовж деякої прямої. Отже, зв'язок - лінійний, шукатимемо рівняння регресії у вигляді прямої Уx = ax + b. Для його знаходження скористаємося системою нормальних рівнянь:

Складемо розрахункову таблицю.

За знайденим середнім складаємо систему та вирішуємо її щодо параметрів а та b:

Отже, отримаємо рівняння регресії у на х: = 3,57692 х + 3,19231

Будуємо лінію регресії на кореляційному полі.

Підставляючи в рівняння регресії значення х зі стовпця 2, отримаємо розрахункові (стовпець 7) і порівнюємо їх з даними у, що відображено в стовпці 8. До речі, правильність розрахунків підтверджується і збігом середніх значень у.

Коефіцієнтлінійної кореляціїоцінює тісноту залежності між ознаками х і у і розраховується за формулою

Кутовий коефіцієнт прямої регресії а (при х) характеризує напрямок виявленоїзалежностіознак: при а>0 однакові, при а<0- противоположны. Його абсолютна величина - міра зміни результативної ознаки при зміні факторного на одиницю виміру.

Вільний член прямої регресії виявляє напрям, яке абсолютне значення - кількісну міру впливу результативний ознака всіх інших чинників.

Якщо< 0, то ресурс факторної ознаки окремого об'єкта використовується з меншою, а при>0 збільшою результативністю, ніж у середньому по всій безлічі об'єктів.

Проведемо післярегресійний аналіз.

Коефіцієнт при х прямої регресії дорівнює 3,57692 >0, отже, зі збільшенням (зменшенням) випуску продукції зростає (падає) витрата електроенергії. Збільшення випуску продукції на 1 тис. прим. дає в середньому зростання витрат електроенергії на 3,57692 тис. кВт.год.

2. Вільний член прямої регресії дорівнює 3,19231, отже, вплив інших чинників збільшує силу впливу випуску продукції витрату електроенергії в абсолютному виміріна 3,19231 тис. кВт.год.

3. Коефіцієнт кореляції 0,8235 виявляє тісну залежність витрати електроенергії від випуску продукції.

За рівнянням регресійної моделілегко робити прогнози. Для цього рівняння регресії підставляють значення х - обсяг випуску продукції і прогнозують витрати електроенергії. У цьому значення х можна брати у межах заданого розмаху, а й поза ним.

Зробимо прогноз про можливу витрату електроенергії на заводі з обсягом виробництва 4,5 тис. шт.

3,57692 * 4,5 + 3,19231 = 19,288 45 тис. кВт.год.

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

1. Захаренков С.М. Соціально-економічна статистика: Навчальний практ. посібник. -Мн.: БДЕУ, 2002.

2. Єфімова М.Р., Петрова Є.В., Рум'янцев В.М. Загальна теоріястатистики. - М: ІНФРА - М., 2000.

3. Єлісєєва І.І. Статистика. - М: Проспект, 2002.

4. Загальна теорія статистики / За заг. ред. О.Е. Башин, А.А. Спірина. - М.: Фінанси та статистика, 2000.

5. Соціально-економічна статистика: Навчальний практ. посібник/Захаренков С.М. та ін - Мн.: ЄГУ, 2004.

6. Соціально-економічна статистика: Навч. допомога. / За ред. Нестерович С.Р. - Мн.: БДЕУ, 2003.

7. Теслюк І.Є., Тарловська В.А., Терліженко Н. Статистика. - Мінськ, 2000.

8. Харченко Л.П. Статистика. - М: ІНФРА - М, 2002.

9. Харченко Л.П., Долженкова В.Г., Іонін В.Г. Статистика. - М: ІНФРА - М, 1999.

10. Економічна статистика/За ред. Ю.М. Іванова – М., 2000.

Розміщено на Allbest.ru

...

Подібні документи

    Розрахунок середньої арифметичної для інтервального рядурозподілу. Визначення загального індексуфізичного обсягу товарообігу. Аналіз абсолютної зміни загальної вартості продукції з допомогою зміни фізичного обсягу. Розрахунок коефіцієнта варіації.

    контрольна робота , доданий 19.07.2010

    Сутність оптового, роздрібного та громадського товарообігу. Формули розрахунку індивідуальних, агрегатних індексів товарообігу. Розрахунок характеристик інтервального ряду розподілу – середнього арифметичного, моди та медіани, коефіцієнта варіації.

    курсова робота , доданий 10.05.2013

    Розрахунок планового та фактичного обсягу продажів, відсотка виконання плану, абсолютної зміни товарообігу. Визначення абсолютного приросту, середніх темпів зростання та приросту грошових доходів. Розрахунок структурних середніх: моди, медіани, квартилю.

    контрольна робота , доданий 24.02.2012

    Інтервальний ряд розподілу банків за обсягом прибутку. Знаходження моди та медіани отриманого інтервального ряду розподілу графічним методомта шляхом розрахунків. Розрахунок показників інтервального ряду розподілу. Обчислення середньої арифметичної.

    контрольна робота , доданий 15.12.2010

    Формули визначення середніх величин інтервального ряду – моди, медіани, дисперсії. Розрахунок аналітичних показників рядів динаміки за ланцюговою та базисною схемами, темпами зростання та приросту. Поняття зведеного індексу собівартості, цін, витрат та товарообігу.

    курсова робота , доданий 27.02.2011

    Поняття та призначення, порядок та правила побудови варіаційного ряду. Аналіз однорідності даних у групах. Показники варіації (хитання) ознаки. Визначення середнього лінійного та квадратичного відхилення, коефіцієнта осциляції та варіації

    контрольна робота , доданий 26.04.2010

    Поняття моди та медіани як типових характеристик, порядок та критерії їх визначення. Знаходження моди та медіани у дискретному та інтервальному варіаційному ряду. Квартили та децилі як додаткові характеристики варіаційного статистичного ряду.

    контрольна робота , доданий 11.09.2010

    Побудова інтервального ряду розподілу за групувальною ознакою. Характеристика відхилення розподілу частот від симетричної форми, розрахунок показників ексцесу та асиметрії. Аналіз показників бухгалтерського балансу чи звіту про прибутки.

    контрольна робота , доданий 19.10.2014

    Перетворення емпіричного ряду в дискретний та інтервальний. Визначення середньої величини дискретного ряду з використанням її властивостей. Розрахунок за дискретним рядом моди, медіани, показників варіації (дисперсія, відхилення, коефіцієнт осциляції).

    контрольна робота , доданий 17.04.2011

    Побудова статистичного ряду розподілу організацій. Графічне визначеннязначення моди та медіани. Тіснота кореляційного зв'язку з використанням коефіцієнта детермінації. Визначення помилки вибірки середньооблікової чисельності працівників.

Найбільш простим способом узагальнення статистичного матеріалує побудова рядів. Результатом зведення статистичного дослідженняможе бути ряди розподілу. Поруч розподілу у статистиці називається упорядкований розподіл одиниць сукупності на групи за якоюсь однією ознакою: за якісною чи кількісною. Якщо ряд побудований за якісною ознакою, то він називається атрибутивним, а якщо за кількісною ознакою, то варіаційний.

Варіаційний ряд характеризується двома елементами: варіантом (Х) та частотою (f). Варіанта – це окреме значення ознаки окремої одиниці чи групи сукупності. Число, що показує скільки разів зустрічається те чи інше значення ознаки, називається частотою. Якщо частота виражена відносним числом, вона називається частотою. Варіаційний ряд може бути інтервальним, коли визначені межі «від» і «до», а може бути дискретним, коли ознака, що вивчається, характеризується певним числом.

Побудову варіаційних рядів розглянемо на прикладах.

приклад. і є дані про тарифні розряди 60 робітників одного з цехів заводу.

Розподілити робітників за тарифним розрядом, побудувати варіаційний ряд.

Для цього випишемо всі значення ознаки в порядку зростання і порахуємо кількість робітників у кожній групі.

Таблиця 1.4

Розподіл робітників за розрядом

Розряд робітників (X)

Число робітників

людина (f)

у % до підсумку (приватність)

Ми отримали варіаційний дискретний ряд, в якому ознака (розряд робітника), що вивчається, представлений певним числом. Для наочності варіаційні ряди є графічними. З даного ряду розподілу побудували поверхню розподілу.

Рис. 1.1. Полігон розподілу робітників за тарифним розрядом

Побудова інтервального ряду з рівними інтервалами розглянемо на прикладі.

приклад. Відомі дані про вартість основного капіталу 50 фірм у млн руб. Потрібно показати розподіл фірм за вартістю основний капітал.

Щоб показати розподіл фірм за вартістю основного капіталу, спочатку вирішимо питання кількості груп, які хочемо виділити. Припустимо, вирішили виділити 5 груп підприємств. Потім визначимо величину інтервалу групи. Для цього скористаємося формулою

Відповідно до нашого прикладу.

Шляхом збільшення величини інтервалу до мінімального значення ознаки, отримаємо групи фірм за вартістю основного капіталу.

Одиниця, що володіє подвійним значенням, відноситься до тієї групи, де вона виступає в ролі верхньої межі (тобто значення ознаки 17 піде в першу групу, 24 - в другу і т.д.).

Підрахуємо кількість заводів у кожній групі.

Таблиця 1.5

розподіл фірм за вартістю основного капіталу (млн руб.)

Вартість основного капіталу
в млн руб. (Х)

Число фірм
(частота) (f)

Накопичені частоти
(кумулятивні)

Згідно з цим розподілом отримали варіаційний інтервальний ряд, з якого випливає, що 36 фірм мають основний капітал вартістю від 10 до 24 млн руб. і т.д.

Інтервальні ряди розподілу можна подати графічно як гістограми.

Результати обробки даних оформлюються в статистичні таблиці. Статистичні таблиці містять своє підлягає і присудок.

Підлягає – це та сукупність чи частина сукупності, що піддається характеристиці.

Сказуване – показники, що характеризують підлягає.

Таблиці розрізняють: прості та групові, комбінаційні, з простою та складною розробкою присудка.

Проста таблиця підлягає містить перелік окремих одиниць.

Якщо ж підлягає є угруповання одиниць, то така таблиця називається груповий. Наприклад, група підприємств за кількістю робітників, групи населення за статтю.

У підлягає комбінаційної таблиці міститься угруповання за двома або декількома ознаками. Наприклад, населення за статтю поділяється на групи за освітою, віком тощо.

Комбінаційні таблиці містять інформацію, що дозволяє виявити та охарактеризувати взаємозв'язок низки показників та закономірність їх зміни як у просторі, так і в часі. Щоб таблиця була наочної розробки її підлягає, обмежуються двома-трьома ознаками, утворюючи у кожному їх обмежене число груп.

Визначення в таблицях може бути розроблено по-різному. При простий розробці присудка всі його показники розташовуються незалежно один від одного.

При складній розробці присудка показники поєднуються один з одним.

При побудові будь-якої таблиці потрібно виходити з цілей дослідження та змісту обробленого матеріалу.

Крім таблиць у статистиці використовуються графіки та діаграми. Діаграма – статистичні дані зображуються за допомогою геометричних фігур. Діаграми поділяються на лінійні та стовпчикові, але можуть бути фігурні діаграми (малюнки та символи), кругові діаграми(коло приймається за величину всієї сукупності, а площі окремих секторів відображають питома вагаабо її частку складових частин), радіальні діаграми(Будуються на базі полярних ординат). Картограма є поєднанням контурної карти або плану місцевості з діаграмою.

Результати угруповання зібраних статистичних даних, Як правило, представляються у вигляді рядів розподілу. Ряд розподілу - це впорядкований розподіл одиниць сукупності на групи за ознакою, що вивчається.

Ряди розподілу поділяються на атрибутивні та варіаційні, залежно від ознаки, покладеної в основу угруповання. Якщо ознака якісна, то ряд розподілу називається атрибутивним. Прикладом атрибутивного ряду є розподіл підприємств та організацій за формами власності (див. табл. 3.1).

Якщо ознака, яким будується ряд розподілу, кількісний, то ряд називається варіаційним.

Варіаційний ряд розподілу завжди складається з двох частин: варіант і відповідних частот (або частостей). Варіантою називається значення , яке може набувати ознаки в одиниць сукупності, частотою - кількість одиниць спостереження, що мають дане значення ознаки. Сума частот завжди дорівнює обсягу сукупності. Іноді замість частот розраховують частоти - це частоти, виражені або у частках одиниці (тоді сума всіх частостей дорівнює 1), або у відсотках до обсягу сукупності (сума частостей дорівнюватиме 100%).

Варіаційні ряди бувають дискретними та інтервальними. У дискретних рядів (табл. 3.7) варіанти виражені конкретними числами, Найчастіше цілими.

Таблиця 3.8. Розподіл працівників за часом роботи у страховій компанії
Час роботи в компанії повних років(варіанти) Число працюючих
Чоловік (частоти) у % до підсумку (частини)
до року 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
Разом 129 100,0

У інтервальних рядах (див. табл. 3.2) значення показника задаються як інтервалів. Інтервали мають дві межі: нижню та верхню. Інтервали можуть бути відкритими та закритими. У відкритих немає жодної з кордонів, так, у табл. 3.2 перший інтервал немає нижньої межі, а в останнього - верхньої. При побудові інтервального ряду в залежності від характеру розкиду значень ознаки використовують як рівні інтервальні проміжки, так і нерівні (табл. 3.2 представлений варіаційний ряд з рівними інтервалами).

Якщо ознака приймає обмежену кількість значень, зазвичай трохи більше 10, будують дискретні ряди розподілу. Якщо варіант більше, дискретний ряд втрачає свою наочність; у цьому випадку доцільно використати інтервальну форму варіаційного ряду. При безперервній варіації ознаки, коли його значення в певних межах відрізняються один від одного на скільки завгодно малу величину, також будують ряд інтервалу розподілу.

3.3.1. Побудова дискретних варіаційних рядів

Розглянемо методику побудови дискретних варіаційних рядів з прикладу.

Приклад 3.2. Є такі дані про кількісний склад 60 сімей:

Щоб отримати уявлення про розподіл сімей за кількістю їх членів, слід побудувати варіаційний ряд. Оскільки ознака приймає обмежену кількість цілих значень будуємо дискретний варіаційний ряд. Для цього спочатку рекомендується виписати всі значення ознаки (число членів у сім'ї) у порядку зростання (тобто провести ранжування статистичних даних):

Потім необхідно підрахувати кількість сімей, які мають однаковий склад. Число членів сімей (значення варіюючої ознаки) - це варіанти (будемо їх позначати через х), число сімей, що мають однаковий склад, - це частоти (будемо їх позначати через f). Результати угруповання подаємо у вигляді наступного дискретного варіаційного ряду розподілу:

Таблиця 3.11.
Число членів сім'ї (х) Число сімей (y)
1 8
2 14
3 20
4 9
5 5
6 4
Разом 60

3.3.2. Побудова інтервальних варіаційних рядів

Покажемо методику побудови інтервальних варіаційних рядів розподілу на прикладі.

приклад 3.3. В результаті статистичного спостереженняотримані такі дані про середню величину процентної ставки 50 комерційних банків (%):

Таблиця 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Як бачимо, переглядати такий масив даних украй незручно, крім того, не видно закономірностей зміни показника. Побудуємо інтервальний ряд розподілу.

  1. Визначимо кількість інтервалів.

    Число інтервалів практично часто задається самим дослідником з завдань кожного конкретного спостереження. Водночас його можна вирахувати і математично за формулою Стерджеса

    n = 1 + 3,322lgN,

    де n – число інтервалів;

    N – обсяг сукупності (число одиниць спостереження).

    Для нашого прикладу отримаємо: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6"7.

  2. Визначимо величину інтервалів (i) за формулою

    де х max – максимальне значення ознаки;

    х min – мінімальне значення ознаки.

    Для нашого прикладу

    Інтервали варіаційного ряду наочні, якщо їх межі мають "круглі" значення, тому округлим розмір інтервалу 1,9 до 2, а мінімальне значення ознаки 12,3 до 12,0.

  3. Визначимо межі інтервалів.

    Інтервали, як правило, записують таким чином, щоб верхня межа одного інтервалу була одночасно нижньою межею наступного інтервалу. Так, для нашого прикладу отримаємо: 120-140; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.

    Подібний запис означає, що ознака безперервна. Якщо ж варіанти ознаки приймають суворо певні значеннянаприклад, тільки цілі, але їх кількість занадто велика для побудови дискретного ряду, то можна створити інтервальний ряд, де нижня межа інтервалу не збігатиметься з верхньою межею наступного інтервалу (це означатиме, що ознака дискретна). Наприклад, у розподілі працівників підприємства за віком можна створити такі інтервальні групи років: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 та більше.

    Крім того, у нашому прикладі ми могли б зробити перший та останній інтервали відкритими, тощо. записати: до 14,0; 24,0 та вище.

  4. За вихідними даними збудуємо ранжований ряд. Для цього запишемо в порядку зростання значення, які набуває ознаки. Результати подаємо у таблиці: Таблиця 3.13. Ранжований ряд величин процентної ставки комерційних банків
    Ставка банку % (варіанти)
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Підрахуємо частоти.

    При підрахунку частот може виникнути ситуація, коли значення ознаки потрапить на межу якогось інтервалу. У такому разі можна керуватися правилом: ця одиниця приписується до того інтервалу, для якого її значення є верхнім кордоном. Так, значення 16,0 у нашому прикладі ставитиметься до другого інтервалу.

Результати угруповання, отримані в прикладі, оформимо в таблиці.

Таблиця 3.14. Розподіл комерційних банків за величиною кредитної ставки
Коротка ставка, % Кількість банків, од. (Частоти) Накопичені частоти
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
Разом 50 -

В останній графі таблиці представлені накопичені частоти, які отримують шляхом послідовного підсумовування частот, починаючи з першої (наприклад, для першого інтервалу - 5, другого інтервалу 5 + 9 = 14, для третього інтервалу 5 + 9 + 4 = 18 і т.д. .). Накопичена частота, наприклад, 33, показує, що з 33 банків кредитна ставка вбирається у 20% (верхня межа відповідного інтервалу).

У процесі угруповання даних під час побудови варіаційних рядів іноді використовуються нерівні інтервали. Це стосується тих випадків, коли значення ознаки підкоряються правилу арифметичної або геометричній прогресіїабо коли застосування формули Стерджес приводить до появи "порожніх" інтервальних груп, що не містять жодної одиниці спостереження. Тоді межі інтервалів задаються довільно самим дослідником виходячи з здорового глуздута цілей обстеження або за формулами. Так, для даних, що змінюються в арифметичної прогресії, Розмір інтервалів обчислюється наступним чином.

Умова:

Є дані про віковий склад робітників (років): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28, 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Побудувати інтервальний ряд розподілу.
    2. Побудувати графічне зображенняряду.
    3. Графічно визначити моду та медіану.

Рішення:

1) За формулою Стерджеса сукупність треба поділити на 1 + 3,322 lg 30 = 6 груп.

Максимальний вік – 38, мінімальний – 18.

Ширина інтервалу Оскільки кінці інтервалів мають бути цілими числами, розділимо сукупність на 5 груп. Ширина інтервалу – 4.

Для полегшення підрахунків розташуємо дані у порядку зростання: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 3 30, 31, 32, 32, 33, 34, 35, 38, 38.

Розподіл вікового складуробітників

Графічно ряд можна зобразити як гістограми чи полігону. Гістограма – стовпчикова діаграма. Основа стовпчика – ширина інтервалу. Висота стовпчика дорівнює частоті.

Полігон (або багатокутник розподілу) – графік частот. Щоб побудувати його по гістограмі, з'єднуємо середини верхніх сторін прямокутників. Багатокутник замикаємо на осі Ох на відстанях, рівних половині інтервалу крайніх значень х.

Мода (Мо) - це величина досліджуваного ознаки, що у цій сукупності зустрічається найчастіше.

Щоб визначити моду за гістограмою, треба вибрати найвищий прямокутник, провести лінію від правої вершини прямокутника до правого верхньому куткупопереднього прямокутника і від лівої вершини модального прямокутника провести лінію до лівої вершини наступного прямокутника. Від точки перетину цих ліній провести перпендикуляр до осі х. Абсцис і буде модою. Мо ≈ 27,5. Отже, найпоширеніший вік у цій сукупності 27-28 років.

Медіана (Mе) - це величина ознаки, що вивчається, яка знаходиться в середині впорядкованого варіаційного ряду.

Медіану знаходимо по кумуляті. Кумулята – графік накопичених частот. Абсциси – варіанти ряду. Ординати – накопичені частоти.

Для визначення медіани по кумуляті знаходимо по осі ординат точку, що відповідає 50% накопичених частот (у нашому випадку 15), проводимо через неї пряму, паралельно осі Ох, і від точки її перетину з кумулятою проводимо перпендикуляр до осі х. Абсцис є медіаною. Ме ≈ 25,9. Це означає, що половина робітників у цій сукупності має вік менше 26 років.

Найважливішим етапом дослідження соціально-економічних явищ та процесів є систематизація первинних даних та отримання на цій основі зведеної характеристики всього об'єкта за допомогою узагальнюючих показників, що досягається шляхом зведення та угруповання первинного статистичного матеріалу.

Статистичне зведення - це комплекс послідовних операційщодо узагальнення конкретних одиничних фактів, що утворюють сукупність, для виявлення типових риста закономірностей, властивих досліджуваному явищу загалом. Проведення статистичного зведення включає наступні етапи :

  • вибір групувального ознаки;
  • визначення порядку формування груп;
  • розробка системи статистичних показниківдля характеристики груп та об'єкта в цілому;
  • розробка макетів статистичних таблиць для представлення результатів зведення.

Статистичним угрупованням називається розчленування одиниць сукупності, що вивчається на однорідні групиза певними суттєвими для них ознаками. Угруповання є найважливішим статистичним методомузагальнення статистичних даних, основою правильного обчислення статистичних показників.

Розрізняють наступні видиугруповань: типологічні, структурні, аналітичні. Всі ці угруповання поєднує те, що одиниці об'єкта поділені на групи за якоюсь ознакою.

Групувальною ознакою називається ознака, яким проводиться розбиття одиниць сукупності деякі групи. Від правильного виборугрупувальні ознаки залежать висновки статистичного дослідження. Як основу угруповання необхідно використовувати суттєві, теоретично обґрунтовані ознаки (кількісні чи якісні).

Кількісні ознаки угруповання мають числове вираження (обсяг торгів, вік людини, дохід сім'ї тощо), а якісні ознаки угруповання відображають стан одиниці сукупності (підлога, сімейний стан, галузева приналежність підприємства, його форма власності тощо).

Після того, як визначено підставу угруповання, слід вирішити питання про кількість груп, на які треба розбити досліджувану сукупність. Число груп залежить від завдань дослідження та виду показника, покладеного в основу угруповання, обсягу сукупності, ступеня варіації ознаки.

Наприклад, угруповання підприємств за формами власності враховує муніципальну, федеральну та власність суб'єктів федерації. Якщо угруповання проводиться за кількісною ознакою, тоді необхідно звернути особливу увагуна число одиниць досліджуваного об'єкта та ступінь коливання групувального ознаки.

Коли визначено кількість груп, слід визначити інтервали угруповання. Інтервал - Це значення варіює ознаки, що лежать у певних межах. Кожен інтервал має свою величину, верхню та нижню межі або хоча б одну з них.

Нижнім кордоном інтервалу називається найменше значення ознаки в інтервалі, а верхнім кордоном - Найбільше значення ознаки в інтервалі. Величина інтервалу є різницею між верхньою та нижньою межами.

Інтервали угруповання залежно від їхньої величини бувають: рівні та нерівні. Якщо варіація ознаки проявляється у порівняно вузьких межах і розподіл має рівномірний характер, то будують угруповання з рівними інтервалами. Величина рівного інтервалувизначається за такою формулою :

де Хmax, Хmin - максимальне та мінімальне значенняознаки у сукупності; n – число груп.

Найпростіше угруповання, у якому кожна виділена група характеризується одним показником є ​​ряд розподілу.

Статистичний рядрозподілу - це упорядкований розподіл одиниць сукупності на групи за певною ознакою. Залежно від ознаки, покладеної основою освіти низки розподілу, розрізняють атрибутивні і варіаційні ряди розподілу.

Атрибутивними називають ряди розподілу, побудовані за якісним ознакамтобто ознаками, що не мають числового виразу(Розподіл за видами праці, за статтю, за професією і т.д.). Атрибутивні рядиРозподіли характеризують склад сукупності за тими чи іншими суттєвими ознаками. Взяті за кілька періодів ці дані дозволяють досліджувати зміну структури.

Варіаційними рядами називають ряди розподілу, побудовані за кількісним ознакою. Будь-який варіаційний ряд складається з двох елементів: варіантів та частот. Варіантами називаються окремі значенняознаки, які він приймає в варіаційному ряду, тобто конкретне значення ознаки, що варіює.

Частотами називаються чисельності окремих варіантів або кожної групи варіаційного ряду, тобто це числа, які показують, як часто зустрічаються ті чи інші варіанти у ряді розподілу. Сума всіх частот визначає чисельність усієї сукупності, її обсяг. Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 чи 100%.

Залежно від характеру варіації ознаки розрізняють три форми варіаційного ряду: ранжований ряд, дискретний ряд та інтервальний ряд.

Ранжований варіаційний ряд - це розподіл окремих одиниць сукупності у порядку зростання чи спадання досліджуваного ознаки. Ранжування дозволяє легко розділити кількісні дані по групах, відразу виявити найменше та найбільше значенняознаки, виділити значення, які найчастіше повторюються.

Дискретний варіаційний ряд характеризує розподіл одиниць сукупності за дискретною ознакою, що приймає лише цілі значення. Наприклад, тарифний розряд, кількість дітей у сім'ї, кількість працівників для підприємства та інших.

Якщо ознака має безперервну зміну, які в певних межах можуть набувати будь-яких значень («від - до»), то для цієї ознаки потрібно будувати інтервальний варіаційний ряд . Наприклад, розмір доходу, стаж роботи, вартість основних фондів підприємства та ін.

Приклади розв'язання задач на тему «Статистичне зведення та угруповання»

Завдання 1 . Є інформація про кількість книг, отриманих студентами за абонементом за минулий навчальний рік.

Побудувати ранжований та дискретний варіаційні ряди розподілу, позначивши елементи ряду.

Рішення

Ця сукупністьє безліч варіантів кількості одержуваних студентами книг. Підрахуємо кількість таких варіантів та упорядкуємо у вигляді варіаційного ранжованого та варіаційного дискретного рядів розподілу.

Завдання 2 . Є дані про вартість основних фондів у 50 підприємств, тис. руб.

Побудувати низку розподілу, виділивши 5 груп підприємств (з рівними інтервалами).

Рішення

Для рішення виберемо найбільше та найменше значеннявартість основних фондів підприємств. Це 30,0 та 10,2 тис. руб.

Знайдемо розмір інтервалу: h = (30,0-10,2): 5 = 3,96 тис. руб.

Тоді до першої групи входитимуть підприємства, розмір основних фондів яких становить від 10,2 тис. руб. до 10,2 +3,96 = 14,16 тис. руб. Таких підприємств буде 9. До другої групи увійдуть підприємства, розмір основних фондів яких складе від 14,16 тис. руб. до 14,16 +3,96 = 18,12 тис. руб. Таких підприємств буде 16. Аналогічно знайдемо числопідприємств, що входять до третьої, четвертої та п'ятої групи.

Отриманий ряд розподілу помістимо до таблиці.

Завдання 3 . По ряду підприємств легкої промисловості отримано такі дані:

Здійсніть угруповання підприємств за кількістю робітників, утворюючи 6 груп з рівними інтервалами. Підрахуйте по кожній групі:

1. кількість підприємств
2. число робітників
3. обсяг виробленої продукції протягом року
4. середнє фактичне вироблення одного робітника
5. обсяг основних засобів
6. середній розміросновних засобів одного підприємства
7. середню величину виробленої продукції одним підприємством

Результати розрахунку оформіть у таблиці. Зробіть висновки.

Рішення

Для вирішення виберемо найбільше та найменше значення середньооблікового числа робітників на підприємстві. Це 43 та 256.

Знайдемо розмір інтервалу: h = (256-43): 6 = 35,5

Тоді до першої групи входитимуть підприємства, середньооблікова кількість робітників на яких становить від 43 до 43 +35,5 = 78,5 чоловік. Таких підприємств буде 5. До другої групи увійдуть підприємства, середньооблікова кількість робітників на яких складе від 78,5 до 78,5 +35,5 = 114 осіб. Таких підприємств буде 12. Аналогічно знайдемо кількість підприємств, що входять до третьої, четвертої, п'ятої та шостої групи.

Отриманий ряд розподілу помістимо до таблиці та обчислимо необхідні показники по кожній групі:

Висновок : Як видно з таблиці, друга група підприємств є найчисленнішою До неї входять 12 підприємств. Найменшими є п'ята і шоста групи (по два підприємства). Це найбільші підприємства (за кількістю робітників).

Оскільки друга група найчисленніша, обсяг виробленої продукції за рік підприємствами цієї групи та обсяг основних засобів значно вищий за інші. Водночас середній фактичний вироблення одного робітника на підприємствах цієї групи найбільшого не є. Тут лідирують підприємства четвертої групи. На цю групу припадає досить великий обсяг основних засобів.

У висновку зазначимо, що середній розмір основних засобів та середня величина виробленої продукції одного підприємства прямо пропорційні розмірам підприємства (за кількістю робітників).