Біографії Характеристики Аналіз

Статистичні методи аналізу наукових даних. Статистичні методи – це що таке? Застосування статистичних методів

ФЕДЕРАЛЬНА АНЕНСТВА З ОСВІТИ

ДЕРЖАВНИЙ ОСВІТНИЙ УСТАНОВА

ВИЩОЇ ПРОФЕСІЙНОЇ ОСВІТИ

«ПІВДЕННИЙ ДЕРЖАВНИЙ УНІВЕРСИТЕТ»

ІНСТИТУТ ДОДАТКОВОЇ ОСВІТИ

ПРОФЕСІЙНА ПЕРЕПІДГОТОВКА З ПРОГРАМИ

«ДЕРЖАВНЕ І МУНІЦИПАЛЬНЕ УПРАВЛІННЯ»

РЕФЕРАТ

З дисципліни: «Статистика»

«Статистичні методи дослідження»

Виконала:

Ханти-Мансійськ

Вступ

1. Методи статистичного дослідження.

1.1. Метод статистичного спостереження

1.4. Варіаційні ряди

1.5. Вибірковий метод

1.6. Кореляційний та регресійний аналіз

1.7. Ряди динаміки

1.8. Статистичні індекси

Висновок

Список використаної літератури


Повна та достовірна статистична інформація є тією необхідною підставою, на якій базується процес управління економікою. Вся інформація, що має народногосподарську значущість, зрештою, обробляється та аналізується за допомогою статистики.

Саме статистичні дані дозволяють визначити обсяги валового внутрішнього продукту та національного доходу, виявити основні тенденції розвитку галузей економіки, оцінити рівень інфляції, проаналізувати стан фінансових та товарних ринків, дослідити рівень життя населення та інші соціально-економічні явища та процеси. Опанування статистичної методологією - одна з умов пізнання кон'юнктури ринку, вивчення тенденцій та прогнозування, прийняття оптимальних рішень на всіх рівнях діяльності.

Статистична наука - це галузь знань, що вивчає явища суспільного життя з їхньої кількісної сторони в нерозривному зв'язку з їх якісним змістом у конкретних умовах місця та часу. Статистична практика - це діяльність зі збирання, накопичення, обробки та аналізу цифрових даних, що характеризують всі явища в житті суспільства.

Говорячи про статистику, слід пам'ятати, що цифри в статистиці не абстрактні, а виражають глибокий економічний зміст. Кожен економіст повинен вміти користуватися статистичними цифрами, аналізувати їх, вміти використовуватиме обґрунтування своїх висновків.

Статистичні закони діють у межах часу та місця, в яких вони виявлені.

Навколишній світ складається із масових явищ. Якщо окремий факт залежить від законів випадку, маса явищ підпорядковується закономірностям. Для виявлення цих закономірностей використовується закон великих чисел.

Для отримання статистичної інформації органи державної та відомчої статистики, а також комерційні структури проводять різноманітні статистичні дослідження. Процес статистичного дослідження включає три основні стадії: збір даних, їх зведення та угруповання, аналіз та розрахунок узагальнюючих показників.

Від того, як зібраний первинний статистичний матеріал, як він оброблений і згрупований значною мірою залежать результати та якість усієї подальшої роботи, а зрештою при порушеннях можуть призвести до абсолютно хибних висновків.

Складною, трудомісткою та відповідальною є заключна, аналітична стадія дослідження. На цій стадії розраховуються середні показники та показники розподілу, аналізується структура сукупності, досліджується динаміка та взаємозв'язок між досліджуваними явищами та процесами.

На всіх стадіях дослідження статистика використовує різноманітні методи. Методи статистики – це особливі прими та способи вивчення масових суспільних явищ.

На першій стадії дослідження використовуються методи масового спостереження, збирається первинний статистичний матеріал. Основне умова - масовість, т.к. закономірності життя виявляється у досить великому масиві даних з дії закону великих чисел, тобто. у зведених статистичних характеристиках випадковості взаємопогашуються.

На другій стадії дослідження, коли зібрана інформація піддається статистичній обробці, використовується метод угруповань. Застосування методу угруповань вимагає неодмінної умови - якісної однорідності сукупності.

На третій стадії дослідження проводиться аналіз статистичної інформації за допомогою таких методів як метод узагальнюючих показників, табличний та графічний методи, методи оцінки варіації, балансовий метод, індексний метод.

Аналітична робота повинна містити елементи передбачення, вказувати на можливі наслідки ситуацій, що складаються.

Керівництво статистикою країни здійснює Державний комітет Російської Федерації зі статистики. Як федеральний орган виконавчої влади він здійснює загальне керівництво статистикою в країні, надає офіційну статистичну інформацію Президенту, Уряду, Федеральним Зборам, федеральним органам виконавчої влади, громадським та міжнародним організаціям, розробляє статистичну методологію, координує статистичну діяльність федеральних та регіональних організацій виконавчої влади, здійснює аналіз економіко-статистичної інформації, складає національні рахунки та робить балансові розрахунки.

Система органів статистики до утворена відповідно до адміністративно територіальним розподілом країни. У республіках, що входять до РФ, є Республіканські комітети. В автономних округах, краях, областях, у Москві та Санкт-Петербурзі діють Державні комітети зі статистики.

У районах (містах) – управління (відділи) державної статистики. Крім державної, існує ще відомча статистика (на підприємствах, відомствах, міністерствах). Вона забезпечує внутрішні потреби у статистичній інформації.

Мета цієї роботи – розглянути статистичні методи дослідження.

1. Методи статистичного дослідження

Між наукою-статистикою та практикою існує тісний взаємозв'язок: статистика використовує дані практики, узагальнює та розробляє методи проведення статистичних досліджень. У свою чергу, у практичній діяльності застосовуються теоретичні положення статистичної науки для вирішення конкретних управлінських завдань. Знання статистики необхідне сучасному фахівцю для прийняття рішень в умовах стохастики (коли аналізовані явища схильні до впливу випадковостей), для аналізу елементів ринкової економіки, у зборі інформації, у зв'язку зі збільшенням числа господарських одиниць та їх типів, аудиті, фінансовому менеджменті, прогнозуванні.

Для вивчення предмета статистики розроблено та застосовуються специфічні прийоми, сукупність яких утворює методологію статистики (методи масових спостережень, угруповань, узагальнюючих показників, динамічних рядів, індексний метод та ін.). Застосування у статистиці конкретних методів визначається поставленими завданнями залежить від характеру вихідної інформації. При цьому статистика спирається на такі діалектичні категорії, як кількість та якість, необхідність та випадковість, причинність, закономірність, одиничне та масове, індивідуальне та загальне. Статистичні методи використовують комплексно (системно). Це зумовлено складністю процесу економіко-статистичного дослідження, що складається із трьох основних стадій: перша – збір первинної статистичної інформації; друга - статистична зведення та обробка первинної інформації; третя – узагальнення та інтерпретація статистичної інформації.

Загальною методологією вивчення статистичних сукупностей є використання основних принципів, якими керуються в будь-якій науці. До цих принципів, як до свого роду початків відносяться такі:

1. об'єктивність досліджуваних явищ та процесів;

2. виявлення взаємозв'язку та системності в яких проявляється зміст досліджуваних факторів;

3. цілепокладання, тобто. досягнення поставленої мети з боку дослідника, вивчає відповідні статистичні дані.

Це виявляється у отриманні відомостей про тенденції, закономірності та можливі наслідки розвитку досліджуваних процесів. Знання закономірностей розвитку соціально-економічних процесів, які цікавлять суспільство, має важливе практичного значення.

До особливостей статистичного аналізу даних слід віднести метод масового спостереження, наукової обгрунтованості якісного змісту угруповань та його результатів, обчислення та аналіз узагальнених та узагальнюючих показників об'єктів, що вивчаються.

Щодо конкретних методів економічної, промислової чи статистики культури, населення, національного багатства тощо, то тут можуть бути свої специфічні методи збирання, угруповання та аналізу відповідних сукупностей (суми фактів).

В економічній статистиці, наприклад, широко застосовується балансовий метод як найпоширеніший метод взаємної ув'язки окремих показників у єдиній системі економічних зв'язків у суспільному виробництві. До методів, що застосовуються в економічній статистиці, також належать складання угруповань, обчислення відносних показників (відсоткове співвідношення), порівняння, обчислення різних видів середніх величин, індексів тощо.

Метод сполучних ланок у тому, що дві об'ємних, тобто. кількісні показники зіставляються на основі існуючого між ними відносини. Наприклад, продуктивність праці в натуральних показниках та відпрацьованого часу, або обсяг перевезень у тоннах та середньої дальності перевезень у км.

p align="justify"> При аналізі динаміки розвитку народного господарства основним методом виявлення цієї динаміки (руху) є індексний метод, методи аналізу часових рядів.

При статистичному аналізі основних економічних закономірностей розвитку народного господарства важливим методом статистики є обчислення тісноти зв'язків між показниками за допомогою кореляційного та дисперсійного аналізу та ін.

Крім названих методів широкого поширення набули математико-статистичні методи дослідження, які розширюються в міру руху масштабів застосування ЕОМ та створення автоматизованих систем.

Етапи статистичного дослідження:

1. Статистичне спостереження – масовий науково організований збір первинної інформації про окремі одиниці досліджуваного явища.

2. Угруповання та зведення матеріалу - узагальнення даних спостереження для отримання абсолютних величин (обліково-оцінних показників) явища.

3. Обробка статистичних даних та аналіз результатів для отримання обґрунтованих висновків про стан досліджуваного явища та закономірності його розвитку.

Усі етапи статистичного дослідження тісно пов'язані одне з одним і однаково важливі. Недоліки і помилки, що виникають кожної стадії, позначаються все дослідженні загалом. Тому правильне використання спеціальних методів статистичної науки кожному етапі дозволяє отримати достовірну інформацію результаті статистичного дослідження.

Методи статистичного дослідження:

1. Статистичне спостереження

2. Зведення та угруповання даних

3. Розрахунок узагальнюючих показників (абсолютні, відносні та середні величини)

4. Статистичні розподіли (варіаційні ряди)

5. Вибірковий метод

6. Кореляційно-регресійний аналіз

7. Ряди динаміки

Завдання статистики – обчислення статистичних показників та його аналіз, завдяки чому керуючі органи отримують всебічну характеристику керованого об'єкта, чи то вся національна економіка чи окремі її галузі, підприємства та його підрозділи. Керувати соціально-економічними системами не можна, не маючи оперативної, достовірної та повної статистичної інформації.


Статистичне спостереження- це планомірний, науково-організований та, як правило, систематичний збір даних про явища суспільного життя. Воно здійснюється шляхом реєстрації наперед намічених суттєвих ознак з метою отримання надалі узагальнюючих характеристик цих явищ.

Наприклад, при проведенні перепису населення про кожного мешканця країни записуються відомості про його поле, вік, сімейний стан, освіту та ін., а потім статистичні органи визначають на основі цих відомостей чисельність населення країни, його вікову структуру, розміщення по території країни, сімейний склад та інші показники.

До статистичного спостереження пред'являються такі вимоги: повнота охоплення сукупності, що вивчається, достовірність і точність даних, їх одноманітність і сумісність.

Форми, види та способи статистичного спостереження

Статистичне спостереження здійснюється у двох формах: звітність та спеціально організоване статистичне спостереження.

Звітністюназивають таку організаційну форму статистичного спостереження, коли він відомості надходять у статистичні органи від підприємств, установ і закупівельних організацій як обов'язкових звітів про їх діяльності.

Звітність може бути загальнодержавною та внутрішньовідомчою.

Загальнодержавна - надходить до вищих органів та до органів державної статистики. Вона необхідна з метою узагальнення, контролю, аналізу та прогнозування.

Внутрішньовідомча – використовується у Міністерствах та відомствах для оперативних потреб.

Звітність затверджується Держкомстатом РФ. Звітність складається на підставі первинного обліку. Особливість звітності в тому, що вона є обов'язковою, документально обґрунтованою та юридично підтвердженою підписом керівника.

Спеціально-організоване статистичне спостереження- Спостереження, що організується з якоюсь особою метою для отримання відомостей, яких немає у звітності, або для перевірки та уточнення даних звітності. Це перепис населення, худоби, устаткування, різноманітні одноразові обліки. Як, наприклад, бюджетні обстеження домашніх господарств, опитування громадської думки тощо.

Види статистичного спостереженняможна згрупувати за двома ознаками: характером реєстрації фактів і з охоплення одиниць сукупності.

За характером реєстраціїфактів статистичне спостереження може бути: поточнимабо систематичним і перервним .

Поточне спостереження - це безперервний облік, наприклад, виробництва, відпуск матеріалу зі складу тощо, тобто. реєстрація здійснюється у міру вчинення факту.

Перервне спостереження то, можливо періодичним, тобто. що повторюється через певні проміжки часу. Наприклад, перепис худоби на 1 січня або реєстрація цін на ринку на 22 число кожного місяця. Одноразове спостереження організується при необхідності, тобто. без дотримання періодичності або взагалі одного разу. Наприклад, вивчення громадської думки.

За охопленням одиниць сукупностіспостереження може бути суцільним та несуцільним.

При суцільномуспостереженні обстеженню піддаються всі одиниці сукупності. Наприклад, перепис населення.

При несуцільномуспостереженні обстежується частина одиниць сукупності. Несуцільне спостереження можна поділити на підвиди: вибіркове, монографічне, метод основного масиву.

Вибіркове спостереження- це спостереження, що ґрунтується на принципі випадкового відбору. При правильній його організації та проведенні вибіркове спостереження дає досить достовірні дані про сукупність, що вивчається. У деяких випадках можна замінити суцільний облік, т.к. результати вибіркового спостереження із цілком певною ймовірністю можна поширити протягом усього сукупність. Наприклад, контроль якості продукції, вивчення продуктивності худоби тощо. У разі ринкової економіки сфера застосування вибіркового спостереження розширюється.

Монографічне спостереження- це детальне, глибоке вивчення та опис характерних у якомусь відношенні одиниць сукупності. Воно проводиться з метою виявлення наявних та намічених тенденцій у розвитку явища (виявлення недоліків, вивчення передового досвіду, нових форм організації тощо)

Метод основного масивуполягає в тому, що обстеженню піддається найбільші одиниці, які разом узяті мають переважну питому вагу в сукупності здебільшого для даного дослідження ознакою (ознаками). Так щодо роботи ринків у містах обстеженню піддаються ринки у містах, де проживає 50% від населення, а оборот ринків становить 60% від загального обороту.

За джерелом відомостейрозрізняють безпосереднє спостереження, документальне та опитування.

Безпосереднімназивають таке спостереження, у якому самі реєстратори шляхом виміру, зважування чи підрахунку встановлюють факт і роблять запис їх у формулярі (бланці) спостереження.

Документальне- передбачає запис відповідей виходячи з відповідних документів.

Опитування- це спостереження, у якому відповіді питання записуються зі слів опитуваного. Наприклад, перепис населення.

У статистиці відомості про явище, що вивчається, можуть бути зібрані різними способами: звітним, експедиційним, самочисленням, анкетним, кореспондентським.

Сутність звітногоспособу полягає у наданні звітів у суворо обов'язковому порядку.

ЕкспедиційнийМетод полягає в тому, що спеціально залучені та навчені працівники записують відомості у формуляр спостереження (перепис населення).

При самочислення(самореєстрації) формуляри заповнюють самі опитувані. Цей спосіб застосовується, наприклад, щодо маятникової міграції (пересування населення від місця проживання до місця роботи і назад).

Анкетнийспосіб - це збір статистичних даних за допомогою спеціальних запитальників (анкет), що розсилаються певному колу осіб або публікуються в періодичній пресі. Цей спосіб застосовується дуже широко, особливо у різних соціологічних обстеженнях. Однак він має велику частку суб'єктивізму.

Сутність кореспондентськогоСпосіб полягає в тому, що статистичні органи домовляються з певними особами (добровільними кореспондентами), які беруть на себе зобов'язання вести спостереження за будь-якими явищами у встановлені терміни та повідомляти результати до статистичних органів. Так, наприклад, проводяться експертні оцінки щодо конкретних питань соціально-економічного розвитку країни.

1.2. Зведення та угруповання матеріалів статистичного спостереження

Сутність та завдання зведення та угруповання

Зведення- це операція з відпрацювання конкретних поодиноких фактів, що утворюють сукупність та зібрані в результаті спостереження. Через війну зведення безліч індивідуальних показників які стосуються кожної одиниці об'єкта спостереження, перетворюються на систему статистичних таблиць і результатів, проявляються типові риси і закономірності досліджуваного явища загалом.

По глибині та точності обробки розрізняють зведення просте і складне.

Просте зведення- це операція з підрахунку загальних результатів, тобто. за сукупністю одиниць спостереження.

Складне зведення- це комплекс операцій, які включають угруповання одиниць спостереження, підрахунок підсумків у кожній групі і з об'єкту загалом, оформлення результатів як статистичних таблиць.

Проведення зведення включає такі етапи:

Вибір групувального ознаки;

Визначення порядку формування групи;

Розробка системи показників для характеристики груп та об'єкта в цілому;

Розробка макетів таблиць для надання результатів зведення.

За формою обробки зведення буває:

Централізована (весь первинний матеріал надходить в одну вище організацію, наприклад, Держкомстат РФ, і там повністю обробляється);

Децентралізована (обробка зібраного матеріалу йде по висхідній лінії, тобто матеріал піддається зведенню та угрупованню на кожному ступені).

Насправді зазвичай поєднують обидві форми організації зведення. Так, наприклад, під час перепису попередні підсумки отримують у порядку децентралізованого зведення, а зведені остаточні - в результаті централізованої розробки бланків перепису.

За технікою виконання зведення буває механізованим і ручним.

Угрупуваннямназивається розчленування досліджуваної сукупності на однорідні групи за певними суттєвими ознаками.

На основі методу угруповань вирішуються центральні завдання дослідження, забезпечується правильне застосування інших методів статистичного та статистико-математичного аналізу.

Робота зі складання угруповань складна та важка. Прийоми угруповань різноманітні, що з різноманітністю групувальних ознак і різними завданнями дослідження. До основних завдань, які вирішуються за допомогою угруповань відносяться:

Виділення соціально-економічних типів;

Вивчення структури сукупності, структурних зрушень у ній;

Виявлення зв'язку між явищами та взаємозалежності.

Види угруповань

Залежно від завдань, які вирішуються за допомогою угруповань, виділяють 3 типи угруповань: типологічні, структурні та аналітичні.

Типологічне угрупованнявирішує завдання виявлення соціально-економічних типів. При побудові угруповання цього виду основна увага має бути приділена ідентифікації типів та вибору групувальної ознаки. Виходять у своїй із сутності досліджуваного явища. (Таблиця 2.3).

Структурне угрупованнявирішує завдання вивчення складу окремих типових груп за якоюсь ознакою. Наприклад, розподіл постійного населення за віковими групами.

Аналітичне угрупованнядозволяє виявити взаємозв'язку між явищами та його ознаками, тобто. виявити вплив одних ознак (факторних) на інші (результативні). Взаємозв'язок у тому, що з зростанням факторного ознаки зростає чи зменшується значення результативного ознаки. В основі аналітичного угруповання завжди лежить факторнийознака, а кожна група характеризується середнімивеличинами результативної ознаки.

Наприклад, залежність обсягу роздрібного товарообігу від величини торгової площі магазину. Тут факторна (угруповальна) ознака - торгова площа, а результативна - середній на 1 магазин обсяг товарообігу.

За складністю угруповання буває простим і складним (комбінованим).

У простийугрупованні на підставі одна ознака, а в складною- два і більше у поєднанні (у комбінації). У цьому випадку спочатку групи утворюються за однією (основною) ознакою, а потім кожна з них поділяється на підгрупи за іншою ознакою і т.д.

1.3. Абсолютні та відносні статистичні величини

Абсолютні статистичні величини

Вихідною, первинною формою висловлювання статистичних показників є абсолютні величини. Абсолютні величинихарактеризують розмір явищ у заходах маси, площі, обсягу, протяжності, часу тощо.

Індивідуальні абсолютні показники виходять, як правило, безпосередньо у процесі спостереження внаслідок виміру, зважування, підрахунку, оцінки. У деяких випадках абсолютні індивідуальні показники є різницею.

Зведені, підсумкові об'ємні абсолютні показники одержують у результаті зведення та угруповання.

Абсолютні статистичні показники є числами іменованими, тобто. мають одиниці виміру. Існує 3 типи одиниць виміру абсолютних величин: натуральні, трудові та вартісні.

Натуральні одиницівиміри - виражають величину явища у фізичних заходах, тобто. заходи ваги, обсягу, протяжності, часу, рахунки, тобто. у кілограмах, кубічних метрах, кілометрах, годинниках, штуках і т.д.

Різновидом натуральних одиниць є умовно-натуральні одиниці виміру, які використовуються для відома декількох різновидів однієї і тієї ж споживчої вартості. Одну їх приймають за зразок, інші перераховуються з допомогою спеціальних коефіцієнтів в одиниці заходи цього зразка. Так, наприклад, мило з різним вмістом жирних кислот перераховують на 40% вміст жирних кислот.

В окремих випадках для характеристики будь-якого явища однієї одиниці виміру недостатньо, і використовується добуток двох одиниць виміру.

Прикладом може бути вантажообіг у тонно-кілометрах, виробництво електроенергії в кіловат-годинах та інших.

В умовах ринкової економіки найбільше значення мають вартісні (грошові) одиниці виміру(Рубль, долар, марка і т.д.). Вони дозволяють отримати грошову оцінку будь-яких соціально-економічних явищ (обсяг продукції, товарообігу, національного прибутку тощо). Однак, слід пам'ятати, що в умовах високих темпів інфляції показники у грошовій оцінці стають непорівнянними. Це слід враховувати під час аналізу вартісних показників у поступовій динаміці. Для досягнення сумісності показники необхідно перераховувати у порівнянні ціни.

Трудові одиниці виміру(людина-годинник, людино-дні) використовуються визначення витрат праці з виробництва продукції, виконання якоїсь роботи тощо.

Відносні статистичні величини, їх сутність та форми вираження

Відносними величинамиу статистиці називаються величини, що виражають кількісне співвідношення між явищами життя. Вони виходять у результаті розподілу однієї величини в іншу.

Величина з якою виробляється порівняння (знаменник) називається основою, базою порівняння; а та, яка порівнюється (числитель) - називається порівнюваною, звітною або поточною величиною.

Відносна величина показує, у скільки разів порівнювана величина більша або менша за базисну, або яку частку перша становить від другої; а окремих випадках - скільки одиниць однієї величини посідає одиницю (чи 100, на 1000 тощо.) інший (базисної) величини.

В результаті зіставлення однойменних абсолютних величин виходять абстрактні неіменовані відносні величини, що показують у скільки разів дана величина більша або менша за базисну. І тут базисна величина приймається за одиницю (у результаті виходить коефіцієнт).

Крім коефіцієнта широко поширеною формою вираження відносних величин є відсотки(%). І тут базисна величина приймається за 100 одиниць.

Відносні величини можуть виражатися в проміле (‰), в продецимілі (0/000). У цих випадках база порівняння приймається відповідно за 1000 та за 10000. В окремих випадках база порівняння може бути прийнята і за 100000.

Відносні величини може бути числами іменованими. Її найменування є поєднання найменувань порівнюваного і базисного показників. Наприклад, густота населення чол/кв. км (скільки людей посідає 1 квадратний кілометр).

Види відносних величин

Види відносних величин поділяються залежно від їхнього змісту. Це відносні величини: планового завдання, виконання плану, динаміки, структури, координації, інтенсивності та рівня економічного розвитку, порівняння.

Відносна величина планового завданняє відношенням величини показника, що встановлюється на запланований період до величини його, досягнутої до запланованого періоду.

Відносною величиною виконання плануназивається величина, що виражає співвідношення між фактичним та плановим рівнем показника.

Відносна величина динамікиє відношення рівня показника за даний період до рівня цього ж показника в минулому.

Три вищеперелічені відносні величини пов'язані між собою, а саме: відносна величина динаміки дорівнює добутку відносних величин планового завдання та виконання плану.

Відносна величина структуриє відношення розмірів частини до цілого. Вона характеризує структуру, склад тієї чи іншої сукупності.

Ці ж величини у відсотках називають питомою вагою.

Відносною величиною координаціїназивають співвідношення частин цілого між собою. В результаті отримують, у скільки разів ця частина більша за базисну. Або скільки відсотків від неї становить або скільки одиниць даної структурної частини припадає на 1 одиницю (100 або 1000 і т.д. одиниць) базової структурної частини.

Відносна величина інтенсивностіхарактеризує розвиток досліджуваного явища чи процесу у іншому середовищі. Це відношення двох взаємозалежних явищ, але різних. Воно може бути виражене і у відсотках, і в промілі, і продецеміллі, і іменованій. Різновидом відносної величини інтенсивності є показник рівня економічного розвитку, Що характеризує виробництво продукції душу населення.

Відносна величина порівнянняє співвідношення однойменних абсолютних показників з різних об'єктів (підприємствам, районам, областям, країнам і т.д.). Він може бути виражений як у коефіцієнтах, і у відсотках.

Середні величини їх сутність та види

Статистика, як відомо, вивчає масові соціально-економічні явища. Кожне з цих явищ може мати різне кількісне вираження однієї й тієї ж ознаки. Наприклад, заробітна плата однієї і тієї ж професії робітників або ціни на ринку на той самий товар і т.д.

Для вивчення будь-якої сукупності за ознаками, що варіюють (кількісно змінюються) статистика використовує середні величини.

Середня величина- це узагальнююча кількісна характеристика сукупності однотипних явищ по одномуваріюючої ознакою.

Найважливіша властивість середньої величини полягає в тому, що вона представляє значення певної ознаки у всій сукупності одним числом, незважаючи на кількісні відмінності його в окремих одиниць сукупності, і виражає загальне, що притаманне всім одиницям сукупності, що вивчається. Отже, через характеристику одиниці сукупності вона характеризує всю сукупність загалом.

Середні величини пов'язані із законом великих чисел. Суть зв'язку у тому, що з усреднении випадкові відхилення індивідуальних величин з дії закону великих чисел взаємопогашуються й у середньої виявляється основна тенденція розвитку, необхідність, закономірність проте, при цьому середню необхідно обчислювати з урахуванням узагальнення маси фактів.

Середні величини дозволяють порівнювати показники, які стосуються сукупностей з різною чисельністю одиниць.

Найважливішою умовою наукового використання середніх величин у статистичному аналізі суспільних явищ є однорідністьсукупності, на яку обчислюється середня. Однакова за формою та технікою обчислення середня в одних умовах (для неоднорідної сукупності) фіктивна, а в інших (для однорідної сукупності) відповідає дійсності. Якісна однорідність сукупності визначається з урахуванням всебічного теоретичного аналізу сутності явища. Так, наприклад, при обчисленні середньої врожайності потрібно, щоб вихідні дані належали до однієї і тієї ж культури (середня врожайність пшениці) або групи культур (середня врожайність зернових). Не можна обчислювати середню для різноманітних культур.

Математичні прийоми, які у різних розділах статистики, безпосередньо пов'язані з обчисленням середніх величин.

Середні у суспільних явищах мають відносну сталість, тобто. протягом певного проміжку часу однотипні явища характеризуються приблизно однаковими середніми.

Середині величини дуже тісно пов'язані з методом угруповань, т.к. для характеристики явищ необхідно обчислювати не тільки загальні (для всього явища) середні, а й групові (для типових груп цього явища за ознакою, що вивчається).

Види середніх величин

Від того, в якому вигляді представлені вихідні дані для розрахунку середньої величини, за якою формулою вона буде визначатися. Розглянемо найчастіше застосовувані у статистиці види середніх величин:

Середню арифметичну;

Середню гармонійну;

Середню геометричну;

Середню квадратичну.

1.4. Варіаційні ряди

Сутність та причини варіації

Інформація про середні рівні досліджуваних показників зазвичай буває недостатньою для глибокого аналізу досліджуваного процесу чи явища.

Необхідно враховувати і розкид або варіацію значень окремих одиниць, яка є важливою характеристикою сукупності, що вивчається. Кожне індивідуальне значення ознаки складається під спільним впливом багатьох чинників. Соціально-економічні явища, як правило, мають велику варіацію. Причини цієї варіації містяться у сутності явища.

Показники варіації визначають, як групуються значення ознаки навколо середньої величини. Вони застосовуються для характеристики упорядкованих статистичних сукупностей: угруповань, класифікацій, рядів розподілу. Найбільшою мірою варіації піддаються курси акцій, обсяги попиту та пропозиції, відсоткові ставки у різні періоди та у різних місцях.

Абсолютні та відносні показники варіації

За змістом визначення варіація вимірюється ступенем коливання варіантів ознаки рівня їх середньої величини, тобто. як різницю х-х. На використанні відхилень від середньої побудовано більшість показників, що застосовуються в статистиці для вимірювання варіацій значень ознаки в сукупності.

Найпростішим абсолютним показником варіації є розмах варіації R = xmax-xmin. Розмах варіації виявляється у тих самих одиницях виміру, як і Х. Він залежить лише від двох крайніх значень ознаки і, тому, недостатньо характеризує коливання ознаки.

Абсолютні показники варіації залежать від одиниць вимірювання ознаки та ускладнюють порівняння двох або кількох різних варіаційних рядів.

Відносні показники варіаціїобчислюються як відношення різних абсолютних показників варіації до середньої арифметичної. Найбільш поширеним з них є коефіцієнт варіації.

Коефіцієнт варіації характеризує коливання ознаки всередині середньої. Найкращі значення його до 10%, непогані до 50%, погані понад 50%. Якщо коефіцієнт варіації не перевищує 33%, то сукупність за ознакою, що розглядається, можна вважати однорідною.

1.5. Вибірковий метод

Сутність вибіркового методу полягає в тому, щоб за властивостями частини (вибірки) судити про чисельні характеристики цілого (генеральної сукупності), за окремими групами варіантів їхньої загальної сукупності, яка іноді мислиться як сукупність необмежено великого обсягу. Основу вибіркового методу становить той внутрішній зв'язок, що існує у популяціях між одиничним та загальним, частиною та цілим.

Вибірковий метод має очевидні переваги перед суцільним вивченням генеральної сукупності, оскільки скорочує обсяг роботи (за рахунок зменшення числа спостережень) дозволяє економити сили та засоби, отримувати інформацію про такі сукупності, повне обстеження яких практично неможливе або недоцільне.

Досвід показав, що правильно зроблена вибірка досить добре представляє або репрезентує (від лат. represento-представляю) структуру і стан генеральної сукупності. Проте повного збігу вибіркових даних із даними обробки генеральної сукупності, зазвичай, немає. У цьому полягає недолік вибіркового методу, і натомість якого видно переваги суцільного описи генеральної сукупності.

Через неповне відображення вибіркою статистичних характеристик (параметрів) генеральної сукупності перед дослідником виникає важливе завдання: по-перше, враховувати і дотримуватися тих умов, за яких вибірка найкраще репрезентує генеральну сукупність, а по-друге, у кожному конкретному випадку встановлювати, з якою впевненістю можна перенести результати вибіркового спостереження всю генеральну сукупність, з якої вибірка взята.

Репрезентативність вибірки залежить від цілого ряду умов і насамперед від того, як вона здійснюється, або планомірно (тобто за наперед наміченою схемою), або шляхом непланомірного відбору варіант з генеральної сукупності. У будь-якому випадку вибірка має бути типовою та цілком об'єктивною. Ці вимоги повинні виконуватися як найбільш суттєві умови репрезентативності вибірки. Перш ніж обробляти вибірковий матеріал, його потрібно ретельно перевірити та звільнити вибірку від усього зайвого, що порушує умови репрезентативності. У той самий час при освіті вибірки не можна надходити по сваволі, включати у склад лише ті варіанти, які здаються типовими, проте інші бракувати. Доброякісна вибірка має бути об'єктивною, т. е. проводитися без упереджених спонукань, крім суб'єктивних впливів її склад. Виконанню цієї умови репрезентативності відповідає принцип рендомізації (від англ. Rendom-випадок), або випадкового відбору варіант з генеральної сукупності.

Цей принцип покладено основою теорії вибіркового методу і має дотримуватися завжди утворення репрезентативної вибіркової сукупності, крім випадків планомірного чи навмисного відбору.

Існують різні способи відбору. Залежно від способу відбору розрізняють вибірки таких типів:

Випадкова вибірка із поверненням;

Випадкова вибірка без повернення;

Механічна;

Типова;

Серійне.

Розглянемо утворення випадкових вибірок із поверненням та без повернення. Якщо вибірка проводиться з маси виробів (наприклад, з ящика), то після ретельного перемішування слід брати об'єкти випадково, тобто так, щоб всі вони мали однакову ймовірність потрапити у вибірку. Часто для утворення випадкової вибірки елементи генеральної сукупності попередньо нумеруються, а кожен номер записується на окремій картці. У результаті виходить пачка карток, кількість яких збігається з обсягом генеральної сукупності. Після ретельного перемішування із цієї пачки беруть по одній картці. Об'єкт, що має однаковий номер з карткою, вважається таким, що потрапив у вибірку. При цьому можливі два принципово різні способи утворення вибіркової сукупності.

Перший спосіб - витягнута картка після фіксації її номера повертається до пачки, після чого картки знову ретельно перемішуються. Повторюючи такі вибірки по одній картці, можна створити вибіркову сукупність будь-якого обсягу. Вибіркова сукупність, утворена за такою схемою, отримала назву випадкової вибірки із поверненням.

Другий спосіб – кожна витягнута картка після її запису назад не повертається. Повторюючи за такою схемою вибірки однією карткою, можна отримати вибіркову сукупність будь-якого заданого обсягу. Вибіркову сукупність, утворену за цією схемою, називають випадковою вибіркою без повернення. Випадкова вибірка без повернення утворюється в тому випадку, якщо з ретельно перемішаної пачки одразу беруть необхідну кількість карток.

Однак при великому обсязі генеральної сукупності описаний вище спосіб утворення випадкової вибірки з поверненням та без повернення виявляється дуже трудомістким. І тут користуються таблицями випадкових чисел, у яких числа перебувають у випадковому порядку. Частка того, щоб відібрати, наприклад, 50 об'єктів із пронумерованої генеральної сукупності, відкривають будь-яку сторінку таблиці випадкових чисел і виписують поспіль 50 випадкових чисел; у вибірку потрапляють об'єкти, номери яких збігаються з виписаними випадковими числами, якщо випадкове число таблиці виявиться більше обсягу генеральної сукупності, таке число пропускають.

Зауважимо, що різницю між випадковими вибірками із поверненням і без повернення стирається, якщо вони становлять незначну частину великої генеральної сукупності.

При механічному способі утворення вибіркової сукупності елементи генеральної сукупності, що підлягають обстеженню, відбираються через певний інтервал. Приміром, якщо вибірка має становити 50% генеральної сукупності, то відбирається кожен другий елемент генеральної сукупності. Якщо вибірка десяти процентна, то відбирається кожен її десятий елемент тощо.

Слід зазначити, що іноді механічний відбір може забезпечити репрезентативної вибірки. Наприклад, якщо відбирається кожен дванадцятий валик, що обточується, причому відразу ж після відбору проводять заміну різця, то відібраними виявляться всі валики, обточені затупленими різцями. У разі необхідно усунути збіг ритму відбору з ритмом заміни різця, навіщо слід відбирати хоча б кожен десятий валик з дванадцяти обточених.

При великій кількості однорідної продукції, що випускається, коли в її виготовленні беруть участь різні верстати, і навіть цехи, для утворення репрезентативної вибірки користуються типовим способом відбору. У цьому випадку, генеральну сукупність попередньо розбивають на групи, що не перетинаються. Потім із кожної групи, за схемою випадкової вибірки з поверненням або без повернення відбирають певну кількість елементів. Вони й утворюють вибіркову сукупність, яка називається типовою.

Нехай, наприклад, вибірковим шляхом досліджується продукція цеху, в якому є 10 верстатів, які виробляють одну продукцію. Користуючись схемою випадкової вибірки з поверненням або без повернення, відбирають вироби спочатку з продукції, зробленої на першому, потім на другому і т. д. верстатах. Такий спосіб відбору дозволяє створити типову вибірку.

Іноді на практиці буває доцільно користуватися серійним способом відбору, ідея якого полягає в тому, що генеральну сукупність розбивають на деяку кількість серій, що не перетинаються, і за схемою випадкової вибірки з поверненням або без повернення контролюють всі елементи лише відібраних серій. Наприклад, якщо вироби виготовляються великою групою верстатів-автоматів, суцільному обстеженню піддають продукцію лише кількох верстатів. Серійним відбором користуються у разі, якщо обстежуваний ознака коливається у різних серіях незначно.

Про те, який спосіб відбору слід віддати перевагу в тій чи іншій ситуації, слід судити, виходячи з вимог поставленого завдання та умов виробництва. Зауважимо, що на практиці при складанні вибірки часто використовують одночасно кілька способів відбору в комплексі.

1.6. Кореляційний та регресійний аналіз

Регресійний та кореляційний аналізи - це ефективні методи, які дозволяють аналізувати значні обсяги інформації з метою дослідження можливого взаємозв'язку двох або більше змінних.

Завдання кореляційного аналізузводяться до вимірювання тісноти відомого зв'язку між ознаками, що варіюють, визначенню невідомих причинних зв'язків (причинний характер яких повинен бути з'ясований за допомогою теоретичного аналізу) та оцінки факторів, що надають найбільший вплив на результативну ознаку.

Завданнями регресійного аналізує вибір типу моделі (форми зв'язку), встановлення ступеня впливу незалежних змінних на залежну та визначення розрахункових значень залежної змінної (функції регресії).

Вирішення всіх названих завдань призводить до необхідності комплексного використання цих методів.

1.7. Ряди динаміки

Поняття про ряди динаміки та види рядів динаміки

Поруч динамікиназивається ряд послідовно розташованих у часі статистичних показників, які у своїй зміні відображають хід розвитку явища, що вивчається.

Ряд динаміки складається з двох елементів: моменту чи періоду часу, яким відносяться дані та статистичних показників (рівнів). Обидва елементи разом утворюють члени ряду. Рівні ряду зазвичай позначають через "y", а період часу – через "t".

За тривалістю часу, до яких належать рівні низки, ряди динаміки поділяються на моментні та інтервальні.

У моментних рядахкожен рівень характеризує явища на момент часу. Наприклад: кількість вкладів населення установах ощадного банку РФ, наприкінці року.

У інтервальних рядахдинаміки кожен рівень ряду характеризує явище за період часу. Наприклад: виробництво годинників у РФ за роками.

У інтервальних рядах динаміки рівні ряду можна підсумовувати і отримати загальну величину за ряд наступних один за одним періодів. У моментних рядах ця сума не має сенсу.

Залежно від способу вираження рівнів ряду розрізняють ряди динаміки абсолютних величин, відносних і середніх величин.

Ряди динаміки можуть бути з рівним та нерівним інтервалами. Поняття інтервалу в моментних та інтервальних рядах різні. Інтервал моментного ряду - це період від однієї дати до іншої дати, на які наведені дані. Якщо це дані про кількість вкладів на кінець року, то інтервал дорівнює від кінця одного року до кінця іншого року. Інтервал інтервального ряду - це період часу, за який узагальнені дані. Якщо це виробництво годин за роками, то інтервал дорівнює одному році.

Інтервал ряду може бути рівним і нерівним як моментних, так і в інтервальних рядах динаміки.

За допомогою рядів динаміки визначають швидкість і інтенсивність розвитку явищ, виявляють основну тенденцію їх розвитку, виділяють сезонні коливання, порівнюють розвиток у часі окремих показників різних країн, виявляють зв'язки між явищами, що розвиваються в часі.

1.8. Статистичні індекси

Поняття про індекси

Слово "index" латинське і означає "показник", "покажчик". У статистиці під індексом розуміється узагальнюючий кількісний показник, що виражає співвідношення двох сукупностей, що складаються з елементів, які безпосередньо не піддаються підсумовуванню. Наприклад, обсяг продукції підприємства у натуральному вираженні підсумовувати не можна (крім однорідної), а для узагальнюючої характеристики обсягу це необхідно. Не можна підсумовувати ціни окремі види продукції і т.д. Для узагальнюючої характеристики таких сукупностей у поступовій динаміці, просторі й проти планом застосовуються індекси. Крім зведеної характеристики явищ індекси дозволяють оцінити роль окремих чинників у зміні складного явища. Індекси використовуються і для виявлення структурних зрушень у народному господарстві.

Індекси розраховуються як складного явища (загальні чи зведені), так окремих його елементів (індивідуальні індекси).

У індексах, що характеризують зміну явища у часі розрізняють базовий та звітний (поточний) періоди. Базовийперіод - це період часу якого належить величина, прийнята за основу порівняння. Позначається він підрядковим знаком "0". Звітнийперіод - це період часу, до якого відноситься величина, що піддається порівнянню. Позначається він підрядковим знаком "1".

Індивідуальнііндекси – це звичайна відносна величина.

Зведений індекс- характеризує зміна всієї складної сукупності загалом, тобто. що складається з елементів, що не підсумовуються. Отже, щоб розрахувати такий індекс, треба подолати несумарність елементів сукупності.

Це досягається запровадженням додаткового показника (співмірника). Зведений індекс складається з двох елементів: індексованої величини та ваги.

Індексована величина- Це показник, для якого розраховується індекс. Вага (співмірник) - це додатковий показник, що вводиться для цілей порівняння індексованої величини. У зведеному індексі в чисельнику та знаменнику завжди складна сукупність, виражена сумою творів індексованої величини та ваги.

Залежно від об'єкта дослідження як загальні, і індивідуальні індекси поділяються на індекси об'ємних (кількісних) показників(фізичного обсягу продукції, посівної площі, чисельності робітників та ін.) та індекси якісних показників(ціни, собівартості, врожайності, продуктивності праці, заробітної плати та ін.).

Залежно від бази порівняння індивідуальні та загальні індекси можуть бути ланцюговимиі базисними .

Залежно від методології розрахунку загальні індекси мають дві форми: агрегатнуі форму середньогоіндексу.

Правильно проведений збір, аналіз даних та статистичні розрахунки дозволяють забезпечити зацікавлені структури та громадськість інформацією про розвиток економіки, про напрям її розвитку, показати ефективність використання ресурсів, врахувати зайнятість населення та його працездатність, визначити темпи зростання цін та вплив торгівлі на сам ринок чи окремо взяту сферу.

Список використаної літератури

1. Глінський В.В., Іонін В.Г. Статистичний аналіз. Навчальний посібник.- М.: Філін, 1998-264 с.

2. Єлісєєва І.І., Юзбашев М.М. Загальна теорія статистики. Підручник.-

М.: Фінанси та статистика, 1995 р.-368 с.

3. Єфімова М.Р., Петрова Є.В., Рум'янцев В.М. Загальна теорія статистики. Підручник.-М.: ІНФРА-М, 1996-416 с.

4. Костіна Л.В. Методика побудови статистичних графіків. Методичний посібник. - Казань, ТИСБИ, 2000-49 с.

5. Курс соціально-економічної статистики: Підручник / за ред. проф. М.Г. Назарова.-М.: Фінстатінформ, ЮНІТІ-ДІАНА, 2000 р.-771 с.

6. Загальна теорія статистики: статистична методологія до вивчення комерційної діяльності: Підручник/під ред. А.А. Спіріна, О.Е.Башеної-М.: Фінанси та статистика, 1994-296 с.

7. Статистика: курс лекцій/Харченко Л.П., Долженкова В.Г., Іонін В.Г. та ін.- Новосибірськ,: НДАЕіУ, М.: ІНФРА-М, 1997 р.-310 с.

8. Статистичний словник/гл.ред. М.А. Корольов.-М.: Фінанси та статистика, 1989 р.-623 с.

9. Теорія статистики: Підручник / за ред. проф. Шмойлової Р.А.- М.: Фінанси та статистика, 1996-464 с.

Спостереження як початковий етап дослідження пов'язане зі збором вихідних даних про питання, що вивчається. Воно властиво багатьом наукам. Однак кожна наука має свою специфіку, відрізняючись за своїми спостереженнями. Тому не всяке спостереження – статистичне.

Статистичне дослідження— це науково організований за єдиною програмою збір, зведення та аналіз даних (фактів) про соціально-економічні, демографічні та інші явища та процеси суспільного життя в державі з реєстрацією їх найбільш суттєвих ознак в обліковій документації.

Відмінними рисами (специфікою) статистичного дослідження є: цілеспрямованість, організованість, масовість, системність (комплексність), сумісність, документованість, контрольованість, практичність.

Загалом статистичне дослідження має:

  • Мати суспільно-корисну мету та загальну (державну) значимість;
  • Відноситися до конкретних умов його місця та часу;
  • виражати статистичний вид обліку (а чи не бухгалтерський і оперативний);
  • Проводиться за заздалегідь розробленою програмою з її науково обґрунтованим методологічним та іншим забезпеченням;
  • Здійснювати збір масових даних (фактів), у яких відбивається вся сукупність причинно-наслідкових та інших факторів, що різнобічно характеризують явище;
  • Реєструватися як облікових документів встановленого зразка;
  • Гарантувати відсутність помилок спостереження або зводити їх до можливого мінімуму;
  • Передбачати певні критерії якості та способи контролю зібраних даних, забезпечуючи їх достовірність, повноту та змістовність;
  • орієнтуватися на економічно ефективну технологію збору та обробки даних;
  • Бути надійною інформаційною базою для всіх наступних етапів статистичного дослідження та всіх користувачів статистичної інформації.

Дослідження, які задовольняють цим вимогам, статистичними є. Не є статистичними дослідження, наприклад, спостереження та дослідження: матері за дитиною, що грає (особисте питання); глядачів за театральною постановкою (немає облікової документації щодо видовища); наукового працівника за фізико-хімічними дослідами з їх вимірами, розрахунками та документальною реєстрацією (не масово-суспільні дані); лікаря за хворими із веденням медичних карток (оперативний облік); бухгалтера за рухом коштів на банківському рахунку підприємства (бухгалтерський облік); журналістів за громадською та особистою життєдіяльністю державних осіб чи інших знаменитостей (не предмет статистики).

Безліч одиниць, які мають масовістю, типовістю, якісною однорідністю та наявністю варіації.

Статистична сукупність складається з матеріально існуючих об'єктів (працівники, підприємства, країни, регіони), є об'єктом статистичного дослідження.

Див. також:

Статистичне спостереження є першою стадією статистичного дослідження, що є науково організованим збором даних про досліджувані явища і процеси суспільного життя.

Етапи статистичних операцій

Будь-яке статистичне дослідження складається із шести етапів.

Етап 1. Статистичне дослідження починається з формування первинної статистичної інформаційної бази за вибраним комплексом показників.
  • Проведення.
  • Використання офіційних державних та корпоративних (фірмових) джерел.
  • Використання наукових статистичних досліджень у журналах, газетах, монографіях тощо.
  • Використання електронних засобів інформації (Internet, CD, дискет, та ін.).
Етап 2. Первинне узагальнення та угруповання статистичних даних.
  • , Кумуляти (), графіки розподілу частот (частин).
  • Формування та його первинний аналіз. Графічний прогноз (з концепцією "оптиміст", "песиміст", "реаліст").
  • Розрахунок моментів К-го порядку (середніх, дисперсій, мір скошеності, виміру ексцесу) з метою визначення показників центру розширення, показників скошеності (асиметрії), показників ексцесу (гостровершинності).
  • Формування та первинні розрахунки складних статистичних показників (відносних, зведених багаторівневих).
  • Формування та первинні розрахунки індексних показників.
Етап 3. Наступний етап статистичного дослідження включає економічну інтерпретацію первинного узагальнення.
  • та фінансова оцінка об'єкта аналізу.
  • Формування тривоги (задоволення) економічних та фінансових ситуацій.
  • Попередження про наближення до порогових статистичних значень у прикладних, як правило, макроекономічних задачах.
  • Диверсифікація первинного статистичного узагальнення отриманих прикладних результатів щодо ієрархії влади, партнерства, бізнесу.
Етап 4. Комп'ютерний аналіз первинних та узагальнених розширених (об'ємних) статистичних даних.
  • Аналіз варіації розширених статистичних даних.
  • Аналіз динаміки розширених статистичних даних.
  • Аналіз зв'язків розширених статистичних даних.
  • Багатомірні зведення та угруповання.
Етап 5. Комп'ютерне прогнозування за вибраними найважливішими напрямами.
  • Метод найменших квадратів (МНК).
  • Ковзаючі середні.
  • Технічний аналіз.
  • Подання зведеного аналізу та варіантів прогнозу з рекомендаціями про внесення корективів в управління та інвестиції.
Етап 6. Узагальнений аналіз отриманих результатів та перевірка їх на достовірність за статистичними критеріями. Етап 7. Завершальним етапом статистичного дослідження є прийняття.

Виділяють п'ять основних видів статистичного аналізу, що використовуються під час проведення маркетингових досліджень: дескриптивний аналіз, вивідний аналіз, аналіз відмінностей, аналіз зв'язків та передбачуваний аналіз. Іноді ці види аналізу використовуються окремо, іноді – спільно.

В основі дескриптивного аналізу лежить використання таких статистичних заходів, як середня величина (середня), мода, середнє відхилення, розмах або амплітуда варіації.

p align="justify"> Аналіз, в основі якого лежить використання статистичних процедур (наприклад, перевірка гіпотез) з метою узагальнення отриманих результатів на всю сукупність, називається вивідним аналізом.

Аналіз відмінностей використовується для порівняння результатів дослідження двох груп (двох ринкових сегментів) для визначення ступеня реальної відмінності в їх поведінці, реакції на ту саму рекламу і т.п.

Аналіз зв'язків спрямовано визначення систематичних зв'язків (їх спрямованості та сили) змінних. Наприклад, визначення, як збільшення витрат за рекламу впливає збільшення збуту.

Передбачуваний аналіз використовується з метою прогнозування розвитку подій у майбутньому, наприклад, шляхом аналізу часових рядів. Статистичні методи прогнозування розглянуто у розділі 7.

Інструменти дескриптивного аналізу

Для опису інформації, отриманої з урахуванням вибіркових вимірів, широко використовується дві групи заходів. Перша включає заходи «центральної тенденції», чи заходи, які описують типового респондента чи типову відповідь. Друга включає заходи варіації, або заходи, що описують ступінь схожості чи несхожості респондентів чи відповідей із «типовими» респондентами чи відповідями.

Існують інші описові заходи, наприклад заходи асиметрії (наскільки знайдені криві розподілу відрізняються від нормальних кривих розподілу). Однак вони використовуються не так часто, як вищезгадані, і не становлять особливого інтересу для замовника.

Нижче надається лише коротка характеристика зазначених заходів. Більш детальну інформацію можна отримати з книг з математичної статистики, наприклад .

До заходів центральної тенденції ставляться мода, медіана і середня.

Мода характеризує величину ознаки, що з'являється найчастіше проти іншими величинами даного ознаки. Мода має відносний характер, і необов'язково, щоб більшість респондентів вказала саме цю величину ознаки.

Медіана характеризує значення ознаки, що займає серединне місце у впорядкованому ряду значень цієї ознаки.

Третім заходом центральної тенденції є середня величина, яка найчастіше розраховується як середня арифметична величина. За її обчисленні загальний обсяг ознаки порівну розподіляється між усіма одиницями сукупності.

Видно, що ступінь інформативності середньої величини більший, ніж медіани, а медіани – моди.

Проте розглянуті заходи не характеризують варіацію відповіді якесь питання чи, кажучи іншими словами, несхожість, відмінність респондентів чи виміряних характеристик. Вочевидь, крім знання величин заходів центральної тенденції важливо встановити, наскільки близько до цих величин розташовані інші отримані оцінки. Зазвичай використовують три заходи варіації: розподіл частот, розмах варіації та середнє відхилення.

Розподіл частотпредставляє у табличній чи графічній формі число випадків появи кожного значення виміряної характеристики (ознака) у кожному обраному діапазоні її значень. Розподіл частот дозволяє швидко зробити висновки про рівень подробиці результатів вимірювань.

Розмах варіаціївизначає абсолютну різницю між максимальним і мінімальним значеннями виміряної ознаки. Іншими словами, це різниця між кінцевими точками в розподілі впорядкованих величин виміряної ознаки. Цей захід визначає інтервал розподілу значень ознаки.

Середнє квадратичне відхиленняє узагальнюючою статистичною характеристикою варіації значень ознаки. Якщо ця міра мала, то крива розподілу має вузьку, стислу форму (результати вимірювань мають високий ступінь схожості); якщо міра велика, то крива розподілу має широкий, розтягнутий вигляд (великий рівень відмінності оцінок).

Раніше було зазначено, що вибір шкали вимірювань, а отже, типу питань у опитувальному аркуші визначають кількість отриманої інформації. Подібним чином, кількість інформації, яка отримується при використанні розглянутих вище заходів, є різною. Загальним правилом є те, що статистичні заходи дають можливість отримати більшу інформацію при застосуванні найбільш інформативних шкал вимірювань. Вибір шкали вимірювань визначає вибір статистичних заходів. Наприклад, одне з питань демографічного дослідження, під час проведення якого використовувалася шкала найменувань, стосувалося національності. Російським було присвоєно код 1, українцям – 2, татарам – 3 тощо. У разі, звісно, ​​можна обчислити середнє значення. Але як інтерпретувати середню національність, що дорівнює, скажімо, 5,67? Для обчислення середніх треба використовувати інтервальну шкалу чи шкалу відносин. Однак у нашому прикладі можна використати моду.

Що стосується заходів варіації, то при використанні номінальної шкали застосовується розподіл частот, при використанні шкали порядків - кумулятивний розподіл частот, а при використанні шкали і інтервальної шкали відносин - середнє квадратичне відхилення.

Статистичний висновок

Висновок є видом логічного аналізу, спрямованого на отримання загальних висновків про всю сукупність на основі спостережень за малою групою одиниць цієї сукупності.

Висновки робляться на основі аналізу малої кількості фактів. Наприклад, якщо два ваших товариша, які мають одну і ту ж марку автомобіля, скаржаться на його якість, то ви можете зробити висновок про низьку якість даної марки автомобіля в цілому.

Статистичний висновок заснований на статистичному аналізі результатів вибіркових досліджень і спрямований на оцінку параметрів сукупності в цілому. У разі результати вибіркових досліджень є лише відправною точкою отримання загальних висновків.

Наприклад, автомобілебудівна компанія провела два незалежні дослідження з метою визначення ступеня задоволеності споживачів своїми автомобілями. Перша вибірка включала 100 споживачів, які купили цю модель протягом останніх шести місяців. Друга вибірка включала 1000 споживачів. У ході телефонного інтерв'ювання респонденти відповідали на запитання: «Ви задоволені чи не задоволені купленою вами моделлю автомобіля?». Перше опитування виявило 30% незадоволених, друге – 35%.

Оскільки існують помилки вибірки і в першому і другому випадках, то можна зробити наступний висновок. Для першого випадку: близько 30% опитаних висловили незадоволеність придбаною моделлю автомобіля. Для другого випадку близько 35% опитаних висловили незадоволеність придбаною моделлю автомобіля. Який загальний висновок можна зробити в даному випадку? Як позбутися терміна «біля»? Для цього введемо показник помилки: 30% ± х% та 35% ± у% і порівняємо х та у. Використовуючи логічний аналіз, можна дійти невтішного висновку, що велика вибірка містить меншу помилку і що її основі можна зробити більш правильні висновки про думку всієї сукупності споживачів. Видно, що вирішальним чинником отримання правильних висновків є розмір вибірки. Даний показник є у всіх формулах, що визначають зміст різних методів статистичного висновку.

При проведенні маркетингових досліджень найчастіше використовуються такі методи статистичного висновку: оцінка параметрів та перевірка гіпотез.

Оцінка параметрівГенеральної сукупності є процес визначення, виходячи з даних про вибірку, інтервалу, в якому знаходиться один з параметрів генеральної сукупності, наприклад середнє значення. Для цього використовують такі статистичні показники: середні величини, середню квадратичну помилку та бажаний рівень довірливості (зазвичай 95% або 99%).

Нижче піде розмова про їхню роль при проведенні оцінки параметрів.

Середня квадратична помилка є, як зазначалося вище, мірою варіації вибіркового розподілу при теоретичному припущенні, що досліджувалося безліч незалежних вибірок однієї й тієї генеральної сукупності.

Вона визначається за такою формулою:

Де s x - середня квадратична помилка вибіркової середньої;

s – середнє квадратичне відхилення від середньої величини у вибірці;

n – обсяг вибірки.

Якщо використовуються процентні заходи, що виражають альтернативну мінливість якісних ознак, то

де s - середня квадратична помилка вибіркової середньої під час використання відсоткових заходів;

р - відсоток респондентів у вибірці, які підтримали першу альтернативу;

q = (100 - q) - відсоток респондентів у вибірці, які підтримали

другу альтернативу;

n – обсяг вибірки.

Видно, що середня помилка вибірки тим більша, чим більша варіація, і тим менше, чим більший обсяг вибірки.

Оскільки завжди існує вибіркова помилка, необхідно оцінити розкид значень досліджуваного параметра генеральної сукупності. Припустимо, дослідник вибрав рівень довірливості, що дорівнює 99%. З властивостей нормальної кривої розподілу випливає, що відповідає параметр Z = ± 2,58. Середня для генеральної сукупності загалом обчислюється за формулою

Якщо використовуються процентні заходи, то

Це означає, що якщо ви хочете, щоб при 99%-му рівні довірливості діапазон оцінок включав справжню для генеральної сукупності оцінку, необхідно помножити середню квадратичну помилку на 2,58 і додати отриманий результат до відсоткового значення р (верхня гранична оцінка). Якщо ж зробити віднімання цього твору, то знайдемо нижню граничну оцінку.

Як ці формули пов'язані зі статистичним висновком?

Оскільки проводиться оцінка параметра генеральної сукупності, то тут вказується діапазон, який потрапляє справжнє значення параметра генеральної сукупності. З цією метою для вибірки беруться статистичний захід центральної тенденції, величина дисперсії та обсяг вибірки. Далі робиться припущення про рівень довірливості та розраховується діапазон розкиду параметра для генеральної сукупності.

Наприклад, для членів вибірки (100 читачів якоїсь газети) було встановлено, що середній час читання газети становить 45 хвилин за середньої квадратичної помилки 20 хвилин. При рівні довірчості, що дорівнює 95%-ному, отримаємо

При 99%-му рівні довірливості отримаємо

Видно, що довірчий інтервал ширший для 99% порівняно з 95% рівнем довірчості.

Якщо використовуються відсотки і виявилося, що з вибірки у 100 осіб 50% опитаних зранку п'є каву, то за рівня довірливості у 99% отримаємо наступний діапазон оцінок:

Таким чином, логіка статистичного висновку спрямована на отримання кінцевих висновків про досліджуваний параметр генеральної сукупності на основі вибіркового дослідження, здійсненого за законами математичної статистики. Якщо використовується простий висновок, не заснований на статистичних вимірах, то кінцеві висновки носять суб'єктивний характер і на основі одних і тих самих фактів різні фахівці можуть зробити різні висновки.

З використанням статистичного висновку використовуються формули, які мають об'єктивний характер, основу яких лежать загальновизнані статистичні концепції. В результаті кінцеві висновки мають набагато об'єктивніший характер.

У ряді випадків робляться міркування щодо якогось параметра генеральної сукупності (величині середньої, дисперсії, характеру розподілу, формі та тісноті зв'язку між змінними) виходячи лише з деяких припущень, роздумів, інтуїції, неповних знань. Такі судження називаються гіпотезами.

Статистичної гіпотезою називається припущення про властивість генеральної сукупності, яку можна перевірити, спираючись на дані вибірки.

Під перевіркою гіпотезирозуміється статистична процедура, застосовувана на підтвердження чи відхилення гіпотези, заснованої на результатах вибіркових досліджень. Перевірка гіпотези складає основі виявлення узгодженості емпіричних даних з гіпотетичними. Якщо розбіжність між порівнюваними величинами не виходить межі випадкових помилок, гіпотезу приймають. При цьому не робиться жодних висновків про правильність самої гіпотези, йдеться лише про узгодженість порівнюваних даних.

Перевірка гіпотези проводиться у п'ять етапів:

1. Робиться припущення щодо якоїсь характеристики генеральної сукупності, наприклад про середню величину певного параметра.

2. Формується випадкова вибірка, проводиться вибіркове дослідження та визначаються статистичні показники вибірки.

3. Порівнюються гіпотетичне та статистичне значення досліджуваної характеристики.

4. Визначається, чи відповідають результати вибіркового дослідження прийнятій гіпотезі.

5. Якщо результати вибіркового дослідження не підтверджують гіпотезу, остання переглядається – вона має відповідати даним вибіркового дослідження.

Внаслідок варіації результатів вибіркових досліджень неможливо зробити абсолютно точний висновок про достовірність гіпотези, проводячи просте арифметичне порівняння величин характеристик. Тому статистична перевірка гіпотези включає використання: вибіркового значення характеристики, середнього квадратичного відхилення, бажаного рівня довірливості та гіпотетитичного значення характеристики для генеральної сукупності загалом.

Для перевірки гіпотез про середні величини застосовується така формула:

Наприклад, готуючи рекламу навчальної програми з підготовки торгових агентів у коледжі, керівник програми вважав, що випускники програми отримують у середньому 1750 доларів на місяць. Таким чином, гіпотетична середня для генеральної сукупності дорівнює 1750 доларів. Для перевірки цієї гіпотези було проведено телефонне обстеження торгових агентів різних фірм.

Вибірка склала 100 осіб, середня для вибірки дорівнювала 1800 доларів і середнє відхилення становило 350 доларів. Виникає питання, чи є велика різниця (50 доларів) між гіпотетичною зарплатою та її середнім значенням для вибірки. Проводимо розрахунки за формулою (4.2):

Видно, що середня квадратична помилка середньої величини дорівнювала 35 доларам, а приватне від розподілу 50 на 45 становить 1,43 (нормоване відхилення), що менше ±1,96 - величини, що характеризує рівень довірливості 95%. У разі висунуту гіпотезу можна визнати достовірною.

При використанні процентної міри випробування гіпотези здійснюється в такий спосіб. Припустимо, що, виходячи з власного досвіду, один із автолюбителів висунув гіпотезу, згідно з якою лише 10% автолюбителів використовують ремені безпеки. Проте національні вибіркові дослідження 1000 автолюбителів показали, що 80% із них використовують ремені безпеки. Розрахунки у разі проводяться так:

де р - Відсоток з вибіркових досліджень;

π H -відсоток із гіпотези;

s p - Середня квадратична помилка при розрахунках у відсотках.

Видно, початкова гіпотеза відрізнялася від знайдених 80% на величину 55,3, помножену на середньоквадратичну помилку, тобто. не може бути визнана достовірною.

У ряді випадків доцільно використати спрямовані гіпотези. Спрямовані гіпотези визначає напрями можливих значень якогось параметра генеральної сукупності. Наприклад, заробітна плата становить понад 1750 доларів. У цьому випадку використовується лише одна сторона кривої розподілу, що знаходить відображення у застосуванні знаків «+» та «-» у розрахункових формулах.

Більш детальну інформацію з цієї проблеми можна отримати з .

Тут, щоправда, постає питання. Якщо можна провести вибіркові дослідження, навіщо висувати гіпотези? Обробка результатів вибіркових досліджень дає змогу отримати середні величини та його статистичні характеристики, не висуваючи жодних гіпотез. Тому перевірка гіпотез скоріше застосовується у випадках, коли неможливо чи надзвичайно трудомістко проводити повномасштабні дослідження та коли потрібно порівнювати результати кількох досліджень (для різних груп респондентів чи проведених у різний час). Такі завдання, зазвичай, виникають у соціальній статистиці. Трудомісткість статистико-соціологічних досліджень призводить до того, що майже всі вони будуються на непоганому обліку. Тому проблема доказовості висновків у соціальній статистиці стоїть особливо гостро.

Застосовуючи процедуру перевірки гіпотез, слід пам'ятати, що вона може гарантувати результати з певною ймовірністю лише за «упередженими» вибірками, на основі об'єктивних даних.

Аналіз відмінностей

Перевірка суттєвості відмінностей полягає в зіставленні відповідей на те саме питання, отриманих для двох або більше незалежних груп респондентів. Крім того, у ряді випадків цікавить порівняння відповідей на два або більше незалежних питань для однієї і тієї ж вибірки.

Прикладом першого випадку може бути вивчення питання: що воліють пити вранці жителі певного регіону: каву чи чай. Спочатку було опитано на основі формування випадкової вибірки 100 респондентів, 60% яких віддають перевагу каві; через рік дослідження було повторено, і лише 40% із 300 опитаних осіб висловилося за каву. Як можна порівняти результати цих двох досліджень? Прямим арифметичним шляхом порівнювати 40% і 60% не можна через різні помилки вибірок. Хоча у разі великих відмінностей у цифрах, скажімо, 20 та 80%, легше зробити висновок про зміну смаків на користь кави. Однак якщо є впевненість, що ця велика різниця обумовлена ​​насамперед тим, що в першому випадку використовувалася дуже мала вибірка, такий висновок може виявитися сумнівним. Таким чином, при проведенні такого порівняння до розрахунку необхідно прийняти два критичні фактори: ступінь суттєвості відмінностей між величинами параметра для двох вибірок та середні квадратичні помилки двох вибірок, що визначаються їх обсягами.

Для перевірки, чи є суттєвою різниця виміряних середніх, використовується нульова гіпотеза. Нульова гіпотеза припускає, що дві сукупності, порівнювані за однією або декількома ознаками, не відрізняються один від одного. У цьому передбачається, що дійсне відмінність порівнюваних величин дорівнює нулю, а виявлене за даними відмінність від нуля має випадковий характер , .

Для перевірки суттєвості різниці між двома виміряними середніми (відсотками) спочатку проводиться їх порівняння, а потім отримана різниця перетворюється на значення середньоквадратичних помилок, і визначається, наскільки далеко вони відхиляються від гіпотетичного нульового значення.

Як тільки визначено середньоквадратичні помилки, стає відомою площа під нормальною кривою розподілу і з'являється можливість зробити висновок про можливість виконання нульової гіпотези.

Розглянемо наступний приклад. Спробуємо відповісти на запитання: «Чи є різниця у споживанні прохолодних напоїв між дівчатами та юнаками?». Під час опитування було поставлено питання щодо кількості банок прохолодних напоїв, що споживаються протягом тижня. Описова статистика показала, що в середньому юнаки споживають 9, а дівчата 7,5 банок прохолодних напоїв. Середні квадратичні відхилення, відповідно, склали 2 та 1,2. Обсяг вибірок у обох випадках становив 100 осіб. Перевірка статистично значимої різниці в оцінках здійснювалася так:

де x 1 і x 2 – середні для двох вибірок;

s 1 та s 2 - середні квадратичні відхилення для двох вибірок;

n 1 і n 2 - обсяг відповідно першої та другої вибірки.

Чисельник цієї формули характеризує різницю середніх. Крім того, необхідно врахувати відмінність форми двох кривих розподілу. Це здійснюється у знаменнику формули. Вибірковий розподіл тепер сприймається як вибірковий розподіл різниці між середніми (відсотковими заходами). Якщо нульова гіпотеза справедлива, то розподіл різниці є нормальною кривою із середньою, що дорівнює нулю, та середньою квадратичною помилкою, що дорівнює 1.

Видно, що величина 6,43 істотно перевищує значення ±1,96 (95% рівень довірливості) і ±2,58 (99% рівень довірливості). Це означає, що нульова гіпотеза не є істинною.

На рис. 4.6 наводяться криві розподіли для цих двох порівнюваних вибірок та середня квадратична помилка кривої різниці. Середня квадратична помилка середньої кривої різниці дорівнює 0. Внаслідок великого значення середньоквадратичних помилок ймовірність справедливості нульової гіпотези про відсутність різниці між двома середніми менше 0,001.

Основи статистичного аналізу даних

статистика»біостатистикою».

1. номінальну;
2. ординальну;
3. інтервальну;

вибірки

репрезентативної

вибіркової рамки простою випадковою вибіркою інтервальна вибірка

стратифікованої вибірки

кластернаі квотна вибірки

нульової гіпотези

альтернативної гіпотези потужності

довірчої ймовірності».


Назва: Основи статистичного аналізу даних
Детальний опис:

Після завершення будь-якого наукового дослідження, фундаментального чи експериментального проводиться статистичний аналіз отриманих даних. Щоб статистичний аналіз успішно проведено і дозволив вирішити поставлені завдання, дослідження має бути грамотно сплановано. Отже, без розуміння основ статистики неможливе планування та опрацювання результатів наукового експерименту. Тим не менш, медична освіта не дає не тільки знання статистики, а й навіть основ вищої математики. Тому дуже часто можна зіткнутися з думкою, що питаннями статобробки у біомедичних дослідженнях має займатися лише фахівець зі статистики, а лікарю-досліднику слід зосередитись на медичних питаннях своєї наукової роботи. Подібний поділ праці, що передбачає допомогу в аналізі даних, цілком виправданий. Однак розуміння принципів статистики необхідне хоча б для того, щоб уникнути некоректної постановки завдання перед фахівцем, спілкування з яким до початку дослідження є настільки ж важливим, як і на етапі обробки даних.

Перш ніж говорити про основи статистичного аналізу, слід з'ясувати зміст терміна « статистика». Існує безліч визначень, але найбільш повним і лаконічним є, на наш погляд, визначення статистики як «науки про збирання, подання та аналіз даних». У свою чергу використання статистики в додатку до живого світу називають «біометрією» або « біостатистикою».

Слід зазначити, що часто статистику зводять лише до обробки експериментальних даних, не звертаючи уваги на етап їх отримання. Проте статистичні знання необхідні вже під час планування експерименту, щоб отримані під час нього показники могли дати досліднику достовірну інформацію. Тому можна сказати, що статистичний аналіз результатів експерименту починається ще до початку дослідження.

Вже на етапі розробки плану дослідник має чітко уявляти, якого типу змінні будуть у його роботі. Усі змінні можна поділити на два класи: якісні та кількісні. Те, який діапазон може приймати змінна залежить від шкали вимірювань. Можна виділити чотири основні шкали:

1. номінальну;
2. ординальну;
3. інтервальну;
4. раціональну (шкалу відносин).

У номінальній шкалі (шкалі «назв») є лише умовні позначення для опису деяких класів об'єктів, наприклад, «підлога» або «професія пацієнта». Номінальна шкала передбачає, що змінна прийматиме значення, кількісні взаємини між якими визначити неможливо. Так, неможливо встановити математичні відносини між чоловічою та жіночою статтю. Умовні числові позначення (жінки – 0, чоловіки – 1, або навпаки) даються абсолютно довільно і призначені лише для комп'ютерної обробки. Номінальна шкала є якісною у чистому вигляді, окремі категорії у цій шкалі виражають частотами (кількість чи частка спостережень, відсотки).

Ординальна (порядкова) шкала передбачає, що окремі категорії в ній можуть вишиковуватися за зростанням або зменшенням. У медичній статистиці класичним прикладом порядкової шкали є градація ступенів тяжкості захворювання. В даному випадку ми можемо вибудувати тяжкість за зростанням, але все ще не маємо можливості задати кількісні взаємини, тобто дистанція між значеннями, виміряними в ординальній шкалі, невідома чи не має значення. Встановити порядок дотримання значень змінної «ступінь тяжкості» легко, але при цьому неможливо визначити, скільки разів тяжкий стан відрізняється від стану середньої тяжкості.

Ординальна шкала відноситься до напівкількісних типів даних, і її градації можна описувати як частотами (як у якісній шкалі), так і заходами центральних значень, на чому ми зупинимося нижче.

Інтервальна та раціональна шкали відносяться до суто кількісних типів даних. В інтервальній шкалі ми можемо визначити, наскільки одне значення змінної відрізняється від іншого. Так, підвищення температури тіла на 1 градус Цельсія завжди означає збільшення теплоти, що виділяється на фіксовану кількість одиниць. Однак в інтервальній шкалі є і позитивні та негативні величини (немає абсолютного нуля). У зв'язку з цим неможливо сказати, що 20 градусів Цельсія - це вдвічі тепліше, ніж 10. Ми можемо лише констатувати, що 20 градусів настільки ж тепліше, ніж 10, як 30 - тепліше 20.

Раціональна шкала (шкала відносин) має одну точку відліку і лише позитивні значення. У медицині більшість раціональних шкал – це концентрації. Наприклад, рівень глюкози 10 ммоль/л - це удвічі більша концентрація проти 5 ммоль/л. Для температури оптимальною шкалою є шкала Кельвіна, де є абсолютний нуль (відсутність тепла).

Слід додати, що будь-яка кількісна змінна може бути безперервною, як у разі вимірювання температури тіла (це безперервна інтервальна шкала), або дискретною, якщо ми вважаємо кількість клітин крові або потомство лабораторних тварин (це дискретна раціональна шкала).

Зазначені відмінності мають вирішальне значення для вибору методів статистичного аналізу результатів експерименту. Так, для номінальних даних застосуємо критерій «хі-квадрат», а відомий тест Стьюдента вимагає, щоб змінна (інтервальна чи раціональна) була безперервною.

Після того, як буде вирішено питання про тип змінної, слід зайнятися формуванням вибірки. Вибірка – це невелика група об'єктів певного класу (у медицині – населення). Для отримання абсолютно точних даних потрібно досліджувати всі об'єкти даного класу, однак, з практичних (часто - фінансових) міркувань вивчають лише частину популяції, яка називається вибіркою. Надалі статистичний аналіз дозволяє досліднику поширити отримані закономірності на всю популяцію з певним ступенем точності. Фактично, вся біомедична статистика спрямована на отримання найточніших результатів із найменш можливої ​​кількості спостережень, адже при дослідженнях на людях важливий і етичний момент. Ми не можемо дозволити собі ризикувати більше пацієнтів, ніж це необхідно.

Створення вибірки регламентується рядом обов'язкових вимог, порушення яких може призвести до помилкових висновків із результатів дослідження. По-перше, важливий обсяг вибірки. Від обсягу вибірки залежить точність оцінки параметрів, що досліджуються. Тут слід звернути увагу на слово "точність". Чим більші розміри досліджуваних груп, тим точніші (але не обов'язково правильні) результати отримує вчений. Для того щоб результати вибіркових досліджень можна було переносити на всю популяцію в цілому, вибірка повинна бути репрезентативної. Репрезентативність вибірки передбачає, що у ній відбито всі істотні властивості популяції. Іншими словами, в досліджуваних групах особи різної статі, віку, професій, соціального статусу та ін зустрічаються з тією ж частотою, що і у всій популяції.

Проте перед початком вибору досліджуваної групи, слід визначитися з необхідністю вивчення конкретної популяції. Прикладом популяції можуть бути всі пацієнти з певною нозологією або люди працездатного віку тощо. Так, результати, отримані для популяції молодих людей призовного віку, навряд чи вдасться екстраполювати жінок у постменопаузі. Набір характеристик, які матиме група, що вивчається, визначає «узагальненість» даних дослідження.

Формувати вибірки можна різними шляхами. Найпростіший з них - вибір за допомогою генератора випадкових чисел необхідної кількості об'єктів із популяції або вибіркової рамки(Sampling frame). Такий спосіб називається « простою випадковою вибіркою». Якщо випадковим чином вибрати початкову точку у вибірковій рамці, а потім взяти кожен другий, п'ятий або десятий об'єкти (залежно від того яких розмірів групи потрібні дослідження), то вийде інтервальна вибірка. Інтервальна вибірка не є випадковою, оскільки ніколи не виключається можливість періодичних повторень даних у рамках вибіркової рамки.

Можливий варіант створення так званої « стратифікованої вибірки», яка припускає, що населення складається з декількох різних груп і цю структуру слід відтворити в експериментальній групі. Наприклад, якщо у популяції співвідношення чоловіків і жінок 30:70, тоді в стратифікованій вибірці їх співвідношення має бути таким самим. При даному підході критично важливо не балансувати вибірку надмірно, тобто уникнути однорідності її характеристик, інакше дослідник може прогаяти шанс знайти відмінності або зв'язки в даних.

Крім описаних способів формування груп є ще кластернаі квотна вибірки. Перша використовується у разі, коли отримання повної інформації про вибіркову рамку утруднено через її розміри. Тоді вибірка формується з кількох груп, що входять у популяцію. Друга - квотна - аналогічна стратифікованій вибірці, але тут розподіл об'єктів відповідає такому популяції.

Повертаючись до обсягу вибірки, слід сказати, що він тісно пов'язаний із ймовірністю статистичних помилок першого та другого роду. Статистичні помилки може бути зумовлені тим, що у дослідженні вивчається вся популяція, та її частина. Помилка першого роду – це помилкове відхилення нульової гіпотези. У свою чергу, нульова гіпотеза - це припущення про те, що всі групи, що вивчаються, взяті з однієї генеральної сукупності, а значить, відмінності або зв'язки між ними випадкові. Якщо провести аналогію з діагностичними тестами, то помилка першого роду є хибнопозитивним результатом.

Помилка другого роду – це неправильне відхилення альтернативної гіпотези, зміст якої у тому, що розбіжності чи зв'язок між групами зумовлені не випадковим збігом, а впливом досліджуваних чинників. І знову аналогія з діагностикою: помилка другого роду - це хибнонегативний результат. З цією помилкою пов'язане поняття потужності, Що говорить про те, наскільки певний статистичний метод ефективний у даних умовах, про його чутливість. Потужність обчислюється за формулою: 1-β, де - це ймовірність помилки другого роду. Цей показник залежить переважно від обсягу вибірки. Чим більші розміри груп, тим менша ймовірність помилки другого роду і вища потужність статистичних критеріїв. Залежність ця як мінімум квадратична, тобто зменшення обсягу вибірка вдвічі призведе до падіння потужності щонайменше в чотири рази. Мінімально допустимою потужністю вважають 80%, а максимально допустимий рівень помилки першого роду приймають 5%. Однак завжди слід пам'ятати, що ці межі задані довільно і можуть змінюватись в залежності від характеру та цілей дослідження. Як правило, науковою спільнотою визнається довільна зміна потужності, однак у переважній більшості випадків рівень помилки першого роду не може перевищувати 5%.

Все вищесказане має безпосереднє відношення до етапу планування дослідження. Тим не менш, багато дослідників помилково ставляться до статистичної обробки даних лише як до деяких маніпуляцій, які виконуються після завершення основної частини роботи. Часто після закінчення не спланованого експерименту, виникає непереборне бажання замовити аналіз статистичних даних на стороні. Але з «купи сміття» навіть фахівцю зі статистики буде дуже складно вивчити очікуваний дослідником результат. Тому при недостатніх знаннях біостатистики необхідно звертатися за допомогою у статистичному аналізі ще до початку експерименту.

Звертаючись до самої процедури аналізу, слід зазначити два основних типи статистичних технік: описові і доказові (аналітичні). Описові техніки включають методи дозволяють представити дані в компактному і легкому для сприйняття вигляді. Сюди можна віднести таблиці, графіки, частоти (абсолютні та відносні), заходи центральної тенденції (середні, медіана, мода) та міри розкидання даних (дисперсія, стандартне відхилення, міжквартильний інтервал тощо). Інакше кажучи, описові методи дають характеристику досліджуваним вибіркам.

Найбільш популярний (хоч і часто помилковий) спосіб опису наявних кількісних даних полягає у визначенні наступних показників:

  • кількість спостережень у вибірці чи її обсяг;
  • середня величина (середнє арифметичне);
  • стандартне відхилення-показник того, наскільки широко змінюються значення змінних.

Важливо пам'ятати, що середнє арифметичне та стандартне відхилення – це заходи центральної тенденції та розкиду у досить невеликій кількості вибірок. У таких вибірках значення у більшості об'єктів з рівною ймовірністю відхилено від середнього, а їх розподіл утворює симетричний «дзвін» (гауссіану або криву Гаусса-Лапласа). Такий розподіл ще називають «нормальним», але на практиці медичного експерименту він зустрічається лише у 30% випадків. Якщо значення змінної розподілені несиметрично щодо центру, то групи краще описувати з допомогою медіани і квантилей (процентилей, квартилей, децилей).

Завершивши опис груп, потрібно відповісти питанням про їх взаємовідносинах і можливості узагальнити результати дослідження протягом усього населення. І тому використовуються доказові методи биостатистики. Саме про них насамперед згадують дослідники, коли йдеться про статистичну обробку даних. Зазвичай цей етап роботи називають "тестуванням статистичних гіпотез".

Завдання тестування гіпотез можна розділити на великі групи. Перша група відповідає на питання, чи є відмінності між групами за рівнем деякого показника, наприклад, відмінності в рівні печінкових трансаміназ у пацієнтів із гепатитом та здорових людей. Друга група дозволяє довести наявність зв'язку між двома або більше показниками, наприклад, функції печінки та імунної системи.

У практичному плані завдання з першої групи можна поділити на два підтипи:

  • порівняння показника лише у двох групах (здорові та хворі, чоловіки та жінки);
  • порівняння трьох та більше груп (вивчення різних доз препарату).

Необхідно враховувати, що статистичні методи суттєво відрізняються для якісних та кількісних даних.

У ситуації, коли змінна, що вивчається, - якісна і порівнюються тільки дві групи, можна використовувати критерій «хі-квадрат». Це досить потужний і широко відомий критерій, проте він виявляється недостатньо ефективним у разі, якщо кількість спостережень мала. Для вирішення цієї проблеми існують кілька методів, такі як виправлення Йейтса на безперервність і точний метод Фішера.

Якщо змінна, що вивчається, є кількісною, то можна використовувати один з двох видів статистичних критеріїв. Критерії першого виду засновані на конкретному типі розподілу генеральної сукупності та оперують параметрами цієї сукупності. Такі критерії називають «параметричними», і вони, як правило, базуються на припущенні щодо нормальності розподілу значень. Непараметричні критерії не базуються на припущенні про тип розподілу генеральної сукупності та не використовують її параметри. Іноді такі критерії називають "вільними від розподілу" (distribution-free tests). Певною мірою це помилково, оскільки будь-який непараметричний критерій передбачає, що розподіли у всіх порівнюваних групах будуть однаковими, інакше можуть бути отримані хибнопозитивні результати.

Існує два параметричні критерії, що застосовуються до даних, вилучених із нормально розподіленої сукупності: t-тест Стьюдента для порівняння двох груп і F-тест Фішера, що дозволяє перевірити рівність дисперсій (він же - дисперсійний аналіз). Непараметричних критеріїв значно більше. Різні критерії відрізняються один від одного за припущеннями, на яких вони засновані, за складністю обчислень, за статистичною потужністю і т.д. Вілкоксону для незалежних вибірок. Ці тести зручні тим, що вимагають припущення про характері розподілу даних. Але якщо виявиться, що вибірки взяті з нормально розподіленої генеральної сукупності, їх статистична потужність несуттєво відрізнятиметься від такої для тесту Стьюдента.

Повний опис статистичних методів можна знайти у спеціальній літературі, однак, ключовим моментом є те, що кожен статистичний тест вимагає набору правил (допущень) та умов для свого використання, та механічний перебір кількох методів для пошуку «потрібного» результату абсолютно неприйнятний з наукового погляду. . В цьому сенсі статистичні тести близькі до лікарських препаратів - у кожного є показання та протипоказання, побічні ефекти та ймовірність неефективності. І так само небезпечним є безконтрольне застосування статистичних тестів, адже на них базуються гіпотези та висновки.

Для більш повного розуміння питання точності статистичного аналізу необхідно визначити та розібрати поняття « довірчої ймовірності».Довірча ймовірність - це величина, прийнята як межа між ймовірними та малоймовірними подіями. Традиційно вона позначається буквою «p». Для багатьох дослідників єдиною метою виконання статистичного аналізу є розрахунок заповітного значення p, яке ніби проставляє коми у відомій фразі «стратити не можна помилувати». Максимально допустимою довірчою ймовірністю вважається величина 0,05. Слід пам'ятати, що довірча ймовірність – це не ймовірність певної події, а питання довіри. Виставляючи перед початком аналізу довірчу ймовірність, ми цим визначаємо ступінь довіри до результатів наших досліджень. А, як відомо, надмірна довірливість та зайва підозрілість однаково негативно позначаються на результатах будь-якої роботи.

Рівень довірчої ймовірності показує, яку максимальну ймовірність виникнення помилки першого дослідник вважає допустимою. Зменшення рівня довірчої ймовірності, інакше кажучи, посилення умов тестування гіпотез збільшує ймовірність помилок другого роду. Отже, вибір рівня довірчої ймовірності має здійснюватися з урахуванням можливої ​​шкоди виникнення помилок першого і другого роду. Наприклад, прийняті в біомедичній статистиці жорсткі рамки, що визначають частку хибно-позитивних результатів не більше 5% - це сувора необхідність, адже на підставі результатів медичних досліджень впроваджується або відхиляється нове лікування, а це питання життя багатьох тисяч людей.

Необхідно мати на увазі, що сама собою величина p малоінформативна для лікаря, оскільки говорить тільки про ймовірність помилкового відхилення нульової гіпотези. Цей показник нічого не говорить, наприклад, про розмір терапевтичного ефекту при застосуванні препарату, що вивчається, в генеральній сукупності. Тому є думка, що замість рівня довірчої ймовірності краще оцінювати результати дослідження за величиною довірчого інтервалу. Довірчий інтервал - це діапазон значень, у якому з певною ймовірністю укладено справжнє значення популяції (для середнього, медіани або частоти). На практиці зручніше мати обидва ці значення, що дозволяє з більшою впевненістю судити про застосування отриманих результатів до популяції в цілому.

На закінчення слід сказати кілька слів про інструменти, якими користується фахівець зі статистики, або дослідник, який самостійно проводить аналіз даних. Давно пішли у минуле ручні обчислення. Існуючі на сьогоднішній день статистичні комп'ютерні програми дозволяють проводити статистичний аналіз, не маючи серйозної математичної підготовки. Такі потужні системи як SPSS, SAS, R та ін дають можливість досліднику використовувати складні та потужні статистичні методи. Однак далеко не завжди це благо. Не знаючи про ступінь застосування статистичних тестів до конкретних даних експерименту, дослідник може провести розрахунки і навіть отримати деякі числа на виході, але результат буде дуже сумнівним. Тому обов'язковою умовою для проведення статистичної обробки результатів експерименту має бути добре знання математичних основ статистики.


Досить докладно викладено у вітчизняній літературі. У практиці російських підприємств, тим часом, використовуються лише деякі з них. Розглянемо далі деякі методи статистичної обробки

Загальні відомості

У практиці вітчизняних підприємств поширені переважно статистичні методи контролю. Якщо говорити про регулювання технологічного процесу, воно відзначається вкрай рідко. Застосування статистичних методівпередбачає, що на підприємстві формується група спеціалістів, які мають відповідну кваліфікацію.

Значення

Відповідно до вимог ІСО сер. 9000, постачальнику необхідно визначити необхідність у статистичних методах, що застосовуються у процесі розробки, регулювання та перевірки можливостей виробничого процесу та характеристики виробів. Використовувані прийоми базуються на теорії ймовірностей та математичних розрахунках. Статистичні методи аналізу данихможуть впроваджуватися будь-якому етапі життєвого циклу вироби. Вони забезпечують оцінку та облік ступеня неоднорідності продукції чи варіабельності її властивостей щодо встановлених номіналів чи необхідних значень, а також мінливості процесу її створення. Статистичні методи – цеприйоми, за допомогою яких можна із заданою точністю та достовірністю судити про стан явищ, що досліджуються. Вони дозволяють спрогнозувати ті чи інші проблеми, виробити оптимальні рішення на основі вивченої фактичної інформації, тенденцій та закономірностей.

Напрями використання

Основні області, у яких поширені статистичні методи, - це:


Практика розвинутих країн

Статистичні методи – цеоснова, що забезпечує виробництво продукції з високими споживчими характеристиками. Ці прийоми широко використовуються у промислово розвинених державах. Статистичні методи - це, насправді, гаранти отримання споживачами продукції, відповідної встановленим вимогам. Ефект їх використання підтверджено практикою промислових підприємств Японії. Саме вони сприяли досягненню найвищого виробничого рівня у цій країні. Багаторічний досвід зарубіжних країн показує, наскільки ефективними є ці прийоми. Зокрема відомо, що компанія Hewlelt Packard, застосовуючи статистичні методи, змогла знизити в одному з випадків кількість шлюбу за місяць з 9 000 до 45 од.

Труднощі впровадження

У вітчизняній практиці існує низка перешкод, що не дозволяють використовувати статистичні методи вивченняпоказників. Складнощі виникають внаслідок:


Розробка програми

Необхідно сказати, що визначення потреби у тих чи інших статистичних методах у сфері якості, вибір, освоєння конкретних прийомів є досить складною та тривалою роботою для будь-якого вітчизняного підприємства. Для її ефективного здійснення доцільно розробити спеціальну довготривалу програму. У ній слід передбачити формування служби, завдання якої входитиме організація та методичне керівництво застосування статистичних методів. У рамках програми потрібно передбачити оснащення відповідними технічними засобами, навчання фахівців, визначити склад виробничих завдань, які мають вирішуватись за допомогою вибраних прийомів. Освоєння рекомендується розпочати з використання найпростіших підходів. Наприклад, можна використовувати відомі елементарні виробництва. Згодом доцільно перейти до інших прийомів. Наприклад, це може бути аналіз дисперсії, вибіркова обробка інформації, регулювання процесів, планування факторного дослідження та експериментів та ін.

Класифікація

До статистичних методів економічного аналізу належатьрізні прийоми. Варто сказати, що їх налічується досить багато. Однак провідний спеціаліст у сфері менеджменту якості в Японії К. Ісікава рекомендує використовувати сім основних методів:

  1. Діаграми Парето.
  2. Угруповання відомостей за загальними ознаками.
  3. Контрольні карти.
  4. Причинно-наслідкові діаграми.
  5. Гістограми.
  6. Контрольні листки.
  7. Розкид діаграми.

Керуючись власним досвідом у сфері менеджменту, Ісікава стверджує, що 95% усіх питань та проблем на підприємстві можна вирішити, використовуючи ці сім підходів.

Діаграма Парето

Цей базується на певному співвідношенні. Воно було названо "принципом Парето". Відповідно до нього, із 20% причин з'являється 80% наслідків. у наочній та зрозумілій формі показує відносний вплив кожної обставини на загальну проблему у спадному порядку. Цей вплив можна досліджувати на кількості втрат, дефектів, спровокованих кожною причиною. Відносний вплив ілюструється за допомогою стовпчиків, накопичений вплив факторів за допомогою кумулятивної прямої.

Причинно-наслідкова діаграма

На ній досліджувану проблему умовно зображують у формі горизонтальної прямої стрілки, а умови та фактори, побічно або прямо впливають на неї, - у вигляді похилих. При побудові слід враховувати навіть незначні здавалося б обставини. Це обумовлюється тим, що на практиці досить часто бувають випадки, в яких вирішення завдання забезпечується винятком кількох факторів, що здаються несуттєвими. Причини, що впливають на основні обставини (першого та наступних порядків), зображують на діаграмі горизонтальними короткими стрілками. Деталізована схема матиме форму скелета риби.

Угруповання відомостей

Цей економіко-статистичний методвикористовується для впорядкування безлічі показників, отриманих при оцінці та вимірюванні одного або декількох параметрів об'єкта. Як правило, така інформація представлена ​​у формі невпорядкованої послідовності значень. Це можуть бути лінійні розміри заготовки, температура плавлення, твердість матеріалу, кількість дефектів тощо. На основі такої системи складно робити висновки про властивості виробу або процеси його створення. Упорядкування здійснюється за допомогою лінійних графіків. Вони наочно показують зміни параметрів, що спостерігаються, протягом певного періоду.

Контрольний листок

Як правило, він представлений у вигляді таблиці розподілу частот входження вимірюваних величин параметрів об'єкта відповідні проміжки. Контрольні листки складаються залежно від мети дослідження. Діапазон значень показників поділяється на однакові інтервали. Їх число вибирають зазвичай дорівнює квадратному кореню з кількості виконаних вимірювань. Бланк повинен бути простим, щоб виключити проблеми під час заповнення, прочитання, перевірки.

Гістограма

Вона представлена ​​у формі ступінчастого багатокутника. Він наочно ілюструє розподіл показників вимірів. Діапазон встановлених величин розбивається на рівні проміжки, які відкладають осі абсцис. До кожного інтервалу будується прямокутник. Його висота дорівнює частоті входження величини у цей проміжок.

Діаграми розкиду

Вони використовуються під час перевірки гіпотези про взаємозв'язок двох змінних величин. Модель будується в такий спосіб. На осі абсцис відкладають величину одного параметра, ординат – іншого показника. У результаті графіку з'являється точка. Ці дії повторюються всім значень змінних. За наявності взаємозв'язку поле кореляції витягнуте, і напрямок не співпадатиме зі спрямованістю осі ординат. Якщо залежність відсутня, воно паралельно одній з осей або матиме форму кола.

Контрольні карти

Вони використовуються в оцінці процесу протягом конкретного періоду. Формування контрольних карток базується на таких положеннях:

  1. Усі процеси відхиляються від заданих параметрів із часом.
  2. Нестабільний перебіг явища не змінюється випадково. Невипадковими виступають відхилення, що виходять за межі передбачуваних меж.
  3. Окремі зміни можуть бути спрогнозовані.
  4. Стабільний процес може випадково відхилятися і передбачуваних межах.

Використання у практиці російських підприємств

Слід сказати, що вітчизняний та зарубіжний досвід показує, що найбільш ефективним статистичним методом оцінки стабільності та точності обладнання та технологічних процесів виступає складання контрольних карток. Цей спосіб використовується також для регулювання виробничих потенційних потужностей. При побудові карток необхідно правильно вибрати досліджуваний параметр. Рекомендується віддавати перевагу тим показникам, які безпосередньо відносяться до призначення виробу, можуть бути легко виміряні і на які можна вплинути за допомогою регулювання процесу. Якщо такий вибір утруднений або не виправданий, можна виконати оцінку величин, корельованих (взаємопов'язаних) з контрольованим параметром.

Нюанси

Якщо вимір показників з точністю, необхідної для складання карт за кількісним критерієм, економічно чи технічно неможливий, використовують альтернативну ознаку. З ним пов'язані такі терміни, як "шлюб" та "дефект". Під останнім розуміють кожну відокремлену невідповідність виробу встановленим вимогам. Шлюбом називають продукцію, надання якої заборонена споживачам, у зв'язку з наявністю у ній дефектів.

Особливості

Кожен тип карт має свою специфіку. Її необхідно брати до уваги при їх виборі для конкретного випадку. Карти за кількісним критерієм вважаються чутливішими до змін процесу, ніж ті, в яких використовується альтернативна ознака. Однак при цьому перші трудомісткіші. Їх використовують для:

  1. Налагодження процесу.
  2. Оцінки можливостей впровадження технології.
  3. Перевірка точності роботи обладнання.
  4. Визначення допусків.
  5. Порівняння декількох допустимих способів створення продукту.

Додатково

Якщо розладка процесу відрізняється усуненням контрольованого параметра, необхідно використовувати Х-карти. Якщо має місце збільшення розсіювання значень, потрібно вибирати R або S-моделі. Необхідно, проте, враховувати низку особливостей. Зокрема, використання S-карт дозволить точніше і швидше встановити розладку процесу, ніж R-моделі при однакових водночас, побудова останніх не вимагає виконання складних розрахунків.

Висновок

В економіці дозволяють досліджувати фактори, які виявляються в ході якісної оцінки, у просторі та динаміці. З їхньою допомогою можна виконувати прогнозні розрахунки. До статистичних методів економічна аналізу не відносять способи оцінки причинно-наслідкових зв'язків господарських процесів та подій, виявлення перспективних та невикористаних резервів підвищення результативності діяльності. Іншими словами, до розглянутих підходів не включаються факторні прийоми.