Біографії Характеристики Аналіз

Середня квадратична помилка вибірки тим більше. Середня квадратична стандартна помилка вибірки пояснення для

Середня помилка вибірки показує, наскільки відхиляється в середньому параметр вибіркової сукупностівід відповідного параметра генерального. Якщо розрахувати середню помилку всіх можливих вибірок певного видузаданого обсягу ( n), витягнутих з однієї і тієї ж генеральної сукупності, то отримаємо їх узагальнюючу характеристику - середню помилку вибірки ().

Теоретично вибіркового спостереження виведені формули для визначення , які індивідуальні для різних способіввідбору (повторного та безповторного), типів використовуваних вибірок та видів оцінюваних статистичних показників.

Наприклад, якщо застосовується повторна власне випадкова вибірка, визначається як:

При оцінюванні середнього значення ознаки;

Якщо ознака альтернативна, і оцінюється частка.

При власному випадковому відборі до формули вноситься поправка (1 - n/N):

- для середнього значення ознаки;

- Для частки.

Імовірність отримання саме такої величини помилки завжди дорівнює 0,683. Насправді ж вважають за краще отримувати дані з більшою ймовірністю, але це призводить до зростання величини помилки вибірки.

Гранична помилка вибірки () дорівнює t-кратному числу середніх помилок вибірки (теоретично вибірки прийнято коефіцієнт t називати коефіцієнтом довіри):

Якщо помилку вибірки збільшити вдвічі (t = 2), то отримаємо набагато більшу ймовірність того, що вона не перевищить певної межі (у нашому випадку – подвійний середньої помилки) – 0,954. Якщо взяти t = 3, то довірча ймовірністьстановитиме 0,997 - практично достовірність.

Рівень граничної помилкивибірки залежить від наступних факторів:

  • ступеня варіації одиниць генеральної сукупності;
  • обсягу вибірки;
  • вибраних схем відбору (безповторний відбір дає меншу величину помилки);
  • рівня довірчої ймовірності.

Якщо обсяг вибірки більше 30, то значення t визначається за таблицею нормального розподілу, якщо менше – за таблицею розподілу Стьюдента.

Наведемо деякі значення коефіцієнта довіри із таблиці нормального розподілу.

Довірчий інтервал для середнього значення ознаки та для частки в генеральній сукупності встановлюється таким чином:

Отже, визначення меж генеральної середньої та частки складається з наступних етапів:

Помилки вибірки при різних видахвідбору

  1. Власне випадкова та механічна вибірка. Середня помилка власне випадкової та механічної вибірки знаходяться за формулами, наведеними в табл. 11.3.

Приклад 11.2. Для вивчення рівня фондовіддачі було проведено вибіркове обстеження 90 підприємств із 225 методом випадкової повторної вибірки, В результаті якого отримані дані, представлені в таблиці.

У цьому прикладі маємо 40%-ную вибірку (90: 225 = 0,4, або 40%). Визначимо її граничну помилку та межі для середнього значення ознаки в генеральній сукупності за кроками алгоритму:

  1. За результатами вибіркового обстеження розрахуємо середнє значення та дисперсію у вибірковій сукупності:
Таблиця 11.5.
Результати спостереження Розрахункові значення
рівень фондовіддачі, руб., X i кількість підприємств, f i середина інтервалу, x i \xb4 x i \xb4 f i x i \xb4 2 f i
До 1,4 13 1,3 16,9 21,97
1,4-1,6 15 1,5 22,5 33,75
1,6-1,8 17 1,7 28,9 49,13
1,8-2,0 15 1,9 28,5 54,15
2,0-2,2 16 2,1 33,6 70,56
2,2 і вище 14 2,3 32,2 74,06
Разом 90 - 162,6 303,62

Вибіркова середня

Вибіркова дисперсія досліджуваної ознаки

Для наших даних визначимо граничну помилку вибірки, наприклад, із ймовірністю 0,954. За таблицею значень ймовірності функції нормального розподілу (див. Витримку з неї, наведену в Додатку 1) знаходимо величину коефіцієнта довіри t, що відповідає ймовірності 0,954. За ймовірності 0,954 коефіцієнт t дорівнює 2.

Таким чином, у 954 випадках із 1000 середнє значення фондовіддачі буде не вище 1,88 руб. і не нижче 1,74 руб.

Вище було використано повторну схему випадкового відбору. Подивимося, чи зміняться результати обстеження, якщо припустити, що відбір здійснювався за схемою відбору. У цьому випадку розрахунок середньої помилки проводиться за формулою

Тоді при ймовірності, що дорівнює 0,954 величина граничної помилки вибірки складе:

Довірчі межі для середнього значення ознаки при неповторному випадковому відборі матимуть такі значення:

Порівнявши результати двох схем відбору, можна дійти невтішного висновку у тому, що застосування безповторної випадкової вибірки дає більш точні результати проти застосуванням повторного відбору за однієї й тієї ж довірчої ймовірності. При цьому, що більший обсяг вибірки, то суттєвіше звужуються межі значень середньої при переході від однієї схеми відбору до іншої.

За даними прикладу визначимо, у яких межах перебуває частка підприємств із рівнем фондовіддачі, що не перевищує значення 2,0 руб., у генеральній сукупності:

  1. розрахуємо вибіркову частку.

Кількість підприємств у вибірці з рівнем фондовіддачі, що не перевищує значення 2,0 руб., Складає 60 одиниць. Тоді

m = 60, n = 90, w = m/n = 60: 90 = 0,667;

  1. розрахуємо дисперсію частки у вибірковій сукупності
  1. середня помилка вибірки під час використання повторної схемивідбору складе

Якщо припустити, що було використано безповторна схема відбору, то середня помилка вибірки з урахуванням поправки на кінцівку сукупності становитиме

  1. Задамо довірчу ймовірність і визначимо граничну помилку вибірки.

При значенні ймовірності Р = 0,997 за таблицею нормального розподілу отримуємо значення коефіцієнта довіри t = 3 (див. витримку з неї, наведену в Додатку 1):

Таким чином, з ймовірністю 0,997 можна стверджувати, що в генеральній сукупності частка підприємств з рівнем фондовіддачі, що не перевищує значення 2,0 руб., Не менше, ніж 54,7%, і не більше 78,7%.

  1. Типова вибірка. При типовій вибірці Генеральна сукупністьоб'єктів розбита на k груп, тоді

N 1 + N 2 + … + N i + … + N k = N.

Обсяг вилучених із кожної типової групи одиниць залежить від прийнятого способу відбору; їх Загальна кількістьутворює необхідний обсяг вибірки

n 1 + n 2 + … + n i + … + n k = n.

Існують такі два способи організації відбору всередині типової групи: пропорційної обсягу типових груп і пропорційного ступеня коливання значень ознаки у одиниць спостереження в групах. Розглянемо перший із них, як найчастіше використовуваний.

Відбір, пропорційний обсягу типових груп, передбачає, що у кожній з них буде відібрано наступне числоодиниць сукупності:

n = n i · N i / N

де n i - кількість видобутих одиниць для вибірки з i-ї типової групи;

n – загальний обсяг вибірки;

N i - кількість одиниць генеральної сукупності, що склали i-ю типову групу;

N – загальна кількість одиниць генеральної сукупності.

Відбір одиниць усередині груп відбувається як випадкової чи механічної вибірки.

Формули для оцінювання середньої помилки вибірки для середнього та частки представлені у табл. 11.6.

Тут – середня з групових дисперсій типових груп.

Приклад 11.3. В одному з московських вузів проведено вибіркове обстеження студентів з метою визначення показника середньої відвідуваності вузівської бібліотеки одним студентом за семестр. Для цього було використано 5%-ву безповторну типову вибірку, типові групи якої відповідають номеру курсу. При відборі, пропорційному обсягу типових груп, отримані такі дані:

Таблиця 11.7.
Номер курсу Усього студентів, чол., N i Обстежено внаслідок вибіркового спостереження, чол., n i Середня кількість відвідувань бібліотеки одним студентом за семестр, x i Внутрішньогрупова вибіркова дисперсія,
1 650 33 11 6
2 610 31 8 15
3 580 29 5 18
4 360 18 6 24
5 350 17 10 12
Разом 2 550 128 8 -

Число студентів, яке необхідно обстежити на кожному курсі, розрахуємо так:

аналогічно для інших груп:

Розподіл значень вибіркових середніх має нормальний закон розподілу (чи наближається щодо нього) при п > 100, незалежно від характеру розподілу генеральної сукупності. Однак у разі малих вибірок діє інший закон розподілу – розподіл Стьюдента. У цьому випадку коефіцієнт довіри знаходиться за таблицею t-розподілу Стьюдента в залежності від величини довірчої ймовірності Р та обсягу вибірки п. У Додатку 1 наводиться фрагмент таблиці t-розподілу Стьюдента, представленої у вигляді залежності довірчої ймовірності від обсягу вибірки та коефіцієнта довіри t.

Приклад 11.4. Припустимо, що вибіркове обстеження восьми студентів академії показало, що на підготовку до контрольної роботиза статистикою вони витратили таку кількість годин: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6,6.

Приклад 11.5. Розрахуємо, скільки з 507 промислових підприємствслід перевірити податкову інспекцію, щоб із ймовірністю 0,997 визначити частку підприємств із порушеннями у сплаті податків. За даними минулого аналогічного обстеження величина середнього квадратичного відхилення становила 0,15; розмір помилки вибірки передбачається отримати вище, ніж 0,05.

У разі використання повторного випадкового відбору слід перевірити

При неповторному випадковому відборі потрібно перевірити

Як бачимо, використання безповторного відбору дозволяє проводити обстеження набагато меншого числаоб'єктів.

Приклад 11.6. Планується провести обстеження заробітної платина підприємствах галузі шляхом випадкового безповторного відбору. Якою має бути чисельність вибіркової сукупності, якщо на час обстеження галузі число зайнятих становило 100 000 чол.? Гранична помилка вибірки має перевищувати 100 крб. із ймовірністю 0,954. За результатами попередніх обстежень заробітної плати у галузі відомо, що середнє квадратичне відхиленняскладає 500 руб.

Отже, для вирішення поставленого завдання необхідно включити у вибірку щонайменше 100 осіб.

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називають помилкою репрезентативності. Розрізняють систематичні та випадкові помилкивибірки.

Випадкові помилки пояснюються недостатньо рівномірним уявленняму вибірковій сукупності різних категорій одиниць генеральної сукупності.

Систематичні помилки можуть бути пов'язані з порушенням правил відбору чи умов реалізації вибірки.

Так, під час обстеження бюджетів домашніх господарств вибіркову сукупність протягом понад 40 років будували з урахуванням територіально-галузевого принципу відбору, що було зумовлено основною метою бюджетного обстеження – дати характеристику життя робітників, службовців і колгоспників. Вибіркова сукупність розподілялася по регіонах та галузях економіки РРФСР пропорційно загальної чисельностізайнятих; для створення галузевої вибірки застосовували типову вибірку з механічним відбором одиниць усередині груп.

Головним критерієм відбору була середньомісячна оплата праці. Принцип відбору забезпечував пропорційну представництво у вибірковій сукупності працюючих з різним рівнем заробітної плати.

З появою нових соціальних груп(Підприємців, фермерів, безробітних) репрезентативність вибірки порушувалася не тільки через відмінності зі структурою генеральної сукупності, а й у зв'язку з систематичною помилкою, яка виникала через розбіжність одиниці відбору (працівник) та одиниці спостереження (домогосподарство). Домогосподарство, що має більше одного працюючого члена сім'ї, мало й більшу ймовірність бути відібраним, ніж домогосподарство, у складі якого був один працюючий. Сім'ї, що не мають зайнятих в обстежуваних галузях, випадали з кола одиниць, що відбираються (домогосподарства пенсіонерів, домогосподарства, що існують за рахунок індивідуальної трудової діяльності, тощо). Оцінка точності отриманих результатів (кордону довірчих інтервалів, помилки вибірки) було утруднено, оскільки під час побудови вибірки не використовувалися імовірнісні моделі.

У 1996–1997 роках. був впроваджений принципово новий підхіддля формування вибірки домашніх господарств. Як основу її проведення використовували дані мікропереписи населення 1994 р. Генеральну сукупність під час відбору склали всі типи домашніх господарств, крім колективних. А вибіркову сукупність стали організовувати з урахуванням представницькості складу та типів домашніх господарств у межах кожного суб'єкта РФ.

Вимірювання помилок репрезентативності вибіркових показників ґрунтується на припущенні про випадковий характер їх розподілу при безкінечності. великому числівибірок.

Кількісну оцінку надійності вибіркового показника використовують, щоб скласти уявлення про генеральну характеристику. Це здійснюють або на основі вибіркового показника з урахуванням його випадкової помилки або на основі висування деякої гіпотези (про величину середньої дисперсії, характер розподілу, зв'язку) щодо властивостей генеральної сукупності.

Для перевірки гіпотези оцінюють узгодженість емпіричних даних із гіпотетичними.

Розмір випадкової помилки репрезентативності залежить:

  • 1) від обсягу вибірки;
  • 2) ступеня варіації досліджуваної ознаки у генеральній сукупності;
  • 3) прийнятого способу формування вибіркової сукупності.

Розрізняють середню (стандартну) та граничну помилки вибірки.

Середня помилка характеризує міру відхилень вибіркових показників аналогічних показників генеральної сукупності.

Граничною помилкою прийнято вважати максимально можливе розбіжність вибіркової та генеральної характеристик, тобто. максимум помилки при заданій ймовірності її появи.

За даними вибіркової сукупності можна оцінити різні показники (параметри) генеральної сукупності. Найчастіше використовують оцінку:

Основним принципом застосування вибіркового методу є забезпечення рівної можливості всім одиниць генеральної сукупності бути відібраними у вибіркову сукупність. За такого підходу дотримується вимога випадкового, об'єктивного відбору і, отже, помилка вибірки визначається насамперед її обсягом ( п ). Зі збільшенням останнього величина середньої помилки зменшується, характеристики вибіркової сукупності наближаються до характеристик генеральної сукупності.

При однаковій чисельності вибіркових сукупностей та інших рівних умовахпомилка вибірки буде меншою в гой з них, яка відібрана з генеральної сукупності з меншою варіацією ознаки, що вивчається. Зменшення варіації ознаки означає зниження величини дисперсії (для кількісної ознаки або для альтернативної ознаки).

Залежність величини помилки вибірки від способів формування вибіркової сукупності визначається за формулами середньої помилки вибірки (табл. 5.2).

Доповнимо показники табл. 5.2 наступними поясненнями.

Вибіркова дисперсія дещо менша за генеральну, в математичної статистикидоведено, що

Таблиця 5.2

Формули розрахунку середньої помилки вибірки мрі різних способахвідбору

Вигляд вибірки

повторний для

безповторний для

Власне

випадкова

(Проста)

Серійна

(З рівновеликими

Типова (пропорційно до обсягу груп)

Якщо вибіркова сукупність має великий обсяг (тобто. п досить велике), то співвідношення наближається до одиниці і вибіркова дисперсія практично збігається з генеральною.

Вибірку вважають безумовно великою при п > 100 і безумовно малої при п < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

Вони можуть бути розраховані за такими формулами:

де – середня i -ї серії; - загальна середня по всій вибірковій сукупності;

де - частка одиниць певної категорії в i -ї серії; – частка одиниць цієї категорії у всій вибірковій сукупності; r – кількість відібраних серій.

4. Для визначення середньої помилки типової вибірки у разі відбору одиниць пропорційно чисельності кожної групи як показник варіації виступає середня з внутрішньогрупових дисперсій(– для кількісної ознаки, для альтернативної ознаки). За правилом складання дисперсій величина середньої із внутрішньогрупових дисперсій менша, ніж величина загальної дисперсії. Значення середньої можливої ​​помилкитипової вибірки менше, ніж помилка простої власне-випадкової вибірки.

Часто використовують комбінований відбір: індивідуальний відбір одиниць поєднують із груповим, типовий відбір – із відбором серіями. За будь-якого способу відбору з певною ймовірністю можна стверджувати, що відхилення вибіркової середньої (або частки) від генеральної середньої (або частки) не перевищить певну величину, яку називають граничною помилкою вибірки.

Співвідношення між межею помилки вибірки (∆), що гарантується з деякою ймовірністю F(t), та середньою помилкою вибірки має вигляд: або , де t - Коефіцієнт довіри, що визначається залежно від рівня ймовірності F(t).

Значення функції F(t) і t визначаються з урахуванням спеціально складених математичних таблиць. Наведемо деякі з них, які найчастіше застосовуються:

т

Таким чином, гранична помилка вибірки відповідає на питання про точність вибірки з певною ймовірністю, величина якої залежить від значення коефіцієнта довіри t. Так, при t = 1 ймовірність F(t ) відхилення вибіркових характеристик від генеральних на величину одноразової середньої помилки дорівнює 0,683. Отже, у середньому з кожної 1000 вибірок 683 дадуть узагальнюючі показники (середню, частку), які відрізнятимуться від генеральних лише на величину одноразової середньої помилки. При t = 2 ймовірність F(t) дорівнює 0,954, це означає, що з кожної 1000 вибірок 954 дадуть узагальнюючі показники, які відрізнятимуться від генеральних лише на дворазову середню помилку вибірки, і т.д.

Поряд з абсолютною величиноюграничної помилки вибірки розраховують та відносну помилку, яка визначається як відсоткове відношенняграничної помилки вибірки до відповідної характеристики вибіркової сукупності:

Насправді прийнято задавати величину ∆, зазвичай, не більше 10% передбачуваного середнього рівня ознаки.

Розрахунок середньої та граничної помилок вибірки дозволяє визначити межі, в яких будуть перебувати характеристики генеральної сукупності:

Межі, в яких з даним ступенем ймовірності буде укладена невідома величина показника, що вивчається в генеральній сукупності, називають довірчим інтервалом, а ймовірність F(t) довірчою ймовірністю. Чим вище значення ∆, тим більша величина довірчого інтервалуі, отже, нижче точність оцінки.

Розглянемо наступний приклад. Для визначення середнього розміру вкладу банку шляхом повторної випадкової вибірки було відібрано 200 валютних рахунків вкладників. В результаті встановили, що середній розмірвкладу - 60 тис. руб., Дисперсія склала 32. При цьому 40 рахунків виявилися до запитання. Необхідно з ймовірністю 0,954 визначити межі, у яких перебувають середній розмір вкладу на валютних рахунках банку і частка рахунків до запитання.

Розрахуємо середню помилку вибіркової середньої за формулою для повторного відбору

Гранична помилка вибіркової середньої з ймовірністю 0,954 становитиме

Отже, середній розмір вкладу на валютних рахунках у банку знаходиться в межах тис. руб.

З ймовірністю 0,954 можна стверджувати, що середній розмір вкладу на валютних рахунках у банку становить від 59200 до 60800 руб.

Визначимо частку вкладів до запитання у вибірковій сукупності:

Середня помилка вибіркової частки

Гранична помилка частки з ймовірністю 0,954 становитиме

Таким чином, частка рахунків до запитання у генеральній сукупності перебуває в межах w :

З ймовірністю 0,954 можна стверджувати, частка рахунків до запитання у кількості валютних рахунків у банку становить від 14,4 до 25,6%.

При конкретних дослідженняхважливо встановити оптимальне співвідношення між мірою надійності отриманих результатів та величиною припустимої помилки вибірки. У зв'язку з цим при організації вибіркового спостереження виникає питання, пов'язане з визначенням обсягу вибірки, необхідного для отримання необхідної точності результатів із заданою ймовірністю. Розрахунок необхідного обсягу вибірки проводиться на основі формул граничної помилки вибірки відповідно до виду та способу відбору (табл. 5.3).

Таблиця 5.3

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

Продовжимо приклад, у якому подано результати вибіркового обстеження особових рахунків вкладників банку.

Потрібно встановити, скільки необхідно обстежити рахунків, щоб із ймовірністю 0,977 помилка щодо середнього розміру вкладу не перевищила 1,5 тис. крб. Виразимо з формули граничної помилки вибірки для повторного відбору показник чисельності вибірки:

При визначенні необхідного обсягу вибірки за наведеними формулами виникає труднощі у знаходженні значень σ2 і так, оскільки ці величини можна отримати лише після проведення вибіркового обстеження. У зв'язку з цим замість фактичних значень даних показників підставляють наближені, які могли бути визначені на основі будь-яких пробних вибіркових спостереженьабо з попередніх аналітичних обстежень.

У тих випадках, коли статистик знає середнє значення ознак, що вивчаються (наприклад, з інструкцій, законодавчих актів тощо) або межі, в яких ця ознака варіюється, можна застосувати наступний розрахунок за наближеними формулами:

а добуток w(1 – w) замінити значенням 0,25 (w = 0,5).

Щоб отримати більше точний результат, Набувають максимально можливе значення цих показників. Якщо розподіл ознаки у генеральній сукупності підпорядковується нормальному закону, Розмах варіації приблизно дорівнює 6σ ( крайні значеннявідстоять у той і інший бік від середньої з відривом 3σ). Звідси , але якщо розподіл свідомо асиметричний, то .

За будь-якого виду вибірки її обсяг починають розраховувати за формулою повторного відбору.

Якщо в результаті розрахунку частка відбору ( n ) перевищить 5%, то проводять розрахунок за формулою безповторного відбору.

Для типової вибірки необхідно загальний обсяг вибіркової сукупності поділити між виділеними типами одиниць. Розрахунок числа спостережень із кожної групи залежить від названих раніше організаційних формтипової вибірки.

При типовому відборі одиниць непропорційно чисельності груп загальну кількість одиниць, що відбираються ділять на число груп, отримана величина дає чисельність відбору з кожної типової групи:

де k - Число виділених типових груп.

При відборі одиниць пропорційно до чисельності типових груп число спостережень по кожній групі визначають за формулою

де - обсяг вибірки з i -ї групи; - Об `єм i -ї групи.

При відборі з урахуванням варіації ознаки відсоток вибірки кожної групи повинен бути пропорційний середньому квадратичному відхилення цієї групи (). Розрахунок чисельності () виробляють за формулами

При серійному відборі необхідну чисельність серій, що відбираються, визначають так само, як і при власне-випадковому відборі:

Повторний відбір

Неповторний відбір

При цьому дисперсії та помилки вибірки можуть бути розраховані для середньої величини або частки ознаки.

При використанні вибіркового спостереження характеристика його результатів можлива з урахуванням зіставлення отриманих меж помилок вибіркових показників з величиною допустимої похибки.

У зв'язку з цим постає завдання визначення ймовірності того, що помилка вибірки не перевищить допустиму похибку. Вирішення цієї задачі зводиться до розрахунку на основі формули граничної помилки вибірки величини t.

Продовжуючи розгляд прикладу вибіркового обстеження особових рахунків клієнтів банку, знайдемо ймовірність, з якої можна стверджувати, що помилка щодо середнього розміру вкладу не перевищить 785 руб.:

відповідна довірча ймовірність становитиме 0,95.

В даний час практика вибіркового спостереження включає статистичні спостереження, що здійснюються:

  • - Органами Росстату;
  • - іншими міністерствами та відомствами (наприклад, моніторинг підприємств у системі Банку Росії).

Відоме узагальнення досвіду щодо організації вибіркових обстежень малих підприємств, населення та домашніх господарств представлено у Методологічних положеннях зі статистики. У них дано більше широке поняттявибіркового спостереження, що це розглянуто вище (табл. 5.4).

У статистичній практиці використовують усі чотири типи вибірок, поданих у табл. 5.4. Однак зазвичай віддають перевагу описаним вище імовірнісним (випадковим) вибіркам, що є найбільш об'єктивними, так як за ними можна оцінити точність результатів, що одержуються за даними самої вибірки.

Таблиця 5.4

Типи вибірок

У вибірках квазівипадкового типу передбачається наявність ймовірнісного відбору на підставі, що фахівець, який розглядає вибірку, вважає його допустимим. Прикладом використання квазівипадкової вибірки у статистичній практиці є "Вибіркове обстеження малих підприємств з вивчення соціальних процесіву малому підприємництві", проведене в 1996 р. в деяких регіонах Росії. Одиниці спостереження (малі підприємства) відбиралися експертно з урахуванням представництва галузей економіки з уже сформованої вибірки обстеження фінансово-господарської діяльності малих підприємств (форма "Відомості про основні показники фінансово-господарської діяльності малого підприємства"). При узагальненні вибіркових даних передбачалося, що вибіркова сукупність сформована шляхом простого випадкового добору.

Пряме використання судження експерта є найбільш загальним методомнавмисного включення одиниць у вибірку. Приклад такого способу відбору є монографічний метод, що передбачає отримання лише від однієї одиниці спостереження, що є типовою, на думку організатора обстеження – експерта.

Вибірки, сформовані на основі спрямованого відбору, реалізуються за допомогою об'єктивної процедури, але без використання ймовірнісного механізму. Широко відомий метод основного масиву, при якому у вибірку включають найбільші (істотні) одиниці спостереження, що забезпечують основний внесок у показник, наприклад сумарне значенняознаки, що становить основну мету обстеження.

У статистичній практиці часто застосовують комбінований метод статистичного спостереження. Поєднання суцільного та вибіркового методів спостереження має два аспекти:

  • чергування у часі;
  • одночасне їх використання (частина сукупності спостерігають на суцільній основі, а частина – вибірково).

Чергування періодичних вибіркових з порівняно рідкісними суцільними обстеженнями чи переписами необхідно уточнення складу досліджуваної сукупності. Надалі цю інформацію використовують як статистичну основувибіркового спостереження. Прикладами можуть бути переписи населення та вибіркові обстеження домашніх господарств у проміжках часу між їх проведеннями.

У даному випадкупотрібно вирішувати такі завдання:

  • - Визначення складу ознак суцільного спостереження, що забезпечують організацію вибірки;
  • - Обґрунтування періодів чергування, тобто. коли суцільні дані втрачають актуальність і необхідні витрати на їх оновлення.

Одночасне використання у межах одного обстеження суцільного і вибіркового спостережень зумовлено неоднорідністю які у статистичної практиці сукупностей. Особливо це справедливо для обстежень економічної діяльності сукупності підприємств, на яку характерні скошені розподілу ознак, що досліджуються, коли деяка кількість одиниць має характеристики, що сильно відрізняються від основної маси значень. І тут такі одиниці спостерігають на суцільної основі, іншу частину сукупності – вибірково.

При даній організації спостережень основними завданнями є:

  • - Встановлення їх оптимальної пропорції;
  • - Розробка способів оцінки точності результатів.

Типовим прикладом, що ілюструє даний аспект застосування комбінованого методу, є загальний принциппроведення обстежень сукупності підприємств, відповідно до якого обстеження сукупності великих та середніх підприємств проводять переважно суцільним методом, а малих – вибірковим.

Подальший розвиток методології вибіркового спостереження здійснюють як у поєднанні з організацією суцільного спостереження, і через організацію спеціальних обстежень, проведення яких диктується необхідністю отримання додаткової інформаціїна вирішення конкретних завдань. Так, організація обстежень у сфері умов та рівня життя населення передбачена у двох аспектах:

Обов'язковими компонентами можуть стати щорічні дослідження доходів, витрат та споживання (аналог обстеження бюджетів домашніх господарств), які включають також базові показники умов життя населення. Щорічно за спеціальним планом обов'язкові компоненти повинні доповнюватися одноразовими обстеженнями (модулями) умов життя населення, спрямованими на поглиблене вивченнябудь-якої обраної соціальної темиз них загальної кількості(наприклад, активи домашніх господарств, здоров'я, харчування, освіта, умови праці, житлові умови, дозвілля, соціальна мобільність, Безпека та ін) з різною періодичністю, що визначається потребою в показниках та ресурсними можливостями.

Поняття та розрахунок помилки вибірки.

Завданням вибіркового спостереження є дача вірних уявлень про зведені показники всієї сукупності з урахуванням певної частини, підданої спостереженню. Можливе відхилення вибіркової частки та вибіркової середньої від частки та середньої в генеральній сукупності називається помилкою вибірки або помилкою репрезентативності. Чим більший розмір цієї помилки, тим більше показники вибіркового спостереження відрізняються від показників генеральної сукупності.

Розрізняються:

Помилки вибірки;

Помилки реєстрації.

Помилки реєстраціївиникають при неправильному встановленні факту у процесі спостереження. Вони властиві як суцільному спостереженню, і вибірковому, але у вибірковому їх менше.

За природою помилки бувають:

Тенденційні – навмисні, тобто. були відібрані або найкращі або гірші одиниці сукупності. У цьому спостереження втрачають сенс;

Випадкові – основний організаційний принцип вибіркового спостереження у тому, ніж запобігти навмисного відбору, тобто. забезпечити суворе дотримання принципу випадкового відбору.

Загальним правиломвипадкового відборує: в окремих одиниць генеральної сукупності повинні бути абсолютно однакові умови і можливості впасти до одиниць, що входять у вибірку. Це характеризує незалежність результату вибірки від волі спостерігача. Воля ж спостерігача породжує тенденційні помилки. Помилка вибірки при випадковому відборі випадковий характер. Вона характеризує розміри відхилень генеральних показників від вибіркових.

У зв'язку з тим, що ознаки в досліджуваній сукупності варіюють, то склад одиниць, що потрапили у вибірку, може не збігатися зі складом одиниць усієї сукупності. Це означає, що Рі не збігаються з Wта . Можлива розбіжність між цими характеристиками визначається помилкою вибірки, що визначається за такою формулою:

де - генеральна дисперсія.

де – вибіркова дисперсія.

Звідси видно, де генеральна дисперсія відрізняється від вибіркової дисперсіїв раз.

Існує повторний та безповторний відбір. Сутність повторного відбору у тому, кожна, яка потрапила у вибірку одиниця, після спостереження повертається у генеральну сукупність і може бути досліджена повторно. При повторному відборі середня помилка вибірки розраховується:

Для показника частки альтернативної ознаки дисперсія вибірки визначається за такою формулою:

Насправді повторний відбір застосовується рідко. При безповторному відборі, чисельність генеральної сукупності Nв ході вибірки скорочується, формула середньої помилки вибірки для кількісної ознаки має вигляд:



тоді

Одне з можливих значень, в яких може бути частка ознаки, що вивчається, дорівнює:

де – помилка вибірки альтернативної ознаки.

приклад.

При вибіркове обстеження 10% виробів партії готової продукції за методом без повторного відбору отримано такі дані про вміст вологи у зразках.

Визначити середній % вологості, дисперсію, середнє квадратичне відхилення, з ймовірністю 0,954 можливі межі, у яких очікується порівн. % вологості всієї готової продукції, ймовірність 0,987 можливі межі питомої вагистандартної продукції за умови, що до нестандартної партії належать вироби з вологістю до 13% і вище 19%.

Лише з певною ймовірністю можна стверджувати, що генеральна частка від вибіркової частки і генеральна середня від вибіркової середньої відхиляються в tразів.

У статистиці ці відхилення називаються граничними помилками вибірки і позначаються.

Імовірність суджень можна підвищити або знизити в tразів. За ймовірності 0,683, при 0,954, при 0,987, тоді показники генеральної сукупності за показниками вибірки визначаються.

Як ми знаємо, репрезентативність - властивість вибіркової сукупності представляти характеристику генеральної. Якщо збігу немає, говорять про помилку репрезентативності – міру відхилення статистичної структури вибірки від структури відповідної генеральної сукупності. Припустимо, що середній щомісячний сімейний дохід пенсіонерів у генеральній сукупності становить 2 тис. крб., а вибіркової - 6 тис. крб. Це означає, що соціолог опитував лише заможну частину пенсіонерів, а його дослідження вкралася помилка репрезентативності. Іншими словами, помилкою репрезентативності називається розбіжність між двома сукупностями - генеральною, на яку спрямований теоретичний інтерес соціолога та уявлення про властивості якої він хоче отримати зрештою, та вибірковою, на яку спрямований практичний інтерес соціолога, яка виступає одночасно як об'єкт обстеження та засіб отримання інформації про генеральну сукупність.

Поряд із терміном «помилка репрезентативності» у вітчизняній літературі можна зустріти інший – «помилка вибірки». Іноді вони використовують як синоніми, інколи ж «помилка вибірки» використовується замість «помилки репрезентативності» як кількісно точніше поняття.

Помилка вибірки - відхилення середніх показників вибіркової сукупності від середніх показників генеральної сукупності.

Насправді помилка вибірки визначається шляхом порівняння відомих характеристик генеральної сукупності з вибірковими середніми. У соціології під час обстеження дорослого населення найчастіше використовують дані переписів населення, поточного статистичного обліку, результати попередніх опитувань. Як контрольні параметри зазвичай застосовуються соціально-демографічні ознаки. Порівняння середніх генеральної та вибіркової сукупностей, на основі цього визначення помилки вибірки та її зменшення називається контролюванням репрезентативності. Оскільки порівняння своїх та чужих даних можна зробити після завершення дослідження, такий спосіб контролю називається апостеріорним, тобто. здійснюваним після досвіду.

В опитуваннях Інституту Дж. Геллапа репрезентативність контролюється за наявними в національних переписах даними про розподіл населення за статтю, віком, освітою, доходом, професією, расовою приналежністю, місцем проживання, величиною населеного пункту. Всеросійський центр вивчення громадської думки(ВЦВГД) використовує для подібних цілей такі показники, як стать, вік, освіта, тип поселення, сімейний стан, сфера зайнятості, посадовий статус респондента, які запозичуються у Державному комітеті зі статистики РФ. У тому іншому випадку генеральна сукупність відома. Помилки вибірки неможливо встановити, якщо невідомі значення змінної у вибірковій та генеральній сукупності.

Фахівці ВЦВГД забезпечують при аналізі даних ретельний ремонт вибірки, щоб мінімізувати відхилення, що виникли на етапі польових робіт. Особливо сильні усунення спостерігаються за параметрами статі та віку. Пояснюється це тим, що жінки та люди з вищою освітоюбільше часу проводять вдома і легше йдуть контакт із інтерв'юером, тобто. є легко досяжною групою порівняно з чоловіками та людьми «неосвіченими»35.

Помилка вибірки обумовлюється двома факторами: методом формування вибірки та розміром вибірки.

Помилки вибірки поділяються на два типи - випадкові та систематичні. Випадкова помилка – це ймовірність того, що вибіркова середня вийде (або не вийде) за межі заданого інтервалу. До випадкових помилок відносять статистичні похибки, властиві самому вибірковому методу. Вони зменшуються у разі зростання обсягу вибіркової сукупності.

Другий тип помилок вибірки – систематичні помилки. Якщо соціолог вирішив дізнатися думку всіх жителів міста про проведену місцевими органамивлади соціальної політики, а опитав лише тих, хто має телефон, виникає навмисне зміщення вибірки на користь заможних верств, тобто. систематична помилка.

Таким чином, систематичні помилки – результат діяльності самого дослідника. Вони найнебезпечніші, оскільки призводять до досить значних зсувів результатів дослідження. Систематичні помилки вважаються страшнішими за випадкові ще й тому, що вони не піддаються контролю та виміру.

Вони виникають, коли, наприклад: 1) вибірка відповідає завданням дослідження (соціолог вирішив вивчити лише працюючих пенсіонерів, а опитав всіх поспіль); 2) у наявності незнання характеру генеральної сукупності (соціолог думав, що 70% всіх пенсіонерів не працює, а виявилося, що не працює лише 10%); 3) відбираються лише «виграшні» елементи генеральної сукупності (наприклад, лише забезпечені пенсіонери).

Увага! На відміну від випадкових помилок, систематичні помилки при зростанні обсягу вибірки не зменшуються.

Узагальнивши всі випадки, коли відбуваються систематичні помилки, методисти склали їхній реєстр. Вони вважають, що джерелом неконтрольованих перекосів у розподілі вибіркових спостережень можуть бути наступні фактори:
♦ порушено методичні та методологічні правила проведення соціологічного дослідження;
♦ обрано неадекватні способи формування вибіркової сукупності, методи збору та розрахунку даних;
♦ відбулася заміна необхідних одиниць спостереження іншими, доступнішими;
♦ відзначено неповне охоплення вибіркової сукупності (недоотримання анкет, неповне їх заповнення, важкодоступність одиниць спостереження).

Навмисні помилки соціолог припускає рідко. Найчастіше помилки виникають через те, що соціологу погано відома структура генеральної сукупності: розподіл людей за віком, професією, доходами тощо.

Систематичні помилки легше попередити (проти випадковими), але їх дуже важко усунути. Запобігати систематичним помилкам, точно передбачаючи їх джерела, найкраще заздалегідь - на самому початку дослідження.

Ось деякі способи уникнути помилок вибірки:
♦ кожна одиниця генеральної сукупності повинна мати рівну ймовірність потрапити у вибірку;
♦ відбір бажано проводити із однорідних сукупностей;
♦ треба знати характеристики генеральної сукупності;
♦ при складанні вибіркової сукупності треба враховувати випадкові та систематичні помилки.

Якщо вибіркову сукупність (або просто вибірку) складено правильно, то соціолог отримує надійні результати, що характеризують всю генеральну сукупність. Якщо вона складена неправильно, то помилка, що виникла етапі складання вибірки, кожному наступному етапі проведення соціологічного дослідження примножується і досягає зрештою такий величини, яка переважує цінність проведеного дослідження. Кажуть, що від такого дослідження більше шкоди, ніж користі.

Подібні помилки можуть статися тільки з вибірковою сукупністю. Щоб уникнути чи зменшити ймовірність помилки, найпростіший спосіб – збільшувати розміри вибірки (в ідеалі до обсягу генеральної: коли обидві сукупності збігатимуться, помилка вибірки взагалі зникне). Економічно такий метод неможливий. Залишається інший шлях – удосконалювати математичні методискладання вибірки. Вони і застосовуються практично. Такий перший канал проникнення до соціології математики. Другий канал - математична обробкаданих.

Особливо важлива проблемапомилок стає у маркетингових дослідженнях, де використовуються невеликі вибірки. Зазвичай вони становлять кілька сотень, рідше – тисячу респондентів. Тут вихідним пунктом розрахунку вибірки виступає питання визначення розмірів вибіркової сукупності. Чисельність вибіркової сукупності залежить від двох факторів: 1) вартості збору інформації та 2) прагнення до певного ступеня статистичної достовірностірезультатів, які сподівається отримати дослідник. Звісно, ​​навіть досвідчені в статистиці і соціології люди інтуїтивно розуміють, що більше розміри вибірки, тобто. що ближче вони до розмірів генеральної сукупності загалом, то надійніші і достовірні отримані дані. Однак ми вже говорили про практичну неможливість суцільних опитувань у тих випадках, коли вони проводяться на об'єктах, чисельність яких перевищує десятки, сотні тисяч і навіть мільйони. Зрозуміло, що вартість збору інформації (що включає оплату тиражування інструментарію, праці анкетерів, польових менеджерів та операторів з комп'ютерного введення) залежить від суми, яку готовий виділити замовник, і слабо залежить від дослідників. Що ж до другого фактора, то ми зупинимося на ньому трохи докладніше.

Отже, що більше величина вибірки, то менше можлива помилка. Хоча необхідно відзначити, що за бажання збільшити точність удвічі вам доведеться збільшити вибірку не вдвічі, а вчетверо. Наприклад, щоб зробити вдвічі більше точну оцінкуданих, отриманих шляхом опитування 400 людина, вам потрібно опитати не 800, а 1600 людина. Втім, навряд чи маркетингове дослідження потребує стовідсоткової точності. Якщо пивовару необхідно дізнатися, яка частина споживачів пива віддає перевагу саме його марці, а не сорту його конкурента, - 60% або 40%, то на його плани ніяк не вплине різниця між 57%, 60 або 63%.

Помилка вибірки може залежати як від її величини, а й від ступеня відмінностей між окремими одиницями всередині генеральної сукупності, що її досліджуємо. Наприклад, якщо нам потрібно дізнатися, яка кількість пива споживається, то ми виявимо, що всередині нашої генеральної сукупності норми споживання різних людейзначно різняться (гетерогенна генеральна сукупність). В іншому випадку ми вивчатимемо споживання хліба і встановимо, що у різних людейвоно відрізняється значно менш значно (гомогенная генеральна сукупність). Чим більша різниця (або гетерогенність) всередині генеральної сукупності, тим більша величина можливої ​​помилки вибірки. Зазначена закономірність лише підтверджує те, що нам підказує простий здоровий глузд. Таким чином, як справедливо стверджує В. Ядов, «чисельність (обсяг) вибірки залежить від рівня однорідності або різнорідності об'єктів, що вивчаються. Що більше вони однорідні, то менша чисельність може забезпечити статистично достовірні висновки».

Визначення обсягу вибірки залежить від рівня довірчого інтервалу припустимої статистичної помилки. Тут маються на увазі так звані випадкові помилки, пов'язані з природою будь-яких статистичних похибок. В.І. Паніотто наводить такі розрахунки репрезентативної вибіркиз припущенням 5% помилки:
Це означає, що якщо ви, опитавши, припустимо, 400 осіб у районному місті, де чисельність дорослого платоспроможного населення становить 100 тис. осіб, виявили, що 33% опитаних покупців віддають перевагу продукції місцевого м'ясокомбінату, то з 95%-ною ймовірністю можете стверджувати, що постійними покупцями цієї продукції є 33+5% (тобто від 28 до 38%) мешканців цього міста.

Можна також скористатися розрахунками інституту Геллапа для оцінки співвідношення розмірів вибірки та помилки вибірки.