Біографії Характеристики Аналіз

Для розрахунку граничної помилки вибірки необхідно скоригувати. Формула довірчої ймовірності при оцінці генеральної середньої

Помилка вибірки- це об'єктивно виникає розбіжність між характеристиками вибірки та генеральної сукупності. Вона залежить від низки чинників: ступеня варіації досліджуваного ознаки, чисельності вибірки, шляхом відбору одиниць у вибіркову сукупність, прийнятого рівня достовірності результату дослідження.

Для репрезентативності вибірки важливо забезпечити випадковість відбору, щоб всі об'єкти генеральної сукупності мали рівні ймовірності потрапити у вибірку. Для забезпечення репрезентативності вибірки застосовують такі способи відбору:

· власне-випадкова(проста випадкова) вибірка (послідовно відбирається перший об'єкт, що випадково попався);

· механічна(систематична) вибірка;

· типова(стратифікована, розшарована) вибірка (об'єкти відбираються пропорційно до представництва різних типів об'єктів у генеральній сукупності);

· серійна(Гніздова) вибірка.

Відбір одиниць у вибіркову сукупність може бути повторним чи безповторним. При повторному відборіщо у вибірку одиниця піддається обстеженню, тобто. реєстрації значень її ознак, що повертається в генеральну сукупність і нарівні з іншими одиницями бере участь у подальшій процедурі відбору. При безповторному відборіодиниця, що потрапила у вибірку, піддається обстеженню і в подальшій процедурі відбору не бере участі.

Вибіркове спостереження завжди пов'язане з помилкою, оскільки кількість відібраних одиниць не дорівнює початковій (генеральній) сукупності. Випадкові помилки вибірки обумовлені дією випадкових чинників, які містять будь-яких елементів системності у бік впливу розраховані вибіркові характеристики. Навіть за суворого дотримання всіх принципів формування вибіркової сукупності вибіркові і генеральні характеристики дещо відрізнятимуться. Тому випадкові помилки, що отримуються, повинні бути статистично оцінені і враховані при поширенні результатів вибіркового спостереження на всю генеральну сукупність. Оцінка таких помилок і є основним завданням, яке вирішується в теорії вибіркового спостереження. Зворотним завданням є визначення такої мінімально необхідної чисельності вибіркової сукупності, коли помилка не перевищить заданої величини. На вироблення навичок у вирішенні цих завдань і спрямований матеріал цього розділу.

Власно-випадкова вибірка. Її суть полягає у відборі одиниць із генеральної сукупності загалом, без поділу її на групи, підгрупи чи серії окремих одиниць. При цьому одиниці відбираються у випадковому порядку, що не залежить ні від послідовності розташування одиниць у сукупності, ні від значень їх ознак.

Після проведення відбору з використанням одного з алгоритмів, що реалізують принцип випадковості або на основі таблиці випадкових чисел, визначаються межі генеральних характеристик. Для цього розраховуються середня та гранична помилки вибірки.

Середня помилка повторної власно-випадкової вибіркивизначається за формулою

де σ - середнє квадратичне відхилення ознаки, що вивчається;

n - обсяг (кількість одиниць) вибіркової сукупності.

Гранична помилка вибіркипов'язана із заданим рівнем ймовірності. При вирішенні поданих нижче завдань необхідна ймовірність становить 0,954 (t = 2) або 0,997 (t = 3). З урахуванням обраного рівня ймовірності та відповідного йому значення t гранична помилка вибірки становитиме:

Тоді можна стверджувати, що за заданої ймовірності генеральна середня перебуватиме у таких межах:

При визначенні кордонів генеральної часткипри розрахунку середньої помилки вибірки використовується дисперсія альтернативної ознаки, яка обчислюється за такою формулою:

де w - вибіркова частка, тобто частка одиниць, які мають певний варіант або варіанти досліджуваного ознаки.

При вирішенні окремих завдань необхідно враховувати, що за невідомої дисперсії альтернативної ознаки можна використовувати її максимально можливу величину, що дорівнює 0,25.

приклад. В результаті вибіркового обстеження незайнятого населення, яке шукає роботу, проведеного на основі власне-випадкової повторної вибіркибули отримані дані, наведені у табл. 1.14.

Таблиця 1.14

Результати вибіркового обстеження незайнятого населення

Із ймовірністю 0,954 визначте межі:

а) середнього віку незайнятого населення;

б) частки (питомої ваги) осіб, молодших 25 років, у загальній чисельності незайнятого населення.

Рішення.Для визначення середньої помилки вибірки необхідно, перш за все, визначити вибіркову середню величину та дисперсію ознаки, що вивчається. Для цього при ручному способі розрахунку доцільно побудувати таблицю 1.15.

Таблиця 1.15

Розрахунок середнього віку незайнятого населення та дисперсії

На підставі даних таблиці розраховуються необхідні показники:

· Вибіркова середня величина:

;

· Дисперсія:

· середньоквадратичне відхилення:

.

Середня помилка вибірки складе:

року.

Визначимо з ймовірністю 0,954 ( t= 2) граничну помилку вибірки:

року.

Встановимо межі генеральної середньої: (41,2 - 1,6) (41,2+1,6) або:

Таким чином, на підставі проведеного вибіркового обстеження з ймовірністю 0,954 можна зробити висновок, що середній вік незайнятого населення, що шукає роботу, лежить в межах від 40 до 43 років.

Для відповіді на питання, поставлене в пункті «б» даного прикладу, за вибірковими даними визначимо частку осіб віком до 25 років та розрахуємо дисперсію частки:

Розрахуємо середню помилку вибірки:

Гранична помилка вибірки із заданою ймовірністю складе:

Визначимо межі генеральної частки:

Отже, з ймовірністю 0,954 можна стверджувати, частка осіб віком до 25 років у кількості незайнятого населення перебуває у межах від 3,9 до 1 1,9%.

При розрахунку середньої помилки власне-випадковою безповторноювибірки необхідно враховувати виправлення на безповторність відбору:

де N - обсяг (кількість одиниць) генеральної сукупності/

Необхідний обсяг власно-випадкової повторної вибіркивизначається за формулою:

Якщо відбір безповторний, то формула набуває наступного вигляду:

Отриманий на основі використання цих формул результат завжди округляється у велику сторону до цілого значення.

приклад.Необхідно визначити, скільки учнів перших класів шкіл району необхідно відібрати в порядку власно-випадкової безповторної вибірки, щоб з ймовірністю 0,997 визначити межі середнього зростання першокласників з граничною помилкою 2 см. Відомо, що всього в перших класах шкіл району навчається 1100 учнів за результатами аналогічного обстеження в іншому районі становила 24.

Рішення.Необхідний обсяг вибірки при рівні ймовірності 0,997 ( t= 3) складе:

Таким чином, для отримання даних про середнє зростання першокласників із заданою точністю необхідно обстежити 52 школярі.

Механічна вибірка. Ця вибірка полягає у відборі одиниць із загального списку одиниць генеральної сукупності через рівні інтервали відповідно до встановленого відсотка відбору. При вирішенні завдань визначення середньої помилки механічної вибірки, і навіть необхідної її чисельності, слід використовувати наведені вище формули, застосовувані при власне-випадковому безповторному відборі.

Так, при 2% вибірці відбирається кожна 50-а одиниця (1:0,02), при 5% вибірці - кожна 20 одиниця (1:0,05) і т.д.

Таким чином, відповідно до прийнятої частки відбору, генеральна сукупність механічно розбивається на рівновеликі групи. З кожної групи у вибірку відбирається лише одна одиниця.

Важливою особливістю механічної вибірки і те, що формування вибіркової сукупності можна здійснити, не вдаючись до складання списків. Насправді часто використовують той порядок, у якому фактично розміщуються одиниці генеральної сукупності. Наприклад, послідовність виходу готових виробів з конвеєра чи потокової лінії, порядок розміщення одиниць партії товару під час зберігання, транспортування, реалізації тощо.

Типова вибірка.Ця вибірка застосовується у випадках, коли одиниці генеральної сукупності об'єднані у кілька великих типових груп. Відбір одиниць у вибірку проводиться усередині цих груп пропорційно їх обсягу на основі використання власне-випадкової або механічної вибірки (за наявності необхідної інформації відбір також може проводитися пропорційно варіації ознаки, що вивчається в групах).

Типова вибірка зазвичай застосовується щодо складних статистичних сукупностей. Наприклад, при вибірковому обстеженні продуктивність праці працівників торгівлі, які з окремих груп з кваліфікації.

Важливою особливістю типової вибірки і те, що вона дає точніші результати проти іншими способами відбору одиниць у вибіркову сукупність.

Середня помилка типової вибірки визначається за формулами:

(Повторний відбір);

(Безповторний відбір),

де - середня з внутрішньогрупових дисперсій.

приклад. З метою вивчення доходів населення за трьома районами області сформовано 2%-ву вибірку, пропорційну чисельності населення цих районів. Отримані результати наведено в табл. 16.

Таблиця 16

Результати вибіркового обстеження доходів населення

Необхідно визначити межі середньодушових доходів населення області загалом за рівня ймовірності 0,997.

Рішення.Розрахуємо середню із внутрішньогрупових дисперсій:

де N i- Об `єм i-і групи;

n, - обсяг вибірки з/- та групи.

Серійна вибірка. Ця вибірка використовується у випадках, коли одиниці досліджуваної сукупності об'єднані в невеликі рівновеликі групи чи серії. Одиницею відбору у разі є серія. Серії відбираються з допомогою власно-випадкової чи механічної вибірки, а всередині відібраних серій обстежуються все без винятку одиниці.

В основі розрахунку середньої помилки серійної вибірки лежить міжгрупова дисперсія:

(Повторний відбір);

(Безповторний відбір),

де x i- кількість відібраних i- серій;

R- загальна кількість серій.

Міжгрупову дисперсію при рівновеликих групах обчислюють так:

де х i- середня i-ї серії;

х- загальна середня по всій вибірковій сукупності.

приклад. З метою контролю якості комплектуючих із партії виробів, упакованих у 50 ящиків по 20 виробів у кожному, було здійснено 10%-ву серійну вибірку. По ящикам, що потрапили у вибірку, середнє відхилення параметрів виробу від норми відповідно склало 9 мм, 11, 12, 8 і 14 мм. З ймовірністю 0,954 визначте середнє відхилення параметрів у всій партії загалом.

Рішення.Вибіркова середня:

мм.

Розмір міжгрупової дисперсії:

З урахуванням встановленої ймовірності Р = 0,954 (t= 2) гранична помилка вибірки складе:

мм.

Зроблені розрахунки дозволяють зробити висновок, що середнє відхилення параметрів всіх виробів від норми знаходиться в наступних межах:

Для визначення необхідного обсягу серійної вибірки при заданій граничній помилці використовуються такі формули:

(Повторний відбір);

(Безповторний відбір).

Поняття та розрахунок помилки вибірки.

Завданням вибіркового спостереження є дача вірних уявлень про зведені показники всієї сукупності з урахуванням певної частини, підданої спостереженню. Можливе відхилення вибіркової частки та вибіркової середньої від частки та середньої в генеральній сукупності називається помилкою вибірки або помилкою репрезентативності. Чим більший розмір цієї помилки, тим більше показники вибіркового спостереження відрізняються від показників генеральної сукупності.

Розрізняються:

Помилки вибірки;

Помилки реєстрації.

Помилки реєстраціївиникають при неправильному встановленні факту у процесі спостереження. Вони властиві як суцільному спостереженню, і вибірковому, але у вибірковому їх менше.

За природою помилки бувають:

Тенденційні – навмисні, тобто. були відібрані або найкращі або гірші одиниці сукупності. У цьому спостереження втрачають сенс;

Випадкові – основний організаційний принцип вибіркового спостереження у тому, ніж запобігти навмисного відбору, тобто. забезпечити суворе дотримання принципу випадкового відбору.

Загальним правилом випадкового відборує: в окремих одиниць генеральної сукупності повинні бути абсолютно однакові умови і можливості впасти до одиниць, що входять у вибірку. Це характеризує незалежність результату вибірки від волі спостерігача. Воля ж спостерігача породжує тенденційні помилки. Помилка вибірки при випадковому відборі має випадковий характер. Вона характеризує розміри відхилень генеральних показників від вибіркових.

У зв'язку з тим, що ознаки в досліджуваній сукупності варіюють, то склад одиниць, що потрапили у вибірку, може не збігатися зі складом одиниць усієї сукупності. Це означає, що Рі не збігаються з Wта . Можлива розбіжність між цими характеристиками визначається помилкою вибірки, що визначається за такою формулою:

де – генеральна дисперсія.

де – вибіркова дисперсія.

Звідси видно, де генеральна дисперсія відрізняється від вибіркової дисперсії у раз.

Існує повторний та безповторний відбір. Сутність повторного відбору у тому, кожна, яка потрапила у вибірку одиниця, після спостереження повертається у генеральну сукупність і може бути досліджена повторно. При повторному відборі середня помилка вибірки розраховується:

Для показника частки альтернативної ознаки дисперсія вибірки визначається за такою формулою:

Насправді повторний відбір застосовується рідко. При безповторному доборі чисельність генеральної сукупності Nв ході вибірки скорочується, формула середньої помилки вибірки для кількісної ознаки має вигляд:



тоді

Одне з можливих значень, в яких може бути частка ознаки, що вивчається, дорівнює:

де – помилка вибірки альтернативної ознаки.

приклад.

При вибірковому обстеженні 10% виробів партії готової продукції методом без повторного відбору отримані такі дані про вміст вологи у зразках.

Визначити середній % вологості, дисперсію, середнє квадратичне відхилення, з ймовірністю 0,954 можливі межі, в яких очікується порівн. % вологості всієї готової продукції, з ймовірністю 0,987 можливі межі частки стандартної продукції за умови, що до нестандартної партії відносяться вироби з вологістю до 13 і вище 19 %.

Лише з певною ймовірністю можна стверджувати, що генеральна частка від вибіркової частки і генеральна середня від вибіркової середньої відхиляються в tразів.

У статистиці ці відхилення називаються граничними помилками вибірки і позначаються.

Імовірність суджень можна підвищити або знизити в tразів. За ймовірності 0,683, при 0,954, при 0,987, тоді показники генеральної сукупності за показниками вибірки визначаються.

Вибіркове спостереження

Поняття вибіркового спостереження

Вибірковий метод використовується, коли застосування суцільного спостереження фізично неможливе через величезний масив даних або економічно недоцільно. Фізична неможливість має місце, наприклад, щодо пасажиропотоків, ринкових цін, сімейних бюджетів. Економічна недоцільність має місце в оцінці якості товарів, що з їх знищенням. Наприклад, дегустація, випробування цегли на міцність тощо. Вибіркове спостереження використовується для перевірки результатів суцільного.

Статистичні одиниці, відібрані для спостереження, становлять вибірковусукупність або вибірку,а всіх масив - генеральнусукупність (ГС). При цьому кількість одиниць у вибірці позначають п,у всій ГС – N.Ставлення n/Nназивається відносний розмір або частка вибірки.

Якість результатів вибіркового спостереження залежить від репрезентативностівибірки, тобто. від того, наскільки вона представницька у ГС. Для забезпечення репрезентативності вибірки необхідно дотримуватися принципу випадковості відбору одиниць, який передбачає, що на включення одиниці ГС у вибірку не може вплинути якийсь інший фактор крім випадку.

Способи формування вибірки

1. Власне випадковийвідбір: всі одиниці ГС нумеруються, а номери, що випали в результаті жеребкування, відповідають одиницям, що потрапили у вибірку, причому число номерів дорівнює запланованому обсягу вибірки. Насправді замість жеребкування використовують генератори випадкових чисел. Цей спосіб відбору може бути повторним(Коли кожна одиниця, відібрана у вибірку, після проведення спостереження повертається в ГС і може бути знову обстежена) і безповторним(коли обстежені одиниці ГС не повертаються і можуть бути обстежені повторно). При повторному відборі ймовірність попадання у вибірку для кожної одиниці ГС залишається незмінною, а при безповторному відборі вона змінюється (збільшується), але для тих, що залишилися в ГС після відбору з неї кількох одиниць, ймовірність попадання у вибірку однакова.



2. Механічнийвідбір: відбираються одиниці генеральної сукупності із постійним кроком N/п. Тож якщо вона генеральна сукупність містить 100 тис.од., а потрібно вибрати 1 тис.од., то вибірку потрапить кожна сота одиниця.

3. Стратифікований(Розшарований) відбір здійснюється з неоднорідної генеральної сукупності, коли її попередньо розбивають на однорідні групи, після чого проводять відбір одиниць з кожної групи у вибіркову сукупність випадковий або механічним способом пропорційно їх чисельності в генеральній сукупності.

4. Серійний(Гніздовий) відбір: випадковим або механічним способом вибирають не окремі одиниці, а певні серії (гнізда), усередині яких відбувається суцільне спостереження.

Середня помилка вибірки

Після завершення відбору необхідного числа одиниць у вибірку та реєстрації передбачених програмою спостереження ознак цих одиниць, що вивчаються, переходять до розрахунку узагальнюючих показників. До них відносять середню величину ознаки, що вивчається, і частку одиниць, що володіють яким-небудь значенням цієї ознаки. Однак, якщо ГС зробити кілька вибірок, визначивши при цьому їх узагальнюючі характеристики, то можна встановити, що їх значення будуть різними, крім того, вони відрізнятимуться і від реального значення в ГС, якщо таке визначити за допомогою суцільного спостереження. Іншими словами, узагальнюючі характеристики, розраховані за даними вибірки, відрізнятимуться від їх реальних значень у ГС, тому введемо такі умовні позначення (табл. 8).

Таблиця 8. Умовні позначення

Різниця між значенням узагальнюючих характеристик вибіркової та генеральної сукупностей називається помилкою вибірки,яка поділяється на помилку реєстраціїта помилку репрезентативності. Перша виникає через неправильні або неточні відомості з причин нерозуміння суті питання, неуважності реєстратора при заповненні анкет, формулярів і т.п. Вона досить легко виявляється та усувається. Друга виникає через недотримання принципу випадковості відбору одиниць вибірку. Її складніше виявити і усунути, вона набагато більша за першу і тому її вимір є основним завданням вибіркового спостереження.

Для вимірювання помилки вибірки визначається її середня помилка за формулою (39) для повторного відбору та за формулою (40) – для безповторного:

= ;(39) = . (40)

З формул (39) і (40) видно, що середня помилка менша у безповторної вибірки, що і зумовлює її ширше застосування.

Між показниками вибіркової сукупності та шуканими показниками (параметрами) генеральної сукупності, як правило, існують деякі розбіжності, які називають помилками вибірки.Загальна помилка вибіркової характеристики складається з помилок двох пологів: помилки реєстрації та помилки репрезентативності.

Помилки реєстрації властиві будь-якому статистичному спостереженню і їх поява може бути викликано неуважністю реєстратора, неточністю підрахунків, недосконалістю вимірювальних приладів тощо.

Помилки репрезентативності притаманні лише вибірковому спостереженню і зумовлені самою його природою, оскільки як би ретельно і правильно не проводився відбір одиниць, середні та відносні показники вибіркової сукупності завжди будуть якоюсь мірою відрізнятися від відповідних показників генеральної сукупності.

Розрізняють систематичні та випадкові помилки репрезентативності. Систематичні помилки репрезентативності - це неточності, які виникають внаслідок недотримання умов відбору одиниць у вибіркову сукупність, не надання рівної можливості кожній одиниці генеральної сукупності потрапити у вибірку. Випадкові помилки репрезентативності - це похибки, що виникають унаслідок те, що вибіркова сукупність точно не відтворює характеристики генеральної сукупності (середнє, частку, дисперсію та інших.) з несплошного характеру обстеження.

При дотриманні принципу випадкового відбору розмір помилки вибірки залежить від чисельності вибірки. Чим більша чисельність вибірки за інших рівних умов, тим менше величина помилки вибірки. При великій чисельності вибірки виразніше проявляється дія закону великих чисел, згідно з яким: з ймовірністю, як завгодно близькою до одиниці, можна стверджувати, що при досить великому обсязі вибірки та обмеженої дисперсії вибіркові характеристики (середня частка) будуть мало відрізнятися від відповідних генеральних характеристик .

Розміри помилки вибірки також безпосередньо пов'язані зі ступенем варіювання ознаки, що вивчається, а ступінь варіювання, як зазначалося вище, у статистиці характеризується розміром дисперсії (розсіяння): чим менше дисперсія, тим менше помилка вибірки, тим більше надійні статистичні висновки. Тому на практиці дисперсію ототожнюють із помилкою вибірки.

Оскільки параметр генеральної сукупності є шукана величина і він невідомий, потрібно орієнтуватися не так на конкретну помилку, а середню з усіх можливих вибірок.

Якщо з генеральної сукупності відібрати кілька вибіркових сукупностей, кожна з отриманих вибірок надасть різне значення конкретної помилки.

Середня квадратична величина обчислена з усіх можливих значень конкретних помилок (;) становитиме:

де *і – вибіркові середні; х - генеральна середня;)] - чисельність вибірок за величиною є1 = ~си - х.

Середнє квадратичне відхилення вибіркових середніх від середньої генеральної називають середньою помилкою вибірки.

Залежність величини помилки вибірки від її чисельності та від ступеня варіювання ознаки знаходить вираз у формулі середньої помилки вибірки /і.

Квадрат середньої помилки (дисперсія вибіркових середніх) прямо пропорційний дисперсіїСто і обернено пропорційний чисельності вибірки п:

де – дисперсія ознаки у генеральній сукупності.

Звідси середню помилку у загальному вигляді визначають за такою формулою:

Отже, визначивши за вибіркою середнє квадратичне відхилення, можна встановити значення середньої помилки вибірки, величина якої, як випливає з формули, тим більше, чим більша варіація випадкової величини і тим менше, чим більша чисельність вибірки.

Тому зі зростанням обсягу вибірки розмір середньої помилки зменшується. Якщо, наприклад, потрібно зменшити середню помилку вибірки вдвічі, то чисельність вибірки слід збільшити вчетверо, якщо треба зменшити помилку вибірки втричі, то обсяг вибірки слід збільшити у дев'ять разів тощо.

У практичних розрахунках застосовуються дві формули середньої помилки вибірки для середньої та частки.

При вибірковому вивченні середніх показників формула середньої помилки така:

При вивченні відносних показників (приватних ознак) формула середньої помилки має вигляд:

дег - частка ознаки у генеральній сукупності.

Застосування наведених формул середньої помилки передбачає, що відомі генеральна дисперсія та генеральна частка. Однак насправді ці показники невідомі та обчислити їх неможливо через відсутність даних щодо генеральної сукупності. Тому виникає потреба заміни генеральної дисперсії та генеральної частки іншими, близькими до них, величинами.

У математичній статистиці підтверджено, що такими величинами можуть бути вибіркова дисперсія (ст) і вибіркова частка (с).

З урахуванням сказаного формули середньої помилки можуть бути записані так:

Ці формули дозволяють визначити середню помилку при повторній вибірці. Застосування простої випадкової повторної вибірки на практиці є обмеженим. Насамперед практично недоцільно, інколи ж неможливо повторне обстеження тих самих одиниць. Застосування безповторного відбору замість повторного диктується вимогою підвищення ступеня точності і надійності вибірки. Тому практично частіше використовують спосіб безповторного випадкового відбору. За цим способом відбору одиниця сукупності, відібрана у вибірку, у подальшому відборі не бере участі. Одиниці відбирають із генеральної сукупності, зменшеної на кількість раніше відібраних одиниць. Тому у зв'язку зі зміною чисельності генеральної сукупності після кожного відбору та ймовірності відбору для залишених одиниць у формули середньої помилки вибірки вводиться поправочний множник

де N – чисельність генеральної сукупності; п- Чисельність вибірки. При досить великому значенні N можна одиницею знаменника знехтувати. Тоді

Отже, формули середньої помилки вибірки для безповторного відбору для середньої та для частки відповідно мають вигляд:

Оскільки пзавжди менше М, то додатковий множник завжди менше одиниці. Отже, абсолютне значення помилки вибірки при безповторному відборі завжди буде меншим, ніж при повторному.

Якщо чисельність вибірки досить велика, то величина 1 близька до одиниці, а тому нею можна знехтувати. Тоді середню помилку випадкового безповторного відбору визначають за такою формулою власне-випадкової повторної вибірки.

Розрахуємо для нашого прикладу середню помилку для врожайності та частки ділянок із врожайністю 25 ц/га та більше.

Середня помилка вибірки

а) середньої врожайності ячменю

Середня врожайність ячменю в генеральній сукупності х -Г^= 25,1±0,12 ц/га, тобто знаходиться в межах від 24,98 до 25,22 ц/га.

Частка ділянок з урожайністю 25 ц/га і більше у генеральній сукупності р

Т-^Г = 0,80±0,07, тобто. знаходиться у межах від 73 до 87%.

Середня помилка вибірки показує можливі відхилення показників вибіркової сукупності від показників генеральної сукупності. Разом про те під час проведення вибіркового спостереження перед дослідниками часто стоїть завдання розрахунку як середньої помилки, а й визначення граничної можливої ​​помилки вибірки. Знаючи середню помилку, можна визначити межі, за які не вийде величина помилки вибірки. Однак стверджувати, що ці відхилення не перевищать заданої величини, можна не з абсолютною достовірністю, а лише з певним ступенем ймовірності. Рівень ймовірності, що приймається щодо можливих меж, у яких містяться значення параметрів генеральної сукупності, називається довірчим рівнем ймовірності.

Довірча ймовірність- це досить висока і така, що практично вважається здійсненою в кожному конкретному випадку, ймовірність, що гарантує отримання надійних статистичних висновків. Позначимо її через Га можливість перевищити цей рівень - а. Отже,а =1 - Р Ймовірністьа називають рівнем значимості(суттєвості), що характеризує відносне число помилкових висновків у загальній кількості висновків і визначається як різниця між одиницею та довірчою ймовірністю, що приймається.

Рівень довірчої ймовірності встановлює дослідник виходячи зі ступеня відповідальності та характеру завдань, що вирішуються. У статистичних дослідженнях економіки найчастіше приймається рівень довірчої ймовірності Г = 0,95; Р = 0,99 (відповідно рівень значимостіа = 0,05; а = 0,01) рідшеГ = 0,999. Наприклад, довірча ймовірністьГ = 0,99 означає, що помилка оцінки в 99 випадках зі 100 не перевищить встановленої величини і тільки в одному випадку зі 100 може досягти обчисленого значення, або перевищити його.

Помилка вибірки, обчислена із заданим ступенем надійної ймовірності, називаєтьсяграничною помилкою вибірки Єр.

Розглянемо, як встановлюється величина можливої ​​граничної помилки вибірки. Величинаєр пов'язана з нормованим відхиленням та, яке визначається як відношення граничної помилки вибіркиєр до середньої помилкита:

Для зручності розрахунків відхилення випадкової величини від середнього значення зазвичай виражають в одиницях середнього квадратичного відхилення. Вираз

називаютьнормованим відхиленням. в У статистичній літературіі називаютькоефіцієнтом довіри, чи коефіцієнтом кратності середньої помилки вибірки.

Так, нормоване відхилення вибіркової середньої можна визначити за такою формулою:

та _є_р_

З виразу 1 можна знайти можливу граничну помилку вибірки

ер = і/л.

Підставивши замістьр. у її значення, наведемо формули граничних помилок вибірки для середньої та для частки при безповторному випадковому відборі:

Отже, гранична помилка вибірки залежить від величини середньої помилки та нормованого відхилення та дорівнює ± кратному числу середніх помилок вибірки.

Середня і гранична помилки вибірки - іменовані величини і виражаються у тих самих одиницях, як і середня арифметична і середнє квадратичне відхилення.

Нормоване відхилення функціонально пов'язані з ймовірністю. Для знаходження значеньі складено спеціальні таблиці (доб.2), якими можна знайти значенняіпри заданому рівні довірчої ймовірності та значення ймовірності при відомому і.

Наведемо значенняі та відповідні їм ймовірності для вибірок із чисельністюп > 30, що найчастіше використовується у практичних розрахунках:

Отже, приі = 1 ймовірність відхилення вибіркових характеристик від генеральних величину одноразової середньої помилки вибірки дорівнює 0,6827. Це означає, що в середньому з кожної 1000 вибірок 683 дадуть узагальнені характеристики, які відрізнятимуться від генеральних узагальнених характеристик не більше ніж на величину одноразової середньої помилки. При і = 2 ймовірність дорівнює 0,9545. в Це означає, що з кожного 1000 вибірок 954 дадуть узагальнені характеристики, які відрізнятимуться від генеральних узагальнених характеристик лише на двократну середню помилку вибірки тощо.

Однак у зв'язку з тим, що зазвичай проводиться тільки одна вибірка, то ми говоримо, що, наприклад, з ймовірністю 0,9545 можна гарантувати, що розміри граничної помилки не перевищать дворазову середню помилку вибірки.

Математично доведено, що відношення помилки вибірки до середньої помилки, як правило, не перевищує± 3д при досить великій чисельності п, незважаючи на те, що помилка вибірки може набувати будь-яких значень. Інакше кажучи можна сказати, що з досить високої ймовірності судження (Р = 0,9973) гранична помилка вибірки, зазвичай, вбирається у трьох середніх помилок вибірки. Тому величину Ер = 3д можна прийняти межу можливої ​​помилки вибірки.

Визначимо для нашого прикладу граничну помилку вибірки для середньої врожайності та частки ділянок із врожайністю 25 ц/га та більше. Довірчий рівень ймовірності приймемо рівним Р = 0,9545. в За таблицею (додаток.2) знайдемо значення і = 2. Середні помилки вибірки для врожайності та частки ділянок з урожайністю 25 ц/га та більше були знайдені раніше та відповідно становили: Ц~= ±0,12 ц/га;МР = ±0,07.

Гранична помилка середньої врожайності ячменю:

Отже, різниця між вибірковою середньою врожайністю та генеральною середньою буде не більше 0,24 ц/га. Межі середньої врожайності у генеральній сукупності: х = х ± є ~ = 25,1 + 0,24, тобто від 24,86 до 25,34 ц/га.

Гранична помилка частки ділянок із врожайністю 25 ц/га та більше:

Отже, гранична помилка у визначенні частки ділянок із врожайністю 25 ц/га і більше не перевищить 14%, тобто питома вага ділянок із зазначеною врожайністю у генеральній сукупності знаходиться в межах: г= а> ± ер = 0,80 ± 0,14, тобто від 66 до 94%.

Розбіжності між величиною будь-якого показника, знайденого за допомогою статистичного спостереження, та дійсними його розмірами називаються помилками спостереження . Залежно від причин виникнення розрізняють помилки реєстрації та помилки репрезентативності.

Помилки реєстрації виникають у результаті неправильного встановлення фактів чи помилкового запису у процесі спостереження чи опитування. Вони бувають випадковими чи систематичними. Випадкові помилки реєстрації можуть бути допущені як опитуваними у відповідях, і реєстраторами. Систематичні помилки можуть і навмисними, і ненавмисними. Умисні – свідомі, тенденційні спотворення дійсного стану справи. Ненавмисні викликаються різними випадковими причинами (недбалість, неуважність).

Помилки репрезентативності (представницькості) виникають у результаті неповного обстеження та у разі, якщо обстежувана сукупність недостатньо повно відтворює генеральну сукупність. Вони можуть бути випадковими та систематичними. Випадкові помилки репрезентативності – це відхилення, що виникають при несуцільному спостереженні через те, що сукупність відібраних одиниць спостереження (вибірка) неповно відтворює всю сукупність загалом. Систематичні помилки репрезентативності – це відхилення, що виникають внаслідок порушення принципів випадкового відбору одиниць. Помилки репрезентативності органічно властиві вибірковому спостереженню і виникають через те, що вибіркова сукупність в повному обсязі відтворює генеральну. Уникнути помилок репрезентативності не можна, проте, користуючись методами теорії ймовірностей, заснованими на використанні граничних теорем закону великих чисел, ці помилки можна звести до мінімальних значень, межі яких встановлюються досить великою точністю.

Помилки вибірки різниця між характеристиками вибіркової та генеральної сукупності. Для середнього значення помилка визначатиметься за формулою

де

Величина
називається граничною помилкою вибірки.

Гранична помилка вибірки – величина випадкова. Дослідженню закономірностей випадкових помилок вибірки присвячені граничні теореми закону великих чисел. Найбільш повно ці закономірності розкрито в теоремах П. Л. Чебишева та А. М. Ляпунова.

Теорему П. Л. Чебишева Стосовно аналізованого методу можна сформулювати наступним чином: при досить великому числі незалежних спостережень можна з ймовірністю, близькою до одиниці (тобто майже з достовірністю), стверджувати, що відхилення вибіркової середньої від генеральної буде скільки завгодно малим. У теоремі П. Л. Чебишева доведено, що величина помилки має перевищувати . У свою чергу величина , що виражає середнє квадратичне відхилення вибіркової середньої від генеральної середньої, залежить від коливання ознаки в генеральній сукупності та числа відібраних одиниць n. Ця залежність виражається формулою

, (7.2)

де залежить також від способу виробництва вибірки.

Величину =називають середньою помилкою вибірки. У цьому виразі - Генеральна дисперсія, n- Обсяг вибіркової сукупності.

Розглянемо, як впливає на величину середньої помилки кількість одиниць, що відбираються. n. Логічно неважко переконатися, що при відборі великої кількості одиниць розбіжності між середніми будуть меншими, тобто існує зворотний зв'язок між середньою помилкою вибірки та числом відібраних одиниць. При цьому тут утворюється не просто зворотна математична залежність, а така залежність, яка показує, що квадрат розходження між середніми обернено пропорційний числу відібраних одиниць.

Збільшення коливання ознаки тягне у себе збільшення середнього квадратичного відхилення, отже, і помилки. Якщо припустити, що це одиниці матимуть однакову величину ознаки, то середнє квадратичне відхилення дорівнюватиме нулю і помилка вибірки також зникне. Тоді немає потреби застосовувати вибірку. Проте слід пам'ятати, що величина коливання ознаки у генеральній сукупності невідома, оскільки невідомі розміри одиниць у ній. Можна розрахувати лише коливання ознаки у вибірковій сукупності. Співвідношення між дисперсіями генеральної та вибіркової сукупності виражається формулою

Оскільки величина за досить великих nблизька до одиниці, можна приблизно вважати, що вибіркова дисперсія дорівнює генеральної дисперсії, тобто.

Отже, середня помилка вибірки показує, які можливі відхилення показників вибіркової сукупності від відповідних показників генеральної сукупності. Однак про величину цієї помилки можна судити з певною ймовірністю. На величину ймовірності вказує множник

Теорема А. М. Ляпунова . А. М. Ляпунов довів, що розподіл вибіркових середніх (отже, та їх відхилень від генеральної середньої) за досить великої кількості незалежних спостережень наближено нормально за умови, що генеральна сукупність має кінцеву середню та обмежену дисперсію.

Математично теорему Ляпуноваможна записати так:

(7.3)

де
, (7.4)

де
- Математична постійна;

гранична помилка вибірки , яка дозволяє з'ясувати, у яких перебуває величина генеральної середньої.

Значення цього інтеграла для різних значень коефіцієнта довіри tобчислені та наводяться у спеціальних математичних таблицях. Зокрема, за:

Оскільки tвказує на ймовірність розбіжності
, Т. е. на ймовірність того, на яку величину генеральна середня буде відрізнятися від вибіркової середньої, то це може бути прочитано так: з ймовірністю 0,683 можна стверджувати, що різниця між вибірковою та генеральною середніми не перевищує однієї величини середньої помилки вибірки. Іншими словами, у 68,3% випадків помилка репрезентативності не вийде за межі
Імовірно 0,954 можна стверджувати, що помилка репрезентативності не перевищує
(Тобто в 95% випадків). З ймовірністю 0,997, тобто досить близькою до одиниці, можна очікувати, що різниця між вибірковою та генеральною середньою не перевершить триразової середньої помилки вибірки і т.д.

Логічно зв'язок тут виглядає досить ясно: що більше межі, у яких допускається можлива помилка, то з більшою ймовірністю судять про її величину.

Знаючи вибіркову середню величину ознаки
та граничну помилку вибірки
, можна визначити межі (межі), в яких укладено генеральну середню

1 . Власно-випадкова вибірка – цей спосіб орієнтований вибірку одиниць з генеральної сукупності без будь-якого розчленування частини чи групи. При цьому для дотримання основного принципу вибірки – рівної можливості всім одиницям генеральної сукупності бути відібраним – використовуються схема випадкового отримання одиниць шляхом жеребкування (лотереї) або таблиці випадкових чисел. Можливий повторний та безповторний відбір одиниць

Середня помилка власне-випадкової вибірки є середньоквадратичним відхиленням можливих значень вибіркової середньої від генеральної середньої. Середні помилки вибірки при власневипадковому методі відбору представлені в табл. 7.2.

Таблиця 7.2

Середня помилка вибірки μ

При відборі

повторному

безповторному

Для середньої

У таблиці використані такі позначення:

- Дисперсія вибіркової сукупності;

- Чисельність вибірки;

- Чисельність генеральної сукупності;

- вибіркова частка одиниць, що володіють ознакою, що вивчається;

- Число одиниць, що володіють ознакою, що вивчається;

- Чисельність вибірки.

Для збільшення точності замість множника слід брати множник
, але за великої чисельності Nрізницю між цими висловлюваннями практичного значення немає.

Гранична помилка власно-випадкової вибірки
розраховується за формулою

, (7.6)

де t - Коефіцієнт довіри залежить від значення ймовірності.

приклад.Під час обстеження ста зразків виробів, відібраних із партії у випадковому порядку, 20 виявилося нестандартними. Із ймовірністю 0,954 визначте межі, де знаходиться частка нестандартної продукції партії.

Рішення. Обчислимо генеральну частку ( Р):
.

Частка нестандартної продукції:
.

Гранична помилка вибіркової частки із ймовірністю 0,954 розраховується за формулою (7.6) із застосуванням формули табл. 7.2 для частки:

Імовірно 0,954 можна стверджувати, що частка нестандартної продукції в партії товару знаходиться в межах 12 % ≤ P≤ 28 %.

У практиці проектування вибіркового спостереження виникає потреба визначення чисельності вибірки, яка необхідна забезпечення певної точності розрахунку генеральних середніх. Гранична помилка вибірки та її ймовірність у своїй є заданими. З формули
та формул середніх помилок вибірки встановлюється необхідна чисельність вибірки. Формули визначення чисельності вибірки ( n) Залежать від способу відбору. Розрахунок чисельності вибірки для власне-випадкової вибірки наведено у табл. 7.3.

Таблиця 7.3

Передбачуваний відбір

для середньої

Повторний

Неповторний

2 . Механічна вибірка – при цьому методі виходять з обліку деяких особливостей розташування об'єктів у генеральній сукупності, їх упорядкованості (за списком, номером, алфавітом). Механічна вибірка здійснюється шляхом відбору окремих об'єктів генеральної сукупності через певний інтервал (кожен 10-й чи 20-й). Інтервал розраховується щодо , де n- Чисельність вибірки, N- Чисельність генеральної сукупності. Так, якщо з сукупності в 500 000 одиниць передбачається отримати 2% вибірку, тобто відібрати 10 000 одиниць, то пропорція відбору складе
Відбір одиниць здійснюється відповідно до встановленої пропорції через рівні інтервали. Якщо розташування об'єктів у генеральній сукупності має випадковий характер, то механічна вибірка за змістом аналогічна до випадкового відбору. При механічному відборі застосовується лише неповторна вибірка.

Середня помилка та чисельність вибірки під час механічного відбору підраховується за формулами власне-випадкової вибірки (див. табл. 7.2 та 7.3).

3 . Типова вибірка , за якої генеральна сукупність ділиться за деякими суттєвими ознаками на типові групи; відбір одиниць провадиться з типових груп. У цьому способі відбору генеральна сукупність розчленовується на однорідні у певному відношенні групи, які мають характеристики, і питання зводиться до визначення обсягу вибірок з кожної групи. Може бути рівномірна вибірка – при цьому способі з кожної типової групи відбирається однакове число одиниць
Такий підхід виправданий лише за рівності чисельності вихідних типових груп. При типовому відборі, непропорційному обсягу груп, загальна кількість одиниць, що відбираються, ділиться на число типових груп, отримана величина дає чисельність відбору з кожної типової групи.

Більш досконалою формою відбору є пропорційна вибірка . Пропорційною називається така схема формування вибіркової сукупності, коли чисельність вибірок, взятих із кожної типової групи в генеральній сукупності, пропорційна чисельностям, дисперсіям (або комбіновано і чисельностям, і дисперсіям). Умовно визначаємо чисельність вибірки в 100 одиниць та відбираємо одиниці з груп:

пропорційно до чисельності їх генеральної сукупності (Табл. 7.4). У таблиці зазначено:

N i- Чисельність типової групи;

d j- Частка ( N i/ N);

N- Чисельність генеральної сукупності;

n i- Чисельність вибірки з типової групи обчислюється:

, (7.7)

n- Чисельність вибірки з генеральної сукупності.

Таблиця 7.4

N i

d j

n i

пропорційно середньому квадратичному відхилення (Табл. 7.5).

тут  i- Середнє квадратичне відхилення типових груп;

n i - Чисельність вибірки з типової групи обчислюється за формулою

(7.8)

Таблиця 7.5

N i

n i

комбіновано (Табл. 7.6).

Чисельність вибірки обчислюється за такою формулою

. (7.9)

Таблиця 7.6

i N i

Під час проведення типової вибірки безпосередній відбір із кожної групи проводиться шляхом випадкового відбору.

Середні помилки вибірки розраховуються за формулами таблиці. 7.7 залежно від способу відбору типових груп.

Таблиця 7.7

Спосіб відбору

Повторний

Неповторний

для середньої

для частки

для середньої

для частки

Непропорційний обсягу груп

Пропорційний обсягу груп

Пропорційний коливання в групах (є найвигіднішим)

тут
- Середня з внутрішньогрупових дисперсій типових груп;

– частка одиниць, які мають досліджуваний ознакою;

– середня із внутрішньогрупових дисперсій для частки;

- Середнє квадратичне відхилення у вибірці з i-ї типової групи;

- Обсяг вибірки з типової групи;

- загальний обсяг вибірки;

- Обсяг типової групи;

- Обсяг генеральної сукупності.

Чисельність вибірки з кожної типової групи має бути пропорційна середньому квадратичному відхиленню цієї групи
.Розрахунок чисельності
провадиться за формулами, наведеними в табл. 7.8.

Таблиця 7.8

4 . Серійна вибірка – зручна у випадках, коли одиниці сукупності об'єднані в невеликі групи чи серії. При серійної вибірці генеральну сукупність поділяють однакові за обсягом групи – серії. У вибіркову сукупність відбираються серії. Сутність серійної вибірки полягає у випадковому чи механічному відборі серій, усередині яких проводиться суцільне обстеження одиниць. Середня помилка серійної вибірки з рівновеликими серіями залежить від величини міжгрупової дисперсії. Середні помилки зведені у табл. 7.9.

Таблиця 7.9

Спосіб відбору серії

для середньої

для частки

Повторний

Неповторний

Тут R- Число серій в генеральній сукупності;

r- Число відібраних серій;

- міжсерійна (міжгрупова) дисперсія середніх;

- міжсерійна (міжгрупова) дисперсія частки.

При серійному відборі необхідну чисельність серій, що відбираються визначають так само, як і при власне-випадковому методі відбору.

Розрахунок чисельності серійної вибірки проводиться у разі формулам, наведеним у табл. 7.10.

Таблиця 7.10

приклад.У механічному цеху заводу у десяти бригадах працює 100 робітників. З метою вивчення кваліфікації робітників була зроблена 20%-на серійна безповторна вибірка, до якої увійшли дві бригади. Отримано такий розподіл обстежених робітників за розрядами:

Розряди робітників у бригаді 1

Розряди робітників у бригаді 2

Розряди робітників у бригаді 1

Розряди робітників у бригаді 2

Необхідно визначити з ймовірністю 0,997 межі, у яких перебуває середній розряд робітників механічного цеху.

Рішення.Визначимо вибіркові середні за бригадами та загальну середню як середню зважену з групових середніх:

Визначимо міжсерійну дисперсію за формулами (5.25):

Розрахуємо середню помилку вибірки за такою формулою табл. 7.9:

Обчислимо граничну помилку вибірки з ймовірністю 0,997:

З ймовірністю 0,997 можна стверджувати, що середній розряд робітників механічного цеху знаходиться в межах