Біографії Характеристики Аналіз

Генеральна сукупність та вибірка зразок. Генеральна сукупність та вибірка

Сукупність однорідних об'єктів часто досліджують щодо будь-якої ознаки, що характеризує їх, виміряного кількісно чи якісно.

Наприклад, якщо є партія деталей, то кількісною ознакоюможе бути розмір деталі за ГОСТом, а якісним – стандартність деталі.

У разі потреби їх перевірки на відповідність стандартам іноді вдаються до суцільного обстеження, але на практиці це застосовується вкрай рідко. Наприклад, якщо генеральна сукупність містить велика кількістьдосліджуваних об'єктів, практично неможливо проводити суцільне обстеження. У такому разі з усієї сукупності відбирають певну кількість об'єктів (елементів) та їх досліджують. Таким чином, є генеральна та вибіркова сукупність.

Генеральною називають сукупність всіх об'єктів, що піддаються обстеженню чи вивченню. Генеральна сукупність, як правило, містить у собі кінцеве числоелементів, але якщо воно надто велике, то з метою спрощення математичних обчисленьдопускається, що вся сукупність складається з незліченної кількості об'єктів.

Вибіркою чи вибірковою сукупністю називається частина відібраних елементів із усієї сукупності. Вибірка може бути повторною чи безповторною. У першому випадку її повертають у генеральну сукупність, у другому – ні. У практичної діяльностіНайчастіше використовують безповторний випадковий відбір.

Генеральна сукупність та вибірка мають бути пов'язані між собою репрезентативністю. Інакше кажучи, щоб за характеристиками вибіркової сукупності можна було впевнено визначати ознаки всієї сукупності, треба, щоб елементи вибірки максимально точно їх представляли. Іншими словами, вибірка має бути представницькою (репрезентативною).

Вибірка буде більш менш репрезентативною, якщо вона проводиться випадково з дуже великої кількостівсієї сукупності. Це можна стверджувати з урахуванням так званого закону великих чисел. При цьому всі елементи мають рівну можливість потрапити у вибірку.

Є різні варіантивідбору. Всі ці методи в принципі можна поділити на два варіанти:

  • Варіант 1. Відбираються елементи, коли генеральна сукупність не поділяється на частини. До цього варіанту можна віднести простий випадковий повторний і біс повторний відбіры.
  • Варіант 2. Генеральна сукупність поділяється на частини та проводиться відбір елементів. Сюди можна віднести типовий, механічний та серійний відбори.

Простий випадковий - відбір, у якому елементи витягуються однією зі всієї сукупності випадковим чином.

Типовий - це відбір, у якому елементи відбираються не з усієї сукупності, та якщо з її «типових» елементів.

Механічний - це такий відбір, коли всю сукупність поділяють на кількість груп, що дорівнює кількості елементів, що має бути у вибірці, і, відповідно, з кожної групи вибирається один елемент. Наприклад, якщо треба відібрати 25% деталей, виготовлених верстатом, вибирають кожну четверту деталь, а якщо потрібно відібрати 4% деталей, то вибирають кожну двадцять п'яту деталь і так далі. При цьому слід сказати, що іноді механічний відбір може не забезпечувати достатньої

Серійний - це такий відбір, у якому елементи відбирають із усієї сукупності «серіями», що піддаються суцільному дослідженню, а чи не по одному. Наприклад, коли деталі виготовляються більшим числомверстатів-автоматів, то суцільне обстеження проводиться лише щодо продукції кількох верстатів. Серійний відбір використовують, якщо досліджувана ознака має незначну варіативність у різних серіях.

З метою зменшення похибки застосовують оцінки генеральної сукупності за допомогою вибіркової. Причому вибірковий контроль може бути як одноступінчастим, і багатоступінчастим, що підвищує надійність обстеження.

Генеральна сукупність- сукупність всіх об'єктів (одиниць), щодо яких вчений має намір робити висновки щодо конкретної проблеми. Генеральна сукупність складається із усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження. Іноді генеральна сукупність — це населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата), найчастіше задається кілька критеріїв, визначальних об'єкт дослідження. Наприклад, жінки 18-29 років, які використовують крем для рук певних марок не рідше одного разу на тиждень, і мають дохід не нижче $150 на одного члена сім'ї.

Вибірка- безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.

  1. Обсяг вибірки;
  2. Залежні та незалежні вибірки;
  3. Репрезентативність:
    1. приклад нерепрезентативної вибірки;
  4. Види плану побудови груп із вибірок;
  5. Стратегії побудови груп:
    1. Рандомізація;
    2. Попарний відбір;
    3. Стратометричний відбір;
    4. Наближене моделювання.

Обсяг вибірки- Число випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30-35.

Залежні та незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну ​​пару (тобто, коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця основа взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок: пари близнюків, два виміри будь-якої ознаки до і після експериментального впливу, чоловіки та дружини тощо.

У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними, наприклад: чоловіки та жінки, психологи та математики.

Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок здійснюється за допомогою різних статистичних критеріїв:

  • t-критерій Стьюдента;
  • T-критерій Вілкоксону;
  • U-критерій Манна-Уітні;
  • Критерій знаків та ін.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна.

Приклад нерепрезентативної вибірки

У США одним із найвідоміших історичних прикладівнерепрезентативної вибірки вважається випадок, що стався під час президентських виборів у 1936 році Журнал «Літрері Дайджест», який успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, людям, обраним по телефонних книгах усієї країни, та людям із реєстраційних списків автомобілів. У 25 % бюлетенів, що повернулися (майже 2,5 мільйона) голоси були розподілені наступним чином:

57% віддавали перевагу кандидату-республіканцю Альфу Лендону

40% обрали чинного на той час президента-демократа Франкліна Рузвельта

На дійсних виборах, як відомо, переміг Рузвельт, набравши більше 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, оскільки їм було відомо, що більшість їх передплатників вважають себе республіканцями, вони розширили вибірку за рахунок людей, вибраних з телефонних книг та реєстраційних списків. Однак вони не врахували сучасних їм реалій і насправді набрали ще більше республіканців: під час Великої депресії мати телефони та автомобілі могли собі дозволити в основному представники середнього та верхнього класу (тобто більшість республіканців, а не демократів).

Види плану побудови груп із вибірок

Виділяють кілька основних видів плану побудови груп:

  1. Дослідження з експериментальною та контрольною групами, які ставляться у різні умови;
  2. Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору;
  3. Дослідження з використанням лише однієї групи – експериментальної;
  4. Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.

Стратегії побудови груп

Відбір груп для їх участі в психологічний експериментздійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності:

  1. Рандомізація (випадковий відбір);
  2. Попарний відбір;
  3. Стратометричний відбір;
  4. наближене моделювання;
  5. Залучення реальних груп.

Рандомізація

Рандомізація, або випадковий вибір, використовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибіркузі 100 студентів ВНЗ, можна скласти папірці з іменами всіх студентів ВНЗ у капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором

Попарний відбір

Попарний відбір - стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних по значним експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з кращим варіантом - залученням близнюкових пар (моно-і дизиготних), оскільки дозволяє створити.

Стратометричний відбір

Стратометричний відбір – рандомізація з виділенням страт (або кластерів). При даному способіФормування вибірки генеральна сукупність ділиться на групи (страти), які мають певні характеристики (стаття, вік, політичні переваги, освіта, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.

Наближене моделювання

Наближене моделювання - складання обмежених вибірок та узагальнення висновків про цю вибірку більш широку популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Генеральна сукупність(В англ. - population) - сукупність всіх об'єктів (одиниць), щодо яких вчений має намір робити висновки щодо конкретної проблеми.

Генеральна сукупність складається із усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження. Іноді генеральна сукупність - це населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата), найчастіше задається кілька критеріїв, визначальних об'єкт дослідження. Наприклад, чоловіки 30-50 років, які використовують бритву певної марки не рідше одного разу на тиждень, і мають дохід не нижче $100 на одного члена сім'ї.

Вибіркаабо вибіркова сукупність- безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.

Характеристики вибірки:

 Якісна характеристика вибірки – кого саме ми вибираємо та які способи побудови вибірки ми для цього використовуємо.

 Кількісна характеристика вибірки – скільки випадків вибираємо, тобто обсяг вибірки.

Необхідність вибірки

 Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії – величезна кількість територіально розкиданих ринків.

 Існує необхідність збору первинної інформації.

Обсяг вибірки

Обсяг вибірки- Число випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30 – 35.

17. Основні способи формування вибірки

Формування вибіркиНасамперед ґрунтується на знанні контуру вибірки, під яким розуміється список усіх одиниць сукупності, з якого вибираються одиниці вибірки. Наприклад, якщо як сукупність розглядати всі автосервісні майстерні міста Москви, то треба мати список таких майстерень, що розглядається як контур, в межах якого формується вибірка.

Контур вибірки неминуче містить помилку, яка називається помилкою контуру вибірки і характеризує ступінь відхилення від справжніх розмірів сукупності. Вочевидь, що немає повно офіційного списку всіх автосервісних майстерень м. Москви. Дослідник повинен інформувати замовника роботи про розмір помилки контуру вибірки.

При формуванні вибірки використовуються імовірнісні (випадкові) та неймовірні (невипадкові) методи.

Якщо всі одиниці вибірки мають відомий шанс (імовірність) бути включеними у вибірку, то вибірка називається імовірнісною. Якщо ця можливість невідома, то вибірка називається неймовірною. На жаль, у більшості маркетингових досліджень через неможливість точного визначення розміру сукупності неможливо точно розрахувати ймовірності. Тому термін «відома ймовірність» скоріш грунтується на використанні певних методів формування вибірки, ніж знанні точних розмірів сукупності.

Імовірнісні методи включають:

Простий випадковий відбір;

Систематичний відбір;

кластерний відбір;

Стратифікований відбір.

Неймовірні методи:

Відбір з урахуванням принципу зручності;

Відбір з урахуванням суджень;

Формування вибірки у процесі опитування;

Формування вибірки з урахуванням квот.

Сенс методу відбору з урахуванням принципу зручності у тому, що формування вибірки здійснюється найзручнішим з позицій дослідника чином, наприклад з позицій мінімальних витрат часу і зусиль, з позицій доступності респондентів. Вибір місця дослідження та складу вибірки проводиться суб'єктивним чином, наприклад, опитування покупців здійснюється у магазині, найближчому до місця проживання дослідника. Очевидно, що багато представників сукупності не беруть участі в опитуванні.

Формування вибірки на основі судження ґрунтується на використанні думки кваліфікованих фахівців, експертів щодо складу вибірки. На основі такого підходу часто формується склад фокус-групи.

Формування вибірки в процесі опитування засноване на розширенні числа опитуваних, виходячи з пропозицій респондентів, які вже взяли участь в обстеженні. Спочатку дослідник формує вибірку набагато меншу, ніж потрібно для дослідження, потім у міру проведення розширюється.

Формування вибірки з урахуванням квот (квотний відбір) передбачає попереднє, з цілей дослідження, визначення чисельності груп респондентів, відповідальних певним вимогам (ознакам). Наприклад, з метою дослідження було ухвалено рішення, що в універмазі має бути опитано п'ятдесят чоловіків та п'ятдесят жінок. Інтерв'юер проводить опитування, доки не вибере встановлену квоту.

Розподіл випадкової величинимістить всю інформацію про неї статистичних властивостях. Чи багато знати значень випадкової величини, щоб побудувати її розподіл? Для цього слід досліджувати її генеральну сукупність.

Генеральна сукупність - безліч всіх значень, які може набувати дана випадкова величина.

Число одиниць у генеральній сукупності називається її обсягом N. Ця величина може бути кінцевою та нескінченною. Наприклад, якщо досліджується зростання мешканців деякого міста, то обсяг генеральної сукупності буде дорівнює числумешканців міста. Якщо виконується будь-який фізичний експеримент, Обсяг генеральної сукупності буде нескінченним, т.к. число всіх можливих значень будь-якого фізичного параметраі нескінченності.

Дослідження генеральної сукупності який завжди можливе і доцільно. Воно неможливе, якщо обсяг генеральної сукупності нескінченний. Але й за кінцевих обсягів повне дослідженняне завжди виправдано, оскільки потребує великих витрат часу та праці, а абсолютна точність результатів зазвичай не потрібна. Менш точні результати, але із значно меншими витратами сил і коштів можна одержати щодо лише частини генеральної сукупності. Такі дослідження називаються вибірковими.

Статистичні дослідження, що проводяться тільки на частині генеральної сукупності, називаються вибірковими, а частина генеральної сукупності, що досліджується, називається вибіркою.

На малюнку 7.2 символічно показані генеральна сукупність та вибірка у вигляді множини та її підмножини.

Малюнок 7.2 Генеральна сукупність та вибірка

Працюючи з деяким підмножиною даної генеральної сукупності, що часто становить незначну її частину, ми отримуємо результати, за цілком цілком задовільні для практичних цілей. Дослідження здебільшого генеральної сукупності лише збільшує точність, але з змінює суті результатів, якщо вибірка взято правильно зі статистичної погляду.

Для того, щоб вибірка відображала властивості генеральної сукупності та результати були достовірними, вона має бути репрезентативної(представницькою).

У деяких генеральних сукупностей будь-яка їх частина є репрезентативною через їхню природу. Однак у більшості випадків необхідно вживати спеціальних заходів для забезпечення репрезентативності вибірок.

Однимз головних досягнень сучасної математичної статистикивважається розробка теорії та практики методу випадкових вибірок, що забезпечують репрезентативність відбору даних.

Вибіркові дослідження завжди програють точно порівняно з дослідженням всієї генеральної сукупності. Однак з цим можна змиритися, якщо величина похибки буде відомою. Очевидно, що чим більший обсяг вибірки наближатиметься до обсягу генеральної сукупності, тим похибка буде меншою. Звідси ясно, що проблеми статистичного висновку стають особливо актуальними під час роботи з малими вибірками ( N ? 10-50).

Весь масив особин певної категорії називається генеральною сукупністю. Обсяг генеральної сукупності визначається завданнями дослідження.

Якщо вивчається якийсь вид диких тварин чи рослин, то генеральною сукупністю будуть усі особини цього виду. У даному випадкуобсяг генеральної сукупності буде дуже великий і за розрахунках він приймається за нескінченно більшу величину.

Якщо вивчається дія якого-небудь агента на рослини та тварин певної категорії, то генеральною сукупністю будуть усі рослини та тварини тієї категорії (виду, статі, віку, господарського призначення), до якої належали піддослідні об'єкти. Це вже не дуже велика кількістьособин, але ще недоступний для суцільного вивчення.

Не завжди обсяг генеральної сукупності недоступний для суцільного дослідження. Іноді вивчаються невеликі сукупності, наприклад, визначається середній надій або середній настриг вовни у групи тварин, закріплених за певним працівником. У таких випадках генеральною сукупністю буде зовсім невелика кількість особин, які досліджуються. Невелика генеральна сукупність зустрічається також при дослідженні рослин або тварин, що є в якійсь колекції, з метою характеристики певної групиу цій колекції.

Характеристики групових властивостей (і т. д.), які стосуються всієї генеральної сукупності, називаються генеральними параметрами.

Вибірка - група об'єктів, що відрізняються трьома особливостями:

1 це частина генеральної сукупності;

2 відібрана у випадковому порядку, певним чином;

3 досліджувана для характеристики всієї генеральної сукупності.

Щоб за вибіркою можна було отримати досить точну характеристику всієї генеральної сукупності, необхідно організувати правильний відбір об'єктів з генеральної сукупності.

Теорією та практикою розроблено кілька систем відбору особин у вибірку. В основу цих систем покладено прагнення забезпечити максимальну можливість вибору будь-якого об'єкта з генеральної сукупності. Тенденційність, упередженість при відборі об'єктів для вибіркового дослідженняперешкоджають отриманню правильних загальних висновків, роблять результати вибіркового дослідження непоказовими для всієї генеральної сукупності, тобто нерепрезентативними.

Для отримання правильної, неспотвореної характеристики всієї генеральної сукупності необхідно прагнути забезпечити можливість добору будь-якого об'єкта з будь-якої частини генеральної сукупності. Ця основна вимога повинна виконуватися тим суворіше, чим більш мінлива ознака, що вивчається. Цілком зрозуміло, що при різноманітності, що наближається до нуля, наприклад, у разі вивчення кольору волосся або пір'я деяких видів, будь-який спосіб відбору вибірки дасть репрезентативні результати.

У різних дослідженнях застосовуються наступні способивідбору об'єктів у вибірку.

4 Випадковий повторний відбір, при якому об'єкти вивчення відбираються з генеральної сукупності без попереднього обліку розвитку у них ознаки, що вивчається, тобто у випадковому (для даної ознаки) порядку; після відбору кожен об'єкт вивчається і потім повертається у свою генеральну сукупність, отже будь-який об'єкт може потрапити повторно вибірку. Такий спосіб відбору дорівнює відбору з нескінченно великої генеральної сукупності, для якого розроблені основні показники взаємовідносин між вибірковими та генеральними величинами.

5 Випадковий безповторний відбір, у якому об'єкти, відібрані, як й у попередньому способі, випадково, не повертаються у генеральну сукупність і можуть повторно потрапити у вибірку. Це найпоширеніший спосіб організації вибірки; він рівносильний відбору з великої, але обмеженої генеральної сукупності, що враховується щодо генеральних показників по выборочным.

6 Механічний відбір, у якому виробляється відбір об'єктів із окремих частин генеральної сукупності, причому ці частини попередньо намічаються механічно по квадратам дослідного поля, по випадковим групам тварин, взятих із різних ареалів популяції тощо. буд. Зазвичай намічається стільки таких частин, скільки передбачається взяти об'єктів вивчення, тому число елементів буває дорівнює чисельності вибірки. Механічний відбір іноді здійснюється вибором для вивчення особин через певне число, наприклад при пропусканні тварин через розкол і відборі кожного десятого, сотого і т. д., або при взятті укосу через кожні 100 або 200 м, або відборі одного об'єкта через котрі 10, що зустрілися, 100 і т. д. екземплярів для дослідження всієї популяції.

8 Серійний (гніздовий) відбір, у якому генеральна сукупність розбивається на частини – серії, деякі з них досліджуються повністю. Застосовується цей спосіб успішно у випадках, коли досліджувані об'єкти досить рівномірно розподілені у певному обсязі чи певної території. Наприклад, для дослідження зараженості повітря чи води мікроорганізмами беруть проби, які піддаються суцільному дослідженню. У деяких випадках гніздовим способом можуть бути обстежені сільськогосподарські об'єкти. При вивченні виходів м'яса та інших продуктів переробки м'ясної породи худоби у вибірку можна взяти всіх тварин цієї породи, що надійшли на два-три м'ясокомбінати. При вивченні величини яйця у колгоспному птахівництві можна у кількох колгоспах провести вивчення цієї ознаки у всього поголів'я курей.

Характеристики групових властивостей (μ, sі т. д.), отримані для вибірки, називаються вибірковими показниками.

Репрезентативність

Безпосереднє вивчення групи відібраних об'єктів дає насамперед первинний матеріал і характеристику самої вибірки.

Усі вибіркові дані та зведені показники мають значення як первинні факти, розкриті дослідженням і підлягають ретельному розгляду, аналізу та зіставленню з результатами інших робіт. Але цим не обмежується процес вилучення інформації, закладений у первинних матеріалахдослідження.

Та обставина, що об'єкти відбиралися у вибірку спеціальними прийомами й у достатній кількості, робить результати вивчення вибірки показовими як для самої вибірки, але й у всій генеральної сукупності, з якої взята ця вибірка.

Вибірка за певних умов стає більш менш точним відображенням всієї генеральної сукупності. Ця властивість вибірки називається репрезентативністю, що означає представництво з певною точністю та надійністю.

Як і будь-яка властивість, репрезентативність вибіркових даних може бути виражена достатньою або недостатньою мірою. У першому випадку у вибірці виходять достовірні оцінки генеральних параметрів, у другому недостовірні. Важливо пам'ятати, що отримання недостовірних оцінок не применшує значення вибіркових показників характеристики самої вибірки. Отримання достовірних оцінок розширює область застосування досягнень, отриманих при вибірковому дослідженні.