Біографії Характеристики Аналіз

Генеральна сукупність випадкова та природна вибірки. Генеральна сукупність та вибірковий метод

Генеральна сукупність (В англ. - population) - сукупність всіх об'єктів (одиниць), щодо яких вчений має намір робити висновки щодо конкретної проблеми.

Генеральна сукупність складається із усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження. Іноді генеральна сукупність - це населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата), найчастіше задається кілька критеріїв, визначальних об'єкт дослідження. Наприклад, чоловіки 30-50 років, які використовують бритву певної марки не рідше одного разу на тиждень, і мають дохід не нижче $100 на одного члена сім'ї.

Вибіркаабо вибіркова сукупність- безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.

Характеристики вибірки:

· Якісна характеристика вибірки – кого саме ми вибираємо та які способи побудови вибірки ми для цього використовуємо.

· Кількісна характеристика вибірки – скільки випадків вибираємо, тобто обсяг вибірки.

Необхідність вибірки

· Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії – величезна кількість територіально розкиданих ринків.

· Існує потреба у зборі первинної інформації.

Обсяг вибірки

Обсяг вибірки- Число випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30 – 35.

Залежні та незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну ​​пару (тобто коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця підстава взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:

· пари близнюків,

· два виміри будь-якої ознаки до і після експериментального впливу,

· чоловіки та дружини

· і т.п.

Якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад:

· чоловіки та жінки,

· психологи та математики.

Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок здійснюється за допомогою різних статистичних критеріїв:

· t-критерій Стьюдента

· Критерій Вілкоксона

· U-критерій Манна-Уітні

· Критерій знаків

· та ін.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна.

Приклад нерепрезентативної вибірки

У США одним із найвідоміших історичних прикладів нерепрезентативної вибірки вважається випадок, що стався під час президентських виборів у 1936 році. Журнал «Літрері Дайджест», який успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, а також людям, обраним за телефонними книгами всієї країни та людям із реєстраційних списків автомобілів. У 25 % бюлетенів, що повернулися (майже 2,5 мільйона) голоси були розподілені наступним чином:

· 57% віддавали перевагу кандидату-республіканцю Альфу Лендону

· 40% обрали чинного на той час президента-демократа Франкліна Рузвельта

На дійсних виборах, як відомо, переміг Рузвельт, набравши більше 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, оскільки їм було відомо, що більшість їх передплатників вважають себе республіканцями, вони розширили вибірку за рахунок людей, вибраних з телефонних книг та реєстраційних списків. Однак вони не врахували сучасних їм реалій і насправді набрали ще більше республіканців: під час Великої депресії мати телефони та автомобілі могли собі дозволити в основному представники середнього та вищого класу (тобто більшість республіканців, а не демократів).

Види плану побудови груп із вибірок

Виділяють кілька основних видів плану побудови груп:

1. Дослідження з експериментальною та контрольною групами, які ставляться у різні умови.

2. Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору

3. Дослідження з використанням лише однієї групи – експериментальної.

4. Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.

Типи вибірки

Вибірки поділяються на два типи:

· імовірнісні

· неймовірні

Імовірнісні вибірки

1. Проста ймовірнісна вибірка:

oПроста повторна вибірка. Використання такої вибірки ґрунтується на припущенні, що кожен респондент з часткою ймовірності може потрапити у вибірку. За підсумками списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і їх навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки разів, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.

Процедура побудови простої випадкової вибірки включає наступні кроки:

1. необхідно отримати повний список членів генеральної сукупності та пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;

2. визначити очікуваний обсяг вибірки, тобто очікуване число опитаних;

3. Витягти з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має бути 100 людина, з таблиці беруть 100 випадкових чисел. Ці випадкові числа можуть генеруватись комп'ютерною програмою.

4. вибрати зі списку-основи спостереження, номери яких відповідають виписаним випадковим числам

· Проста випадкова вибірка має очевидні переваги. Цей метод дуже простий для розуміння. Результати дослідження можна поширювати на сукупність, що вивчається. Більшість підходів до отримання статистичних висновків передбачають збирання інформації за допомогою простої випадкової вибірки. Однак метод простої випадкової вибірки має як мінімум чотири суттєві обмеження:

1. часто складно створити основу вибіркового спостереження, яка б провести просту випадкову вибірку.

2. результатом застосування простої випадкової вибірки може стати більша сукупність, або сукупність, розподілена на великій географічній території, що значно збільшує час і вартість збору даних.

3. результати застосування простої випадкової вибірки часто характеризуються низькою точністю та більшою стандартною помилкою, ніж результати застосування інших ймовірнісних методів.

4. в результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють сукупність, що вивчається. Імовірність цього особливо велика за невеликого обсягу вибірки.

· Проста неповторна вибірка. Процедура побудови вибірки така сама, тільки картки з номерами респондентів не повертаються назад у колоду.

1. Систематична імовірнісна вибірка. Є спрощеним варіантом простої імовірнісної вибірки. За підсумками списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Розмір До визначається випадково. Найбільш достовірний результат досягається при однорідній генеральній сукупності, інакше можливі збіг величини кроку та якихось внутрішніх циклічних закономірностей вибірки (змішування вибірки). Мінуси: такі ж, як і в простій імовірнісній вибірці.

2. Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (сім'я, школа, бригада тощо). Відібрані елементи зазнають суцільного обстеження. Відбір статистичних одиниць може бути організований на кшталт випадкової чи систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.

3. Районована вибірка. У разі неоднорідної генеральної сукупності, перш ніж використовувати ймовірнісну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районованою. Групами районування можуть бути як природні освіти (наприклад, райони міста), і будь-який ознака, закладений основою дослідження. Ознака, на основі якої здійснюється поділ, називається ознакою розшарування та районування.

4. «Зручна» вибірка. Процедура «зручної» вибірки полягає у встановленні контактів із «зручними» одиницями вибірки – з групою студентів, спортивною командою, з друзями та сусідами. Якщо необхідно отримати інформацію про реакцію людей на нову концепцію, така вибірка цілком обґрунтована. «Зручну» вибірку часто використовують із попереднього тестування анкет.

Неймовірні вибірки

Відбір у такій вибірці здійснюється за принципами випадковості, а, по суб'єктивним критеріям – доступності, типовості, рівного представництва тощо.

1. Квотна вибірка – вибірка будується як модель, яка відтворює структуру генеральної сукупності як квот (пропорцій) досліджуваних ознак. Число елементів вибірки з різним поєднанням ознак, що вивчаються, визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена ​​5000 чоловік, з них 2000 жінок та 3000 чоловіків, тоді у квотній вибірці у нас будуть 20 жінок та 30 чоловіків, або 200 жінок та 300 чоловіків. Квотовані вибірки найчастіше ґрунтуються на демографічних умовах: стать, вік, регіон, дохід, освіта та інші. Мінуси: зазвичай такі вибірки нерепрезентативні, т.к. не можна врахувати відразу кілька соціальних параметрів. Плюси: доступний матеріал.

2. Спосіб снігового кома. Вибірка будується в такий спосіб. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які б підходили під умови відбору і могли б взяти участь у дослідженні. Отже, крім першого кроку, вибірка формується з участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти та опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, що належать до однієї професійної групи, респондентів, які мають схожі хобі/захоплення тощо)

3. Стихійна вибірка - вибірка так званого "першого зустрічного". Часто використовується в теле- та радіоопитуваннях. Розмір та склад стихійних вибірок заздалегідь не відомий, і визначається лише одним параметром – активністю респондентів. Мінуси: неможливо встановити якусь генеральну сукупність представляють опитані, і як наслідок – неможливість визначити репрезентативність.

4. Маршрутне опитування часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, в якому опитуватиметься, нумеруються всі вулиці. З допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожне велике число розглядається як 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 – це номер вулиці на карті, 8 – номер будинку, 32 – номер квартири.

5. Районована вибірка із відбором типових об'єктів. Якщо після районування кожної групи відбирається типовий об'єкт, тобто. об'єкт, який переважно досліджуваних у дослідженні показників наближається до середніх показників, така вибірка називається районованої з відбором типових об'єктів.

Стратегії побудови груп

Відбір груп для їхньої участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності.

· Рандомізація (випадковий відбір)

· Попарний відбір

· Стратометричний відбір

· Наближене моделювання

· Залучення реальних груп

Рандомізація, або випадковий відбірвикористовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором (Гудвін Дж., с. 147).

Попарний відбір- стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних за значними експерименту побічним параметрам. Ця стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з кращим варіантом - залученням близнюкових пар (моно- та дизиготних), оскільки дозволяє створити...

Стратометричний відбір - рандомізація із виділенням страт (чи кластерів). При цьому способі формування вибірки генеральна сукупність ділиться на групи (страти), які мають певні характеристики (стаття, вік, політичні переваги, освіту, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.

Наближене моделювання - Складання обмежених вибірок та узагальнення висновків про цю вибірку на ширшу популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Наближене моделювання – формування моделі, яка чітко обумовленого класу систем (процесів) визначає його поведінка (чи необхідні явища) з прийнятною точністю.

Сукупність однорідних об'єктів часто досліджують щодо будь-якої ознаки, що характеризує їх, виміряного кількісно чи якісно.

Наприклад, якщо є партія деталей, то кількісним ознакою то, можливо розмір деталі по ГОСТу, а якісним - стандартність деталі.

У разі потреби їх перевірки на відповідність стандартам іноді вдаються до суцільного обстеження, але на практиці це застосовується вкрай рідко. Наприклад, якщо генеральна сукупність містить дуже багато досліджуваних об'єктів, практично неможливо проводити суцільне обстеження. У такому разі з усієї сукупності відбирають певну кількість об'єктів (елементів) та їх досліджують. Таким чином, є генеральна та вибіркова сукупність.

Генеральною називають сукупність всіх об'єктів, що піддаються обстеженню чи вивченню. Генеральна сукупність, як правило, містить у собі кінцеве число елементів, але якщо воно надто велике, то з метою спрощення математичних обчислень допускається, що вся сукупність складається з незліченної кількості об'єктів.

Вибіркою чи вибірковою сукупністю називається частина відібраних елементів із усієї сукупності. Вибірка може бути повторною чи безповторною. У першому випадку її повертають у генеральну сукупність, у другому – ні. У практичній діяльності найчастіше використовують безповторний випадковий відбір.

Генеральна сукупність та вибірка мають бути пов'язані між собою репрезентативністю. Інакше кажучи, щоб за характеристиками вибіркової сукупності можна було впевнено визначати ознаки всієї сукупності, треба, щоб елементи вибірки максимально точно їх представляли. Іншими словами, вибірка має бути представницькою (репрезентативною).

Вибірка буде більш менш репрезентативною, якщо вона проводиться випадково з дуже великої кількості всієї сукупності. Це можна стверджувати з урахуванням так званого закону великих чисел. При цьому всі елементи мають рівну можливість потрапити у вибірку.

Є різні варіанти відбору. Всі ці методи в принципі можна поділити на два варіанти:

  • Варіант 1. Відбираються елементи, коли генеральна сукупність не поділяється на частини. До цього варіанту можна віднести простий випадковий повторний та безповторний відбори.
  • Варіант 2. Генеральна сукупність поділяється на частини та проводиться відбір елементів. Сюди можна віднести типовий, механічний та серійний відбори.

Простий випадковий - відбір, у якому елементи витягуються однією зі всієї сукупності випадковим чином.

Типовий - це відбір, у якому елементи відбираються не з усієї сукупності, та якщо з її «типових» елементів.

Механічний - це такий відбір, коли всю сукупність поділяють на кількість груп, що дорівнює кількості елементів, що має бути у вибірці, і, відповідно, з кожної групи вибирається один елемент. Наприклад, якщо треба відібрати 25% деталей, виготовлених верстатом, вибирають кожну четверту деталь, а якщо потрібно відібрати 4% деталей, то вибирають кожну двадцять п'яту деталь і так далі. При цьому слід сказати, що іноді механічний відбір може не забезпечувати достатньої

Серійний - це такий відбір, у якому елементи відбирають із усієї сукупності «серіями», що піддаються суцільному дослідженню, а чи не по одному. Наприклад, коли деталі виготовляються великою кількістю верстатів-автоматів, то суцільне обстеження проводиться лише щодо продукції кількох верстатів. Серійний відбір використовують, якщо досліджувана ознака має незначну варіативність у різних серіях.

З метою зменшення похибки застосовують оцінки генеральної сукупності за допомогою вибіркової. Причому вибірковий контроль може бути як одноступінчастим, і багатоступінчастим, що підвищує надійність обстеження.

У попередньому розділі нас цікавила розподіл ознаки у певній сукупності елементів. Сукупність, яка поєднує всі елементи, що має цю ознаку, називається генеральною. Якщо ознака людська (національність, освіта, коефіцієнт IQ тощо), то генеральна сукупність - все людство. Це дуже велика сукупність, тобто кількість елементів у сукупності n велика. Число елементів називається обсягом сукупності. Сукупності можуть бути кінцевими та нескінченними. Генеральна сукупність - всі люди хоч і дуже велика, але, звичайно, кінцева. Генеральна сукупність – усі зірки, напевно, нескінченно.

Якщо дослідник проводить вимір деякої безперервної випадкової величини X, кожен результат виміру вважатимуться елементом деякої гіпотетичної необмеженої генеральної сукупності. У цій генеральній сукупності незліченну кількість результатів розподілено за ймовірністю під впливом похибок у приладах, неуважності експериментатора, випадкових перешкод у самому явищі та ін.

Якщо ми проведемо n повторних вимірів випадкової величини Х, тобто отримаємо n конкретних різних чисельних значень, цей результат експерименту вважатимуться вибіркою обсягу n з гіпотетичної генеральної сукупності результатів одиничних вимірів.

Природно вважати, що дійсним значенням величини, що вимірюється, є середнє арифметичне від результатів. Ця функція від n результатів вимірювань називається статистикою, і вона сама є випадковою величиною, що має деякий розподіл, що називається вибірковим розподілом. Визначення вибіркового розподілу тієї чи іншої статистики - найважливіше завдання статистичного аналізу. Зрозуміло, що це розподіл залежить від обсягу вибірки n і зажадав від розподілу випадкової величини Х гіпотетичної генеральної сукупності. Вибірковий розподіл статистики є розподілом Х q в нескінченній сукупності всіх можливих вибірок обсягу n з вихідної генеральної сукупності.

Можна проводити вимірювання та дискретної випадкової величини.

Нехай вимір випадкової величини Х є киданням правильної однорідної трикутної піраміди, на гранях якої написані числа 1, 2, 3, 4. Дискретна, випадкова величина Х має простий рівномірний розподіл:

Експеримент можна робити необмежену кількість разів. Гіпотетичною теоретичною генеральною сукупністю є нескінченна сукупність, в якій є однакові частки (по 0.25) чотирьох різних елементів, позначених цифрами 1, 2, 3, 4. Серія n повторних кидань піраміди або одночасне кидання n однакових пірамід можна розглядати як вибір n цієї генеральної сукупності. В результаті експерименту маємо n чисел. Можна запровадити деякі функції цих величин, які називаються статистиками, можуть бути пов'язані з певними параметрами генерального розподілу.

Найважливішими числовими характеристиками розподілів є ймовірності Р i , математичне очікування М, дисперсія D. Статистиками для ймовірностей Р i є відносні частоти, де n i - Частота результату i (i = 1,2,3,4) у вибірці. Математичного очікування М відповідає статистика

яка називається вибірковим середнім. Вибіркова дисперсія

відповідає генеральній дисперсії D.

Відносна частота будь-якої події (i=1,2,3,4) у серіях з n повторних випробувань (або вибірках обсягу n з генеральної сукупності) матиме біномне розподіл.

У цього розподілу математичне очікування дорівнює 0.25 (не залежить від n), а середнє квадратичне відхилення одно (швидко зменшується зі зростанням n). Розподіл є вибірковим розподілом статистики, відносна частота будь-якого з чотирьох можливих результатів одиничного кидання піраміди в повторних n випробуваннях. Якби ми вибрали з нескінченної, генеральної сукупності, в якій чотири різні елементи (i=1,2,3,4) мають рівні частки по 0.25, всі можливі вибірки обсягом n (їх число також нескінченно), то отримали б так звану математичну вибірку обсягу n. У цій вибірці кожен із елементів (i=1,2,3,4) розподілено за біноміальним законом.

Допустимо, ми виконали кидання цієї піраміди, і число двійки випало 3 рази (). Ми можемо знайти можливість цього результату, використовуючи вибірковий розподіл. Вона дорівнює

Наш результат виявився вельми малоймовірним; у серії із двадцяти чотирьох кратних кидань він зустрічається приблизно один раз. У біології такий результат зазвичай вважається практично неможливим. В цьому випадку у нас з'явиться сумнів: є піраміда правильною і однорідною, чи справедливо при одному киданні рівність, чи правильний розподіл і, отже, вибірковий розподіл.

Щоб вирішити сумнів, треба виконати ще один раз чотириразове кидання. Якщо знову з'явиться результат, то ймовірність двох результатів дуже мала. Зрозуміло, що ми отримали практично неможливий результат. Тому вихідний розподіл неправильний. Очевидно, що, якщо другий результат виявиться ще малоймовірнішим, то є ще більше підстав розібратися з цією "правильною" пірамідою. Якщо ж результат повторного експерименту буде і тоді можна вважати, що піраміда правильна, а перший результат (), теж вірний, але просто малоймовірний.

Нам можна було і не займатися перевіркою правильності та однорідності піраміди, а вважати апріорі піраміду правильною та однорідною, і, отже, правильним вибірковий розподіл. Далі слід з'ясувати, що дає знання вибіркового розподілу на дослідження генеральної сукупності. Але оскільки встановлення вибіркового розподілу є основним завданням статистичного дослідження, докладний опис експериментів із пірамідою можна вважати виправданим.

Вважатимемо, що вибірковий розподіл правильний. Тоді експериментальні значення відносної частоти різних серіях по n кидань піраміди будуть групуватися близько значення 0.25, що є центром вибіркового розподілу і точним значенням оцінюваної ймовірності. І тут кажуть, що відносна частота є незміщеною оцінкою. Оскільки, вибіркова дисперсія прагнути до нуля зі зростанням n, то експериментальні значення відносної частоти дедалі більше групуватимуться біля математичного очікування вибіркового розподілу зі зростанням обсягу вибірки. Тому є спроможною оцінкою ймовірності.

Якби піраміда виявилася направильною та неоднорідною, то вибіркові розподіли для різних (i=1,2,3,4) мали б відмінні математичні очікування (різні) та дисперсії.

Зазначимо, що отримані тут біномні вибіркові розподіли при великих n() добре апроксимуються нормальним розподілом з параметрами і, що значно спрощує розрахунки.

Продовжимо випадковий експеримент - кидання правильної, однорідної, трикутної піраміди. Випадкова величина Х, пов'язана з цим досвідом, має розподіл. Математичне очікування тут одно

Проведемо n кидань, що еквівалентно випадковій вибірці обсягу n з гіпотетичної, нескінченної, генеральної сукупності, що містить рівні частки (0.25) чотирьох різних елементів. Отримаємо n вибіркових значень випадкової величини Х(). Виберемо статистику, яка є вибірковим середнім. Величина сама є випадковою величиною, що має деякий розподіл, що залежить від обсягу вибірки та розподілу вихідної, випадкової величини Х. Величина є усередненою сумою n однакових випадкових величин (тобто з однаковим розподілом). Зрозуміло, що

Тому статистика є незміщеною оцінкою математичного очікування. Вона є також заможною оцінкою, оскільки

Таким чином, теоретичний вибірковий розподіл має також математичне очікування, що й у вихідного розподілу дисперсія зменшена в n разів.

Нагадаємо, що дорівнює

Математична, абстрактна нескінченна вибірка, пов'язана з вибіркою обсягу n з генеральної сукупності та з введеною статистикою міститиме в нашому випадку елементів. Наприклад, якщо в математичній вибірці будуть елементи зі значеннями статистики. Усього елементів буде 13. Частка крайніх елементів у математичній вибірці буде мінімальною, тому що результати і мають ймовірності рівні. Серед безлічі елементарних результатів чотирьох кратного кидання піраміди є лише по одному сприятливому і. При наближенні статистик до середніх значень ймовірності зростатимуть. Наприклад, значення реалізуватиметься при елементарних наслідках, і т. д. Відповідно зросте і частка елемента 1.5 в математичній вибірці.

Середнє значення матиме максимальну ймовірність. Зі зростанням n експериментальні результати будуть групуватися близько середнього значення. Те, що середнє вибіркового середнього дорівнює середньому початковій сукупності часто використовується в статистиці.

Якщо виконати розрахунки ймовірностей у вибірковому розподілі, то можна переконатися, що вже при такому невеликому значенні n вибірковий розподіл буде виглядати як нормальний. Воно буде симетричним, у якому значення буде медіаною, модою та математичним очікуванням. Зі зростанням n воно добре апроксимується відповідним нормальним навіть, якщо вихідний розподіл прямокутний. Якщо ж вихідний розподіл є нормальним, то розподіл є розподілом Стьюдента за будь-якого n.

Для оцінки генеральної дисперсії необхідно вибрати складнішу статистику, яка дає незміщену та заможну оцінку. У вибірковому розподілі для S 2 математичне очікування рівне, а дисперсія. При більших обсягах вибірок вибірковий розподіл вважатимуться нормальним. При малих n і нормальному вихідному розподілі вибірковий розподіл S 2 буде ч 2 _розподіл.

Вище ми спробували представити перші кроки дослідника, який намагається провести простий статистичний аналіз повторних експериментів із правильною однорідною трикутною призмою (тетраедром). У цьому випадку нам відомий вихідний розподіл. Можна в принципі теоретично отримати і вибіркові розподіли відносної частоти, вибіркової середньої та вибіркової дисперсії в залежності від числа повторних дослідів n. При великих n всі ці вибіркові розподіли наближатимуться до відповідних нормальних розподілів, оскільки вони є законами розподілу сум незалежних випадкових величин (центральна гранична теорема). Таким чином, нам відомі очікувані результати.

Повторні експерименти чи вибірки дадуть оцінки параметрів вибіркових розподілів. Ми стверджували, що експериментальні оцінки будуть правильними. Ми не виконували ці експерименти і навіть не наводили результатів дослідів, отриманих іншими дослідниками. Можна наголосити, що з визначенні законів розподілів теоретичні методи використовуються частіше, ніж прямі експерименти.

У математичній статистиці виділяють два фундаментальні поняття: генеральна сукупність та вибірка.
Сукупністю - називається практично лічильне безліч деяких об'єктів або елементів, що цікавлять дослідника;
Властивістю сукупності називається реальна або уявна якість, властива деяким усім її елементам. Властивість може бути випадковою або невипадковою.
Параметром сукупності називається властивість, яку можна квантифікувати як константи чи змінної величини.
Проста сукупність характеризується:
окремою властивістю (наприклад: усі студенти Росії);
окремим параметром у вигляді константи чи змінної (всі студенти жіночої статі);
системою непересічних (неспільних) якостей, наприклад: Усі вчителі та учні шкіл м. Владивостока.
Складна сукупність характеризується:
системою, хоча б частково перетинаються властивостей (Студенти психологічного та математичних факультетів ДВГУ, які закінчили школу із золотою медаллю);
системою параметрів незалежних та залежних у сукупності; при комплексному вивченні особистості.
Гомогенною або однорідною називається сукупність, всі характеристики якої притаманні кожному її елементу;
Гетерогенною чи неоднорідною називається сукупність, характеристики якої зосереджені в окремих підмножинах елементів.
Важливим параметром є обсяг сукупності - кількість елементів, що її утворюють. Величина обсягу залежить від цього, як визначено сама сукупність, і які питання нас цікавлять. Допустимо нас цікавить емоційний стан студента 1-го курсу в період складання конкретного іспиту у сесію. Тоді генеральна сукупність вичерпується протягом півгодини. Якщо нас цікавить емоційний стан усіх студентів 1-го курсу, то сукупність буде набагато більшою, і ще більшою, якщо взяти емоційний стан усіх студентів 1-го курсу даного вузу і т.д. Зрозуміло, що сукупності великого обсягу можна досліджувати лише вибірковим шляхом.
Вибірка називається деяка частина генеральної сукупності, те, що безпосередньо вивчається.
Вибірки класифікуються за репрезентативністю, обсягом, способом відбору та схемою випробувань.
Репрезентативна - вибірка адекватно відображає генеральну сукупність у якісному та кількісному відношенні. Вибірка має адекватно відображати генеральну сукупність, інакше результати не співпадуть із метою дослідження.
Репрезентативність залежить від обсягу, чим більший обсяг, тим вибірка репрезентативніша. За способом відбору.
Випадкова – якщо елементи відбираються випадковим чином. Так як більшість методів математичної статистики ґрунтується на понятті випадкової вибірки, то природно вибірка має бути випадковою.
Невипадкова вибірка:
механічний відбір, коли вся сукупність ділиться на стільки частин, скільки одиниць планується у вибірці і потім із кожної частини відбирається один елемент;
типовий відбір - сукупність ділиться на гомогенні частини, і з кожної здійснюється довільна вибірка;
серійний відбір - сукупність ділять на велику кількість різновеликих серій, потім роблять вибірку однієї серії;
комбінований відбір - поєднуються аналізовані види відбору, різних етапах.
За схемою випробувань - вибірки можуть бути незалежними та залежними. За обсягом вибірки ділять на малі та великі. До малих відносять вибірки, у яких кількість елементів n 200 і середня вибірка задовольняє умові 30Малі вибірки використовуються при статистичному контролі відомих властивостей вже вивчених сукупностей.
Великі вибірки використовуються для встановлення невідомих властивостей та параметрів сукупності.

Ще на тему 1.3. Генеральна сукупність та вибірка:

  1. 7.2 Характеристики вибіркової та генеральної сукупності
  2. 1.6. Точкова та інтервальна оцінки коефіцієнтів кореляції нормально розподіленої генеральної сукупності

Генеральна сукупність- сукупність всіх об'єктів (одиниць), щодо яких вчений має намір робити висновки щодо конкретної проблеми. Генеральна сукупність складається із усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження. Іноді генеральна сукупність — це населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата), найчастіше задається кілька критеріїв, визначальних об'єкт дослідження. Наприклад, жінки 18-29 років, які використовують крем для рук певних марок не рідше одного разу на тиждень, і мають дохід не нижче $150 на одного члена сім'ї.

Вибірка- безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.

  1. Обсяг вибірки;
  2. Залежні та незалежні вибірки;
  3. Репрезентативність:
    1. приклад нерепрезентативної вибірки;
  4. Види плану побудови груп із вибірок;
  5. Стратегії побудови груп:
    1. Рандомізація;
    2. Попарний відбір;
    3. Стратометричний відбір;
    4. Наближене моделювання.

Обсяг вибірки- Число випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30-35.

Залежні та незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну ​​пару (тобто, коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця основа взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок: пари близнюків, два виміри будь-якої ознаки до і після експериментального впливу, чоловіки та дружини тощо.

У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними, наприклад: чоловіки та жінки, психологи та математики.

Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок здійснюється за допомогою різних статистичних критеріїв:

  • t-критерій Стьюдента;
  • T-критерій Вілкоксону;
  • U-критерій Манна-Уітні;
  • Критерій знаків та ін.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна.

Приклад нерепрезентативної вибірки

У США одним із найвідоміших історичних прикладів нерепрезентативної вибірки вважається випадок, що стався під час президентських виборів у 1936 році Журнал «Літрері Дайджест», який успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, людям, обраним за телефонними книгами всієї країни, та людям із реєстраційних списків автомобілів. У 25 % бюлетенів, що повернулися (майже 2,5 мільйона) голоси були розподілені наступним чином:

57% віддавали перевагу кандидату-республіканцю Альфу Лендону

40% обрали чинного на той час президента-демократа Франкліна Рузвельта

На дійсних виборах, як відомо, переміг Рузвельт, набравши більше 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, оскільки їм було відомо, що більшість їх передплатників вважають себе республіканцями, вони розширили вибірку за рахунок людей, вибраних з телефонних книг та реєстраційних списків. Однак вони не врахували сучасних їм реалій і насправді набрали ще більше республіканців: під час Великої депресії мати телефони та автомобілі могли собі дозволити в основному представники середнього та верхнього класу (тобто більшість республіканців, а не демократів).

Види плану побудови груп із вибірок

Виділяють кілька основних видів плану побудови груп:

  1. Дослідження з експериментальною та контрольною групами, які ставляться у різні умови;
  2. Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору;
  3. Дослідження з використанням лише однієї групи – експериментальної;
  4. Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.

Стратегії побудови груп

Відбір груп для їхньої участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності:

  1. Рандомізація (випадковий відбір);
  2. Попарний відбір;
  3. Стратометричний відбір;
  4. наближене моделювання;
  5. Залучення реальних груп.

Рандомізація

Рандомізація, або випадковий вибір, використовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів ВНЗ, можна скласти папірці з іменами всіх студентів ВНЗ у капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором

Попарний відбір

Попарний відбір - стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних по значним експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з кращим варіантом - залученням близнюкових пар (моно-і дизиготних), оскільки дозволяє створити.

Стратометричний відбір

Стратометричний відбір – рандомізація з виділенням страт (або кластерів). При цьому способі формування вибірки генеральна сукупність ділиться на групи (страти), які мають певні характеристики (стаття, вік, політичні переваги, освіту, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.

Наближене моделювання

Наближене моделювання - складання обмежених вибірок та узагальнення висновків про цю вибірку більш широку популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.