Биографии Характеристики Анализ

Генерална съвкупност и извадкова извадка. Генерална съвкупност и извадка

Набор от хомогенни обекти често се разглежда във връзка с някаква характеристика, която ги характеризира, измерена количествено или качествено.

Например, ако има партида части, тогава количествен признакможе да бъде размерът на частта според GOST и качеството - стандартът на частта.

Ако е необходимо, те се проверяват за съответствие със стандартите, понякога прибягват до пълно проучване, но на практика това рядко се използва. Например, ако населението съдържа голяма сумаизследваните обекти е практически невъзможно да се проведе непрекъснато изследване. В този случай от цялата популация се избират определен брой обекти (елементи) и те се изследват. По този начин има генерална и извадкова съвкупност.

Общото наименование е съвкупността от всички обекти, които подлежат на изследване или изследване. Населениеобикновено съдържа крайно числоелементи, но ако е твърде голям, тогава с цел опростяване математически изчисленияпредполага се, че цялата колекция се състои от неизброим брой предмети.

Извадка или извадкова популация е част от избраните елементи от цялата популация. Вземането на проби може да се повтаря или да не се повтаря. В първия случай се връща в общата съвкупност, във втория не. AT практически дейностипо-често се използва неповтарящ се случаен избор.

Популацията и извадката трябва да бъдат свързани помежду си чрез представителност. С други думи, за да могат характеристиките на извадката да определят уверено характеристиките на цялата популация, е необходимо елементите на извадката да ги представят възможно най-точно. С други думи, извадката трябва да бъде представителна (представителна).

Извадката ще бъде повече или по-малко представителна, ако се изтегли на случаен принцип от много Голям бройцелият агрегат. Това може да се твърди въз основа на така наречения закон на големите числа. В този случай всички елементи имат еднаква вероятност да бъдат включени в извадката.

На разположение различни опцииселекция. Всички тези методи по принцип могат да бъдат разделени на две опции:

  • Вариант 1. Елементите се избират, когато съвкупността не е разделена на части. Тази опция включва просто произволно повторение и демон преизбиранес.
  • Вариант 2. Генералната съвкупност се разделя на части и се извършва подбор на елементи. Те включват типични, механични и серийни селекции.

Обикновено произволно - селекция, при която елементите се извличат един по един от цялата популация на случаен принцип.

Типична е селекция, при която елементите се избират не от цялата популация, а от всички нейни „типични“ части.

Механичен - това е такава селекция, когато цялата популация е разделена на няколко групи, равни на броя на елементите, които трябва да бъдат в извадката, и съответно от всяка група се избира по един елемент. Например, ако е необходимо да се изберат 25% от частите, направени от машината, тогава се избира всяка четвърта част, а ако са необходими 4% от частите, тогава се избира всяка двадесет и пета част и т.н. В същото време трябва да се каже, че понякога механичният избор може да не е достатъчен

Сериен - това е такава селекция, при която елементите се избират от цялата популация в "серии", подложени на непрекъснато изследване, а не един по един. Например, когато се правят части Голям бройавтоматични машини, тогава се извършва пълно проучване само по отношение на продуктите на няколко машини. Сериен подбор се използва, ако изследваната черта има малка променливост в различни серии.

За да се намали грешката, се използват оценки на генералната съвкупност с помощта на извадка. Освен това селективният контрол може да бъде както едноетапен, така и многоетапен, което повишава надеждността на изследването.

Население- съвкупността от всички обекти (единици), по отношение на които ученият възнамерява да направи изводи, когато изучава конкретен проблем. Генералната съвкупност се състои от всички обекти, които подлежат на изследване. Съставът на генералната съвкупност зависи от целите на изследването. Понякога генералната съвкупност е цялото население на определен регион (например, когато се изследва отношението на потенциалните избиратели към даден кандидат), най-често се задават няколко критерия, които определят обекта на изследване. Например жени на възраст 18-29 години, които използват определени марки кремове за ръце поне веднъж седмично и имат доход от поне $150 на член на семейството.

проба- набор от случаи (субекти, обекти, събития, проби), използвайки определена процедура, избрани от генералната съвкупност за участие в изследването.

  1. Размер на извадката;
  2. Зависими и независими проби;
  3. Представителност:
    1. Пример непредставителна извадка;
  4. Видове планове за изграждане на групи по образци;
  5. Стратегии за изграждане на група:
    1. рандомизация;
    2. Избор по двойки;
    3. Стратометрична селекция;
    4. Приблизително моделиране.

Размер на извадката- броя на случаите, включени в извадката. Поради статистически причини се препоръчва броят на случаите да бъде поне 30-35.

Зависими и независими проби

При сравняване на две (или повече) проби, тяхната зависимост е важен параметър. Ако е възможно да се установи хомоморфна двойка (тоест, когато един случай от проба X съответства на един и само един случай от проба Y и обратно) за всеки случай в две проби (и тази основа на връзка е важна за функцията измерени върху пробите), такива проби се наричат ​​зависими. Примери за зависими проби: двойки близнаци, две измервания на характеристика преди и след експериментална експозиция, съпрузи и съпруги и др.

Ако няма такава връзка между пробите, тогава тези проби се считат за независими, например: мъже и жени, психолози и математици.

Съответно зависимите проби винаги имат еднакъв размер, докато размерът на независимите проби може да се различава.

Пробите се сравняват с помощта на различни статистически критерии:

  • t-тест на Стюдънт;
  • Wilcoxon Т-тест;
  • U-тест на Ман-Уитни;
  • Критерии за признаци и др.

Представителност

Извадката може да се счита за представителна или непредставителна.

Пример за непредставителна извадка

Един от най-известните в САЩ исторически примеринепредставителна извадка се счита за инцидент, случил се по време на президентските избори през 1936 г. Списанието Litrery Digest, което успешно прогнозира събитията от няколко предишни избори, сгреши в прогнозите си, като изпрати десет милиона пробни бюлетини на своите абонати, избрани хора от телефонните указатели на цялата страна и хора от регистрационните списъци на автомобили. В 25% от върнатите бюлетини (близо 2,5 милиона) гласовете са разпределени както следва:

57% предпочитат републиканския кандидат Алф Ландън

40% са избрали тогавашния президент демократ Франклин Рузвелт

Както е известно, Рузвелт печели реалните избори с повече от 60% от гласовете. Грешката на Litreary Digest беше следната: искайки да увеличат представителността на извадката - тъй като знаеха, че мнозинството от техните абонати се смятат за републиканци - те разшириха извадката с хора, избрани от телефонните указатели и регистрационните списъци. Те обаче не взеха предвид реалностите на своето време и всъщност наеха още повече републиканци: по време на Голямата депресия най-вече средната и висшата класа (т.е. мнозинството републиканци, а не демократи) можеха да си позволят да собствени телефони и коли.

Видове планове за изграждане на групи от образци

Има няколко основни типа план за изграждане на група:

  1. Изследване с експериментални и контролни групи, които са поставени в различни условия;
  2. Проучване с експериментални и контролни групи, използвайки стратегия за подбор на двойки;
  3. Проучване, като се използва само една група - експериментална;
  4. Изследване по смесен (факториален) план – всички групи са поставени в различни условия.

Стратегии за изграждане на група

Подбор на групи за тяхното участие психологически експериментсе извършва с помощта на различни стратегии, които са необходими, за да се осигури възможно най-високо съответствие с вътрешната и външната валидност:

  1. Рандомизиране (случаен избор);
  2. Избор по двойки;
  3. Стратометрична селекция;
  4. Приблизително моделиране;
  5. Ангажиране на реални групи.

Рандомизиране

Рандомизирането или случаен подбор се използва за създаване на прости произволни проби. Използването на такава извадка се основава на предположението, че всеки член на популацията е еднакво вероятно да бъде включен в извадката. Например да правите произволна извадкаот 100 студенти можете да поставите листчета с имената на всички студенти в шапка и след това да вземете 100 листа от нея - това ще бъде случаен избор

Избор по двойки

Подборът по двойки е стратегия за конструиране на извадкови групи, при които групи от субекти са съставени от субекти, които са еквивалентни по странични параметри, които са значими за експеримента. Тази стратегия е ефективна за експерименти, използващи експериментални и контролни групи с най-добрия вариант - привличане на двойки близнаци (моно- и дизиготни), тъй като ви позволява да създавате.

Стратометрична селекция

Стратометрична селекция - рандомизация с избор на страти (или клъстери). При този методизвадка, генералната съвкупност се разделя на групи (страти), които имат определени характеристики (пол, възраст, политически предпочитания, образование, ниво на доходи и т.н.), и се избират субекти със съответните характеристики.

Приблизително моделиране

Приблизително моделиране - изготвяне на ограничени извадки и обобщаване на заключенията за тази извадка към по-голяма популация. Например, когато участвате в проучване на студенти от 2-ра година на университета, данните от това проучване се разширяват до „хора на възраст от 17 до 21 години“. Допустимостта на подобни обобщения е изключително ограничена.

Население(на английски - население) - съвкупността от всички обекти (единици), по отношение на които ученият възнамерява да направи изводи, когато изучава конкретен проблем.

Генералната съвкупност се състои от всички обекти, които подлежат на изследване. Съставът на генералната съвкупност зависи от целите на изследването. Понякога генералната съвкупност е цялото население на определен регион (например, когато се изследва съотношението потенциални избиратели към кандидат), най-често се задават няколко критерия, които определят обекта на изследване. Например мъже на възраст 30-50 години, които използват определена марка самобръсначка поне веднъж седмично и имат доход от поне $100 на член от семейството.

пробаили рамка за вземане на проби- набор от случаи (субекти, обекти, събития, проби), използвайки определена процедура, избрани от генералната съвкупност за участие в изследването.

Примерни характеристики:

 Качествени характеристики на извадката – кого точно избираме и какви методи на извадка използваме за това.

 Количествени характеристики на извадката – колко случая избираме, с други думи, размера на извадката.

Необходимост от вземане на проби

 Обектът на изследване е много обширен. Например, потребителите на продуктите на една глобална компания са огромен брой географски разпръснати пазари.

 Има нужда от събиране на първична информация.

Размер на извадката

Размер на извадката- броя на случаите, включени в извадката. Поради статистически причини се препоръчва броят на случаите да бъде поне 30-35.

17. Основни методи за вземане на проби

Вземане на пробиосновно се основава на познаване на структурата на извадката, която се разбира като списък на всички единици от съвкупността, от които са избрани единиците на извадката. Например, ако разглеждаме всички автосервизи в град Москва като набор, тогава трябва да имаме списък с такива сервизи, разглеждани като контур, в рамките на който се формира извадката.

Контурът на извадката неизбежно съдържа грешка, наречена грешка на контура на извадката, която характеризира степента на отклонение от истинския размер на популацията. Очевидно няма пълен официален списък на всички сервизи за автомобили в Москва. Изследователят трябва да информира клиента на работата за размера на грешката на контура на вземане на проби.

При формирането на извадка се използват вероятностни (случайни) и невероятностни (неслучайни) методи.

Ако всички извадкови единици имат известен шанс (вероятност) да бъдат включени в извадката, тогава извадката се нарича вероятностна извадка. Ако тази вероятност е неизвестна, тогава извадката се нарича невероятна. За съжаление, в повечето маркетингови проучвания, поради невъзможността за точно определяне на размера на популацията, не е възможно точно да се изчислят вероятностите. Следователно терминът „известна вероятност“ се основава повече на използването на определени методи за вземане на проби, отколкото на познаване на точния размер на популацията.

Вероятностните методи включват:

Прост произволен избор;

Систематичен подбор;

избор на клъстер;

стратифицирана селекция.

Невероятни методи:

Избор на принципа на удобство;

Избор въз основа на преценки;

Формиране на извадката по време на изследването;

Формиране на извадка по квоти.

Смисълът на метода за подбор, основан на принципа на удобството, е, че вземането на проби се извършва по най-удобния начин от гледна точка на изследователя, например от гледна точка на минимално време и усилия, от гледна точка на наличието на респонденти. Изборът на място за изследване и съставът на извадката се извършва субективно, например проучване на клиенти се извършва в магазин, който е най-близо до мястото на пребиваване на изследователя. Очевидно много членове на населението не участват в проучването.

Формирането на извадка въз основа на преценка се основава на използването на мнението на квалифицирани специалисти, експерти относно състава на извадката. Въз основа на този подход често се формира съставът на фокус групата.

Формирането на извадката по време на проучването се основава на разширяване на броя на респондентите въз основа на предложенията на респонденти, които вече са участвали в проучването. Първоначално изследователят формира извадка, много по-малка от необходимата за изследването, след което тя се разширява, докато се провежда.

Формирането на извадка въз основа на квоти (квотен подбор) включва предварително определяне, въз основа на целите на изследването, на броя на групите респонденти, които отговарят на определени изисквания (характеристики). Например, за целите на проучването беше решено петдесет мъже и петдесет жени да бъдат интервюирани в универсален магазин. Интервюиращият провежда проучване, докато не избере определена квота.

Разпределение случайна величинасъдържа цялата информация за статистически свойства. Колко стойности на случайна променлива трябва да знаете, за да изградите нейното разпределение? За да направите това, трябва да проучите общо население.

Генералната съвкупност е набор от всички стойности, които дадена случайна променлива може да приеме.

Броят на единиците в генералната съвкупност се нарича неин обем н. Тази стойност може да бъде ограничена или безкрайна. Например, ако изследваме растежа на жителите на определен град, тогава размерът на общата популация ще бъде е равно на числотожители на града. Ако някой физически експеримент, тогава обемът на генералната съвкупност ще бъде безкраен, защото броя на всички възможни стойности на всяка физически параметъре равно на безкрайност.

Изследването на общата популация не винаги е възможно и целесъобразно. Това е невъзможно, ако размерът на генералната съвкупност е безкраен. Но дори и при ограничени обеми пълно проучванене винаги е оправдано, тъй като изисква много време и труд и обикновено не се изисква абсолютна точност на резултатите. По-малко точни резултати, но с много по-малко усилия и пари може да се получи чрез изучаване само на част от общата популация. Такива изследвания се наричат ​​селективни.

Статистическите изследвания, проведени само върху част от генералната съвкупност, се наричат ​​извадкови, а изследваната част от генералната съвкупност се нарича извадка.

Фигура 7.2 символично показва популацията и извадката като набор и негово подмножество.

Фигура 7.2 Популация и извадка

Работейки с някакво подмножество от дадена генерална съвкупност, често съставляващо незначителна част от нея, получаваме резултати, които са доста задоволителни по отношение на точността за практически цели. Изследването на голяма част от генералната съвкупност само повишава точността, но не променя същността на резултатите, ако извадката е взета правилно от статистическа гледна точка.

За да може извадката да отразява свойствата на генералната съвкупност и резултатите да бъдат надеждни, тя трябва да бъде Представител(Представител).

В някои общи съвкупности всяка част от тях е представителна по силата на тяхната природа. В повечето случаи обаче трябва да се обърне специално внимание, за да се гарантира, че пробите са представителни.

единедно от най-големите постижения на съвременността математическа статистикасе счита за развитие на теорията и практиката на метода на случайната извадка, осигуряващ представителността на подбора на данни.

Извадковите изследвания винаги губят точност в сравнение с изследването на цялата популация. Това обаче може да се съгласува, ако се знае големината на грешката. Очевидно, колкото повече размерът на извадката се доближава до размера на генералната съвкупност, толкова по-малка ще бъде грешката. От това става ясно, че проблемите на статистическите изводи стават особено актуални при работа с малки извадки ( н ? 10-50).

Целият набор от индивиди от определена категория се нарича генерална съвкупност. Обемът на генералната съвкупност се определя от целите на изследването.

Ако се изследва някакъв вид диви животни или растения, тогава общата популация ще включва всички индивиди от този вид. AT този случайобемът на генералната съвкупност ще бъде много голям и при изчисленията се приема като безкрайно голяма величина.

Ако се изследва ефектът на някакъв агент върху растения и животни от определена категория, тогава общата популация ще бъде всички растения и животни от тази категория (вид, пол, възраст, икономическа цел), към която принадлежат експерименталните обекти. Вече не е толкова добре голям бройиндивиди, но все още не са достъпни за непрекъснато проучване.

Обемът на общата популация не винаги е достъпен за непрекъснато изследване. Понякога се изследват малки съвкупности, например средният добив на мляко или средното остригане на вълна се определят за група животни, назначени на конкретен работник. В такива случаи общата популация ще бъде много малък брой индивиди, всички от които се изследват. Малка обща съвкупност се открива и при изследване на растения или животни в колекция с цел характеризиране определена групав тази колекция.

Характеристиките на груповите свойства (и т.н.), отнасящи се до цялата популация, се наричат ​​общи параметри.

Пробата е група от обекти, които имат три характеристики:

1 е част от генералната съвкупност;

2 избрани на случаен принцип, по определен начин;

3 изследвани, за да характеризират цялата генерална популация.

За да се получи доста точна характеристика на цялата генерална съвкупност от извадката, е необходимо да се организира правилният подбор на обекти от генералната съвкупност.

Теорията и практиката са разработили няколко системи за подбор на индивиди в извадка. Основата на всички тези системи е желанието да се осигури максимална възможност за избор на всеки обект от общото население. Пристрастие, пристрастие при избора на обекти за извадково изследваневъзпрепятстват получаването на правилни общи заключения, правят резултатите от извадково изследване показателни за цялата обща съвкупност, т.е. непредставителни.

За да се получи правилна, неизкривена характеристика на цялата генерална съвкупност, е необходимо да се стремим да осигурим възможността за избор на всеки обект от всяка част от генералната съвкупност в извадката. Това основно изискване трябва да се спазва толкова по-стриктно, колкото по-променлива е изследваната черта. Напълно разбираемо е, че при разнообразие, което клони към нула, например в случай на изследване на цвета на косата или перата на някои видове, всеки метод на вземане на проби ще даде представителни резултати.

Използвани са различни изследвания следните начиниизбор на обекти в извадката.

4 Случайна повторна селекция, при която обектите на изследване се избират от общата популация, без първо да се вземе предвид развитието на изследваната черта, т.е. в произволен (за тази черта) ред; след селекция всеки артикул се проучва и след това се връща на собствената му популация, така че всеки артикул да може да бъде повторно взет. Този метод на селекция е равнозначен на селекция от безкрайно голяма генерална популация, за която са разработени основните показатели за връзката между извадката и общите стойности.

5 Случайна неповтаряща се селекция, при която обекти, избрани на случаен принцип, както в предишния метод, не се връщат в генералната съвкупност и не могат да влязат отново в извадката. Това е най-често срещаната схема за вземане на проби; е равносилно на подбор от голяма, но ограничена генерална съвкупност, която се взема предвид при определяне на генерални показатели от извадкови.

6 Механична селекция, при която обектите се избират от отделни части на генералната популация и тези части се маркират предварително механично според квадратите на опитното поле, според произволни групи животни, взети от различни области на популацията и т.н. Обикновено , планирани са толкова много такива части, колкото се предполага, че се вземат обекти за изследване, така че броят на частите е равен на размера на извадката. Механичният подбор понякога се извършва, като се избере да се изследват индивиди след определен брой, например, когато преминават животни през разцеп и се избира всяка десета, стотна и т.н., или когато се прави разрез на всеки 100 или 200 m, или се избира един обект всеки 10 срещани, 100 и т.н. копия при изследването на цялата популация.

8 Сериен (гнездов) подбор, при който генералната съвкупност се разделя на части - серии, някои от тях се изучават изцяло. Този метод се използва успешно в случаите, когато изследваните обекти са сравнително равномерно разпределени в определен обем или на определена територия. Например, когато се изследва замърсяването на въздуха или водата с микроорганизми, се вземат проби, които се подлагат на непрекъснато изследване. В някои случаи селскостопанските обекти могат да бъдат изследвани и по метода на гнездене. При изследване на добивите на месо и други продукти от преработката на месни породи говеда е възможно да се вземат в пробата всички животни от тази порода, пристигнали в два или три месопреработвателни предприятия. При изучаване на размера на яйцата в колективното птицевъдство е възможно да се изследва тази характеристика в цялата популация от пилета в няколко колективни ферми.

Характеристики на груповите свойства (μ, си др.), получени за извадка, се наричат ​​извадкови показатели.

Представителност

Директното изследване на група избрани обекти осигурява на първо място основния материал и характеристиките на самата проба.

Всички примерни данни и обобщени показатели са важни като първични факти, разкрити от изследването и подлежат на внимателно разглеждане, анализ и сравнение с резултатите от други разработки. Но това не се ограничава до процеса на извличане на информация, вградена в първични материалиизследвания.

Фактът, че обектите са избрани в извадката по специални методи и в достатъчно количество, прави резултатите от изследването на извадката показателни не само за самата извадка, но и за цялата генерална съвкупност, от която е взета тази проба.

Извадката, при определени условия, става повече или по-малко точно отражение на цялата популация. Това свойство на извадката се нарича представителност, което означава представителност с определена точност и достоверност.

Като всяко свойство, представителността на извадковите данни може да бъде изразена в достатъчна или недостатъчна степен. В първия случай в извадката се получават надеждни оценки на общите параметри, във втория случай - ненадеждни. Важно е да запомните, че получаването на ненадеждни оценки не намалява стойността на показателите за извадката за характеризиране на самата извадка. Получаването на надеждни оценки разширява обхвата на постиженията, получени в селективно изследване.