Биографии Характеристики Анализ

Генеральная совокупность и выборка образец. Генеральная совокупность и выборка

Совокупность однородных объектов часто исследуют относительно какого-либо признака, характеризующего их, измеренного количественно либо качественно.

К примеру, если имеется партия деталей, то количественным признаком может быть размер детали по ГОСТу, а качественным - стандартность детали.

В случае необходимости их проверки на соответствие стандартам иногда прибегают к сплошному обследованию, но на практике это применяется крайне редко. К примеру, если генеральная совокупность содержит огромное количество изучаемых объектов, то практически невозможно проводить сплошное обследование. В таком случае из всей совокупности отбирают определенное число объектов (элементов) и их исследуют. Таким образом, имеется генеральная и выборочная совокупность.

Генеральной называют совокупность всех объектов, которые подвергаются обследованию или изучению. Генеральная совокупность, как правило, содержит в себе конечное число элементов, но если оно слишком велико, то с целью упрощения математических вычислений допускается, что вся совокупность состоит из бесчисленного числа объектов.

Выборкой или выборочной совокупностью называется часть отобранных элементов из всей совокупности. Выборка может быть повторной либо бесповторной. В первом случае её возвращают в генеральную совокупность, во втором - нет. В практической деятельности чаще используют бесповторный случайный отбор.

Генеральная совокупность и выборка должны быть связаны между собой репрезентативностью. Говоря по другому, для того, чтобы по характеристикам выборочной совокупности можно было уверенно определять признаки всей совокупности, надо, чтобы элементы выборки максимально точно их представляли. Иными словами, выборка должна быть представительной (репрезентативной).

Выборка будет более или менее репрезентативной, если она производится случайно из очень большого числа всей совокупности. Это можно утверждать на основе так называемого закона больших чисел. При этом все элементы имеют равную вероятность попасть в выборку.

Имеются различные варианты отбора. Все эти способы в принципе можно разделить на два варианта:

  • Вариант 1. Отбираются элементы, когда генеральная совокупность не делится на части. К этому варианту можно отнести простой случайный повторный и бесповторный отборы.
  • Вариант 2. Генеральная совокупность разделяется на части и производится отбор элементов. Сюда можно отнести типический, механический и серийный отборы.

Простой случайный - отбор, при котором элементы извлекаются по одному из всей совокупности случайным образом.

Типический - это отбор, при котором элементы отбираются не из всей совокупности, а из всех её «типических» частей.

Механический - это такой отбор, когда всю совокупность разделяют на количество групп, равное числу элементов, которое должно быть в выборке, и, соответственно, из каждой группы выбирается один элемент. К примеру, если надо отобрать 25% деталей, изготовленных станком, то выбирают каждую четвёртую деталь, а если требуется отобрать 4% деталей, то выбирают каждую двадцать пятую деталь и так далее. При этом необходимо сказать, что иногда механический отбор может не обеспечивать достаточной

Серийный - это такой отбор, при котором элементы отбирают из всей совокупности «сериями», подвергаемыми сплошному исследованию, а не по одному. К примеру, когда детали изготавливаются большим числом станков-автоматов, то сплошное обследование проводится только в отношении продукции нескольких станков. Серийный отбор используют, если исследуемый признак имеет незначительную вариативность в разных сериях.

С целью уменьшения погрешности применяют оценки генеральной совокупности с помощью выборочной. Причем выборочный контроль может быть как одноступенчатым, так и многоступенчатым, что повышает надежность обследования.

Генеральная совокупность - совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы. Генеральная совокупность состоит из всех объектов, которые подлежат изучению. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность — это все население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объект исследования. Например, женщины 18-29 лет, использующие крем для рук определённых марок не реже раза в неделю, и имеющие доход не ниже $150 на одного члена семьи.

Выборка - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

  1. Объём выборки;
  2. Зависимые и независимые выборки;
  3. Репрезентативность:
    1. Пример нерепрезентативной выборки;
  4. Виды плана построения групп из выборок;
  5. Стратегии построения групп:
    1. Рандомизация;
    2. Попарный отбор;
    3. Стратометрический отбор;
    4. Приближённое моделирование.

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30-35.

Зависимые и независимые выборки

При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X сооветствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми. Примеры зависимых выборок: пары близнецов, два измерения какого-либо признака до и после экспериментального воздействия, мужья и жёны и т. п.

В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми, например: мужчины и женщины, психологи и математики.

Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.

Сравнение выборок производится с помощью различных статистических критериев:

  • t-критерий Стьюдента;
  • T-критерий Вилкоксона;
  • U-критерий Манна-Уитни;
  • Критерий знаков и др.

Репрезентативность

Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.

Пример нерепрезентативной выборки

В США одним из наиболее известных исторических примеров нерепрезентативной выборки считается случай, происшедший во время президентских выборов в 1936 году Журнал «Литрери Дайджест», успешно прогнозировавший события нескольких предшествующих выборов, ошибся в своих предсказаниях, разослав десять миллионов пробных бюллетеней своим подписчикам, людям, выбранным по телефонным книгам всей страны, и людям из регистрационных списков автомобилей. В 25 % вернувшихся бюллетеней (почти 2,5 миллиона) голоса были распределены следующим образом:

57 % отдавали предпочтение кандидату-республиканцу Альфу Лэндону

40 % выбрали действующего в то время президента-демократа Франклина Рузвельта

На действительных же выборах, как известно, победил Рузвельт, набрав более 60 % голосов. Ошибка «Литрери Дайджест» заключалась в следующем: желая увеличить репрезентативность выборки, - так как им было известно, что большинство их подписчиков считают себя республиканцами, - они расширили выборку за счёт людей, выбранных из телефонных книг и регистрационных списков. Однако они не учли современных им реалий и в действительности набрали ещё больше республиканцев: во время Великой депрессии обладать телефонами и автомобилями могли себе позволить в основном представители среднего и верхнего класса (то есть большинство республиканцев, а не демократов).

Виды плана построения групп из выборок

Выделяют несколько основных видов плана построения групп:

  1. Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия;
  2. Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора;
  3. Исследование с использованием только одной группы - экспериментальной;
  4. Исследование с использованием смешанного (факторного) плана - все группы ставятся в разные условия.

Стратегии построения групп

Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности:

  1. Рандомизация (случайный отбор);
  2. Попарный отбор;
  3. Стратометрический отбор;
  4. Приближённое моделирование;
  5. Привлечение реальных групп.

Рандомизация

Рандомизация, или случайный отбор, используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек - это будет случайным отбором

Попарный отбор

Попарный отбор - стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом - привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать.

Стратометрический отбор

Стратометрический отбор - рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол, возраст, политические предпочтения, образование, уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.

Приближённое моделирование

Приближённое моделирование - составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.

Генеральная совокупность (в англ. - population ) - совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы.

Генеральная совокупность состоит из всех объектов, которые подлежат изучению. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность - это все население определённого региона (например, когда изучается отношение потенциальных избирателей к кандидату), чаще всего задаётся несколько критериев, определяющих объект исследования. Например, мужчины 30-50 лет, использующие бритву определённой марки не реже раза в неделю, и имеющие доход не ниже $100 на одного члена семьи.

Выборка или выборочная совокупность - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.

Характеристики выборки:

 Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем.

 Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

Необходимость выборки

 Объект исследования очень обширный. Например, потребители продукции глобальной компании – огромное количество территориально разбросанных рынков.

 Существует необходимость в сборе первичной информации.

Объём выборки

Объём выборки - число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30 – 35.

17. Основные способы формирования выборки

Формирование выборки прежде всего основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автосервисные мастерские города Москвы, то надо иметь список таких мастерских, рассматриваемый как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не существует полно официального списка всех автосервисных мастерских г. Москвы. Исследователь должен информировать заказчика работы о размерах ошибки контура выборки.

При формировании выборки используются вероятностные (случайные) и невероятностные (неслучайные) методы.

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. К сожалению, в большинстве маркетинговых исследований из-за невозможности точного определения размера совокупности не представляется возможным точно рассчитать вероятности. Поэтому термин «известная вероятность» скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

Вероятностные методы включают в себя:

Простой случайный отбор;

Систематический отбор;

Кластерный отбор;

Стратифицированный отбор.

Невероятностные методы:

Отбор на основе принципа удобства;

Отбор на основе суждений;

Формирование выборки в процессе опроса;

Формирование выборки на основе квот.

Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например с позиций минимальных затрат времени и усилий, с позиций доступности респондентов. Выбор места исследования и состава выборки производится субъективным образом, например, опрос покупателей осуществляется в магазине, ближайшем к месту жительства исследователя. Очевидно, что многие представители совокупности не принимают участия в опросе.

Формирование выборки на основе суждения основано на использовании мнения квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокус-группы.

Формирование выборки в процессе опроса основано на расширении числа опрашиваемых исходя из предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется для исследования, затем она по мере проведения расширяется.

Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования было принято решение, что в универмаге должно быть опрошено пятьдесят мужчин и пятьдесят женщин. Интервьюер проводит опрос, пока не выберет установленную квоту.

Распределение случайной величины содержит всю информацию о ее статистических свойствах. Много ли нужно знать значений случайной величины, чтобы построить ее распределение? Для этого нужно исследовать ее генеральную совокупность .

Генеральная совокупность - множество всех значений, которые может принимать данная случайная величина.

Число единиц в генеральной совокупности называется ее объемом N . Эта величина может быть конечной и бесконечной. Например, если исследуется рост жителей некоторого города, то объем генеральной совокупности будет равен числу жителей города. Если выполняется любой физический эксперимент, то объем генеральной совокупности будет бесконечным, т.к. число всех возможных значений любого физического параметра равно бесконечности.

Исследование генеральной совокупности не всегда возможно и целесообразно. Оно невозможно, если объем генеральной совокупности бесконечен. Но и при конечных объемах полное исследование не всегда оправдано, поскольку требует больших затрат времени и труда, а абсолютная точность результатов обычно не требуется. Менее точные результаты, но со значительно меньшими затратами сил и средств можно получить при исследовании только части генеральной совокупности. Такие исследования называются выборочными.

Статистические исследования, проводимые только на части генеральной совокупности, называются выборочными, а исследуемая часть генеральной совокупности называется выборкой.

На рисунке 7.2 символически показаны генеральная совокупность и выборка в виде множества и его подмножества.

Рисунок 7.2 Генеральная совокупность и выборка

Работая с некоторым подмножеством данной генеральной совокупности, часто составляющим незначительную ее часть, мы получаем результаты, по точности вполне удовлетворительные для практических целей. Исследование большей части генеральной совокупности только увеличивает точность, но не изменяет сути результатов, если выборка взята правильно со статистической точки зрения.

Для того, чтобы выборка отражала свойства генеральной совокупности и результаты были достоверными, она должна быть репрезентативной (представительной).

У некоторых генеральных совокупностей любая их часть является репрезентативной в силу их природы. Однако в большинстве случаев необходимо принимать специальные меры для обеспечения репрезентативности выборок.

Одним из главных достижений современной математической статистики считается разработка теории и практики метода случай ных выборок, обеспечивающих репрезентативность отбора данных.

Выборочные исследования всегда проигрывают в точности по сравнению с исследованием всей генеральной совокупности. Однако с этим можно примириться, если величина погрешности будет известной. Очевидно, что чем больше объем выборки будет приближаться к объему генеральной совокупности, тем погрешность будет меньшей. Отсюда ясно, что проблемы статистического вывода становятся особенно актуальными при работе с малыми выборками (N ? 10-50).

Весь массив особей определенной категории называется генеральной совокупностью. Объем генеральной совокупности определяется задачами исследования.

Если изучается какой-нибудь вид диких животных или растений, то генеральной совокупностью будут все особи этого вида. В данном случае объем генеральной совокупности будет очень большой и при расчетах он принимается за бесконечно большую величину.

Если изучается действие какого-нибудь агента на растения и животных определенной категории, то генеральной совокупностью будут все растения и животные той категории (вида, пола, возраста, хозяйственного назначения), к которой относились подопытные объекты. Это уже не очень большое количество особей, но еще недоступное для сплошного изучения.

Не всегда объем генеральной совокупности недоступен для сплошного исследования. Иногда изучаются небольшие совокупности, например, определяется средний удой или средний настриг шерсти у группы животных, закрепленных за определенным работником. В таких случаях генеральной совокупностью будет совсем небольшое количество особей, которые все исследуются. Небольшая генеральная совокупность встречается также при исследовании растений или животных, имеющихся в какой-нибудь коллекции, с целью характеристики определенной группы в данной коллекции.

Характеристики групповых свойств ( и т. д.), относящиеся ко всей генеральной совокупности, называются генеральными параметрами.

Выборка – группа объектов, отличающихся тремя особенностями:

1 это часть генеральной совокупности;

2 отобранная в случайном порядке, определенным образом;

3 исследуемая для характеристики всей генеральной совокупности.

Для того чтобы по выборке можно было получить достаточно точную характеристику всей генеральной совокупности, необходимо организовать правильный отбор объектов из генеральной совокупности.

Теорией и практикой разработано несколько систем отбора особей в выборку. В основу всех этих систем положено стремление обеспечить максимальную возможность выбора любого объекта из генеральной совокупности. Тенденциозность, предвзятость при отборе объектов для выборочного исследования препятствуют получению правильных общих выводов, делают результаты выборочного исследования непоказательными для всей генеральной совокупности, т. е. нерепрезентативными.

Для получения правильной, неискаженной характеристики всей генеральной совокупности необходимо стремиться обеспечить возможность отбора в выборку любого объекта из любой части генеральной совокупности. Это основное требование должно выполняться тем строже, чем более изменчив изучаемый признак. Вполне понятно, что при разнообразии, приближающемся к нулю, например в случае изучения цвета волос или перьев некоторых видов, любой способ отбора выборки даст репрезентативные результаты.

В различных исследованиях применяются следующие способы отбора объектов в выборку.

4 Случайный повторный отбор, при котором объекты изучения отбираются из генеральной совокупности без предварительного учета развития у них изучаемого признака, т. е. в случайном (для данного признака) порядке; после отбора каждый объект изучается и затем возвращается в свою генеральную совокупность, так что любой объект может попасть повторно в выборку. Такой способ отбора равносилен отбору из бесконечно большой генеральной совокупности, для которого разработаны основные показатели взаимоотношений между выборочными и генеральными величинами.

5 Случайный бесповторный отбор, при котором объекты, отобранные, как и при предыдущем способе, случайно, не возвращаются в генеральную совокупность и не могут повторно попасть в выборку. Это наиболее распространенный способ организации выборки; он равносилен отбору из большой, но ограниченной генеральной совокупности, что учитывается при определении генеральных показателей по выборочным.

6 Механический отбор, при котором производится отбор объектов из отдельных частей генеральной совокупности, причем эти части предварительно намечаются механически по квадратам опытного поля, по случайным группам животных, взятых из разных ареалов популяции и т. д. Обычно намечается столько таких частей, сколько предполагается взять объектов для изучения, поэтому число частей бывает равно численности выборки. Механический отбор иногда осуществляется выбором для изучения особей через определенное число, например при пропускании животных через раскол и отборе каждого десятого, сотого и т. д., или при взятии укоса через каждые 100 или 200 м, или отборе одного объекта через каждые встретившиеся 10, 100 и т. д. экземпляров при исследовании всей популяции.

8 Серийный (гнездовой) отбор, при котором генеральная совокупность разбивается на части – серии, некоторые из них исследуются целиком. Применяется этот способ с успехом в тех случаях, когда исследуемые объекты достаточно равномерно распределены в определенном объеме или на определенной территории. Например, при исследовании зараженности воздуха или воды микроорганизмами берут пробы, которые подвергаются сплошному исследованию. В некоторых случаях гнездовым способом могут быть обследованы также сельскохозяйственные объекты. При изучении выходов мяса и других продуктов переработки мясной породы скота в выборку можно взять всех животных этой породы, поступивших на два-три мясокомбината. При изучении величины яйца в колхозном птицеводстве можно в нескольких колхозах провести изучение этого признака у всего поголовья кур.

Характеристики групповых свойств (μ, s и т. д.), полученные для выборки, называются выборочными показателями.

Репрезентативность

Непосредственное изучение группы отобранных объектов дает, прежде всего, первичный материал и характеристику самой выборки.

Все выборочные данные и сводные показатели имеют значение в качестве первичных фактов, вскрытых исследованием и подлежащих тщательному рассмотрению, анализу и сопоставлению с результатами других работ. Но этим не ограничивается процесс извлечения информации, заложенный в первичных материалах исследования.

То обстоятельство, что объекты отбирались в выборку специальными приемами и в достаточном количестве, делает результаты изучения выборки показательными не только для самой выборки, но также и для всей генеральной совокупности, из которой взята эта выборка.

Выборка при определенных условиях становится более или менее точным отражением всей генеральной совокупности. Это свойство выборки называется репрезентативностью, что означает представительность с определенной точностью и надежностью.

Как и всякое свойство, репрезентативность выборочных данных может быть выражена в достаточной или в недостаточной степени. В первом случае в выборке получаются достоверные оценки генеральных параметров, во втором – недостоверные. Важно помнить, что получение недостоверных оценок не умаляет значения выборочных показателей для характеристики самой выборки. Получение же достоверных оценок расширяет область применения достижений, полученных при выборочном исследовании.