Биографии Характеристики Анализ

Как сделать вторичную группировку данных. Группировка статистических данных

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.

Пример 1.

Произвести укрупнение интервалов на основе данных таблицы 2.7.:

Таблица 2.7.

Число магазинов

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 2.8.).

Таблица 2.8.

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот за IV квартал, тыс.руб.

Товарооборот в среднем на 1 магазин, тыс.руб.

Совершенно четко видно, чем крупнее магазины, тем выше уровень товарооборота.

Пример 2.

Имеются следующие данные о распределении колхозов по числу дворов (табл. 2.9.).

Таблица 2.9.

Удельный вес колхозов группы в процентах к итогу

Группы колхозов по числу дворов

Эти данные не позволяют провести сравнение распределения колхозов в 2-х районах по числу дворов, так как в этих районах имеется различное число групп колхозов. Необходимо ряды распределения привести к сопоставимому виду.

За основу сравнения необходимо взять распределение колхозов 1 района. Следовательно, по второму району надо произвести вторичную группировку, чтобы образовать такое же число групп и с теми же интервалами, как и в первом районе. Получим следующие данные (табл.2.10.).

Таблица 2.10.

Группы колхозов по числу дворов

Удельный вес колхозов группы в % к итогу

21-7=14, 14+23=37

Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно примем, что это число колхозов должно быть пропорционально удельному весу отобранных дворов в группе.

Определяем удельный вес 50 дворов в пятой группе.

(50 * 18) / (250 - 150) = 9

Определяем удельный вес 50 дворов в шестой группе.

(50 * 21) / (400 - 250) = 7 и т.д.

При анализе и сопоставлении нескольких группировок, например по нескольким цехам, предприятиям и т.д., может возникнуть ситуация когда исходные группировки несопоставимы из-за различного числа групп или разной величины используемых интервалов. Чтобы такие группировки привести в сопоставимый вид, т.е. либо к одному числу групп, либо к одной величине интервала, используется метод вторичной группировки. Метод вторичной группировки – это метод образования новых групп на основании имеющихся по заданным требованиям группировки. Для проведения вторичной группировки используются 2 способа: 1) объединение первоначальных групп, 2) долевая перегруппировка.

Приведение нескольких несопоставимых группировок в сопоставимой вид осуществляется в три этапа. На первом этапе осуществляется анализ исходных группировок на предмет выявления условий несопоставимости исходных группировок. На втором этапе выбирается способ приведения исходных группировок в сопоставимый вид. На третьем этапе осуществляется вторичная перегруппировка исходных группировок и анализ полученных результатов. При необходимости осуществляется повторная перегруппировка. Рассмотрим способы вторичной перегруппировки.

1 способ Статистическое наблюдение о распределении рабочих предприятия по стажу работы в 2000 году дало следующие результаты (табл.2.7).

Таблица 2.7

В 2002 году была проведено повторное статистическое наблюдение, которое дало следующие результаты (табл.2.8). Оценить изменения в распределении рабочих по стажу за 2 года непосредственно по данным обеих таблиц невозможно. Анализ обеих таблиц показывает, что они несовместны из-за разного числа групп и разной величины интервала.

Таблица 2.8

Чтобы привести данные обеих таблиц к сопоставимому виду можно в таблице 2.7 объединить как 1 и 2 группы, так и 3 и 4 группы. Это даст возможность оценить изменения в распределении рабочих по стажу, которые произошли на предприятии за два года. Результаты перегруппировки данных статистического наблюдения за 2000год (табл.2.7) приведены в таблице 2.9.

Таблица 2.9

Сравнивая данные за 2002 год (табл.2.8) с перегруппированными данными за 2000 год (табл.2.9) можно сделать вывод: за два года уменьшилось число рабочих со стажем до 6 лет, т.е. молодых, и увеличилось число рабочих с большим стажем.

2 способ Пусть статистическое наблюдение в 2002 году дало такие результаты (табл.2.10). Сравнивая данные за 2000 год (табл.2.9) и данные за 2002 год (табл. 2.7) можно сделать вывод о их несовместности из-за разного числа групп и разной величины интервала. Анализ показывает, что применение 1 способа приведения данных к сопоставимому виду невозможно. Поэтому используем 2 способ для перегруппировки данных за 2000 год (табл.2.7) таким образом, чтобы они соответствовали группировке данных за 2002 год (табл.2.10)

Таблица 2.10

Применение второго способа предполагает равномерное распределение частот внутри каждой группы. Это является непременным условием использования второго способа. Для перегруппировки данных за 2000 год (табл.2.7)сделаем следующие расчеты. Так в новую первую группу (1-4) (табл.2.10) войдут все данные старой первой группы (1-3) (табл.22.7) и данные о количестве рабочих, имеющих стаж 4 года из старой второй группы. Число рабочих, имеющих стаж 4 года, равен 3 (9/3=3, так как в старой второй группе было 9 рабочих, а интервал равен 3). Таким образом, новая первая группа (1-4) будет включать 18 рабочих (18=15+3)Вторая новая группа (5-8) будет включать 6 рабочих, имеющих стаж 5, 6 лет (из старой второй группы 6=9/3·2) и 18 рабочих, имеющих стаж 7, 8 лет (из старой третьей группы 18=27/3·2) Таким образом, новая вторая группа (5-8) будет включать 24 рабочих (24=6+18). В новую третью группу (9-12) войдут рабочие, имеющие стаж 9 лет (9=27/3) и все 9 рабочих из старой четвертой группы (10-12). Таким образом, в новой третьей группе (9-12) будет 18 рабочих (18=9+9). Перегруппированные данные за 2000год и данные за 2002 год сведем в одну таблицу(2.11), что позволит осуществить сравнительный анализ.

Таблица 2.11

Анализ распределения рабочих предприятия по стажу (табл.2.11) показывает, что в 2002 году число рабочих с большим стажем (от 9 до 12 лет) увеличилось, а с меньшим стажем (от 1 до 8 лет) – уменьшилось. Таким образом, перегруппировка данных позволила привести данные в сопоставимый вид, провести анализ и сделать необходимые выводы.

Контрольные вопросы и задания

1.Что такое статистическое наблюдение? Какие условия должны быть реализованы при проведении статистического наблюдения (смотрите определение)?

2. По каким признакам можно классифицировать статистические наблюдения? Приведите примеры статистического наблюдения.

3. Какие ошибки возникают при проведении статистических наблюдений и какие методы контроля могут быть использованы?

4. Определите в каком примере дана простая, а в каком сложная сводка. Пример 1. В понедельник в ткацком цехе работало 200 работниц. Пример 2. В понедельник в ткацком цехе на участке №1 работало 40 работниц, на участке №2 – 60 работниц, а всего работало 100 работниц.

5. Какие группировки используются при обработке статистической информации? Чем они разнятся между собой?

6. В отделе главного технолога работает 15 человек, а в отделе маркетинга и сбыта 10 человек. В каком случае коллективы отделов являются однородными совокупностями, а в каком случае –неоднородными совокупностями.

7. Ежедневная реализация ткани артикула А в магазине Ткани в октябре месяце характеризовалась следующими данными (в метрах): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9, 5, 10, 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. Осуществить группировку данных, используя равные интервалы.

8. Перегруппировать результаты группировки данных из пункта 7 в следующие группы: (3-9), (9-15), 15-21).

Тема № 3 СТАТИСТИЧЕСКИЕ РЯДЫ РАСПРЕДЕЛЕНИЯ, ТАБЛИЦЫ, ГРАФИКА

3.1 Статистические ряды распределения – понятие, виды, формы представления

Одной из форм представления данных статистического наблюдения является статистический ряд распределения. Статистический ряд распределения – это упорядоченное расположение единиц совокупности на группы по группировочному признаку. С помощью статистических рядов распределения возможно изучение структуры и границ изменения совокупности, оценка однородности и определение закономерности развития единицсовокупности. По виду статистические ряды распределения подразделяются на атрибутивные, вариационные и временные ряды.

Атрибутивные и вариационные ряды состоят из двух элементов: варианты и частоты (частости или плотности). Варианта () – это конкретное значение признака, которое он принимает в ряду распределения. Частота () – это абсолютное число, показывающее, сколько раз (как часто) встречается в совокупности то или иное значение признака (варианта) или сколько единиц совокупности обладают тем или иным значением признака (вариантой). Частость () – это относительная величина, определяющая долю отдельных вариант в общем объеме совокупности (). Частость может быть выражена либо в долях, в этом случае объем совокупности равен единице (), либо в процентах, этом случае объем совокупности равен 100% (). В целом частость рассчитывается следующим образом

где - объем совокупности.

Плотность () - это относительная величина, показывающая, сколько единиц совокупности (в абсолютной или относительной форме) приходится на единицу длины интервала группы (). Плотность может быть абсолютной или относительной. Абсолюная плотность равна

Относительная плотность равна

При расчете относительной плотности используется частость, выраженная в долях.

Атрибутивный ряд – это ряд, построенный на основе качественного признака совокупности. Данные ряды строятся с помощью типологической группировки и могут быть выражены в виде таблицы. Например, распределение рабочих предприятия по тарифным разрядам (табл.3.1).

Таблица 3.1

В приведенном примере (табл.3.1) совокупностью являются все рабочие предприятия. Объем совокупности равен 250 человекам. Единицей совокупности является один рабочий. В качестве признака единицы совокупности выбран тарифный разряд. Признак имеет несколько конкретных значений – вариант (1 разряд, 2 разряд, 3 разряд, 4 разряд, 5 разряд). В таблице значения признака приведены в графе 2, значения частот в графе 3, значение частости в графе 4.

Вариационный ряд – это ряд, построенный на основе количественного признака совокупности. Данные ряды строятся, в основном, с помощью структурной группировки и могут быть выражены в виде таблицы. Вариационные ряды бывают двух типов: дискретные вариационный ряды и интервальные. Дискретный вариационный ряд – это ряд, в котором значения признака (варианты) представлены дискретными величинами . Интервальный вариационный ряд – это ряд, в котором значения признака выражены в виде интервалов . На основе данных о ежедневном обороте 34 индивидуальных предпринимателей, приведенных на стр. , построим вариационный интервальный ряд (табл.3.2)

Таблица 3.2

В графе 3 приведена частота – количество предпринимателей, однодневный оборот которых попадает в определенный интервал (гр.2). В графе 4 рассчитана частость в процентах по формуле 3.1. Так частость для первой группы (3,1 – 3,9) будет равна

Аналогичным образом рассчитывается частость и для других групп. В графе 5 приведена частость в долях. Она может быть получена либо путем расчета

либо путем преобразования процентов в доли . При расчетах данные в десятичной форме нужно показывать с точность до 3 знаков после запятой. Это повышает точность расчетов и получение соответствующих итоговых данных. Так сумма частостей в процентах должна быть равна 100%, а в долях – равна 1.

В графе 6 таблицы 3.2 приведены значения абсолютной плотности. Расчет выполнен по формуле 3.2. Так для первой группы абсолютная плотность будет равна

Если частота () взята из графы 3, то величина интервала () определена как разность между верхней границей (3,9) и нижней границей (3,1) интервала первой группы, т.о. . Аналогичным образом рассчитывается абсолютная плотность для других групп. После выполнения расчетов необходимо дать им экономическую интерпретацию. Так, например, абсолютная плотность первой группы говорит о том, что на каждую тысячу руб. оборота в первой группе приходится 5 предпринимателей.

В графе 7 таблицы 3.2 приведены значения относительной плотности. Расчет выполнен по формуле 3.3. Так для первой группы относительная плотность будет равна

Аналогичным образом рассчитываются относительная плотность и для других групп. Относительная плотность первой группы говорит о том, что доля предпринимателей, приходящих на каждую тысячу оборота в первой группе, равна 0,147.

В графе 2 табл.3.3 представлен оборот в виде интервалов, а в графе 3 представлен оборот в виде дискретных величин. Для первой группы дискретная величина рассчитана следующим образом

Аналогичным образом рассчитывается оборот в виде дискретной величины и для других групп.

Часто при анализе вариационных рядов возникает потребность в понимании изменения объема совокупности при изменении (в основном в порядке возрастания) значений признака. Для этого используются такие понятия как накопленные частоты или накопленные частости. Накопленные частоты ( ) – это сумма частот сначала ряда до определенного значения признака включительно. Накопленные частости – это сумма частостей от начала ряда до определенного значения признака включительно. Рассмотрим нахождение значений этих показателей по данным табл. 3.4 В графе 6 табл. 3.4 приведены накопленные частоты. В первой группе (гр.1) 4 предпринимателя (гр.4) имели оборот от 3,1 до 3,9 тыс. руб. (гр.2) или средний оборот 3,5 тыс. руб. (гр.3). Поскольку эта первая группа, постольку и накопленная частота т.е. количество предпринимателей будет равно 4 (гр.6). Во второй группе количество предпринимателей, имеющих оборот от 3,9 до 4,7 тыс. руб. или средний оборот в 4,3 тыс руб. равно 5 чел. Отсюда накопленная частота, т.е. количество предпринимателей, имеющих оборот от 3,1 до 4,7 тыс руб. или в среднем от и менее 4, 3 тыс. руб., будет равна 9=4+5. Для третьей группы накопленная частота будет равна 16=4+5+7 и т.д. Аналогичным образом рассчитывается и накопленная частость.

Наряду с первичным группировкой в??статистике находит широкое применение вторичное группировки. Вторичным группировкой называют образование новых групп на основе ранее проведенного группировки

Вторичное группировки используют для решения различных задач, важнейшими из которых являются: 1) образование на основе группам по количественным признакам качественно однородных групп (типов) 2) приведение двух (а или более) группам с различными интервалами к единому виду с целью сопоставимости и анализа, 3) образование более укрупненных групп, в которых яснее проявляется характер распределение.

Суть этого приема заключается в получении сопоставимых данных по различным группировках, для чего: численный состав группы (по проценту) фиксируется на одном уровне во всех группировках; по всем группировках уста овлюеться также равное число групп и одинаковое содержание групповых таблиц. Сравнению и сопоставлению подлежат не абсолютные показатели по группам, а относительные величины, процентное отношениея.

Различают два способа вторичного группировки: 1) путем преобразования интервалов первичного группировки (чаще простым укрупнением интервалов) и 2) путем закрепления за каждой группой определенной части единиц совокупности (частичное перегруппировки). При использовании этих способов вторичного группировки обычно предполагают, что распределение признака внутри интервалов будет равномернымм.

Применение вторичного группировки для приведения двух группам с различными интервалами к единому виду в целях сопоставимости проиллюстрируем на следующем примере. Для этого используем данные первичного декабря упування двух районов по численности работников животноводства (табл. 37.7).

. Таблица 37. Группировка хозяйств двух районов по численности работников животноводства

Район I

Район II

группы хозяйств по

группы хозяйств по

численности работников, чел

итоге

численности работников, чел

итоге

Непосредственно данные группам двух районов несопоставимы, так как хозяйства распределены по группам с различными интервалами: 20 чел в районе I и 30 чел в районе II. Число выделенных групп также неодинаковое

Для приведения двух группам в сопоставимый вид проведем вторичное группировки. С этой целью перегруппируют материалы в группы, единые для обоих районов: возьмем интервал 40 чел (табл. 38)

Поскольку есть возможность вторичное группировки хозяйств района I осуществить способом простого укрупнения интервалов (имеет место совпадение нижних и верхних интервалов в двух группировках), используем этот спос и б для решения поставленной задачи.

Поясним последовательность расчетов. В первую группу хозяйств с численностью работников до 160 чел войдут хозяйства I и II групп

. Таблица 38. Вторичное группировки хозяйств двух районов по численности работников животноводства

Удельный вес хозяйств этих групп в общем итоге составит 16% (12 апреля). Во вторую группу хозяйств с численностью работников от 160 до 200 чел войдут хозяйства III и IV групп их удельный вес га в общей сложности составит 45% (18 27). Аналогично выполняются расчеты при образовании остальных декабрягруп.

перегруппируют хозяйства района II. Поскольку укрупнение интервалов для хозяйств района II не подходит и задачи не решает используем способ частичного перегруппировки данных первичного группировками ня.

В первую, заново созданную группу хозяйств района II с численностью работников животноводства до 160 чел, полностью войдут хозяйства первичного группировки с таким же интервалом. Удельный вес хозяйств ств этой группы составляет 88%.

Во вторую группу хозяйств вторичного группировки с численностью работников от 160 до 200 чел полностью войдут хозяйства II группы (16%) и часть хозяйств III группы. Для определения части господ дарств, которую нужно взять с III группы, необходимо ее расчленить на подгруппы с численностью работников 190 - 200, 200 - 210, 210 - 220 чел. Показатели удельного веса хозяйств в этих подгруппах определяются я пропорционально делению величины интервала. Величина интервала, которую мы рассматриваем, составляет 30 чел и делится на три равные части. Для получения нужного интервала 160 - 200 чел до величины интервала II группы (160 - 190 чел) следует добавить одну треть величины интервала III группы (190 - 220 чел) и такую??же часть хозяйств этой группыієї групи.

Итак, во вторую, заново созданную группу хозяйств, войдут 16% хозяйств второй группы и одна треть III группы - 10% (1/3-30), что составит 26% от общей численности хозяйств района II

В III группу хозяйств вторичного группировки (200 - 240 чел) войдет часть хозяйств III группы (190 - 220 чел), оставшуюся - 20% (% -30) и две трети хозяйств IV группы (220 - 250 чел) - % (% -21), то есть 34% всей численности хозяйств района I II.

Аналогичные расчеты выполняются и при образовании остальных, заново созданных групп хозяйств: 240 - 280 и более 280 чел. Как бы в табл 37 наряду с данными об удельном весе хозяйств по группам были приведены и данные об их численности, то расчеты по заново созданных группах выполнялись бы в тех же соотношениях, что и по удельному весу хоств.

После вторичного группировки первичный материал становится сравнимым, поскольку для двух районов взяты одинаковые группы по численности работников. Из данных табл 38 видно, что распределение хозяйств по численности ю работников животноводства в двух районах существенно отличается: в районе I преобладают хозяйства с численностью работников животноводства до 200 чел (61% общей численности хозяйств), в районе II - хозяйства с численностью работников животноводства - более 200 чел (66% общей численности хозяйстврств).

Сведения о каждой единице анализируемой совокупности, полученные в результате первой стадии статистического исследования, характеризуют статистическое наблюдение с различных его сторон, так как они обладают многочисленными признаками и свойствами, которые изменяются во времени и пространстве. Для получения сводной характеристики всего объекта при помощи обобщающих показателей нужно систематизировать и обобщить результаты, которые были получены в ходе статистического наблюдения. Это даст нам возможность выявить особенности и черты статистической совокупности в целом и отдельных ее составляющих, обнаружить закономерности изучаемых социально–экономических явлений и процессов. Данную систематизацию называют сводкой первичного статистического материала.

Второй этап статистической работыстатистическая сводка – это обработка первичных данных в целях получения обобщенных характеристик изучаемого явления или процесса по ряду существенных для него признаков для выявления типичных черт и закономерностей, присущих явлению или процессу в целом.

Статистическая сводка – это переход от единичных данных к сведениям о группах единиц и совокупности в целом.

Проведение сводки включает три этапа:

1) предварительный контроль – это проверка данных;

2) группировка данных по заданным признакам – это определение производных показателей;

3) оформление результатов сводки в виде статистических таблиц, они являются удобной формой для восприятия полученной информации.

Смысловая согласованность статистических сведений – это предварительный контроль. В соответствии с программой статистической сводки для того, чтобы в дальнейшем предоставить полученную информацию в доступном для восприятия виде, используется статистическая группировка данных.

Полученные результаты группировки оформляются в виде группировочных таблиц, содержащих сводную характеристику исследуемой совокупности по одному или нескольким признакам, которые взаимосвязаны логикой анализа. Различают сводку простую и сложную. Сведения об отдельных единицах подытоживаются в целом по совокупности без разделения их на однородные группы. Итоги простой статистической сводки предназначаются для дальнейшей обработки материала, простая сводка также имеет самостоятельное познавательное значение.

Простая статистическая сводка – это операция по подсчету общих итоговых и групповых данных по совокупности единиц наблюдения и оформление этого материала в таблицах.

Простая статистическая сводка дает нам возможность определить число единиц изучаемой совокупности и объем изучаемых признаков, но тем самым простая сводка не дает нам представления о целостности состава изучаемой совокупности.

Если единицы совокупности разбивают на однородные группы, после этого подсчитывают итоги по каждой группе, а затем по всей совокупности в целом, такую статистическую сводку называют сложной. Сложная сводка позволяет нам изучить состав совокупности и выявить влияние одних признаков на другие, т. е раскрыть свойственные данной совокупности закономерности.

Сложная статистическая сводка – это комплекс операций. включающих распределение единиц наблюдения изучаемого социально–экономического явления или процесса на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц. На основе всестороннего теоретического анализа сущности и содержания изучаемых явлений и процессов проводится статистическая сводка. Программой и планом проведения статистической сводки обеспечивается достоверность и обоснованность ее результатов.

Программа статистической сводки содержит перечень групп на которые может быть разбита или разбивается совокупность единиц статистического наблюдения, а также систему показателей, характеризующих изучаемую совокупность явлений и процессов как в целом, так и отдельных ее частей. От целей и задач исследования зависит программа статистической сводки. Разработка программы включает следующие этапы:

1) выбирается группировочный признак для образования однородных групп;

2) определяется порядок формирования и число групп;

3) разрабатывается система статистических показателей для характеристики групп и объекта в целом;

4) создаются макеты статистических таблиц для предоставления результатов сводки.

Вместе с программой статистической сводки составляют план ее проведения. План должен содержать информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц.

Сводка также бывает децентрализованной и централизованной.

Децентрализованная статистическая сводка – это способ обобщения материала, который осуществляется снизу доверху по иерархической лестнице управления и на каждом из этапов подвергается обработке. Обработка данных производится на местах, т. е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а затем выводятся итоговые показатели в целом по социально–экономическому положению страны.

Централизованная статистическая сводка – это способ, при котором все первичные данные, полученные в результате статистического наблюдения, сосредоточиваются в одной центральной организации и подвергаются обработке от начала до конца.

По технике выполнения статистическая сводка бывает механизированная (с использованием электронно–вычислительной техники) и ручная.

2. Сущность и классификация группировок

Научно обоснованное распределение на группы дает возможность сделать правильные выводы об изучаемой совокупности и происходящих в ней процессах.

Принципы научной группировки были изложены в работах В. И. Ленина. Статистическая группировка, как указывал В. И. Ленин, не является второстепенным вопросом. Она требует всестороннего социально–экономического анализа изучаемых явлений, Решающее значение в статистической группировке имеет правильный выбор группировочных признаков в соответствии с задачами статистического исследования. В основу группировки должны быть положены самые существенные, самые важные для изучаемого вопроса признаки, которые позволят выявить социально–экономические типы явлений. Блестящим примером применения статистических группировок для выявления социально–экономических типов может служить таблица из работы В. И. Ленина «Развитие капитализма в России».

Статистическая группировка – это один из основных этапов проведения статистического исследования.

Процесс образования однородных групп на основе разделения статистической совокупности на части или объединение изучаемых статистических единиц в совокупности по определенным для них признакам называют статистической группировкой Важнейшим статистическим методом обобщения данных являются статистические группировки.

Три основных типа задач, решаемых с помощью метода статистической группировки:

1) выделение социально–экономических типов явлений;

2) изучение структуры явления и структурных сдвигов, происходящих в явлении;

3) выявление взаимосвязей и взаимозависимостей между явлениями и признаками, характеризующими эти явления. Различают следующие виды статистических группировок:

1) типологические;

2) структурные;

3) аналитические.

Качественно однородные группы совокупностей, т. е. объекты, которые по своим группировочным признакам близки друг к другу, называют типологической группировкой.

Примером типологической группировки являются: группировка земель, по формам собственности. Основное внимание в типологической группировке должно уделяться идентификации типов и выбору группировочного признака. Для построения типологической группировки необходимо воспользоваться количественными и качественными (атрибутивными) признаками.

Группировка по атрибутивному признаку предполагает, что число выделенных групп соответствует фактическому числу градаций этого признака. По количественному признаку необходимо правильно установить интервал группировки, определить необходимое число групп. Проблема определения интервалов типологической группировки решается на основании выделения таких количественных границ изменения группировочного признака, при которых явление изменяет или приобретает новое качество.

В типологической группировке от числа существующих социально–экономических типов зависит число групп. От состава, структуры однородных групп и изучения вариации признаков внутри однотипной совокупности и однотипных групп на основе построения структурной группировки зависят социально–экономические типы явлений. Разделение однородной совокупности на определенные группы, которые в дальнейшем будут характеризовать структуру по определенному группировочному признаку, называют структурной группировкой. Здесь также рассматриваются количественные и атрибутивные признаки. Примером является группировка рабочих склада по квалификации.

По атрибутивному признаку группы отличаются друг от друга по характеру признака. Количественный признак также предполагает определение числа групп и ширины интервала.

Основная задача статистических группировок – исследование связей и зависимостей между признаками единиц статистической совокупности, которая решается с помощью построения аналитических группировок. Аналитическая группировка – это группировка, выявляющая взаимосвязи и взаимозависимости между изучаемыми социально–экономическими явлениями и признаками, их характеризующими.

Все признаки в статистической науке можно подразделять на факторные и результативные. Признаки, которые оказывают большое влияние на изменение результативных признаков, называют факторными. Признаки, изменяющиеся под влиянием факторных признаков, называют результативными.

Важная задача при построении аналитической группировки – выбор числа групп, на которые необходимо разбить изучаемую совокупность единиц наблюдения, и определение их границ.

Требования, которые необходимо соблюдать в процессе построения аналитических группировок, это: каждая изучаемая группа должна содержать однородные единицы совокупности по груп–пировочному признаку, и количество единиц в каждой изучаемой группе должно быть достаточным для того, чтобы получить статистические характеристики изучаемого объекта.

Простой называется группировка, если группа образована только по одному признаку. Если разбить группу на подгруппу в соответствии с определенными признаками, то такую группировку называют комбинированной.

Комбинационной считается группировка, когда разбивка совокупности на группы производится по двум и более группировоч–ным признакам, взятым в сочетании (комбинации) друг с другом Комбинационные группировки позволяют изучать единицы совокупности одновременно по нескольким признакам.

При изучении сложных социально–экономических явлений и процессов применяются комбинационные группировки. Для того чтобы построить комбинационную группировку, необходимо выявить наличие достаточно большого числа наблюдений.

Для того чтобы найти скопление (в мерном пространстве) объектов (точек), необходимо применить многомерную группировку Различают группировки по используемой информации:

1) первичные – производятся на основе исходных данных которые были получены в результате статистического наблюдения;

2) вторичные – это результат соединения или расчленения группировки.

3. Принципы построения группировок

Для построения статистических группировок нужно выбрать группировочный признак, далее определить количество групп, на которые разбивают изучаемую статистическую совокупность и зафиксировать границы интервалов группировки. Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.

Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом. Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования.

В группировку входят количественные и атрибутивные (качественные) признаки. Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.). Атрибутивные признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака. Число групп, на которые расчленяется статистическая совокупность, зависит от количества градаций атрибутивного признака.

Важно изучить экономическую сущность исследуемого явления при построении группировки по количественному признаку.

Для определения числа групп можно воспользоваться формулой Стерджесса:

h + 3,322 ? lg N,

где h – число групп;

N – число единиц совокупности;

lgN – десятичный логарифм от N.

Данная формула говорит о том, что выбор числа групп объектно зависит от объема совокупности. После установления числа групп решается вопрос об определении интервалов группировки.

На основе интервала группировки можно количественно различить одни группы от других и наметить границы выделения их нового качества. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.

Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.

Ширина интервала – это разность между верхней и нижней границами. Интервалы группировки в зависимости от их ширины бывают равными и неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

Величина равного интервала определяется по следующей формуле:

h = R/n = (х мах – х min) / n,

гдех мах,х min – максимальное и минимальное значение признака в совокупности;

n – число групп.

Данную формулу называют шагом интервала. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов. Выбор равных или неравных интервалов зависит от степени заполнения интервалов. Интервалы группировок могут быть закрытыми и открытыми Закрытыми интервалами являются интервалы, в которых указаны верхняя и нижняя границы. Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего). К количественным признакам можно отнести непрерывный признак, или дискретный. Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.

В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы. Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях. По роли, которую играют признаки во взаимосвязи изучаемых объектов, процессов или явлений, их можно подразделить на факторные и результативные. Факторные признаки воздействуют на другие признаки, а результативные испытывают на себе влияние других признаков.

Группировки различают:

  1. Первичные , составленные на основе первичного материала собранного при наблюдениях.
  2. Вторичные , составленные на основе первичных, используется в двух случаях:
    • когда необходимо мелкие формальные группы, переформировать, в более крупные;
    • когда надо дать сравнительную оценку материалов собранных в разных местах и по различным методикам.
Группировка, составленная по двум или более признакам, называется – комбинационной .
Признак, по которому происходит выделение групп или типов явлений, называется группировочным или основанием группировки . Основание может быть количественным или атрибутивным. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).

Пример №1 . Имеются следующие данные о распределении торговых фирм по численности работников двух регионов.


Постройте вторичную группировку данных о распределении фирм, пересчитав данные региона 1 в соответствии с группировкой региона 2. В каком регионе средняя численность работников больше?

Решение:
В первую группу «Менее 5» войдет 4/5 от группы «1-5». Тогда число фирм составит: 6*4/5 = 4,8 ≈ 5.
В группу «5-10» полностью входит группа «6-10» и часть группы «1-5», т.е. число фирма будет равно 4 + (6-5) = 5
В группу «11-20» полностью войдет группа «11-15» и часть группы «16-20», а именно ¼*50 = 12,5 ≈ 13.
В группу «21 -30» полностью входит группа «16-20» и группа «21-25», а группа «более 25». Получаем: (50-13) + 20 + 15 = 72


Находим среднюю численность работников:
Для первого региона.

Средняя взвешенная: x ср = 1960/105 = 18,67

Для второго региона.


Средняя взвешенная: x ср = 3502,5/117 = 29,94
Таким образом, во втором регионе средняя численность работников больше.

Пример №2 .
Распределение рабочих по стажу работы

№ группы Группы рабочих по стажу, лет Число рабочих, чел. Число рабочих в процентах к итогу
I 2-6 6 30,0
II 6-10 6 30,0
III 10-14 5 25,0
IV 14-18 3 15,0
ИТОГО 20 100,0

В ряду распределения, для наглядности, изучаемый признак исчисляют в процентах. Результаты первичной группировки показали, что 60,0% рабочих имеют стаж до 10 лет, причем поровну от 2-6 лет – 30% и от 6-10 лет – 30%, а 40% рабочих имеют стаж от 10 до 18 лет.
Для изучения зависимости между стажем работы и выработкой необходимо построить аналитическую группировку. В основании ее возьмем те же группы, что в ряду распределения. Результаты группировки представим в таблице 2.

Таблица 2 - Группировка рабочих по стажу работы

№ группы Группы рабочих по стажу лет Число рабочих, чел. Средний стаж работы, лет Выработка продукции, руб.
Всего На одного раб.
I 2-6 6 3,25 1335,0 222,5
II 6-10 6 7,26 1613,0 268,8
III 10-14 5 11,95 1351,0 270,2
IV 14-18 3 16,5 965,0 321,6
ИТОГО: 20 8,62 5264 236

Для заполнения таблицы 2. необходимо составить рабочею таблицу 3.

Таблица 3.

№ п/п Группы рабочих по стажу, лет Номер рабочего Стаж Выработка в руб.
1 2 3 4 5
1 2-6 1, 2, 3, 4, 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
Итого по группе: 6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
Итого по группе 6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
Итого по группе 5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
Итого по группе 3 49,5 965
Всего 20 172.4 5264,0

Разделив графы (4:3); (5:3) табл. 3 получим соответствующие данные для заполнения таблицы 2. Итак далее по всем группам. Заполнив таблицу 2. получим аналитическую таблицу.
Рассчитав рабочую таблицу сверяем итоговые результаты таблицы с данными условия задачи, они должны совпадать. Таким образом, кроме построения группировок, нахождения средних величин, проверим еще арифметический контроль.
Анализируя аналитическую таблицу 2, можно сделать вывод о том, что и изучаемые признаки (показатели) зависят друг от друга. С ростом стажа работы постоянно увеличивается выработка продукции на одного рабочего. Выработка рабочих четвертой группы на 99,1 руб. выше, чем первой или на 44,5 % мы рассмотрели пример группировки по одному признаку. Но в ряде случаев для решения поставленных задач такая группировка является недостаточной. В таких случаях переходят к группировке по двум или более признакам, т.е. к комбинационной. Произведем вторичную группировку данных по средней выработке продукции.
Каждую группу охарактеризуем числом рабочих, средним стажем работы, средней выработкой – всего и на одного рабочего расчеты представлены в таблице 4.

Таблица 4 - Группировка рабочих по стажу и средней выработке продукции

№ п/п Группы рабочих Число раб., чел. Сред. стаж работы, лет Средняя выработка прод., руб.
по стажу по средней выраб. прод. в руб. всего на одного раб.
1 2-6 200,0-250,0 4 2,5 835,0 208,75
Итого по группе 6 3,25 1335,0 222,5
2 6-10 200,0-250,0 - - - -
3 10-14 200,0-250,0 1 12,5 230,0 230,0
Итого по группе 5 11,96 1351,0 270,2
4 14-18 200,0-250,0 - - - -
Итого по группе 3 16,5 965,0 321,6
Итого по группам 200,0-250,0 5 3,0 1065,0 213,0
Всего 20 8,62 5264 263,2

Для построения вторичной аналитической группировки по средней выработке продукции в пределах первоначально созданных групп, определим интервал вторичной группировки, выделив при этом три группы, т.е. на одну меньше чем в первоначальной группировке.
Тогда, i=(350-200)/3 = 50 руб.
Больше групп брать нет смысла, будет очень маленький интервал, меньше можно. Итоговые данные по группе рассчитываются как сумма стажа по группе, направить по первой 19, 5 лет делится на число рабочих – 6 человек, получим 3,25 года.
Данные таблицы показывают, что выработка продукции находится в прямой зависимости от стажа работы.

Иногда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности, либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа, необходимо имеющуюся группировку несколько изменить: объединить ранее выделенные относительно мелкие группы в небольшое число более крупных типичных групп или изменить границы прежних групп, с тем чтобы сделать группировку сопоставимой с другими.