Биографии Характеристики Анализ

Как найти среднеарифметическое значение. Средняя арифметическая

Начиная рассуждать о средних величинах, чаще всего вспоминают, как заканчивали школу и поступали в учебное заведение. Тогда по аттестату рассчитывался средний балл: все оценки (и хорошие, и не очень) складывали, полученную сумму делили на их количество. Так вычисляется самый простой вид средней, которая называется средняя арифметическая простая. На практике в статистике применяются различные виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая, структурные средние. Тот или иной их вид используется в зависимости от характера данных и целей исследования.

Средняя величина является наиболее распространенным статистическим показателем, с помощью которого дается обобщающая характеристика совокупности однотипных явлений по одному из варьирующих признаков. Она показывает уровень признака в расчете на единицу совокупности. С помощью средних величин проводится сравнение различных совокупностей по варьирующим признакам, изучаются закономерности развития явлений и процессов общественной жизни.

В статистике применяются два класса средних: степенные (аналитические) и структурные. Последние используются для характеристики структуры вариационного ряда и будут рассмотрены далее в гл. 8.

К группе степенных средних относят среднюю арифметическую, гармоническую, геометрическую, квадратическую. Индивидуальные формулы для их вычисления можно привести к виду, общему для всех степенных средних, а именно

где m - показатель степенной средней: при m = 1 получаем формулу для вычисления средней арифметической, при m = 0 - средней геометрической, m = -1 - средней гармонической, при m = 2 - средней квадратической;

x i - варианты (значения, которые принимает признак);

f i - частоты.

Главным условием, при котором можно использовать степенные средние в статистическом анализе, является однородность совокупности, которая не должна содержать исходных данных, резко различающихся по своему количественному значению (в литературе они носят название аномальных наблюдений).

Продемонстрируем важность этого условия на следующем примере.

Пример 6.1. Вычислим среднюю заработную плату сотрудников малого предприятия.

Таблица 6.1. Заработная плата работников
№ п/п Заработная плата, руб. № п/п Заработная плата, руб.
1 5 950 11 7 000
2 6 790 12 5 950
3 6 790 13 6 790
4 5 950 14 5 950
5 7 000 5 6 790
6 6 790 16 7 000
7 5 950 17 6 790
8 7 000 18 7 000
9 6 790 19 7 000
10 6 790 20 5 950

Для расчета среднего размера заработной платы необходимо просуммировать заработную плату, начисленную всем работникам предприятия (т.е. найти фонд заработной платы), и разделить на число работающих:


А теперь добавим в нашу совокупность всего лишь одного человека (директора этого предприятия), но с окладом в 50 000 руб. В таком случае вычисляемая средняя будет совсем другая:

Как видим, она превышает 7000 руб., т.д. она больше всех значений признака за исключением одного-единственного наблюдения.

Для того чтобы таких случаев не происходило на практике, и средняя не теряла бы своего смысла (в примере 6.1 она уже не выполняет роль обобщающей характеристики совокупности, которой должна быть), при расчете средней следует аномальные, резко выделяющиеся наблюдения либо исключить из анализа и тем самым сделать совокупность однородной, либо разбить совокупность на однородные группы и вычислить средние значения по каждой группе и анализировать не общую среднюю, а групповые средние значения.

6.1. Средняя арифметическая и ее свойства

Средняя арифметическая вычисляется либо как простая, либо как взвешенная величина.

При расчете средней заработной платы по данным таблицы примера 6.1 мы сложили все значения признака и поделили на их количество. Ход наших вычислений запишем в виде формулы средней арифметической простой

где х i - варианты (отдельные значения признака);

п - число единиц в совокупности.

Пример 6.2. Теперь сгруппируем наши данные из таблицы примера 6.1, т.д. построим дискретный вариационный ряд распределения работающих по уровню заработной платы. Результаты группировки представлены в таблице.

Запишем выражение для вычисления среднего уровня заработной платы в более компактной форме:

В примере 6.2 была применена формула средней арифметической взвешенной

где f i - частоты, показывающие, сколько раз встречается значение признака х i y единиц совокупности.

Расчет средней арифметической взвешенной удобно проводить в таблице, как это показано ниже (табл. 6.3):

Таблица 6.3. Расчет средней арифметической в дискретном ряду
Исходные данные Расчетный показатель
заработная плата, руб. численность работающих, чел. фонд заработной платы, руб.
x i f i x i f i
5 950 6 35 760
6 790 8 54 320
7 000 6 42 000
Итого 20 132 080

Следует отметить, что средняя арифметическая простая используется в тех случаях, когда данные не сгруппированы или сгруппированы, но все частоты равны между собой.

Часто результаты наблюдения представляют в виде интервального ряда распределения (см. таблицу в примере 6.4). Тогда при расчете средней в качестве x i берут середины интервалов. Если первый и последний интервалы открыты (не имеют одной из границ), то их условно "закрывают", принимая за величины данного интервала величину примыкающего интервала, т.д. первый закрывают исходя из величины второго, а последний - по величине предпоследнего.

Пример 6.3. По результатам выборочного обследования одной из групп населения рассчитаем размер среднедушевого денежного дохода.

В приведенной таблице середина первого интервала равна 500. Действительно, величина второго интервала - 1000 (2000-1000); тогда нижняя граница первого равна 0 (1000-1000), а его середина - 500. Аналогично поступаем с последним интервалом. За его середину принимаем 25 000: величина предпоследнего интервала 10 000 (20 000-10 000), тогда его верхняя граница - 30 000 (20 000 + 10 000), а середина, соответственно, - 25 000.

Таблица 6.4. Расчет средней арифметической в интервальном ряду
Среднедушевой денежный доход, руб. в месяц Численность населения к итогу, % f i Середины интервалов x i x i f i
До 1 000 4,1 500 2 050
1 000-2 000 8,6 1 500 12 900
2 000-4 000 12,9 3 000 38 700
4 000-6 000 13,0 5 000 65 000
6 000-8 000 10,5 7 000 73 500
8 000-10 000 27,8 9 000 250 200
10 000-20 000 12,7 15 000 190 500
20 000 и выше 10,4 25 000 260 000
Итого 100,0 - 892 850

Тогда среднедушевой размер месячного дохода составит

Тема среднего арифметического и среднего геометрического входит в программу математики 6-7 классов. Так как параграф довольно прост для понимания, его быстро проходят, и к завершению учебного года школьники его забывают. Но знания в базовой статистике нужны для сдачи ЕГЭ, а также для международных экзаменов SAT. Да и для повседневной жизни развитое аналитическое мышление никогда не помешает.

Как вычислить среднее арифметическое и среднее геометрическое чисел

Допустим, имеется ряд чисел: 11, 4, и 3. Средним арифметическим называется сумма всех чисел, поделенная на количество данных чисел. То есть в случае чисел 11, 4, 3, ответ будет 6. Как образом получается 6?

Решение: (11 + 4 + 3) / 3 = 6

В знаменателе должно стоять число, равное количеству чисел, среднее которых нужно найти. Сумма делится на 3, так как слагаемых три.

Теперь надо разобраться со средним геометрическим. Допустим, есть ряд чисел: 4, 2 и 8.

Средним геометрическим чисел называется произведение всех данных чисел, находящееся под корнем со степенью, равной количеству данных чисел.То есть в случае чисел 4, 2 и 8 ответом будет 4. Вот каким образом это получилось:

Решение: ∛(4 × 2 × 8) = 4

В обоих вариантах получились целые ответы, так как для примера были взяты специальные числа. Так происходит отнюдь не всегда. В большинстве случаев ответ приходится округлять или оставлять под корнем. Например, для чисел 11, 7 и 20 среднее арифметическое ≈ 12,67, а среднее геометрическое - ∛1540. А для чисел 6 и 5 ответы, соответственно, будут 5,5 и √30.

Может ли так произойти, что среднее арифметическое станет равным среднему геометрическому?

Конечно, может. Но только в двух случаях. Если имеется ряд чисел, состоящий только либо из единиц, либо из нулей. Примечательно также то, что ответ не зависит от их количества.

Доказательство с единицами: (1 + 1 + 1) / 3 = 3 / 3 = 1 (среднее арифметическое).

∛(1 × 1 × 1) = ∛1 = 1(среднее геометрическое).

Доказательство с нулями: (0 + 0) / 2=0 (среднее арифметическое).

√(0 × 0) = 0 (среднее геометрическое).

Другого варианта нет и быть не может.

В процессе различных расчетов и работы с данными довольно часто требуется подсчитать их среднее значение. Оно рассчитывается путем сложения чисел и деления общей суммы на их количество. Давайте выясним, как вычислить среднее значение набора чисел при помощи программы Microsoft Excel различными способами.

Самый простой и известный способ найти среднее арифметическое набора чисел — это воспользоваться специальной кнопкой на ленте Microsoft Excel. Выделяем диапазон чисел, расположенных в столбце или в строке документа. Находясь во вкладке «Главная», жмем на кнопку «Автосумма», которая расположена на ленте в блоке инструментов «Редактирование». Из выпадающее списка выбираем пункт «Среднее».

После этого, с помощью функции «СРЗНАЧ», производится расчет. В ячейку под выделенным столбцом, или справа от выделенной строки, выводится средняя арифметическая данного набора чисел.

Этот способ хорош простотой и удобством. Но, у него имеются и существенные недостатки. С помощью этого способа можно произвести подсчет среднего значения только тех чисел, которые располагаются в ряд в одном столбце, или в одной строке. А вот, с массивом ячеек, или с разрозненными ячейками на листе, с помощью этого способа работать нельзя.

Например, если выделить два столбца, и вышеописанным способом вычислить среднее арифметическое, то ответ будет дан для каждого столбца в отдельности, а не для всего массива ячеек.

Вычисление с помощью Мастера функций

Для случаев, когда нужно подсчитать среднюю арифметическую массива ячеек, или разрозненных ячеек, можно использовать Мастер функций. Он применяет все ту же функцию «СРЗНАЧ», известную нам по первому методу вычисления, но делает это несколько другим способом.

Кликаем по ячейке, где хотим, чтобы выводился результат подсчета среднего значения. Жмем на кнопку «Вставить функцию», которая размещена слева от строки формул. Либо же, набираем на клавиатуре комбинацию Shift+F3.

Запускается Мастер функций. В списке представленных функций ищем «СРЗНАЧ». Выделяем его, и жмем на кнопку «OK».

Открывается окно аргументов данной функции. В поля «Число» вводятся аргументы функции. Это могут быть как обычные числа, так и адреса ячеек, где эти числа расположены. Если вам неудобно вводить адреса ячеек вручную, то следует нажать на кнопку расположенную справа от поля ввода данных.

После этого, окно аргументов функции свернется, а вы сможете выделить ту группу ячеек на листе, которую берете для расчета. Затем, опять нажимаете на кнопку слева от поля ввода данных, чтобы вернуться в окно аргументов функции.

Если вы хотите подсчитать среднее арифметическое между числами, находящимися в разрозненных группах ячеек, то те же самые действия, о которых говорилось выше, проделывайте в поле «Число 2». И так до тех пор, пока все нужные группы ячеек не будут выделены.

После этого, жмите на кнопку «OK».

Результат расчета среднего арифметического будет выделен в ту ячейку, которую вы выделили перед запуском Мастера функций.

Панель формул

Существует ещё третий способ запустить функцию «СРЗНАЧ». Для этого, переходим во вкладку «Формулы». Выделяем ячейку, в которой будет выводиться результат. После этого, в группе инструментов «Библиотека функций» на ленте жмем на кнопку «Другие функции». Появляется список, в котором нужно последовательно перейти по пунктам «Статистические» и «СРЗНАЧ».

Затем, запускается точно такое же окно аргументов функции, как и при использовании Мастера функций, работу в котором мы подробно описали выше.

Дальнейшие действия точно такие же.

Ручной ввод функции

Но, не забывайте, что всегда при желании можно ввести функцию «СРЗНАЧ» вручную. Она будет иметь следующий шаблон: «=СРЗНАЧ(адрес_диапазона_ячеек(число); адрес_диапазона_ячеек(число)).

Конечно, этот способ не такой удобный, как предыдущие, и требует держать в голове пользователя определенные формулы, но он более гибкий.

Расчет среднего значения по условию

Кроме обычного расчета среднего значения, имеется возможность подсчета среднего значения по условию. В этом случае, в расчет будут браться только те числа из выбранного диапазона, которые соответствуют определенному условию. Например, если эти числа больше или меньше конкретно установленного значения.

Для этих целей, используется функция «СРЗНАЧЕСЛИ». Как и функцию «СРЗНАЧ», запустить её можно через Мастер функций, из панели формул, или при помощи ручного ввода в ячейку. После того, как открылось окно аргументов функции, нужно ввести её параметры. В поле «Диапазон» вводим диапазон ячеек, значения которых будут участвовать в определении среднего арифметического числа. Делаем это тем же способом, как и с функцией «СРЗНАЧ».

А вот, в поле «Условие» мы должны указать конкретное значение, числа больше или меньше которого будут участвовать в расчете. Это можно сделать при помощи знаков сравнения. Например, мы взяли выражение «>=15000». То есть, для расчета будут браться только ячейки диапазона, в которых находятся числа большие или равные 15000. При необходимости, вместо конкретного числа, тут можно указать адрес ячейки, в которой расположено соответствующее число.

Поле «Диапазон усреднения» не обязательно для заполнения. Ввод в него данных является обязательным только при использовании ячеек с текстовым содержимым.

Когда все данные введены, жмем на кнопку «OK».

После этого, в предварительно выбранную ячейку выводится результат расчета среднего арифметического числа для выбранного диапазона, за исключением ячеек, данные которых не отвечают условиям.

Как видим, в программе Microsoft Excel существует целый ряд инструментов, с помощью которых можно рассчитать среднее значение выбранного ряда чисел. Более того, существует функция, которая автоматически отбирает числа из диапазона, не соответствующие заранее установленному пользователем критерию. Это делает вычисления в приложении Microsoft Excel ещё более удобными для пользователей.

У этого термина существуют и другие значения, см. среднее значение.

Сре́днее арифмети́ческое (в математике и статистике) множества чисел - сумма всех чисел, делённая на их количество. Является одной из наиболее распространённых мер центральной тенденции.

Предложена (наряду со средним геометрическим и средним гармоническим) ещё пифагорейцами.

Частными случаями среднего арифметического являются среднее (генеральной совокупности) и выборочное среднее (выборки).

Введение

Обозначим множество данных X = (x 1 , x 2 , …, x n ), тогда выборочное среднее обычно обозначается горизонтальной чертой над переменной (x ¯ {\displaystyle {\bar {x}}} , произносится «x с чертой»).

Для обозначения среднего арифметического всей совокупности используется греческая буква μ. Для случайной величины, для которой определено среднее значение, μ есть вероятностное среднее или математическое ожидание случайной величины. Если множество X является совокупностью случайных чисел с вероятностным средним μ, тогда для любой выборки x i из этой совокупности μ = E{x i } есть математическое ожидание этой выборки.

На практике разница между μ и x ¯ {\displaystyle {\bar {x}}} в том, что μ является типичной переменной, потому что видеть можно скорее выборку, а не всю генеральную совокупность. Поэтому, если выборку представлять случайным образом (в терминах теории вероятностей), тогда x ¯ {\displaystyle {\bar {x}}} (но не μ) можно трактовать как случайную переменную, имеющую распределение вероятностей на выборке (вероятностное распределение среднего).

Обе эти величины вычисляются одним и тем же способом:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {1}{n}}(x_{1}+\cdots +x_{n}).}

Если X - случайная переменная, тогда математическое ожидание X можно рассматривать как среднее арифметическое значений в повторяющихся измерениях величины X . Это является проявлением закона больших чисел. Поэтому выборочное среднее используется для оценки неизвестного математического ожидания.

В элементарной алгебре доказано, что среднее n + 1 чисел больше среднего n чисел тогда и только тогда, когда новое число больше чем старое среднее, меньше тогда и только тогда, когда новое число меньше среднего, и не меняется тогда и только тогда, когда новое число равно среднему. Чем больше n , тем меньше различие между новым и старым средними значениями.

Заметим, что имеется несколько других «средних» значений, в том числе среднее степенное, среднее Колмогорова, гармоническое среднее, арифметико-геометрическое среднее и различные средне-взвешенные величины (например, среднее арифметическое взвешенное, среднее геометрическое взвешенное, среднее гармоническое взвешенное).

Примеры

  • Для трёх чисел необходимо сложить их и разделить на 3:
x 1 + x 2 + x 3 3 . {\displaystyle {\frac {x_{1}+x_{2}+x_{3}}{3}}.}
  • Для четырёх чисел необходимо сложить их и разделить на 4:
x 1 + x 2 + x 3 + x 4 4 . {\displaystyle {\frac {x_{1}+x_{2}+x_{3}+x_{4}}{4}}.}

Или проще 5+5=10, 10:2. Потому что мы складывали 2 числа, а значит, сколько чисел складываем, на столько и делим.

Непрерывная случайная величина

Для непрерывно распределённой величины f (x) {\displaystyle f(x)} среднее арифметическое на отрезке [ a ; b ] {\displaystyle } определяется через определённый интеграл:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x {\displaystyle {\overline {f(x)}}_{}={\frac {1}{b-a}}\int _{a}^{b}f(x)dx}

Некоторые проблемы применения среднего

Отсутствие робастности

Основная статья: Робастность в статистике

Хотя среднее арифметическое часто используется в качестве средних значений или центральных тенденций, это понятие не относится к робастной статистике, что означает, что среднее арифметическое подвержено сильному влиянию «больших отклонений». Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию «среднего», а значения среднего из робастной статистики (например, медиана) может лучше описывать центральную тенденцию.

Классическим примером является подсчёт среднего дохода. Арифметическое среднее может быть неправильно истолковано в качестве медианы, из-за чего может быть сделан вывод, что людей с большим доходом больше, чем на самом деле. «Средний» доход истолковывается таким образом, что доходы большинства людей находятся вблизи этого числа. Этот «средний» (в смысле среднего арифметического) доход является выше, чем доходы большинства людей, так как высокий доход с большим отклонением от среднего делает сильный перекос среднего арифметического (в отличие от этого, средний доход по медиане «сопротивляется» такому перекосу). Однако, этот «средний» доход ничего не говорит о количестве людей вблизи медианного дохода (и не говорит ничего о количестве людей вблизи модального дохода). Тем не менее, если легкомысленно отнестись к понятиям «среднего» и «большинство народа», то можно сделать неверный вывод о том, что большинство людей имеют доходы выше, чем они есть на самом деле. Например, отчёт о «среднем» чистом доходе в Медине, штат Вашингтон, подсчитанный как среднее арифметическое всех ежегодных чистых доходов жителей, даст на удивление большое число из-за Билла Гейтса. Рассмотрим выборку (1, 2, 2, 2, 3, 9). Среднее арифметическое равно 3.17, но пять значений из шести ниже этого среднего.

Сложный процент

Основная статья: Окупаемость инвестиций

Если числа перемножать , а не складывать , нужно использовать среднее геометрическое, а не среднее арифметическое. Наиболее часто этот казус случается при расчёте окупаемости инвестиций в финансах.

Например, если акции в первый год упали на 10 %, а во второй год выросли на 30 %, тогда некорректно вычислять «среднее» увеличение за эти два года как среднее арифметическое (−10 % + 30 %) / 2 = 10 %; правильное среднее значение в этом случае дают совокупные ежегодные темпы роста, по которым годовой рост получается только около 8,16653826392 % ≈ 8,2 %.

Причина этого в том, что проценты имеют каждый раз новую стартовую точку: 30 % - это 30 % от меньшего, чем цена в начале первого года, числа: если акции в начале стоили $30 и упали на 10 %, они в начале второго года стоят $27. Если акции выросли на 30 %, они в конце второго года стоят $35.1. Арифметическое среднее этого роста 10 %, но поскольку акции выросли за 2 года всего на $5.1, средний рост в 8,2 % даёт конечный результат $35.1:

[$30 (1 - 0.1) (1 + 0.3) = $30 (1 + 0.082) (1 + 0.082) = $35.1]. Если же использовать таким же образом среднее арифметическое значение 10 %, мы не получим фактическое значение: [$30 (1 + 0.1) (1 + 0.1) = $36.3].

Сложный процент в конце 2 года: 90 % * 130 % = 117 % , то есть общий прирост 17 %, а среднегодовой сложный процент 117 % ≈ 108.2 % {\displaystyle {\sqrt {117\%}}\approx 108.2\%} , то есть среднегодовой прирост 8,2 %.

Направления

Основная статья: Статистика направлений

При расчёте среднего арифметического значений некоторой переменной, изменяющейся циклически (например, фаза или угол), следует проявлять особую осторожность. Например, среднее чисел 1° и 359° будет равно 1 ∘ + 359 ∘ 2 = {\displaystyle {\frac {1^{\circ }+359^{\circ }}{2}}=} 180°. Это число неверно по двум причинам.

  • Во-первых, угловые меры определены только для диапазона от 0° до 360° (или от 0 до 2π при измерении в радианах). Таким образом, ту же пару чисел можно было бы записать как (1° и −1°) или как (1° и 719°). Средние значения каждой из пар будут отличаться: 1 ∘ + (− 1 ∘) 2 = 0 ∘ {\displaystyle {\frac {1^{\circ }+(-1^{\circ })}{2}}=0^{\circ }} , 1 ∘ + 719 ∘ 2 = 360 ∘ {\displaystyle {\frac {1^{\circ }+719^{\circ }}{2}}=360^{\circ }} .
  • Во-вторых, в данном случае, значение 0° (эквивалентное 360°) будет геометрически лучшим средним значеним, так как числа отклоняются от 0° меньше, чем от какого-либо другого значения (у значения 0° наименьшая дисперсия). Сравните:
    • число 1° отклоняется от 0° всего на 1°;
    • число 1° отклоняется от вычисленного среднего, равного 180°, на 179°.

Среднее значение для циклической переменной, рассчитанное по приведённой формуле, будет искусственно сдвинуто относительно настоящего среднего к середине числового диапазона. Из-за этого среднее рассчитывается другим способом, а именно, в качестве среднего значения выбирается число с наименьшей дисперсией (центральная точка). Также вместо вычитания используется модульное расстояние (то есть, расстояние по окружности). Например, модульное расстояние между 1° и 359° равно 2°, а не 358° (на окружности между 359° и 360°==0° - один градус, между 0° и 1° - тоже 1°, в сумме - 2°).

Виды средних величин и методы их расчета

На этапе статистической обработки могут быть поставлены самые различные задачи исследования, для решения которых нужно выбрать соответствующую среднюю. При этом необходимо руководствоваться следующим правилом: величины, которые представляют собой числитель и знаменатель средней, должны быть логически связаны между собой.

  • степенные средние ;
  • структурные средние .

Введем следующие условные обозначения:

Величины, для которых исчисляется средняя;

Средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений;

Частота (повторяемость индивидуальных значений признака).

Различные средние выводятся из общей формулы степенной средней:

(5.1)

при k = 1 - средняя арифметическая; k = -1 - средняя гармоническая; k = 0 - средняя геометрическая; k = -2 - средняя квадратическая.

Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи с чем каждый вариант приходится умножать на эту численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней .

Средняя арифметическая - самый распространенный вид средней. Она используется, когда расчет осуществляется по несгруппированным статистическим данным, где нужно получить среднее слагаемое. Средняя арифметическая - это такое среднее значение признака, при получении которого сохраняется неизменным общий объем признака в совокупности.

Формула средней арифметической (простой ) имеет вид

где n - численность совокупности.

Например, средняя заработная плата работников предприятия вычисляется как средняя арифметическая:

Определяющими показателями здесь являются заработная плата каждого работника и число работников предприятия. При вычислении средней общая сумма заработной платы осталась прежней, но распределенной как бы между всеми работниками поровну. К примеру, необходимо вычислить среднюю заработную плату работников небольшой фирмы, где заняты 8 человек:

При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной , которая имеет вид

(5.3)

Так, нам необходимо рассчитать средний курс акций какого-то акционерного общества на торгах фондовой биржи. Известно, что сделки осуществлялись в течение 5 дней (5 сделок), количество проданных акций по курсу продаж распределилось следующим образом:

1 - 800 ак. - 1010 руб.

2 - 650 ак. - 990 руб.

3 - 700 ак. - 1015 руб.

4 - 550 ак. - 900 руб.

5 - 850 ак. - 1150 руб.

Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА):

ОСС = 1010 ·800+990·650+1015·700+900·550+1150·850= 3 634 500;

КПА = 800+650+700+550+850=3550.

В этом случае средний курс стоимости акций был равен

Необходимо знать свойства арифметической средней, что очень важно как для ее использования, так и при ее расчете. Можно выделить три основных свойства, которые наиболее всего обусловили широкое применение арифметической средней в статистико-экономических расчетах.

Свойство первое (нулевое ): сумма положительных отклонений индивидуальных значений признака от его среднего значения равна сумме отрицательных отклонений. Это очень важное свойство, поскольку оно показывает, что любые отклонения (как с +, так и с -), вызванные случайными причинами, взаимно будут погашены.

Доказательство:

Свойство второе (минимальное ): сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа (а), т.е. есть число минимальное.

Доказательство.

Составим сумму квадратов отклонений от переменной а:

(5.4)

Чтобы найти экстремум этой функции, необходимо ее производную по а приравнять нулю:

Отсюда получаем:

(5.5)

Следовательно, экстремум суммы квадратов отклонений достигается при . Этот экстремум - минимум, так как функция не может иметь максимума.

Свойство третье : средняя арифметическая постоянной величины равна этой постоянной: при а = const.

Кроме этих трех важнейших свойств средней арифметической существуют так называемые расчетные свойства , которые постепенно теряют свою значимость в связи с использованием электронно-вычислительной техники:

  • если индивидуальное значение признака каждой единицы умножить или разделить на постоянное число, то средняя арифметическая увеличится или уменьшится во столько же раз;
  • средняя арифметическая не изменится, если вес (частоту) каждого значения признака разделить на постоянное число;
  • если индивидуальные значения признака каждой единицы уменьшить или увеличить на одну и ту же величину, то средняя арифметическая уменьшится или увеличится на ту же самую величину.

Средняя гармоническая . Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1.

Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1:

К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость:

В статистической практике чаще используется гармоническая взвешенная, формула которой имеет вид

Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.

Например, при расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам не известно количество реализованных единиц (речь идет о разных товарах), но известны суммы реализаций этих различных товаров. Допустим, необходимо узнать среднюю цену реализованных товаров:

Получаем

Средняя геометрическая . Чаще всего средняя геометрическая находит свое применение при определении средних темпов роста (средних коэффициентов роста), когда индивидуальные значения признака представлены в виде относительных величин. Она используется также, если необходимо найти среднюю между минимальным и максимальным значениями признака (например, между 100 и 1000000). Существуют формулы для простой и взвешенной средней геометрической.

Для простой средней геометрической

Для взвешенной средней геометрической

Средняя квадратическая величина . Основной сферой ее применения является измерение вариации признака в совокупности (расчет среднего квадратического отклонения).

Формула простой средней квадратической

Формула взвешенной средней квадратической

(5.11)

В итоге можно сказать, что от правильного выбора вида средней величины в каждом конкретном случае зависит успешное решение задач статистического исследования. Выбор средней предполагает такую последовательность:

а) установление обобщающего показателя совокупности;

б) определение для данного обобщающего показателя математического соотношения величин;

в) замена индивидуальных значений средними величинами;

г) расчет средней с помощью соответствующего уравнения.

Средние величины и вариация

Средняя величина - это обобщающий показатель, который характеризует качественно однородную совокупность по определенному количественному признаку. Например, средний возраст лиц, осужденных за кражу.

В судебной статистике средние величины используют для характеристики:

Средних сроков рассмотрения дел данной категории;

Среднего размера иска;

Среднего числа ответчиков, приходящихся на одно дело;

Среднего размера ущерба;

Средней нагрузки судей, и др.

Средняя всегда величина именованная и имеет ту же размерность, что и признак у отдельной единицы совокупности. Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному варьирующему признаку, поэтому за всякой средней скрывается ряд распределения единиц этой совокупности по изучаемому признаку. Выбор вида средней определяется содержанием показателя и исходных данных для расчета средней величины.

Все виды средних величин, используемые в статистических исследованиях, подразделяются на две категории:

1) степенные средние;

2) структурные средние.

Первая категория средних величин включает: среднюю арифметическую, среднюю гармоническую, среднюю геометрическую и среднюю квадратическую . Вторая категория - это мода и медиана . При этом каждый из перечисленных видов степенных средних величин может иметь две формы: простую и взвешенную . Простая форма средней величины используется для получения среднего значения изучаемого признака, когда расчет осуществляется по несгруппированным статистическим данным, либо когда каждая варианта в совокупности встречается только один раз. Взвешенными средними называют величины, которые учитывают, что варианты значений признака могут иметь различную численность, в связи, с чем каждый вариант приходится умножать на соответствующую частоту. Иными словами, каждый вариант «взвешивают» по своей частоте. Частоту называют статистическим весом.

Средняя арифметическая простая – самый распространенный вид средней. Она равна сумме отдельных значений признака, деленной на общее число этих значений:

,

где x 1 ,x 2 , … ,x N – индивидуальные значения варьирующего признака (варианты), а N – число единиц совокупности.

Средняя арифметическая взвешенная применяется в тех случаях, когда данные представлены в виде рядов распределения или группировок. Она вычисляется как сумма произведений вариантов на соответствующие им частоты, деленная на сумму частот всех вариантов:

где x i – значение i –й варианты признака; f i – частота i –й варианты.

Таким образом, каждое значение варианты взвешивается по своей частоте, поэтому частоты иногда называют статистическими весами.

Замечание. Когда речь идет о средней арифметической величине без указания ее вида, подразумевается средняя арифметическая простая.

Таблица 12.

Решение. Для расчета используем формулу средней арифметической взвешенной:

Таким образом, в среднем на одно уголовное дело приходится два обвиняемых.

Если вычисление средней величины производят по данным, сгруппированным в виде интервальных рядов распределения, то сначала надо определить серединные значения каждого интервала х" i , после чего рассчитать среднюю величину по формуле средней арифметической взвешенной, в которую вместо x i подставляют х" i .

Пример. Данные о возрасте преступников, осужденных за совершение кражи, представлены в таблице:

Таблица 13.

Определить средний возраст преступников, осужденных за совершение кражи.

Решение. Для того, чтобы определить средний возраст преступников на основе интервального вариационного ряда необходимо сначала найти серединные значения интервалов. Так как дан интервальный ряд с открытыми первым и последним интервалами, то величины этих интервалов принимаются равными величинам смежных закрытых интервалов. В нашем случае величина первого и последнего интервалов равны 10.

Теперь находим средний возраст преступников по формуле средней арифметической взвешенной:

Таким образом, средний возраст преступников, осужденных за совершение кражи, приближенно равен 27 лет.

Средняя гармоническая простая представляет собой величину, обратную средней арифметической из обратных значений признака:

где 1/x i обратные значения вариантов, а N – число единиц совокупности.

Пример. Для определения средней годовой нагрузки на судей районного суда при рассмотрении уголовных дел провели обследование нагрузки 5 судей этого суда. Средние затраты времени на одно уголовное дело для каждого из обследованных судей оказались равными (в днях): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Найти средние затраты на одно уголовное дело и среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел.

Решение. Для определения средних затрат времени на одно уголовное дело, воспользуемся формулой средней гармонической простой:

Для упрощения расчетов в примере возьмем число дней в году равным 365, включая выходные (это не влияет на методику расчета, а при вычислении аналогичного показателя на практике необходимо вместо 365 дней подставить количество рабочих дней в конкретном году). Тогда средняя годовая нагрузка на судей данного районного суда при рассмотрении уголовных дел составит: 365(дней) : 5,56 ≈ 65,6 (дел).

Если бы мы для определения средних затрат времени на одно уголовное дело, воспользовались формулой средней арифметической простой, то получили бы:

365 (дней) : 5,64 ≈ 64,7 (дела), т.е. средняя нагрузка на судей оказалась меньше.

Проверим обоснованность такого подхода. Для этого воспользуемся данными о затратах времени на одно уголовное дело для каждого судьи и рассчитаем число уголовных, рассмотренных каждым из них за год.

Получим соответственно :

365(дней) : 6 ≈ 61 (дело), 365(дней) : 5,6 ≈ 65,2 (дел), 365(дней) : 6,3 ≈ 58 (дел),

365(дней) : 4,9 ≈ 74,5 (дела), 365(дней) : 5,4 ≈ 68 (дел).

Теперь вычислим среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел:

Т.е. средняя годовая нагрузка такая же, как и при использовании средней гармонической.

Таким образом, использование средней арифметической в данном случае неправомерно.

В тех случаях, когда известны варианты признака, их объемные значения (произведение варианты на частоту), но неизвестны сами частоты, применяется формула средней гармонической взвешенной:

,

где x i – значения вариантов признака, а w i – объемные значения вариантов (w i = x i · f i ).

Пример. Данные о цене единицы однотипного товара, произведенного различными учреждениями уголовно-исполнительной системы, и об объемах его реализации приведены в таблице 14.

Таблица 14

Найти среднюю цену реализации товара.

Решение. При расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам неизвестно количество реализованных единиц, но известны суммы реализаций товаров. Поэтому для нахождения средней цены реализованных товаров воспользуемся формулой средней гармонической взвешенной. Получаем

Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:

Средняя геометрическая вычисляется извлечением корня степени N из произведения всех значений вариантов признака:

где x 1 ,x 2 , … ,x N – индивидуальные значения варьирующего признака (варианты), а

N – число единиц совокупности.

Этот вид средней используется для вычисления средних показателей роста рядов динамики.

Средняя квадратическая применяется для расчета среднеквадратического отклонения, являющегося показателем вариации, и будет рассмотрена ниже.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода , или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном (упорядоченном) ряду. Упорядочение единиц статистической совокупности может быть проведено по возрастанию или убыванию вариантов изучаемого признака.

Медиана (Ме) – это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Таким образом, медиана – это тот вариант ранжированного ряда, по обе стороны от которого в данном ряду должно находиться равное число единиц совокупности.

Для нахождения медианы сначала необходимо определить ее порядковый номер в ранжированном ряду по формуле:

где N – объем ряда (число единиц совокупности).

Если ряд состоит из нечетного числа членов, то медиана равна варианте с номером N Me . Если же ряд состоит из четного числа членов, то медиана определяется как среднее арифметическое двух смежных вариант, расположенных в середине.

Пример. Дан ранжированный ряд 1, 2, 3, 3, 6, 7, 9, 9, 10. Объем ряда N = 9, значит N Me = (9 + 1) / 2 = 5. Следовательно, Ме = 6, т.е. пятой варианте. Если дан ряд 1, 5, 7, 9, 11, 14, 15, 16, т.е. ряд с четным числом членов (N = 8), то N Me = (8 + 1) / 2 = 4,5. Значит медиана равна полусумме четвертой и пятой вариант, т.е. Ме = (9 + 11) / 2 = 10.

В дискретном вариационном ряду медиану определяют по накопленным частотам. Частоты вариант, начиная с первой, суммируются до тех пор, пока не будет превзойден номер медианы. Значение последней просуммированной варианты и будет медианой.

Пример. Найти медиану числа обвиняемых, приходящихся на одно уголовное дело, используя данные таблицы 12.

Решение. В данном случае объем вариационного ряда N = 154, следовательно, N Me = (154 + 1) / 2 = 77,5. Просуммировав частоты первой и второй варианты, получим: 75 + 43 = 118, т.е. мы превзошли номер медианы. Значит Ме = 2.

В интервальном вариационном ряду распределения сначала указывают интервал, в котором будет находиться медиана. Его называют медианным . Это первый интервал, накопленная частота которого превышает половину объема интервального вариационного ряда. Затем численное значение медианы определяется по формуле:

где x Ме – нижняя граница медианного интервала; i – величина медианного интервала; S Ме-1 – накопленная частота интервала, который предшествует медианному; f Ме – частота медианного интервала.

Пример. Найти медиану возраста преступников, осужденных за совершение кражи, на основе статистических данных, представленных в таблице 13.

Решение. Статистические данные представлены интервальным вариационным рядом, значит сначала определим медианный интервал. Объем совокупности N = 162, следовательно, медианным интервалом является интервал 18-28, т.к. это первый интервал, накопленная частота которого (15 + 90 = 105) превышает половину объема (162: 2 = 81) интервального вариационного ряда. Теперь численное значение медианы определяем по приведенной выше формуле:

Таким образом, половина осужденных за совершение кражи младше 25 лет.

Модой (Мо) называют значение признака, которое наиболее часто встречается у единиц совокупности. К моде прибегают для выявления величины признака, имеющей наибольшее распространение. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Например, для дискретного ряда, представленного в таблице 3 Мо = 1, так как этому значению варианты соответствует наибольшая частота - 75. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Его значение находят по формуле:

где x Mo – нижняя граница модального интервала; i – величина модального интервала; f Мо – частота модального интервала; f Мо-1 – частота интервала, предшествующего модальному; f Мо+1 – частота интервала, следующего за модальным.

Пример. Найтимодувозраста преступников, осужденных за совершение кражи, данные о которых представлены в таблице 13.

Решение. Наибольшая частота соответствует интервалу 18-28, следовательно, мода должна находиться в этом иртервале. Ее величину определяем по приведенной выше формуле:

Таким образом, наибольшее число преступников, осужденных за совершение кражи, имеет возраст 24 года.

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако две совокупности, имеющие одинаковые средние значения, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Например, в одном суде были назначены следующие сроки лишения свободы: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 лет, а в другом – 5, 5, 6, 6, 7, 7, 7, 8, 8, 8 лет. В обоих случаях средняя арифметическая равна 6,7 лет. Однако эти совокупности существенно различаются между собой разбросом индивидуальных значений назначенного срока лишения свободы относительно среднего значения.

И для первого суда, где этот разброс достаточно большой, средняя величина срока лишения свободы плохо отражает всю совокупность. Таким образом, если индивидуальные значения признака мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой свойств данной совокупности. В противном случае средняя арифметическая будет ненадежной характеристикой этой совокупности и применение ее на практике малоэффективно. Поэтому необходимо учитывать вариацию значений изучаемого признака.

Вариация – это различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Термин «вариация» имеет латинское происхождение – variatio, что означает различие, изменение, колеблемость. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К основным показателям вариации относятся следующие:

1) размах вариации;

2) среднее линейное отклонение;

3) дисперсия;

4) среднее квадратическое отклонение;

5) коэффициент вариации.

Кратко остановимся на каждом из них.

Размах вариации R самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:

Размах вариации (размах колебаний) – важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных значений отклонений индивидуальных значений признака от средней и определяется по формулам:

1) для несгруппированных данных

2) для вариационного ряда

Однако наиболее широко применяемым показателем вариации является дисперсия . Она характеризует меру разброса значений изучаемого признака относительно его среднего значения. Дисперсия определяется как средняя из отклонений, возведенных в квадрат.

Простая дисперсия для не сгруппированных данных:

.

Взвешенная дисперсия для вариационного ряда:

Замечание. На практике для вычисления дисперсии лучше использовать следующие формулы:

Для простой дисперсии

.

Для взвешенной дисперсии

Среднее квадратическое отклонение - это корень квадратный из дисперсии:

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем, однороднее совокупность и тем лучше средняя арифметическая отражает собой всю совокупность.

Рассмотренные выше меры рессеяния (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными показателями, судить по которым о степени колеблемости признака не всегда возможно. В некоторых задачах необходимо использовать относительные показатели рассеяния, одним из которых является коэффициент вариации.

Коэффициент вариации – выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации разных признаков или одного и того же признака в различных совокупностях, но и для характеристики однородности совокупности. Статистическая совокупность считается количественно однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному распределению).

Пример. Имеются следующие данныео сроках лишения свободы 50 осужденных, доставленных для отбывания назначенного судом наказания в исправительное учреждение уголовно-исполнительной системы: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2, 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6, 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Построить ряд распределения по срокам лишения свободы.

2. Найти среднее значение, дисперсию и среднее квадратическое отклонение.

3. Вычислить коэффициент вариации и сделать заключение об однородности или неоднородности изучаемой совокупности.

Решение. Для построения дискретного ряда распределения необходимо определить варианты и частоты. Варианта в данной задаче – это срок лишения свободы, а частоты – численность отдельных вариант. Рассчитав частоты, получим следующий дискретный ряд распределения:

Найдем среднее значение и дисперсию. Поскольку статистические данные представлены дискретным вариационным рядом, то для их вычисления будем использовать формулы среднего арифметического взвешенного и дисперсии. Получим:

= = 4,1;

= 5,21.

Теперь вычисляем среднее квадратическое отклонение:

Находим коэффициент вариации:

Следовательно, статистическая совокупность количественно неоднородна.

Средняя арифметическая простая

Средние величины

Большое распространение в статистике имеют средние величины.

Средняя величина - это обобщающий показатель, в котором находят выражение действия общих условий, закономерностей развития изучаемого явления.

Статистические средние рассчитываются на основе массовых данных правильно статистически организованного наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в акционерных обществах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.

При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.

Например, средняя выработка отдельного продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д. Средняя выработка отражает общую характеристику всей совокупности.

Средняя величина измеряется в тех же единицах, что и сам признак.

Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, необходимо располагать системой средних величин, которые могут описать явление с разных сторон.

Существуют различные виды средних:

    средняя арифметическая;

    средняя гармоническая;

    средняя геометрическая;

    средняя квадратическая;

    средняя кубическая.

Средние всех перечисленных выше видов, в свою очередь, делятся на простые (невзвешенные) и взвешенные.

Рассмотрим виды средних, которые используются в статистике.

Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.

Отдельные значения признака называют вариантами и обозначают через х i (
); число единиц совокупности обозначают через n, среднее значение признака – через . Следовательно, средняя арифметическая простая равна:

или

Пример 1. Таблица 1

Данные о производстве рабочими продукции А за смену

В данном примере варьирующий признак - выпуск изделий за смену.

Численные значения признака (16, 17 и т. д.) называют вариантами. Определим среднюю выработку продукции рабочими данной группы:

шт.

Простая средняя арифметическая применяется в случаях, когда имеются отдельные значения признака, т.е. данные не сгруппированы. Если данные представлены в виде рядов распределения или группировок, то средняя исчисляется иначе.

Средняя арифметическая взвешенная

Средняя арифметическая взвешенная равна сумме произведений каждого отдельного значения признака (варианта) на соответствующую частоту, деленной на сумму всех частот.

Число одинаковых значений признака в рядах распределения называется частотой или весом и обозначается через f i .

В соответствии с этим, средняя арифметическая взвешенная выглядит так:

или

Из формулы видно, что средняя зависит не только от значений признака, но и от их частот, т.е. от состава совокупности, от ее структуры.

Пример 2. Таблица 2

Данные о заработной плате рабочих

По данным дискретного ряда распределения видно, что одни и те же значения признака (варианты) повторяются несколько раз. Так, варианта х 1 встречается в совокупности 2 раза, а варианта х 2 - 6 раз и т.д.

Вычислим среднюю заработную плату одного рабочего:

Фонд заработной платы по каждой группе рабочих равен произведению варианты на частоту (
), а сумма этих произведений дает общий фонд заработной платы всех рабочих (
).

Если бы расчет был выполнен по формуле простой средней арифметической, средний заработок был бы равен 3 000 руб. (). Сравнивая полученный результат с исходными данными, очевидно, что средняя заработная плата должна быть существенно выше (больше половины рабочих получают заработную плату выше 3 000 руб.). Поэтому расчет по простой средней арифметической в таких случаях будет ошибочным.

Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных вариационных рядов с закрытыми или открытыми интервалами.

Рассмотрим расчет средней арифметической для таких рядов.

Среднее значение это:

Среднее значение

Сре́днее значе́ние - числовая характеристика множества чисел или функций; - некоторое число, заключённое между наименьшим и наибольшим из их значений.

  • 1 Основные сведения
  • 2 Иерархия средних значений в математике
  • 3 В теории вероятностей и статистике
  • 4 См. также
  • 5 Примечания

Основные сведения

Исходным пунктом становления теории средних величин явилось исследование пропорций школой Пифагора. При этом не проводилось строгого различия между понятиями средней величины и пропорции. Значительный толчок развитию теории пропорций с арифметической точки зрения был дан греческими математиками - Никомахом Герасским (конец I - начало II в. н. э.) и Паппом Александрийским (III в. н. э.). Первым этапом развития понятия средней является этап, когда средняя стала считаться центральным членом непрерывной пропорции. Но понятие средней как центрального значения прогрессии не дает возможности вывести понятие средней по отношению к последовательности n членов, независимо от того, в каком порядке они следуют друг за другом. Для этой цели необходимо прибегнуть к формальному обобщению средних. Следующий этап - переход от непрерывных пропорций к прогрессиям - арифметической, геометрической и гармонической.

В истории статистики впервые широкое употребление средних величин связано с именем английского ученого У. Петти. У. Петти один из первых пытался придать средней величине статистический смысл, связав её с экономическими категориями. Но описания понятия средней величины, его выделения Петти не произвел. Родоначальником теории средних величин принято считать А. Кетле. Он одним из первых начал последовательно разрабатывать теорию средних величин, пытаясь подвести под неё математическую базу. А. Кетле выделял два вида средних величин - собственно средние и средние арифметические. Собственно средние представляют вещь, число, действительно существующие. Собственно средние или средние статистические должны выводиться из явлений однокачественных, одинаковых по своему внутреннему значению. Средние арифметические - числа, дающие возможно близкое представление о многих числах, различных, хотя и однородных.

Каждый из видов средней может выступать либо в форме простой, либо в форме взвешенной средней. Правильность выбора формы средней вытекает из материальной природы объекта исследования. Формулы простых средних применяются в случае, если индивидуальные значения усредняемого признака не повторяются. Когда в практических исследованиях отдельные значения изучаемого признака встречаются несколько раз у единиц исследуемой совокупности, тогда частота повторений индивидуальных значений признака присутствует в расчетных формулах степенных средних. В этом случае они называются формулами взвешенных средних.

Wikimedia Foundation. 2010.


Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя величина это:

1) наиболее типичное для совокупности значение признака;

2) объем признака совокупности, распределенный поровну между единицами совокупности.

Признак, для которого рассчитывается средняя величина, в статистике называется «осредняемый».

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Важно отметить, что в процессе осреднения совокупное значение уровней признака или конечное его значение (в случае расчета средних уровней в ряду динамики) должно оставаться неизменным. Другими словами, при расчете средней величины объем исследуемого признака не должен быть искажен, и выражения, составляемые при расчетах средней, обязательно должны иметь смысл.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

,

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;

m – показатель степени средней;

f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Виды степенных средних

Вид степенной
средней

Показатель
степени (m)

Формула расчета

Простая

Взвешенная

Гармоническая

Геометрическая

Арифметическая

Квадратическая

Кубическая

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым. Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,…, i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×…×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда



Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;

h Me – его величина;

(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);

S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;

m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

,

где Х Mo – нижнее значение модального интервала;

m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);

m Mo-1 – то же для интервала, предшествующего модальному;

m Mo+1 – то же для интервала, следующего за модальным;

h – величина интервала изменения признака в группах.

ЗАДАЧА 1

Имеются следующие данные по группе промышленных предприятий за отчетный год


предприятия

Объем продукции, млн. руб.

Среднесписочное число работников, чел.

Прибыль, тыс. руб.

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

Требуется выполнить группировку предприятий по обмену продукции, приняв следующие интервалы:

    до 200 млн. руб.

    от 200 до 400 млн. руб.

  1. от 400 до 600 млн. руб.

    По каждой группе и по всем вместе определить число предприятий, объем продукции, среднесписочное число работников, среднюю выработку продукции на одного работника. Результаты группировки представить в виде статистической таблицы. Сформулировать вывод.

    РЕШЕНИЕ

    Произведем группировку предприятий по обмену продукции, расчет числа предприятий, объема продукции, среднесписочного числа работников по формуле простой средней. Результаты группировки и расчетов сводим в таблицу.

    Группы по объему продукции


    предприятия

    Объем продукции, млн. руб.

    Среднегодовая стоимость основных средств, млн. руб.

    Среднеспи

    сочное число работников, чел.

    Прибыль, тыс. руб.

    Средняя выработка продукции на одного работника

    1 группа

    до 200 млн. руб.

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Средний уровень

    198,3

    24,9

    2 группа

    от 200 до 400 млн. руб.

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Средний уровень

    282,3

    37,6

    1530

    64,0

    3 группа

    от 400 до

    600 млн.

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Средний уровень

    512,9

    34,4

    1421

    120,9

    Всего по совокупности

    5314,2

    419,4

    17131

    1113,4

    0,31

    В среднем по совокупности

    379,6

    59,9

    1223,6

    79,5

    Вывод. Таким образом, в рассматриваемой совокупности наибольшее число предприятий по объему продукции попало в третью группу – семь, или половина предприятий. Величина среднегодовой стоимости основных средств также в данной группе, как и большая величина среднесписочного числа работников – 9974 человек, наименее прибыльны предприятия первой группы.

    ЗАДАЧА 2

    Имеются следующие данные по предприятиям фирмы

    Номер предприятия, входящего в фирму

    I квартал

    II квартал

    Выпуск продукции, тыс. руб.

    Отработано рабочими человеко-дней

    Средняя выработка на одного рабочего в день, руб.

    59390,13