Биографии Характеристики Анализ

Каким моментом является средняя арифметическая x. Свойства средней арифметической

В процессе вычисления средней арифметической и использования ее в анализе социально-экономических процессов может оказаться полезным знание ряда ее математических свойств, которые мы приведем без развернутых доказательств.

Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной: при

Свойство 2. Алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической равна нулю: для несгруппированных данных и для рядов распределения.

Это свойство означает, что сумма положительных отклонений равна сумме отрицательных отклонений, т.е. все отклонения, обусловленные случайными причинами взаимно погашаются.

Свойство 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное: для несгруппировочных данных и для рядов распределения. Это свойство означает, что сумма квадратов отклонений индивидуальных значений признака от средней арифметической всегда меньше суммы отклонений вариантов признака от любого другого значения, даже мало отличающегося от средней.

Второе и третье свойство средней арифметической применяются для проверки правильности расчета средней величины; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Все три первых свойства выражают сущностные черты средней как статистической категории.

Следующие свойства средней рассматриваются как вычислительные, поскольку они имеют некоторое прикладное значение.

Свойство 4. Если все веса (частоты) разделить на какое-либо постоянное число d, то средняя арифметическая не изменится, поскольку это сокращение в равной степени коснется и числителя и знаменателя формулы расчета средней.

Из этого свойства вытекают два важных следствия.

Следствие 1. Если все веса равны между собой, то вычисление средней арифметической взвешенной можно заменить вычислением средней арифметической простой.

Следствие 2. Абсолютные значения частот (весов) можно заменять их удельными весами.

Свойство 5. Если все варианты разделить или умножить на какое-либо постоянное число d, то средняя арифметическая уменьшиться или увеличиться в d раз.

Свойство 6. Если все варианты уменьшить или увеличить на постоянной число A, то и со средней произойдут аналогичные изменения.

Прикладные свойства средней арифметической можно проиллюстрировать, применив способ расчета средней от условного начала (способ моментов).

Средняя арифметическая способом моментов вычисляется по формуле:

где А – середина какого-либо интервала (предпочтение отдается центральному);



d – величина равновеликого интервала, или наибольший кратный делитель интервалов;

m 1 – момент первого порядка.

Момент первого порядка определяется следующим образом:

.

Технику применения этого способа расчета проиллюстрируем по данным предшествующего примера.

Таблица 5.6

Стаж работы, лет Число рабочих Середина интервала x
до 5 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 и выше 22,5 +10 +2 +22
Итого Х Х Х -3

Как видно из расчетов, приведенных в табл. 5.6 из всех вариантов вычитается одно из их значений 12,5, которое приравнивается нулю и служит условным началом отсчета. В результате деления разностей на величину интервала – 5 получают новые варианты.

Согласно итогу табл. 5.6 имеем: .

Результат вычислений по способу моментов аналогичен результату, который был получен применением основного способа расчета по средней арифметической взвешенной.

М ср - рассчитанная при помощи метода моментов = 61,6 кг

Средняя арифметическая величина обладает тремя свой­ствами.

1. Средняя занимает серединное положение в вариационном ряду . В строго симметричном ряду: М = М 0 =М е.

2. Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных, она вскрывает то типичное, что характерно для всей совокуп­ности . К средней обращаются всякий раз, когда надо исклю­чить случайное влияние от­дельных факторов, выявить об­щие черты, существующие за­кономерности, получить полное и глубокое представление о наиболее общих и характерных особенностях всей группы.

3. Сумма отклоне­ний всех вариант от средней равна нулю : S (V-M)= 0 . Это происходит потому, что средняя величина превышает размеры одних вариант и мень­ше размеров других вариант.

Иначе говоря, истинное отклонение вариант от истинной средней (d =v-М) может быть положительной и отрицательной величи­ной, поэтому сумма S всех "+"d и "-"d равна нулю.

Данное свойство средней используется при проверке правильности расчетов М. Если сумма отклонений вариант от средней равна нулю, то можно сделать вывод, что средняя вычислена правильно. На этом свойстве основан способ моментов для определения М. Ведь если условная средняя А будет равна истинной М, то сумма отклонений вариант от условной средней будет равна нулю.

Роль средних величин в биологии чрезвычайно велика. С одной стороны их используют для характеристики явлений в целом, с другой - они необходимы для оценки отдельных величин. При сравнении отдельных величин со средними получают ценные харак­теристики для каждой из них. Использование средних величин требует строгого соблюдения принципа однородности совокупности. Нарушение этого принципа искажает представление о реальных процессах.

Вычисление средних из неоднородной в социально-экономическом отношении совокупности делает их фик­тивными, искаженными. Следовательно, для того чтобы правильно использовать средние величины, надо быть уверенным в том, что они характеризуют однородные статистические совокупности.

ХАРАКТЕРИСТИКА РАЗНООБРАЗИЯ ПРИЗНАКА В

СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Напри­мер, в группе детей, однородной по возрасту, полу и месту житель­ства, рост каждого ребенка отличается от роста сверстников. То же можно сказать о числе посещений, сделанных отдельными лицами в поликлинику, об уровне белка крови у каждого больного ревматизмом, об уровне артериального давления у отдельных лиц, больных гипертонической болезнью и т. п. В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности. Вариабельность демонстративно можно представить на примере роста в группах подростков.



Статистика позволяет охарактеризовать это специальными крите­риями, определяющими уровень разнообразия каждого признака в той или иной группе. К таким критериям относятся лимит (lim), амплитуда ряда (Am), среднее квадратическое отклонение (s) и коффициент вариации (C v). Так как каждый из этих крите­риев имеет свое самостоятельное значение, то следует остановиться на них отдельно.

Лимит - опреде­ляется крайними значе­ниями вариант в вариа­ционном ряду

Амплитуда (Am) - разность край­них вариант

Лимит и амплитуда - дают определен­ную информацию о степени разнообразия роста в каждой группе. Однако как лимит, так и амплитуда ряда обладает одним существенным недостатком. Они учитывают только разно­образие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Дело в том, что разнообразие проявляется не столько в крайних вариантах, сколько при анализе всей внутренней структуры группы. Поэтому этими критериями можно пользоваться для при­ближенной характеристики разнообразия, особенно при малом чис­ле наблюдений (n<30).

Наиболее полную характеристику разноо­бразию признака в совокупности дает так называемое среднее квадратическое отклоне­ние , обозначаемое греческой буквой "сигма" - s.

Существует два способа расчета среднего квадратического отклонения : среднеарифметический и способ моментов .

При сред­неарифметическом способе расчета применяют формулу, где d - истинное отклонение вариант от истинной средней (V-M).

Формула используется при небольшом числе наблюдений (n<30), когда в вариационном ряду все частоты р= 1.

При р > 1 используют формулу такого вида:

При наличии вычислительной техники эту формулу приме­няют и при большом количестве наблюдений.

Эта формула предназначена для определения "сигмы" по способу моментов:


где: a - условное отклонение от условной средней (V-A ); p - частота встречаемости для варианты; n - число вариант; i - величина интервала между группами.

Этот способ применяется в тех случаях, когда нет вычислитель­ной техники, а вариационный ряд громоздкий как за счет большого числа наблюдений, так и за счет вариант, выраженных многознач­ными числами. При числе наблюдений, равном 30 и менее, в момен­те второй степени п заменяют за (п -1).

Как видно из формулы среднего квадратичного отклонения (4), в знаменателе стоит (п -1), т.е. при числе наблюдений, равном или меньшем 30 (n£30), необходимо в знаменатель формулы брать (п -1). Если при определении средней арифметической М учиты­вают все элементы ряда, то, рассчитывая а, надо брать не все случаи, а на единицу меньше (п-1).

При большом числе наблюдений (n>30) в знаменатель формулы берут п, так как единица не изменяет результаты расчета и поэтому автоматически опускается.

Следует обратить внимание на то, что среднее квадратическое отклонение - именованная величина , поэтому оно должно иметь обозначение, общее для вариант и средней арифметической вели­чины (размерность – кг, см. км и др).

Расчет среднего квадратического отклонения по способу момен­тов производится после расчета средней величины.

Существует еще один критерий, характеризующий уровень раз­нообразия величин признака в совокупности, - коэффициент ва­риации .

Коэффициент вариации (Сv) - является относительной мерой разнообразия, так как исчисляется как процентное отноше­ние среднего квадратического отклонения (а) к средней арифме­тической величине (М). Формула коэффициента вариации такова:

Для ориентировочной оценки степени разнообразия признака пользуются следующими градациями коэффициента вариации. Если коэффициент составляет более 20%, то отмечают сильное разно­образие; при 20-10% - среднее, и если коэффициент менее 10%, то считают, что разнообразие слабое.

Коэффициент вариации применяют при сравнении степени раз­нообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Допустим, необходимо сравнить степень разнообразия массы тела у новорожденных и 5-летних детей. Понятно, что у новорожденных "сигма" всегда будет меньше, чем у семилетних детей, так как меньше их индивидуальная масса. Среднее квадратическое отклонение будет меньше там, где меньше величина самого признака. В этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение, а на относительную меру разнообразия - коэффициент вариации Сv.

Большое значение коэффициент вариации также имеет для оцен­ки и сопоставления степени разнообразия нескольких признаков с разной размерностью. По среднему квадратическому отклонению нельзя еще судить о различии в сте­пени разнообразия указанных признаков. Для этого необходимо использовать коэффициент вариации – Сv.

Среднее квадратическое отклонение связано со структурой ряда распределения признака. Схематич­но это можно изобразить следующим образом.

Теорией статистики доказано, что при нормальном распределе­нии в пределах М±s находится 68% всех случаев, в пределах М±2s - 95,5% всех случаев, а в пределах М±3s - 99,7% всех случаев, составляющих совокупность. Таким образом, М±3s охва­тывает почти весь вариационный ряд.

Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического при­менения среднего квадратического отклонения. Можно восполь­зоваться этим правилом для выяснения - вопроса о типичности средней величины. Если 95% всех вариант находятся в пределах М±2s, то средняя - является характерной для данного ряда и не требуется увеличивать число наблюдений в совокупности. Для опре­деления типичности средней сравнивается фактическое распреде­ление с теоретическим, путем расчета сигмальных отклонений.

Практическое значение среднего квадратического отклонения заключается также в том, что зная М и s , можно построить необходимые вариационные ряды для практического использования. Сигму (s ) также используют для сравнения степени разнообразия однород­ных признаков, например при сравнении колебаний (вариабель­ности) роста детей в городе и селе местности. Зная сигму (s ), можно рассчитать коэффициент вариации (Сv), необходимой для сравнения степени разнообразия признаков, выраженных в различных единицах измерения (сантиметрах, килограммах и др.). Это позволяет выявить более устойчивые (постоянные) и менее устойчивые признаки в совокупности.

Сравнивая коэффициенты вариации (C v), можно сделать выводы о том, что является наиболее устойчивым признаком в совокупности признаков. Среднее квадратическое отклонение (s) используется также для оценки отдельных признаков у одного объекта. Стандартное отклонение указывает, на сколько сигм (s ) от средней (М) отклоняются индивидуальные измерения.

Среднее квадратическое отклонение (s) может быть исполь­зовано в биологии и экологии при разработке проблем нормы и патологии.

Наконец, среднее квадратическое отклонение является важным компонентом формулы т м - сред­ней ошибки средней арифметической (ошибки ре­презентативности):

где т м - средняя ошибка средней арифметической величины (ошибка репрезентативности), п - число наблюдений.

Репрезентативность. Важнейшие теоретические основы репрезентативности были освещены выше в разделе, посвященном выборочной и генеральной совокупности. Репрезентативность означает представительность в выборочной совокупности всех учитываемых признаков (пол, возраст, профессия, стаж и др.) единиц наблюдения, составляющих генеральную совокупность. Достигается эта репрезентативность выборочной совокупности по отношению к генеральной с помощью специальных методов отбора, которые излагаются ниже.

Оценка достоверности результатов исследования базируется на теоретических основах репрезентативности.

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Под достоверностью статистических показа­телей следует понимать степень их соответствия отображаемой ими действительности. Достоверными результатами считаются те, которые не искажают и правильно отражают объективную реальность.

Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.

В большинстве исследований исследователю приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом - на генеральную совокупность.

Таким образом, оценка достоверности необходима для того, чтобы по части явления должно было бы судить о явлении в целом, о его закономерностях.

Оценка достоверности результатов исследования предусматривает определение:

1) ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) - т ;

2) доверительных границ средних (или относительных) величин;

3) достоверности разности средних (или относительных) величин
(по критерию
t );

4) достоверности различия сравниваемых групп по критерию c 2 .

1. Определение средней ошибки средней (или относительной) величины (ошибки репре­зентативности) - т.

Ошибка репрезентативности (m ) является важнейшей стати­стической величиной, необходимой для оценки достоверности ре­зультатов исследования. Эта ошибка возникает в тех случаях, когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Они проистекают из сущности выбороч­ного исследования; генеральная совокупность может быть охарак­теризована по выборочной совокупности только с некоторой по­грешностью, измеряемой ошибкой репрезентативности.

Ошибки репрезентативности нельзя смешивать с обычным пред­ставлением об ошибках: методических, точности измерения, ариф­метических и др.

По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генераль­ной совокупности.

Этот единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Ошибки репрезентативности можно свести к достаточно малой величине, т. е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточ­ного количества наблюдений (п).

Каждая средняя величина - М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина - Р (уровень ле­тальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой - т. Так, средняя арифметическая вели­чина выборочной совокупности (М) имеет ошибку репрезентатив­ности, которая называется средней ошибкой средней арифметической (m м) и определяется по формуле:

Как видно из этой формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия (s ) возможно путем увели­чения числа наблюдений.

На этом принципе основан метод определения достаточного числа наблюдений для выборочного исследования.

Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается m р

Для определения средней ошибки относительной величины (Р) используется следующая формула:

где Р - относительная величина. Если показатель выражен в про­центах, то q=100-P, если Р- в промиллях, то q=1000-P, если Р- в продецимиллях, то q= 10000-Р и т.д.; п - число наблю­дений. При числе наблюдений менее 30 в знаменатель следует взять (п – 1 ).

Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представ­лена со своей средней ошибкой. Это дает возможность" рассчи­тать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых пока­зателей (результатов исследования).

Формулы по статистике

Тема 1: Группировка статистических данных

Определение числа групп (если группи-ка по непрер. приз-ку или дискрет. со многими знач-ями)

Определение величины равного интервала :

Тема 2: Абсолютные и относительные величины

Относительные величины :

1) относит. вел-на структуры :

2) относит. вел-на планового задания :

3) относит. вел-на выполнения плана :

4) относит. вел-на динамики или темп роста :

5) относит. вел-на сравнения

6) относит. вел-на интенсивности (пример: фондоотдача = объем/стоимость (один год))

Тема 3: Средние величины и показатели вариации

Средняя арифметическая

простая :

взвешенная :

Средняя гармоническая

простая :

взвешенная : , сумма значений признака по группе

Свойства средн. арифметической:

    если каждую вари-ту х умен-ть или увел-ть на одно и то же число, то ср. вел-на умен-ется или увел-ется на это же число;

    если каждую вари-ту х умен-ть или увел-ть в одно и то же число раз, то ср. вел-на умен-ется или увел-ется в одно и то же число раз;

    если каждую частоту f умен-ть или увел-ть в одно и то же число раз, то ср. вел-на не изменится.

Ср. вел-на зависит от вар-ты х и структуры совок-сти , кот. харак-ется долями d .

Ряд распределения имеет 3 центра :

1) ср. аримет-кое ;

2) мода – наиболее часто встречающаяся вар-та ;

3) медиана – вар-та, стоящая в середине ряда распре-ния. Сначала находят N медианы, кот. равен n/2, если число еди-ц совок-сти n – чётное, или , если число еди-ц совок-сти нечетное .

Осн. пока-ли вариации :

1) размах вариации :

2) ср. линейное отклонение (ср. арифм-кая из абсолют. откл-ний отдел. значений)

Для несгруппир. данных:

Для сгруппир. данных:

3) ср. квадратическое отклонение (хар-ет ср. абсол. откл-ние вар-ты от ср. вел-ны)

Для несгруппир. данных :

Для сгруппир. данных :

4) Дисперсия – квадрат среднеквадр-ного откл-ния

Для несгруппир. данных :

Для сгруппир. данных :

Общая дисперсия: (для сгрупп.) (для несгрупп.)

ср. вел-на резул. приз-ка в сово-сти, - частота (в совокупности!)

Внутригрупповая дисперсия: - кол-во вариант в группе i

Междугрупповая дисперсия: - кол-во вариант в группе i

Правило сложения дисперсий:

Не имеет еди-ц измерения.

5) Коэффициент вариации хар-ет ср. относит. откл-ние вар-ты от ср. вел-ны.

Способ моментов

Часто мы сталкиваемся с расчетом средней арифметической упрощенным способом.

В этом случае используются свойства средней величины. Метод упрощенного расчета называется способом моментов, либо способом отсчета от условного нуля.

Способ моментов предполагает следующие действия :

1) Выбирается начало отсчета (из х ) – условный нуль (A ). Обычно как можно ближе к середине распре-ния.

2) Находятся отклонения вариантов от условного нуля ().

4) Если эти отклонения содержат общий множитель (k ), то рассчитанные

отклонения делятся на этот множитель.

Способ моментов :

Средняя:

Дисперсия:

Тема 4: Выборочное наблюдение

Обозначения в теории выборки:

N – числи-ль генер. выборки

n – числи-ль генер. выборки

Генер. средняя (оценивают)

– выбор. средняя (рассчитывают)

p – генер. доля (оценивают)

w – выбор. доля (рассчитывают)

P (t ) – задаваемый уровень веро-сти

Генер. средняя: с задан. уровнем вероя-сти P(t)

– ошибка выборки для ср. вел-ны

, t – критерий надеж-сти, его вел-на зав-т от уровня задан. вероя-сти P(t)

Если 1) P (t ) = 0,683, то t =1 ; 2) P (t ) = 0,954, то t =2 ; 3) P (t ) = 0,997, то t =3

– среднеквадр. ошибка выборки

– верна для повторного отбора в выборке.

- для бесповторного отбора

Доказано: с задан. уровнем вероя-сти P(t)

– ошибка выборки для доли

, – среднеквадр. ошибка выборки для доли

–для повторного отбора

- для бесповторного отбора

Тема 5: Ряды динамики

Аналит. пока-ли:

1) Абсолют. прирост (разница уровней)

(цепной) ; (базисный)

2) Темп роста (отношение уровней)

(цепной) ; (базисный)

3) Темп прироста

(цепной) ; (базисный)

4) Абсолютное значение 1% прироста

(цепной) ; (базисный)

Средние показатели:

1) ср. уровни динам. ряда ;

2) ср. аналитич. показ-ли динам. ряда .

Расчет ср. уровня зав-т от вида РД:

а) для интерв. РД с равн. периодами вре-ни ср. арифмет. простая

б) для интерв. РД с неравн. периодами вре-ни ср. арифмет. взвешенная

в) для моментных РД с равноотстоящими датами ср. хронологическая

г) для моментных РД с неравноотстоящими датами ср. арифмет. взвешенная

Расчет ср. аналит. показ-лей:

а) ср. абсолют. прирост

б) ср. темп роста

в) ср. темп прироста

Смыкание РД

Для проведения смыкания РД в смыкаемых рядах находится временной момент (дата, период), когда им-ся сведения об изучаемом признаке как в прежних, так и в новых условиях. Рассчитывается коэфф-т, дальнейш. расчеты – по сомкнутом. ряду.

В ходе обработки РД важн. задачей яв-ся выявление основ. тенденции раз-тия явления (тренда) и сглаживание случ. колебаний. Для решения этой задачи сущ-ют особые способы, кот. наз-ют методами выравнивания.

3 основн. способа обработки динамического ряда:

а) укрупнение интервалов РД и расчет средних для кажд. укрупненного интервала;

(переход от менее продолжит.инт-лов к более продолжит. Средняя, рассчитанная по укрупненным инт-лам, позволяет выявить направление и характер (ускорение или замедление) основ. тенденции развития. Средняя рассчитывается по формулам простой средней арифметической.

б) метод скользящей средней;

(вычисл-ся ср. уровень из опред. числа, обычно нечетного, первых по счету уровней ряда. Затем - из такого же числа уровней, но начиная со второго по счету, далее - начиная с третьего и т. д. Т/о, средняя как бы «скользит» по временному ряду от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя один следующий.

в) аналитическое выравнивание.

Сезонные колебания и волны

Индексами сезонности яв-ся процентные отношения фактических внутригодовых уровней к постоянной или переменной средней. Совокупность этих показателей отражает сезонную волну.

Для выявления сезон. колебаний обычно испо-ют данные за несколько лет, распределенные по месяцам. Для каждого месяца рассчитывается средняя величина уровня, например за 3 года ( ), затем из них вычисляется средний уровень для всего ряда ( ), далее определяется процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда:

где - средний уровень для каждого месяца;

Среднемесячный уровень для всего ряда.

Для наглядного представления сезонной волны индексы сезонности изображают в виде графиков.

Индивидуальные индексы:

себестоимости

стоимости

денежных затрат

затрат труда

i q

i p

i z

i pq

i qz

i qt

Общие индексы:

Общий индекс физического объема

(как в среднем изм-лось кол-во товаров на рынке)

Абсолютное изм-ние стои-сти за счет изм-ния кол-ва товаров

Общий индекс цен

(агрегатный) (как в среднем изм-лись цены на рынке)

Абсолютное изм-ние стои-сти за счет изм-ния цен

Общий индекс товарооборота (стоимости)

общ. относит. изме-ния стои-сти товаров на рынке

Общ. абсолют. изм-ние стои-сти товаров на рынке

Взаимосвязь индексов

I pq = I p I q

Общий индекс себестоимости

Общий индекс физич. объема (по себестоимости)

Взаимосвязь между индексами

Общий индекс затрат на производство

ЦЕЛЬ ЗАНЯТИЯ: Овладеть основами вариационной статистики, навыками вычисления и оценки достоверности средних величин

МЕТОДИКА ПРОВЕДЕНИЯ ЗАНЯТИЯ: Студенты самостоятельно готовятся к практическому занятию по рекомендованной литературе и выполняют индивидуальное домашнее задание. Преподаватель в течение 10 минут проверяет правильность выполнения домашнего задания и указывает на допущенные ошибки, проверяет степень подготовки с использованием тестирования и устного опроса. Затем студенты самостоятельно вычисляют средние величины и оценивают их достоверность. В конце занятия преподаватель проверяет самостоятельную работу студентов.

КОНТРОЛЬНЫЕ ВОПРОСЫ:

1. Что представляет собой вариационный ряд, какие виды вариационных рядов выделяют в статистике, каковы элементы вариационного ряда.

2. Что такое средние величины, возможности их использования в медицине и практической деятельности врача.

3. Виды средних величин: мода, медиана, средняя арифметическая

4. Методика вычисления средней арифметической и параметров, характеризующих среднюю.

5. Какие математические законы позволяют теоретически обосновать достоверность статистических данных.

6. Как определить среднюю ошибку средней величины.

7. Что понимается под доверительной границей производных величин.

8. Оценка достоверности различий средних величин при помощи доверительного коэффициента t.

9. Оценка критерия достоверности при больших и малых выборках.

В медико-социальных исследованиях наряду с абсолютными и относительными широко используются средние величины. Средняя величина – это совокупная обобщающая характеристика количественных признаков, она обычно обозначается буквой М или Х. Средние величины существенно отличаются от статистических коэффициентов:

1. Коэффициенты характеризуют признак, встречающийся только у некоторой части статистического коллектива, так называемый альтернативный признак, который может иметь место или не иметь место (рождение, смерть, заболевание, инвалидность).

Средние величины охватывают признаки, присущие всем членам коллектива, но в разной степени (вес, рост, дни лечения в больнице).

2. Коэффициенты применяются для измерения качественных признаков. Средние величины - для варьирующих количественных признаков.

Применение средних величин в медико-социальных исследованиях широко используется при изучении физического развития. Кроме того, средние величины применяются:

1. Для характеристики организации работы лечебно-профилактических учреждений и оценки их деятельности:

А) в поликлинике: показатели нагрузки врачей, посещаемость поликлиники, среднее число посещений на 1-м году жизни, среднее число детей на участке, среднее число посещений при определенном заболевании и т. д.;

Б) в стационаре: среднее число дней работы койки в году; средняя длительность лечения при определенных заболеваниях и т. д.;

В) в органах санэпиднадзора: средняя площадь (или кубатура) на 1 человека, средние нормы питания (белки, жиры, углеводы, витамины, минеральные соли, калории) в дневном рационе возрастных групп у детей и взрослых и т. д.

2. Для определения медико-физиологических показателей организма в норме и патологии в клинических и экспериментальных исследованиях.

3. В специальных демографических и медико-социальных исследованиях.

Для расчета средней величины необходимо построить вариационный ряд - т. е. ряд числовых измерений определенного признака, отличающихся по своей величине.

Вариационные ряды бывают следующих видов:

А) ранжированный, неранжированный;

Б) сгруппированный, несгруппированный;

В) прерывный, непрерывный.

Ранжированный ряд - упорядоченный ряд; варианты располагаются последовательно по нарастанию или убыванию числовых значений.

Неранжированный ряд - варианты располагаются бессистемно.

Прерывный (дискретный) ряд - варианты выражены в виде целых (дискретных) чисел (окна в избе).

Непрерывный ряд – варианты могут быть выражены дробными числами.

Несгруппированный ряд – каждому значению варианты соответствует определенное число частот.

Сгруппированный ряд (интервальный) – варианты соединены в группы, объединяющие их по величине в пределах определенного интервала.

В статистике принято выделять следующие виды средних величин: мода (Мо), медиана (Ме) и средняя арифметическая (М). Мода – величина варьирующего признака, наиболее часто встречающаяся в совокупности. В вариационном ряду это варианта, имеющая наибольшую частоту встречаемости. Обычно мода является величиной довольно близкой к средней арифметической, совпадает с ней при полной симметрии распределения. Медиана – варианта, делящая вариационный ряд на две равные половины. При нечетном числе наблюдений медианой является варианта, имеющая в вариационном ряду порядковый номер (n + 1): 2. Средняя арифметическая величина (М) – в отличие от моды и медианы опирается на все произведенные наблюдения, поэтому является важной характеристикой для всего распределения.

В зависимости от вида вариационного ряда используется тот или иной способ расчета средней. Средняя арифметическая для простого ряда, где каждая варианта встречается один раз, вычисляется по формуле: М =

Знак суммы, V –отдельные значения вариант, n –число наблюдений. Средняя арифметическая взвешенная определяется по формуле: М=

Знак суммы, V –отдельные значения вариант, n –число наблюдений, р – частота встречаемости вариант. Одним из наиболее простых и достаточно точных способов расчета средней арифметической является способ моментов, основанный на том, что алгебраическая сумма отклонений каждой варианты вариационного ряда от средней арифметической равна нулю. М= А + i

Где А – условно принятая средняя или мода, а- отклонение каждой варианты от условно принятой средней, р –частота встречаемости вариант, n –число наблюдений, i – интервал или расстояние между соседними вариантами. Основные свойства средней величины: 1) имеет абстрактный характер, так как является обобщающей величиной: в ней стираются случайные колебания; 2) занимает срединное положение в ряду (в строго симметричном ряду); 3) сумма отклонений всех вариант от средней величины равна нулю. Данное свойство средней величины используется для проверки правильности расчета средней. Она оценивается по уровню колеблемости вариационного ряда. Критериями такой оценки могут служить: амплитуда (разница между крайними вариантами); среднее квадратическое отклонение, показывающее, как отличаются варианты от рассчитанной средней величины; коэффициент вариации.

Среднеквадратическое отклонение (

) наиболее точно характеризует степень разнообразия варьирующего признака, без чего нельзя достаточно полно охарактеризовать явление. Для простого вариационного ряда (р =1) среднеквадратическое отклонение расчитывается по формуле

Для взвешенного вариационного ряда по формуле:

Где d = V – M - отклонение каждой варианты от средней арифметической. При числе наблюдений меньше 30 в знаменателе этих формул берется не n, а n – 1 (так называемое в статистике число степеней свободы). При числе наблюдений более 30 уменьшение знаменателя на единицу не имеет практического значения, т.к. существенно не сказывается на конечном результате. Значительно упрощает вычисления расчет среднего квадратического отклонения по способу моментов.

где, величина

называется моментом первой степени, а

Моментом второй степени.

Степень разнообразия (колеблемости) признака в вариационном ряду можно оценить по коэффициенту вариации (отношение среднего квадратического отклонения к средней величине, умноженное на 100%); при вариации менее 10% отмечается слабое разнообразие, при вариации 10-20% - среднее, а при вариации более 20% - сильное разнообразие признака. Если нет возможности сравнить вариационный ряд с другими, то используют правило трех сигм. Если к средней прибавить одну сигму, то этой вычисленной средней соответствует 68,3%, при двух сигмах - 95,4%, при трех сигмах - 99,7% от всех признаков. В медицине с величиной М ± 1? связано понятие нормы; отклонения от средней (в любую сторону) больше, чем на 1?, но меньше чем на 2?, считаются субнормальными (выше или ниже нормы), а при отклонении от средней больше чем на 2?, варианты считаются значительно отличающимися от нормы (патология).

Мерой точности и достоверности результатов выборочных статистических величин являются средние ошибки представительности (репрезентативности). Средняя ошибка средней арифметической – m (отношение среднего квадратического отклонения к квадратному корню из общего числа наблюдений - объектов). m =

Мерой достоверности среднего показателя наряду с его ошибкой являются, доверительные границы и достоверность разности между двумя средними величинами.

ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ:

ЗАДАНИЕ №1. Определить моду и медиану вариационного ряда. На основе приведенных данных вычислите: среднюю арифметическую по способу моментов, среднее квадратическое отклонение, коэффициент вариации, среднюю ошибку средней арифметической

Задача 1.

Вычислите среднюю длительность пребывания больного в хирургическом отделении стационара

Задача 2.

Вычислите среднюю длительность временной нетрудоспособности при гипертонической болезни II стадии (гипертонический криз)

Вычислите среднюю частоту пульса в группе здоровых мужчин в возрасте 22 года после умеренной физической нагрузки

Задача 4.

Вычислите среднюю жилую площадь, приходящуюся на одного человека в семьях с низким уровнем достатка

Задача 5.

Вычислите средний вес у девочек 12 лет, воспитывающихся в интернате

Задача 6.

Вычислите максимальную мышечную силу правой кисти у 15-летних юношей, регулярно посещающих спортивные секции

Задача 7.

Вычислите средний рост 17-летних девушек, обучающихся в общеобразовательной школе.

Задача 8.

Вычислите среднее число пациентов принятых участковым терапевтом за один рабочий день

Задача 9.

Вычислите среднее число детей в дагестанской семье

Задача 10.

Вычислите среднее число пораженных кариесом зубов у 18 летних студенток медицинской академии (индекс КПУ)

Задача 11.

Вычислите среднее число детей первого года жизни, проживающих на одном педиатрическом участке

Задача 12.

Вычислить среднее число пропущенных занятий по дисциплине «Общественное здоровье и здравоохранение» студентами 4 курса лечебного факультета в весеннем семестре

Задача 13.

Вычислите средний рост призывников в Ставропольском крае

Задача 14.

Вычислите среднее число пациентов принятых хирургом в поликлинике за один рабочий день

ЗАДАНИЕ №2. Для средних величин, вычисленных в предыдущем задании определите доверительные границы с вероятностью безошибочного прогноза 95%.

Ю.П. Лисицын. Общественное здоровье и здравоохранение. Учебник для вузов. М., 2002.

Ю.П. Лисицын. Социальная гигиена (медицина) и организация здравоохранения. Казань, 1999. –с. 288-289.

В.К. Юрьев, Г.И. Куценко. Общественное здоровье и здравоохранение. С.-П., 2000. –с. 191-199.

А.Ф. Серенко, В.В. Ермаков. Социальная гигиена и организация здравоохранения. М., 1984. –с.124-146.

Общественное здоровье и здравоохранение. Под ред. В.А. Миняева, Н.И. Вишнякова. М. «МЕДпресс-информ», 2002. –с. 97-107.

Руководство по социальной гигиене и организации здравоохранения. Под ред. Ю.П. Лисицына. М., 1987.

Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. С.-П. «Фолиант», 2003.

Признаки единиц статистических совокупностей различны по своему значению, например, заработная плата рабочих одной профессии какого-либо предприятия не одинакова за один и тот же период времени, различны цены на рынке на одинаковую продукцию, урожайность сельскохозяйственных культур в хозяйствах района и т.д. Поэтому, чтобы определить значение признака, характерное для всей изучаемой совокупности единиц, рассчитывают средние величины.
Средняя величина это обобщающая характеристика множества индивидуальных значений некоторого количественного признака.

Совокупность, изучаемая по количественному признаку, состоит из индивидуальных значений; на них оказывают влияние, как общие причины, так и индивидуальные условия. В среднем значении отклонения, характерные для индивидуальных значений, погашаются. Средняя, являясь функцией множества индивидуальных значений, представляет одним значением всю совокупность и отражает то общее, что присуще всем ее единицам.

Средняя, рассчитываемая для совокупностей, состоящих из качественно однородных единиц, называется типической средней . Например, можно рассчитать среднемесячную заработную плату работника той или иной профессиональной группы (шахтера, врача библиотекаря). Разумеется, уровни месячной заработной платы шахтеров в силу различия их квалификации, стажа работы, отработанного за месяц времени и многих других факторов отличаются друг от друга, так и от уровня средней заработной платы. Однако в среднем уровне отражены основные факторы, которые влияют на уровень заработной платы, и взаимно погашаются различия, которые возникают вследствие индивидуальных особенностей работника. Средняя заработная плата отражает типичный уровень оплаты труда для данного вида работников. Получению типической средней должен предшествовать анализ того, насколько данная совокупность качественно однородна. Если совокупность состоит их отдельных частей, следует разбить ее на типические группы (средняя температура по больнице).

Средние величины, используемые в качестве характеристик для неоднородных совокупностей, называются системными средними . Например, средняя величина валового внутреннего продукта (ВВП) на душу населения, средняя величина потребления различных групп товаров на человека и другие подобные величины, представляющие обобщающие характеристики государства как единой экономической системы.

Средняя должна вычисляться для совокупностей, состоящих из достаточно большого числа единиц. Соблюдение этого условия необходимо для того, чтобы вошел в силу закон больших чисел, в результате действия которого случайные отклонения индивидуальных величин от общей тенденции взаимно погашаются.

Виды средних и способы их вычисления

Выбор вида средней определяется экономическим содержанием определенного показателя и исходных данных. Однако любая средняя величина должна вычисляться так, чтобы при замене ею каждой варианты осредняемого признака не изменился итоговый, обобщающий, или, как его принято называть, определяющий показатель , который связан с осредняемым показателем. Например, при замене фактических скоростей на отдельных отрезках пути их средней скоростью не должно измениться общее расстояние, пройденное транспортным средством за одно и тоже время; при замене фактических заработных плат отдельных работников предприятия средней заработной платой не должен измениться фонд заработной платы. Следовательно, в каждом конкретном случае в зависимости от характера имеющихся данных, существует только одно истинное среднее значение показателя, адекватное свойствам и сущности изучаемого социально-экономического явления.
Наиболее часто применяются средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и средняя кубическая.
Перечисленные средние относятся к классу степенных средних и объединяются общей формулой:
,
где – среднее значение исследуемого признака;
m – показатель степени средней;
– текущее значение (варианта) осредняемого признака;
n – число признаков.
В зависимости от значения показателя степени m различают следующие виды степенных средних:
при m = -1 – средняя гармоническая ;
при m = 0 – средняя геометрическая ;
при m = 1 – средняя арифметическая ;
при m = 2 – средняя квадратическая ;
при m = 3 – средняя кубическая .
При использовании одних и тех же исходных данных, чем больше показатель степени m в вышеприведенной формуле, тем больше значение средней величины:
.
Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется правилом мажорантности средних .
Каждая из отмеченных средних может приобретать две формы: простую и взвешенную .
Простая форма средней применяется, когда средняя вычисляется по первичным (несгруппированными) данным. Взвешенная форма – при расчете средней по вторичным (сгруппированным) данным.

Средняя арифметическая

Средняя арифметическая применяется, когда объем совокупности представляет собой сумму всех индивидуальных значений варьирующего признака. Следует отметить, что если вид средней величины не указывается, подразумевается средняя арифметическая. Ее логическая формула имеет вид:

Средняя арифметическая простая рассчитывается по несгруппированным данным по формуле:
или ,
где – отдельные значения признака;
j – порядковый номер единицы наблюдения, которая характеризуется значением ;
N – число единиц наблюдения (объем совокупности).
Пример. В лекции «Сводка и группировка статистических данных» рассматривались результаты наблюдения стажа работы бригады из 10 человек. Рассчитаем средний стаж работы рабочих бригады. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

По формуле средней арифметической простой вычисляются также средние в хронологическом ряду , если интервалы времени, за которое представлены значения признака, равны.
Пример. Объем реализованной продукции за первый квартал составил 47 ден. ед., за второй 54, за третий 65 и за четвертый 58 ден. ед. Среднеквартальный оборот составляет (47+54+65+58)/4 = 56 ден. ед.
Если в хронологическом ряду приведены моментные показатели, то при вычислении средней они заменяются полусуммами значений на начало и конец периода.
Если моментов больше двух и интервалы между ними равны, то средняя вычисляется по формуле средней хронологической

,
где n- число моментов времени
В случае, когда данные сгруппированы по значениям признака (т. е. построен дискретный вариационный ряд распределения) средняя арифметическая взвешенная рассчитывается с использовании либо частот , либо частостей наблюдения конкретных значений признака , число которых (k) значительно меньше числа наблюдений (N) .
,
,
где k – количество групп вариационного ряда,
i – номер группы вариационного ряда.
Поскольку , а , получаем формулы, используемые для практических расчетов:
и
Пример. Рассчитаем средний стаж рабочих бригад по сгруппированному ряду.
а) с использованием частот:

б) с использованием частостей:

В случае, когда данные сгруппированы по интервалам , т.е. представлены в виде интервальных рядов распределения, при расчете средней арифметической в качестве значения признака принимают середину интервала, исходя из предположения о равномерном распределении единиц совокупности на данном интервале. Расчет ведется по формулам:
и
где - середина интервала: ,
где и – нижняя и верхняя границы интервалов (при условии, что верхняя граница данного интервала совпадает с нижней границей следующего интервала).

Пример. Рассчитаем среднюю арифметическую интервального вариационного ряда, построенного по результатам исследования годовой заработной платы 30 рабочих (см. лекцию «Сводка и группировка статистических данных»).
Таблица 1 – Интервальный вариационный ряд распределения.

Интервалы, грн.

Частота, чел.

Частость,

Середина интервала,

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

грн. или грн.
Средние арифметические, вычисленные на основе исходных данных и интервальных вариационных рядов, могут не совпадать из-за неравномерности распределения значений признака внутри интервалов. В этом случае для более точного вычисления средней арифметической взвешенной следует использовать не средины интервалов, а средние арифметические простые, рассчитанные для каждой группы (групповые средние ). Средняя, вычисленная по групповым средним с использованием взвешенной формулы расчета, называется общей средней .
Средняя арифметическая обладает рядом свойств.
1. Сумма отклонений вариант от средней равна нулю:
.
2. Если все значения вариант увеличиваются или уменьшаются на величину А, то и средняя величина увеличивается или уменьшается на ту же величину А:

3. Если каждую варианту увеличить или уменьшить в В раз, то средняя величина также увеличится или уменьшатся в то же количество раз:
или
4. Сумма произведений вариант на частоты равна произведению средней величины на сумму частот:

5. Если все частоты разделить или умножить на какое-либо число, то средняя арифметическая не изменится:

6) если во всех интервалах частоты равны друг другу, то средняя арифметическая взвешенная равна простой средней арифметической:
,
где k – количество групп вариационного ряда.

Использование свойств средней позволяет упростить ее вычисление.
Допустим, что все варианты (х) сначала уменьшены на одно и то же число А, а затем уменьшены в В раз. Наибольшее упрощение достигается, когда в качестве А выбирается значение середины интервала, обладающего наибольшей частотой, а в качестве В – величина интервала (для рядов с одинаковыми интервалами). Величина А называется началом отсчета, поэтому этот метод вычисления средней называется спосо бом отсчета от условного нуля или способом моментов .
После такого преобразования получим новый вариационный ряд распределения, варианты которого равны . Их средняя арифметическая, называемая моментом первого порядка, выражаетсяформулой и согласно второго и третьего свойств средней арифметической равна средней из первоначальных вариант, уменьшенной сначала на А, а потом в В раз, т. е. .
Для получения действительной средней (средней первоначального ряда)нужно момент первого порядка умножить на В и прибавить А:

Расчет средней арифметической по способу моментов иллюстрируется данными табл. 2.
Таблица 2 – Распределение работников цеха предприятия по стажу работы


Стаж работников, лет

Количество работников

Середина интервала

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Находим момент первого порядка . Затем, зная, что А=17,5, а В=5, вычисляем средний стаж работы работников цеха:
лет

Средняя гармоническая
Как было показано выше, средняя арифметическая применяется для расчета среднего значения признака в тех случаях, когда известны его варианты x и их частоты f.
Если статистическая информация не содержит частот f по отдельным вариантам x совокупности, а представлена как их произведение , применяется формула средней гармонической взвешенной . Чтобы вычислить среднюю, обозначим , откуда . Подставив эти выражения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:
,
где - объем (вес) значений признака показателя в интервале с номером i (i=1,2, …, k).

Таким образом, средняя гармоническая применяется в тех случаях, когда суммированию подлежат не сами варианты, а обратные им величины: .
В тех случаях, когда вес каждой варианты равен единице, т.е. индивидуальные значения обратного признака встречаются по одному разу, применяется средняя гармоническая простая :
,
где – отдельные варианты обратного признака, встречающиеся по одному разу;
N – число вариант.
Если по двум частям совокупности численностью и имеются средние гармонические, то общая средняя по всей совокупности рассчитывается по формуле:

и называется взвешенной гармонической средней из групповых средних .

Пример. В ходе торгов на валютной бирже за первый час работы заключены три сделки. Данные о сумме продажи гривны и курсе гривны по отношению к доллару США приведены в табл. 3 (графы 2 и 3). Определить средний курс гривны по отношению к доллару США за первый час торгов.
Таблица 3 – Данные о ходе торгов на валютной бирже

Средний курс доллара определяется отношением суммы проданных в ходе всех сделок гривен к сумме приобретенных в результате этих же сделок долларов. Итоговая сумма продажи гривны известна из графы 2 таблицы, а количество купленных в каждой сделке долларов определяется делением суммы продажи гривны к ее курсу (графа 4). Всего в ходе трех сделок куплено 22 млн. дол. Значит, средний курс гривны за один доллар составил
.
Полученное значение является реальным, т.к. замена им фактических курсов гривны в сделках не изменит итоговой суммы продаж гривны, выступающей в качестве определяющего показателя : млн. грн.
Если бы для расчета была использована средняя арифметическая, т.е. гривны, то по обменному курсу на покупку 22 млн. дол. нужно было бы затратить 110,66 млн. грн., что не соответствует действительности.

Средняя геометрическая
Средняя геометрическая используется для анализа динамики явлений и позволяет определить средний коэффициент роста. При расчете средней геометрической индивидуальные значения признака представляют собой относительные показатели динамики, построенные в виде цепных величин, как отношения каждого уровня к предыдущему.
Средняя геометрическая простая рассчитывается по формуле:
,
где – знак произведения,
N – число осредняемых величин.
Пример. Количество зарегистрированных преступлений за 4 года возросло в 1,57 раза, в т. ч. за 1-й – в 1,08 раза, за 2-й – в 1,1 раза, за 3-й – в 1,18 и за 4-й – в 1,12 раза. Тогда среднегодовой темп роста количества преступлений составляет: , т.е. число зарегистрированных преступлений ежегодно росло в среднем на 12%.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Для расчета средней квадратической взвешенной определяем и заносим в таблицу и . Тогда средняя величина отклонений длины изделий от заданной нормы равна:

Средняя арифметическая в данном случае была бы непригодна, т.к. в результате мы получили бы нулевое отклонение.
Применение средней квадратической будет рассмотрено далее в показателях вариации.