Биографии Характеристики Анализ

Как да изчислим средноаритметичното. Резюме: Средни стойности, използвани в статистиката

Този термин има и други значения, вижте средното значение.

Средно аритметично(в математиката и статистиката) набори от числа - сборът от всички числа, разделен на техния брой. Това е една от най-често срещаните мерки за централна тенденция.

Той е предложен (заедно със средното геометрично и средното хармонично) от питагорейците.

Специални случаи на средноаритметичната стойност са средната стойност (на генералната съвкупност) и средната стойност на извадката (на извадките).

Въведение

Обозначете набора от данни х = (х 1 , х 2 , …, х н), тогава средната стойност на извадката обикновено се обозначава с хоризонтална лента над променливата (x ¯ (\displaystyle (\bar (x))) , произнася се " хс тире“).

Гръцката буква μ се използва за означаване на средноаритметичното на цялата съвкупност. За случайна величина, за която е определена средната стойност, μ е средна вероятностили очаквана стойностслучайна величина. Ако наборът хе колекция произволни числасъс средна вероятност μ, тогава за всяка проба х азот тази колекция μ = E( х аз) е очакването на тази проба.

На практика разликата между μ и x ¯ (\displaystyle (\bar (x))) е, че μ е типична променлива, защото можете да видите селекция, а не цялата общо население. Следователно, ако извадката е представена произволно (от гледна точка на теорията на вероятностите), тогава x ¯ (\displaystyle (\bar (x))) (но не μ) може да се третира като случайна променлива, имаща вероятностно разпределение в извадката ( вероятностно разпределение на средната стойност).

И двете количества се изчисляват по същия начин:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Ако хе случайна променлива, тогава математическото очакване хможе да се разглежда като средноаритметично на стойностите при многократни измервания на количеството х. Това е проявление на закона големи числа. Следователно средната стойност на извадката се използва за оценка на неизвестното математическо очакване.

В елементарната алгебра се доказва, че средната н+ 1 число над средното нчисла, ако и само ако новото число е по-голямо от старото средно, по-малко, ако и само ако новото число е по-малко от средното, и не се променя, ако и само ако новото число е равно на средното. Колкото повече н, толкова по-малка е разликата между новата и старата средна стойност.

Обърнете внимание, че има няколко други налични „средни“, включително средно по степенен закон, средно по Колмогоров, средно хармонично, средно аритметично-геометрично и различни претеглени средни (напр. средно аритметично претеглено, средно геометрично претеглено, средно претеглено хармонично) .

Примери

x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • За четири числа трябва да ги съберете и разделите на 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Или по-лесно 5+5=10, 10:2. Тъй като добавихме 2 числа, което означава, че колкото числа добавим, на толкова разделяме.

Непрекъсната случайна променлива

За непрекъснато разпределена стойност f (x) (\displaystyle f(x)) средното аритметично в интервала [ a ; b ] (\displaystyle ) се дефинира чрез определен интеграл:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Някои проблеми при използването на средната стойност

Липса на здравина

Основна статия: Устойчивост в статистиката

Въпреки че средната аритметична стойност често се използва като средна стойност или централни тенденции, тази концепция не се прилага за стабилна статистика, което означава, че средната аритметична стойност е обект на силно влияние"големи отклонения". Трябва да се отбележи, че за разпределения с голяма асиметрия средноаритметичната стойност може да не съответства на концепцията за „средно“, а стойностите на средната стойност от стабилна статистика (например медианата) могат по-добре да опишат централната тенденция.

Класическият пример е изчисляването на средния доход. Средната аритметична стойност може да бъде погрешно изтълкувана като медиана, което може да доведе до извода, че има повече хора с повече доходи, отколкото има в действителност. „Средният“ доход се тълкува по такъв начин, че доходите на повечето хора са близки до това число. Този "среден" (в смисъла на средноаритметичния) доход е по-висок от дохода на повечето хора, тъй като високият доход с голямо отклонение от средния прави средноаритметичното силно изкривено (за разлика от това, средният доход "се съпротивлява" такова изкривяване). Въпреки това, този „среден“ доход не казва нищо за броя на хората близо до средния доход (и не казва нищо за броя на хората близо до модалния доход). Ако обаче понятията „среден“ и „мнозинство“ се приемат несериозно, тогава може да се заключи неправилно, че повечето хора имат доходи, по-високи от реалните. Например, доклад за "средния" нетен доход в Медина, Вашингтон, изчислен като средната аритметична стойност на всички годишни нетни доходи на жителите, ще даде изненадващо високо число, което се дължи на Бил Гейтс. Разгледайте извадката (1, 2, 2, 2, 3, 9). Средната аритметична стойност е 3,17, но пет от шестте стойности са под тази средна стойност.

Сложна лихва

Основна статия: ROI

Ако числата умножават се, но не гънка, трябва да използвате средното геометрично, а не средното аритметично. Най-често този инцидент се случва при изчисляване на възвръщаемостта на инвестициите във финансите.

Например, ако акциите паднаха с 10% през първата година и се повишиха с 30% през втората година, тогава е неправилно да се изчисли „средното“ увеличение през тези две години като средно аритметично (−10% + 30%) / 2 = 10%; правилната средна стойност в този случай се дава от комбинирания годишен темп на растеж, от който годишният растеж е само около 8,16653826392% ≈ 8,2%.

Причината за това е, че процентите имат нова начална точка всеки път: 30% са 30% от число, по-малко от цената в началото на първата година:ако акцията е започнала от $30 и е паднала с 10%, тя струва $27 в началото на втората година. Ако акциите се покачат с 30%, те струват $35,1 в края на втората година. Средната аритметична стойност на този растеж е 10%, но тъй като акциите са нараснали само с $5,1 за 2 години, средно увеличение от 8,2% дава краен резултат от $35,1:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $35,1]. Ако използваме средноаритметичната стойност от 10% по същия начин, няма да получим действителната стойност: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Сложна лихва в края на година 2: 90% * 130% \u003d 117%, т.е. общо увеличение от 17% и средната годишна сложна лихва 117% ≈ 108,2% (\displaystyle (\sqrt (117\%))\приблизително 108,2\%), т.е. средно годишно увеличение от 8,2%.

Упътвания

Основна статия: Статистика на дестинацията

При изчисляване на средната стойност аритметични стойностинякаква променлива, която се променя циклично (например фаза или ъгъл), трябва да се обърне специално внимание. Например средната стойност от 1° и 359° би била 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Този номер е неправилен по две причини.

  • първо, ъглови меркидефиниран само за диапазона от 0° до 360° (или от 0 до 2π, когато се измерва в радиани). Така една и съща двойка числа може да бъде записана като (1° и −1°) или като (1° и 719°). Средните стойности на всяка двойка ще бъдат различни: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Второ, в този случай, стойност от 0° (еквивалентна на 360°) ще бъде геометрично най-добрата средна стойност, тъй като числата се отклоняват по-малко от 0°, отколкото от всяка друга стойност (стойността 0° има най-малката дисперсия). Сравнете:
    • числото 1° се отклонява от 0° само с 1°;
    • числото 1° се отклонява от изчислената средна стойност от 180° със 179°.

Средната стойност за циклична променлива, изчислена съгласно горната формула, ще бъде изкуствено изместена спрямо реалната средна стойност към средата на числения диапазон. Поради това средната стойност се изчислява по различен начин, а именно числото с най-малка дисперсия (централна точка) се избира като средна стойност. Също така, вместо изваждане, се използва модулно разстояние (т.е. периферно разстояние). Например, модулното разстояние между 1° и 359° е 2°, а не 358° (върху окръжност между 359° и 360°==0° - един градус, между 0° и 1° - също 1°, общо - 2 °).

Видове средни стойности и методи за тяхното изчисляване

На сцената статистическа обработкаМогат да се поставят различни изследователски задачи, за чието решение е необходимо да се избере подходящата средна стойност. В този случай е необходимо да се ръководите от следното правило: стойностите, които представляват числителя и знаменателя на средната стойност, трябва да бъдат логически свързани помежду си.

  • средни мощности;
  • структурни средни.

Нека въведем следната нотация:

Стойностите, за които се изчислява средната стойност;

Средно, където горната линия показва, че се извършва осредняване индивидуални ценности;

Честота (повторяемост на стойностите на индивидуалните черти).

От общата формула за средна мощност се извличат различни средства:

(5.1)

за k = 1 - средно аритметично; k = -1 - средна хармонична; k = 0 - средно геометрично; k = -2 - средноквадратичен корен.

Средните стойности са или прости, или претеглени. претеглени средни стойностисе наричат ​​количества, които отчитат, че някои варианти на стойностите на атрибута могат да имат различни числа и следователно всеки вариант трябва да бъде умножен по това число. С други думи, „теглата“ са броят на единиците на съвкупността в различни групи, т.е. всяка опция е "претеглена" по своята честота. Честотата f се нарича статистическо теглоили средно тегло.

Средноаритметично- най-често срещаният тип среда. Използва се, когато изчислението се извършва върху негрупирани статистически данни, където искате да получите средното сборено. Средно аритметичното е такава средна стойност на признак, при получаването на която общият обем на признака в популацията остава непроменен.

Формулата за средно аритметично ( просто) има формата

където n е размерът на популацията.

Например, средната заплата на служителите на предприятието се изчислява като средно аритметично:

Определящи показатели тук са заплатите на всеки служител и броят на служителите в предприятието. При изчисляване на средната общата сума на заплатите остава същата, но разпределена, така да се каже, поравно между всички работници. Например, трябва да изчислите средната стойност заплатислужители на малка фирма с 8 души персонал:

При изчисляване на средните стойности отделните стойности на атрибута, който се осреднява, могат да се повтарят, така че средната стойност се изчислява с помощта на групирани данни. В такъв случай говорим сиотносно използването средноаритметично претеглено, което изглежда като

(5.3)

И така, трябва да изчислим средната цена на акциите на едно акционерно дружество на борсата. Известно е, че транзакциите са извършени в рамките на 5 дни (5 транзакции), броят на продадените акции по курса на продажба е разпределен, както следва:

1 - 800 ак. - 1010 рубли

2 - 650 ак. - 990 рубли.

3 - 700 ак. - 1015 рубли.

4 - 550 ак. - 900 рубли.

5 - 850 ак. - 1150 рубли.

Първоначалният коефициент за определяне на средната цена на акциите е коефициентът обща суматранзакции (OSS) към броя на продадените акции (KPA):

OSS = 1010 800+990 650+1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

В този случай средната цена на акциите беше равна на

Необходимо е да се познават свойствата на средноаритметичната стойност, което е много важно както за нейното използване, така и за нейното изчисляване. Могат да се разграничат три основни свойства, което най-вече доведе до широкото използване на средноаритметичното в статистическите и икономически изчисления.

Имот едно (нула): сумата от положителните отклонения на отделните стойности на признак от средната му стойност е равна на сумата отрицателни отклонения. Това е много важно свойство, тъй като показва, че всички отклонения (както с +, така и с -) поради случайни причини ще бъдат взаимно отменени.

Доказателство:

Имот две (минимум): сумата от квадратните отклонения на отделните стойности на признака от средната аритметична е по-малка, отколкото от всяко друго число (а), т.е. е минималният брой.

Доказателство.

Съставете сумата от квадратите на отклоненията от променливата a:

(5.4)

За да се намери екстремумът на тази функция, е необходимо нейната производна по отношение на a да се приравни на нула:

От тук получаваме:

(5.5)

Следователно, екстремумът на сумата от квадратите на отклоненията се достига при . Този екстремум е минимумът, тъй като функцията не може да има максимум.

Имот три: средноаритметично постоянна стойносте равно на тази константа: за a = const.

В допълнение към тези три най-важните свойствасредно аритметично, има т.нар дизайнерски свойства, които постепенно губят своето значение поради използването на електронни компютри:

  • ако индивидуалната стойност на атрибута на всяка единица се умножи или раздели на постоянно число, тогава средноаритметичната стойност ще се увеличи или намали със същото количество;
  • средноаритметичната стойност няма да се промени, ако теглото (честотата) на всяка стойност на характеристиката се раздели на постоянно число;
  • ако отделните стойности на атрибута на всяка единица се намалят или увеличат с една и съща сума, тогава средноаритметичната стойност ще намалее или се увеличи със същата сума.

Средно хармонично. Тази средна стойност се нарича реципрочна средна аритметична, тъй като тази стойност се използва, когато k = -1.

Проста хармонична средна стойностсе използва, когато теглата на характерните стойности са еднакви. Формулата му може да бъде извлечена от базова формула, замествайки k = -1:

Например трябва да изчислим Средната скоростдве коли, които са изминали един и същи път, но с различни скорости: първата - със скорост 100 км/ч, втората - 90 км/ч. Използвайки метода на средната хармонична стойност, изчисляваме средната скорост:

В статистическата практика по-често се използва хармонично претеглено, чиято формула има формата

Тази формула се използва в случаите, когато теглата (или обемите на явленията) за всеки атрибут не са равни. В първоначалното съотношение е известно, че числителят изчислява средната стойност, но знаменателят е неизвестен.

Например, когато изчисляваме средната цена, трябва да използваме съотношението на продаденото количество към броя на продадените единици. Ние не знаем броя на продадените единици (говорим за различни стоки), но знаем сумите на продажбите на тези различни стоки. Да кажем, че трябва да знаем средна ценапродадени стоки:

Получаваме

Средна геометрична. Най-често средното геометрично намира приложение при определяне на средния темп на растеж (средни темпове на растеж), когато индивидуалните стойности на признака са представени във формата относителни стойности. Използва се и ако е необходимо да се намери средната стойност между минимума и максимални стойностихарактеристика (например между 100 и 1000000). Има формули за проста и среднопретеглена геометрична стойност.

За проста геометрична средна

За средното геометрично претеглено

Среден квадратна стойност . Основният обхват на неговото приложение е измерването на вариацията на даден признак в популацията (изчисляване на средната стандартно отклонение).

Проста формула за среден квадрат

Формула за средноквадратичен корен

(5.11)

В резултат на това може да се каже, че правилен изборвидът на средната стойност във всеки отделен случай зависи успешно решениезадачи на статистическите изследвания. Изборът на средната стойност предполага следната последователност:

а) установяване на обобщаващ показател за населението;

б) определяне на математическо съотношение на стойностите за даден обобщаващ показател;

в) замяна на индивидуални стойности със средни стойности;

г) изчисляване на средната стойност с помощта на съответното уравнение.

Средни стойности и вариация

средна стойносте обобщаващ показател, който характеризира качествено хомогенна съвкупност за определен количествен признак. Например, средна възрастлица, осъдени за кражби.

В съдебната статистика средните стойности се използват за характеризиране на:

Средни срокове за разглеждане на дела от тази категория;

Искова молба със среден размер;

Средният брой обвиняеми по дело;

Среден размер на щетите;

Средна натовареност на съдиите и др.

Средната стойност винаги е наименувана и има същото измерение като атрибута на отделна единица от съвкупността. всеки средна стойностхарактеризира изследваната популация според всеки един променлив признак, следователно зад всяка средна стойност е скрита поредица от разпределение на единици от тази популация според изследвания признак. Изборът на вида на средната се определя от съдържанието на показателя и изходните данни за изчисляване на средната.

Всички видове средни стойности, използвани в статистически изследванияса разделени на две категории:

1) средни мощности;

2) структурни средни.

Първата категория средни стойности включва: средно аритметично, средно хармонично, средно геометрично и корен квадратен . Втората категория е модаи Медиана. В същото време всеки от изброени видовесиловите средства могат да имат две форми: просто и претеглени . проста формасредната стойност се използва за получаване на средната стойност на изследвания признак, когато изчислението се извършва върху негрупирани статистически данни или когато всеки вариант в популацията се среща само веднъж. Среднопретеглените стойности се наричат ​​стойности, които вземат предвид, че опциите за стойностите на дадена характеристика могат да имат различни числа и следователно всяка опция трябва да бъде умножена по съответната честота. С други думи, всяка опция е "претеглена" по своята честота. Честотата се нарича статистическо тегло.

просто аритметично средно- най-често срещаният тип среда. Тя е равна на сбора индивидуални ценностичерта, разделена на общ бройтези стойности:

,

където x 1 ,x 2 , … ,x Nса индивидуалните стойности на променливата характеристика (опции), а N е броят на единиците на популацията.

Средно аритметично претегленоизползва се, когато данните са представени под формата на серии на разпределение или групи. Изчислява се като сумата от произведенията на опциите и съответните им честоти, разделена на сумата от честотите на всички опции:

където x i- значение аз–ти варианти на признака; фи- честота аз-та опция.

По този начин всяка стойност на варианта се претегля по своята честота, поради което честотите понякога се наричат ​​статистически тегла.

Коментирайте.Когато става дума за средно аритметична стойностбез да се уточнява вида му, подразбира се простото средно аритметично.

Таблица 12

Решение.За изчислението използваме формулата на среднопретеглената аритметична стойност:

Така на едно наказателно дело има средно по двама обвиняеми.

Ако изчисляването на средната стойност се извършва според данни, групирани под формата на серии на интервално разпределение, тогава първо трябва да определите средните стойности на всеки интервал x "i, след което изчислете средната стойност, като използвате претеглената формула за средна аритметична стойност, в която вместо x i се замества x" i.

Пример.Данните за възрастта на престъпниците, осъдени за кражби, са представени в таблицата:

Таблица 13

Определете средната възраст на престъпниците, осъдени за кражба.

Решение.За да се определи средната възраст на нарушителите въз основа на интервала вариационна серияпърво трябва да намерите средните стойности на интервалите. Тъй като ни е дадена интервална серия с отвори първои последните интервали, тогава стойностите на тези интервали се приемат равни на стойностите на съседните затворени интервали. В нашия случай стойността на първия и последния интервал е 10.

Сега намираме средната възраст на престъпниците, използвайки формулата за средноаритметично претеглено:

По този начин средната възраст на нарушителите, осъдени за кражба, е приблизително 27 години.

Средно хармонично просто е реципрочната стойност на средното аритметично на реципрочните стойности на характеристиката:

където 1/ x iреципрочни стойностиопции, а N е броят на единиците от съвкупността.

Пример.За определяне на средногодишната натовареност на съдиите от районен съд при разглеждане на наказателни дела е проведено проучване на натовареността на 5 съдии от този съд. Средното време, прекарано по едно наказателно дело за всеки от анкетираните съдии се оказа равно (в дни): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Намерете средните разходи за един наказателно дело и средногодишната натовареност на съдиите от този районен съд при разглеждане на наказателни дела.

Решение.За да определим средното време, прекарано в едно наказателно дело, използваме хармоничната проста формула:

За да опростим изчисленията в примера, нека вземем броя на дните в годината, равен на 365, включително почивните дни (това не засяга метода на изчисление и при изчисляване на подобен показател на практика е необходимо да се замени броят на работещите дни в определена година вместо 365 дни). Тогава средната годишна натовареност на съдиите от този районен съд при разглеждане на наказателни дела ще бъде: 365 (дни): 5,56 ≈ 65,6 (дела).

Ако използваме простата средноаритметична формула, за да определим средното време, прекарано в едно наказателно дело, ще получим:

365 (дни): 5,64 ≈ 64,7 (случаи), т.е. средната натовареност на съдиите е по-малка.

Нека проверим валидността на този подход. За целта използваме данни за времето, прекарано по едно наказателно дело за всеки съдия, и изчисляваме броя на наказателните дела, разгледани от всеки от тях на година.

Получаваме съответно:

365 (дни) : 6 ≈ 61 (случай), 365 (дни) : 5,6 ≈ 65,2 (случай), 365 (дни) : 6,3 ≈ 58 (случай),

365 (дни) : 4,9 ≈ 74,5 (случаи), 365 (дни) : 5,4 ≈ 68 (случаи).

Сега изчисляваме средната годишна натовареност на съдиите от този районен съд при разглеждане на наказателни дела:

Тези. средногодишното натоварване е същото като при използване на средната хармонична стойност.

Следователно използването на средноаритметичното в този случай е незаконно.

В случаите, когато са известни вариантите на дадена характеристика, техните обемни стойности (произведението на вариантите по честотата), но самите честоти са неизвестни, се прилага формулата за хармонична среднопретеглена стойност:

,

където x iса стойностите на вариантите на признака, а w i са обемните стойности на вариантите ( w i = x i f i).

Пример.Данните за цената на една единица от един и същ вид стока, произведена от различни институции на пенитенциарната система, и за обема на нейната реализация са дадени в таблица 14.

Таблица 14

Намерете средната продажна цена на продукта.

Решение.Когато изчисляваме средната цена, трябва да използваме отношението на продаденото количество към броя на продадените единици. Не знаем броя на продадените единици, но знаем сумата на продажбите на стоки. Следователно, за да намерим средната цена на продадените стоки, използваме формулата за хармонична среднопретеглена стойност. Получаваме

Ако използвате формулата за средно аритметично тук, можете да получите средна цена, която ще бъде нереалистична:

Средна геометричнасе изчислява чрез извличане на корен от степен N от произведението на всички стойности на вариантите на характеристиките:

където x 1 ,x 2 , … ,x Nса индивидуалните стойности на променливата черта (опции) и

не броят на единиците от съвкупността.

Този тип средна стойност се използва за изчисляване на средните темпове на растеж на динамичните редове.

корен квадратенсе използва за изчисляване на стандартното отклонение, което е индикатор за вариация и ще бъде обсъдено по-долу.

За определяне структурата на популацията се използват специални средни стойности, които включват Медиана и мода , или така наречените структурни средни. Ако средноаритметичната стойност се изчислява въз основа на използването на всички варианти на стойностите на атрибута, тогава медианата и модата характеризират стойността на варианта, който заема определена средна позиция в класираната (подредена) серия. Подреждането на единиците от статистическата съвкупност може да се извърши във възходящ или низходящ ред на вариантите на изследвания признак.

Медиана (аз)е стойността, която съответства на варианта в средата на класираната серия. Така медианата е този вариант на класираната серия, от двете страни на която в тази серия трябва да има равен бройагрегатни единици.

За да намерите медианата, първо трябва да я определите. сериен номерв подреден ред по формулата:

където N е обемът на серията (броят единици на съвкупността).

Ако серията се състои от нечетен брой членове, тогава медианата е равна на варианта с число N Me . Ако серията се състои от четен брой членове, тогава медианата се определя като средноаритметично от две съседни опции, разположени в средата.

Пример.Дадена е класирана серия 1, 2, 3, 3, 6, 7, 9, 9, 10. Обемът на серията е N = 9, което означава N Me = (9 + 1) / 2 = 5. Следователно, Me = 6, т.е. пети вариант. Ако на ред е дадено 1, 5, 7, 9, 11, 14, 15, 16, т.е. серия с четен брой членове (N = 8), тогава N Me = (8 + 1) / 2 = 4,5. Така че медианата е равна на половината от сбора на четвъртата и петата опция, т.е. Аз = (9 + 11) / 2 = 10.

В серия от дискретни вариации медианата се определя от натрупаните честоти. Вариантните честоти, започвайки с първата, се сумират до надвишаване на средното число. Стойността на последните сумирани опции ще бъде медианата.

Пример.Намерете средния брой обвиняеми по наказателно дело, като използвате данните в таблица 12.

Решение.В този случай обемът на вариационната серия е N = 154, следователно N Me = (154 + 1) / 2 = 77,5. Обобщавайки честотите на първата и втората опция, получаваме: 75 + 43 = 118, т.е. надхвърлихме средното число. Значи аз = 2.

В интервалните вариационни серии на разпределението първо посочете интервала, в който ще се намира медианата. Наричат ​​го Медиана . Това е първият интервал, чиято кумулативна честота надвишава половината от обема на интервалната вариационна серия. Тогава числовата стойност на медианата се определя по формулата:

където x Азе долната граница на средния интервал; i е стойността на средния интервал; S Me-1е кумулативната честота на интервала, който предхожда медианата; е азе честотата на средния интервал.

Пример.Намерете средната възраст на нарушителите, осъдени за кражба, въз основа на статистическите данни, представени в таблица 13.

Решение.Статистическите данни са представени по интервал вариационни серии, така че първо определяме средния интервал. Обемът на популацията N = 162, следователно средният интервал е интервалът 18-28, т.к. това е първият интервал, чиято натрупана честота (15 + 90 = 105) надвишава половината от обема (162: 2 = 81) на серията интервални вариации. Сега числената стойност на медианата се определя от горната формула:

Така половината от осъдените за кражби са под 25 години.

Мода (Mo)назовете стойността на атрибута, който най-често се среща в единици от съвкупността. Модата се използва за идентифициране на стойността на функция, която има най-разпространени. За дискретна серия режимът ще бъде вариантът с най-висока честота. Например за дискретна серия, представена в таблица 3 мо= 1, тъй като тази стойност на опциите съответства на най-високата честота - 75. За да определите режима на интервалната серия, първо определете модален интервал (интервал с най-висока честота). След това в рамките на този интервал се намира стойността на характеристиката, която може да бъде режим.

Стойността му се намира по формулата:

където x Moе долната граница на модалния интервал; i е стойността на модалния интервал; f Moе честотата на модалния интервал; f Mo-1е честотата на интервала, предхождащ модала; f Mo+1е честотата на интервала след модала.

Пример.Намерете възрастовия режим на престъпниците, осъдени за кражба, данните за които са представени в таблица 13.

Решение.Най-високата честота съответства на интервала 18-28, следователно режимът трябва да бъде в този интервал. Стойността му се определя по горната формула:

По този начин, най-голям бройосъжданият за кражба е на 24 години.

Средната стойност дава обобщаваща характеристика на съвкупността от изследваното явление. Въпреки това, две популации с еднакви средни стойности могат да се различават значително една от друга по отношение на степента на флуктуация (вариация) в стойността на изследвания признак. Например в един съд са определени следните срокове лишаване от свобода: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 години, а в друг - 5, 5, 6, 6, 7, 7 години. , 7 , 8, 8, 8 години. И в двата случая средноаритметичното е 6,7 години. Въпреки това, тези агрегати се различават значително един от друг в разпространението на индивидуалните стойности на определения срок на лишаване от свобода спрямо средната стойност.

А за първия съд, където тази вариация е доста голяма, средният срок на лишаване от свобода не отразява добре цялото население. По този начин, ако отделните стойности на атрибута се различават малко една от друга, тогава средноаритметичната стойност ще бъде доста показателна характеристика на свойствата на тази популация. В противен случай средноаритметичното ще бъде ненадеждна характеристика на тази съвкупност и прилагането му на практика е неефективно. Следователно е необходимо да се вземе предвид вариацията в стойностите на изследвания признак.

Вариация- това са разлики в стойностите на даден признак в различни единици от дадена популация в един и същи период или момент от време. Терминът "вариация" е латински произход- variatio, което означава разлика, промяна, колебание. Възниква в резултат на факта, че отделните стойности на атрибута се формират под комбинирано влияние на различни фактори (условия), които се комбинират по различен начин във всеки отделен случай. За измерване на вариацията на признак, различни абсолютни и относителна производителност.

Основните показатели за вариация включват следното:

1) диапазон на вариация;

2) средно линейно отклонение;

3) дисперсия;

4) стандартно отклонение;

5) коефициент на вариация.

Нека се спрем накратко на всеки от тях.

Вариация на обхвата R е най-достъпният абсолютен индикатор по отношение на лекотата на изчисление, който се определя като разликата между най-голямата и най-малката стойност на атрибута за единиците от тази съвкупност:

Диапазон на вариация (диапазон на колебания) - важен показателфлуктуации на знака, но дава възможност да се видят само екстремни отклонения, което ограничава обхвата на неговото приложение. За по-точно характеризиране на вариациите на даден признак въз основа на неговото колебание се използват други показатели.

Средно линейно отклонениее средноаритметичното на абсолютни стойностиотклонения на отделните стойности на атрибута от средната и се определя по формулите:

1) за негрупирани данни

2) за вариационна серия

Въпреки това, най-широко използваната мярка за вариация е дисперсия . Той характеризира мярката за разпространение на стойностите на изследваната черта спрямо нейната средна стойност. Дисперсията се определя като средната стойност на отклоненията на квадрат.

проста вариацияза негрупирани данни:

.

Претеглена дисперсияза вариационната серия:

Коментирайте.На практика е по-добре да използвате следните формули за изчисляване на дисперсията:

За проста вариация

.

За претеглена дисперсия

Стандартно отклонениее корен квадратен от дисперсията:

Стандартното отклонение е мярка за надеждността на средната стойност. Колкото по-малко е стандартното отклонение, толкова по-хомогенна е популацията и толкова по-добре средното аритметично отразява цялата популация.

Мерките за дисперсия, разгледани по-горе (обхват на вариация, дисперсия, стандартно отклонение), са абсолютни показатели, по които не винаги може да се прецени степента на флуктуация на даден признак. В някои задачи е необходимо да се използват относителни индекси на разсейване, един от които е коефициентът на вариация.

Коефициентът на вариация- изразено като процент от отношението на стандартното отклонение към средната аритметична стойност:

Коефициентът на вариация се използва не само за сравнителна оценка на вариацията различни знациили една и съща черта в различни популации, но и за характеризиране на хомогенността на популацията. Статистическата съвкупност се счита за количествено хомогенна, ако коефициентът на вариация не надвишава 33% (за разпределения, близки до нормалното разпределение).

Пример.Има следните данни за сроковете на лишаване от свобода на 50 осъдени, доставени за изтърпяване на наложеното от съда наказание в поправителна институция на пенитенциарната система: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 бр. , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1 , 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Изградете серия за разпределение по условия на лишаване от свобода.

2. Намерете средната стойност, дисперсията и стандартното отклонение.

3. Изчислете коефициента на вариация и направете заключение за хомогенността или хетерогенността на изследваната популация.

Решение.За да се построи дискретна серия на разпределение, е необходимо да се определят вариантите и честотите. Вариантът в тази задача е срокът на лишаване от свобода, а честотата е броят на отделните варианти. След като изчислихме честотите, получаваме следното дискретна серияразпределения:

Намерете средната стойност и дисперсията. Тъй като статистическите данни са представени от дискретна вариационна серия, ние ще използваме формулите на средното аритметично претеглено и дисперсията, за да ги изчислим. Получаваме:

= = 4,1;

= 5,21.

Сега изчисляваме стандартното отклонение:

Намираме коефициента на вариация:

Следователно статистическата съвкупност е количествено хетерогенна.

просто аритметично средно

Средни стойности

Средните стойности се използват широко в статистиката.

средна стойносте обобщаващ показател, в който се намира изразът на действието Общи условия, модели на развитие на изследваното явление.

Средните статистически стойности се изчисляват на базата на масови данни от правилно статистически организирано наблюдение (непрекъснато и извадково). Статистическата средна стойност обаче ще бъде обективна и типична, ако се изчисли от масови данни за качествено хомогенна популация ( масови явления). Например, ако изчислим средната работна заплата в акционерни дружества и държавни предприятия и разширим резултата до цялата съвкупност, тогава средната стойност е фиктивна, тъй като се изчислява върху разнородна съвкупност и такава средна губи всички значение.

С помощта на средната стойност има, така да се каже, изглаждане на разликите в големината на характеристиката, които възникват по една или друга причина в отделните единици на наблюдение.

Например средната производителност на отделен продавач зависи от много фактори: квалификация, трудов стаж, възраст, форма на обслужване, здраве и т.н. Средната продукция отразява основни характеристикицелият агрегат.

Средната стойност се измерва в същите единици като самата характеристика.

Всяка средна стойност характеризира изследваната популация по всеки един признак. За да се получи пълна и изчерпателна картина на изследваната популация по отношение на редица съществени характеристики, е необходимо да има система от средни стойности, които могат да опишат явлението от различни ъгли.

Съществуват различни видовесредно:

    средноаритметично;

    среден хармоник;

    средно геометрично;

    корен квадратен;

    среден куб.

Средните стойности на всички видове, изброени по-горе, от своя страна се разделят на прости (непретеглени) и претеглени.

Помислете за видовете средни стойности, които се използват в статистиката.

Простата средна аритметична (непретеглена) е равна на сумата от отделните стойности на характеристиката, разделена на броя на тези стойности.

Отделни стойности на признак се наричат ​​варианти и се означават с х i (
); броят на единиците съвкупност се означава с n, средната стойност на признака - с . Следователно простата средна аритметична е:

или

Пример 1маса 1

Данни за производството на продукти А от работници на смяна

AT този примерпроменлива характеристика е освобождаването на продукти на смяна.

Числените стойности на атрибута (16, 17 и т.н.) се наричат ​​опции. Нека определим средното производство на продукти от работниците от тази група:

PCS.

Простата средна аритметична стойност се използва в случаите, когато има индивидуални стойности на характеристика, т.е. данните не са групирани. Ако данните са представени под формата на серии на разпределение или групи, тогава средната стойност се изчислява по различен начин.

Средно аритметично претеглено

Среднопретеглената аритметична стойност е равна на сумата от произведенията на всяка отделна стойност на атрибута (опцията) по съответната честота, разделена на сумата от всички честоти.

Броят на идентичните стойности на характеристиките в серията на разпределение се нарича честота или тегло и се обозначава с f i .

В съответствие с това среднопретеглената аритметична стойност изглежда така:

или

От формулата се вижда, че средната зависи не само от стойностите на атрибута, но и от техните честоти, т.е. върху състава на населението, върху неговата структура.

Пример 2таблица 2

Данни за заплатите на работниците

Според данните от серията с дискретно разпределение се вижда, че едни и същи стойности на атрибута (опции) се повтарят няколко пъти. И така, вариант x 1 се среща в съвкупността 2 пъти, а вариант x 2 - 6 пъти и т.н.

Изчислете средната заплата на работник:

Фонд работна заплата за всяка група работници е равно на произведениеточестотни опции (
), а сумата от тези продукти дава общия фонд работна заплата на всички работници (
).

Ако изчислението се извърши по простата формула за средна аритметична стойност, средната печалба ще бъде 3000 рубли. (). Сравнявайки получения резултат с първоначалните данни, е очевидно, че средната заплата трябва да бъде значително по-висока (повече от половината работници получават заплати над 3000 рубли). Следователно изчисляването на простата средна аритметична стойност в такива случаи ще бъде погрешно.

Статистическият материал в резултат на обработка може да бъде представен не само под формата на дискретни разпределителни серии, но и под формата на интервални вариационни серии със затворени или отворени интервали.

Помислете за изчисляването на средната аритметична стойност за такива серии.

Средната стойност е:

Означава

Означава - числена характеристиканабори от числа или функции; - някакво число, затворено между най-малката и най-голямата от техните стойности.

  • 1 Основна информация
  • 2 Йерархия на средствата в математиката
  • 3 В теорията на вероятностите и статистиката
  • 4 Вижте също
  • 5 бележки

Основна информация

Отправната точка за формирането на теорията за средните стойности беше изследването на пропорциите от училището на Питагор. В същото време не е направено строго разграничение между понятията средно и пропорционално. Значителен тласък в развитието на теорията за пропорциите от аритметична гледна точка е даден от гръцките математици - Никомах от Герас (края на I - началото на II век от н.е.) и Пап от Александрия (III в. от н.е.). Първият етап от развитието на концепцията за средна стойност е етапът, когато средната стойност започва да се счита за централен член на непрекъсната пропорция. Но концепцията за средната стойност като централна стойност на прогресията не дава възможност да се изведе концепцията за средната стойност по отношение на последователност от n члена, независимо от реда, в който те следват един след друг. За тази цел е необходимо да се прибегне до формално обобщение на средните стойности. Следващият етап е преходът от непрекъснати пропорции към прогресии - аритметични, геометрични и хармонични.

В историята на статистиката за първи път широкото използване на средните стойности се свързва с името на английския учен У. Пети. У. Пети беше един от първите, които се опитаха да придадат статистическо значение на средната стойност, свързвайки я с икономически категории. Но Пети не дава описание на концепцията за средната стойност, нейното разпределение. A. Quetelet се счита за основател на теорията за средните стойности. Той е един от първите, които последователно развиват теорията на средните величини, опитвайки се да й донесат математическа основа. A. Quetelet отделя два вида средни стойности - действителни средни и средни аритметични. Правилно средните стойности представляват нещо, число, което наистина съществува. Всъщност средните стойности или статистическите средни трябва да бъдат получени от явления с едно и също качество, идентични по своята вътрешна значимост. Средните аритметични са числа, които дават най-близката възможна представа за много числа, различни, макар и хомогенни.

Всеки тип средна стойност може да бъде или проста средна, или среднопретеглена. Правилността на избора на средната форма следва от материалната природа на обекта на изследване. Използват се прости средни формули, ако отделните стойности на осреднената характеристика не се повтарят. Когато в практически изследванияиндивидуалните стойности на изследваната черта се срещат няколко пъти в единиците на изследваната популация, тогава честотата на повторенията на отделните стойности на чертата присъства във формулите за изчисление на средните мощности. В този случай те се наричат ​​среднопретеглени формули.

Фондация Уикимедия. 2010 г.

Тема 5. Средните величини като статистически показатели

Понятието средно. Обхват на средните стойности в статистическо изследване

Средните стойности се използват на етапа на обработка и обобщаване на получените първични статистически данни. Необходимостта от определяне на средните стойности се дължи на факта, че за различни единици от изследваните популации индивидуалните стойности на една и съща черта, като правило, не са еднакви.

Средна стойностнаричаме индикатор, който характеризира обобщената стойност на характеристика или група характеристики в изследваната популация.

Ако изследваме популация с качествено хомогенни характеристики, тогава средната стойност се появява тук като типично средно. Например за групи работници в определена индустрия с фиксирано ниво на доход се определя типичен среден разход за стоки от първа необходимост, т.е. типичната средна обобщава качествено хомогенните стойности на атрибута в дадената съвкупност, което е делът на разходите на работниците в тази група за стоки от първа необходимост.

При изследване на популация с качествено разнородни характеристики на преден план могат да излязат нетипичните средни показатели. Такива са например средните показатели за произведения национален доход на глава от населението (разн възрастови групи), средни добиви от зърнени култури в цяла Русия (райони с различни климатични зони и различни зърнени култури), средна раждаемост на населението във всички региони на страната, средни температури над определен периоди т.н. Тук средните стойности обобщават качествено разнородни стойности на характеристики или системни пространствени съвкупности (международна общност, континент, държава, регион, област и т.н.) или динамични съвкупности, разширени във времето (век, десетилетие, година, сезон и т.н. ) . Тези средни се наричат системни средни стойности.

По този начин значението на средните стойности се състои в тяхната обобщаваща функция. Средната стойност замества голям брой отделни стойности на черта, разкриващи общи свойства, присъщи на всички единици от съвкупността. Това от своя страна ви позволява да избегнете случайни причини и да идентифицирате общи моделипоради общи причини.

Видове средни стойности и методи за тяхното изчисляване

На етапа на статистическа обработка могат да се поставят различни изследователски задачи, за чието решаване е необходимо да се избере подходящата средна стойност. В този случай е необходимо да се ръководите от следното правило: стойностите, които представляват числителя и знаменателя на средната стойност, трябва да бъдат логически свързани помежду си.

    средни мощности;

    структурни средни.

Нека въведем следната нотация:

Стойностите, за които се изчислява средната стойност;

Средно, където редът по-горе показва, че се извършва осредняване на отделните стойности;

Честота (повторяемост на стойностите на индивидуалните черти).

От общата формула за средна мощност се извличат различни средства:

(5.1)

за k = 1 - средно аритметично; k = -1 - средна хармонична; k = 0 - средно геометрично; k = -2 - средноквадратичен корен.

Средните стойности са или прости, или претеглени. претеглени средни стойностисе наричат ​​количества, които отчитат, че някои варианти на стойностите на атрибута могат да имат различни числа и следователно всеки вариант трябва да бъде умножен по това число. С други думи, „теглата“ са броят на единиците на съвкупността в различни групи, т.е. всяка опция е "претеглена" по своята честота. Честотата f се нарича статистическо теглоили средно тегло.

Средноаритметично- най-често срещаният тип среда. Използва се, когато изчислението се извършва върху негрупирани статистически данни, където искате да получите средното сборено. Средно аритметичното е такава средна стойност на признак, при получаването на която общият обем на признака в популацията остава непроменен.

Формулата за средна аритметична (проста) има формата

където n е размерът на популацията.

Например, средната заплата на служителите на предприятието се изчислява като средно аритметично:


Определящи показатели тук са заплатите на всеки служител и броят на служителите в предприятието. При изчисляване на средната общата сума на заплатите остава същата, но разпределена, така да се каже, поравно между всички работници. Например, необходимо е да се изчисли средната заплата на служителите на малка компания, в която работят 8 души:

При изчисляване на средните стойности отделните стойности на атрибута, който се осреднява, могат да се повтарят, така че средната стойност се изчислява с помощта на групирани данни. В този случай говорим за използване средноаритметично претеглено, което изглежда като

(5.3)

И така, трябва да изчислим средната цена на акциите на едно акционерно дружество на борсата. Известно е, че транзакциите са извършени в рамките на 5 дни (5 транзакции), броят на продадените акции по курса на продажба е разпределен, както следва:

    1 - 800 ак. - 1010 рубли

    2 - 650 ак. - 990 рубли.

    3 - 700 ак. - 1015 рубли.

    4 - 550 ак. - 900 рубли.

    5 - 850 ак. - 1150 рубли.

Първоначалното съотношение за определяне на средната цена на акциите е съотношението на общата сума на транзакциите (TCA) към броя на продадените акции (KPA):

OSS = 1010 800+990 650+1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

В този случай средната цена на акциите беше равна на

Необходимо е да се познават свойствата на средноаритметичната стойност, което е много важно както за нейното използване, така и за нейното изчисляване. Има три основни свойства, които най-вече доведоха до широкото използване на средноаритметичното в статистическите и икономически изчисления.

Свойство едно (нула): сумата от положителните отклонения на отделните стойности на признака от средната му стойност е равна на сумата от отрицателните отклонения. Това е много важно свойство, тъй като показва, че всички отклонения (както с +, така и с -) поради случайни причини ще бъдат взаимно отменени.

Доказателство:

Второто свойство (минимум): сумата от квадратните отклонения на отделните стойности на атрибута от средната аритметична е по-малка от всяко друго число (а), т.е. е минималният брой.

Доказателство.

Съставете сумата от квадратите на отклоненията от променливата a:

(5.4)

За да се намери екстремумът на тази функция, е необходимо нейната производна по отношение на a да се приравни на нула:

От тук получаваме:

(5.5)

Следователно, екстремумът на сумата от квадратите на отклоненията се достига при . Този екстремум е минимумът, тъй като функцията не може да има максимум.

Трето свойство: средноаритметичното на константа е равно на тази константа: при a = const.

Освен тези три най-важни свойства на средноаритметичното съществуват и т.нар дизайнерски свойства, които постепенно губят своето значение поради използването на електронни компютри:

    ако индивидуалната стойност на атрибута на всяка единица се умножи или раздели на постоянно число, тогава средноаритметичното ще се увеличи или намали със същото количество;

    средноаритметичната стойност няма да се промени, ако теглото (честотата) на всяка стойност на характеристиката се раздели на постоянно число;

    ако отделните стойности на атрибута на всяка единица се намалят или увеличат с една и съща сума, тогава средноаритметичната стойност ще намалее или се увеличи със същата сума.

Средно хармонично. Тази средна стойност се нарича реципрочна средна аритметична, тъй като тази стойност се използва, когато k = -1.

Проста хармонична средна стойностсе използва, когато теглата на характерните стойности са еднакви. Неговата формула може да бъде получена от основната формула чрез заместване на k = -1:

Например, трябва да изчислим средната скорост на две коли, които са изминали един и същи път, но с различни скорости: първата със 100 км/ч, втората с 90 км/ч. Използвайки метода на средната хармонична стойност, изчисляваме средната скорост:

В статистическата практика по-често се използва хармонично претеглено, чиято формула има формата

Тази формула се използва в случаите, когато теглата (или обемите на явленията) за всеки атрибут не са равни. В първоначалното съотношение е известно, че числителят изчислява средната стойност, но знаменателят е неизвестен.

Как да изчислим средната стойност на числата в Excel

Намерете средната стойност аритметични числав Excel можете да използвате .

Синтаксис AVERAGE

=СРЕДНО(число1,[число2],…) - Руска версия

Аргументи СРЕДНО

  • номер 1- първото число или диапазон от числа, за изчисляване на средната аритметична стойност;
  • номер2(По избор) – второ число или диапазон от числа за изчисляване на средната аритметична стойност. Максимална сумааргументи на функцията - 255.

За да изчислите, направете следните стъпки:

  • Изберете произволна клетка;
  • Напишете формула в него =СРЕДНО(
  • Изберете диапазона от клетки, за които искате да направите изчисление;
  • Натиснете клавиша "Enter" на клавиатурата

Функцията ще изчисли средната стойност в посочения диапазон сред тези клетки, които съдържат числа.

Как да намерите средната стойност на даден текст

Ако има празни редове или текст в диапазона от данни, тогава функцията ги третира като "нула". Ако данните съдържат булеви изрази FALSE или TRUE, тогава функцията третира FALSE като „нула“ и TRUE като „1“.

Как да намерим средното аритметично по условие

Функцията се използва за изчисляване на средната стойност по условие или критерий. Например, да кажем, че имаме данни за продажбите на продукти:

Нашата задача е да изчислим средните продажби на химикалки. За да направим това, ще предприемем следните стъпки:

  • В клетка A13напишете името на продукта „Химикалки“;
  • В клетка B13нека въведем формулата:

=СРЕДНОАКО(A2:A10;A13;B2:B10)

Диапазон на клетките A2:A10” сочи към списъка с продукти, в който ще търсим думата „Химикалки”. Аргумент A13това е връзка към клетка с текст, който ще търсим сред целия списък с продукти. Диапазон на клетките B2:B10” е диапазон с данни за продажби на продукти, сред които функцията ще намери „Химикалки” и ще изчисли средната стойност.


В процеса на изучаване на математиката учениците се запознават с понятието средно аритметично. В бъдеще в статистиката и някои други науки учениците се сблъскват с изчислението на други.Какви могат да бъдат те и как се различават един от друг?

значение и разлика

Не винаги точните показатели дават представа за ситуацията. За да се оцени тази или онази ситуация, понякога е необходимо да се анализира голяма сумацифри. И тогава на помощ идват средните стойности. Те ви позволяват да оцените ситуацията като цяло.

От училищните дни много възрастни помнят съществуването на средната аритметична стойност. Изчислява се много лесно - сумата от поредица от n члена се дели на n. Тоест, ако трябва да изчислите средната аритметична стойност в последователността от стойности 27, 22, 34 и 37, тогава трябва да решите израза (27 + 22 + 34 + 37) / 4, тъй като 4 стойности се използват в изчисленията. В този случай желаната стойност ще бъде равна на 30.

Често в рамките на училищен курсизучаване на средното геометрично. Изчисляване дадена стойностсе основава на извличане на корен от n-та степен от произведението на n-членове. Ако вземем едни и същи числа: 27, 22, 34 и 37, тогава резултатът от изчисленията ще бъде 29,4.

хармонична средна ин общообразователно училищеобикновено не е обект на изследване. Въпреки това се използва доста често. Тази стойност е реципрочна на средната аритметична и се изчислява като частно от n - броя на стойностите и сумата 1/a 1 +1/a 2 +...+1/a n . Ако отново вземем същото за изчисление, тогава хармоникът ще бъде 29,6.

Среднопретеглена стойност: характеристики

Въпреки това, всички горепосочени стойности може да не се използват навсякъде. Например в статистиката, при изчисляване на някои важна роляима "тегло" на всяко число, използвано в изчисленията. Резултатите са по-показателни и правилни, защото вземат предвид повече информация. Тази група от величини е често срещано име "среднопретеглена стойност". Те не се предават в училище, така че си струва да се спрем на тях по-подробно.

На първо място, струва си да се обясни какво се разбира под "тежестта" на определена стойност. Най-лесният начин да обясните това е да конкретен пример. Телесната температура на всеки пациент се измерва два пъти дневно в болницата. От 100 пациенти в различни отделения на болницата 44 ще бъдат с нормална температура - 36,6 градуса. Други 30 ще са с повишена стойност – 37,2, 14 – 38, 7 – 38,5, 3 – 39, а останалите две – 40. И ако вземем средно аритметично, то тази стойност общо за болницата ще е над 38 градуса ! Но почти половината от пациентите имат абсолютно И тук би било по-правилно да се използва среднопретеглената стойност, а "тежестта" на всяка стойност ще бъде броят на хората. В този случай резултатът от изчислението ще бъде 37,25 градуса. Разликата е очевидна.

В случай на среднопретеглени изчисления, „теглото“ може да се приеме като брой пратки, брой хора, работещи в даден ден, изобщо всичко, което може да бъде измерено и да повлияе на крайния резултат.

Разновидности

Среднопретеглената стойност съответства на средната аритметична стойност, разгледана в началото на статията. Въпреки това, първата стойност, както вече беше споменато, също взема предвид теглото на всяко число, използвано в изчисленията. Освен това има и претеглени геометрични и хармонични стойности.

Има още една интересна разновидност, използвана в серии от числа. Това е претеглена пълзяща средна. Именно на негова база се изчисляват тенденциите. В допълнение към самите стойности и тяхната тежест, там се използва и периодичност. И когато се изчислява средната стойност в даден момент от времето, се вземат предвид и стойностите за предишни периоди от време.

Изчисляването на всички тези стойности не е толкова трудно, но на практика обикновено се използва само обичайната среднопретеглена стойност.

Методи за изчисление

В ерата на компютъризацията не е необходимо ръчно да се изчислява среднопретеглената стойност. Въпреки това би било полезно да знаете формулата за изчисление, за да можете да проверите и, ако е необходимо, да коригирате получените резултати.

Най-лесно ще бъде да разгледаме изчислението на конкретен пример.

Необходимо е да се установи каква е средната работна заплата в това предприятие, като се вземе предвид броят на работниците, получаващи определена заплата.

И така, изчисляването на среднопретеглената стойност се извършва по следната формула:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Например изчислението би било:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Очевидно няма особена трудност при ръчното изчисляване на среднопретеглената стойност. Формулата за изчисляване на тази стойност в едно от най-популярните приложения с формули - Excel - изглежда като функцията SUMPRODUCT (серия от числа; серия от тегла) / SUM (серия от тегла).

средна стойност- това е обобщаващ показател, който характеризира качествено хомогенна съвкупност по определен количествен признак. Например средната възраст на лицата, осъдени за кражби.

В съдебната статистика средните стойности се използват за характеризиране на:

Средни срокове за разглеждане на дела от тази категория;

Искова молба със среден размер;

Средният брой обвиняеми по дело;

Среден размер на щетите;

Средна натовареност на съдиите и др.

Средната стойност винаги е наименувана и има същото измерение като атрибута на отделна единица от съвкупността. Всяка средна стойност характеризира изследваната популация според всеки един променлив признак, следователно зад всяка средна стойност има поредица от разпределение на единици от тази популация според изследвания признак. Изборът на вида на средната се определя от съдържанието на показателя и изходните данни за изчисляване на средната.

Всички видове средни стойности, използвани в статистическите изследвания, попадат в две категории:

1) средни мощности;

2) структурни средни.

Първата категория средни стойности включва: средно аритметично, средно хармонично, средно геометрично и корен квадратен . Втората категория е модаи Медиана. Освен това всеки от изброените типове средни мощности може да има две форми: просто и претеглени . Простата форма на средната стойност се използва за получаване на средната стойност на изследваната характеристика, когато изчислението се основава на негрупирана статистика или когато всеки вариант се среща само веднъж в популацията. Среднопретеглените стойности се наричат ​​стойности, които вземат предвид, че опциите за стойностите на дадена характеристика могат да имат различни числа и следователно всяка опция трябва да бъде умножена по съответната честота. С други думи, всяка опция е "претеглена" по своята честота. Честотата се нарича статистическо тегло.

просто аритметично средно- най-често срещаният тип среда. Тя е равна на сумата от индивидуалните характерни стойности, разделена на общия брой на тези стойности:

където x 1 ,x 2 , … ,x N- индивидуални стойности на променливия атрибут (опции) и N - броят на единиците на съвкупността.

Средно аритметично претегленоизползва се, когато данните са представени под формата на серии на разпределение или групи. Изчислява се като сумата от произведенията на опциите и съответните им честоти, разделена на сумата от честотите на всички опции:

където x i- значение аз-ти варианти на признака; фи- честота азта опции.

По този начин всяка стойност на варианта се претегля по своята честота, поради което честотите понякога се наричат ​​статистически тегла.


Коментирайте.Когато става дума за средно аритметично без да се уточнява вида му, се има предвид средното аритметично число.

Таблица 12

Решение.За изчислението използваме формулата на среднопретеглената аритметична стойност:

Така на едно наказателно дело има средно по двама обвиняеми.

Ако изчисляването на средната стойност се извършва според данни, групирани под формата на серии на интервално разпределение, тогава първо трябва да определите средните стойности на всеки интервал x "i, след което изчислете средната стойност, като използвате претеглената формула за средна аритметична стойност, в която вместо x i се замества x" i.

Пример.Данните за възрастта на престъпниците, осъдени за кражби, са представени в таблицата:

Таблица 13

Определете средната възраст на престъпниците, осъдени за кражба.

Решение.За да определите средната възраст на престъпниците въз основа на серията от интервални вариации, първо трябва да намерите средните стойности на интервалите. Тъй като е дадена серия от интервали с отворен първи и последен интервал, стойностите на тези интервали се приемат равни на стойностите на съседни затворени интервали. В нашия случай стойността на първия и последния интервал е 10.

Сега намираме средната възраст на престъпниците, използвайки формулата за средноаритметично претеглено:

По този начин средната възраст на нарушителите, осъдени за кражба, е приблизително 27 години.

Средно хармонично просто е реципрочната стойност на средното аритметично на реципрочните стойности на характеристиката:

където 1/ x iса реципрочните стойности на опциите, а N е броят на единиците от съвкупността.

Пример.За определяне на средногодишната натовареност на съдиите от районен съд при разглеждане на наказателни дела е проведено проучване на натовареността на 5 съдии от този съд. Средното време, прекарано по едно наказателно дело за всеки от анкетираните съдии се оказа равно (в дни): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Намерете средните разходи за един наказателно дело и средногодишната натовареност на съдиите от този районен съд при разглеждане на наказателни дела.

Решение.За да определим средното време, прекарано в едно наказателно дело, използваме хармоничната проста формула:

За да опростим изчисленията в примера, нека вземем броя на дните в годината, равен на 365, включително почивните дни (това не засяга метода на изчисление и при изчисляване на подобен показател на практика е необходимо да се замени броят на работещите дни в определена година вместо 365 дни). Тогава средната годишна натовареност на съдиите от този районен съд при разглеждане на наказателни дела ще бъде: 365 (дни): 5,56 ≈ 65,6 (дела).

Ако използваме простата средноаритметична формула, за да определим средното време, прекарано в едно наказателно дело, ще получим:

365 (дни): 5,64 ≈ 64,7 (случаи), т.е. средната натовареност на съдиите е по-малка.

Нека проверим валидността на този подход. За целта използваме данни за времето, прекарано по едно наказателно дело за всеки съдия, и изчисляваме броя на наказателните дела, разгледани от всеки от тях на година.

Получаваме съответно:

365 (дни) : 6 ≈ 61 (случай), 365 (дни) : 5,6 ≈ 65,2 (случай), 365 (дни) : 6,3 ≈ 58 (случай),

365 (дни) : 4,9 ≈ 74,5 (случаи), 365 (дни) : 5,4 ≈ 68 (случаи).

Сега изчисляваме средната годишна натовареност на съдиите от този районен съд при разглеждане на наказателни дела:

Тези. средногодишното натоварване е същото като при използване на средната хармонична стойност.

Следователно използването на средноаритметичното в този случай е незаконно.

В случаите, когато са известни вариантите на дадена характеристика, техните обемни стойности (произведението на вариантите по честотата), но самите честоти са неизвестни, се прилага формулата за хармонична среднопретеглена стойност:

,

където x iса стойностите на опциите за черта, а w i са обемните стойности на опциите ( w i = x i f i).

Пример.Данните за цената на една единица от един и същ вид стока, произведена от различни институции на пенитенциарната система, и за обема на нейната реализация са дадени в таблица 14.

Таблица 14

Намерете средната продажна цена на продукта.

Решение.Когато изчисляваме средната цена, трябва да използваме отношението на продаденото количество към броя на продадените единици. Не знаем броя на продадените единици, но знаем сумата на продажбите на стоки. Следователно, за да намерим средната цена на продадените стоки, използваме формулата за хармонична среднопретеглена стойност. Получаваме

Ако използвате формулата за средно аритметично тук, можете да получите средна цена, която ще бъде нереалистична:

Средна геометричнасе изчислява чрез извличане на корен от степен N от произведението на всички стойности на вариантите на характеристиките:

,

където x 1 ,x 2 , … ,x N- индивидуални стойности на променливата черта (опции) и

н- брой единици съвкупност.

Този тип средна стойност се използва за изчисляване на средните темпове на растеж на динамичните редове.

корен квадратенсе използва за изчисляване на стандартното отклонение, което е индикатор за вариация и ще бъде обсъдено по-долу.

За определяне структурата на популацията се използват специални средни стойности, които включват Медиана и мода , или така наречените структурни средни. Ако средноаритметичната стойност се изчислява въз основа на използването на всички варианти на стойностите на атрибута, тогава медианата и модата характеризират стойността на варианта, който заема определена средна позиция в класираната (подредена) серия. Подреждането на единиците от статистическата съвкупност може да се извърши във възходящ или низходящ ред на вариантите на изследвания признак.

Медиана (аз)е стойността, която съответства на варианта в средата на класираната серия. Така медианата е този вариант на класираната серия, от двете страни на която в тази серия трябва да има равен брой единици от съвкупността.

За да намерите медианата, първо трябва да определите нейния пореден номер в класираната серия, като използвате формулата:

където N е обемът на серията (броят единици на съвкупността).

Ако серията се състои от нечетен брой членове, тогава медианата е равна на варианта с число N Me . Ако серията се състои от четен брой членове, тогава медианата се определя като средноаритметично от две съседни опции, разположени в средата.

Пример.Дадена е класирана серия 1, 2, 3, 3, 6, 7, 9, 9, 10. Обемът на серията е N = 9, което означава N Me = (9 + 1) / 2 = 5. Следователно, Me = 6, т.е. пети вариант. Ако на ред е дадено 1, 5, 7, 9, 11, 14, 15, 16, т.е. серия с четен брой членове (N = 8), тогава N Me = (8 + 1) / 2 = 4,5. Така че медианата е равна на половината от сбора на четвъртата и петата опция, т.е. Аз = (9 + 11) / 2 = 10.

В серия от дискретни вариации медианата се определя от натрупаните честоти. Вариантните честоти, започвайки с първата, се сумират до надвишаване на средното число. Стойността на последните сумирани опции ще бъде медианата.

Пример.Намерете средния брой обвиняеми по наказателно дело, като използвате данните в таблица 12.

Решение.В този случай обемът на вариационната серия е N = 154, следователно N Me = (154 + 1) / 2 = 77,5. Обобщавайки честотите на първата и втората опция, получаваме: 75 + 43 = 118, т.е. надхвърлихме средното число. Значи аз = 2.

В интервалните вариационни серии на разпределението първо посочете интервала, в който ще се намира медианата. Наричат ​​го Медиана . Това е първият интервал, чиято кумулативна честота надвишава половината от обема на интервалната вариационна серия. Тогава числовата стойност на медианата се определя по формулата:

където x Аз- долната граница на средния интервал; i - стойността на средния интервал; S Me-1- натрупаната честота на интервала, който предхожда медианата; е аз- честота на средния интервал.

Пример.Намерете средната възраст на нарушителите, осъдени за кражба, въз основа на статистическите данни, представени в таблица 13.

Решение.Статистическите данни са представени чрез серия от интервални вариации, което означава, че първо определяме средния интервал. Обемът на популацията N = 162, следователно средният интервал е интервалът 18-28, т.к. това е първият интервал, чиято натрупана честота (15 + 90 = 105) надвишава половината от обема (162: 2 = 81) на серията интервални вариации. Сега числената стойност на медианата се определя от горната формула:

Така половината от осъдените за кражби са под 25 години.

Мода (Mo)назовете стойността на атрибута, който най-често се среща в единици от съвкупността. Модата се използва за идентифициране на стойността на чертата, която има най-голямо разпространение. За дискретна серия режимът ще бъде вариантът с най-висока честота. Например за дискретна серия, представена в таблица 3 мо= 1, тъй като тази стойност на опциите съответства на най-високата честота - 75. За да определите режима на интервалната серия, първо определете модален интервал (интервал с най-висока честота). След това в рамките на този интервал се намира стойността на характеристиката, която може да бъде режим.

Стойността му се намира по формулата:

където x Mo- долната граница на модалния интервал; i - стойността на модалния интервал; f Mo- модална интервална честота; f Mo-1- честота на интервала, предшестващ модалния; f Mo+1- честота на интервала след модала.

Пример.Намерете възрастовия режим на престъпниците, осъдени за кражба, данните за които са представени в таблица 13.

Решение.Най-високата честота съответства на интервала 18-28, следователно режимът трябва да бъде в този интервал. Стойността му се определя по горната формула:

Така най-много осъдени за кражби престъпници са на 24 години.

Средната стойност дава обобщаваща характеристика на съвкупността от изследваното явление. Въпреки това, две популации с еднакви средни стойности могат да се различават значително една от друга по отношение на степента на флуктуация (вариация) в стойността на изследвания признак. Например в един съд са определени следните срокове лишаване от свобода: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 години, а в друг - 5, 5, 6, 6, 7, 7 години. , 7 , 8, 8, 8 години. И в двата случая средноаритметичното е 6,7 години. Въпреки това, тези агрегати се различават значително един от друг в разпространението на индивидуалните стойности на определения срок на лишаване от свобода спрямо средната стойност.

А за първия съд, където тази вариация е доста голяма, средният срок на лишаване от свобода не отразява добре цялото население. По този начин, ако отделните стойности на атрибута се различават малко една от друга, тогава средноаритметичната стойност ще бъде доста показателна характеристика на свойствата на тази популация. В противен случай средноаритметичното ще бъде ненадеждна характеристика на тази съвкупност и прилагането му на практика е неефективно. Следователно е необходимо да се вземе предвид вариацията в стойностите на изследвания признак.

Вариация- това са разлики в стойностите на дадена характеристика в различни единици от дадена съвкупност в един и същи период или момент от време. Терминът "вариация" е от латински произход - variatio, което означава разлика, промяна, колебание. Възниква в резултат на факта, че отделните стойности на атрибута се формират под комбинирано влияние на различни фактори (условия), които се комбинират по различни начини във всеки отделен случай. За измерване на вариацията на даден признак се използват различни абсолютни и относителни показатели.

Основните показатели за вариация включват следното:

1) диапазон на вариация;

2) средно линейно отклонение;

3) дисперсия;

4) стандартно отклонение;

5) коефициент на вариация.

Нека се спрем накратко на всеки от тях.

Вариация на обхвата R е най-достъпният абсолютен индикатор по отношение на лекотата на изчисление, който се определя като разликата между най-голямата и най-малката стойност на атрибута за единиците от тази съвкупност:

Диапазонът на вариация (диапазонът на колебанията) е важен индикатор за изменчивостта на даден признак, но той позволява да се видят само екстремни отклонения, което ограничава обхвата му. За по-точно характеризиране на вариациите на даден признак въз основа на неговото колебание се използват други показатели.

Средно линейно отклонениепредставлява средноаритметичното на абсолютните стойности на отклоненията на отделните стойности на признака от средната и се определя по формулите:

1) за негрупирани данни

2) за вариационна серия

Въпреки това, най-широко използваната мярка за вариация е дисперсия . Той характеризира мярката за разпространение на стойностите на изследваната черта спрямо нейната средна стойност. Дисперсията се определя като средната стойност на отклоненията на квадрат.

проста вариацияза негрупирани данни:

.

Претеглена дисперсияза вариационната серия:

Коментирайте.На практика е по-добре да използвате следните формули за изчисляване на дисперсията:

За проста вариация

.

За претеглена дисперсия

Стандартно отклонениее корен квадратен от дисперсията:

Стандартното отклонение е мярка за надеждността на средната стойност. Колкото по-малко е стандартното отклонение, толкова по-хомогенна е популацията и толкова по-добре средното аритметично отразява цялата популация.

Разгледаните по-горе дисперсионни мерки (обхват на вариация, дисперсия, стандартно отклонение) са абсолютни показатели, по които не винаги е възможно да се прецени степента на флуктуация на даден признак. В някои задачи е необходимо да се използват относителни индекси на разсейване, един от които е коефициентът на вариация.

Коефициентът на вариация- изразено като процент от отношението на стандартното отклонение към средната аритметична стойност:

Коефициентът на вариация се използва не само за сравнителна оценка на вариациите на различни признаци или един и същи признак в различни популации, но и за характеризиране на хомогенността на популацията. Статистическата съвкупност се счита за количествено хомогенна, ако коефициентът на вариация не надвишава 33% (за разпределения, близки до нормалното разпределение).

Пример.Има следните данни за сроковете на лишаване от свобода на 50 осъдени, доставени за изтърпяване на наложеното от съда наказание в поправителна институция на пенитенциарната система: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 бр. , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1 , 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Изградете серия за разпределение по условия на лишаване от свобода.

2. Намерете средната стойност, дисперсията и стандартното отклонение.

3. Изчислете коефициента на вариация и направете заключение за хомогенността или хетерогенността на изследваната популация.

Решение.За да се построи дискретна серия на разпределение, е необходимо да се определят вариантите и честотите. Вариантът в тази задача е срокът на лишаване от свобода, а честотата е номерът на отделния вариант. След като изчислим честотите, получаваме следната дискретна серия на разпределение:

Намерете средната стойност и дисперсията. Тъй като статистическите данни са представени от дискретна вариационна серия, ние ще използваме формулите на средното аритметично претеглено и дисперсията, за да ги изчислим. Получаваме:

= = 4,1;

= 5,21.

Сега изчисляваме стандартното отклонение:

Намираме коефициента на вариация:

Следователно статистическата съвкупност е количествено хетерогенна.