Биографии Характеристики Анализ

Медиана на извадкови данни. Определяне на мода и медиана по графичен метод

Структурни (позиционни) средни- това са средни стойности, които заемат определено място (позиция) в класирана вариационна серия.

Мода(мо) е стойността на характеристиката, която най-често се среща в изследваната популация.

За дискретни вариационни сериимодата ще бъде стойността на опциите с най-висока честота

Пример. Определете режима от наличните данни (Таблица 7.5).

Таблица 7.5 - Разпределение на дамските обувки, продавани в магазин за обувки н, февруари 2013 г

Според табл. 5 показва, че най-високата честота fмакс= 28, съответства на стойността на характеристиката х= 37 размер. Следователно, мо= 37 номер обувки, т.е. именно този размер на обувката беше най-търсен, най-често купуваха обувки от 37-ия размер.

AT първо определено модално разстояние, т.е. съдържащ модата - интервалът с най-висока честота (в случай на интервално разпределение с на равни интервали, при неравни интервали - с най-голяма плътност).

Режимът се счита приблизително за средата на модалния интервал. Конкретната стойност на режима за интервалната серия се определя по формулата:

където x Moе долната граница на модалния интервал;

i Moе стойността на модалния интервал;

fMoе честотата на модалния интервал;

f Mo-1е честотата на интервала, предхождащ модала;

f Mo +1е честотата на интервала след модала.

Пример. Определете режима от наличните данни (Таблица 7.6).

Таблица 7.6 - Разпределение на служителите по трудов стаж

Според табл. 6 показва, че най-високата честота fмакс= 35, съответства на интервала: 6-8 години (модален интервал). Ние определяме модата по формулата:

години.

Следователно, мо= 6,8 години, т.е. Повечето служители имат 6,8 години опит.

Името на медианата е взето от геометрията, където се отнася до сегмента, свързващ един от върховете на триъгълника със средата обратната странаи разделяйки по този начин страната на триъгълника на две равни части.

Медиана(аз) е стойността на характеристиката, която попада в средата на обхвата. В противен случай медианата е стойност, която разделя броя на подредена вариационна серия на две равни части - едната част има стойности на вариращия атрибут по-малки от средния вариант, а другата има големи стойности.

За класирани серии(т.е. подредени - вградени възходящ редили низходящ индивидуални ценностизнак) с нечетен брой членове ( n=нечетен) медианата е вариантът, разположен в центъра на реда. Пореден номер на медианата ( N Аз) се определя, както следва:

N Me =(n+1)/ 2.

Пример.В поредица от 51 члена средното число е (51+1)/2 = 26, т.е. медианата е 26-та опция в серията.

За класирана серия с четен брой термини ( n=дори) - медианата ще бъде средноаритметичната стойност на двете стойности на атрибута, разположен в средата на реда. Серийните номера на двата централни варианта се определят, както следва:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Пример.Когато n=50; N Me1 = 50/2 = 25; N Me2= (50/2)+1 = 26, т.е. медианата е средната стойност на опциите в 25-ия и 26-ия ред по ред.

AT отделен вариационна серия медианата се намира по натрупаната честота, съответстваща на поредния номер на медианата или надвишаваща го за първи път. В противен случай, според натрупаната честота, равна или за първи път надвишаваща половината от сбора на всички честоти от серията.

Пример. Определете медианата от наличните данни (Таблица 7.7).

Таблица 7.7 ​​- Разпределение на дамски обувки, продавани в магазин за обувки н, февруари 2013 г

Според табл. 7 определят сериен номермедиани: N Me =( 67+1)/2=34.

Мода. Медиана. Как да ги изчислим (стр. 1 от 2)

Кумулативната честота, надвишаваща тази стойност за първи път С= 41, съответства на стойността на характеристиката х= 37 размер. Следователно, аз= 37 номер обувки, т.е. половината от чифтовете се купуват по-малки от размер 37, а другата половина се купуват по-големи.

В този пример режимът и медианата са едни и същи, но могат или не могат да бъдат еднакви.

AT интервални вариационни сериикумулативните честоти се определят според данните за кумулативните честоти среден интервал– интервалът, в който натрупаната честота е наполовина или за първи път надхвърля половината от общата сума на честотите. Формулата за определяне на медианата в интервалния ред на разпределението има следващ изглед:

.

където x Азе долната граница на средния интервал;

азе стойността на средния интервал;

фие сумата от честотите на серията;

S Me-1е сумата от натрупаните честоти на интервала, предхождащ медианата;

е азе честотата на средния интервал.

Пример. Определете медианата от наличните данни (Таблица 7.8).

Таблица 7.8 - Разпределение на служителите по трудов стаж

Според табл. 8 определя поредния номер на медианата: NMe=100/2=50. Кумулативната честота, надвишаваща тази стойност за първи път С= 82, съответства на интервал от 6-8 години (среден интервал). В този пример модалните и средните интервали са еднакви, но те могат или не могат да бъдат еднакви. Нека определим медианата по формулата:

години

Следователно, аз= 6,2 години, т.е. половината от служителите имат по-малко от 6,2 години опит, а другата половина имат повече.

Режимът и медианата се използват широко в различни области на икономиката. По този начин изчисляването на модалната производителност на труда, модалните разходи и т.н. дава възможност на икономиста да прецени преобладаващото им ниво в момента. Тази характеристика трябва да се използва за разкриване на резервите на нашата икономика. Модата има значение за решаването на практически проблеми. Така че, когато се планира масовото производство на облекло и обувки, се определя размерът на продукта, който е в най-голямо търсене (модален размер). Модата може да се използва като приблизителна характеристика на нивото на изследвания признак вместо средноаритметично, ако честотните разпределения са близки до симетрични и имат един неплосък връх.

Медианата трябва да се използва като средна стойност в случаите, когато няма достатъчно доверие в хомогенността на изследваната популация. Медианата се влияе не толкова от самите стойности, колкото от броя на случаите на едно или друго ниво. Трябва също да се отбележи, че медианата винаги е специфична (за голям брой наблюдения или в случай на нечетен брой членове на съвкупността), т.к. под азсе подразбира някакъв реален реален елемент от съвкупността, докато средното аритметично често приема стойност, която нито една от единиците на съвкупността не може да приеме.

Основна собственост азв това, че сумата от абсолютните отклонения на стойностите на чертата от медианата е по-малка от всяка друга стойност: . Този имот азможе да се използва например при определяне на строителната площадка на обществени сгради, т.к азопределя точката, която дава най-малко разстояние, да речем, детски градини от местоживеенето на родителите, жителите местностот киното, при проектиране на трамвайни и тролейбусни спирки и др.

В системата от структурни показатели опциите, които заемат определено място в класираните вариационни серии (всеки четвърти, пети, десети, двадесет и пети и т.н.), действат като индикатори за характеристиките на формата на разпределение. По същия начин, с намирането на медианата във вариационната серия, можете да намерите стойността на характеристиката за всяка единица от класираната серия по ред.

Квартили– стойности на атрибути, разделящи обхвата на населението на четири равни части. Разграничете долния квартил ( Q1), средно аритметично ( Q2) и горна ( Въпрос 3). Долният квартил разделя 1/4 от населението с най-ниски стойности на атрибута, горният квартил разделя 1/4 от населението с най-високи стойностизнак. Това означава, че 25% от единиците на съвкупността ще бъдат с по-малка стойност Q1; 25% единици ще бъдат сключени между Q1и Q2; 25% - между Q2и Въпрос 3; останалите 25% превъзхождат Въпрос 3. Средният квартил ( Q2) е медианата .

За изчисляване на квартилите за интервалните серии се използват следните формули:

;

.

където xQ1– долната граница на интервала, съдържащ долния квартил (интервалът се определя от натрупаната честота, като първата надвишава 25%);

x Q3– долната граница на интервала, съдържащ горния квартил (интервалът се определя от натрупаната честота, като първата надвишава 75%);

S Q 1-1е кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил;

S Q 3-1е кумулативната честота на интервала, предхождащ интервала, съдържащ горния квартил;

fQ1е честотата на интервала, съдържащ долния квартил;

fQ3е честотата на интервала, съдържащ горния квартил.

Децилиса стойности на варианти, които разделят класираната серия на десет равни части: 1-ви децил ( d1) разделя населението 1/10 до 9/10, 2-ри децил ( d2) - в съотношение 2/10 към 8/10 и т.н. Децилите се изчисляват по същия начин като медианата и квартилите:

;

.

Използването на горните характеристики при анализа на вариационни серии на разпределение позволява дълбоко и подробно характеризиране на изследваната популация.

ВИЖ ПОВЕЧЕ:

Структурни средни

Наред със силовите средства широко използванеполучени структурни средни стойности.

Структурата на статистическите агрегати е различна. В същото време, колкото по-симетрично е разпределението на единиците от съвкупността, толкова по-качествен е неговият състав според изследваната черта, толкова по-добре, по-надеждно средната стойност на чертата характеризира изследваното явление. Но за случаите на рязко изкривяване (асиметрия) на серията на разпределение средноаритметичната стойност вече не е толкова типична. Например, средният размердепозитите в спестовни банки не представляват особен интерес, тъй като по-голямата част от депозитите са под това ниво, а средната стойност се влияе значително от големите депозити, които са малко и които не са типични за масата депозити.

Мода (статистика)

В такива случаи статистиката използва друга система - системата на спомагателните структурни средни. Те включват режим, медиана, както и квартели, квинтели, децели, процентели.

Мода (Mo)- най-често срещаната стойност на признака, а в дискретна вариационна серия - това е вариантът с най-висока честота.

В статистическата практика модата се използва при изследване на доходите на населението, потребителското търсене, регистрирането на цените и при анализа на някои технически и икономически показатели на предприятията.

AT отделни случаитова е режимът на интерес, а не средноаритметичната стойност. Понякога се използва вместо средно аритметично, например, за характеризиране на структурата на сериите на разпределение.

Редът, в който се определя режимът, зависи от вида на разпределителната серия. Ако променливият атрибут е представен като дискретна серия, тогава не са необходими изчисления за определяне на режима. В такава серия режимът ще бъде стойността на характеристиката, която има най-висока честота.

Ако стойността на атрибута е представена като серия от интервални вариации с равни интервали, тогава режимът се определя чрез изчисление по формулата:

където х мое долната граница на модалния интервал,

аз мое стойността на модалния интервал,

f мо , f Mo-1 , f Mo+1са честотите съответно на модалния, премодалния (предишния) и постмодалния (след модалния) интервали.

Медиана (аз)е стойността на признака, който е в средата на диапазонната вариационна серия, където индивидуални ценностифункции (опции) са подредени във възходящ или низходящ ред (по ранг).

Медианата трябва да се използва като средна стойност в случаите, когато няма достатъчно доверие в хомогенността на изследваната популация. Медианата намира приложение в маркетинговата дейност. Например, разполагането на асансьори, първични винарни, консерви, сумата от разстоянията, до които от доставчиците на суровини трябва да бъде най-малка.

Медианата, подобно на режима, се определя по различни начини. Зависи от структурата на серията за разпространение.
За определяне на медианата в дискретни вариационни серии:

1) намерете поредния му номер по формулата

N Me =
2) изградете поредица от натрупани честоти

3) намерете натрупаната честота, която е равна или надвишава поредния номер на медианата

4) на варианта, съответстващ на дадената натрупана честота, е медианата.

Ако броят на членовете на дискретна серия е нечетен, тогава медианата е в средата на серията и разделя тази серия на две равни части според броя на членовете на серията. Поредният номер на медианата в този случай се изчислява по формулата:

NMe =(f + 1)2,

където fброя на членовете на поредицата.

При интервални серии първо се определя средният интервал. За това, точно както в дискретни редове, пресметнете поредния номер на медианата . Натрупаната честота, която е равна на номера на медианата или първата я надвишава, съответства на медианния интервал в интервалната вариационна серия. Нека означим тази натрупана честота като S Me. Медианата се изчислява директно по формулата:

,
където е долната граница на средния интервал

- стойността на средния интервал

е кумулативната честота на интервала, предхождащ медианата

— честота на средния интервал

Графично определение на мода и медиана
Модата и медианата в интервална серия могат да се определят графично.

Режимът се определя от хистограмата на разпределението. За това се избира най-високият правоъгълник, който е в този случаймодален. След това свързваме десния връх на модалния правоъгълник с десния горен ъгълпредишен правоъгълник. А левият връх на модалния правоъгълник е с горния ляв ъгъл на следващия правоъгълник. Освен това от точката на тяхното пресичане се спуска перпендикуляр към абсцисната ос. Абсцисата на пресечната точка на тези линии ще бъде режимът на разпределение (фиг. 1). Медианата се изчислява от кумулата (фиг. 2). За да се определи, от точка на скалата на натрупаните честоти (честоти), съответстваща на 50%, се начертава права линия, успоредна на абсцисната ос, докато се пресече с кумулата. След това от точката на пресичане на определената права линия с кумулата се спуска перпендикуляр към абсцисната ос. Абсцисата на пресечната точка е медианата.

Индикатори за вариация в статистиката.

В процеса Статистически анализможе да възникне ситуация, когато стойностите на средните стойности съвпадат и популациите, въз основа на които се изчисляват, се състоят от единици, чиито характерни стойности се различават доста рязко една от друга. В този случай се изчисляват показателите за вариация.

Каталог:изтегляния -> Sotrudniki
изтегляния -> Н. Л. Иванова М. Ф. Луканина
изтегляния -> Лекция за предучилищни специалисти и родители „Превенция агресивно поведениедеца в предучилищна възраст"
изтегляния -> Психологически професионална адаптацияличности
изтегляния -> Министерство на образованието и науката Кемеровска областКемеровски регионален психологически и валеологичен център
изтегляния -> федерална службаАдминистрация за контрол на наркотиците на Руската федерация за Кемеровска област
Sotrudniki -> Bow Чувашка републикаспо "четк" на Министерството на образованието на Чувашия
изтегляния -> Характеристики на психологическата и педагогическа подкрепа за развитието на деца в предучилищна възраст
изтегляния -> Мишина М. М. Развитието на мисленето в зависимост от участието в семейни и кланови отношения
Sotrudniki -> Формиране на професионално значими качества у ученици с интелектуални затруднения по професия

ТЕСТ

По темата: "Режим. Медиана. Методи за изчисляването им"

Въведение

Средните стойности и свързаните с тях показатели за вариация играят много важна роля в статистиката, което се дължи на предмета на нейното изследване. Ето защо тази темае един от централните в курса.

Средната стойност е много често срещан обобщаващ показател в статистиката. Това се обяснява с факта, че само с помощта на средната стойност е възможно да се характеризира съвкупността според количествено вариращ признак. Средна стойноств статистиката се нарича обобщаваща характеристика на набор от подобни явления според някаква количествено варираща характеристика. Средната стойност показва нивото на този атрибут, свързано с единицата от съвкупността.

Изучавайки социалните явления и опитвайки се да идентифицираме техните характеристики, типични характеристикив конкретни условия на място и време, статистиците широко използват средни стойности. С помощта на средни стойности различните популации могат да се сравняват една с друга според различни характеристики.

Средните стойности, използвани в статистиката, принадлежат към класа на степенните средни. От средните мощности най-често се използва средноаритметичното, по-рядко средното хармонично; средната хармонична се използва само при изчисляване на средните темпове на динамика, а средната квадратична - само при изчисляване на вариационните показатели.

Средно аритметичното е частното от разделянето на сумата от опциите на техния брой. Използва се в случаите, когато обемът на променлив атрибут за цялата съвкупност се формира като сума от стойностите на атрибута за отделните му единици. Средноаритметичното е най-разпространеният вид средна стойност, тъй като тя съответства на естеството на социалните явления, където обемът на вариращите признаци в съвкупността най-често се формира именно като сума от стойностите на признака в отделни единици на населението.

Съгласно определящото си свойство средната хармонична трябва да се използва, когато общият обем на характеристиката се формира като сума реципрочни стойностиопция. Използва се, когато в зависимост от наличния материал теглата не трябва да се умножават, а да се разделят на опции или, което е същото, да се умножат по обратната им стойност. Средната хармонична стойност в тези случаи е реципрочната на средната аритметична стойност на реципрочните стойности на атрибута.

Средната хармонична стойност трябва да се използва в случаите, когато теглата не са единиците от съвкупността - носители на признака, а произведенията на тези единици и стойността на признака.

1. Дефиниция на режим и медиана в статистиката

Средните аритметични и хармонични са обобщаващите характеристики на съвкупността по един или друг променлив признак. Спомагателни описателни характеристики на разпределението на променлив атрибут са модата и медианата.

В статистиката модата е стойността на характеристика (вариант), която най-често се среща в дадена популация. В серията вариации това ще бъде вариантът с най-висока честота.

Медианата в статистиката се нарича вариант, който е в средата на вариационната серия. Медианата разделя серията наполовина, от двете й страни (нагоре и надолу) има еднакъв брой единици съвкупност.

Модата и медианата, за разлика от експоненциалните средни, са специфични характеристики, тяхната стойност е всеки конкретен вариант във вариационната серия.

Режимът се използва в случаите, когато е необходимо да се характеризира най-често срещаната стойност на характеристика.

5.5 Мода и медиана. Изчисляването им в дискретни и интервални вариационни редове

Ако имате нужда, например, да разберете най-често срещания размер заплатив предприятието, пазарната цена, на която е продадено най-голямото числостоки, най-търсеният от потребителите размер на обувките и т.н., в тези случаи прибягват до модата.

Медианата е интересна с това, че показва количествената граница на стойността на променливата характеристика, която е достигната от половината от членовете на съвкупността. Нека средната заплата на банковите служители възлиза на 650 000 рубли. на месец. Тази характеристика може да бъде допълнена, ако кажем, че половината от работниците са получили заплата от 700 000 рубли. и по-висока, т.е. нека вземем медианата. Модата и медианата са типични характеристики в случаите, когато популациите са хомогенни и големи по брой.

Намиране на модата и медианата в дискретна вариационна серия

Намирането на режима и медианата във вариационна серия, където стойностите на атрибутите са дадени с определени числа, не е много трудно. Разгледайте таблица 1. с разпределението на семействата по броя на децата.

Таблица 1. Разпределение на семействата по брой деца

Очевидно в този пример модата ще бъде семейство с две деца, тъй като тази стойност на опциите съответства на най-голям бройсемейства. Може да има разпределения, при които всички варианти са еднакво често срещани, в който случай няма мода или, с други думи, може да се каже, че всички варианти са еднакво модални. В други случаи не една, а две опции могат да бъдат най-високата честота. Тогава ще има два режима, разпределението ще бъде бимодално. Бимодалните разпределения могат да показват качествената хетерогенност на популацията според изследваната черта.

За да намерите медианата в серия от дискретни вариации, трябва да разделите сумата от честотите наполовина и да добавите ½ към резултата. И така, при разпределението на 185 семейства по броя на децата, медианата ще бъде: 185/2 + ½ = 93, т.е. 93-та опция, която разделя наредения ред наполовина. Какъв е смисълът на 93-та опция? За да разберете, трябва да натрупате честоти, като започнете от най-малките опции. Сумата от честотите на 1-ва и 2-ра опция е 40. Ясно е, че тук няма 93 опции. Ако добавим честотата на 3-та опция към 40, тогава получаваме сумата, равна на 40 + 75 = 115. Следователно 93-тата опция съответства на третата стойност на променливия атрибут, а медианата ще бъде семейство с две деца .

Режим и медиана в този примерсъвпадение. Ако имахме четна сума от честоти (например 184), тогава прилагайки горната формула, получаваме броя на опциите за медиана, 184/2 + ½ = 92,5. Тъй като няма дробни опции, резултатът показва, че медианата е в средата между 92 и 93 опции.

3. Изчисляване на модата и медианата в интервалните вариационни серии

Описателният характер на модата и медианата се дължи на факта, че те не компенсират индивидуалните отклонения. Те винаги съвпадат определен вариант. Следователно режимът и медианата не изискват изчисления, за да ги намерят, ако всички стойности на характеристиката са известни. Въпреки това, в интервалните вариационни серии, изчисленията се използват за намиране на приблизителната стойност на модата и медианата в рамките на определен интервал.

За изчисление определена стойностна модалната стойност на атрибута, заграден в интервала, се използва следната формула:

M o \u003d X Mo + i Mo * (f Mo - f Mo-1) / ((f Mo - f Mo-1) + (f Mo - f Mo + 1)),

Където X Mo е минималната граница на модалния интервал;

i Mo е стойността на модалния интервал;

fMo е честотата на модалния интервал;

f Mo-1 - честотата на интервала, предхождащ модалния;

f Mo+1 е честотата на интервала след модала.

Ще покажем изчислението на режима, като използваме примера, даден в таблица 2.

Таблица 2. Разпределение на работниците в предприятието според изпълнението на производствените норми

За да намерим модата, първо определяме модалния интервал на дадената серия. От примера се вижда, че най-високата честота съответства на интервала, където вариантът е в диапазона от 100 до 105. Това е модалният интервал. Стойността на модалния интервал е 5.

Заместване числови стойностиот таблица 2. в горната формула, получаваме:

M o \u003d 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) \u003d 108,8

Значението на тази формула е следното: стойността на тази част от модалния интервал, която трябва да бъде добавена към минималната му граница, се определя в зависимост от големината на честотите на предходния и следващите интервали. В този случай добавяме 8,8 към 100, т.е. повече от половината от интервала, тъй като честотата на предишния интервал е по-малка от честотата на следващия интервал.

Нека сега изчислим медианата. За да намерим медианата в интервалната вариационна серия, първо определяме интервала, в който тя се намира (средния интервал). Такъв интервал ще бъде този, чиято кумулативна честота е равна или по-голяма от половината от сбора на честотите. Кумулативните честоти се формират чрез постепенно сумиране на честотите, като се започне от интервала от най-малката стойностзнак. Половината от сбора на честотите, които имаме, е 250 (500:2). Следователно, според таблица 3. средният интервал ще бъде интервалът със стойност на заплатите от 350 000 рубли. до 400 000 рубли.

Таблица 3. Изчисляване на медианата в интервалните вариационни серии

Преди този интервал сумата от натрупаните честоти беше 160. Следователно, за да се получи стойността на медианата, е необходимо да се добавят още 90 единици (250 - 160).

При определяне на стойността на медианата се приема, че стойността на единиците в границите на интервала е разпределена равномерно. Следователно, ако 115 единици в този интервал са разпределени равномерно в интервал, равен на 50, тогава 90 единици ще съответстват на следната стойност:

Мода в статистиката

Медиана (статистика)

Медиана (статистика), в математическа статистика- число, характеризиращо извадката (например набор от числа). Ако всички елементи в извадката са различни, тогава медианата е числото на извадката, така че точно половината от елементите в извадката са по-големи от нея, а другата половина са по-малки от нея.

В повече общ случайМедианата може да се намери чрез подреждане на елементите на извадката във възходящ или низходящ ред и вземане на средния елемент. Например извадката (11, 9, 3, 5, 5) след подреждане се превръща в (3, 5, 5, 9, 11) и нейната медиана е числото 5. Ако извадката има четен брой елементи, медианата може да не е уникално определена: за числови данни най-често се използва полусумата от две съседни стойности (т.е. медианата на набора (1, 3, 5, 7) се приема равна на 4).

С други думи, медианата в статистиката е стойността, която разделя серията наполовина по такъв начин, че от двете й страни (нагоре или надолу) се намира същото числоединици от тази популация. Поради това свойство този показател има няколко други имена: 50-ти персентил или 0,5 квантил.

Медианата се използва вместо средноаритметично, когато крайните варианти на класираната серия (най-малката и най-голямата) в сравнение с останалите се оказват прекалено големи или прекалено малки.

Функцията MEDIAN измерва централната тенденция, която е центърът на набор от числа в статистическо разпределение. Има три най-често срещани начина за определяне на централната тенденция:

  • Означава- средно аритметично, което се изчислява чрез добавяне на набор от числа, последвано от разделяне на получената сума на техния брой.
    Например, средното за числата 2, 3, 3, 5, 7 и 10 е 5, което е резултат от разделянето на сбора им, който е 30, на техния брой, който е 6.
  • Медиана- число, което е средата на набор от числа: половината от числата имат стойности, по-големи от медианата, а половината от числата са по-малки.
    Например, медианата за числата 2, 3, 3, 5, 7 и 10 е 4.
  • Модае числото, което се среща най-често в даден наборчисла.

    Например, режимът за числата 2, 3, 3, 5, 7 и 10 е 3.

За характеризиране на редовете на разпределение (структурата на вариационните редове), наред със средната, се използват т.нар. структурни средни: модаи Медиана. Модата и медианата са най-често използваните в икономическата практика.

Мода- вариантът, който най-често се среща в серията на разпространение (в тази популация).

AT отделенпри вариационни серии режимът се определя от най-високата честота. Да приемем, че стоката А се продава в града от 9 фирми на следните цени в рубли:

44; 43; 44; 45; 43; 46; 42; 46;43. Тъй като най-често срещаната цена е 43 рубли, тя ще бъде модална.

При характеризиране социални групинаселението по ниво на дохода трябва да използва модална стойност, а не средна стойност. Средната стойност ще подцени някои показатели и ще надцени други - като по този начин осреднява (изравнява) доходите на всички сегменти от населението.

AT интервалвъв вариационни серии режимът се определя приблизително по формулата:

    ХМ0 - долната граница на модалния интервал;

    h Mo - стойност (стъпка, ширина) на модалния интервал;

    f 1 - локална честота на интервала, предхождащ модалния;

    f 2 - локална честота на модалния интервал;

    f 3 - локална честота на интервала, следващ модалния.

Разпределение на населението по равнище на средния месечен доход на глава от населението

Интервалът 1000-3000 в това разпределение ще бъде модален, т.к има най-висока честота (f=35.5). Тогава, съгласно горната формула, режимът ще бъде равен на:

На графиката (хистограма на разпределение) режимът се определя по следния начин: локалните честоти се нанасят по оста y, а интервалите или центровете на интервалите се нанасят по абсцисата. Избира се най-високата лента, която съответства на стойността на характеристиката с най-висока честота в серията на разпределение.

Модаизползвани за решаване на някои практически проблеми. Така например, когато се изучава оборотът на пазара, се взема модалната цена, за да се проучи търсенето на обувки, дрехи, се използват модалните размери на обувки и дрехи.

Медиана- това е числената стойност на признака за единицата от популацията, която е в средата на класираната серия (построена във възходящ или низходящ ред на стойностите на изследвания признак). Медианапонякога се нарича среден вариант, защото тя разделя съвкупността на две равни части по такъв начин, че от двете й страни има еднакъв брой единици от съвкупността. Ако на всички единици от серия са присвоени поредни номера, тогава поредният номер на медианата ще се определи по формулата (n + 1): 2 за серия, където n - странно. Ако един ред с дориброй единици, тогава Медианаще бъде средната стойност между две съседни опции, определена по формулата: n:2, (n+1):2, (n:2)+1.

В дискретни вариационни серии с нечетен брой единици на съвкупността това е специфична числена стойност в средата на серията.

Намирането на медианата в интервални вариационни серии изисква предварително определяне на интервала, в който се намира медианата, т.е. Медиана интервал- този интервал се характеризира с факта, че неговата кумулативна (кумулативна) честота е равна на половината от сумата или надвишава половината от сумата на всички честоти от серията.

    X Me - долната граница на средния интервал

    h Me - стойността на средния интервал;

    S Me-1 - сумата от натрупаните честоти на интервала, предхождащ медианния интервал;

    f Me е локалната честота на средния интервал.

Според таблицата определяме средната стойност доход на глава от населението. За да направите това, трябва да определите какъв интервал ще бъде медианата. Използваме формулата за броя на медианната единица на редицата, т.е. среден:

Дробна стойност на N (винаги с четен брой членове), равна на 50,5%, показва, че средата на серията е между 50% и 51%, т.е. в третия интервал. С други думи: медианата е интервалът, който за първи път представлява повече от половината от сбора на натрупаните честоти. Следователно медианата:

За да се определи графично интервалът, в който се намира медианата, по оста у се нанасят натрупаните честоти, а по абсцисата центровете на интервалите. От точката на ординатната ос, която съответства на 50,5% от сумата на натрупаните честоти, се начертава права, успоредна на абсцисната ос, докато се пресече с кумулата. От точката на пресичане се спуска перпендикуляр към абсцисната ос.

Съотношението на режима, медианата и средното аритметично показва естеството на разпределението на признака в съвкупността, позволява да се оцени неговата асиметрия. Ако M0

От съотношението на тези показатели следва да се заключи, че е налице дясностранна асиметрия в разпределението на населението според нивото на средния паричен доход на глава от населението:

Квартил- това е четвъртата част от популацията, тя се определя като медиана, само сумата от честотите трябва да се раздели на 4, а при определяне на квартилния интервал кумулативната честота трябва да бъде по-голяма или равна на една четвърт от сбор от честотите на популацията.

ДецилРазделя населението на десет равни части. Определя се по същия начин като квартила, само сумата от честотите трябва да бъде разделена на 10.

Наред със средните стойности се изчисляват структурни средни като статистически характеристики на вариационния ред на разпределение - модаи Медиана.
Мода(Mo) представлява стойността на изследвания признак, повтарящ се с най-висока честота, т.е. mode е стойността на характеристиката, която се среща най-често.
Медиана(Me) е стойността на характеристиката, която попада в средата на класираната (подредена) популация, т.е. медиана - централната стойност на вариационната серия.
Основното свойство на медианата е, че сумата от абсолютните отклонения на стойностите на атрибута от медианата е по-малка от всяка друга стойност ∑|x i - Me|=min.

Определяне на режим и медиана от негрупирани данни

Обмисли определяне на режим и медиана от негрупирани данни. Да приемем, че работните бригади, състоящи се от 9 души, имат следните категории заплати: 4 3 4 5 3 3 6 2 6 . Тъй като в този екип има най-много работници от 3-та категория, тази тарифна категория ще бъде модална. Mo = 3.
За определяне на медианата е необходимо да се класира: 2 3 3 3 4 4 5 6 6 . Централен в тази серия е работникът от 4-та категория, следователно тази категория ще бъде медианата. Ако класираната поредица включва четен брой единици, тогава медианата се определя като средната стойност на двете централни стойности.
Ако режимът отразява най-често срещания вариант на стойността на атрибута, тогава медианата практически изпълнява функциите на средна стойност за хетерогенна популация, която не се подчинява на нормалния закон на разпределение. Нека илюстрираме когнитивното му значение със следния пример.
Да предположим, че трябва да характеризираме средния доход на група хора от 100 души, от които 99 имат доходи в диапазона от $100 до $200 на месец, а месечният доход на последните е $50 000 (Таблица 1).
Таблица 1 - Месечни доходи на изследваната група хора. Ако използваме средно аритметично, получаваме среден доход от около 600 - 700 долара, който няма много общо с доходите на основната част от групата. Медианата, в този случай равна на Me = 163 долара, ще ни позволи да дадем обективна характеристика на нивото на доходите на 99% от тази група хора.
Разгледайте дефиницията на режима и медианата чрез групирани данни (серия на разпределение).
Да предположим, че разпределението на работниците на цялото предприятие като цяло според тарифната категория има следната форма (Таблица 2).
Таблица 2 - Разпределение на работниците в предприятието според тарифната категория

Изчисляване на режим и медиана за дискретна серия

Изчисляване на режим и медиана за интервална серия

Изчисляване на режим и медиана за вариационна серия

Определяне на режима от серия от дискретни вариации

Използва се поредицата от стойности на функции, изградени по-рано, сортирани по стойност. Ако размерът на извадката е нечетен, вземете централната стойност; ако размерът на извадката е четен, вземаме средната аритметична стойност на двете централни стойности.
Определяне на режима от серия от дискретни вариации: 5-та тарифна категория има най-висока честота (60 души), следователно е модална. Mo = 5.
За да се определи средната стойност на атрибута, числото на средната единица на серията (N Me) се намира по следната формула: , където n е обемът на съвкупността.
В нашия случай: .
Получената дробна стойност, която винаги се среща при четен брой единици от съвкупността, показва, че точната среда е между 95 и 96 работници. Необходимо е да се определи към коя група принадлежат работниците с тези поредни номера. Това може да стане чрез изчисляване на натрупаните честоти. В първата група, където са само 12 души, няма работници с тези бройки, а във втора група ги няма (12+48=60). 95-ти и 96-ти работници са в трета група (12+48+56=116), следователно 4-та категория заплата е медианата.

Изчисляване на мода и медиана в интервална серия

За разлика от дискретните вариационни серии, определянето на модата и медианата от интервални серии изисква определени изчисления въз основа на следните формули:
, (5.6)
където x0- долната граница на модалния интервал (интервалът с най-висока честота се нарича модален);
азе стойността на модалния интервал;
fMoе честотата на модалния интервал;
f Mo-1е честотата на интервала, предхождащ модала;
f Mo +1е честотата на интервала след модала.
(5.7)
където x0– долната граница на медианния интервал (медианата е първият интервал, чиято натрупана честота надвишава половината от общата сума на честотите);
азе стойността на средния интервал;
S Me-1- натрупан интервал, предхождащ медианата;
е азе честотата на средния интервал.
Ние илюстрираме приложението на тези формули с помощта на данните в табл. 3.
Интервалът с граници 60 - 80 в това разпределение ще бъде модален, т.к има най-висока честота. Използвайки формула (5.6), определяме режима:

За да се установи медианният интервал, е необходимо да се определи натрупаната честота на всеки следващ интервал, докато тя надхвърли половината от сумата на натрупаните честоти (в нашия случай 50%) (Таблица 5.11).
Установено е, че медианата е интервалът с граници от 100 - 120 хиляди рубли. Сега определяме медианата:

Таблица 3 - Разпределение на населението на Руската федерация по нивото на средния номинален паричен доход на глава от населението през март 1994 г.
Групи по ниво на среден месечен доход на глава от населението, хиляди рублиДял от населението, %
до 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Над 3007,7
Обща сума100,0

Таблица 4 - Дефиниция на медианния интервал
По този начин средната аритметична стойност, модата и медианата могат да се използват като обобщена характеристика на стойностите на определен атрибут за единици от класирана популация.
Основната характеристика на разпределителния център е средноаритметичното, което се характеризира с това, че всички отклонения от него (положителни и отрицателни) се събират до нула. Характерно за медианата е, че сумата на отклоненията от нея по модул е ​​минимална, а модата е стойността на най-често срещания признак.
Съотношението на режима, медианата и средното аритметично показва естеството на разпределението на признака в съвкупността, позволява да се оцени неговата асиметрия. При симетричните разпределения и трите характеристики са еднакви. Колкото по-голямо е несъответствието между модата и средната аритметична стойност, толкова по-асиметрична е серията. За умерено изкривени серии разликата между режима и средната аритметична стойност е приблизително три пъти разликата между медианата и средната стойност, т.е.:
|Mo–`x| = 3 |Me –`x|.

Определяне на мода и медиана по графичен метод

Модата и медианата в интервална серия могат да се определят графично. Режимът се определя от хистограмата на разпределението. За целта се избира най-високият правоъгълник, който в случая е модален. След това свързваме десния връх на модалния правоъгълник с горния десен ъгъл на предишния правоъгълник. А левият връх на модалния правоъгълник е с горния ляв ъгъл на следващия правоъгълник. От точката на тяхното пресичане спускаме перпендикуляра към абсцисната ос. Абсцисата на пресечната точка на тези линии ще бъде режимът на разпределение (фиг. 5.3).


Ориз. 5.3. Графично дефиниране на модата чрез хистограма.


Ориз. 5.4. Графично определяне на медианата чрез кумулат
За определяне на медианата от точка на скалата на натрупаните честоти (честоти), съответстваща на 50%, се начертава права линия, успоредна на абсцисната ос до пресечната точка с кумулата. След това от точката на пресичане се спуска перпендикуляр към абсцисната ос. Абсцисата на пресечната точка е медианата.

Квартили, децили, процентили

По същия начин, с намирането на медианата във вариационната серия на разпределение, можете да намерите стойността на характеристика за всяка единица от класираната серия по ред. Така например можете да намерите стойността на характеристика в единици, които разделят серията на четири равни части, на 10 или 100 части. Тези стойности се наричат ​​"квартили", "децили", "перцентили".
Квартилите са стойността на характеристика, която разделя обособената съвкупност на 4 равни части.
Правете разлика между долния квартил (Q 1), който разделя ¼ от съвкупността с най-ниските стойности на атрибута, и горния квартил (Q 3), който отрязва ¼ частта с най-високите стойности на атрибута . Това означава, че 25% от единиците на съвкупността ще бъдат по-малки от Q 1 ; 25% единици ще бъдат затворени между Q 1 и Q 2; 25% - между Q 2 и Q 3, а останалите 25% са по-добри от Q 3. Средният квартил на Q 2 е медианата.
За изчисляване на квартилите чрез интервални вариационни серии се използват следните формули:
, ,
където x Q 1– долната граница на интервала, съдържащ долния квартил (интервалът се определя от натрупаната честота, като първата надвишава 25%);
x Q 3– долната граница на интервала, съдържащ горния квартил (интервалът се определя от натрупаната честота, като първата надвишава 75%);
аз– интервална стойност;
S Q 1-1е кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил;
S Q 3-1е кумулативната честота на интервала, предхождащ интервала, съдържащ горния квартил;
f Q 1е честотата на интервала, съдържащ долния квартил;
f Q 3е честотата на интервала, съдържащ горния квартил.
Помислете за изчисляването на долния и горния квартил съгласно табл. 5.10. Долният квартил е в диапазона 60 - 80, чиято кумулативна честота е 33,5%. Горният квартил е в диапазона 160 - 180 с акумулирана честота от 75,8%. Имайки това предвид, получаваме:
,
.
В допълнение към квартилите, децилите могат да бъдат определени в ранговете на вариационното разпределение - опции, които разделят класираната вариационна серия на десет равни части. Първият децил (d 1) разделя съвкупността от 1/10 до 9/10, вторият децил (d 1) от 2/10 до 8/10 и т.н.
Те се изчисляват по формулите:
, .
Стойностите на характеристиките, които разделят серията на сто части, се наричат ​​процентили. Съотношенията на медианата, квартилите, децилите и процентилите са показани на фиг. 5.5.

Средната аритметична стойност (наричана по-долу средна) е може би най-популярният статистически параметър. Тази концепция се използва навсякъде - от поговорката "средна температура в болницата" до сериозни научни трудове. Въпреки това, колкото и да е странно, средната стойност е сложна концепция, често подвеждаща, вместо да дава яснота и яснота.

Ако говорим за научна работа, тогава статистическият анализ на данни се използва в почти всички приложни науки, дори в хуманитарните (например психология). Средната стойност се изчислява за характеристики, измерени на така наречените непрекъснати скали. Такива признаци са например концентрацията на вещества в кръвния серум, ръст, тегло, възраст. Средната аритметична може лесно да се изчисли и се учи в гимназията. Въпреки това (в съответствие с разпоредбите на математическата статистика) средната стойност е адекватна мярка за централната тенденция в извадката само в случай на нормално (гаусово) разпределение на атрибута (фиг. 1). Ориз. 1. Нормално (гаусово) разпределение на характеристика в извадката. Средното (M) и медианата (Me) са еднакви

В случай на отклонение на разпределението от нормалния закон е неправилно да се използва средната стойност, тъй като тя е твърде чувствителна към така наречените „извънредни стойности“ - нехарактерни за изследваната извадка, твърде големи или твърде малки ( Фиг. 2). В този случай трябва да се използва друг параметър, медианата, за характеризиране на централната тенденция в извадката. Медианата е стойността на характеристиката, отдясно и отляво на която има равен брой наблюдения (по 50%). Този параметър (за разлика от средната стойност) е устойчив на „отклонения“. Обърнете внимание също, че медианата може да се използва и в случай на нормално разпределение, в който случай медианата е същата като средната.

Ориз. 2. Разпределението на признака в извадката е различно от нормалното. Средната стойност (m) и медианата (ME) не съвпадат

За да се установи дали разпределението на даден признак в извадката е нормално (гаусово) или не, т.е., за да се установи кой от параметрите трябва да се използва (среден или медианен), има специални статистически тестове.

Да вземем пример. Скоростта на утаяване на еритроцитите в групата пациенти със скорошна пневмония е 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Средната стойност за тази проба е 17,8, медианата е 12. Разпределение (според теста на Shapiro-Wilk) не е нормално (фиг. 3), така че трябва да се използва медианата. Ориз. 3. Пример

Колкото и да е странно, но в някои области на икономиката външен наблюдател не може да забележи поне някаква следа от правилното прилагане на математическата статистика. И така, постоянно ни казват за средната заплата (например в изследователски институти) и тези цифри обикновено изненадват не само обикновените служители, но и ръководителите на отдели (сега наричани „среден мениджър“). Изненадани сме, че средната заплата в Москва е 40 хиляди рубли, но, разбира се, разбираме, че сме „осреднени“ с олигарсите. Ето един пример от живота на учените: заплатите на служителите в лабораторията (хиляди рубли) са 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Средната стойност е 17,8, медианата е 12. Съгласете се, че това са различни числа!

Разбира се, не може да се изключи, че премълчаването на свойствата на средния е лукавство, тъй като за ръководството винаги е по-изгодно да представи ситуацията със заплатите на служителите по-добре, отколкото е в действителност.

Не е ли време научната общност да призове нашите лидери да спрат злоупотребата с математическата статистика?

Олга Реброва,
док. пчелен мед. науки, вицепрезидент
IPO "Общество на специалистите по медицина, базирана на доказателства"

Медиана- това е стойност на характеристика, която разделя класираната серия на разпределение на две равни части - със стойности на характеристики по-малки от медианата и със стойности на характеристики по-големи от медианата. За да намерите медианата, трябва да намерите стойността на характеристиката, която е в средата на подредената серия.

Вижте решението на задачата за намиране на модата и медианатаМожеш

В класирани серии, негрупирани данни за намиране на медианатасе свеждат до намиране на поредния номер на медианата. Медианата може да се изчисли по следната формула:

където Xm е долната граница на средния интервал;
im - среден интервал;
Sme е сборът от наблюдения, натрупан преди началото на средния интервал;
fme е броят на наблюденията в средния интервал.

медианни свойства

  1. Медианата не зависи от онези стойности на атрибута, които са разположени от двете му страни.
  2. Аналитичните операции с медианата са много ограничени, така че при комбиниране на две разпределения с известни медиани е невъзможно да се предвиди предварително стойността на медианата на новото разпределение.
  3. Медианата имаминималната собственост. Същността му се състои в това, че сумата от абсолютните отклонения на стойностите на x от медианата е минималната стойност в сравнение с отклонението на X от всяка друга стойност

Графично определение на медианата

За определяне медиани по графичен методизползват натрупаните честоти, върху които се изгражда кумулативната крива. Върховете на ординатите, съответстващи на натрупаните честоти, са свързани с прави сегменти. Разделяйки наполовина последната ордината, която съответства на общата сума на честотите, и начертайте перпендикуляра на пресечната точка с кумулативната крива към нея, намерете ординатата на желаната стойност на медианата.

Определение за мода в статистиката

Мода - характеристика стойност, която има най-висока честота в статистическите серии на разпределение.

Определение за модасе произвежда по различни начини и това зависи от това дали променливата е представена като дискретна или интервална серия.

Намиране на модаи медианата се прави чрез просто разглеждане на колоната за честота. В тази колона намерете най-голямото число, характеризиращо най-високата честота. Съответства на определена стойност на атрибута, който е режимът. В серията от интервални вариации централният вариант на интервала с най-висока честота се счита приблизително за режим. В тази серия за разпространение режим се изчислява по формулата:

където XMo е долната граница на модалния интервал;
imo - модално разстояние;
fm0, fm0-1, fm0+1 са честотите в модалните, предишните и следващите модални интервали.

Модалният интервал се определя от най-високата честота.

Модата се използва широко в статистическата практика при анализа на потребителското търсене, регистриране на цените и др.

Връзки между средно аритметично, медиана и мода

За унимодална серия със симетрично разпределение медианата и модата са еднакви. За асиметричните разпределения те не съвпадат.

К. Пиърсън, въз основа на подравняването на различни видове криви, установи, че за умерено асиметрични разпределения са валидни следните приблизителни връзки между средноаритметичната стойност, медианата и модата: