Біографії Характеристики Аналіз

Медіана вибіркових даних. Визначення моди та медіани графічним методом

Структурні (позиційні) середні– це середні величини, що займають певне місце (позицію) у ранжованому варіаційному ряду.

Мода(Mo) - це значення ознаки, що найчастіше зустрічається в досліджуваній сукупності.

Для дискретних варіаційних рядівмодою буде значення варіанти з найбільшою частотою

приклад. Визначити моду за наявними даними (табл. 7.5).

Таблиця 7.5 – Розподіл жіночого взуття, проданого у взуттєвому магазині N, лютий 2013 р.

За даними табл. 5 видно, що найбільша частота f max= 28, їй відповідає значення ознаки x= 37 розмір. Отже, Mo= 37 обсяг взуття, тобто. саме цей розмір взуття користувався найбільшим попитом, що найчастіше купували взуття 37-го розміру.

У спочатку визначається модальний інтервал, тобто. містить моду – інтервал з найбільшою частотою (у разі інтервального розподілу з рівними інтервалами, у випадку з нерівними інтервалами – найбільшою щільністю).

Модою приблизно вважається середина модального інтервалу. Конкретне значення моди для інтервального ряду визначається за такою формулою:

де x Mo- нижня межа модального інтервалу;

i Mo- Величина модального інтервалу;

f Mo- Частота модального інтервалу;

f Mo -1– частота інтервалу, що передує модальному;

f Mo +1- Частота інтервалу, наступного за модальним.

приклад. Визначити моду за наявними даними (табл. 7.6).

Таблиця 7.6 - Розподіл працівників за стажем

За даними табл. 6 видно, що найбільша частота f max= 35 їй відповідає інтервал: 6-8 років (модальний інтервал). Визначимо моду за формулою:

років.

Отже, Mo= 6,8 років, тобто. більшість працівників мають стаж 6,8 років.

Назва медіани взято з геометрії, де ним іменується відрізок, що з'єднує одну з вершин трикутника із серединою протилежного бокуі таким чином, що розділяє сторону трикутника на дві рівні частини.

Медіана(Ме) це значення ознаки, що припадає на середину ранжованої сукупності. Інакше медіана - це величина, яка ділить чисельність упорядкованого варіаційного ряду на дві рівні частини - одна частина має значення варіює ознаки менші, ніж середній варіант, а інша - більші.

Для ранжованого ряду(тобто впорядкованого - побудованого в порядок зростанняабо спадання індивідуальних значеньознаки) з непарним числом членів ( n=непар) медіаною є варіанта, розташована в центрі ряду. Порядковий номер медіани ( N Me) визначається наступним чином:

N Me = (n+1)/ 2.

приклад.У ряду з 51 члена номер медіани (51+1)/2 = 26, тобто. медіаною є варіант, що стоїть у ряду 26 по порядку.

Для ранжованого ряду з парним числом членів ( n=чет) – медіаною буде середня арифметична із двох значень ознаки, розташованих у середині ряду. Порядкові номери двох центральних варіантів визначаються таким чином:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

приклад.При n=50; N Me1 = 50/2 = 25; N Me2= (50/2) +1 = 26, тобто. медіаною є середня з варіант, що стоять у ряду 25-ої ​​та 26-ої по порядку.

У дискретних варіаційних рядах медіана знаходиться за накопиченою частотою, що відповідає порядковому номеру медіани або вперше його перевищує. Інакше за накопиченою частотою, що дорівнює або вперше перевищує половину суми всіх частот ряду.

приклад. Визначити медіану за даними (табл. 7.7).

Таблиця 7.7 – Розподіл жіночого взуття, проданого у взуттєвому магазині N, лютий 2013 р.

За даними табл. 7 визначимо порядковий номермедіани: N Me = ( 67+1)/2=34.

Мода. Медіана. Способи їх розрахунку (стор. 1 із 2)

Накопичена частота, що вперше перевищує це значення, S= 41, їй відповідає значення ознаки x= 37 розмір. Отже, Me= 37 обсяг взуття, тобто. половина пар купується менше 37-го розміру, інша половина – більше.

У цьому прикладі мода та медіана збігаються, але вони можуть і не збігатися.

У інтервальному варіаційному рядувизначаються накопичені частоти, за даними про накопичені частоти знаходять медіанний інтервал– інтервал, у якому накопичена частота становить половину чи вперше перевищує половину всієї суми частот. Формула визначення медіани в інтервальному ряду розподілу має наступний вигляд:

.

де x Me– нижня межа медіанного інтервалу;

i Me- Величина медіанного інтервалу;

f i- Сума частот ряду;

S Me -1– сума накопичених частот інтервалу, що передує медіанному;

f Me- Частота медіанного інтервалу.

приклад. Визначити медіану за даними (табл. 7.8).

Таблиця 7.8 - Розподіл працівників за стажем

За даними табл. 8 визначимо порядковий номер медіани: N Me = 100/ 2 = 50. Накопичена частота, що вперше перевищує це значення, S= 82 їй відповідає інтервал 6-8 років (медіанний інтервал). У цьому прикладі модальний та медіанний інтервал збігаються, але вони можуть і не збігатися. Визначимо медіану за формулою:

років

Отже, Me= 6,2 роки, тобто. половина працівників мають стаж менше 6,2 років, а інша половина – більше.

Мода та медіана знаходять широке застосування у різних галузях економіки. Так, обчислення модальної продуктивності праці, модальної собівартості тощо. дає можливість економісту судити про переважаючий на даний момент їхній рівень. Ця характеристика має бути використана виявлення резервів нашої економіки. Мода має значення на вирішення практичних завдань. Так, при плануванні масового випуску одягу та взуття встановлюється розмір продукції, який має найбільший попит (модальний розмір). Мода може бути використана в якості наближеної характеристики рівня ознаки, що вивчається замість середньої арифметичної, якщо розподілу частот близько до симетричного і має одну неплоську вершину.

Медіану слід застосовувати як середню величину в тих випадках, де немає достатньої впевненості в однорідності сукупності, що вивчається. На медіану впливають не так самі значення, скільки кількість випадків на тому чи іншому рівні. Слід зазначити, що медіана завжди конкретна (при великому числі спостережень чи разі непарного числа членів сукупності), т.к. під Мемається на увазі деякий дійсний реальний елемент сукупності, тоді як арифметична середня часто набуває такого значення, яке може приймати жодна з одиниць сукупності.

Головна властивість Меу тому, що сума абсолютних відхилень значень ознаки від медіани менша, ніж від будь-якої іншої величини: . Ця властивість Меможе бути використано, наприклад, щодо місця будівництва громадських будівель, т.к. Мевизначає точку, що дає найменшу відстань, припустимо, дитячих садків від місця проживання батьків, мешканців населеного пунктувід кінотеатру, під час проектування трамвайних, тролейбусних зупинок тощо.

У системі структурних показників як показники особливостей форми розподілу виступають варіанти, що займають певне місце в ранжированому варіаційному ряду (кожне четверте, п'яте, десяте, двадцять п'яте і т.д.). Аналогічно з перебуванням медіани в варіаційних рядах можна знайти значення ознаки у будь-якій порядку одиниці ранжованого ряду.

Квартилі- Значення ознаки, що ділять ранжовану сукупність на чотири рівні частини. Розрізняють квартиль нижній ( Q 1), середній ( Q 2) та верхній ( Q 3). Нижній квартиль відокремлює 1/4 частину сукупності з найменшими значеннями ознаки, верхній - 1/4 частина з найбільшими значеннямиознаки. Це означає, що 25% одиниць сукупності будуть меншими за величиною Q 1; 25% одиниць будуть укладені між Q 1і Q 2; 25% - між Q 2і Q 3; інші 25% перевищують Q 3. Середнім квартилем ( Q 2) є медіана .

Для розрахунку квартилів за інтервальним рядом використовують формули:

;

.

де x Q1- нижня межа інтервалу, що містить нижній квартиль (інтервал визначається за накопиченою частотою, першою, що перевищує 25%);

x Q3- нижня межа інтервалу, що містить верхній квартиль (інтервал визначається за накопиченою частотою, першою, що перевищує 75%);

S Q 1-1– накопичена частота інтервалу, що передує інтервалу, що містить нижній квартиль;

S Q 3-1- накопичена частота інтервалу, що передує інтервалу, що містить верхній квартиль;

f Q1- Частота інтервалу, що містить нижній квартиль;

f Q3- Частота інтервалу, що містить верхній квартиль.

Децилі– це значення варіант, який ділять ранжований ряд на десять рівних частин: 1-ий дециль ( d 1) ділить сукупність у співвідношенні 1/10 до 9/10, 2-ий дециль ( d 2) - у співвідношенні 2/10 до 8/10 і т.д. Обчислюються децилі за тією самою схемою, що і медіана, і квартили:

;

.

Використання в аналізі варіаційних рядів розподілу розглянутих вище характеристик дозволяє глибоко і детально охарактеризувати сукупність, що досліджується.

ПОДИВИТИСЯ ЩЕ:

Структурні середні величини

Поряд зі статечними середніми широке розповсюдженняотримали структурні середні.

Структура статистичних сукупностей буває різною. При цьому чим симетричніше розподіл одиниць сукупності, чим якісно однорідніше її склад за ознакою, що вивчається, тим краще, надійніше середня величина ознаки характеризує досліджуване явище. Для випадків різкої скошеності (асиметрія) низки розподілу середня арифметична негаразд типова. Наприклад, середній розмірвкладу в ощадбанках не становить особливого інтересу, оскільки переважна більшість вкладів перебуває нижче рівня, але в середню мають істотний вплив великі вклади, яких мало і які характерні маси вкладів.

Мода (статистика)

У разі статистика застосовує іншу систему – систему допоміжних структурних середніх. До них належать мода, медіана, а також квартели, квінтелі, децелі, перцентелі.

Мода (Мо)- Найбільш часто зустрічається величина ознаки, а в дискретному варіаційному ряду - це варіанти з найбільшою частотою.

У статистичній практиці мода використовується щодо доходів населення, купівельного попиту, реєстрації цін і під час аналізу деяких техніко-економічних показників роботи підприємств.

У окремих випадкахсаме мода представляє інтерес, а чи не середня арифметична. Іноді вона застосовується замість середньої арифметичної, наприклад, для характеристики структури рядів розподілу.

Порядок визначення моди залежить від ряду розподілу. Якщо ознака, що варіює, представлений у вигляді дискретного ряду, то для визначення моди не потрібно ніяких обчислень. У такому ряді модою буде те значення ознаки, яке має найбільшу частоту.

Якщо значення ознаки представлені у вигляді варіаційного інтервального ряду з рівними інтервалами, то моду визначають розрахунковим шляхом за формулою:

де х Мо- нижня межа модального інтервалу,

i Мо- Величина модального інтервалу,

f Мо , f Мо-1 , f Мо+1– відповідно частоти модального, передмодального (попереднього) та післямодального (наступного за модальним) інтервалів.

Медіана (Ме)- це величина ознаки, яка знаходиться в середині ранжованого варіаційного ряду, де окремі значенняознаки (варіанти) розташовані в порядку їх зростання або спадання (по рангу).

Медіану слід застосовувати як середню величину в тих випадках, де немає достатньої впевненості в однорідності сукупності, що вивчається. Медіана знаходить застосування у маркетинговій діяльності. Наприклад, розміщення елеваторів, заводів первинного виноробства, консервних заводів, сума відстаней до яких від постачальників сировини має бути найменшою.

Медіана, як мода, визначається по-різному. Це від будови низки розподілу.
Для визначення медіани у дискретних варіаційних рядах:

1) знаходять її порядковий номер за формулою

N Me =
2) будують низку накопичених частот

3) знаходять накопичену частоту, яка дорівнює порядковому номеру медіани або його перевищує

4) варіанта, що відповідає даній накопиченій частоті, є медіаною.

Якщо число членів дискретного ряду непарне, то медіана знаходиться в середині ряду і поділяє цей ряд навпіл на дві рівні частини за кількістю членів ряду. Порядковий номер медіани в цьому випадку обчислюється за такою формулою:

N Me =(f + 1)2,

де fчисло членів низки.

У інтервальних рядах спочатку визначають медіанний інтервал. Для цього так само, як і в дискретних рядахрозраховують порядковий номер медіани. Накопиченій частоті, яка дорівнює номеру медіани або перша його перевищує, в варіаційному інтервальному ряді відповідає медіанний інтервал. Позначимо цю накопичену частоту S Me. Безпосередньо розрахунок медіани проводять за формулою:

,
де нижня межа медіанного інтервалу

- Величина медіанного інтервалу

- Накопичена частота інтервалу, що передує медіанному

- Частота медіанного інтервалу

Графічне визначення моди та медіани
Моду та медіану в інтервальному ряду можна визначити графічно.

Мода визначається за гістограмою розподілу. Для цього вибирається найвищий прямокутник, який є в даному випадкумодальним. Потім праву вершину модального прямокутника з'єднуємо з правим верхнім кутомпопереднього прямокутника. А ліву вершину модального прямокутника – з верхнім лівим кутом наступного прямокутника. Далі з точки їхнього перетину опускають перпендикуляр на вісь абсцис. Абсцис точки перетину цих прямих і буде модою розподілу (рис. 1). Медіана розраховується за кумулятом (рис. 2). Для її визначення з точки на шкалі накопичених частот (частин), що відповідає 50%, проводиться пряма, паралельна осі абсцис до перетину з кумулятою. Потім із точки перетину зазначеної прямої з кумулятою опускається перпендикуляр на вісь абсцис. Абсцис точки перетину є медіаною.

Показники варіації у статистиці.

В процесі статистичного аналізуможе скластися ситуація, коли значення середніх величин збігаються, а сукупності, на основі яких вони розраховані, складаються з одиниць, значення ознаки яких досить різко розрізняють між собою. І тут розраховують показники варіації.

Каталог: downloads -> Sotrudniki
downloads -> Н. Л. Іванова М. Ф. Луканіна
downloads -> Лекція для фахівців доу та батьків «Профілактика агресивної поведінкидошкільнят»
downloads -> Психологічна професійна адаптаціяособистості
downloads -> Департамент освіти та науки кемерівської областіКемеровський обласний психолого-валеологічний центр
downloads -> Федеральна службаРФ з контролю за обігом наркотиків управління з кемерівської області
Sotrudniki -> Боу чуваської Республікиспо «Четк» Міносвіти Чувашії
downloads -> Особливості психолого-педагогічного супроводу розвитку дітей дошкільного віку
downloads -> Мішина М. М. Розвиток мислення залежно від включеності до сімейно-родових відносин
Sotrudniki -> Формування професійно-значущих якостей у тих, хто навчається з порушеннями інтелекту за професією

КОНТРОЛЬНА РОБОТА

На тему: "Мода. Медіана. Способи їхнього розрахунку"

Вступ

Середні величини та пов'язані з ними показники варіації грають у статистиці дуже велику роль, що обумовлено предметом її вивчення. Тому дана темає одним із центральних в курсі.

Середня є дуже поширеним узагальнюючим показникам у статистиці. Це пояснюється тим, що тільки за допомогою середньої можна охарактеризувати сукупність за кількісно варіюючим ознакою. Середньою величиноюу статистиці називається узагальнююча характеристика сукупності однотипних явищ за якою-небудь кількісно варіює ознакою. Середня вказує рівень цієї ознаки, віднесений до одиниці сукупності.

Вивчаючи суспільні явища і прагнучи виявити їх характерні, типові рисиу конкретних умовах місця та часу, статистики широко використовують середні величини. За допомогою середніх можна порівнювати між собою різні сукупності за ознаками, що варіюють.

Середні, які застосовуються у статистиці, відносяться до класу статечних середніх. Зі статечних середніх найчастіше застосовується середня арифметична, рідше – середня гармонійна; середня гармонічна застосовується лише за обчисленні середніх темпів динаміки, а середня квадратична – лише за обчисленні показників варіації.

Середня арифметична є окреме від поділу суми варіант на їх число. Вона застосовується в тих випадках, коли обсяг ознаки, що варіює, для всієї сукупності утворюється як сума значень ознаки в окремих її одиниць. Середня арифметична – найпоширеніший вид середніх, оскільки він відповідає природі суспільних явищ, де обсяг варіюючих ознак у сукупності найчастіше утворюється як сума значень ознаки в окремих одиниць сукупності.

За своєю визначальною властивістю середня гармонічна повинна застосовуватися тоді, коли загальний обсяг ознаки утворюється як сума обернених значеньрізновид. Її застосовують тоді, коли в залежності від матеріалу, що має ваги, доводиться не множити, а ділити на варіанти або, що те ж саме, множити на зворотне їх значення. Середня гармонійна у випадках – це величина зворотна середньої арифметичної зі зворотних значень ознаки.

До середньої гармонійної слід вдаватися у випадках, як у терезах застосовуються не одиниці сукупності – носії ознаки, а твори цих одиниць значення ознаки.

1. Визначення моди та медіани у статистиці

Середні арифметична і гармонійна є узагальнюючими характеристиками сукупності за тією чи іншою ознакою, що варіює. Допоміжними описовими характеристиками розподілу ознаки, що варіює, є мода і медіана.

Модою в статистиці називається величина ознаки (варіанту), яка найчастіше зустрічається у цій сукупності. У варіаційному ряду це буде варіанта, що має найбільшу частоту.

Медіанною у статистиці називається варіанта, що знаходиться в середині варіаційного ряду. Медіана ділить ряд навпіл, з обох боків від неї (вгору і вниз) знаходиться однакова кількість одиниць сукупності.

Мода та медіана на відміну від статечних середніх є конкретними характеристиками, їх значення має будь-яка конкретна варіанта у варіаційному ряду.

Мода застосовується в тих випадках, коли потрібно охарактеризувати найбільш часто зустрічається величину ознаки.

5.5 Мода та медіана. Їх обчислення в дискретних та інтервальних варіаційних рядах

Якщо треба, наприклад, дізнатися найпоширеніший розмір заробітної платина підприємстві, ціну на ринку, за якою було продано найбільша кількістьтоварів, розмір черевиків, що користується найбільшим попитом у споживачів і т.д., у цих випадках вдаються до моди.

Медіана цікава тим, що показує кількісну межу значення ознаки, що варіює, яку досягла половина членів сукупності. Нехай середня вести працівників банку становила 650000 крб. в місяць. Ця характеристика може бути доповнена, якщо ми скажемо, що половина працівників отримала заробітну плату 700 000 руб. і вище, тобто. наведемо медіану. Мода і медіана є типовими характеристиками у випадках, коли взяті сукупності однорідні і великої чисельності.

Знаходження моди та медіани у дискретному варіаційному ряду

Знайти моду і медіану в варіаційному ряду, де значення ознаки задані певними числами, не становить великої складності. Розглянемо таблицю 1. з розподілу сімей за кількістю дітей.

Таблиця 1. Розподіл сімей за кількістю дітей

Очевидно, у цьому прикладі модою буде сім'я, яка має двох дітей, тому що цьому значенню варіанти відповідає найбільша кількістьсімей. Можуть бути розподіли, де всі варіанти зустрічаються однаково часто, у разі моди немає чи, інакше, можна сказати, що це варіанти однаково модальні. В інших випадках не одна, а два варіанти можуть бути найбільшою частотою. Тоді буде дві моди, розподіл буде бімодальним. Бімодальні розподіли можуть вказувати на якісну неоднорідність сукупності за ознакою, що досліджується.

Щоб знайти медіану в дискретному варіаційному ряді, потрібно суму частот розділити навпіл і до отриманого результату додати ½. Так було в розподілі 185 сім'ї за кількістю дітей медіаною буде: 185/2 + ½ = 93, тобто. 93-я варіанта, яка поділяє впорядкований ряд навпіл. Яке ж значення 93 варіанти? Для того, щоб це з'ясувати, потрібно накопичувати частоти, починаючи від найменшої варіанти. Сума частот 1-й та 2-й варіант дорівнює 40. Зрозуміло, що тут 93 варіанти немає. Якщо додати до 40 частоту 3-ї варіанти, то отримаємо суму, рівну 40 + 75 = 115. Отже, 93-я варіанта відповідає третьому значенню ознаки, що варіює, і медіаною буде сім'я, що має двох дітей.

Мода та медіана в даному прикладізбіглися. Якби ми мали парну суму частот (наприклад, 184), то, застосовуючи вказану вище формулу, отримаємо номер медіанної варіанти, 184/2 + ½ =92,5. Оскільки варіанти з дробовим номером немає, отриманий результат вказує, що медіана знаходиться посередині між 92 і 93 варіантами.

3. Розрахунок моди та медіани в інтервальному варіаційному ряду

Описовий характер моди і медіани пов'язані з тим, що у них погашаються індивідуальні відхилення. Вони завжди відповідають певному варіанті. Тому мода та медіана не вимагають для свого знаходження розрахунків, якщо відомі всі значення ознаки. Однак в інтервальному варіаційному ряду для знаходження наближеного значення моди та медіани в межах певного інтервалу вдаються до розрахунків.

Для розрахунку певного значеннямодальної величини ознаки, укладеної в інтервалі, застосовують формулу:

М о = Х Мо + i Мо * (f Мо - f Мо-1) / ((f Мо - f Мо-1) + (f Мо - f Мо +1)),

Де Х Мо – мінімальна межа модального інтервалу;

i Мо – величина модального інтервалу;

f Мо – частота модального інтервалу;

f Мо-1 – частота інтервалу, що передує модальному;

f Мо+1 – частота інтервалу, наступного за модальним.

Покажемо розрахунок моди з прикладу, наведеному у таблиці 2.

Таблиця 2. Розподіл робітників підприємства щодо виконання норм виробітку

Щоб знайти моду, спочатку визначимо модальний інтервал цього ряду. З прикладу видно, що найбільша частота відповідає інтервалу, де варіант лежить в межах від 100 до 105. Це і є модальний інтервал. Розмір модального інтервалу дорівнює 5.

Підставляючи числові значенняз таблиці 2. у зазначену вище формулу, отримаємо:

М о = 100 + 5 * (104 -12) / ((104 - 12) + (104 - 98)) = 108,8

Сенс цієї формули полягає в наступному: величину частини модального інтервалу, яку потрібно додати до його мінімальної межі, визначають залежно від величини частот попереднього і наступного інтервалів. У разі до 100 додаємо 8,8, тобто. більше половини інтервалу, тому що частота попереднього інтервалу менша за частоту наступного інтервалу.

Обчислимо тепер медіану. Для знаходження медіани в інтервальному варіаційному ряду визначаємо спочатку інтервал, у якому вона знаходиться (медіанний інтервал). Таким інтервалом буде такий, комулятивна частота якого дорівнює чи перевищує половину суми частот. Комулятивні частоти утворюються шляхом поступового підсумовування частот, починаючи від інтервалу найменшим значеннямознаки. Половина суми частот у нас дорівнює 250 (500:2). Отже, згідно з таблицею 3. медіанним інтервалом буде інтервал зі значенням заробітної плати від 350000 руб. до 400 000 руб.

Таблиця 3. Розрахунок медіани в інтервальному варіаційному ряді

До цього інтервалу сума накопичених частот становила 160. Отже, щоб отримати значення медіани, необхідно додати ще 90 одиниць (250 – 160).

При визначенні значення медіани припускають, що значення одиниць у межах інтервалу розподіляється рівномірно. Отже, якщо 115 одиниць, що знаходяться в цьому інтервалі, розподіляються рівномірно в інтервалі, що дорівнює 50, то 90 одиниць буде відповідати наступна його величина:

Мода у статистиці

Медіана (статистика)

Медіана (статистика), в математичної статистики- Число, що характеризує вибірку (наприклад, набір чисел). Якщо всі елементи вибірки різні, то медіана - це таке число вибірки, що рівно половина з елементів вибірки більше за нього, а інша половина менше за нього.

У більш загальному випадкумедіану можна знайти, упорядкувавши елементи вибірки за зростанням або спаданням і взявши середній елемент. Наприклад, вибірка (11, 9, 3, 5, 5) після впорядкування перетворюється на (3, 5, 5, 9, 11) та її медіаною є число 5. Якщо у вибірці парне число елементів, медіана може бути не визначена однозначно: для числових даних найчастіше використовують напівсуму двох сусідніх значень (тобто медіану набору (1, 3, 5, 7) приймають 4).

Іншими словами, медіаною у статистиці називається значення, яке ділить ряд навпіл таким чином, що по обидва боки від неї (вниз чи вгору) розташоване однакове числоодиниць цієї сукупності. Через цю властивість цей показник має ще кілька назв: 50-й перцентиль або квантиль 0,5.

Медіану використовують замість середньої арифметичної, коли крайні варіанти ранжованого ряду (найменша та найбільша) порівняно з іншими виявляються надмірно більшими або надмірно малими.

Функція МЕДІАНА вимірює центральну тенденцію, яка є центром множини чисел в статистичному розподілі. Існує три найбільш поширені способи визначення центральної тенденції:

  • Середнє значення- Середнє арифметичне, яке обчислюється додаванням безлічі чисел з наступним розподілом отриманої суми на їх кількість.
    Наприклад, Середнім значенням для чисел 2, 3, 3, 5, 7 і 10 буде 5, яке є результатом поділу їх суми, що дорівнює 30, на їх кількість, що дорівнює 6.
  • Медіана- Число, яке є серединою безлічі чисел: половина чисел мають значення більші, ніж медіана, а половина чисел - менші.
    Наприклад, медіаною для чисел 2, 3, 3, 5, 7 та 10 буде 4.
  • Мода— число, яке найчастіше зустрічається в даній множинічисел.

    Наприклад, модою для чисел 2, 3, 3, 5, 7 та 10 буде 3.

Для характеристики рядів розподілу (структури варіаційних рядів) поряд із середньою використовуються т.з. структурні середні: модаі медіана. Мода та медіана найчастіше використовуються в економічній практиці.

Мода- варіанта, що найчастіше зустрічається у низці розподілу (у цій сукупності).

У дискретнихВаріаційних рядах мода визначається за найбільшою частотою. Припустимо товар А реалізують у місті 9 фірм за такими цінами в рублях:

44; 43; 44; 45; 43; 46; 42; 46;43. Так як найчастіше зустрічається ціна 43 рублі, то вона і буде модальною.

При характеристиці соціальних групнаселення за рівнем доходу слід використовувати модальне значення, ніж середнє. Середня занижуватиме одні показники і завищуватиме інші - тим самим середня (зрівняння) доходи всіх верств населення.

У інтервальнихваріаційних рядах моду визначають приблизно за формулою:

    ХМ0 – нижня межа модального інтервалу;

    h Mo – величина (крок, ширина) модального інтервалу;

    f 1 - локальна частота інтервалу, що передує модальному;

    f 2 – локальна частота модального інтервалу;

    f 3 - локальна частота інтервалу, наступного за модальним.

Розподіл населення за рівнем середньодушового місячного доходу

Інтервал 1000-3000 у цьому розподілі буде модальним, т.к. він має максимальну частоту (f=35,5). Тоді за вищезгаданою формулою мода дорівнюватиме:

На графіці (гістограмі розподілу) моду визначають так: по осі ординат відкладають локальні частоти, а, по осі абсцис -інтервали чи центри інтервалів. Вибирають найвищий стовпчик, якому відповідає величина ознаки з найбільшою частотою у розподілі.

Модазастосовується на вирішення деяких практичних завдань. Приміром, щодо товарообігу ринку береться модальна ціна, вивчення попиту взуття, одяг використовують модальні розміри взуття та одягу.

Медіана- це чисельне значення ознаки в тієї одиниці сукупності, що у середині ранжированного ряду (побудованого порядку зростання, чи зменшення значень досліджуваного ознаки). Медіануіноді називають серединною варіантою, т.к. вона ділить сукупність на дві рівні частини таким чином, щоб по обидві сторони було однакове число одиниць сукупності. Якщо всім одиницям ряду присвоїти порядкові номери, то порядковий номер медіани визначатиметься за формулою (n+1):2 для рядів, де n - непарне. Якщо ж ряд з парнимчислом одиниць, то медіаноюбуде середнє значення між двома сусідніми варіантами, визначеними за формулою: n:2, (n+1):2, (n:2)+1.

У дискретних варіаційних рядах з непарним числом одиниць сукупності - це конкретне чисельне значення у середині ряду.

Знаходження медіани в інтервальних варіаційних рядах вимагає попереднього визначення інтервалу, де знаходиться медіана, тобто. медіанного інтервалу– цей інтервал характеризується тим, що його кумулятивна (накопичена) частота дорівнює напівсумі або перевищує напівсуму всіх частот ряду.

    X Me - нижня межа медіанного інтервалу

    h Me - величина медіанного інтервалу;

    S Me-1 -сума накопичених частот інтервалу, що передує медіанному інтервалу;

    f Me локальна частота медіанного інтервалу.

За даними таблиці визначимо медіанне значення середньодушового доходу. Для цього необхідно визначити, який інтервал буде медіанним. Використовуємо формулу номера медіанної одиниці ряду, тобто. середини:

Дробове значення N (завжди при парному числі членів) рівне 50,5% свідчить, що середина низки перебуває між 50% і 51%, тобто. у третьому інтервалі. Іншими словами: медіанним вважається інтервал, на який уперше припадає понад половина суми накопичених частот. Звідси медіана:

Для того щоб визначити графічно інтервал, в якому знаходиться медіана, по осі ординат відкладають накопичені частоти, а по осі абсцис - центри інтервалів. З точки на осі ординат, якій відповідає 50.5% суми накопичених частот, лінію проводять паралельно осі абсцис до перетину з кумулятою. З точки перетину опускають перпендикуляр на вісь абсцис.

Співвідношення моди, медіани та середньої арифметичної вказує на характер розподілу ознаки в сукупності, що дозволяє оцінити його асиметрію. Якщо M 0

Зі співвідношення цих показників слід зробити висновок про правосторонню асиметрію розподілу населення за рівнем середньодушового грошового доходу:

Квартіль-Це четверта частина сукупності, визначається як і медіана, тільки суму частот необхідно розділити на 4, а при визначенні квартильного інтервалу, кумулятивна частота повинна бути більшою або дорівнює чверті суми частот сукупності.

Дециль– ділить сукупність десять рівних частин. Визначається так само як і квартиль, лише суму частот необхідно розділити на 10.

Поряд із середніми величинами як статистичні характеристики варіаційних рядів розподілу розраховуються структурні середні – модаі медіана.
Мода(Mo) є значення досліджуваного ознаки, що повторюється з найбільшою частотою, тобто. мода - значення ознаки, що зустрічається найчастіше.
Медіаною(Me) називається значення ознаки, що припадає на середину ранжированной (упорядкованої) сукупності, тобто. медіана – центральне значення варіаційного ряду.
Головна властивість медіани полягає в тому, що сума абсолютних відхилень значень ознаки від медіани менша, ніж від будь-якої іншої величини ∑|x i - Me|=min.

Визначення моди та медіани за несгрупованими даними

Розглянемо визначення моди та медіани за несгрупованими даними. Припустимо, робочі бригади, що з 9 людина, мають такі тарифні розряди: 4 3 4 5 3 3 6 2 6 . Оскільки у цій бригаді найбільше робочих 3-го розряду, цей тарифний розряд буде модальним. Mo = 3.
Для визначення медіани необхідно провести ранжування: 2 3 3 3 4 4 5 6 6 . Центральним у цьому ряду є робітник 4-го розряду, отже, цей розряд і буде медіанним. Якщо ранжований ряд включає парне число одиниць, медіана визначається як середня з двох центральних значень.
Якщо мода відбиває найпоширеніший варіант значення ознаки, то медіана практично виконує функції середньої для неоднорідної, яка підпорядковується нормальному закону розподілу сукупності. Проілюструємо її пізнавальне значення наступним прикладом.
Допустимо, нам необхідно дати характеристику середнього доходу групи людей, що налічує 100 осіб, з яких 99 мають доходи в інтервалі від 100 до 200 доларів на місяць, а місячні доходи останнього становлять 50 000 доларів (табл. 1).
Таблиця 1 – Місячні доходи досліджуваної групи людей. Якщо скористатися середньою арифметичною, то отримаємо середній дохід, що дорівнює приблизно 600 – 700 доларів, який має мало спільного з доходами основної частини групи. Медіана ж, рівна у разі Me = 163 долара, дозволить дати об'єктивну характеристику рівня доходів 99 % цієї групи людей.
Розглянемо визначення моди та медіани за згрупованими даними (рядами розподілу).
Припустимо, розподіл робітників всього підприємства загалом за тарифним розрядом має такий вид (табл. 2).
Таблиця 2 - Розподіл робітників підприємства за тарифним розрядом

Розрахунок моди та медіани для дискретного ряду

Розрахунок моди та медіани для інтервального ряду

Розрахунок моди та медіани для варіаційного ряду

Визначення моди по дискретному варіаційному ряду

Використовується побудований раніше ряд значень ознаки, відсортованих за величиною. Якщо обсяг вибірки непарний, беремо центральне значення; якщо обсяг вибірки парний, беремо середнє арифметичне двох центральних значень.
Визначення моди по дискретному варіаційному ряду: найбільшу частоту (60 осіб) має 5-й тарифний розряд, отже, він і є модальним. Mo = 5.
Для визначення медіанного значення ознаки за такою формулою знаходять номер медіанної одиниці ряду (N Me): де n - обсяг сукупності.
У нашому випадку: .
Отримане дробове значення, що завжди має місце при парному числі одиниць сукупності, вказує, що точна середина знаходиться між 95 і 96 робітниками. Необхідно визначити, до якої групи належать робітники із цими порядковими номерами. Це можна зробити, розрахувавши накопичені частоти. Робітників із цими номерами немає у першій групі, де лише 12 людина, немає їх у другій групі (12+48=60). 95-й та 96-й робітники перебувають у третій групі (12+48+56=116), отже, медіанним є 4-й тарифний розряд.

Розрахунок моди та медіани в інтервальному ряду

На відміну від дискретних варіаційних рядів визначення моди та медіани за інтервальними рядами вимагає проведення певних розрахунків на основі таких формул:
, (5.6)
де x 0- нижня межа модального інтервалу (модальним називається інтервал, що має найбільшу частоту);
i- Величина модального інтервалу;
f Mo- Частота модального інтервалу;
f Mo -1– частота інтервалу, що передує модальному;
f Mo +1- Частота інтервалу, наступного за модальним.
(5.7)
де x 0- нижня межа медіанного інтервалу (медіанним називається перший інтервал, накопичена частота якого перевищує половину загальної суми частот);
i- Величина медіанного інтервалу;
S Me -1– накопичена інтервалу, що передує медіанному;
f Me- Частота медіанного інтервалу.
Проілюструємо застосування цих формул, використовуючи дані табл. 3.
Інтервал із межами 60 – 80 у цьому розподілі буде модальним, т.к. він має максимальну частоту. Використовую формулу (5.6), визначимо моду:

Для встановлення медіанного інтервалу необхідно визначати накопичену частоту кожного наступного інтервалу доти, доки вона не перевищить половини суми накопичених частот (у нашому випадку 50%) (табл. 5.11).
Встановили, що медіанним є інтервал із межами 100 – 120 тис. руб. Визначимо тепер медіану:

Таблиця 3 - Розподіл населення РФ за рівнем середньодушових номінальних грошових доходів у березні 1994р.
групи за рівнем середньодушового місячного доходу, тис. руб.Питома вага населення, %
До 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Понад 3007,7
Разом100,0

Таблиця 4 - Визначення медіанного інтервалу
Таким чином, як узагальнену характеристику значень певної ознаки в одиниць ранжованої сукупності можуть бути використані середня арифметична, мода і медіана.
Основною характеристикою центру розподілу є середня арифметична, для якої характерно те, що всі відхилення від неї (позитивні та негативні) у сумі дорівнюють нулю. Для медіани характерно, що сума відхилень від неї за модулем є мінімальною, а мода є значенням ознаки, яке найчастіше зустрічається.
Співвідношення моди, медіани та середньої арифметичної вказує на характер розподілу ознаки в сукупності, що дозволяє оцінити його асиметрію. У симетричних розподілах всі три показники збігаються. Чим більша розбіжність між модою і середньою арифметичною, тим асиметричніший ряд. Для помірно асиметричних рядів різниця між модою та середньою арифметичною приблизно втричі перевищує різницю між медіаною та середньою, тобто:
|Mo –`x| = 3 | Me - x |.

Визначення моди та медіани графічним методом

Моду та медіану в інтервальному ряду можна визначити графічно. Мода визначається за гістограмою розподілу. Для цього вибирається найвищий прямокутник, який є в даному випадку модальним. Потім праву вершину модального прямокутника з'єднуємо з верхнім правим кутом попереднього прямокутника. А ліву вершину модального прямокутника – з верхнім лівим кутом наступного прямокутника. З точки їхнього перетину опускаємо перпендикуляр на вісь абсцис. Абсцис точки перетину цих прямих і буде модою розподілу (рис. 5.3).


Рис. 5.3. Графічне визначення моди за гістограмою.


Рис. 5.4. Графічне визначення медіани за кумулятом
Для визначення медіани з точки на шкалі накопичених частот (частин), що відповідає 50%, проводиться пряма, паралельна осі абсцис до перетину з кумулятою. Потім із точки перетину опускається перпендикуляр на вісь абсцис. Абсцис точки перетину є медіаною.

Квартили, децилі, перцентілі

Аналогічно з знаходженням медіани в варіаційних рядах розподілу можна знайти значення ознаки у будь-якій порядку одиниці ранжованого ряду. Так, наприклад, можна знайти значення ознаки у одиниць, що ділять ряд на чотири рівні частини, на 10 або на 100 частин. Ці величини називаються "квартілі", "децили", "перцентілі".
Квартілі є значенням ознаки, що ділить ранжовану сукупність на 4 рівновеликі частини.
Розрізняють квартиль нижній (Q 1), що відокремлює ¼ частина сукупності з найменшими значеннями ознаки, і квартиль верхній (Q 3), що осікає ¼ частина з найбільшими значеннями ознаки. Це означає, що 25 % одиниць сукупності будуть меншими за величиною Q 1 ; 25% одиниць будуть укладені між Q1 і Q2; 25% - між Q2 і Q3, а решта 25% перевищують Q3. Середнім квартилем Q2 є медіана.
Для розрахунку квартилів за інтервальним варіаційним рядом використовуються формули:
, ,
де x Q 1– нижня межа інтервалу, що містить нижній квартиль (інтервал визначається за накопиченою частотою, що перша перевищує 25 %);
x Q 3- нижня межа інтервалу, що містить верхній квартиль (інтервал визначається за накопиченою частотою, першою, що перевищує 75%);
i- Величина інтервалу;
S Q 1-1– накопичена частота інтервалу, що передує інтервалу, що містить нижній квартиль;
S Q 3-1- накопичена частота інтервалу, що передує інтервалу, що містить верхній квартиль;
f Q 1- Частота інтервалу, що містить нижній квартиль;
f Q 3- Частота інтервалу, що містить верхній квартиль.
Розглянемо розрахунок нижнього та верхнього квартилів за даними табл. 5.10. Нижній квартиль знаходиться в інтервалі 60 - 80, накопичена частота якого дорівнює 335%. Верхній квартиль лежить в інтервалі 160 – 180 із накопиченою частотою 75,8 %. З урахуванням цього отримаємо:
,
.
Окрім квартилів у варіаційних радах розподілу можуть визначатися децилі – варіанти, що ділять ранжований варіаційний ряд на десять рівних частин. Перший дециль (d 1) ділить сукупність у співвідношенні 1/10 до 9/10, другий дециль (d 1) - у співвідношенні 2/10 до 8/10 і т.д.
Обчислюються вони за формулами:
, .
Значення ознаки, що ділять ряд на 100 частин, називаються перцентилями. Співвідношення медіани, квартилів, децилів та перцентилів представлені на рис. 5.5.

Середнє арифметичне значення (далі за текстом - середнє), мабуть, найпопулярніший статистичний параметр. Цим поняттям користуються повсюдно - починаючи від приказки "середня температура по лікарні" і закінчуючи серйозними науковими працями. Однак, як не дивно, середнє значення — підступне поняття, яке часто вводить в оману, замість того, щоб надавати чіткості викладу та вносити ясність.

Якщо говорити про наукову роботу, то статистичний аналіз даних застосовується майже у всіх прикладних науках, навіть у гуманітарних (наприклад, психології). Середнє значення обчислюється для ознак, що вимірюються у так званих безперервних шкалах. Такими ознаками є, наприклад, концентрації речовин у сироватці крові, зростання, вага, вік. Середнє арифметичне можна легко вирахувати, і цього навчають ще в середній школі. Однак (відповідно до положень математичної статистики) середнє значення є адекватним заходом центральної тенденції у вибірці тільки у разі нормального (гаусового) розподілу ознаки (рис. 1). Рис. 1. Нормальний (гаусовий) розподіл ознаки у вибірці. Середнє (М) та медіана (Ме) збігаються

У разі відхилення розподілу від нормального закону середнє значення використовувати некоректно, оскільки воно є надто чутливим параметром до так званих «викидів» — нехарактерним для вибірки, що вивчається, занадто великим або занадто малим значенням (рис. 2). У цьому випадку для характеристики центральної тенденції у вибірці має застосовуватися інший параметр – медіана. Медіана - це значення ознаки, праворуч і ліворуч від якої знаходиться рівна кількість спостережень (по 50%). Цей параметр (на відміну від середнього значення) стійкий до викидів. Зауважимо також, що медіана може використовуватися і у разі нормального розподілу – у цьому випадку медіана збігається із середнім значенням.

Рис. 2. Розподіл ознаки у вибірці, відмінне від нормального. Середнє (м) та медіана (МЕ) не збігаються

Щоб дізнатися, чи є розподіл ознаки у вибірці нормальним (гаусовим) чи ні, т. е. у тому, щоб дізнатися, який із параметрів слід застосовувати (середнє значення чи медіану), існують спеціальні статистичні тести.

Наведемо приклад. Швидкість осідання еритроцитів у групі пацієнтів, які недавно перенесли пневмонію, - 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Середнє значення для цієї вибірки дорівнює 17,8, медіана - 12. за тестом Шапіро-Вилка) нормальним не є (рис. 3), тому використовувати треба медіану. Рис. 3. Приклад

Як не дивно, але в деяких сферах економіки сторонній спостерігач не може помітити хоч якогось сліду коректного застосування математичної статистики. Так, нам постійно говорять про середню зарплату (наприклад, у НДІ), і ці числа зазвичай дивують не лише рядових співробітників, а й керівників підрозділів (нині званих менеджерами середньої ланки). Ми дивуємось, що середня зарплата в Москві — 40 тис. руб., але, звичайно, розуміємо, що нас «усереднили» з олігархами. Ось приклад із життя науковців: зарплати співробітників лабораторії (тис. руб.) - 3, 5, 5, 7, 11, 12, 16, 16, 21, 42, 58. Середнє значення - 17,8, медіана - 12. Погодьтеся, що це різні числа!

Звичайно, не можна виключити, що замовчування властивостей середнього — лукавство, оскільки керівництву завжди вигідніше уявити ситуацію із зарплатою співробітників краще, ніж вона є насправді.

Чи не час науковій спільноті закликати наших керівників припинити некоректне використання математичної статистики?

Ольга Реброва,
докт. мед. наук, віце-президент
МГО «Товариство фахівців доказової медицини»

Медіана- це таке значення ознаки, яке поділяє ранжований ряд розподілу на дві рівні частини - зі значеннями ознаки менше медіани та зі значеннями ознаки більше медіани. Для знаходження медіани, необхідно знайти значення ознаки, що знаходиться на середині впорядкованого ряду.

Подивитися рішення задачі на знаходження моди та медіаниВи можете

У ранжованих рядах несгруповані дані для знаходження медіанизводяться до пошуку порядкового номера медіани. Медіана може бути обчислена за такою формулою:

де Хm – нижня межа медіанного інтервалу;
im - медіанний інтервал;
Sme - сума спостережень, яка була накопичена до початку медіанного інтервалу;
fme – число спостережень у медіанному інтервалі.

Властивості медіани

  1. Медіана не залежить від тих значень ознаки, які розташовані по обидва боки від неї.
  2. Аналітичні операції з медіаною дуже обмежені, тому при поєднанні двох розподілів із відомими медіанами неможливо заздалегідь передбачити величину медіани нового розподілу.
  3. Медіана маєвластивістю мінімальності. Його суть полягає в тому, що сума абсолютних відхилень значень х від медіани являє собою мінімальну величину в порівнянні з відхиленням X від будь-якої іншої величини

Графічне визначення медіани

Для визначення медіани графічним методомвикористовують накопичені частоти, якими будується кумулятивна крива. Вершини ординат, що відповідають накопиченим частотам, з'єднують відрізками прямої. Розділивши поп олам останню ординату, яка відповідає загальній сумі частот і провівши до неї перпендикуляр перетину з кумулятивною кривою, знаходять ординату шуканого значення медіани.

Визначення моди у статистиці

Мода – значення ознаки, Що має найбільшу частоту у статистичному ряді розподілу

Визначення модивиробляється різними способами, і це залежить від того, чи представлений ознака, що варіює, у вигляді дискретного або інтервального ряду.

Знаходження модита медіани відбувається шляхом звичайного перегляду стовпця частот. У цьому шпальті знаходять найбільше число, що характеризує найбільшу частоту. Їй відповідає певне значення ознаки, яке є модою. В інтервальному варіаційному ряді модою вважають центральний варіант інтервалу з найбільшою частотою. У такій низці розподілу мода обчислюється за формулою:

де ХМо – нижня межа модального інтервалу;
imo – модальний інтервал;
fм0, fм0-1, fм0+1 - частоти в модальному, попередньому та наступному за модальним інтервалах.

Модальний інтервал визначається найбільшою частотою.

Мода широко використовується у статистичній практиці при аналізі купівельного попиту, реєстрації цін тощо.

Співвідношення між середньою арифметичною, медіаною та модою

Для одномодального симетричного ряду розподілу медіана і мода збігаються. Для асиметричних розподілів де вони збігаються.

К. Пірсон на основі вирівнювання різних типів кривих визначив, що для помірно асиметричних розподілів справедливі такі наближені співвідношення між середньою арифметичною, медіаною та модою: