Як розрахувати середнє значення в прикладі Excel. Як зробити середній бал у excel? Стандартний спосіб обчислення

Як порахувати середнє значення чисел в Excel

Знайти середнє арифметичне чисел Excel можна за допомогою функції .

Синтаксис СРЗНАЧ

=СРЗНАЧ(число1;[число2];…) - російська версія

Аргументи СРЗНАЧ

число1– перше число чи діапазон чисел, до розрахунку середнього арифметичного;
число2(Опціонально) – друге число чи діапазон чисел розрахунку середнього арифметичного. Максимальна кількістьаргументів функції – 255.

Для розрахунку виконайте такі кроки:

Виділіть будь-яку комірку;
Напишіть у ній формулу =СРЗНАЧ(
Виділіть діапазон осередків, для якого потрібно зробити розрахунок;
Натисніть клавішу “Enter” на клавіатурі

Функція розрахує середнє у зазначеному діапазоні серед тих осередків, у яких є числа.

Як знайти середнє значення з урахуванням тексту

Якщо в діапазоні даних є порожні рядки або текст, функція сприймає їх як “нуль”. Якщо серед даних є логічні висловлюванняБрехня або ІСТИНА, то Брехня функція сприймає як "нуль", а ІСТИНА як "1".

Як знайти середнє арифметичне за умовою

Для розрахунку середнього за умовою чи критерієм використовується функція. Наприклад, уявимо, що у нас є дані з продажу товарів:

Наше завдання вирахувати середнє значення продажів ручок. Для цього зробимо такі кроки:

У осередку A13напишемо назву товару "Ручки";
У осередку B13введемо формулу:

=ЗНАЧАЛЬНІ(A2:A10;A13;B2:B10)

Діапазон осередків “ А2: A10” вказує на список товарів, у якому ми шукатимемо слово “Ручки”. Аргумент A13це посилання на комірку з текстом, який ми шукатимемо серед усього списку товарів. Діапазон осередків “ B2: B10” це діапазон з даними продажу товарів, серед яких функція знайде “Ручки” та обчислить середнє значення.

Найчастіше дані концентруються навколо якоїсь центральної точки. Таким чином, щоб описати будь-який набір даних, достатньо вказати середнє значення. Розглянемо послідовно три числові характеристики, які використовуються для оцінки середнього значення розподілу: середнє арифметичне, медіана та мода.

Середнє арифметичне

Середнє арифметичне (часто зване просто середнім) – найпоширеніша оцінка середнього значення розподілу. Вона є результатом розподілу суми всіх спостережуваних числових величинна їхню кількість. Для вибірки, що складається з чисел Х 1, Х 2, …, Хn, вибіркове середнє (позначається символом ) одно = (Х 1 + Х 2 + … + Хn) / n, або

де - вибіркове середнє, n- обсяг вибірки, Xi – i-й елементвибірки.

Завантажити замітку у форматі або , приклади у форматі

Розглянемо обчислення середнього арифметичного значенняп'ятирічної середньорічної прибутковості 15 взаємних фондів з дуже високим рівнемризику (рис. 1).

Рис. 1. Середньорічна доходність 15 взаємних фондів із дуже високим рівнем ризику

Вибіркове середнє обчислюється так:

Це добрий дохід, особливо порівняно з 3–4% доходу, який отримали вкладники банків або кредитних спілок за той самий період. Якщо впорядкувати значення прибутковості, то легко помітити, що вісім фондів мають прибутковість вищу, а сім - нижче середнього значення. Середнє арифметичне відіграє роль точки рівноваги, тому фонди з низькими доходами врівноважують фонди з високими доходами. У обчисленні середнього задіяні всі елементи вибірки. Жодна з інших оцінок середнього значення розподілу не має цієї властивості.

Коли слід обчислювати середнє арифметичне.Оскільки середнє арифметичне залежить від усіх елементів вибірки, наявність екстремальних значень впливає на результат. У таких ситуаціях середнє арифметичне може спотворити зміст числових даних. Отже, описуючи набір даних, що містить екстремальні значення, необхідно вказувати медіану або середнє арифметичне та медіану. Наприклад, якщо видалити з вибірки прибутковість фонду RS Emerging Growth, вибіркова середня прибутковість 14 фондів зменшиться майже на 1% і становитиме 5,19%.

Медіана

Медіана є серединне значення впорядкованого масиву чисел. Якщо масив не містить чисел, що повторюються, то половина його елементів виявиться менше, а половина - більше медіани. Якщо вибірка містить екстремальні значення, оцінки середнього значення краще використовувати не середнє арифметичне, а медіану. Щоб визначити медіану вибірки, її спочатку необхідно впорядкувати.

Ця формула є неоднозначною. Її результат залежить від парності чи непарності числа n:

Якщо вибірка містить непарну кількість елементів, медіана дорівнює (n+1)/2-му елементу.
Якщо вибірка містить парну кількість елементів, медіана лежить між двома середніми елементами вибірки та дорівнює середньому арифметичному, обчисленому за цими двома елементами.

Щоб обчислити медіану вибірки, що містить дані про прибутковість 15 взаємних фондів з дуже високий рівень ризику, спочатку необхідно впорядкувати вихідні дані (рис. 2). Тоді медіана буде напроти номера середнього елемента вибірки; у прикладі №8. В Excel є спеціальна функція = МЕДІАНА (), яка працює і з невпорядкованими масивами теж.

Рис. 2. Медіана 15 фондів

Таким чином, медіана дорівнює 6,5. Це означає, що доходність однієї половини фондів з дуже високим рівнем ризику не перевищує 6,5, а доходність другої половини – перевищує її. Зверніть увагу на те, що медіана, що дорівнює 6,5, ненабагато більше середнього значення, що дорівнює 6,08.

Якщо видалити з вибірки прибутковість фонду RS Emerging Growth, то медіана 14 фондів, що залишилися, зменшиться до 6,2%, тобто не так значно, як середнє арифметичне (рис. 3).

Рис. 3. Медіана 14 фондів

Мода

Термін був вперше введений Пірсоном в 1894 р. Мода - це число, яке найчастіше зустрічається у вибірці (найбільш модне). Мода добре описує, наприклад, типову реакцію водіїв на сигнал світлофора про припинення руху. Класичний прикладвикористання моди - вибір розміру випускається партії взуття або кольору шпалер. Якщо розподіл має кілька мод, то кажуть, що він мультимодальний або багатомодальний (має два або більше «піка»). Мультимодальність розподілу дає важливу інформаціюпро природу досліджуваної змінної. Наприклад, у соціологічних опитуваннях, якщо змінна є перевагу чи ставлення до чогось, то мультимодальність може означати, що є кілька безумовно різних думок. Мультимодальність також служить індикатором того, що вибірка не є однорідною та спостереження, можливо, породжені двома або більше «накладеними» розподілами. На відміну від середньої арифметичної, викиди на моду не впливають. Для безперервно розподілених випадкових величин, наприклад, для показників середньорічної прибутковості взаємних фондів, мода іноді взагалі не існує (або немає сенсу). Оскільки ці показники можуть приймати різні значення, повторювані величини зустрічаються вкрай рідко.

Квартилі

Квартілі – це показники, які найчастіше використовуються для оцінки розподілу даних при описі властивостей великих числових вибірок. У той час як медіана розділяє впорядкований масив навпіл (50% елементів масиву менше медіани і 50% - більше), квартілі розбивають упорядкований набір даних на чотири частини. Величини Q 1 медіана і Q 3 є 25-м, 50-м і 75-м перцентилем відповідно. Перший квартиль Q 1 - це число, що розділяє вибірку на дві частини: 25% елементів менше, а 75% - більше першогоквартири.

Третій квартиль Q 3 - це число, що розділяє вибірку також на дві частини: 75% елементів менше, а 25% - більше за третій квартиль.

Для розрахунку квартилів у версіях Excel до 2007 р. використовувалася функція = КВАРТИЛЬ (масив; частина). Починаючи з версії Excel2010, застосовуються дві функції:

=КВАРТИЛЬ.ВКЛ(масив;частина)
=КВАРТИЛЬ.ИСКЛ(масив;частина)

Ці дві функції дають небагато різні значення(Рис. 4). Наприклад, при обчисленні квартилів вибірки, що містить дані про середньорічну прибутковість 15 взаємних фондів з дуже високим рівнем ризику Q 1 = 1,8 або -0,7 для КВАРТИЛЬ.ВКЛ і КВАРТИЛЬ.ІСКЛ відповідно. До речі функція КВАРТИЛЬ, що використовувалася раніше, відповідає сучасної функціїКВАРТИЛЬ. Для розрахунку квартилів в Excel за допомогою наведених вище формул масив даних можна не впорядковувати.

Рис. 4. Обчислення квартир в Excel

Підкреслимо ще раз. Excel вміє розраховувати квартилі для одномірного дискретного ряду , що містить значення випадкової величини. Розрахунок квартилів для розподілу на основі частот наведено нижче у розділі.

Середнє геометричне

На відміну від середнього арифметичного середнє геометричне дозволяє оцінити ступінь зміни змінної з часом. Середнє геометричне – це корінь n-й ступеня з твору nвеличин (в Excel використовується функція = СРГЕОМ):

G= (X 1 * X 2 * ... * X n) 1/n

Схожий параметр – середнє геометричне значеннянорми прибутку – визначається формулою:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

де R i- Норма прибутку за i-й період часу.

Наприклад, припустимо, що обсяг вкладених коштів у вихідний момент часу дорівнює 100 000 дол. До кінця першого року він падає до рівня 50 000 дол., а до кінця другого року відновлюється до вихідної позначки 100 000 дол. дорівнює 0, оскільки початковий та фінальний обсяг коштів рівні між собою. Проте середнє арифметичне річних нормприбутку дорівнює = (-0,5 + 1) / 2 = 0,25 або 25%, оскільки норма прибутку в перший рік R 1 = (50 000 - 100 000) / 100 000 = -0,5, а в другий R 2 = (100 000 – 50 000) / 50 000 = 1. У той самий час, середнє геометричне значення норми прибутку протягом двох років одно: G = [(1–0,5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Таким чином, середня геометрична точніше відображає зміну (точніше, відсутність змін) обсягу інвестицій за дворічний період, ніж середня арифметична.

Цікаві факти.По-перше, середнє геометричне завжди буде менше середнього арифметичного тих самих чисел. За винятком випадку, коли всі взяті числа дорівнюють один одному. По-друге, розглянувши властивості прямокутного трикутника, можна зрозуміти, чому середнє називається геометричним. Висота прямокутного трикутника, опущена на гіпотенузу, є середнім пропорційним між проекціями катетів на гіпотенузу, а кожен катет є середнім пропорційним між гіпотенузою і його проекцією на гіпотенузу (рис. 5). Це дає геометричний спосіб побудови середнього геометричного двох (довжин) відрізків: потрібно побудувати коло на сумі цих двох відрізків як на діаметрі, тоді висота, відновлена з точки їх з'єднання до перетину з колом, дасть шукану величину:

Рис. 5. Геометрична природа середнього геометричного (малюнок з Вікіпедії)

Друге важлива властивістьчислових даних - їх варіація, Що характеризує ступінь дисперсії даних Дві різні вибірки можуть відрізнятися як середніми значеннями, і варіаціями. Проте, як показано на рис. 6 і 7, дві вибірки можуть мати однакові варіації, але різні середні значення, або однакові середні значення і різні варіації. Дані, яким відповідає полігон на рис. 7 змінюються набагато менше, ніж дані, за якими побудований полігон А.

Рис. 6. Два симетричні розподіли дзвоноподібної форми з однаковим розкидом і різними середніми значеннями

Рис. 7. Два симетричні розподіли дзвоноподібної форми з однаковими середніми значеннями та різним розкидом

Існує п'ять оцінок варіації даних:

розмах,
міжквартильний розмах,
дисперсія,
стандартне відхилення,
коефіцієнт варіації.

Розмах

Розмахом називається різниця між найбільшим та найменшим елементами вибірки:

Розмах = ХMax – ХMin

Розмах вибірки, що містить дані про середньорічну прибутковість 15 взаємних фондів з дуже високим рівнем ризику, можна обчислити за допомогою впорядкованого масиву (див. рис. 4): Розмах = 18,5 – (–6,1) = 24,6. Це означає, що різниця між найбільшою та найменшою середньорічною прибутковістю фондів з дуже високим рівнем ризику дорівнює 24,6%.

Розмах дозволяє виміряти загальний розкид даних. Хоча розмах вибірки є дуже простою оцінкою загального розкиду даних, його слабкість у тому, що не враховує, як саме розподілені дані між мінімальним і максимальним елементами. Цей ефект добре простежується на рис. 8, який ілюструє вибірки, що мають однаковий розмах. Шкала В демонструє, що якщо вибірка містить хоча б одне екстремальне значення, розмах вибірки виявляється неточною оцінкою розкиду даних.

Рис. 8. Порівняння трьох вибірок, що мають однаковий розмах; трикутник символізує опору терезів, і його розташування відповідає середньому значенню вибірки

Міжквартильний розмах

Міжквартильний, або середній, розмах – це різниця між третім та першим квартилями вибірки:

Міжквартильний розмах = Q 3 - Q 1

Ця величина дозволяє оцінити розкид 50% елементів та не враховувати вплив екстремальних елементів. Міжквартильний розмах вибірки, що містить дані про середньорічну прибутковість 15 взаємних фондів з дуже високим рівнем ризику, можна обчислити, використовуючи дані на рис. 4 (наприклад, для функції КВАРТИЛЬ.ИСКЛ): Міжквартильний розмах = 9,8 – (–0,7) = 10,5. Інтервал, обмежений числами 9,8 та –0,7, часто називають середньою половиною.

Слід зазначити, що величини Q 1 і Q 3 , а значить, і міжквартильний розмах, не залежать від наявності викидів, оскільки при їх обчисленні не враховується жодна величина, яка була б меншою за Q 1 або більше за Q 3 . Сумарні кількісні характеристики, такі як медіана, перший і третій квартилі, а також міжквартильний розмах, на які не впливають викиди, називаються стійкими показниками.

Хоча розмах та міжквартильний розмах дозволяють оцінити загальний та середній розкид вибірки відповідно, жодна з цих оцінок не враховує, як саме розподілені дані. Дисперсія та стандартне відхиленняпозбавлені цього недоліку. Ці показники дозволяють оцінити рівень коливання даних навколо середнього значення. Вибіркова дисперсіяє наближенням середнього арифметичного, обчисленого на основі квадратів різниць між кожним елементом вибірки та середнім вибірковим. Для вибірки Х 1 , Х 2 ... Х n вибіркова дисперсія (позначається символом S 2 задається наступною формулою:

В загальному випадкувибіркова дисперсія - це сума квадратів різниць між елементами вибірки та вибірковим середнім, поділена на величину, рівну обсягу вибірки мінус один:

де - арифметичне середнє, n- обсяг вибірки, X i - i-й елемент вибірки X. В Excel до версії 2007 для розрахунку вибіркової дисперсіївикористовувалася функція =ДІСП(), з версії 2010 використовується функція =ДІСП.В().

Найбільш практичною та широко поширеною оцінкою розкиду даних є стандартне вибіркове відхилення . Цей показник позначається символом S і дорівнює квадратного кореняз вибіркової дисперсії:

В Excel до версії 2007 для розрахунку стандартного вибіркового відхилення використовувалася функція =СТАНДОТКЛОН(), з версії 2010 використовується функція =СТАНДОТКЛОН.В(). Для розрахунку цих функцій масив даних може бути невпорядкованим.

Ні вибіркова дисперсія, ні стандартне вибіркове відхилення не можуть бути негативними. Єдина ситуація, в якій показники S 2 і S можуть бути нульовими, якщо всі елементи вибірки рівні між собою. У цьому зовсім неймовірному випадкурозмах і міжквартильний розмах також дорівнюють нулю.

Числові дані за своєю природою мінливі. Будь-яка змінна може приймати безліч різних значень. Наприклад, різні взаємні фонди мають різні показники прибутковості та збитків. Внаслідок мінливості числових даних дуже важливо вивчати не лише оцінки середнього значення, які за своєю природою є сумарними, а й оцінки дисперсії, що характеризують розкид даних.

Дисперсія та стандартне відхилення дозволяють оцінити розкид даних навколо середнього значення, інакше кажучи, визначити, скільки елементів вибірки менше від середнього, а скільки - більше. Дисперсія має деякі цінні математичними властивостями. Проте її величина є квадрат одиниці виміру - квадратний відсоток, квадратний долар, квадратний дюйм і т.п. Отже, природною оцінкою дисперсії є стандартне відхилення, яке виражається у звичайних одиницях вимірів – відсотках доходу, доларах чи дюймах.

Стандартне відхилення дає змогу оцінити величину коливань елементів вибірки навколо середнього значення. Практично у всіх ситуаціях основна кількість величин, що спостерігаються, лежить в інтервалі плюс-мінус одне стандартне відхилення від середнього значення. Отже, знаючи середнє арифметичне елементів вибірки та стандартне вибіркове відхилення, можна визначити інтервал, якому належить основна маса даних.

Стандартне відхилення прибутковості 15 взаємних фондів із дуже високим рівнем ризику дорівнює 6,6 (рис. 9). Це означає, що прибутковість основної маси фондів відрізняється від середнього значення не більше ніж на 6,6% (тобто коливається в інтервалі від - S= 6,2 - 6,6 = -0,4 до + S= 12,8). Фактично у цьому інтервалі лежить п'ятирічна середньорічна прибутковість 53,3% (8 із 15) фондів.

Рис. 9. Стандартне вибіркове відхилення

Зверніть увагу на те, що в процесі підсумовування квадратів різниць елементи вибірки, що лежать далі від середнього значення, набувають більшої ваги, ніж елементи, що лежать ближче. Ця властивість є основною причиною того, що для оцінки середнього значення розподілу найчастіше використовують середнє арифметичне значення.

Коефіцієнт варіації

На відміну від попередніх оцінок розкиду коефіцієнт варіації є відносною оцінкою. Він завжди вимірюється у відсотках, а не в одиницях виміру вихідних даних. Коефіцієнт варіації, що позначається символами CV, вимірює розсіювання даних щодо середнього значення. Коефіцієнт варіації дорівнює стандартному відхиленню, поділеному на середнє арифметичне та помноженому на 100%:

де S- стандартне вибіркове відхилення, - Вибіркове середнє.

Коефіцієнт варіації дозволяє порівняти дві вибірки, елементи яких виражаються у різних одиницях виміру. Наприклад, керуючий служби доставки кореспонденції має намір оновити парк вантажівок. При завантаженні пакетів слід враховувати два види обмежень: вага (у фунтах) та обсяг (у кубічних футах) кожного пакета. Припустимо, що у вибірці, що містить 200 пакетів, середня вага дорівнює 26,0 фунтів, стандартне відхилення ваги 3,9 фунтів, середній об'єм пакета 8,8 кубічних футів, а стандартне відхилення обсягу 2,2 кубічних фути. Як порівняти розкид ваги та обсягу пакетів?

Оскільки одиниці виміру ваги та обсягу відрізняються один від одного, керуючий повинен порівняти відносний розкид цих величин. Коефіцієнт варіації ваги дорівнює CV W = 3,9 / 26,0 * 100% = 15%, а коефіцієнт варіації обсягу CV V = 2,2 / 8,8 * 100% = 25%. Таким чином, відносний розкид обсягу пакетів набагато більший від відносного розкиду їх ваги.

Форма розподілу

Третя важлива властивість вибірки – форма її розподілу. Цей розподіл може бути симетричним чи асиметричним. Щоб описати форму розподілу, необхідно обчислити його середнє значення та медіану. Якщо ці два показники збігаються, змінна вважається симетрично розподіленою. Якщо середнє значення змінної більше за медіану, її розподіл має позитивну асиметрію (рис. 10). Якщо медіана більша за середнє значення, розподіл змінної має негативну асиметрію. Позитивна асиметрія виникає, коли середнє значення збільшується до надзвичайно високих значень. Негативна асиметрія виникає, коли середнє значення зменшується до надзвичайно малих значень. Змінна є симетрично розподіленою, якщо вона не набуває жодних екстремальних значень в жодному з напрямків, так що великі та малі значення змінної врівноважують один одного.

Рис. 10. Три види розподілів

Дані, що зображені на шкалі А, мають негативну асиметрію. На цьому малюнку видно довгий хвіст і перекіс вліво, викликані наявністю надзвичайно малих значень. Ці вкрай малі величини зміщують середнє значення вліво, і воно стає меншим за медіану. Дані, що зображені на шкалі Б, розподілені симетрично. Ліва та права половини розподілу є своїми дзеркальними відображеннями. Великі та малі величини врівноважують один одного, а середнє значення та медіана рівні між собою. Дані, зображені на шкалі, мають позитивну асиметрію. На цьому малюнку видно довгий хвіст і перекіс праворуч, викликані наявністю надзвичайно високих значень. Ці занадто великі величини зміщують середнє значення вправо, і воно стає більшим за медіану.

В Excel описові статистики можна отримати за допомогою надбудови Пакет аналізу. Пройдіть меню Дані → Аналіз даних, у вікні, виберіть рядок Описова статистикаі клацніть Ok. У вікні Описова статистикаобов'язково вкажіть Вхідний інтервал(Рис. 11). Якщо ви хочете побачити описові статистики на тому ж аркуші, що й вихідні дані, виберіть перемикач Вихідний інтервалі вкажіть осередок, куди слід помістити лівий верхній кутвиведених статистик (у прикладі $C$1). Якщо ви хочете вивести дані на новий листабо в нову книгу, досить просто вибрати відповідний перемикач. Поставте галочку навпроти Підсумкова статистика. За бажанням також можна вибрати Рівень складності,k-й найменший таk-й найбільший.

Якщо на вкладі Данів області Аналізу вас не відображається піктограма Аналіз даних, потрібно попередньо встановити надбудову Пакет аналізу(Див., Наприклад, ).

Рис. 11. Описові статистики п'ятирічної середньорічної прибутковості фондів з дуже високим рівнем ризику, обчислені за допомогою надбудови Аналіз данихпрограми Excel

Excel обчислює цілий рядстатистик, розглянутих вище: середнє, медіану, моду, стандартне відхилення, дисперсію, розмах ( інтервал), мінімум, максимум та обсяг вибірки ( рахунок). Крім того, Excel обчислює деякі нові для нас статистики: стандартну помилку, ексцес та асиметричність. Стандартна помилка дорівнює стандартному відхилення, поділеному на квадратний корінь обсягу вибірки. Асиметричністьхарактеризує відхилення від симетричності розподілу і є функцією, яка залежить від куба різниць між елементами вибірки та середнім значенням. Ексцес є мірою відносної концентрації даних навколо середнього значення в порівнянні з хвостами розподілу і залежить від різниць між елементами вибірки і середнім значенням, зведених у четвертий ступінь.

Обчислення описових статистикдля генеральної сукупності

Середнє значення, розкид і форма розподілу, розглянуті вище, є показники, зумовлені за вибіркою. Однак, якщо набір даних містить числові виміри всієї генеральної сукупності, можна визначити її параметри. До таких параметрів відносяться математичне очікування, дисперсія і стандартне відхилення генеральної сукупності.

Математичне очікуванняі сумі всіх значень генеральної сукупності, поділеної на обсяг генеральної сукупності:

де µ - математичне очікування, Xi- i-е спостереження змінної X, N- Обсяг генеральної сукупності. В Excel для обчислення математичного очікуваннявикористовується та сама функція, що й для середнього арифметичного: =СРЗНАЧ().

Дисперсія генеральної сукупностідорівнює сумі квадратів різниць між елементами генеральної сукупності та мат. очікуванням, поділеної на обсяг генеральної сукупності:

де σ 2- Дисперсія генеральної сукупності. Excel до версії 2007 для обчислення дисперсії генеральної сукупності використовується функція =ДИСПР(), починаючи з версії 2010 =ДИСП.Г().

Стандартне відхилення генеральної сукупностіодно квадратному кореню, витягнутому з дисперсії генеральної сукупності:

Excel до версії 2007 для обчислення стандартного відхилення генеральної сукупності використовується функція =СТАНДОТКЛОНП(), починаючи з версії 2010 =СТАНДОТКЛОН.Г(). Зверніть увагу на те, що формули для дисперсії та стандартного відхилення генеральної сукупності відрізняються від формул для обчислення вибіркової дисперсії та стандартного відхилення. При обчисленні вибіркових статистик S 2і Sзнаменник дробу дорівнює n – 1, а при обчисленні параметрів σ 2і σ - обсягом генеральної сукупності N.

Емпіричне правило

Більшість ситуацій велика частка спостережень концентрується навколо медіани, утворюючи кластер. У наборах даних, що мають позитивну асиметрію, цей кластер розташований лівіше (тобто нижче) математичного очікування, а в наборах, що мають негативну асиметрію, цей кластер розташований правіше (тобто вище) математичного очікування. У симетричних даних математичне очікування і медіана збігаються, а спостереження концентруються навколо математичного очікування, формуючи дзвоновий розподіл. Якщо розподіл не має яскраво вираженої асиметрії, а дані концентруються навколо якогось центру тяжкості, для оцінки мінливості можна застосовувати емпіричне правило, яке говорить: якщо дані мають дзвоновий розподіл, то приблизно 68% спостережень відстоять від математичного очікування не більше ніж на одне стандартне відхилення, приблизно 95% спостережень відстоять від математичного очікування не більше ніж на два стандартні відхилення і 99,7% спостережень відстоять від математичного очікування не більше ніж на три стандартні відхилення.

Таким чином, стандартне відхилення, що є оцінкою середнього коливання навколо математичного очікування, допомагає зрозуміти, як розподілені спостереження, і ідентифікувати викиди. З емпіричного правила випливає, що для дзвонових розподілів лише одне значення з двадцяти відрізняється від математичного очікування більше, ніж на два стандартні відхилення. Отже, значення, що лежать за межами інтервалу µ ± 2σможна вважати викидами. Крім того, лише три з 1000 спостережень відрізняються від математичного очікування більш ніж на три стандартні відхилення. Таким чином, значення, що лежать за межами інтервалу µ±3σМайже завжди є викидами. Для розподілів, що мають сильну асиметрію або не мають дзвоноподібної форми, можна застосовувати емпіричне правило Бьенаме-Чебишева.

Понад сто років тому математики Б'єнаме та Чебишев незалежно один від одного відкрили корисна властивістьстандартне відхилення. Вони виявили, що для будь-якого набору даних, незалежно від форми розподілу, відсоток спостережень, що лежать на відстані, що не перевищує kстандартних відхилень від математичного очікування, не менше (1 – 1/ k 2) * 100%.

Наприклад, якщо k= 2, правило Бьенаме-Чебишева говорить, що як мінімум (1 - (1/2) 2) х 100% = 75% спостережень має лежати в інтервалі µ ± 2σ. Це правило справедливе для будь-кого k, що перевищує одиницю. Правило Бьенаме-Чебишева носить дуже загальний характері справедливо для розподілу будь-якого виду. Воно вказує мінімальна кількістьспостережень, відстань від яких до математичного очікування не перевищує заданої величини. Однак, якщо розподіл має дзвонову форму, емпіричне правило більш точно оцінює концентрацію даних навколо математичного очікування.

Обчислення описових статистик для розподілу на основі частот

Якщо вихідні дані недоступні, єдиним джерелом інформації стає розподілення частот. У таких ситуаціях можна вирахувати наближені значення кількісних показників розподілу, таких як середнє арифметичне, стандартне відхилення, квартилі.

Якщо вибіркові дані представлені у вигляді розподілу частот, наближене значення середнього арифметичного можна обчислити, припускаючи, що усі значення всередині кожного класу зосереджені в середній точці класу:

де - вибіркове середнє, n- кількість спостережень, чи обсяг вибірки, з- кількість класів у розподілі частот, m j- середня точка j-го класу, fj- Частота, відповідна j-му класу.

Для обчислення стандартного відхилення з розподілу частот також передбачається, що значення всередині кожного класу зосереджені у середній точці класу.

Щоб зрозуміти, як визначаються квартилі низки на основі частот, розглянемо розрахунок нижнього квартилю на основі даних за 2013 про розподіл населення Росії за величиною середньодушових грошових доходів (рис. 12).

Рис. 12. Частка населення Росії із середньодушовими грошовими доходами у середньому протягом місяця, рублів

Для розрахунку першого квартилю інтервального варіаційного рядуможна скористатися формулою:

де Q1 – величина першого квартилю, хQ1 – нижня межа інтервалу, що містить перший квартиль (інтервал визначається за накопиченою частотою, першою, що перевищує 25%); i – величина інтервалу; Σf – сума частот усієї вибірки; мабуть, завжди дорівнює 100%; SQ1-1 – накопичена частота інтервалу, що передує інтервалу, що містить нижній квартиль; fQ1 – частота інтервалу, що містить нижній квартіль. Формула для третього квартилю відрізняється тим, що у всіх місцях замість Q1 потрібно використовувати Q3, а замість ¼ підставити ¾.

У прикладі (рис. 12) нижній квартиль перебуває у інтервалі 7000,1 – 10 000, накопичена частота якого дорівнює 26,4%. Нижня межа цього інтервалу - 7000 руб., Величина інтервалу - 3000 руб., Накопичена частота інтервалу, що передує інтервалу, що містить нижній квартіль - 13,4%, частота інтервалу, що містить нижній квартиль - 13,0%. Таким чином: Q1 = 7000 + 3000 * (¼ * 100 - 13,4) / 13 = 9677 руб.

Пастки, пов'язані з описовими статистиками

У цій замітці ми розглянули, як описати набір даних за допомогою різних статистик, що оцінюють його середнє значення, розкид та вид розподілу. Наступним етапом є аналіз та інтерпретація даних. Досі ми вивчали об'єктивні властивості даних, а тепер переходимо до їх суб'єктивного трактування. Дослідника підстерігають дві помилки: невірно вибраний предмет аналізу та неправильна інтерпретація результатів.

Аналіз прибутковості 15 взаємних фондів із дуже високим рівнем ризику є цілком об'єктивним. Він привів до абсолютно об'єктивних висновків: всі взаємні фонди мають різну доходність, розкид доходності фондів коливається від -6,1 до 18,5, а середня доходність дорівнює 6,08. Об'єктивність аналізу даних забезпечується правильним виборомсумарних кількісних показників розподілу Було розглянуто кілька способів оцінки середнього значення та розкиду даних, зазначені їх переваги та недоліки. Як вибрати правильну статистику, що забезпечує об'єктивний і неупереджений аналіз? Якщо розподіл даних має невелику асиметрію, чи слід вибирати медіану, а чи не середнє арифметичне? Який показник більш точно характеризує розкид даних: стандартне відхилення чи розмах? Чи слід зазначати позитивну асиметрію розподілу?

З іншого боку, інтерпретація даних суб'єктивний процес. Різні людиприходять до різних висновків, тлумачачи одні й самі результати. У кожного своя думка. Хтось вважає сумарні показники середньорічної прибутковості 15 фондів з дуже високим рівнем ризику добрими та цілком задоволений отриманим доходом. Іншим може здатися, що ці фонди мають надто низьку прибутковість. Таким чином, суб'єктивність слід компенсувати чесністю, нейтральністю та ясністю висновків.

Етичні проблеми

Аналіз даних нерозривно пов'язані з етичними питаннями. Слід критично ставитися до інформації, що розповсюджується газетами, радіо, телебаченням та Інтернетом. Згодом ви навчитеся скептично ставитися не тільки до результатів, але й до цілей, предмету та об'єктивності досліджень. Найкраще про це сказав відомий британський політик Бенджамін Дізраелі: «Існують три види брехні: брехня, нахабна брехня та статистика».

Як було зазначено у замітці етичні проблемивиникають під час вибору результатів, які слід навести у звіті. Слід публікувати як позитивні, так і негативні результати. Крім того, роблячи доповідь або письмовий звіт, результати слід викладати чесно, нейтрально та об'єктивно. Слід розрізняти невдалу та нечесну презентації. І тому необхідно визначити, які були наміри доповідача. Іноді важливу інформацію доповідач пропускає по невігластву, а іноді - навмисне (наприклад, якщо він застосовує середнє арифметичне для оцінки середнього значення явно асиметричних даних, щоб отримати бажаний результат). Нечесно також замовчувати результати, які відповідають точці зору дослідника.

Використовуються матеріали книги Левін та ін. Статистика менеджерів. - М: Вільямс, 2004. - с. 178-209

Функція КВАРТИЛЬ залишена для суміщення з більш ранніми версіями Excel

Припустимо, що потрібно знайти середню кількість днів для виконання завдань різними співробітниками. Або ви хочете обчислення інтервалу часу 10 років Середня температурау певний день. Обчислення середнього значення низки чисел декількома способами.

Середня функція міри центральної тенденції, в якій знаходиться центр ряду чисел статистичний розподіл. Три більшість загальних критеріївЦентральні тенденції виступають.

СереднєСереднє арифметичне і обчислюється шляхом додавання ряду чисел і потім поділу кількості цих чисел. Наприклад середнє значення 2, 3, 3, 5, 7 та 10 має 30, розділених на 6, 5;

МедіанаСередній номер ряду чисел. Половина чисел мають значення, які більші, ніж Медіана, а половина чисел мають значення, які менше, ніж Медіана. Наприклад, медіана 2, 3, 3, 5, 7 і 10 - 4.

РежимНайбільш часто зустрічається число групи чисел. Наприклад режим 2, 3, 3, 5, 7 та 10 - 3.

Ці три заходи центральної тенденції симетричного розподілу ряду чисел, є ті самі. У асиметричний розподіл низки чисел вони можуть бути різними.

Обчислення середнього значення осередків, розташованих безперервно в одному рядку або одному стовпці

Виконайте наступні дії.

Обчислення середнього значення осередків, розташованих вразки

Для виконання цього завдання використовується функція СРЗНАЧ. Скопіюйте в таблиці на порожній лист.

Обчислення середнього виваженого значення

СУМПРОВИЗВі сум. Приклад vThis обчислює середню цінуодиниці виміру, оплачена через три покупки, де знаходиться кожен покупки на різну кількість одиниць виміру за різними цінами за одиницю.

Скопіюйте в таблиці на порожній лист.

Обчислення середнього значення чисел без урахування нульових значень

Для виконання цього завдання використовуються функції СРЗНАЧі якщо. Скопіюйте наведену нижче таблицю і майте на увазі, що в цьому прикладі, щоб простіше було зрозуміти, скопіюйте його на порожній лист.

Середнє арифметичне в excel. Таблиці Excel, якнайкраще підходять для будь-яких обчислень. Вивчивши Excel Ви зможете вирішувати завдання з хімії, фізики, математики, геометрії, біології, статистики, економіки та багато інших. Ми навіть не замислюємося, який потужний інструмент знаходиться на наших комп'ютерах, а отже, і не використовуємо його на повну силу. Багато батьків думають, що комп'ютер – це дорога іграшка. А дарма! Звичайно для того, щоб дитина могла на ньому дійсно займатися, Вам самим необхідно навчиться на ньому працювати, а потім і дитину навчити. Ну це вже інша тема, а сьогодні я хочу поговорити з Вами про те, як знайти середнє арифметичне в Excel.

Як знайти середнє арифметичне в Excel

Про швидке в Excel ми вже з вами говорили, а сьогодні поговоримо про середнє арифметичне.

Виділимо осередок С12та за допомогою Майстри функцій запишемо до неї формулу обчислення середнього арифметичного. Для цього на панелі інструментів Стандартна натисніть на кнопку Вставлення функції –fx (На малюнку вище червона стрілка зверху). Відкриється діалогове вікно Майстер Функцій .

Виберіть поле Категорії — Статистичні ;
В полі Виберіть функцію: СРЗНАЧ ;
Натисніть кнопку ОК .

Відкриється наступне вікно Аргументи та функції .

В полі Число1ви побачите запис С2:С11– програма сама визначила діапазон осередків, для яких необхідно знайти середнє арифметичне.

Натисніть кнопку ОКі в осередку С12з'явиться середнє арифметичне балів.

Виявляється, вирахувати середнє арифметичне в Excel зовсім не складно. А я завжди боялася будь-яких формул. Ех, не на той час ми вчилися.

Цей табличний процесорвпорається практично з усіма розрахунками. Він ідеально підходить для бухгалтерського обліку. Для обчислень існують спеціальні інструменти – формули. Їх можна застосовувати до діапазону або до окремих осередків. Щоб дізнатися мінімальну чи максимальну цифру групи клітин, необов'язково шукати їх самостійно. Найкраще скористатися призначеними для цього опціями. Також корисно буде розібратися, як порахувати середнє значення Excel.

Це особливо актуально в таблицях з великим обсягом даних. Якщо у стовпці, наприклад, вказано ціни на продукцію торгового центру. І вам треба дізнатися, який товар найдешевший. Якщо шукати його "вручну", піде дуже багато часу. Але в Екселі це можна зробити за кілька кліків. Утиліта також обчислює середнє арифметичне. Адже це дві прості операції: складання та поділ.

Максимальне та мінімальне

Ось як знайти максимальне значенняв Excel:

Поставте курсор-осередок у будь-яке місце.
Перейдіть до меню "Формули".
Натисніть кнопку «Вставити функцію».
У списку оберіть «МАКС». Або напишіть це слово у полі «Пошук» та натисніть «Знайти».
У вікні «Аргументи» введіть адреси діапазону, максимальне значення якого потрібно дізнатися. В Excel імена клітин складаються з літери та цифри («B1», «F15», «W34»). А назва діапазону - це перший і останній осередки, які до нього входять.
Замість адреси можна написати кілька чисел. Тоді система покаже найбільше їх.
Натисніть "OK". У клітці, де стояв курсор, з'явиться результат.

Наступний крок – вкажіть діапазон значень

Тепер буде легко розібратися, як знайти мінімальне значення в Excel. Алгоритм дій є повністю ідентичним. Просто замість "МАКС" виберіть "МІН".

Середнє

Середнє арифметичне обчислюється так: скласти всі цифри з множини і поділити на їх кількість. В Екселі можна порахувати суми, дізнатися скільки осередків у рядку і так далі. Але це надто складно та довго. Прийдеться використати багато різних функцій. Тримати у голові інформацію. Або навіть щось записувати на листочок. Але можна спростити алгоритм.

Ось як знайти середнє значення в Excel:

Поставте комірку курсор у будь-яке вільне місцетаблиці.
Перейдіть на вкладку Формули.
Натисніть «Вставити функцію».
Виберіть пункт «СРЗНАЧ».
Якщо цього пункту немає у списку, відкрийте його за допомогою опції "Знайти".
Введіть адресу діапазону в області «Число1». Або напишіть кілька цифр у різних полях «Число2», «Чісло3».
Натисніть "OK". У осередку з'явиться потрібне значення.

Так можна проводити розрахунки як з позиціями в таблиці, але й довільними множинами. Excel, власне, грає роль просунутого калькулятора.

Інші способи

Максимальне, мінімальне та середнє можна дізнатися й іншими способами.

Знайдіть панель функцій із позначкою «Fx». Вона над основною робочою областю таблиці.
Поставте курсор у будь-яку комірку.
Введіть аргумент у полі «Fx». Він починається зі знаку рівності. Потім йде формула та адреса діапазону/клітини.
Повинно вийти щось на кшталт «=МАКС(B8:B11)» (максимальне), «=МІН(F7:V11)» (мінімальне), «=СРЗНАЧ(D14:W15)» (середнє).
Клацніть на «галочку» поруч із полем функцій. Або просто натисніть клавішу Enter. У виділеному осередку з'явиться потрібне значення.
Формулу можна скопіювати безпосередньо до самої клітини. Ефект буде той самий.

Знайти та обчислити допоможе Excel-інструмент "Автофункції".

Поставте курсор у комірку.
Знайдіть кнопку, назва якої починається на "Авто". Це залежить від обраної в Excel налаштування за замовчуванням («Автосума», «Авточисло», «Автозміщ», «Автоіндекс»).
Натисніть на чорну стрілку під нею.
Виберіть "МІН" (мінімальне значення), "МАКС" (максимальне) або "СРЗНАЧ" (середнє).
У цій клітці з'явиться формула. Клацніть на будь-який інший осередок - вона буде додана в функцію. Розтягніть рамку навколо неї, щоб охопити діапазон. Або клацніть по сітці із затиснутою клавішею Ctrl, щоб виділяти по одному елементу.
Коли закінчите, натисніть клавішу Enter. Результат відобразиться у клітці.

В Excel вирахувати середнє значення досить легко. Не треба складати, а потім ділити суму. І тому існує окрема функція. Також можна знайти мінімум та максимум у безлічі. Це набагато легше, ніж рахувати вручну або шукати цифри у величезній таблиці. Тому Ексель популярний у багатьох сферах діяльності, де потрібна точність: бізнес, аудит, кадрове діловодство, фінанси, торгівля, математика, фізика, астрономія, економіка, наука.