Биографии Характеристики Анализ

Как да изчислим средна стойност в excel пример. Как да направя среден резултат в Excel? Стандартен метод на изчисление

Как да изчислим средната стойност на числата в Excel

Намерете средната стойност аритметични числав Excel можете да използвате .

Синтаксис AVERAGE

=СРЕДНО(число1,[число2],…) - Руска версия

Аргументи СРЕДНО

  • номер 1- първото число или диапазон от числа, за изчисляване на средната аритметична стойност;
  • номер2(По избор) – второ число или диапазон от числа за изчисляване на средната аритметична стойност. Максимална сумааргументи на функцията - 255.

За да изчислите, направете следните стъпки:

  • Изберете произволна клетка;
  • Напишете формула в него =СРЕДНО(
  • Изберете диапазона от клетки, за които искате да направите изчисление;
  • Натиснете клавиша "Enter" на клавиатурата

Функцията ще изчисли средната стойност в посочения диапазон сред тези клетки, които съдържат числа.

Как да намерите средната стойност на даден текст

Ако има празни редове или текст в диапазона от данни, тогава функцията ги третира като "нула". Ако данните съдържат булеви изрази FALSE или TRUE, тогава функцията третира FALSE като „нула“ и TRUE като „1“.

Как да намерим средното аритметично по условие

Функцията се използва за изчисляване на средната стойност по условие или критерий. Например, да кажем, че имаме данни за продажбите на продукти:

Нашата задача е да изчислим средните продажби на химикалки. За да направим това, ще предприемем следните стъпки:

  • В клетка A13напишете името на продукта „Химикалки“;
  • В клетка B13нека въведем формулата:

=СРЕДНОАКО(A2:A10;A13;B2:B10)

Диапазон на клетките A2:A10” сочи към списъка с продукти, в който ще търсим думата „Химикалки”. Аргумент A13това е връзка към клетка с текст, който ще търсим сред целия списък с продукти. Диапазон на клетките B2:B10” е диапазон с данни за продажби на продукти, сред които функцията ще намери „Химикалки” и ще изчисли средната стойност.


В повечето случаи данните са концентрирани около някаква централна точка. По този начин, за да се опише всеки набор от данни, е достатъчно да се посочи средната стойност. Нека да разгледаме три числови характеристики, които се използват за оценка на средната стойност на разпределението: средно аритметично, медиана и мода.

Средно аритметично

Средната аритметична стойност (често наричана просто средна) е най-често срещаната оценка на средната стойност на разпределение. Това е резултат от разделяне на сумата от всички наблюдаеми числови стойностиза броя им. За проба на числата X 1, X 2, ..., Xн, средната стойност на извадката (обозначена със символа ) се равнява \u003d (X 1 + X 2 + ... + Xн) / н, или

къде е средната стойност на извадката, н- размер на извадката, хазi-ти елементпроби.

Изтеглете бележка в или формат, примери във формат

Помислете за изчисляването на средната стойност аритметична стойностпетгодишна средна годишна доходност на 15 взаимни фонда с много високо нивориск (фиг. 1).

Ориз. 1. Средна годишна доходност на 15 взаимни фонда с много висок риск

Средната стойност на извадката се изчислява, както следва:

Това е добра възвръщаемост, особено в сравнение с 3-4% възвръщаемост, която вложителите в банка или кредитен съюз са получили за същия период от време. Ако сортирате стойностите на възвращаемостта, лесно можете да видите, че осем фонда имат доходност над, а седем - под средната. Средната аритметична стойност действа като точка на баланс, така че фондовете с ниски доходи балансират фондовете с високи доходи. Всички елементи на извадката участват в изчисляването на средната стойност. Нито един от другите оценители на средната стойност на разпределението няма това свойство.

Кога да се изчисли средноаритметичната стойност.Тъй като средноаритметичната стойност зависи от всички елементи на извадката, наличието на екстремни стойности значително влияе върху резултата. В такива ситуации средноаритметичната стойност може да изкриви значението на числовите данни. Следователно, когато се описва набор от данни, съдържащ екстремни стойности, е необходимо да се посочи медианата или средноаритметичното и медианата. Например, ако възвръщаемостта на фонда RS Emerging Growth бъде премахната от извадката, средната извадкова възвръщаемост на 14-те фонда намалява с почти 1% до 5,19%.

Медиана

Медианата е средната стойност на подреден масив от числа. Ако масивът не съдържа повтарящи се числа, тогава половината от неговите елементи ще бъдат по-малки от и половината повече от медианата. Ако извадката съдържа екстремни стойности, по-добре е да се използва медианата, а не средното аритметично, за да се оцени средната стойност. За да се изчисли медианата на извадка, тя първо трябва да бъде сортирана.

Тази формула е двусмислена. Резултатът му зависи от това дали числото е четно или нечетно. н:

  • Ако извадката съдържа нечетен брой елементи, медианата е (n+1)/2-ти елемент.
  • Ако извадката съдържа четен брой елементи, медианата се намира между двата средни елемента на извадката и е равна на средноаритметичната стойност, изчислена върху тези два елемента.

За да изчислим медианата за извадка от 15 взаимни фонда с много висок риск, първо трябва да сортираме необработените данни (Фигура 2). Тогава медианата ще бъде срещу номера на средния елемент на извадката; в нашия пример номер 8. Excel има специална функция =MEDIAN(), която работи и с неподредени масиви.

Ориз. 2. Медиана 15 средства

Така медианата е 6,5. Това означава, че половината от фондовете с много висок риск не надвишават 6,5, докато другата половина го правят. Имайте предвид, че медианата от 6,5 е малко по-голяма от медианата от 6,08.

Ако премахнем доходността на фонда RS Emerging Growth от извадката, тогава медианата на останалите 14 фонда ще намалее до 6,2%, тоест не толкова значително, колкото средноаритметичната (фиг. 3).

Ориз. 3. Медиана 14 средства

Мода

Терминът е въведен за първи път от Pearson през 1894 г. Fashion е числото, което се среща най-често в извадката (най-модерното). Модата описва добре например типичната реакция на шофьорите при светофар за спиране на движението. Класически примеризползване на модата - изборът на размера на произведената партида обувки или цвета на тапета. Ако едно разпределение има множество режими, тогава се казва, че е мултимодално или мултимодално (има два или повече „пика“). Мултимодалността на разпространение дава важна информацияза естеството на изследваната променлива. Например, в социологически проучвания, ако една променлива представлява предпочитание или отношение към нещо, тогава мултимодалността може да означава, че има няколко ясно различни мнения. Мултимодалността също е индикатор, че извадката не е хомогенна и че наблюденията могат да бъдат генерирани от две или повече „припокриващи се“ разпределения. За разлика от средноаритметичната стойност, отклоненията не влияят на режима. За непрекъснато разпределени случайни променливи, като средната годишна възвръщаемост на взаимните фондове, режимът понякога изобщо не съществува (или няма смисъл). Тъй като тези индикатори могат да приемат различни стойности, повтарящите се стойности са изключително редки.

Квартили

Квартилите са мерки, които най-често се използват за оценка на разпределението на данни, когато се описват свойствата на големи числени извадки. Докато медианата разделя подредения масив наполовина (50% от елементите на масива са по-малки от медианата и 50% са по-големи), квартилите разделят подредения набор от данни на четири части. Стойностите на Q 1, медианата и Q 3 са съответно 25-ти, 50-ти и 75-ти персентил. Първият квартил Q 1 е число, което разделя извадката на две части: 25% от елементите са по-малко и 75% са повече от първияквартил.

Третият квартил Q 3 е число, което също разделя извадката на две части: 75% от елементите са по-малко от и 25% са повече от третия квартил.

За изчисляване на квартили във версии на Excel преди 2007 г. се използва функцията =QUARTILE(масив, част). Започвайки с Excel 2010, се прилагат две функции:

  • =QUARTILE.ON(масив, част)
  • =QUARTILE.EXC(масив, част)

Тези две функции дават малко различни значения(фиг. 4). Например, когато се изчисляват квартилите на извадка, съдържаща данни за средната годишна доходност на 15 взаимни фонда с много висок риск, Q 1 = 1,8 или -0,7 съответно за QUARTILE.INC и QUARTILE.EXC. Между другото, функцията QUARTILE, използвана по-рано, съответства на модерна функцияКВАРТИЛ НА За да изчислите квартили в Excel с помощта на горните формули, масивът от данни може да бъде оставен неподреден.

Ориз. 4. Изчислете квартили в Excel

Нека отново подчертаем. Excel може да изчислява квартили за едномерни дискретна серия , съдържащ стойностите случайна величина. Изчисляването на квартилите за базирано на честота разпределение е дадено в раздела по-долу.

средно геометрично

За разлика от средното аритметично, средното геометрично измерва колко се е променила дадена променлива във времето. Средната геометрична е коренът нстепен от продукта нстойности (в Excel се използва функцията = CUGEOM):

Ж= (X 1 * X 2 * ... * X n) 1/n

Подобен параметър е средната стойност геометрична стойностнормата на възвръщаемост се определя по формулата:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

където R i- норма на възвръщаемост аз-ти период от време.

Да предположим например, че първоначалната инвестиция е $100 000. До края на първата година тя спада до $50 000, а до края на втората година се възстановява до първоначалните $100 000. Процентът на възвръщаемост на тази инвестиция за два годишен период е равен на 0, тъй като първоначалната и крайната сума на средствата са равни една на друга. Въпреки това, средната аритметична годишни ставкипечалбата е = (-0,5 + 1) / 2 = 0,25 или 25%, тъй като нормата на възвръщаемост през първата година R 1 = (50 000 - 100 000) / 100 000 = -0,5, а през втората R 2 = (100 000 – 50 000) / 50 000 = 1. В същото време средната геометрична стойност на нормата на възвръщаемост за две години е: G = [(1–0,5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Така средното геометрично отразява по-точно изменението (по-точно липсата на изменение) в обема на инвестициите през двугодишния период, отколкото средното аритметично.

Интересни факти.Първо, средното геометрично винаги ще бъде по-малко от средното аритметично на същите числа. С изключение на случая, когато всички взети числа са равни едно на друго. Второ, като се имат предвид свойствата правоъгълен триъгълник, можете да разберете защо средната се нарича геометрична. Височината на правоъгълен триъгълник, спусната до хипотенузата, е средната пропорционална стойност между проекциите на катетите върху хипотенузата, а всеки катет е средната пропорционална стойност между хипотенузата и неговата проекция върху хипотенузата (фиг. 5). Това дава геометричен начин за конструиране на средното геометрично на два (дължини) сегмента: трябва да изградите окръжност върху сумата от тези два сегмента като диаметър, след това височината, възстановена от точката на тяхната връзка до пресечната точка с кръг, ще даде необходимата стойност:

Ориз. 5. Геометричният характер на средното геометрично (фигура от Wikipedia)

Второ важна собственостчислени данни – им вариацияхарактеризиращ степента на дисперсия на данните. Две различни проби могат да се различават както по средни стойности, така и по вариации. Въпреки това, както е показано на фиг. 6 и 7, две проби могат да имат една и съща вариация, но различни средни стойности, или една и съща средна и напълно различна вариация. Данните, съответстващи на многоъгълник B на фиг. 7 се променят много по-малко от данните, от които е построен полигон А.

Ориз. 6. Две симетрични камбановидни разпределения с еднакво разпространение и различни средни стойности

Ориз. 7. Две симетрични камбановидни разпределения с еднакви средни стойности и различно разсейване

Има пет оценки за вариация на данните:

обхват

Диапазонът е разликата между най-големия и най-малкия елемент на извадката:

Плъзнете = XМакс-XМин

Диапазонът на извадка, съдържаща средната годишна доходност на 15 взаимни фонда с много висок риск, може да бъде изчислен с помощта на подреден масив (вижте Фигура 4): диапазон = 18,5 - (-6,1) = 24,6. Това означава, че разликата между най-високата и най-ниската средна годишна доходност за фондовете с много висок риск е 24,6%.

Диапазонът измерва общото разпространение на данните. Въпреки че обхватът на извадката е много проста оценка на общото разпространение на данните, неговата слабост е, че не взема предвид точно как данните са разпределени между минималния и максималния елемент. Този ефект се вижда добре на фиг. 8, която илюстрира проби със същия диапазон. Скалата B показва, че ако извадката съдържа поне една екстремна стойност, диапазонът на извадката е много неточна оценка на разсейването на данните.

Ориз. 8. Сравнение на три проби с еднакъв диапазон; триъгълникът символизира опората на баланса, а местоположението му съответства на средната стойност на пробата

Интерквартилен диапазон

Интерквартилът или средният диапазон е разликата между третия и първия квартил на извадката:

Интерквартилен диапазон \u003d Q 3 - Q 1

Тази стойност позволява да се оцени разпространението на 50% от елементите и да не се отчита влиянието на екстремни елементи. Интерквартилният диапазон за извадка, съдържаща данни за средната годишна възвръщаемост на 15 много високорискови взаимни фонда, може да бъде изчислен с помощта на данните на фиг. 4 (например за функцията QUARTILE.EXC): Интерквартилен диапазон = 9,8 - (-0,7) = 10,5. Интервалът между 9,8 и -0,7 често се нарича средна половина.

Трябва да се отбележи, че стойностите на Q 1 и Q 3, а оттам и междуквартилният обхват, не зависят от наличието на извънредни стойности, тъй като тяхното изчисление не взема предвид стойност, която би била по-малка от Q 1 или по-голяма от Q 3 . Обща сума количествени характеристики, като медианата, първия и третия квартил и интерквартилния диапазон, които не се влияят от извънредни стойности, се наричат ​​стабилни мерки.

Докато обхватът и интерквартилният обхват предоставят съответно оценка на общото и средното разсейване на извадката, нито една от тези оценки не отчита точно как са разпределени данните. Дисперсия и стандартно отклонениесвободен от този недостатък. Тези индикатори ви позволяват да оцените степента на колебание на данните около средната стойност. Дисперсия на извадкатае приближение на средната аритметична стойност, изчислена от квадратните разлики между всеки елемент на извадката и средната извадка. За извадка от X 1 , X 2 , ... X n дисперсията на извадката (означена със символа S 2 се дава със следната формула:

AT общ случайДисперсията на извадката е сумата от квадратните разлики между елементите на извадката и средната извадка, разделена на стойност, равна на размера на извадката минус едно:

където - средноаритметично, н- размер на извадката, X i - аз-ти примерен елемент х. В Excel преди версия 2007 за изчисление дисперсия на извадкатабеше използвана функцията =VAR(), от версия 2010 се използва функцията =VAR.B().

Най-практичната и широко приета оценка на разсейването на данните е стандартен избирателно отклонение . Този показател се обозначава със символа S и е равен на корен квадратенот дисперсията на извадката:

В Excel преди версия 2007 функцията =STDEV() се използва за изчисляване на стандартното отклонение, от версия 2010 се използва функцията =STDEV.V(). За да се изчислят тези функции, масивът от данни може да бъде неподреден.

Нито дисперсията на извадката, нито стандартното отклонение на извадката могат да бъдат отрицателни. Единствената ситуация, при която показателите S 2 и S могат да бъдат нула, е ако всички елементи на извадката са равни. В това напълно невероятен случайдиапазонът и интерквартилният диапазон също са нула.

Числовите данни по своята същност са непостоянни. Всяка променлива може да приеме набор различни стойности. Например различните взаимни фондове имат различни нива на възвръщаемост и загуба. Поради променливостта на числените данни е много важно да се изследват не само оценките на средната стойност, които са обобщаващи по природа, но и оценките на дисперсията, които характеризират разсейването на данните.

Дисперсията и стандартното отклонение ни позволяват да оценим разпространението на данните около средната стойност, с други думи, да определим колко елемента от извадката са по-малки от средната и колко са по-големи. Дисперсията има някои ценни математически свойства. Стойността му обаче е квадрат на единица мярка - квадратен процент, квадратен долар, квадратен инч и т.н. Следователно естествена оценка на дисперсията е стандартното отклонение, което се изразява в обичайните мерни единици - процент от дохода, долари или инчове.

Стандартното отклонение ви позволява да оцените степента на колебание на елементите на извадката около средната стойност. В почти всички ситуации по-голямата част от наблюдаваните стойности са в рамките на плюс или минус едно стандартно отклонение от средната стойност. Следователно, знаейки средното аритметично на елементите на извадката и стандартното отклонение на извадката, е възможно да се определи интервалът, към който принадлежи по-голямата част от данните.

Стандартното отклонение на възвръщаемостта на 15 взаимни фонда с много висок риск е 6,6 (Фигура 9). Това означава, че доходността на по-голямата част от фондовете се различава от средната стойност с не повече от 6,6% (т.е. тя варира в диапазона от - С= 6,2 – 6,6 = –0,4 до + С= 12,8). Всъщност този интервал съдържа петгодишна средна годишна възвръщаемост от 53,3% (8 от 15) средства.

Ориз. 9. Стандартно отклонение

Обърнете внимание, че в процеса на сумиране на квадратните разлики елементите, които са по-далеч от средната стойност, получават по-голяма тежест от елементите, които са по-близо. Това свойство е основната причина, поради която средната аритметична стойност най-често се използва за оценка на средната стойност на разпределение.

Коефициентът на вариация

За разлика от предишните оценки на разсейването, коефициентът на вариация е относителна оценка. Винаги се измерва като процент, а не в оригиналните единици данни. Коефициентът на вариация, означен със символите CV, измерва разсейването на данните около средната стойност. Коефициентът на вариация е равен на стандартното отклонение, разделено на средната аритметична стойност и умножено по 100%:

където С- стандартно отклонение на извадката, - извадкова средна стойност.

Коефициентът на вариация ви позволява да сравните две проби, чиито елементи са изразени в различни мерни единици. Например, мениджърът на услуга за доставка на поща възнамерява да обнови автопарка от камиони. Когато зареждате пакети, има два вида ограничения, които трябва да имате предвид: теглото (в паундове) и обемът (в кубични футове) на всеки пакет. Да приемем, че в проба от 200 торби средното тегло е 26,0 паунда, стандартното отклонение на теглото е 3,9 паунда, средният обем на опаковката е 8,8 кубически фута, а стандартното отклонение на обема е 2,2 кубични фута. Как да сравним разпределението на теглото и обема на пакетите?

Тъй като мерните единици за тегло и обем се различават една от друга, мениджърът трябва да сравни относителното разпространение на тези стойности. Коефициентът на вариация на теглото е CV W = 3,9 / 26,0 * 100% = 15%, а коефициентът на вариация на обема CV V = 2,2 / 8,8 * 100% = 25%. По този начин относителното разсейване на обемите на пакетите е много по-голямо от относителното разсейване на техните тегла.

Форма за разпространение

Третото важно свойство на извадката е формата на нейното разпределение. Това разпределение може да бъде симетрично или асиметрично. За да се опише формата на разпределение, е необходимо да се изчисли неговата средна стойност и медиана. Ако тези две мерки са еднакви, се казва, че променливата е симетрично разпределена. Ако средната стойност на дадена променлива е по-голяма от медианата, нейното разпределение има положителна асиметрия (фиг. 10). Ако медианата е по-голяма от средната, разпределението на променливата е отрицателно изкривено. Положителна асиметрия възниква, когато средната стойност се увеличи до необичайно високи стойности. Отрицателна асиметрия възниква, когато средната стойност намалее до необичайно малки стойности. Една променлива е симетрично разпределена, ако не приема никакви екстремни стойности в нито една посока, така че големи и малки стойности на променливата взаимно се компенсират.

Ориз. 10. Три вида разпределения

Данните, изобразени по скала А, имат отрицателна асиметрия. Тази фигура показва дълга опашка и ляво изкривяване, причинено от необичайно малки стойности. Тези изключително малки стойности изместват средната стойност наляво и тя става по-малка от медианата. Данните, показани в скала B, са разпределени симетрично. Лявата и дясната половина на разпределението са техни собствени огледални отражения. Големите и малките стойности се балансират взаимно, а средната и медианата са равни. Данните, показани на скала B, имат положителна асиметрия. Тази фигура показва дълга опашка и изкривяване надясно, причинено от наличието на необичайно високи стойности. Тези твърде големи стойности изместват средната стойност надясно и тя става по-голяма от медианата.

В Excel може да се получи описателна статистика с помощта на добавката Пакет за анализ. Преминете през менюто ДанниАнализ на данни, в прозореца, който се отваря, изберете реда Описателна статистикаи щракнете Добре. В прозореца Описателна статистикане забравяйте да посочите интервал на въвеждане(фиг. 11). Ако искате да видите описателна статистика на същия лист като оригиналните данни, изберете бутона за избор изходен интервали посочете клетката, където искате да поставите отляво горен ъгълизходна статистика (в нашия пример $C$1). Ако искате да изпратите данни до нов листили в нова книгапросто изберете съответния бутон за избор. Поставете отметка в квадратчето до Крайна статистика. По желание можете също да изберете Ниво на трудност,k-тото най-малко иk-то по големина.

Ако е на депозит Даннив района на Анализне виждате иконата Анализ на данни, първо трябва да инсталирате добавката Пакет за анализ(виж, например,).

Ориз. 11. Описателна статистика на петгодишната средна годишна доходност на фондове с много високи нива на риск, изчислена с помощта на добавката Анализ на данни Excel програми

Excel изчислява цяла линиястатистически данни, обсъдени по-горе: средна стойност, медиана, режим, стандартно отклонение, дисперсия, диапазон ( интервал), минимум, максимум и размер на извадката ( проверка). Освен това Excel изчислява някои нови статистики за нас: стандартна грешка, ексцес и изкривяване. стандартна грешка е равно на стандартното отклонение, разделено на корен квадратен от размера на извадката. асиметрияхарактеризира отклонението от симетрията на разпределението и е функция, която зависи от куба на разликите между елементите на извадката и средната стойност. Ексцесът е мярка за относителната концентрация на данни около средната стойност спрямо опашките на разпределението и зависи от разликите между извадката и средната стойност, повишена на четвърта степен.

изчисление Описателна статистиказа население

Средната стойност, разсейването и формата на разпределението, обсъдени по-горе, са характеристики, базирани на извадка. Въпреки това, ако наборът от данни съдържа числени измервания на цялата популация, тогава неговите параметри могат да бъдат изчислени. Тези параметри включват средна стойност, дисперсия и стандартно отклонение на популацията.

Очаквана стойносте равна на сумата от всички стойности на генералната съвкупност, разделена на обема на генералната съвкупност:

където µ - очаквана стойност, хаз- аз-та променлива наблюдение х, н- обемът на генералната съвкупност. В Excel за изчисляване математическо очакванеизползва се същата функция като за средното аритметично: =AVERAGE().

Дисперсия на населениеторавна на сумата от квадратите на разликите между елементите на генералната съвкупност и мат. очакване, разделено на размера на населението:

където σ2е дисперсията на генералната съвкупност. Excel преди версия 2007 използва функцията =VAR() за изчисляване на дисперсията на популацията, започвайки с версия 2010 =VAR.G().

стандартно отклонение на населениетое равно на корен квадратен от дисперсията на популацията:

Excel преди версия 2007 използва =STDEV() за изчисляване на стандартното отклонение на популацията, като се започне от версия 2010 =STDEV.Y(). Обърнете внимание, че формулите за вариация на популацията и стандартно отклонение са различни от формулите за вариация на извадката и стандартно отклонение. При изчисляване примерна статистика S2и Сзнаменателят на дробта е n - 1, и при изчисляване на параметрите σ2и σ - обемът на генералната съвкупност н.

основно правило

В повечето ситуации голяма част от наблюденията са концентрирани около медианата, образувайки клъстер. В набори от данни с положителна асиметрия, този клъстер е разположен вляво (т.е. под) от математическото очакване, а в набори с отрицателна асиметрия този клъстер е разположен вдясно (т.е. отгоре) на математическото очакване. Симетричните данни имат една и съща средна стойност и медиана, а наблюденията се групират около средната стойност, образувайки разпределение във формата на камбана. Ако разпределението няма ясно изразено изкривяване и данните са концентрирани около определен център на тежестта, може да се използва правило за оценка на променливостта, което гласи: ако данните имат камбанообразно разпределение, тогава приблизително 68% от наблюденията са по-малко от едно стандартно отклонение от математическото очакване, Приблизително 95% от наблюденията са в рамките на две стандартни отклонения от очакваната стойност, а 99,7% от наблюденията са в рамките на три стандартни отклонения от очакваната стойност.

По този начин стандартното отклонение, което е оценка на средната флуктуация около математическото очакване, помага да се разбере как са разпределени наблюденията и да се идентифицират отклоненията. От основното правило следва, че за камбанообразните разпределения само една от двадесет стойности се различава от математическото очакване с повече от две стандартни отклонения. Следователно стойности извън интервала µ ± 2σ, могат да се считат за извънредни стойности. Освен това само три от 1000 наблюдения се различават от математическото очакване с повече от три стандартни отклонения. По този начин стойностите са извън интервала µ ± 3σпочти винаги са отклонения. За разпределения, които са силно изкривени или не са с форма на камбана, може да се приложи основното правило на Biename-Chebyshev.

Преди повече от сто години математиците Биенамай и Чебишев откриха независимо един от друг полезно свойствостандартно отклонение. Те откриха, че за всеки набор от данни, независимо от формата на разпределението, процентът наблюдения, които се намират на разстояние, което не надвишава кстандартни отклонения от математическото очакване, не по-малко (1 – 1/ 2)*100%.

Например ако к= 2, правилото на Biename-Chebyshev гласи, че най-малко (1 - (1/2) 2) x 100% = 75% от наблюденията трябва да се намират в интервала µ ± 2σ. Това правило е вярно за всеки кнадвишава едно. Правилото Biename-Chebyshev е много общ характери е валиден за дистрибуции от всякакъв вид. То показва минимално количествонаблюдения, разстоянието от които до математическото очакване не превишава зададена стойност. Въпреки това, ако разпределението е с форма на камбана, основното правило оценява по-точно концентрацията на данни около средната стойност.

Изчисляване на описателна статистика за честотно базирано разпределение

Ако оригиналните данни не са налични, разпределението на честотата става единственият източник на информация. В такива ситуации можете да изчислите приблизителните стойности на количествените показатели на разпределението, като средно аритметично, стандартно отклонение, квартили.

Ако примерните данни са представени като честотно разпределение, може да се изчисли приблизителна стойност на средната аритметична стойност, като се приеме, че всички стойности във всеки клас са концентрирани в средната точка на класа:

където - извадкова средна стойност, н- брой наблюдения или размер на извадката, с- броя на класовете в честотното разпределение, mj- средна точка й-ти клас, fй- честота, съответстваща на й-ти клас.

За да се изчисли стандартното отклонение от честотното разпределение, също се приема, че всички стойности във всеки клас са концентрирани в средната точка на класа.

За да разберем как се определят квартилите на реда въз основа на честотите, нека разгледаме изчисляването на долния квартил въз основа на данните за 2013 г. за разпределението на руското население по среден паричен доход на глава от населението (фиг. 12).

Ориз. 12. Делът на населението на Русия с паричен доход на глава от населението средно на месец, рубли

За изчисляване на първия квартил на интервала вариационна серияможете да използвате формулата:

където Q1 е стойността на първия квартил, xQ1 е долната граница на интервала, съдържащ първия квартил (интервалът се определя от натрупаната честота, като първата надвишава 25%); i е стойността на интервала; Σf е сумата от честотите на цялата извадка; вероятно винаги е равно на 100%; SQ1–1 е кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил; fQ1 е честотата на интервала, съдържащ долния квартил. Формулата за третия квартил се различава по това, че на всички места, вместо Q1, трябва да използвате Q3 и да замените ¾ вместо ¼.

В нашия пример (фиг. 12) долният квартил е в диапазона 7000,1 - 10 000, чиято кумулативна честота е 26,4%. Долната граница на този интервал е 7000 рубли, стойността на интервала е 3000 рубли, натрупаната честота на интервала, предхождащ интервала, съдържащ долния квартил, е 13,4%, честотата на интервала, съдържащ долния квартил, е 13,0%. Така: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 рубли.

Клопки, свързани с описателната статистика

В тази бележка разгледахме как да опишем набор от данни, използвайки различни статистики, които оценяват неговата средна стойност, разсейване и разпределение. Следващата стъпка е да анализирате и интерпретирате данните. Досега изучавахме обективните свойства на данните, а сега се обръщаме към тяхната субективна интерпретация. Две грешки чакат изследователя: неправилно избран предмет на анализ и неправилно тълкуване на резултатите.

Анализът на представянето на 15 взаимни фонда с много висок риск е доста безпристрастен. Той доведе до напълно обективни заключения: всички взаимни фондове имат различна доходност, спредът на доходността на фондовете варира от -6,1 до 18,5, а средната доходност е 6,08. Осигурена е обективност на анализа на данните правилният изборобщи количествени показатели на разпространение. Бяха разгледани няколко метода за оценка на средната стойност и разсейването на данните и бяха посочени техните предимства и недостатъци. Как да изберем правилната статистика, която предоставя обективен и безпристрастен анализ? Ако разпределението на данните е леко изкривено, трябва ли медианата да бъде избрана пред средната аритметична? Кой индикатор характеризира по-точно разпространението на данните: стандартно отклонение или диапазон? Трябва ли да се посочи положителната асиметрия на разпределението?

От друга страна, интерпретацията на данни е субективен процес. Различни хорастигат до различни заключения, тълкувайки едни и същи резултати. Всеки си има своя гледна точка. Някой смята общата средна годишна доходност на 15 фонда с много високо ниво на риск за добра и е доста доволен от получения доход. Други може да си помислят, че тези фондове имат твърде ниска възвръщаемост. Така субективизмът трябва да се компенсира от честност, неутралност и яснота на заключенията.

Етични въпроси

Анализът на данни е неразривно свързан с етичните въпроси. Човек трябва да бъде критичен към информацията, разпространявана от вестници, радио, телевизия и интернет. С времето ще се научите да бъдете скептични не само към резултатите, но и към целите, предмета и обективността на изследването. Известният британски политик Бенджамин Дизраели го каза най-добре: „Има три вида лъжи: лъжи, проклети лъжи и статистика.

Както е отбелязано в бележката етични въпросивъзникват при избора на резултатите, които трябва да бъдат представени в доклада. Както положителни, така и отрицателни резултати. Освен това, когато се прави доклад или писмен доклад, резултатите трябва да бъдат представени честно, неутрално и обективно. Правете разлика между лоши и нечестни презентации. За целта е необходимо да се определи какви са били намеренията на говорещия. Понякога говорещият пропуска важна информация поради незнание, а понякога и умишлено (например, ако използва средната аритметична стойност, за да оцени средната стойност на ясно изкривени данни, за да получи желан резултат). Също така е нечестно да се премълчават резултати, които не отговарят на гледната точка на изследователя.

Използвани са материали от книгата Левин и др.Статистика за мениджъри. - М.: Уилямс, 2004. - стр. 178–209

Функцията QUARTILE остава да се комбинира с още ранни версиипревъзходен

Да приемем, че трябва да намерите средния брой дни за задачите, които трябва да бъдат изпълнени от различни служители. Или искате да изчислите времеви интервал от 10 години средна температурана определен ден. Изчисляване на средната стойност на поредица от числа по няколко начина.

Средната стойност е функция на мярката на централната тенденция, в която центърът на поредица от числа е в статистическо разпределение. Трима мнозинство общи критерииизпъкват централни тенденции.

    Средно аритметичноСредната аритметична стойност се изчислява чрез добавяне на поредица от числа и след това разделяне на броя на тези числа. Например средната стойност на 2, 3, 3, 5, 7 и 10 има 30 делено на 6, 5;

    МедианаСредното число на поредица от числа. Половината от числата имат стойности, които са по-големи от медианата, а половината от числата имат стойности, които са по-малки от медианата. Например медианата на 2, 3, 3, 5, 7 и 10 е 4.

    РежимНай-често срещаното число в група числа. Например режим 2, 3, 3, 5, 7 и 10 - 3.

Тези три мерки на централната тенденция на симетричното разпределение на поредица от числа са едни и същи. При асиметрично разпределение на редица числа те могат да бъдат различни.

Изчислете средната стойност на клетките, разположени непрекъснато в един ред или една колона

Направете следното.

Изчисляване на средната стойност на разпръснатите клетки

За да изпълните тази задача, използвайте функцията СРЕДНО АРИТМЕТИЧНО. Копирайте таблицата по-долу върху празен лист.

Изчисляване на среднопретеглената стойност

SUMPRODUCTи суми. vThis пример изчислява средна ценамерни единици, платени за три покупки, като всяка покупка е за различен брой мерни единици на различни цени за единица.

Копирайте таблицата по-долу върху празен лист.

Изчисляване на средната стойност на числата, без да се взема предвид нулеви стойности

За да изпълните тази задача, използвайте функциите СРЕДНО АРИТМЕТИЧНОи ако. Копирайте таблицата по-долу и имайте предвид, че в този пример, за по-лесно разбиране, я копирайте на празен лист.

Средно аритметично в ексел. Excel електронни таблици, са най-подходящи за всякакви изчисления. След като сте изучавали Excel, ще можете да решавате задачи по химия, физика, математика, геометрия, биология, статистика, икономика и много други. Ние дори не се замисляме какъв мощен инструмент е на нашите компютри, което означава, че не го използваме в пълния му потенциал. Много родители смятат, че компютърът е просто скъпа играчка. Но напразно! Разбира се, за да може детето наистина да учи върху него, вие сами трябва да се научите как да работите върху него и след това да научите детето. Е, това е друга тема, но днес искам да говоря с вас за това как да намерите средното аритметично в Excel.

Как да намерите средното аритметично в Excel

Вече говорихме за бързо в Excel, а днес ще говорим за средно аритметично.

Изберете клетка C12и с помощта Помощници за функции запишете в него формулата за изчисляване на средноаритметичното. За да направите това, в лентата с инструменти Standard кликнете върху бутона - Вмъкване на функция −fx (на снимката по-горе червената стрелка е отгоре). Ще се отвори диалогов прозорец Функция Master .

  • Изберете в полето КатегорииСтатистически ;
  • В полето Изберете функция: СРЕДНО АРИТМЕТИЧНО ;
  • Щракнете върху бутона Добре .

Ще се отвори следният прозорец Аргументи и функции .

В полето Номер 1ще видите записа S2: S11- самата програма определи диапазона от клетки, за които е необходимо намерете средното аритметично.

Щракнете върху бутона Добреи в клетката C12ще се появи средната аритметична стойност на резултатите.

Оказва се, че изчисляването на средно аритметично в ексел не е никак трудно. И винаги се страхувах от всякакви формули. Ех, не по това време учехме.

Това процесор за електронни таблицисе справят с почти всички изчисления. Идеален е за счетоводство. За изчисления има специални инструменти - формули. Те могат да бъдат приложени към диапазон или към отделни клетки. За да разберете минималния или максималния брой в група от клетки, не е необходимо да ги търсите сами. По-добре е да използвате предоставените опции за това. Също така ще бъде полезно да разберете как да изчислите средната стойност в Excel.

Това важи особено за таблици с голямо количество данни. Ако колоната съдържа например цени на продукти търговски център. И трябва да разберете кой продукт е най-евтиният. Ако го търсите "ръчно", ще ви отнеме много време. Но в Excel това може да стане само с няколко щраквания. Помощната програма също изчислява средната аритметична стойност. В крайна сметка това са две прости операции: събиране и деление.

Максимум и минимум

Ето как да намерите максимална стойноств ексел:

  1. Поставете клетъчния курсор навсякъде.
  2. Отидете в менюто "Формули".
  3. Щракнете върху Вмъкване на функция.
  4. Изберете „MAX“ от списъка. Или напишете тази дума в полето "Търсене" и щракнете върху "Намери".
  5. В прозореца Аргументи въведете адресите на диапазона, чиято максимална стойност искате да знаете. В Excel имената на клетките се състоят от буква и цифра ("B1", "F15", "W34"). И името на диапазона е първата и последната клетка, които са включени в него.
  6. Вместо адрес можете да напишете няколко номера. Тогава системата ще покаже най-големия от тях.
  7. Натиснете OK. Резултатът ще се появи в клетката, където е бил курсорът.

Следващата стъпка е да посочите диапазон от стойности

Сега ще бъде по-лесно да разберете как да намерите минималната стойност в Excel. Алгоритъмът на действията е напълно идентичен. Просто изберете "MIN" вместо "MAX".

Средно аритметично

Средната аритметична стойност се изчислява по следния начин: съберете всички числа от набора и разделете на техния брой. В Excel можете да изчислявате суми, да разберете колко клетки са в ред и т.н. Но е твърде сложно и дълго. Трябва да се използва много различни функции. Имайте предвид информацията. Или дори да напишете нещо на лист хартия. Но алгоритъмът може да бъде опростен.

Ето как да намерите средната стойност в Excel:

  1. Преместете курсора на клетката до всяка свободно мястомаси.
  2. Отидете в раздела "Формули".
  3. Кликнете върху „Вмъкване на функция“.
  4. Изберете СРЕДНО.
  5. Ако този елемент не е в списъка, отворете го с помощта на опцията "Намери".
  6. В областта Number1 въведете адреса на диапазона. Или напишете няколко числа в различни полета "Номер2", "Номер3".
  7. Натиснете OK. Желаната стойност ще се появи в клетката.

Така че можете да извършвате изчисления не само с позиции в таблицата, но и с произволни набори. Excel всъщност играе ролята на усъвършенстван калкулатор.

други методи

Максимумът, минимумът и средната стойност могат да бъдат намерени по други начини.

  1. Намерете функционалната лента с надпис "Fx". Той е над основната работна зона на масата.
  2. Поставете курсора в произволна клетка.
  3. Въведете аргумент в полето "Fx". Започва със знак за равенство. След това идва формулата и адресът на диапазона/клетката.
  4. Трябва да получите нещо като "=MAX(B8:B11)" (максимум), "=MIN(F7:V11)" (минимум), "=AVERAGE(D14:W15)" (средно).
  5. Кликнете върху "отметката" до функционалното поле. Или просто натиснете Enter. Желаната стойност ще се появи в избраната клетка.
  6. Формулата може да се копира директно в самата клетка. Ефектът ще е същият.

Excel-инструмент "Автофункции" ще ви помогне да намерите и изчислите.

  1. Поставете курсора в клетката.
  2. Намерете бутона, чието име започва с „Автоматично“. Това зависи от опцията по подразбиране, избрана в Excel (AutoSum, AutoNumber, AutoOffset, AutoIndex).
  3. Кликнете върху черната стрелка под него.
  4. Изберете MIN (минимум), MAX (максимум) или AVERAGE (средно).
  5. Формулата ще се появи в маркираната клетка. Кликнете върху всяка друга клетка - тя ще бъде добавена към функцията. „Плъзнете“ кутията около нея, за да покриете диапазона. Или щракнете с Ctrl върху мрежата, за да изберете един по един елемент.
  6. Когато сте готови, натиснете Enter. Резултатът ще се покаже в клетка.

В Excel изчисляването на средната стойност е доста лесно. Няма нужда да добавяте и след това да разделяте сумата. Има отделна функция за това. Можете също така да намерите минимум и максимум в комплект. Много по-лесно е, отколкото да броите на ръка или да търсите числа в огромна електронна таблица. Ето защо Excel е популярен в много области на дейност, където се изисква точност: бизнес, одит, управление на досиета на персонала, финанси, търговия, математика, физика, астрономия, икономика, наука.