Биографии Характеристики Анализ

Каква е формулата за изчисляване на стандартното отклонение. Освен това разграничете

Програмата Excel е високо ценена както от професионалисти, така и от аматьори, тъй като потребител на всяко ниво на обучение може да работи с нея. Например, всеки с минимални умения за "комуникация" с Excel може да начертае проста графика, да направи приличен знак и т.н.

В същото време тази програма дори ви позволява да извършвате различни видове изчисления, например изчисления, но това вече изисква малко по-различно ниво на обучение. Ако обаче току-що сте започнали близко запознаване с тази програма и се интересувате от всичко, което ще ви помогне да станете по-напреднал потребител, тази статия е за вас. Днес ще ви кажа каква е формулата за стандартно отклонение в Excel, защо изобщо е необходима и всъщност кога се прилага. Отивам!

Какво е

Да започнем с теорията. Стандартното отклонение обикновено се нарича квадратен корен, получено от средната аритметична стойност на всички квадратни разлики между наличните стойности, както и тяхната средна аритметична стойност. Между другото, тази стойност обикновено се нарича гръцка буква "сигма". Стандартното отклонение се изчислява по формулата STDEV, съответно програмата го прави за самия потребител.

Същността на тази концепция е да се идентифицира степента на променливост на инструмента, т.е. той по свой начин е показател от описателната статистика. Той разкрива промени в волатилността на инструмента във всеки период от време. С помощта на формули STDEV можете да оцените стандартното отклонение на извадка, докато булевите и текстовите стойности се игнорират.

Формула

Помага за изчисляване на стандартното отклонение във формулата на Excel, която се предоставя автоматично в Excel. За да го намерите, трябва да намерите секцията с формули в Excel и вече там да изберете тази, която има името STDEV, така че е много проста.

След това пред вас ще се появи прозорец, в който ще трябва да въведете данни за изчислението. По-специално, две числа трябва да бъдат въведени в специални полета, след което програмата автоматично ще изчисли стандартното отклонение за извадката.

Несъмнено математическите формули и изчисления са доста сложен въпрос и не всички потребители могат да се справят с него веднага. Въпреки това, ако копаете малко по-дълбоко и разберете проблема малко по-подробно, се оказва, че не всичко е толкова тъжно. Надявам се да сте убедени в това чрез примера за изчисляване на стандартното отклонение.

Видео в помощ

Мъдрите математици и статистици излязоха с по-надежден показател, макар и с малко по-различна цел - средно линейно отклонение. Този индикатор характеризира мярката за разпространение на стойностите на набора от данни около тяхната средна стойност.

За да покажете мярката за разпространението на данните, първо трябва да определите спрямо какво ще се счита това разпространение - обикновено това е средната стойност. След това трябва да изчислите доколко стойностите на анализирания набор от данни са далеч от средните. Ясно е, че всяка стойност съответства на определена степен на отклонение, но ние също се интересуваме от обща оценка, обхващаща цялата популация. Следователно средното отклонение се изчислява по формулата на обичайната средна аритметична стойност. Но! Но за да се изчисли средната стойност на отклоненията, те трябва първо да бъдат добавени. И ако съберем положителни и отрицателни числа, те взаимно ще се компенсират и сборът им ще клони към нула. За да се избегне това, всички отклонения се вземат по модул, т.е. всички отрицателни числа стават положителни. Сега средното отклонение ще покаже обобщена мярка за разпространението на стойностите. В резултат на това средното линейно отклонение ще бъде изчислено по формулата:

ае средното линейно отклонение,

х- анализирания показател, с тире отгоре - средната стойност на показателя,

не броят на стойностите в анализирания набор от данни,

операторът за сумиране, надявам се, не плаши никого.

Средното линейно отклонение, изчислено с помощта на посочената формула, отразява средното абсолютно отклонение от средната стойност за тази популация.

Червената линия на снимката е средната стойност. Отклоненията на всяко наблюдение от средната стойност са обозначени с малки стрелки. Те се събират по модул и се сумират. След това всичко се разделя на броя на стойностите.

За да бъде пълна картината, трябва да се даде още един пример. Да кажем, че има фирма, която произвежда изрезки за лопати. Всеки резник трябва да е дълъг 1,5 метра, но по-важното е, че всички трябва да са еднакви или поне плюс-минус 5 см. Но небрежните работници ще отрежат 1,2 м, след това 1,8 м. . Директорът на фирмата решава да направи статистически анализ на дължината на изрезките. Избрах 10 парчета и измерих дължината им, намерих средната стойност и изчислих средното линейно отклонение. Средната стойност се оказа точно - 1,5 м. Но средното линейно отклонение се оказа 0,16 м. Така се оказва, че всеки резник е по-дълъг или по-къс от необходимото средно с 16 см. Има какво да се говори с работници. Всъщност не съм виждал реалното използване на този индикатор, така че сам измислих пример. В статистиката обаче има такъв показател.

дисперсия

Подобно на средното линейно отклонение, дисперсията също отразява степента, до която данните се разпространяват около средната стойност.

Формулата за изчисляване на дисперсията изглежда така:

(за вариационни серии (претеглена дисперсия))

(за негрупирани данни (проста вариация))

Където: σ 2 - дисперсия, Xi– анализираме показателя sq (стойност на характеристиката), – средната стойност на индикатора, f i – броят на стойностите в анализирания набор от данни.

Дисперсията е средният квадрат на отклоненията.

Първо се изчислява средната стойност, след това се взема разликата между всяка базова линия и средната стойност, повдига се на квадрат, умножава се по честотата на съответната стойност на характеристиката, добавя се и след това се разделя на броя на стойностите в популацията.

Въпреки това, в чиста форма, като например средно аритметично или индекс, дисперсията не се използва. Това е по-скоро спомагателен и междинен показател, който се използва за други видове статистически анализи.

Опростен начин за изчисляване на дисперсията

стандартно отклонение

За да се използва дисперсията за анализ на данни, от нея се взема квадратен корен. Оказва се т.нар стандартно отклонение.

Между другото, стандартното отклонение се нарича още сигма - от гръцката буква, която го обозначава.

Стандартното отклонение очевидно също характеризира мярката за дисперсия на данните, но сега (за разлика от дисперсията) може да се сравни с оригиналните данни. По правило средноквадратичните показатели в статистиката дават по-точни резултати от линейните. Следователно стандартното отклонение е по-точна мярка за разсейването на данните от средното линейно отклонение.

Инструкция

Нека има няколко числа, характеризиращи - или еднородни количества. Например резултатите от измервания, претегляния, статистически наблюдения и др. Всички представени количества трябва да бъдат измерени с една и съща мярка. За да намерите стандартното отклонение, направете следното.

Определете средната аритметична стойност на всички числа: добавете всички числа и разделете сумата на общия брой числа.

Определете дисперсията (разсейването) на числата: съберете квадратите на откритите по-рано отклонения и разделете получената сума на броя на числата.

В отделението има седем пациенти с температура 34, 35, 36, 37, 38, 39 и 40 градуса по Целзий.

Необходимо е да се определи средното отклонение от средното.
Решение:
"в отделение": (34+35+36+37+38+39+40)/7=37 ºС;

Температурни отклонения от средната (в този случай нормалната стойност): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, оказва се: -3, -2, -1 , 0, 1, 2, 3 (ºС);

Разделете сумата от числата, получени по-рано, на техния брой. За точност на изчислението е по-добре да използвате калкулатор. Резултатът от делението е средноаритметичното на събираемите.

Обърнете специално внимание на всички етапи на изчислението, тъй като грешка в поне едно от изчисленията ще доведе до неправилен краен индикатор. Проверете получените изчисления на всеки етап. Средната аритметична стойност има същия метър като сумите на числата, тоест, ако определите средната посещаемост, тогава всички показатели ще бъдат „човек“.

Този метод на изчисление се използва само при математически и статистически изчисления. Така например средноаритметичната стойност в компютърните науки има различен алгоритъм за изчисление. Средноаритметичното е много условен показател. Показва вероятността от събитие, при условие че има само един фактор или индикатор. За най-задълбочен анализ трябва да се вземат предвид много фактори. За това се използва изчисляването на по-общи количества.

Средната аритметична стойност е една от мерките на централната тенденция, широко използвана в математиката и статистическите изчисления. Намирането на средната аритметична стойност на няколко стойности е много проста, но всяка задача има свои собствени нюанси, които просто е необходимо да знаете, за да извършите правилни изчисления.

Количествени резултати от такива експерименти.

Как да намерим средното аритметично

Търсенето на средната аритметична стойност за масив от числа трябва да започне с определяне на алгебричната сума на тези стойности. Например, ако масивът съдържа числата 23, 43, 10, 74 и 34, тогава тяхната алгебрична сума ще бъде 184. При запис средноаритметичното се означава с буквата μ (mu) или x (x с черта) . След това алгебричната сума трябва да бъде разделена на броя на числата в масива. В този пример имаше пет числа, така че средноаритметичната стойност ще бъде 184/5 и ще бъде 36,8.

Характеристики на работа с отрицателни числа

Ако в масива има отрицателни числа, тогава средноаритметичната стойност се намира с помощта на подобен алгоритъм. Разлика има само при пресмятане в среда за програмиране или ако има допълнителни условия в задачата. В тези случаи намирането на средноаритметичното на числа с различни знаци се свежда до три стъпки:

1. Намиране на общото средно аритметично по стандартния метод;
2. Намиране на средно аритметично на отрицателни числа.
3. Изчисляване на средно аритметично на положителни числа.

Отговорите на всяко от действията се изписват разделени със запетаи.

Естествени и десетични дроби

Ако масивът от числа е представен с десетични дроби, решението се извършва по метода за изчисляване на средноаритметичното на цели числа, но резултатът се редуцира според изискванията на задачата за точността на отговора.

Когато работите с естествени дроби, те трябва да бъдат приведени до общ знаменател, който се умножава по броя на числата в масива. Числителят на отговора ще бъде сумата от дадените числители на оригиналните дробни елементи.

дисперсия. Стандартно отклонение

дисперсияе средната аритметична стойност на квадратните отклонения на всяка стойност на характеристиката от общата средна стойност. В зависимост от изходните данни дисперсията може да бъде непретеглена (проста) или претеглена.

Дисперсията се изчислява по следните формули:

за негрупирани данни

за групирани данни

Процедурата за изчисляване на претеглената дисперсия:

1. определяне на среднопретеглената аритметична стойност

2. Определят се вариантни отклонения от средната стойност

3. повдигнете на квадрат отклонението на всяка опция от средната стойност

4. умножете отклоненията на квадрат по тегла (честоти)

5. обобщава получените работи

6. получената сума се разделя на сумата от теглата

Формулата за определяне на дисперсията може да се преобразува в следната формула:

- просто

Процедурата за изчисляване на дисперсията е проста:

1. определям средноаритметичното

2. повдигнете на квадрат средното аритметично

3. квадрат всеки ред опция

4. опция за намиране на сумата от квадрати

5. разделете сумата от квадратите на опцията на техния брой, т.е. определяне на средния квадрат

6. определете разликата между средния квадрат на характеристиката и квадрата на средната стойност

Също така формулата за определяне на претеглената дисперсия може да се преобразува в следната формула:

тези. дисперсията е равна на разликата между средната стойност на квадратите на стойностите на характеристиките и квадрата на средната аритметична стойност. Когато се използва трансформираната формула, се изключва допълнителна процедура за изчисляване на отклоненията на отделните стойности на характеристика от x и се изключва грешка в изчислението, свързана с отклонения на закръгляване

Дисперсията има редица свойства, някои от които улесняват изчисляването:

1) дисперсията на постоянна стойност е нула;

2) ако всички варианти на стойностите на атрибута са намалени с едно и също число, тогава дисперсията няма да намалее;

3) ако всички варианти на стойностите на атрибута са намалени с еднакъв брой пъти (пъти), тогава дисперсията ще намалее с фактор

Стандартно отклонение S- е корен квадратен от дисперсията:

За негрупирани данни:

;

За вариационна серия:

Диапазонът на вариация, средното линейно и средното квадратно отклонение са именувани величини. Те имат същите мерни единици като индивидуалните характеристични стойности.

Дисперсията и стандартното отклонение са най-широко използваните мерки за вариация. Това се обяснява с факта, че те са включени в повечето теореми на теорията на вероятностите, която служи като основа на математическата статистика. В допълнение, дисперсията може да бъде разложена на нейните съставни елементи, което позволява да се оцени влиянието на различни фактори, които причиняват вариацията на даден признак.

Изчисляването на вариационните показатели за банките, групирани по печалба, е показано в таблицата.

Печалба, милиони рубли Брой банки изчислени показатели
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Обща сума: 121,70 17,640 23,126

Средното линейно и средно квадратично отклонение показват до каква степен стойността на атрибута варира средно за изследваните единици и популацията. Така че в този случай средната стойност на колебанието в размера на печалбата е: според средното линейно отклонение 0,882 милиона рубли; според стандартното отклонение - 1,075 милиона рубли. Стандартното отклонение винаги е по-голямо от средното линейно отклонение. Ако разпределението на признака е близко до нормалното, тогава има връзка между S и d: S=1.25d, или d=0.8S. Стандартното отклонение показва как по-голямата част от единиците на съвкупността са разположени спрямо средната аритметична стойност. Независимо от формата на разпределение, 75 стойности на атрибута попадат в интервала x 2S и най-малко 89 от всички стойности попадат в интервала x 3S (теорема на P.L. Chebyshev).

Математическо очакване и дисперсия

Нека измерим една случайна променлива нпъти, например, измерваме скоростта на вятъра десет пъти и искаме да намерим средната стойност. Как е свързана средната стойност с функцията на разпределение?

Ще хвърлим заровете голям брой пъти. Броят на точките, които ще паднат на зара по време на всяко хвърляне, е произволна променлива и може да приеме всякакви естествени стойности от 1 до 6. нклони към едно много конкретно число – математическото очакване Mx. В такъв случай Mx = 3,5.

Как се появи тази стойност? Нека влезе нТестовете веднъж отпаднаха 1 точка, веднъж - 2 точки и т.н. Тогава н→ ∞ броят резултати, при които е паднала една точка, По същия начин От тук

Модел 4.5. Зарове

Нека сега приемем, че знаем закона за разпределение на случайната променлива х, тоест знаем, че случайната променлива хможе да приема стойности х 1 , х 2 , ..., x kс вероятности стр 1 , стр 2 , ..., p k.

Очаквана стойност Mxслучайна величина хравно на:

Отговор. 2,8.

Математическото очакване не винаги е разумна оценка на някаква случайна променлива. Така че, за да се оцени средната заплата, е по-разумно да се използва концепцията за медианата, тоест такава стойност, че броят на хората, които получават по-малко от средната заплата и повече, е еднакъв.

Медианаслучайна променлива се нарича число х 1/2 така че стр (х < х 1/2) = 1/2.

С други думи, вероятността стр 1, че случайната променлива хще бъде по-малко х 1/2 и вероятността стр 2, че случайна променлива хще бъде по-голяма х 1/2 са еднакви и равни на 1/2. Медианата не е еднозначно определена за всички разпределения.

Обратно към случайната променлива х, които могат да приемат стойностите х 1 , х 2 , ..., x kс вероятности стр 1 , стр 2 , ..., p k.

дисперсияслучайна величина хе средната стойност на квадрата на отклонението на случайна променлива от нейното математическо очакване:

Пример 2

При условията на предишния пример изчислете дисперсията и стандартното отклонение на случайна променлива х.

Отговор. 0,16, 0,4.

Модел 4.6. стрелба по мишена

Пример 3

Намерете вероятностното разпределение на броя точки, хвърлени на зара от първото хвърляне, медианата, математическото очакване, дисперсията и стандартното отклонение.

Отпадането на всяко лице е еднакво вероятно, така че разпределението ще изглежда така:

Стандартно отклонение Вижда се, че отклонението на стойността от средната стойност е много голямо.

Свойства на математическото очакване:

  • Математическото очакване на сумата от независими случайни променливи е равно на сумата от техните математически очаквания:

Пример 4

Намерете математическото очакване на сбора и произведението на точките, хвърлени на два зара.

В пример 3 открихме, че за един куб М (х) = 3,5. И така за две кубчета

Дисперсионни свойства:

  • Дисперсията на сумата от независими случайни променливи е равна на сумата от дисперсиите:

D x + г = D x + Dy.

Нека за нхвърляне на зарове гточки. Тогава

Този резултат не е верен само за хвърляния на зарове. В много случаи той определя точността на емпиричното измерване на математическото очакване. Вижда се, че с увеличаване на броя на измерванията нразпространението на стойностите около средната стойност, тоест стандартното отклонение, намалява пропорционално

Дисперсията на случайна променлива е свързана с математическото очакване на квадрата на тази случайна променлива чрез следната връзка:

Нека намерим математическите очаквания на двете части на това равенство. A-приори,

Математическото очакване на дясната страна на равенството, според свойството на математическите очаквания, е равно на

Стандартно отклонение

стандартно отклонениее равно на корен квадратен от дисперсията:
При определяне на стандартното отклонение за достатъчно голям обем от изследваната популация (n> 30) се използват следните формули:

Подобна информация.