Биографии Характеристики Анализ

Пример за формула за стандартно отклонение. стандартно отклонение

Инструкция

Нека има няколко числа, характеризиращи - или еднородни количества. Например резултатите от измервания, претегляния, статистически наблюдения и др. Всички представени количества трябва да бъдат измерени с една и съща мярка. За да намерите стандартното отклонение, направете следното.

Определете средната аритметична стойност на всички числа: добавете всички числа и разделете сумата на общия брой числа.

Определете дисперсията (разсейването) на числата: съберете квадратите на откритите по-рано отклонения и разделете получената сума на броя на числата.

В отделението има седем пациенти с температура 34, 35, 36, 37, 38, 39 и 40 градуса по Целзий.

Необходимо е да се определи средното отклонение от средното.
Решение:
"в отделение": (34+35+36+37+38+39+40)/7=37 ºС;

Температурни отклонения от средната (в този случай нормалната стойност): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, оказва се: -3, -2, -1 , 0, 1, 2, 3 (ºС);

Разделете сумата от числата, получени по-рано, на техния брой. За точност на изчислението е по-добре да използвате калкулатор. Резултатът от делението е средноаритметичното на събираемите.

Обърнете специално внимание на всички етапи на изчислението, тъй като грешка в поне едно от изчисленията ще доведе до неправилен краен индикатор. Проверете получените изчисления на всеки етап. Средната аритметична стойност има същия метър като сумите на числата, тоест, ако определите средната посещаемост, тогава всички показатели ще бъдат „човек“.

Този метод на изчисление се използва само при математически и статистически изчисления. Така например средноаритметичната стойност в компютърните науки има различен алгоритъм за изчисление. Средноаритметичното е много условен показател. Показва вероятността от събитие, при условие че има само един фактор или индикатор. За най-задълбочен анализ трябва да се вземат предвид много фактори. За това се използва изчисляването на по-общи количества.

Средната аритметична стойност е една от мерките на централната тенденция, широко използвана в математиката и статистическите изчисления. Намирането на средната аритметична стойност на няколко стойности е много проста, но всяка задача има свои собствени нюанси, които просто е необходимо да знаете, за да извършите правилни изчисления.

Количествени резултати от такива експерименти.

Как да намерим средното аритметично

Търсенето на средната аритметична стойност за масив от числа трябва да започне с определяне на алгебричната сума на тези стойности. Например, ако масивът съдържа числата 23, 43, 10, 74 и 34, тогава тяхната алгебрична сума ще бъде 184. При запис средноаритметичното се означава с буквата μ (mu) или x (x с черта) . След това алгебричната сума трябва да бъде разделена на броя на числата в масива. В този пример имаше пет числа, така че средноаритметичната стойност ще бъде 184/5 и ще бъде 36,8.

Характеристики на работа с отрицателни числа

Ако в масива има отрицателни числа, тогава средноаритметичната стойност се намира с помощта на подобен алгоритъм. Разлика има само при пресмятане в среда за програмиране или ако има допълнителни условия в задачата. В тези случаи намирането на средноаритметичното на числа с различни знаци се свежда до три стъпки:

1. Намиране на общото средно аритметично по стандартния метод;
2. Намиране на средно аритметично на отрицателни числа.
3. Изчисляване на средно аритметично на положителни числа.

Отговорите на всяко от действията се изписват разделени със запетаи.

Естествени и десетични дроби

Ако масивът от числа е представен с десетични дроби, решението се извършва по метода за изчисляване на средната аритметична стойност на цели числа, но резултатът се редуцира според изискванията на задачата за точността на отговора.

Когато работите с естествени дроби, те трябва да бъдат приведени до общ знаменател, който се умножава по броя на числата в масива. Числителят на отговора ще бъде сумата от дадените числители на оригиналните дробни елементи.

При статистическа проверка на хипотези, при измерване на линейна връзка между случайни величини.

Стандартно отклонение:

Стандартно отклонение(оценка на стандартното отклонение на случайната променлива Под, стени около нас и таван, хспрямо неговото математическо очакване въз основа на безпристрастна оценка на неговата дисперсия):

където - дисперсия; - Подът, стените около нас и таванът, аз-ти примерен елемент; - размер на извадката; - средно аритметично от извадката:

Трябва да се отбележи, че и двете оценки са пристрастни. В общия случай е невъзможно да се изгради безпристрастна оценка. Въпреки това, оценка, базирана на безпристрастна оценка на дисперсията, е последователна.

правило три сигма

правило три сигма() - почти всички стойности на нормално разпределена случайна променлива лежат в интервала. По-стриктно - с не по-малко от 99,7% сигурност, стойността на нормално разпределена случайна променлива се намира в посочения интервал (при условие, че стойността е вярна, а не е получена в резултат на обработка на извадката).

Ако истинската стойност е неизвестна, тогава трябва да използвате не, а пода, стените около нас и тавана, с. Така правилото на трите сигми се превежда в правилото на трите етажа, стените около нас и тавана, с .

Интерпретация на стойността на стандартното отклонение

Голяма стойност на стандартното отклонение показва голямо разпространение на стойностите в представения набор със средната стойност на набора; малка стойност, съответно, показва, че стойностите в набора са групирани около средната стойност.

Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). И трите набора имат средни стойности от 7 и стандартни отклонения съответно от 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият набор има най-голямата стойност на стандартното отклонение - стойностите в рамките на набора силно се отклоняват от средната стойност.

В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на серия от последователни измервания на някаква величина. Тази стойност е много важна за определяне на правдоподобността на изследваното явление в сравнение със стойността, предвидена от теорията: ако средната стойност на измерванията е много различна от стойностите, предвидени от теорията (голямо стандартно отклонение), тогава получените стойности или методът за получаването им трябва да бъдат проверени отново.

Практическа употреба

На практика стандартното отклонение ви позволява да определите колко стойностите в набора могат да се различават от средната стойност.

Климат

Да предположим, че има два града с една и съща средна дневна максимална температура, но единият е разположен на брега, а другият е във вътрешността. Известно е, че крайбрежните градове имат много различни дневни максимални температури, по-ниски от градовете във вътрешността. Следователно стандартното отклонение на максималните дневни температури в крайбрежния град ще бъде по-малко, отколкото във втория град, въпреки че имат еднаква средна стойност на тази стойност, което на практика означава, че вероятността максималната температура на въздуха на всеки конкретен ден от годината ще се различава по-силно от средната стойност, по-висока за град, разположен вътре в континента.

спорт

Да приемем, че има няколко футболни отбора, които са класирани според някакъв набор от параметри, например брой отбелязани и допуснати голове, положения за гол и т.н. Най-вероятно е най-добрият отбор в тази група да има най-добри стойности в повече параметри. Колкото по-малко е стандартното отклонение на отбора за всеки от представените параметри, толкова по-предвидим е резултатът на отбора, такива отбори са балансирани. От друга страна, отбор с голямо стандартно отклонение трудно може да предвиди резултата, което от своя страна се обяснява с дисбаланс, например силна защита, но слабо нападение.

Използването на стандартното отклонение на параметрите на отбора позволява до известна степен да се предвиди резултатът от мача между два отбора, като се оценят силните и слабите страни на отборите, а оттам и избраните методи на борба.

Технически анализ

Вижте също

Литература

* Боровиков, В.СТАТИСТИКА. Изкуството на компютърния анализ на данни: За професионалисти / В. Боровиков. - Санкт Петербург. : Петър, 2003. - 688 с. - ISBN 5-272-00078-1.

Дефинира се като обобщаваща характеристика на размера на вариацията на даден признак в съвкупността. Тя е равна на корен квадратен от средната квадратна стойност на отклоненията на отделните стойности на признака от средната аритметична, т.е. коренът на и може да се намери така:

1. За основния ред:

2. За вариационна серия:

Трансформацията на формулата за стандартно отклонение я води до форма, по-удобна за практически изчисления:

Стандартно отклонениеопределя колко средно се отклоняват конкретни опции от средната им стойност и освен това е абсолютна мярка за флуктуацията на чертата и се изразява в същите единици като опциите и следователно се интерпретира добре.

Примери за намиране на стандартното отклонение: ,

За алтернативни функции формулата за стандартното отклонение изглежда така:

където p е делът на единиците в популацията, които имат определен атрибут;

q - делът на единиците, които нямат тази характеристика.

Концепцията за средно линейно отклонение

Средно линейно отклонениесе определя като средноаритметично от абсолютните стойности на отклоненията на отделните опции от .

1. За основния ред:

2. За вариационна серия:

където сумата от n е сумата от честотите на вариационните серии.

Пример за намиране на средното линейно отклонение:

Предимството на средното абсолютно отклонение като мярка за дисперсия в диапазона на вариация е очевидно, тъй като тази мярка се основава на отчитане на всички възможни отклонения. Но този индикатор има значителни недостатъци. Произволното отхвърляне на алгебрични знаци за отклонения може да доведе до факта, че математическите свойства на този индикатор далеч не са елементарни. Това значително усложнява използването на средното абсолютно отклонение при решаването на задачи, свързани с вероятностни изчисления.

Поради това средното линейно отклонение като мярка за вариацията на даден признак рядко се използва в статистическата практика, а именно когато сумирането на показателите без отчитане на знаците има икономически смисъл. С негова помощ се анализират например оборотът на външната търговия, съставът на заетите, ритъмът на производство и др.

корен квадратен

Приложено RMS, например за изчисляване на средния размер на страните на n квадратни сечения, средните диаметри на стволове, тръби и др. Разделя се на два вида.

Средноквадратичният корен е прост. Ако при замяна на отделни стойности на черта със средна стойност е необходимо да се запази сумата от квадратите на първоначалните стойности непроменена, тогава средната стойност ще бъде квадратична средна стойност.

Това е корен квадратен от частното от сбора на квадратите на отделните стойности на характеристиките, разделен на техния брой:

Средноквадратичното тегло се изчислява по формулата:

където f е знак за тегло.

Среден куб

Приложен среден куб, например при определяне на средната дължина на страната и кубовете. Разделя се на два вида.
Средна кубична проста:

При изчисляване на средните стойности и дисперсията в серията на интервалното разпределение, истинските стойности на атрибута се заменят с централните стойности на интервалите, които са различни от средното аритметично на стойностите, включени в интервал. Това води до систематична грешка при изчисляването на дисперсията. V.F. Шепард определи това грешка в изчисляването на дисперсията, причинено от прилагането на групираните данни, е 1/12 от квадрата на стойността на интервала, както нагоре, така и надолу в големината на дисперсията.

Поправката на Шепардтрябва да се използва, ако разпределението е близко до нормалното, отнася се до характеристика с непрекъснат характер на вариация, изградена върху значително количество първоначални данни (n> 500). Въпреки това, въз основа на факта, че в редица случаи и двете грешки, действащи в различни посоки, се компенсират взаимно, понякога е възможно да се откаже въвеждането на изменения.

Колкото по-малки са дисперсията и стандартното отклонение, толкова по-хомогенна е популацията и толкова по-типична ще бъде средната стойност.
В практиката на статистиката често се налага да се сравняват вариации на различни характеристики. Например, от голям интерес е да се сравнят вариациите във възрастта на работниците и тяхната квалификация, трудовия стаж и заплатите, разходите и печалбата, трудовия стаж и производителността на труда и др. За такива сравнения показателите за абсолютна променливост на характеристиките са неподходящи: невъзможно е да се сравни променливостта на трудовия опит, изразена в години, с промяната на заплатите, изразена в рубли.

За извършване на такива сравнения, както и сравнения на флуктуацията на един и същ признак в няколко съвкупности с различна средна аритметична стойност, се използва относителен показател за вариация - коефициентът на вариация.

Структурни средни

За да се характеризира централната тенденция в статистическите разпределения, често е рационално да се използва, заедно със средната аритметична стойност, определена стойност на атрибута X, който поради определени характеристики на местоположението му в серията на разпределение може да характеризира нивото му.

Това е особено важно, когато екстремните стойности на характеристиката в серията на разпространение имат размити граници. В тази връзка точното определяне на средната аритметична стойност по правило е невъзможно или много трудно. В такива случаи средното ниво може да се определи, като се вземе например стойността на характеристиката, която се намира в средата на честотната серия или която се среща най-често в текущата серия.

Такива стойности зависят само от естеството на честотите, т.е. от структурата на разпределението. Те са типични по отношение на местоположението в честотната серия, поради което такива стойности се считат за характеристики на разпределителния център и следователно са определени като структурни средни. Те се използват за изследване на вътрешната структура и структурата на серията от разпределение на стойностите на атрибутите. Тези показатели включват.

Един от основните инструменти на статистическия анализ е изчисляването на стандартното отклонение. Този индикатор ви позволява да направите оценка на стандартното отклонение за извадка или за общата съвкупност. Нека научим как да използваме формулата за стандартно отклонение в Excel.

Нека веднага да определим какво е стандартното отклонение и как изглежда неговата формула. Тази стойност е корен квадратен от средната аритметична стойност на квадратите на разликата между всички стойности на серията и тяхната средна аритметична стойност. Има идентично наименование за този показател - стандартно отклонение. И двете имена са напълно равностойни.

Но, разбира се, в Excel потребителят не трябва да изчислява това, тъй като програмата прави всичко за него. Нека научим как да изчисляваме стандартното отклонение в Excel.

Изчисляване в Excel

Можете да изчислите посочената стойност в Excel с помощта на две специални функции STDEV.B(по образец) и STDEV.G(според общата съвкупност). Принципът на тяхното действие е абсолютно същият, но те могат да бъдат извикани по три начина, които ще разгледаме по-долу.

Метод 1: Съветник за функции


Метод 2: Раздел Формули


Метод 3: Ръчно въвеждане на формулата

Има и начин, при който изобщо не е необходимо да извиквате прозореца на аргументите. За да направите това, въведете формулата ръчно.


Както можете да видите, механизмът за изчисляване на стандартното отклонение в Excel е много прост. Потребителят трябва само да въведе числа от населението или връзки към клетки, които ги съдържат. Всички изчисления се извършват от самата програма. Много по-трудно е да се разбере какъв е изчисленият показател и как резултатите от изчислението могат да се приложат на практика. Но разбирането на това вече принадлежи повече към сферата на статистиката, отколкото към обучението как да работите със софтуер.

В тази статия ще говоря за как да намерите стандартното отклонение. Този материал е изключително важен за пълното разбиране на математиката, така че учителят по математика трябва да отдели отделен урок или дори няколко за изучаването му. В тази статия ще намерите връзка към подробен и разбираем видео урок, който обяснява какво е стандартното отклонение и как да го намерите.

стандартно отклонениедава възможност да се оцени разпространението на стойностите, получени в резултат на измерване на определен параметър. Обозначава се със символ (гръцката буква "сигма").

Формулата за изчисление е доста проста. За да намерите стандартното отклонение, трябва да вземете корен квадратен от дисперсията. Така че сега трябва да попитате „Какво е дисперсия?“

Какво е дисперсия

Определението за дисперсия е следното. Дисперсията е средната аритметична стойност на квадратните отклонения на стойностите от средната стойност.

За да намерите дисперсията, извършете следните изчисления последователно:

  • Определете средната стойност (проста средна аритметична стойност на поредица от стойности).
  • След това извадете средната стойност от всяка от стойностите и повдигнете получената разлика на квадрат (получихме разлика на квадрат).
  • Следващата стъпка е да изчислим средноаритметичната стойност на квадратите на получените разлики (Можете да разберете защо са точно квадратите по-долу).

Нека разгледаме един пример. Да приемем, че вие ​​и вашите приятели решите да измерите височината на вашите кучета (в милиметри). В резултат на измерванията получихте следните измервания на височината (при холката): 600 mm, 470 mm, 170 mm, 430 mm и 300 mm.

Нека изчислим средната стойност, дисперсията и стандартното отклонение.

Нека първо намерим средната стойност. Както вече знаете, за това трябва да добавите всички измерени стойности и да ги разделите на броя на измерванията. Напредък на изчислението:

Средно мм.

И така, средната (средноаритметична) е 394 mm.

Сега трябва да дефинираме отклонение на височината на всяко от кучетата от средната:

накрая за изчисляване на дисперсията, всяка от получените разлики се повдига на квадрат и след това намираме средноаритметичното на получените резултати:

Дисперсия mm 2 .

Така дисперсията е 21704 mm 2 .

Как да намерите стандартното отклонение

И така, как сега да изчислим стандартното отклонение, знаейки дисперсията? Както помним, вземете корен квадратен от това. Тоест стандартното отклонение е:

mm (закръглено до най-близкото цяло число в mm).

Използвайки този метод, открихме, че някои кучета (напр. ротвайлери) са много големи кучета. Но има и много малки кучета (например дакели, но не трябва да им казвате това).

Най-интересното е, че стандартното отклонение носи полезна информация. Сега можем да покажем кои от получените резултати от измерването на растежа са в интервала, който получаваме, ако отделим от средното (от двете му страни) стандартното отклонение.

Тоест, използвайки стандартното отклонение, получаваме „стандартен“ метод, който ви позволява да разберете коя от стойностите е нормална (статистическа средна) и коя е изключително голяма или, обратно, малка.

Какво е стандартно отклонение

Но ... нещата ще бъдат малко по-различни, ако анализираме вземане на пробиданни. В нашия пример разгледахме общото население.Тоест нашите 5 кучета бяха единствените кучета в света, които ни интересуваха.

Но ако данните са извадка (стойности, избрани от голяма популация), тогава изчисленията трябва да се направят по различен начин.

Ако има стойности, тогава:

Всички други изчисления се правят по същия начин, включително определянето на средната стойност.

Например, ако нашите пет кучета са само извадка от популация от кучета (всички кучета на планетата), трябва да разделим на 4 вместо 5а именно:

Дисперсия на извадката = mm 2 .

В този случай стандартното отклонение за извадката е равно на mm (закръглено до най-близкото цяло число).

Можем да кажем, че направихме известна "корекция" в случай, че нашите стойности са само малка извадка.

Забележка. Защо точно квадратите на разликите?

Но защо вземаме квадратите на разликите, когато изчисляваме дисперсията? Да приемем, че при измерване на някакъв параметър сте получили следния набор от стойности: 4; четири; -четири; -четири. Ако просто добавим абсолютните отклонения от средната стойност (разликата) помежду си ... отрицателните стойности се компенсират с положителни:

.

Оказва се, че тази опция е безполезна. Тогава може би си струва да опитате абсолютните стойности на отклоненията (т.е. модулите на тези стойности)?

На пръв поглед се оказва, че не е лошо (резултантната стойност, между другото, се нарича средно абсолютно отклонение), но не във всички случаи. Нека опитаме друг пример. Нека резултатът от измерването е следният набор от стойности: 7; един; -6; -2. Тогава средното абсолютно отклонение е:

по дяволите! Отново получихме резултат 4, въпреки че разликите са с много по-голям спред.

Сега нека видим какво се случва, ако повдигнем на квадрат разликите (и след това извадим корен квадратен от тяхната сума).

За първия пример получавате:

.

За втория пример получавате:

Сега е съвсем друг въпрос! Средноквадратичното отклонение е толкова по-голямо, колкото по-голямо е разпространението на разликите ... към което се стремихме.

Всъщност този метод използва същата идея като при изчисляване на разстоянието между точките, само че се прилага по различен начин.

И от математическа гледна точка използването на квадрати и квадратни корени е по-полезно, отколкото бихме могли да получим на базата на абсолютните стойности на отклоненията, поради което стандартното отклонение е приложимо към други математически проблеми.

Сергей Валериевич ви каза как да намерите стандартното отклонение