Биографии Характеристики Анализ

Изчисляване на стандартното отклонение. Как да намерите стандартното отклонение

При статистическа проверка на хипотези, при измерване на линейна връзка между случайни величини.

Стандартно отклонение:

Стандартно отклонение(оценка на стандартното отклонение на случайната променлива Под, стени около нас и таван, хспрямо неговото математическо очакване въз основа на безпристрастна оценка на неговата дисперсия):

където - дисперсия; - Подът, стените около нас и таванът, аз-ти примерен елемент; - размер на извадката; - средно аритметично от извадката:

Трябва да се отбележи, че и двете оценки са пристрастни. В общия случай е невъзможно да се изгради безпристрастна оценка. Въпреки това, оценка, базирана на безпристрастна оценка на дисперсията, е последователна.

правило три сигма

правило три сигма() - почти всички стойности на нормално разпределена случайна променлива лежат в интервала. По-стриктно - с не по-малко от 99,7% сигурност, стойността на нормално разпределена случайна променлива се намира в посочения интервал (при условие, че стойността е вярна, а не е получена в резултат на обработка на извадката).

Ако истинската стойност е неизвестна, тогава трябва да използвате не, а пода, стените около нас и тавана, с. Така правилото на трите сигми се превежда в правилото на трите етажа, стените около нас и тавана, с .

Интерпретация на стойността на стандартното отклонение

Голяма стойност на стандартното отклонение показва голямо разпространение на стойностите в представения набор със средната стойност на набора; малка стойност, съответно, показва, че стойностите в набора са групирани около средната стойност.

Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). И трите набора имат средни стойности от 7 и стандартни отклонения съответно от 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият набор има най-голямата стойност на стандартното отклонение - стойностите в рамките на набора силно се отклоняват от средната стойност.

В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на серия от последователни измервания на някаква величина. Тази стойност е много важна за определяне на правдоподобността на изследваното явление в сравнение със стойността, предвидена от теорията: ако средната стойност на измерванията е много различна от стойностите, предвидени от теорията (голямо стандартно отклонение), тогава получените стойности или методът за получаването им трябва да бъдат проверени отново.

Практическа употреба

На практика стандартното отклонение ви позволява да определите колко стойностите в набора могат да се различават от средната стойност.

Климат

Да предположим, че има два града с една и съща средна дневна максимална температура, но единият е разположен на брега, а другият е във вътрешността. Известно е, че крайбрежните градове имат много различни дневни максимални температури, по-ниски от градовете във вътрешността. Следователно стандартното отклонение на максималните дневни температури в крайбрежния град ще бъде по-малко, отколкото във втория град, въпреки че имат еднаква средна стойност на тази стойност, което на практика означава, че вероятността максималната температура на въздуха на всеки конкретен ден от годината ще се различава по-силно от средната стойност, по-висока за град, разположен вътре в континента.

спорт

Да приемем, че има няколко футболни отбора, които са класирани според някакъв набор от параметри, например брой отбелязани и допуснати голове, положения за гол и т.н. Най-вероятно е най-добрият отбор в тази група да има най-добри стойности в повече параметри. Колкото по-малко е стандартното отклонение на отбора за всеки от представените параметри, толкова по-предвидим е резултатът на отбора, такива отбори са балансирани. От друга страна, отбор с голямо стандартно отклонение трудно може да предвиди резултата, което от своя страна се обяснява с дисбаланс, например силна защита, но слабо нападение.

Използването на стандартното отклонение на параметрите на отбора позволява до известна степен да се предвиди резултатът от мача между два отбора, като се оценят силните и слабите страни на отборите, а оттам и избраните методи на борба.

Технически анализ

Вижте също

Литература

* Боровиков, В.СТАТИСТИКА. Изкуството на компютърния анализ на данни: За професионалисти / В. Боровиков. - Санкт Петербург. : Петър, 2003. - 688 с. - ISBN 5-272-00078-1.

Според извадковото проучване вложителите са групирани според размера на депозита в Сбербанк на града:

Определете:

1) диапазон на вариация;

2) среден размер на депозита;

3) средно линейно отклонение;

4) дисперсия;

5) стандартно отклонение;

6) коефициент на вариация на вноските.

Решение:

Тази серия на разпределение съдържа отворени интервали. В такива серии стойността на интервала от първата група условно се приема за равна на стойността на интервала от следващата, а стойността на интервала от последната група е равна на стойността на интервала от предишната един.

Стойността на интервала на втората група е 200, следователно стойността на първата група също е 200. Стойността на интервала на предпоследната група е 200, което означава, че последният интервал също ще има стойност, равна на 200.

1) Дефинирайте диапазона на вариация като разликата между най-голямата и най-малката стойност на атрибута:

Диапазонът на вариация на размера на вноската е 1000 рубли.

2) Средният размер на вноската се определя по формулата на средноаритметично претеглената стойност.

Нека предварително определим дискретната стойност на атрибута във всеки интервал. За да направим това, използвайки простата формула за средна аритметична стойност, намираме средните точки на интервалите.

Средната стойност на първия интервал ще бъде равна на:

второто - 500 и т.н.

Нека поставим резултатите от изчисленията в таблицата:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Обща сума 400 - 312000

Средният депозит в Сбербанк на града ще бъде 780 рубли:

3) Средното линейно отклонение е средната аритметична стойност на абсолютните отклонения на отделните стойности на атрибута от общата средна стойност:

Процедурата за изчисляване на средното линейно отклонение в серията на интервално разпределение е следната:

1. Средната аритметична претеглена стойност се изчислява, както е показано в параграф 2).

2. Определят се абсолютните отклонения на варианта от средната стойност:

3. Получените отклонения се умножават по честотите:

4. Сумата от претеглените отклонения се намира, без да се взема предвид знакът:

5. Сумата от претеглените отклонения се дели на сумата от честотите:

Удобно е да използвате таблицата с изчислени данни:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Обща сума 400 - - - 81280

Средното линейно отклонение на размера на депозита на клиентите на Сбербанк е 203,2 рубли.

4) Дисперсията е средноаритметичната стойност на квадратите на отклоненията на всяка стойност на характеристиката от средната аритметична стойност.

Изчисляването на дисперсията в серията на интервалното разпределение се извършва по формулата:

Процедурата за изчисляване на дисперсията в този случай е следната:

1. Определете среднопретеглената аритметична стойност, както е показано в параграф 2).

2. Намерете отклонения от средната стойност:

3. Поставяне на квадрат на отклонението на всяка опция от средната стойност:

4. Умножете отклоненията на квадрат по тегла (честоти):

5. Обобщете получените произведения:

6. Получената сума се разделя на сумата от теглата (честотите):

Нека поставим изчисленията в таблица:

Сума на депозита, разтривайте.Брой сътрудници, fСредата на интервала, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Обща сума 400 - - - 23040000

При статистическа проверка на хипотези, при измерване на линейна връзка между случайни величини.

Стандартно отклонение:

Стандартно отклонение(оценка на стандартното отклонение на случайната променлива Под, стени около нас и таван, хспрямо неговото математическо очакване въз основа на безпристрастна оценка на неговата дисперсия):

където - дисперсия; - Подът, стените около нас и таванът, аз-ти примерен елемент; - размер на извадката; - средно аритметично от извадката:

Трябва да се отбележи, че и двете оценки са пристрастни. В общия случай е невъзможно да се изгради безпристрастна оценка. Въпреки това, оценка, базирана на безпристрастна оценка на дисперсията, е последователна.

правило три сигма

правило три сигма() - почти всички стойности на нормално разпределена случайна променлива лежат в интервала. По-стриктно - с не по-малко от 99,7% сигурност, стойността на нормално разпределена случайна променлива се намира в посочения интервал (при условие, че стойността е вярна, а не е получена в резултат на обработка на извадката).

Ако истинската стойност е неизвестна, тогава трябва да използвате не, а пода, стените около нас и тавана, с. Така правилото на трите сигми се превежда в правилото на трите етажа, стените около нас и тавана, с .

Интерпретация на стойността на стандартното отклонение

Голяма стойност на стандартното отклонение показва голямо разпространение на стойностите в представения набор със средната стойност на набора; малка стойност, съответно, показва, че стойностите в набора са групирани около средната стойност.

Например, имаме три набора от числа: (0, 0, 14, 14), (0, 6, 8, 14) и (6, 6, 8, 8). И трите набора имат средни стойности от 7 и стандартни отклонения съответно от 7, 5 и 1. Последният набор има малко стандартно отклонение, тъй като стойностите в набора са групирани около средната стойност; първият набор има най-голямата стойност на стандартното отклонение - стойностите в рамките на набора силно се отклоняват от средната стойност.

В общ смисъл стандартното отклонение може да се счита за мярка за несигурност. Например във физиката стандартното отклонение се използва за определяне на грешката на серия от последователни измервания на някаква величина. Тази стойност е много важна за определяне на правдоподобността на изследваното явление в сравнение със стойността, предвидена от теорията: ако средната стойност на измерванията е много различна от стойностите, предвидени от теорията (голямо стандартно отклонение), тогава получените стойности или методът за получаването им трябва да бъдат проверени отново.

Практическа употреба

На практика стандартното отклонение ви позволява да определите колко стойностите в набора могат да се различават от средната стойност.

Климат

Да предположим, че има два града с една и съща средна дневна максимална температура, но единият е разположен на брега, а другият е във вътрешността. Известно е, че крайбрежните градове имат много различни дневни максимални температури, по-ниски от градовете във вътрешността. Следователно стандартното отклонение на максималните дневни температури в крайбрежния град ще бъде по-малко, отколкото във втория град, въпреки че имат еднаква средна стойност на тази стойност, което на практика означава, че вероятността максималната температура на въздуха на всеки конкретен ден от годината ще се различава по-силно от средната стойност, по-висока за град, разположен вътре в континента.

спорт

Да приемем, че има няколко футболни отбора, които са класирани според някакъв набор от параметри, например брой отбелязани и допуснати голове, положения за гол и т.н. Най-вероятно е най-добрият отбор в тази група да има най-добри стойности в повече параметри. Колкото по-малко е стандартното отклонение на отбора за всеки от представените параметри, толкова по-предвидим е резултатът на отбора, такива отбори са балансирани. От друга страна, отбор с голямо стандартно отклонение трудно може да предвиди резултата, което от своя страна се обяснява с дисбаланс, например силна защита, но слабо нападение.

Използването на стандартното отклонение на параметрите на отбора позволява до известна степен да се предвиди резултатът от мача между два отбора, като се оценят силните и слабите страни на отборите, а оттам и избраните методи на борба.

Технически анализ

Вижте също

Литература

* Боровиков, В.СТАТИСТИКА. Изкуството на компютърния анализ на данни: За професионалисти / В. Боровиков. - Санкт Петербург. : Петър, 2003. - 688 с. - ISBN 5-272-00078-1.

Провеждането на какъвто и да е статистически анализ е немислимо без изчисления. В тази статия ще разгледаме как да изчислим дисперсията, стандартното отклонение, коефициента на вариация и други статистически показатели в Excel.

Максимална и минимална стойност

Средно линейно отклонение

Средното линейно отклонение е средната стойност на абсолютните (по модул) отклонения от в анализирания набор от данни. Математическата формула изглежда така:

ае средното линейно отклонение,

х- анализиран показател,

Х- средната стойност на показателя,

н

В Excel тази функция се извиква SROTCL.

След като изберете функцията SIRT, ние определяме диапазона от данни, за който трябва да се извърши изчислението. Натиснете "OK".

дисперсия

(модул 111)

Може би не всеки знае какво е, така че ще обясня - това е мярка, която характеризира разпространението на данни около математическото очакване. Въпреки това обикновено има налична само извадка, така че се използва следната формула за отклонение:

s2е дисперсията на извадката, изчислена от данни от наблюдения,

х– индивидуални ценности,

Хе средноаритметичната стойност на извадката,

не броят на стойностите в анализирания набор от данни.

Съответната функция на Excel е − ДИСП.Г. Когато анализирате сравнително малки проби (до около 30 наблюдения), трябва да използвате , което се изчислява по следната формула.

Разликата, очевидно, е само в знаменателя. Excel има функция за изчисляване на примерната безпристрастна дисперсия DISP.B.

Изберете желаната опция (обща или селективна), посочете диапазона, щракнете върху бутона "OK". Получената стойност може да бъде много голяма поради предварителното квадратиране на отклоненията. Дисперсията в статистиката е много важен показател, но обикновено се използва не в чиста форма, а за допълнителни изчисления.

Стандартно отклонение

Стандартното отклонение (RMS) е коренът на дисперсията. Този показател се нарича още стандартно отклонение и се изчислява по формулата:

от общото население

по проба

Можете просто да вземете корена на дисперсията, но има готови функции за стандартно отклонение в Excel: STDEV.Gи STDEV.V(съответно за генералната и извадковата съвкупност).

Стандарт и стандартно отклонение, повтарям, са синоними.

След това, както обикновено, посочете желания диапазон и кликнете върху "OK". Стандартното отклонение има същите мерни единици като анализирания показател, поради което е сравнимо с оригиналните данни. Повече за това по-долу.

Коефициентът на вариация

Всички индикатори, разгледани по-горе, са свързани с мащаба на първоначалните данни и не позволяват да се получи образна представа за вариациите на анализираната популация. За да получите относителна мярка за разсейване на данните, използвайте коефициентът на вариация, което се изчислява чрез разделяне стандартно отклонениена средно аритметично. Формулата за коефициента на вариация е проста:

За изчисляване на коефициента на вариация в Excel няма готова функция, което не е голям проблем. Изчислението може да се направи чрез просто разделяне на стандартното отклонение на средната стойност. За да направите това, в лентата с формули напишете:

STDEV.G()/СРЕДНО()

Обхватът на данните е посочен в скоби. Ако е необходимо, използвайте стандартното отклонение за пробата (STDEV.B).

Коефициентът на вариация обикновено се изразява като процент, така че клетка с формула може да бъде оформена в процентен формат. Желаният бутон се намира на лентата в раздела "Начало":

Можете също така да промените формата, като изберете от контекстното меню, след като изберете желаната клетка и щракнете с десния бутон на мишката.

Коефициентът на вариация, за разлика от други показатели за разпространение на стойностите, се използва като независим и много информативен показател за вариация на данните. В статистиката е общоприето, че ако коефициентът на вариация е по-малък от 33%, тогава наборът от данни е хомогенен, ако е повече от 33%, тогава той е хетерогенен. Тази информация може да бъде полезна за предварително описание на данните и за идентифициране на възможности за допълнителен анализ. В допълнение, коефициентът на вариация, измерен като процент, дава възможност да се сравни степента на дисперсия на различни данни, независимо от техния мащаб и мерни единици. Полезен имот.

Коефициент на трептене

Друга мярка за разсейването на данните днес е коефициентът на трептене. Това е отношението на диапазона на вариация (разликата между максималните и минималните стойности) към средната стойност. Няма готова формула на Excel, така че трябва да съберете три функции: MAX, MIN, AVERAGE.

Коефициентът на трептене показва степента на вариация спрямо средната стойност, която може да се използва и за сравняване на различни набори от данни.

Като цяло, с помощта на Excel, много статистически показатели се изчисляват много просто. Ако нещо не е ясно, винаги можете да използвате полето за търсене във функцията. Е, Google идва на помощ.

За изчисляване на средната геометрична проста се използва формулата:

геометрично претеглени

За определяне на средното геометрично претеглено се използва формулата:

Средните диаметри на колелата, тръбите, средните страни на квадратите се определят с помощта на средния квадрат.

RMS стойностите се използват за изчисляване на някои показатели, като например коефициента на вариация, който характеризира ритъма на продукцията. Тук стандартното отклонение от планираната продукция за определен период се определя по следната формула:

Тези стойности точно характеризират изменението на икономическите показатели спрямо базовата им стойност, взета в нейната средна стойност.

Квадратно просто

Средната квадратична проста стойност се изчислява по формулата:

Квадратно претеглено

Среднопретегленият корен на квадрат е:

22. Абсолютните мерки за вариация включват:

диапазон на вариация

средно линейно отклонение

дисперсия

стандартно отклонение

Диапазон на вариация (r)

Вариация на обхватае разликата между максималните и минималните стойности на атрибута

Той показва границите, в които се променя стойността на признака в изследваната популация.

Трудовият стаж на петима кандидати на предишна работа е: 2,3,4,7 и 9 години. Решение: обхват на вариация = 9 - 2 = 7 години.

За обобщена характеристика на разликите в стойностите на атрибута, средните показатели за вариация се изчисляват въз основа на допускането на отклонения от средната аритметична стойност. Разликата се приема като отклонение от средната стойност.

В същото време, за да се избегне превръщането в нула на сумата от отклоненията на опциите на чертата от средната стойност (нулевото свойство на средната стойност), трябва или да се игнорират знаците на отклонението, т.е. да се вземе тази сума по модул , или повдигнете на квадрат стойностите на отклонението

Средно линейно и квадратично отклонение

Средно линейно отклонениее средноаритметичното на абсолютните отклонения на отделните стойности на атрибута от средната стойност.

Средното линейно отклонение е просто:

Трудовият стаж на петима кандидати на предишна работа е: 2,3,4,7 и 9 години.

В нашия пример: години;

Отговор: 2,4 години.

Средно линейно отклонение, претегленоважи за групирани данни:

Средното линейно отклонение, поради своята условност, се използва сравнително рядко на практика (по-специално за характеризиране на изпълнението на договорните задължения по отношение на еднаквостта на доставката; при анализа на качеството на продукта, като се вземат предвид технологичните характеристики на производството ).

Стандартно отклонение

Най-съвършената характеристика на вариацията е стандартното отклонение, което се нарича стандарт (или стандартно отклонение). Стандартно отклонение() е равен на корен квадратен от средния квадрат на отклоненията на отделните стойности на характеристиката от средната аритметична стойност:

Стандартното отклонение е просто:

Претегленото стандартно отклонение се прилага за групирани данни:

Между средно квадратичното и средното линейно отклонение при условия на нормално разпределение има следната зависимост: ~ 1,25.

Стандартното отклонение, което е основната абсолютна мярка за вариация, се използва при определяне на стойностите на ординатите на кривата на нормалното разпределение, при изчисления, свързани с организацията на наблюдението на извадката и установяване на точността на характеристиките на извадката, както и при оценяване на границите на вариация на даден признак в хомогенна популация.