Биографии Характеристики Анализ

Как да намерим дисперсията от формулата за стандартно отклонение. Стандартно отклонение, метод на изчисление, приложение

Програмата Excel е високо ценена както от професионалисти, така и от аматьори, тъй като потребител на всяко ниво на обучение може да работи с нея. Например, всеки с минимални умения за "комуникация" с Excel може да начертае проста графика, да направи приличен знак и т.н.

В същото време тази програма дори ви позволява да извършвате различни видове изчисления, например изчисления, но това вече изисква малко по-различно ниво на обучение. Ако обаче току-що сте започнали близко запознаване с тази програма и се интересувате от всичко, което ще ви помогне да станете по-напреднал потребител, тази статия е за вас. Днес ще ви кажа каква е формулата за стандартно отклонение в Excel, защо изобщо е необходима и всъщност кога се прилага. Отивам!

Какво е

Да започнем с теорията. Стандартното отклонение обикновено се нарича квадратен корен, получено от средната аритметична стойност на всички квадратни разлики между наличните стойности, както и тяхната средна аритметична стойност. Между другото, тази стойност обикновено се нарича гръцка буква "сигма". Стандартното отклонение се изчислява по формулата STDEV, съответно програмата го прави за самия потребител.

Същността на тази концепция е да се идентифицира степента на променливост на инструмента, т.е. той по свой начин е показател от описателната статистика. Той разкрива промени в волатилността на инструмента във всеки период от време. С помощта на формули STDEV можете да оцените стандартното отклонение на извадка, докато булевите и текстовите стойности се игнорират.

Формула

Помага за изчисляване на стандартното отклонение във формулата на Excel, която се предоставя автоматично в Excel. За да го намерите, трябва да намерите секцията с формули в Excel и вече там да изберете тази, която има името STDEV, така че е много проста.

След това пред вас ще се появи прозорец, в който ще трябва да въведете данни за изчислението. По-специално, две числа трябва да бъдат въведени в специални полета, след което програмата автоматично ще изчисли стандартното отклонение за извадката.

Несъмнено математическите формули и изчисления са доста сложен въпрос и не всички потребители могат да се справят с него веднага. Въпреки това, ако копаете малко по-дълбоко и разберете проблема малко по-подробно, се оказва, че не всичко е толкова тъжно. Надявам се да сте убедени в това чрез примера за изчисляване на стандартното отклонение.

Видео в помощ

Урок номер 4

Тема: „Описателна статистика. Индикатори за разнообразието на признака в съвкупността "

Основните критерии за разнообразието на даден признак в статистическата съвкупност са: граница, амплитуда, стандартно отклонение, коефициент на осцилация и коефициент на вариация. В предишния урок беше обсъдено, че средните стойности дават само обобщаваща характеристика на изучавания признак в съвкупност и не отчитат стойностите на отделните му варианти: минималните и максималните стойности, над средните , под средното и т.н.

Пример. Средни стойности на две различни числови последователности: -100; - двадесет; 100; 20 и 0,1; -0,2; 0,1 са абсолютно еднакви и равниО.Въпреки това диапазоните на разсейване на данните на тези относителни средни последователности са много различни.

Определянето на изброените критерии за разнообразието на признака се извършва преди всичко, като се вземе предвид неговата стойност за отделните елементи на статистическата съвкупност.

Индикаторите за измерване на вариацията на чертата са абсолютени роднина. Абсолютните показатели за вариация включват: диапазон на вариация, граница, стандартно отклонение, дисперсия. Коефициентът на вариация и коефициентът на колебание се отнасят до относителни мерки за вариация.

Лимит (lim)–това е критерий, който се определя от екстремните стойности на варианта в вариационната серия. С други думи, този критерий е ограничен от минималните и максималните стойности на атрибута:

Амплитуда (Am)или диапазон на вариация -това е разликата между крайностите. Изчисляването на този критерий се извършва чрез изваждане на минималната му стойност от максималната стойност на атрибута, което дава възможност да се оцени степента на дисперсия на варианта:

Недостатъкът на границата и амплитудата като критерии за променливост е, че те изцяло зависят от екстремните стойности на признака във вариационната серия. В този случай колебанията в стойностите на атрибута в рамките на серията не се вземат предвид.

Най-пълната характеристика на разнообразието на даден признак в статистическа съвкупност се дава от стандартно отклонение(сигма), което е обща мярка за отклонението на даден вариант от средната му стойност. Стандартното отклонение също често се нарича стандартно отклонение.

Основата на стандартното отклонение е сравнението на всяка опция със средната аритметична стойност на тази популация. Тъй като в съвкупността винаги ще има опции както по-малко, така и повече от него, тогава сумата от отклоненията със знака "" ще бъде изплатена от сумата от отклоненията със знака "", т.е. сумата от всички отклонения е нула. За да се избегне влиянието на знаците на разликите, се вземат отклоненията на варианта от средноаритметичното на квадрат, т.е. . Сумата от квадратите на отклоненията не е равна на нула. За да получите коефициент, способен да измерва променливостта, вземете средната стойност на сумата от квадрати - тази стойност се нарича дисперсия:

По дефиниция дисперсията е средният квадрат на отклоненията на отделните стойности на характеристика от средната му стойност. дисперсия квадратно стандартно отклонение.

Дисперсията е размерна величина (наименувана). Така че, ако вариантите на числовите серии са изразени в метри, тогава дисперсията дава квадратни метри; ако вариантите са изразени в килограми, тогава дисперсията дава квадрата на тази мярка (kg 2) и т.н.

Стандартно отклонениее корен квадратен от дисперсията:

, тогава при изчисляване на дисперсията и стандартното отклонение в знаменателя на дробта, вместое необходимо да се постави.

Изчисляването на стандартното отклонение може да бъде разделено на шест етапа, които трябва да се извършват в определена последователност:

Прилагане на стандартно отклонение:

а) да се прецени флуктуацията на вариационните редове и сравнителна оценка на типичността (представителността) на средните аритметични стойности. Това е необходимо при диференциална диагноза при определяне на стабилността на признаците.

б) за реконструкцията на вариационния ред, т.е. възстановяване на неговата честотна характеристика въз основа на три сигма правила. В интервала (М±3σ) има 99,7% от всички варианти на серията, в интервала (М±2σ) - 95,5% и в интервала (М±1σ) - 68,3% опция за ред(Фиг. 1).

в) за идентифициране на "изскачащи" опции

г) да се определят параметрите на нормата и патологията с помощта на сигма оценки

д) да се изчисли коефициентът на вариация

д) да се изчисли средната грешка на средноаритметичното.

За да се характеризира всяка обща съвкупност, която иманормален тип разпределение , достатъчно е да знаете два параметъра: средно аритметично и стандартно отклонение.

Фигура 1. Правило на трите сигми

Пример.

В педиатрията стандартното отклонение се използва за оценка на физическото развитие на децата чрез сравняване на данните за конкретно дете със съответните стандартни показатели. За еталон се приемат средноаритметичните показатели на физическото развитие на здрави деца. Сравнението на показателите със стандартите се извършва по специални таблици, в които стандартите са дадени заедно със съответните им сигма скали. Смята се, че ако показателят за физическото развитие на детето е в рамките на стандарта (средно аритметично) ±σ, тогава физическото развитие на детето (според този показател) съответства на нормата. Ако индикаторът е в рамките на стандарта ±2σ, тогава има леко отклонение от нормата. Ако индикаторът надхвърли тези граници, тогава физическото развитие на детето рязко се различава от нормата (възможна е патология).

В допълнение към вариационните показатели, изразени в абсолютни стойности, статистическите изследвания използват вариационни показатели, изразени в относителни стойности. Коефициент на трептене -това е отношението на диапазона на вариация към средната стойност на признака. Коефициентът на вариация -това е отношението на стандартното отклонение към средната стойност на характеристиката. Обикновено тези стойности се изразяват като процент.

Формули за изчисляване на относителните показатели на вариация:

От горните формули се вижда, че колкото по-голям е коеф V близо до нула, толкова по-малка е вариацията на стойностите на чертата. Колкото повече V, толкова по-променлив е знакът.

В статистическата практика най-често се използва коефициентът на вариация. Използва се не само за сравнителна оценка на вариацията, но и за характеризиране на хомогенността на популацията. Наборът се счита за хомогенен, ако коефициентът на вариация не надвишава 33% (за разпределения, близки до нормалните). Аритметично съотношението на σ и средноаритметичното елиминира влиянието на абсолютната стойност на тези характеристики, а процентното съотношение прави коефициента на вариация безразмерна (неназована) стойност.

Получената стойност на коефициента на вариация се оценява в съответствие с приблизителните градации на степента на разнообразие на признака:

Слаб - до 10%

Средно - 10 - 20%

Силен - повече от 20%

Използването на коефициента на вариация е препоръчително в случаите, когато е необходимо да се сравнят признаци, които са различни по размер и размер.

Разликата между коефициента на вариация и други критерии за разсейване е ясно демонстрирана от пример.

маса 1

Състав на служителите на промишлено предприятие

Въз основа на статистическите характеристики, дадени в примера, може да се заключи, че възрастовият състав и образователното ниво на служителите на предприятието са относително хомогенни, с ниска професионална стабилност на изследвания контингент. Лесно е да се види, че опитът да се преценят тези социални тенденции чрез стандартното отклонение би довел до погрешно заключение, а опитът да се сравнят счетоводните характеристики „трудов опит“ и „възраст“ със счетоводната характеристика „образование“ като цяло би бил неправилно поради разнородността на тези характеристики.

Медиана и процентили

За ординални (рангови) разпределения, където критерият за средата на серията е медианата, стандартното отклонение и дисперсията не могат да служат като характеристики на дисперсията на варианта.

Същото важи и за отворените вариационни серии. Това обстоятелство се дължи на факта, че отклоненията, според които се изчисляват дисперсията и σ, се отчитат от средната аритметична стойност, която не се изчислява в отворени вариационни серии и в серии от разпределения на качествени характеристики. Следователно, за компресирано описание на разпределения се използва друг параметър на разсейване - квантил(синоним - "перцентил"), подходящ за описание на качествени и количествени характеристики във всякаква форма на тяхното разпределение. Този параметър може да се използва и за преобразуване на количествени характеристики в качествени. В този случай такива оценки се присвояват в зависимост от това кой ред на квантила съответства на една или друга конкретна опция.

В практиката на биомедицинските изследвания най-често се използват следните квантили:

- Медиана;

, са квартили (четвърти), където е долният квартил, горен квартил.

Квантилите разделят областта на възможните промени в вариационна серия на определени интервали. Медианата (квантилът) е вариантът, който е в средата на вариационната серия и разделя тази серия наполовина, на две равни части ( 0,5 и 0,5 ). Квартилът разделя серията на четири части: първата част (долният квартил) е опцията, разделяща опциите, чиито числени стойности не надвишават 25% от максимално възможните в тази серия, квартилът разделя опциите с числена стойност до 50 % от максимално възможния. Горният квартил () разделя опциите до 75% от максимално възможните стойности.

При асиметрично разпределение променлива спрямо средната аритметична стойност, медианата и квартилите се използват за нейното характеризиране.В този случай се използва следната форма за показване на средната стойност - аз (;). Например, изследваният признак - "периодът, в който детето започва да ходи самостоятелно" - в изследваната група има асиметрично разпределение. В същото време долният квартил () съответства на началото на ходенето - 9,5 месеца, медианата - 11 месеца, горният квартил () - 12 месеца. Съответно, характеристиката на средния тренд на посочения признак ще бъде представена като 11 (9,5; 12) месеца.

Оценка на статистическата значимост на резултатите от изследването

Статистическата значимост на данните се разбира като степента на съответствието им с показаната реалност, т.е. Статистически значими данни са тези, които не изкривяват и правилно отразяват обективната реалност.

Да се ​​оцени статистическата значимост на резултатите от дадено изследване означава да се определи с каква вероятност е възможно да се прехвърлят резултатите, получени върху извадкова популация, към цялата популация. Необходима е оценка на статистическата значимост, за да се разбере доколко част от явлението може да се използва, за да се прецени явлението като цяло и неговите модели.

Оценката на статистическата значимост на резултатите от изследването се състои от:

1. грешки на представителността (грешки на средни и относителни стойности) - м;

2. доверителни граници на средни или относителни стойности;

3. надеждност на разликата между средни или относителни стойности според критерия T.

Стандартна грешка на средноаритметичната стойностили грешка в представителносттахарактеризира колебанията в средната стойност. Трябва да се отбележи, че колкото по-голям е размерът на извадката, толкова по-малък е разпределението на средните стойности. Стандартната грешка на средната стойност се изчислява по формулата:

В съвременната научна литература средноаритметичната стойност се записва заедно с грешката на представителност:

или заедно със стандартното отклонение:

Като пример, разгледайте данните за 1500 градски поликлиники в страната (общо население). Средният брой обслужени пациенти в поликлиниката е 18150 души. Случайният избор на 10% от обектите (150 поликлиники) дава среден брой пациенти, равен на 20 051 души. Извадковата грешка, очевидно свързана с факта, че не всички 1500 поликлиники са включени в извадката, е равна на разликата между тези средни стойности - общата средна ( Мген) и средно извадка ( М sb). Ако формираме друга извадка със същия размер от нашата популация, това ще даде различен размер на грешката. Всички тези извадкови средни, с достатъчно големи извадки, обикновено се разпределят около общата средна с достатъчно голям брой повторения на извадка от същия брой обекти от генералната съвкупност. Стандартна грешка на средната стойност ме неизбежното разпространение на извадковите средни около общата средна стойност.

В случай, че резултатите от изследването са представени чрез относителни стойности (например проценти), на споделяне на стандартна грешка:

където P е показателят в %, n е броят на наблюденията.

Резултатът се показва като (P ± m)%. Например,процентът на възстановяване сред пациентите е (95,2±2,5)%.

Ако броят на елементите в популацията, тогава при изчисляване на стандартните грешки на средната и дела в знаменателя на дробта, вместое необходимо да се постави.

За нормално разпределение (разпределението на извадковите средни стойности е нормално) е известно каква част от популацията попада във всеки интервал около средната стойност. По-специално:

На практика проблемът се състои в това, че характеристиките на генералната съвкупност са ни непознати и извадката се прави именно с цел тяхната оценка. Това означава, че ако вземем проби с еднакъв размер нот общата популация, тогава в 68,3% от случаите интервалът ще съдържа стойността М(ще бъде на интервала в 95,5% от случаите и на интервала в 99,7% от случаите).

Тъй като всъщност е направена само една извадка, това твърдение е формулирано по отношение на вероятността: с вероятност от 68,3%, средната стойност на атрибута в генералната съвкупност се съдържа в интервала, с вероятност от 95,5% - в интервала и т.н.

На практика такъв интервал се изгражда около стойността на извадката, която би с дадена (достатъчно висока) вероятност - вероятност за доверие -ще „покрие“ истинската стойност на този параметър в общата популация. Този интервал се нарича доверителен интервал.

Вероятност за довериеП е степента на увереност, че доверителният интервал наистина ще съдържа истинската (неизвестна) стойност на параметъра в популацията.

Например, ако нивото на увереност Рравно на 90%, това означава, че 90 проби от 100 ще дадат правилна оценка на параметъра в общата популация. Съответно вероятността от грешка, т.е. неправилна оценка на общата средна стойност за извадката, е равна в проценти: . За този пример това означава, че 10 проби от 100 ще дадат неправилна оценка.

Очевидно степента на доверие (вероятността на доверие) зависи от размера на интервала: колкото по-широк е интервалът, толкова по-висока е увереността, че неизвестна стойност за общата съвкупност ще попадне в него. На практика се взема най-малко два пъти грешката на извадката, за да се конструира доверителен интервал, за да се осигури поне 95,5% увереност.

Определянето на доверителните граници на средните и относителните стойности ни позволява да намерим двете им екстремни стойности - минималната възможна и максималната възможна, в рамките на които изследваният индикатор може да се появи в цялата обща популация. Въз основа на това, доверителни граници (или доверителен интервал)- това са границите на средни или относителни стойности, надхвърлянето на които поради случайни колебания има незначителна вероятност.

Доверителният интервал може да бъде пренаписан като: , където Tе критерий за доверие.

Доверителните граници на средноаритметичната стойност в генералната съвкупност се определят по формулата:

М ген = М изберете + тм М

за относителна стойност:

Р ген = П изберете + тм Р

където М гени Р ген- стойности на средните и относителни стойности за генералната съвкупност; М изберетеи Р изберете- стойностите на средните и относителните стойности, получени от извадката; м Ми м П- грешки на средни и относителни стойности; T- критерий за доверие (критерий за точност, който се задава при планиране на изследването и може да бъде равен на 2 или 3); тм- това е доверителният интервал или Δ - пределната грешка на показателя, получена при извадковото изследване.

Трябва да се отбележи, че стойността на критерия Tдо известна степен е свързано с вероятността за безгрешна прогноза (p), изразена в%. Избира се от самия изследовател, като се ръководи от необходимостта да получи резултат с необходимата степен на точност. И така, за вероятността за безгрешна прогноза от 95,5%, стойността на критерия Tе 2, за 99,7% - 3.

Дадените оценки на доверителния интервал са приемливи само за статистически съвкупности с повече от 30 наблюдения.При по-малък размер на популацията (малки извадки) се използват специални таблици за определяне на критерия t. В тези таблици желаната стойност е в пресечната точка на линията, съответстваща на размера на популацията (n-1)и колона, съответстваща на нивото на вероятност за прогноза без грешки (95,5%; 99,7%), избрана от изследователя. В медицинските изследвания, когато се установяват граници на доверие за всеки индикатор, вероятността за безгрешна прогноза е 95,5% или повече. Това означава, че стойността на показателя, получен върху извадката от съвкупността, трябва да бъде намерена в генералната съвкупност в поне 95,5% от случаите.

    Въпроси по темата на урока:

    Уместността на показателите за разнообразието на даден признак в статистическата съвкупност.

    Обща характеристика на абсолютните показатели на вариация.

    Стандартно отклонение, изчисление, приложение.

    Относителни показатели за вариация.

    Медиана, квартилен резултат.

    Оценка на статистическата значимост на резултатите от изследването.

    Стандартна грешка на средноаритметичната стойност, формула за изчисление, пример за използване.

    Изчисляване на дела и неговата стандартна грешка.

    Концепцията за доверителна вероятност, пример за използване.

10. Понятието доверителен интервал, неговото приложение.

    Тестови задачи по темата с примерни отговори:

1. АБСОЛЮТНИ ПОКАЗАТЕЛИ ЗА ИЗМЕНЕНИЕ СА

1) коефициент на вариация

2) коефициент на трептене

4) медиана

2. ОТНОСИТЕЛНИ ПОКАЗАТЕЛИ ЗА ИЗМЕНЕНИЕ СА

1) дисперсия

4) коефициент на вариация

3. КРИТЕРИИ, ОПРЕДЕЛЕНИ ОТ ЕКСТРЕМАЛНИТЕ СТОЙНОСТИ НА ВАРИАНТ ВЪВ ВАРИАЦИОННА ПОРЕДИЦА

2) амплитуда

3) дисперсия

4) коефициент на вариация

4. РАЗЛИКАТА НА ЕКСТРЕМНИЯ ВАРИАНТ Е

2) амплитуда

3) стандартно отклонение

4) коефициент на вариация

5. СРЕДНАТА КВАДРАТНА ОТКЛОНЕНИЯ НА ИНДИВИДУАЛНИ ЗНАЧИМИ СТОЙНОСТИ ОТ СРЕДНАТА МУ СТОЙНОСТ Е

1) коефициент на трептене

2) медиана

3) дисперсия

6. СЪОТНОШЕНИЕТО НА ДИАПАЗОНА НА ВАРИАЦИЯТА КЪМ СРЕДНАТА СТОЙНОСТ НА ХАРАКТЕРИСТИКАТА Е

1) коефициент на вариация

2) стандартно отклонение

4) коефициент на трептене

7. СЪОТНОШЕНИЕТО НА СРЕДНОТО КВАДРАТНО ОТКЛОНЕНИЕ КЪМ СРЕДНАТА СТОЙНОСТ НА ХАРАКТЕРИСТИКАТА Е

1) дисперсия

2) коефициент на вариация

3) коефициент на трептене

4) амплитуда

8. ВАРИАНТ, КОЙТО Е В СРЕДАТА НА ВАРИАЦИОННА СЕРИЯ И Я РАЗДЕЛЯ НА ДВЕ РАВНИ ЧАСТИ Е

1) медиана

3) амплитуда

9. В МЕДИЦИНСКИТЕ ИЗСЛЕДВАНИЯ, ПРИ УСТАНОВЯВАНЕ НА ДОВЕРИТЕЛНИ ГРАНИЦИ НА ВСЯК ИНДИКАТОР, СЕ ПРИЕМА ВЕРОЯТНОСТТА ЗА БЕЗГРЕШНА ПРОГНОЗА

10. АКО 90 ПРОБИ ОТ 100 ДАВАТ ПРАВИЛНА ОЦЕНКА НА ПАРАМЕТЪР В ГЕНЕРАЛНА ПОПУЛАЦИЯ, ТОГАВА ТОВА ОЗНАЧАВА, ЧЕ ВЕРОЯТНОСТТА ЗА ДОВЕРИЕ ПРАВЕН

11. В СЛУЧАЙ, АКО 10 ПРОБИ ОТ 100 ДАВАТ НЕПРАВИЛНА ОЦЕНКА, ВЕРОЯТНОСТТА ЗА ГРЕШКА Е

12. ГРАНИЦИТЕ НА СРЕДНИ ИЛИ ОТНОСИТЕЛНИ СТОЙНОСТИ, ИМА МАЛКА ВЕРОЯТНОСТ ДА МИНЕТЕ ОТВЪД ГРАНИЦИТЕ ПОРАДИ СЛУЧАЙНИ КОЛЕБАНИЯ - ТОВА

1) доверителен интервал

2) амплитуда

4) коефициент на вариация

13. ЗА МАЛКА ИЗВАДКА СЕ СЧИТА ТАЗИ ПОПУЛАЦИЯ, В КОЯТО

1) n е по-малко или равно на 100

2) n е по-малко или равно на 30

3) n е по-малко или равно на 40

4) n е близо до 0

14. ЗА ВЕРОЯТНОСТ ЗА БЕЗГРЕШНА ПРОГНОЗА 95% КРИТЕРИЙНА СТОЙНОСТ TКОМПОЗИРА

15. ЗА ВЕРОЯТНОСТ ЗА БЕЗГРЕШНА ПРОГНОЗА 99% КРИТЕРИЙНА СТОЙНОСТ TКОМПОЗИРА

16. ЗА РАЗПРЕДЕЛЕНИЯ, БЛИЗКИ ДО НОРМАЛНОТО, ПОПУЛАЦИЯТА СЕ СЧИТА ЗА ХОМОГЕННА, АКО КОЕФИЦИЕНТЪТ НА ВАРИАЦИЯ НЕ ПРЕВИШАВА

17. ОПЦИЯ, РАЗДЕЛЯЩА ВАРИАНТИ, КОИТО ЧИСЛОВИТЕ СТОЙНОСТИ НЕ ПРЕВИШАВАТ 25% ОТ МАКСИМАЛНО ВЪЗМОЖНИТЕ В ТОЗИ РЕД Е

2) долен квартил

3) горен квартил

4) квартил

18. ДАННИ, КОИТО НЕ ИЗКРИВЯВАТ И ПРАВИЛНО ОТРАЗЯТ ОБЕКТИВНАТА РЕАЛНОСТ, СЕ НАРИЧАТ

1) невъзможно

2) еднакво възможно

3) надежден

4) случаен

19. СЪГЛАСНО ПРАВИЛОТО НА ТРИТЕ СИГМИ, С НОРМАЛНО РАЗПРЕДЕЛЕНИЕ НА ЗНАК ВЪТРЕШНОСТ
ЩЕ БЪДАТ ЛОКАЛИЗАЦИИ

1) 68,3% опция

$X$. Първо, нека си припомним следното определение:

Определение 1

Население-- съвкупност от произволно избрани обекти от даден тип, върху които се извършват наблюдения с цел получаване на специфични стойности на случайна променлива, извършвани при непроменени условия при изследване на една случайна променлива от даден тип.

Определение 2

Обща вариация-- средноаритметичната стойност на квадратните отклонения на стойностите на варианта на генералната съвкупност от тяхната средна стойност.

Нека стойностите на варианта $x_1,\ x_2,\dots ,x_k$ имат съответно честотите $n_1,\ n_2,\dots ,n_k$. Тогава общата дисперсия се изчислява по формулата:

Нека разгледаме частен случай. Нека всички варианти $x_1,\ x_2,\dots ,x_k$ са различни. В този случай $n_1,\ n_2,\dots ,n_k=1$. Получаваме, че в този случай общата дисперсия се изчислява по формулата:

Също така свързана с тази концепция е концепцията за общото стандартно отклонение.

Определение 3

Общо стандартно отклонение

\[(\sigma )_r=\sqrt(D_r)\]

Дисперсия на извадката

Нека ни бъде даден примерен набор по отношение на случайна променлива $X$. Първо, нека си припомним следното определение:

Определение 4

Извадкова популация-- част от избраните обекти от генералната съвкупност.

Определение 5

Дисперсия на извадката-- средноаритметичната стойност на стойностите на варианта на извадката.

Нека стойностите на варианта $x_1,\ x_2,\dots ,x_k$ имат съответно честотите $n_1,\ n_2,\dots ,n_k$. Тогава дисперсията на извадката се изчислява по формулата:

Нека разгледаме частен случай. Нека всички варианти $x_1,\ x_2,\dots ,x_k$ са различни. В този случай $n_1,\ n_2,\dots ,n_k=1$. Получаваме, че в този случай дисперсията на извадката се изчислява по формулата:

Свързано с това понятие е и понятието стандартно отклонение на извадката.

Определение 6

Примерно стандартно отклонение-- корен квадратен от общата дисперсия:

\[(\sigma )_v=\sqrt(D_v)\]

Коригирана дисперсия

За да се намери коригираната дисперсия $S^2$, е необходимо дисперсията на извадката да се умножи по частта $\frac(n)(n-1)$, т.е.

Тази концепция се свързва и с концепцията за коригираното стандартно отклонение, което се намира по формулата:

В случай, че стойността на варианта не е дискретна, а е интервална, тогава във формулите за изчисляване на генералните или примерните дисперсии стойността на $x_i$ се приема за стойността на средата на интервала, към който $ x_i.$ принадлежи

Примерна задача за намиране на дисперсия и стандартно отклонение

Пример 1

Извадката от съвкупността е дадена от следната таблица на разпределение:

Снимка 1.

Намерете за него дисперсията на извадката, стандартното отклонение на извадката, коригираната дисперсия и коригираното стандартно отклонение.

За да разрешим този проблем, първо ще направим таблица за изчисление:

Фигура 2.

Стойността на $\overline(x_v)$ (примерно средно) в таблицата се намира по формулата:

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_in)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15,25\]

Намерете дисперсията на примера, като използвате формулата:

Примерно стандартно отклонение:

\[(\sigma )_v=\sqrt(D_v)\приблизително 5,12\]

Коригирана дисперсия:

\[(S^2=\frac(n)(n-1)D)_v=\frac(20)(19)\cdot 26.1875\приблизително 27.57\]

Коригирано стандартно отклонение.

Стандартното отклонение е един от онези статистически термини в корпоративния свят, който издига профила на хората, които успяват да го прецакат успешно в разговор или презентация, и оставя смътно неразбиране за онези, които не знаят какво е, но се притесняват да питам. Всъщност повечето мениджъри не разбират концепцията за стандартното отклонение и ако сте един от тях, време е да спрете да живеете в лъжата. В днешната статия ще ви покажа как тази подценена статистика може да ви помогне да разберете по-добре данните, с които работите.

Какво измерва стандартното отклонение?

Представете си, че сте собственик на два магазина. И за да се избегнат загуби, е важно да има ясен контрол на складовите наличности. В опит да разберете кой е най-добрият борсов мениджър, решавате да анализирате акциите от последните шест седмици. Средната седмична себестойност на наличността и на двата магазина е приблизително еднаква и е около 32 условни единици. На пръв поглед средната стойност на акциите показва, че и двамата мениджъри работят по един и същ начин.

Но ако погледнете по-отблизо дейността на втория магазин, можете да видите, че въпреки че средната стойност е правилна, променливостта на акциите е много висока (от 10 до 58 USD). Следователно може да се заключи, че средната стойност не винаги оценява правилно данните. Тук идва стандартното отклонение.

Стандартното отклонение показва как стойностите са разпределени спрямо средната стойност в нашия . С други думи, можете да разберете колко голям е оттокът от седмица на седмица.

В нашия пример използвахме функцията на Excel STDEV, за да изчислим стандартното отклонение заедно със средната стойност.

В случая на първия мениджър стандартното отклонение е 2. Това ни казва, че всяка стойност в извадката се отклонява средно с 2 от средната стойност. Добро е? Нека погледнем въпроса от друг ъгъл - стандартно отклонение от 0 ни казва, че всяка стойност в извадката е равна на средната си стойност (в нашия случай 32,2). Например, стандартно отклонение от 2 не се различава много от 0, което показва, че повечето от стойностите са близки до средните. Колкото по-близо е стандартното отклонение до 0, толкова по-надеждна е средната стойност. Освен това, стандартно отклонение, близко до 0, показва малка променливост в данните. Тоест стойността на потъване със стандартно отклонение от 2 показва невероятната последователност на първия мениджър.

В случая на втория магазин стандартното отклонение е 18,9. Тоест цената на оттока се отклонява средно с 18,9 от средната стойност от седмица на седмица. Лудо разпространение! Колкото по-далеч е стандартното отклонение от 0, толкова по-малко точна е средната стойност. В нашия случай цифрата от 18,9 показва, че на средната стойност ($32,8 на седмица) просто не може да се вярва. Това също ни казва, че седмичният отток е силно променлив.

Това е концепцията за стандартно отклонение накратко. Въпреки че не дава представа за други важни статистически измервания (режим, медиана...), всъщност стандартното отклонение играе решаваща роля в повечето статистически изчисления. Разбирането на принципите на стандартното отклонение ще хвърли светлина върху същността на много процеси във вашата дейност.

Как да изчислим стандартното отклонение?

И така, сега знаем какво казва цифрата на стандартното отклонение. Да видим как се брои.

Помислете за набор от данни от 10 до 70 на стъпки от 10. Както можете да видите, вече изчислих стандартното отклонение за тях с помощта на функцията STDEV в клетка H2 (оранжева).

По-долу са стъпките, които Excel предприема, за да стигне до 21.6.

Моля, имайте предвид, че всички изчисления са визуализирани за по-добро разбиране. Всъщност в Excel изчислението е мигновено, оставяйки всички стъпки зад кулисите.

Excel първо намира средната стойност на извадката. В нашия случай средната стойност се оказа 40, която се изважда от всяка примерна стойност в следващата стъпка. Всяка получена разлика се повдига на квадрат и се сумира. Получихме сумата, равна на 2800, която трябва да бъде разделена на броя на пробните елементи минус 1. Тъй като имаме 7 елемента, се оказва, че трябва да разделим 2800 на 6. От резултата намираме квадратния корен, тази цифра ще бъде стандартното отклонение.

За тези, които не са напълно ясни относно принципа на изчисляване на стандартното отклонение с помощта на визуализация, давам математическа интерпретация на намирането на тази стойност.

Функции за изчисляване на стандартно отклонение в Excel

В Excel има няколко разновидности на формули за стандартно отклонение. Просто трябва да напишете =STDEV и ще се убедите сами.

Струва си да се отбележи, че функциите STDEV.V и STDEV.G (първата и втората функция в списъка) дублират съответно функциите STDEV и STDEV (петата и шестата функция в списъка), които бяха запазени за съвместимост с по-ранни версии на Excel.

Като цяло разликата в окончанията В и G функциите показват принципа на изчисляване на стандартното отклонение на извадка или популация. Вече обясних разликата между тези два масива в предишния.

Характеристика на функциите STDEV и STDEVPA (третата и четвъртата функция в списъка) е, че при изчисляване на стандартното отклонение на масив се вземат предвид логически и текстови стойности. Текстът и истинските булеви стойности са 1, а фалшивите булеви стойности са 0. Трудно ми е да си представя ситуация, в която ще имам нужда от тези две функции, така че мисля, че могат да бъдат игнорирани.

  • Отговори на изпитни въпроси по обществено здраве и здравеопазване.
  • 1. Общественото здраве и здравеопазването като наука и област на практика. Основни цели. Обект, предмет на изследване. Методи.
  • 2. Здравеопазване. Определение. История на развитието на здравето. Съвременни здравни системи, техните характеристики.
  • 3. Държавна политика в областта на опазването на общественото здраве (Закон на Република Беларус "за здравеопазването"). Организационни принципи на системата на общественото здравеопазване.
  • 4. Осигуряване и частни форми на здравеопазване.
  • 5. Профилактика, определение, принципи, съвременни проблеми. Видове, нива, направления на профилактика.
  • 6. Национални програми за превенция. Тяхната роля за подобряване на здравето на населението.
  • 7. Медицинска етика и деонтология. Определение на понятието. Съвременни проблеми на медицинската етика и деонтология, характеристики.
  • 8. Здравословен начин на живот, определение на понятието. Социални и медицински аспекти на здравословния начин на живот (HLS).
  • 9. Хигиенно обучение и възпитание, определение, основни принципи. Методи и средства за хигиенно обучение и възпитание. Изисквания към лекцията, здравен бюлетин.
  • 10. Здраве на населението, фактори, влияещи върху здравето на населението. Здравна формула. Показатели, характеризиращи общественото здраве. Схема на анализ.
  • 11. Демографията като наука, определение, съдържание. Стойността на демографските данни за здравеопазването.
  • 12. Статика на населението, методология на изследването. Преброявания на населението. Видове възрастови структури на населението.
  • 13. Механично движение на населението. Характеристика на миграционните процеси, влиянието им върху здравните показатели на населението.
  • 14. Плодовитостта като медико-социален проблем. Метод за изчисляване на показатели. Раждаемост според СЗО. Съвременни тенденции.
  • 15. Специални коефициенти на раждаемост (показатели за раждаемост). Възпроизводство на населението, видове възпроизводство. Показатели, методи за изчисляване.
  • 16. Смъртността на населението като медико-социален проблем. Методи на изследване, показатели. Нива на обща смъртност според СЗО. Съвременни тенденции.
  • 17. Детската смъртност като медико-социален проблем. Фактори, определящи нивото му.
  • 18. Майчина и перинатална смъртност, основни причини. Показатели, методи за изчисляване.
  • 19. Естествено движение на населението, фактори, влияещи върху него. Показатели, методи за изчисляване. Основните модели на естественото движение в Беларус.
  • 20. Семейно планиране. Определение. Съвременни проблеми. Медицински организации и услуги по семейно планиране в Република Беларус.
  • 21. Заболеваемостта като медико-социален проблем. Съвременни тенденции и особености в Република Беларус.
  • 22. Медико-социални аспекти на нервно-психическото здраве на населението. Организация на психо-неврологичната помощ
  • 23. Алкохолизмът и наркоманията като медико-социален проблем
  • 24. Болестите на органите на кръвообращението като медико-социален проблем. Рискови фактори. направления на превенцията. Организация на кардиологичните грижи.
  • 25. Злокачествените новообразувания като медико-социален проблем. Основните направления на превенцията. Организация на онкологичните грижи.
  • 26. Международна статистическа класификация на болестите. Принципи на изграждане, ред на използване. Значението му в изследването на заболеваемостта и смъртността на населението.
  • 27. Методи за изследване на заболеваемостта на населението, тяхната сравнителна характеристика.
  • Методика за изследване на общата и първична заболеваемост
  • Показатели за обща и първична заболеваемост.
  • Показатели за инфекциозно заболяване.
  • Основните показатели, характеризиращи най-важната неепидемична заболеваемост.
  • Основните показатели за "хоспитализирана" заболеваемост:
  • 4) Заболявания с временна нетрудоспособност (въпрос 30)
  • Основните показатели за анализ на заболеваемостта от wut.
  • 31. Проучване на заболеваемостта според профилактичните прегледи на населението, видовете профилактични прегледи, процедурата за провеждане. здравни групи. Концепцията за "патологична привързаност".
  • 32. Заболеваемост според причините за смъртта. Методи на изследване, показатели. Медицински акт за смърт.
  • Основните показатели на заболеваемостта според причините за смъртта:
  • 33. Инвалидността като медико-социален проблем Дефиниране на понятието, индикатори. Тенденции в областта на инвалидността в Република Беларус.
  • Тенденции в областта на уврежданията в Република Беларус.
  • 34. Първична здравна помощ (ПМСП), определение, съдържание, роля и място в системата на медицинската помощ за населението. Основни функции.
  • 35. Основни принципи на първичната здравна помощ. Медицински организации на първичната здравна помощ.
  • 36. Организация на амбулаторното медицинско обслужване на населението. Основни принципи. институции.
  • 37. Организация на медицинското обслужване в болница. институции. Индикатори за предоставяне на болнична помощ.
  • 38. Видове медицински грижи. Организиране на специализирана медицинска помощ за населението. Центрове за специализирана медицинска помощ, техните задачи.
  • 39. Основни насоки за подобряване на болничната и специализирана помощ в Република Беларус.
  • 40. Защита на здравето на жените и децата в Република Беларус. контрол. Медицински организации.
  • 41. Съвременни проблеми на женското здраве. Организация на акушерската и гинекологичната помощ в Република Беларус.
  • 42. Организация на лечебно-профилактични грижи за детското население. Водещи проблеми със здравето на децата.
  • 43. Организация на здравната защита на селското население, основните принципи за предоставяне на медицинска помощ на селските жители. Етапи. организации.
  • II етап - териториално медицинско дружество (ТМО).
  • III етап - областната болница и лечебните заведения в района.
  • 45. Медико-социална експертиза (МСЕ), определение, съдържание, основни понятия.
  • 46. ​​​​Рехабилитация, определение, видове. Закон на Република Беларус „За превенцията на инвалидността и рехабилитацията на хората с увреждания“.
  • 47. Медицинска рехабилитация: определение на понятието, етапи, принципи. Услуги за медицинска рехабилитация в Република Беларус.
  • 48. Градска поликлиника, структура, задачи, управление. Основни показатели за ефективност на поликлиниката.
  • Основни показатели за ефективност на поликлиниката.
  • 49. Районният принцип на организиране на извънболничната помощ на населението. Видове парцели. Териториална терапевтична зона. Регламенти. Съдържанието на работата на окръжния лекар-терапевт.
  • Организация на работата на местния терапевт.
  • 50. Кабинет по инфекциозни болести на поликлиниката. Раздели и методи на работа на лекар в кабинета по инфекциозни болести.
  • 52. Основни показатели, характеризиращи качеството и ефективността на диспансерното наблюдение. Методът на тяхното изчисляване.
  • 53. Отдел за медицинска рехабилитация (ОМР) на поликлиниката. Структура, задачи. Процедура за насочване на пациенти към интензивно отделение.
  • 54. Детска поликлиника, структура, задачи, раздели на работа. Особености на амбулаторното лечение на деца.
  • 55. Основните раздели на работата на местния педиатър. Съдържанието на лечебната и превантивната работа. Комуникация при работа с други лечебни заведения. Документация.
  • 56. Съдържанието на превантивната работа на местния педиатър. Организация на сестрински грижи за новородени.
  • 57. Структура, организация, съдържание на женската консултация. Показатели за работа по обслужване на бременни жени. Документация.
  • 58. Родилен дом, структура, организация на работа, управление. Показатели за работа на родилния дом. Документация.
  • 59. Градска болница, нейните задачи, структура, основни показатели за изпълнение. Документация.
  • 60. Организация на работата на приемното отделение на болницата. Документация. Мерки за предотвратяване на вътреболничните инфекции. Лечебно-протективен режим.
  • Раздел 1. Информация за подразделенията, съоръженията на лечебно-профилактичната организация.
  • Раздел 2. Състояние на лечебно-профилактичната организация в края на отчетната година.
  • Раздел 3. Работата на лекарите в поликлиники (амбулатории), диспансери, консултации.
  • Раздел 4. Превантивни медицински прегледи и работа на стоматологични (зъболекарски) и хирургически кабинети на медицинска организация.
  • Раздел 5. Работа на медицинските помощни отделения (кабинети).
  • Раздел 6. Работа на диагностичните отделения.
  • 62. Годишен отчет за дейността на болницата (f. 14), процедурата за съставяне, структура. Основни показатели за дейността на болницата.
  • Раздел 1. Съставът на пациентите в болницата и резултатите от тяхното лечение
  • Раздел 2. Съставът на болните новородени, прехвърлени в други болници на възраст 0-6 дни и резултатите от тяхното лечение
  • Раздел 3. Легла и тяхното използване
  • Раздел 4. Хирургична работа на болницата
  • 63. Отчет за медицински грижи за бременни жени, родилки и родилки (ф. 32), структура. Основни характеристики.
  • Раздел I. Дейност на женската консултация.
  • Раздел II. Акушерство в болница
  • Раздел III. майчина смъртност
  • Раздел IV. Информация за раждания
  • 64. Медицинско генетично консултиране, основни институции. Ролята му в превенцията на перинаталната и детската смъртност.
  • 65. Медицинска статистика, нейните раздели, задачи. Ролята на статистическия метод при изследване на здравето на населението и дейността на здравната система.
  • 66. Статистическа съвкупност. Определение, видове, свойства. Характеристики на провеждане на статистическо изследване върху извадкова съвкупност.
  • 67. Извадкова съвкупност, изискванията към нея. Принципът и методите за формиране на извадкова съвкупност.
  • 68. Единица за наблюдение. Определение, характеристики на счетоводните характеристики.
  • 69. Организация на статистическите изследвания. Характеристики на етапите.
  • 70. Съдържанието на плана и програмата на статистическите изследвания. Видове планове за статистически изследвания. програма за наблюдение.
  • 71. Статистическо наблюдение. Непрекъснато и непродължително статистическо изследване. Видове неконтинуални статистически изследвания.
  • 72. Статистическо наблюдение (събиране на материали). Грешки на статистическото наблюдение.
  • 73. Статистическо групиране и обобщение. Типологично и вариационно групиране.
  • 74. Статистически таблици, видове, изисквания за изграждане.

81. Стандартно отклонение, метод на изчисление, приложение.

Приблизителен метод за оценка на флуктуацията на вариационна серия е определянето на границата и амплитудата, но стойностите на варианта в серията не се вземат предвид. Основната общоприета мярка за колебанията на количествения признак в диапазона на вариациите е стандартно отклонение (σ - сигма). Колкото по-голямо е стандартното отклонение, толкова по-висока е степента на флуктуация на тази серия.

Методът за изчисляване на стандартното отклонение включва следните стъпки:

1. Намерете средното аритметично (M).

2. Определяне на отклоненията на отделните варианти от средноаритметичното (d=V-M). В медицинската статистика отклоненията от средната стойност се означават с d (deviate). Сумата от всички отклонения е равна на нула.

3. Квадратирайте всяко отклонение d 2 .

4. Умножете отклоненията на квадрат по съответните честоти d 2 *p.

5. Намерете сумата от продуктите  (d 2 * p)

6. Изчислете стандартното отклонение по формулата:

когато n е по-голямо от 30, или
когато n е по-малко или равно на 30, където n е броят на всички опции.

Стойността на стандартното отклонение:

1. Стандартното отклонение характеризира разпространението на варианта спрямо средната стойност (т.е. колебанията на серията вариации). Колкото по-голяма е сигмата, толкова по-висока е степента на разнообразие на тази серия.

2. Стандартното отклонение се използва за сравнителна оценка на степента на съответствие на средноаритметичното с вариационната серия, за която е изчислено.

Вариациите на масовите явления се подчиняват на закона за нормалното разпределение. Кривата, представяща това разпределение, има формата на гладка камбановидна симетрична крива (крива на Гаус). Според теорията на вероятността при явления, които се подчиняват на закона за нормалното разпределение, съществува строга математическа връзка между стойностите на средното аритметично и стандартното отклонение. Теоретичното разпределение на вариант в хомогенна вариационна серия се подчинява на правилото на трите сигми.

Ако в системата от правоъгълни координати по абсцисната ос са нанесени стойностите на количествения признак (опции), а по ординатната ос - честотата на поява на варианта в вариационната серия, тогава вариантите с по-големи и по-малки стойности са равномерно разположени отстрани на средното аритметично.

Установено е, че при нормално разпределение на признака:

В рамките на М1 са 68,3% от вариантните стойности

95,5% от стойностите на варианта са в рамките на M2

99,7% от стойностите на варианта са в рамките на M3

3. Стандартното отклонение ви позволява да зададете нормалните стойности за клинични и биологични параметри. В медицината интервалът M1 обикновено се приема извън нормалните граници за изследваното явление. Отклонението на изчислената стойност от средноаритметичната с повече от 1 показва отклонението на изследвания параметър от нормата.

4. В медицината правилото на трите сигми се използва в педиатрията за индивидуална оценка на нивото на физическо развитие на децата (метод на сигма отклонения), за разработване на стандарти за детско облекло

5. Стандартното отклонение е необходимо за характеризиране на степента на разнообразие на изследваната характеристика и изчисляване на грешката на средната аритметична стойност.

Стойността на стандартното отклонение обикновено се използва за сравняване на колебанията на един и същи тип серии. Ако се сравнят два реда с различни характеристики (ръст и тегло, средна продължителност на болничния престой и болнична смъртност и др.), тогава директното сравнение на сигма размерите е невъзможно. , защото стандартно отклонение - наименована стойност, изразена в абсолютни числа. В тези случаи приложете коефициентът на вариация (CV) , което е относителна стойност: процентът на стандартното отклонение спрямо средната аритметична стойност.

Коефициентът на вариация се изчислява по формулата:

Колкото по-висок е коефициентът на вариация , толкова по-голяма е променливостта на тази серия. Смята се, че коефициентът на вариация над 30% показва качествената хетерогенност на популацията.