Биографии Характеристики Анализ

Доверителен интервал за математическо очакване. Точкови и интервални оценки на средната стойност

И други Всички те са оценки на техните теоретични двойници, които биха могли да се получат, ако нямаше извадка, а население. Но уви, общото население е много скъпо и често недостъпно.

Концепцията за интервална оценка

Всякакви примерна оценкаима малко разсейване, защото е случайна променлива в зависимост от стойностите в конкретна проба. Следователно, за по-надеждни статистически заключения, трябва да се знае не само точкова оценка, но и интервал, който с голяма вероятност γ (гама) обхваща прогнозния показател θ (тета).

Формално това са две такива стойности (статистика) T1(X)и T2(X), Какво T1< T 2 , за които при дадено ниво на вероятност γ условието е изпълнено:

Накратко, вероятно е γ или повече истинската стойност е между точките T1(X)и T2(X), които се наричат ​​долна и горна граница доверителен интервал.

Едно от условията за конструиране на доверителни интервали е неговата максимална стеснимост, т.е. трябва да е възможно най-кратък. Желанието е съвсем естествено, т.к. изследователят се опитва да локализира по-точно находката на желания параметър.

Оттук следва, че доверителен интервалтрябва да покрива максималните вероятности на разпределението. и самата партитура да е в центъра.

Тоест вероятността за отклонение (на истинския показател от оценката) нагоре е равна на вероятността за отклонение надолу. Трябва също да се отбележи, че за изкривените разпределения интервалът отдясно не е такъв равен на интерваланаляво.

Фигурата по-горе ясно показва, че колкото по-високо е нивото на доверие, толкова по-широк е интервалът - пряка връзка.

Това беше малко въведение в теорията интервална оценканеизвестни параметри. Нека да преминем към намирането на доверителни граници за математическото очакване.

Доверителен интервал за математическо очакване

Ако оригиналните данни са разпределени върху , тогава средната стойност ще бъде нормална стойност. Това следва от правилото, което има и линейна комбинация от нормални стойности нормална дистрибуция. Следователно, за да изчислим вероятностите, можем да използваме математически апаратнормален закон за разпределение.

Това обаче ще изисква познаването на два параметъра - очакваната стойност и дисперсията, които обикновено не са известни. Можете, разбира се, да използвате оценки вместо параметри (средно аритметично и ), но тогава разпределението на средната стойност няма да е съвсем нормално, то ще бъде леко изравнено. Гражданинът Уилям Госет от Ирландия умело отбеляза този факт, когато публикува откритието си в броя на Biometrica от март 1908 г. За целите на секретността Госет подписа със Студент. Така се появи t-разпределението на Стюдънт.

Но нормалното разпределение на данните, използвано от К. Гаус при анализа на грешките астрономически наблюдения, се среща изключително рядко в земния живот и е доста трудно да се установи това (за висока прецизностнеобходими са около 2000 наблюдения). Следователно най-добре е да се откажете от предположението за нормалност и да използвате методи, които не зависят от разпределението на оригиналните данни.

Възниква въпросът: какво е разпределението на средноаритметичното, ако се изчислява от данните на неизвестно разпределение? Отговорът дава добре познатата в теорията на вероятностите Централна гранична теорема (CPT). В математиката има няколко нейни версии (формулировките са усъвършенствани през годините), но всички те, грубо казано, се свеждат до твърдението, че сумата Голям бройнезависими случайни променливи се подчинява нормален законразпространение.

При изчисляване на средноаритметичното се използва сумата от случайни променливи. От това се оказва, че средноаритметичното има нормално разпределение, при което очакваната стойност е очакваната стойност на изходните данни, а дисперсията е .

Умни хоразнаем как да докажем CLT, но ние ще проверим това с помощта на експеримент, проведен в Excel. Нека симулираме извадка от 50 равномерно разпределени случайни променливи (използвайки Функции на ExcelСЛУЧАЙНО МЕЖДУ). След това ще направим 1000 такива проби и ще изчислим средноаритметичната стойност за всяка. Нека разгледаме тяхното разпространение.

Вижда се, че разпределението на средната е близко до нормалния закон. Ако обемът на пробите и техният брой се увеличат още повече, тогава сходството ще бъде още по-добро.

Сега, след като се убедихме сами във валидността на CLT, можем, като използваме , да изчислим доверителните интервали за средната аритметична стойност, които с дадена вероятност покриват истинската средна стойност или очаквана стойност.

За да се установят горната и долната граница, е необходимо да се знаят параметрите на нормалното разпределение. По правило те не са, следователно се използват оценки: средноаритметичнои дисперсия на извадката . Отново този метод дава добро приближение само за големи проби. Когато извадките са малки, често се препоръчва да се използва разпределението на Student. Не вярвайте! Разпределението на Стюдънт за средната стойност възниква само когато оригиналните данни имат нормално разпределение, тоест почти никога. Ето защо е по-добре незабавно да зададете минималната лента за количеството необходими данни и да използвате асимптотично правилни методи. Казват, че 30 наблюдения са достатъчни. Вземете 50 - няма да сбъркате.

T 1.2са долната и горната граница на доверителния интервал

– средноаритметично извадково

s0– извадково стандартно отклонение (безпристрастно)

н – размер на извадката

γ – ниво на достоверност (обикновено равно на 0,9, 0,95 или 0,99)

c γ =Φ -1 ((1+γ)/2)обратен смисълстандартни нормални функции на разпределение. С прости думи, това е броят на стандартните грешки от средната аритметична стойност до долната или горната граница (посочените три вероятности съответстват на стойностите от 1,64, 1,96 и 2,58).

Същността на формулата е, че се взема средноаритметичното и след това от него се отделя определена сума ( с γ) стандартни грешки ( s 0 /√n). Всичко се знае, вземете и пребройте.

Преди масовото използване на компютри, за получаване на стойностите на функцията на нормалното разпределение и нейната обратна функция, те използваха . Те все още се използват, но е по-ефективно да се обърнете към готовите Формули на Excel. Всички елементи от горната формула ( , и ) могат лесно да бъдат изчислени в Excel. Но има и готова формула за изчисляване на доверителния интервал - НОРМА ЗА ДОВЕРИЕ. Синтаксисът му е следният.

CONFIDENCE NORM(alpha, standard_dev, size)

алфа– ниво на значимост или ниво на увереност, което в горната нотация е равно на 1- γ, т.е. вероятността математическитеочакването ще бъде извън доверителния интервал. При ниво на достоверност от 0,95, алфа е 0,05 и т.н.

standard_offе стандартното отклонение на данните от извадката. Не е необходимо да изчислявате стандартната грешка, Excel ще раздели на корен от n.

размерът– размер на извадката (n).

Резултатът от функцията CONFIDENCE.NORM е вторият член от формулата за изчисляване на доверителния интервал, т.е. полуинтервал. Съответно долната и горната точка са средната ± получената стойност.

По този начин е възможно да се изгради универсален алгоритъм за изчисляване на доверителните интервали за средноаритметичното, което не зависи от разпределението на изходните данни. Цената за универсалността е нейната асимптотична природа, т.е. необходимостта от използване на относително големи проби. Въпреки това през века модерни технологиисъбирам точно количестводанните обикновено не са трудни.

Тестване на статистически хипотези с помощта на доверителен интервал

(модул 111)

Един от основните проблеми, решавани в статистиката, е. Накратко същността му е следната. Прави се например предположение, че очакванията на общата съвкупност са равни на някаква стойност. След това се конструира разпределението на извадковите средни, които могат да се наблюдават с дадено очакване. След това разглеждаме къде в това условно разпределение се намира реалната средна стойност. Ако надхвърли допустимите граници, тогава появата на такава средна е много малко вероятна, а при еднократно повторение на експеримента е почти невъзможна, което противоречи на изложената хипотеза, която е успешно отхвърлена. Ако средната стойност не надхвърля критично ниво, тогава хипотезата не е отхвърлена (но не и доказана!).

И така, с помощта на доверителни интервали, в нашия случай за очакванията, можете също да тествате някои хипотези. Много лесно се прави. Да предположим, че средноаритметичната стойност за някаква извадка е 100. Тества се хипотезата, че очакването е, да речем, 90. Тоест, ако поставим въпроса примитивно, той звучи така: може ли да е така, с истинската стойност на средно равно на 90, наблюдаваната средна стойност е 100?

За да отговорите на този въпрос, допълнителна информация средно стандартно отклонениеи размер на извадката. Да речем стандартно отклонениее 30, а броят на наблюденията е 64 (за лесно извличане на корена). Тогава стандартната грешка на средната стойност е 30/8 или 3,75. За да се изчисли 95% доверителен интервал, ще е необходимо да се отложи от двете страни на средната стойност с две стандартни грешки(по-точно с 1,96). Доверителният интервал ще бъде приблизително 100 ± 7,5 или от 92,5 до 107,5.

По-нататъшното разсъждение е следното. Ако тестваната стойност попада в доверителния интервал, това не противоречи на хипотезата, тъй като се вписва в границите на случайни флуктуации (с вероятност от 95%). Ако тестваната точка е извън доверителния интервал, тогава вероятността за такова събитие е много малка, във всеки случай под приемливото ниво. Следователно хипотезата се отхвърля като противоречаща на наблюдаваните данни. В нашия случай хипотезата за очакване е извън доверителния интервал (тестваната стойност от 90 не е включена в интервала от 100±7,5), така че трябва да бъде отхвърлена. Отговаряйки на примитивния въпрос по-горе, човек трябва да каже: не, не може, във всеки случай това се случва изключително рядко. Често това показва конкретна вероятност за погрешно отхвърляне на хипотезата (p-ниво), а не дадено ниво, според което е изграден доверителният интервал, но повече за това друг път.

Както можете да видите, не е трудно да се изгради доверителен интервал за средната стойност (или математическото очакване). Основното нещо е да хванете същността и тогава нещата ще тръгнат. На практика повечето използват 95% доверителен интервал, който е с ширина около две стандартни грешки от двете страни на средната стойност.

Това е всичко за сега. Всичко най-хубаво!

Често оценителят трябва да анализира пазара на недвижими имоти в сегмента, в който се намира обектът на оценка. Ако пазарът е развит, може да бъде трудно да се анализира целия набор от представени обекти, следователно за анализ се използва извадка от обекти. Тази извадка не винаги е хомогенна, понякога се налага нейното изчистване от крайности - твърде високи или твърде ниски пазарни оферти. За целта се прилага доверителен интервал. Цел това учение- направете сравнителен анализ на два метода за изчисляване на доверителния интервал и изберете най-добър варианткалкулация при работа с различни проби в системата estimatica.pro.

Доверителен интервал - изчислен въз основа на извадката, интервалът от стойности на характеристиката, който с известна вероятност съдържа оценения параметър на генералната съвкупност.

Смисълът на изчисляването на доверителния интервал е да се изгради такъв интервал въз основа на данните от извадката, така че да може да се твърди с дадена вероятност, че стойността на оценения параметър е в този интервал. С други думи, доверителният интервал с определена вероятност съдържа неизвестна стойностпрогнозна стойност. Колкото по-широк е интервалът, толкова по-голяма е неточността.

Има различни методи за определяне на доверителния интервал. В тази статия ще разгледаме 2 начина:

  • чрез медиана и средна стойност стандартно отклонение;
  • чрез критичната стойност на t-статистиката (коефициент на Стюдънт).

Етапи сравнителен анализ различни начиниИзчисление на CI:

1. формира извадка от данни;

2. обработвам го статистически методи: изчисляване на средна стойност, медиана, дисперсия и др.;

3. изчисляваме доверителния интервал по два начина;

4. Анализирайте почистените проби и получените доверителни интервали.

Етап 1. Извадка от данни

Извадката е формирана чрез системата estimatica.pro. Извадката включва 91 оферти за продажба на 1-стайни апартаменти в 3-та ценова зона с тип планиране "Хрушчов".

Таблица 1. Първоначална проба

Цената на 1 кв.м., к.у.

Фиг. 1. Първоначална проба



Етап 2. Обработка на първоначалната проба

Обработката на извадката чрез статистически методи изисква изчисляване на следните стойности:

1. Средно аритметично

2. Медиана - число, което характеризира извадката: точно половината от елементите на извадката са по-големи от медианата, другата половина е по-малка от медианата

(за извадка с нечетен брой стойности)

3. Диапазон - разликата между максималните и минималните стойности в извадката

4. Дисперсия - използва се за по-точна оценка на вариацията в данните

5. Стандартното отклонение за извадката (наричано по-нататък RMS) е най-често срещаният индикатор за дисперсията на коригиращите стойности около средноаритметичната стойност.

6. Коефициент на вариация - отразява степента на дисперсия на коригиращите стойности

7. коефициент на трептене - отразява относителната флуктуация екстремни стойностицени в извадката около средните

Таблица 2. Статистически показателиоригинална проба

Коефициентът на вариация, който характеризира хомогенността на данните, е 12,29%, но коефициентът на колебание е твърде голям. По този начин можем да заявим, че оригиналната извадка не е хомогенна, така че нека да преминем към изчисляване на доверителния интервал.

Етап 3. Изчисляване на доверителния интервал

Метод 1. Изчисляване чрез медиана и стандартно отклонение.

Доверителният интервал се определя, както следва: минимална стойност- RSD се изважда от медианата; максималната стойност - стандартното отклонение се добавя към медианата.

Така доверителният интервал (47179 CU; 60689 CU)

Ориз. 2. Стойности в рамките на доверителен интервал 1.



Метод 2. Изграждане на доверителен интервал чрез критичната стойност на t-статистиката (коефициент на Стюдънт)

С.В. Грибовски в книгата " Математически методиоценка на стойността на имота” описва как да се изчисли доверителният интервал чрез коефициента на Студент. При изчисляване по този метод самият оценител трябва да зададе нивото на значимост ∝, което определя вероятността, с която ще бъде изграден доверителният интервал. Обикновено се използват нива на значимост от 0,1; 0,05 и 0,01. Те съответстват на доверителни вероятности от 0,9; 0,95 и 0,99. При този метод се предполага истински ценностиматематическото очакване и дисперсията са практически неизвестни (което почти винаги е вярно при решаване на практически проблеми с оценка).

Формула за доверителен интервал:

n - размер на извадката;

Критичната стойност на t-статистиките (разпределенията на Стюдънт) с ниво на значимост ∝, броят на степените на свобода n-1, което се определя от специални статистически таблици или с помощта на MS Excel (→"Статистически"→ СТУДРАСПОБР);

∝ - ниво на значимост, приемаме ∝=0,01.

Ориз. 2. Стойности в рамките на доверителния интервал 2.

Стъпка 4. Анализ на различни начини за изчисляване на доверителния интервал

Два начина за изчисляване на доверителния интервал - чрез медианата и коефициента на Стюдънт - доведоха до различни стойностиинтервали. Съответно бяха получени две различни пречистени проби.

Таблица 3. Статистически показатели за три извадки.

Индекс

Първоначална проба

1 вариант

Вариант 2

Означава

дисперсия

Коеф. вариации

Коеф. трептения

Брой излезли от експлоатация обекти, бр.

Въз основа на извършените изчисления можем да кажем, че стойностите на доверителните интервали, получени по различни методи, се пресичат, така че можете да използвате всеки от методите за изчисление по преценка на оценителя.

Ние обаче вярваме, че при работа в системата estimatica.pro е препоръчително да изберете метод за изчисляване на доверителния интервал в зависимост от степента на развитие на пазара:

  • ако пазарът не е развит, приложете метода на изчисление чрез медианата и стандартното отклонение, тъй като броят на пенсионираните обекти в този случай е малък;
  • ако пазарът е развит, приложете изчислението чрез критичната стойност на t-статистиката (коефициент на Стюдънт), тъй като е възможно да се формира голяма първоначална извадка.

При изготвянето на статията са използвани:

1. Грибовски С.В., Сивец С.А., Левикина И.А. Математически методи за оценка на стойността на имущество. Москва, 2014 г

2. Данни от системата estimatica.pro

Нека CB X образува генералната съвкупност и β е неизвестен параметър CB X. Ако статистическата оценка в * е последователна, тогава колкото по-голям е размерът на извадката, толкова по-точна е стойността на β. На практика обаче нямаме много големи проби, така че не можем да гарантираме по-голяма точност.

Нека s* е статистическа оценка за s. Количество |in* - in| се нарича точност на оценката. Ясно е, че точността е CB, тъй като s* е случайна променлива. Да зададем малък положително число 8 и изискват точността на оценката |in* - in| беше по-малко от 8, т.е. | в* - в |< 8.

Надеждност g или ниво на увереностоценка в чрез in * е вероятността g, с която неравенството |in * - in|< 8, т. е.

Обикновено надеждността на g се задава предварително и за g се приема число, близко до 1 (0,9; 0,95; 0,99; ...).

Тъй като неравенството |in * - in|< S равносильно двойно неравенствов * - С< в < в* + 8, то получаем:

Интервалът (в * - 8, в * + 5) се нарича доверителен интервал, т.е. доверителният интервал покрива неизвестния параметър в с вероятност y. Имайте предвид, че краищата на доверителния интервал са произволни и варират от проба на проба, така че е по-точно да се каже, че интервалът (при * - 8, при * + 8) покрива неизвестния параметър β, а не β принадлежи към този интервал .

Нека генералната съвкупност е дадена от случайна променлива X, разпределена по нормалния закон, освен това е известно стандартното отклонение a. Математическото очакване a = M (X) е неизвестно. Изисква се да се намери доверителен интервал за a за дадена надеждност y.

Примерна средна стойност

е статистическа оценказа xr = a.

Теорема. Случайна стойност xB е нормално разпределен, ако X е нормално разпределен и M(xB) = a,

A (XB) \u003d a, където a \u003d y / B (X), a \u003d M (X). л/и

Доверителният интервал за a има формата:

Намираме 8.

Използване на релацията

където Ф(г) е функцията на Лаплас, имаме:

P ( | XB - a |<8} = 2Ф

намираме стойността на t в таблицата със стойности на функцията на Лаплас.

Обозначаване

T, получаваме F(t) = g

От равенството Find - точността на оценката.

Така доверителният интервал за a има формата:

Ако се даде извадка от общата популация X

нг да се" X2 xm
н. n1 n2 nm

n = U1 + ... + nm, тогава доверителният интервал ще бъде:

Пример 6.35. Намерете доверителния интервал за оценка на очакването a на нормално разпределение с надеждност 0,95, като знаете средната стойност на извадката Xb = 10,43, размера на извадката n = 100 и стандартното отклонение s = 5.

Нека използваме формулата

Да изградим доверителен интервал в MS EXCEL за оценка на средната стойност на разпределението при известна стойност на дисперсията.

Разбира се изборът ниво на довериенапълно зависи от поставената задача. По този начин степента на доверие на пътника в надеждността на самолета, разбира се, трябва да бъде по-висока от степента на доверие на купувача в надеждността на електрическата крушка.

Формулиране на задача

Да приемем, че от населениекато взе пробаразмер n. Предполага се, че стандартно отклонениетова разпределение е известно. Необходимо въз основа на това пробиоцени неизвестното средно разпределение(μ, ) и конструирайте съответния двустранно доверителен интервал.

Точкова оценка

Както е известно от статистика(да го наречем X вж) е безпристрастна оценка на средната стойносттова населениеи има разпределението N(μ;σ 2 /n).

Забележка: Ами ако трябва да построите доверителен интервалв случай на разпространение, което не е нормално?В този случай идва на помощ, което казва, че с достатъчно голям размер проби n от разпространение не- нормално, извадково разпределение на статистики Х срще бъде приблизителнокореспондирам нормална дистрибуцияс параметри N(μ;σ 2 /n).

Така, точкова оценка средата разпределителни стойностиимаме е извадкова средна стойност, т.е. X вж. Сега да се заемем доверителен интервал.

Изграждане на доверителен интервал

Обикновено, знаейки разпределението и неговите параметри, можем да изчислим вероятността случайна променлива да приеме стойност от даден интервал. Сега нека направим обратното: да намерим интервала, в който попада случайната променлива с дадена вероятност. Например от имоти нормална дистрибуцияизвестно е, че с вероятност от 95%, случайна променлива, разпределена върху нормален закон, ще попадне в интервала приблизително +/- 2 от средна стойност(вижте статията за). Този интервал ще служи като наш прототип за доверителен интервал.

Сега да видим дали знаем разпределението , да изчислим този интервал? За да отговорим на въпроса, трябва да уточним формата на разпространение и неговите параметри.

Знаем каква е формата на разпространение нормална дистрибуция(не забравяйте, че говорим за разпределение на пробите статистика X вж).

Параметърът μ ни е неизвестен (просто трябва да се оцени с помощта на доверителен интервал), но имаме оценката му X cf,изчислено въз основа на проба,които могат да се използват.

Вторият параметър е извадково средно стандартно отклонение ще се знае, то е равно на σ/√n.

защото не знаем μ, тогава ще изградим интервала +/- 2 стандартни отклоненияне от средна стойност, но от известната му оценка X вж. Тези. при изчисляване доверителен интервалние НЯМА да приемем това X вжще попадне в интервала +/- 2 стандартни отклоненияот μ с вероятност от 95%, като ще приемем, че интервалът е +/- 2 стандартни отклоненияот X вжс вероятност от 95% ще покрие μ - средната стойност на общата съвкупност,от кое проба. Тези две твърдения са еквивалентни, но второто твърдение ни позволява да конструираме доверителен интервал.

В допълнение, ние прецизираме интервала: случайна променлива, разпределена върху нормален закон, с 95% вероятност попада в интервала +/- 1.960 стандартни отклонения,не +/- 2 стандартни отклонения. Това може да се изчисли с помощта на формулата \u003d НОРМА.СТ.ОБР ((1 + 0,95) / 2), см. примерен файл Sheet Spacing.

Сега можем да формулираме вероятностно твърдение, което ще ни послужи за формиране доверителен интервал:
„Вероятността, че средно населениеразположен от проба среднав рамките на 1.960" стандартни отклонения на средната стойност на извадката", е равно на 95%.

Стойността на вероятността, спомената в твърдението, има специално име , което е свързано сниво на значимост α (алфа) чрез прост израз ниво на доверие =1 . В нашия случай ниво на значимост α =1-0,95=0,05 .

Сега, въз основа на това вероятностно твърдение, ние пишем израз за изчисляване доверителен интервал:

където Zα/2 стандартен нормална дистрибуция(такава стойност на случайна променлива z, Какво П(z>=Zα/2 )=α/2).

Забележка: Горен α/2-квантилопределя ширината доверителен интервалв стандартни отклонения извадкова средна стойност. Горен α/2-квантил стандартен нормална дистрибуциявинаги е по-голямо от 0, което е много удобно.

В нашия случай при α=0,05, горен α/2-квантил е равно на 1,960. За други нива на значимост α (10%; 1%) горен α/2-квантил Zα/2 може да се изчисли по формулата \u003d NORM.ST.OBR (1-α / 2) или, ако е известно ниво на доверие, =NORM.ST.OBR((1+ниво на достоверност)/2).

Обикновено при изграждане доверителни интервали за оценка на средната стойностизползвай само горна α/2-квантили не използвайте по-ниско α/2-квантил. Това е възможно, защото стандартен нормална дистрибуциясиметричен спрямо оста x ( плътност на разпространението мусиметрично около средно, т.е. 0). Следователно няма нужда да се изчислява долен α/2-квантил(нарича се просто α /2-квантил), защото то е равно горна α/2-квантилсъс знак минус.

Спомнете си, че независимо от формата на разпределението на x, съответната случайна променлива X вжразпределени приблизително глоба N(μ;σ 2 /n) (вижте статията за). Следователно, като цяло, горният израз за доверителен интервале само приблизително. Ако x е разпределено върху нормален закон N(μ;σ 2 /n), тогава изразът за доверителен интервале точен.

Изчисляване на доверителен интервал в MS EXCEL

Да решим проблема.
Времето за реакция на електронния компонент към входния сигнал е важна характеристика на устройството. Инженер иска да начертае доверителен интервал за средното време за реакция при ниво на достоверност от 95%. От предишен опит инженерът знае, че стандартното отклонение на времето за реакция е 8 ms. Известно е, че инженерът е направил 25 измервания, за да оцени времето за реакция, средната стойност е 78 ms.

Решение: Един инженер иска да знае времето за реакция на електронно устройство, но той разбира, че времето за реакция не е фиксирана, а случайна променлива, която има собствено разпределение. Така че най-доброто, на което може да се надява, е да определи параметрите и формата на това разпределение.

За съжаление от условието на задачата не знаем формата на разпределението на времето за реакция (не е задължително да е нормално). , това разпределение също е неизвестно. Само той е известен стандартно отклонениеσ=8. Следователно, докато не можем да изчислим вероятностите и да конструираме доверителен интервал.

Въпреки това, въпреки че не знаем разпределението време отделен отговор, знаем, че според CPT, разпределение на пробите средно време за реакцияе приблизително нормално(ще приемем, че условията CPTсе извършват, т.к размерът пробидостатъчно голям (n=25)) .

Освен това, средно аритметичнотова разпределение е равно на средна стойностразпределения на единичния отговор, т.е. μ. НО стандартно отклонениена това разпределение (σ/√n) може да се изчисли по формулата =8/ROOT(25) .

Известно е също, че инженерът е получил точкова оценкапараметър μ равен на 78 ms (X cf). Следователно сега можем да изчислим вероятностите, защото знаем формата за разпространение ( нормално) и неговите параметри (Х ср и σ/√n).

Инженерът иска да знае очаквана стойностμ от разпределението на времето за реакция. Както беше посочено по-горе, това μ е равно на очакване на извадковото разпределение на средното време за отговор. Ако използваме нормална дистрибуция N(X cf; σ/√n), тогава желаното μ ще бъде в диапазона +/-2*σ/√n с вероятност приблизително 95%.

Ниво на значимосте равно на 1-0,95=0,05.

Накрая намерете лявата и дясната граница доверителен интервал.
Лява граница: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / КОРЕН (25) = 74,864
Дясна граница: \u003d 78 + НОРМА. ST. OBR (1-0,05 / 2) * 8 / КОРЕН (25) \u003d 81,136

Лява граница: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Дясна граница: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Отговор: доверителен интервалпри 95% ниво на достоверност и σ=8мсексе равнява 78+/-3.136ms

AT примерен файл на лист Sigmaизвестен създаде форма за изчисляване и изграждане двустранно доверителен интервалза произволно пробис даден σ и ниво на значимост.

Функция CONFIDENCE.NORM().

Ако стойностите пробиса в диапазона B20:B79 , а ниво на значимостравно на 0,05; след това MS EXCEL формула:
=СРЕДНО(B20:B79)-УВЕРЕНИЕ(0,05,σ, БРОЯ(B20:B79))
ще върне лявата граница доверителен интервал.

Същата граница може да се изчисли по формулата:
=СРЕДНО(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(БРОЙ(B20:B79))

Забележка: Функцията TRUST.NORM() се появи в MS EXCEL 2010. По-ранните версии на MS EXCEL използваха функцията TRUST().

Нека една случайна променлива (може да говорим за генерална съвкупност) е разпределена по нормалния закон, за който е известна дисперсията D = 2 (> 0). От генералната съвкупност (на набор от обекти, от които се определя случайна променлива) се прави извадка с размер n. Извадката x 1 , x 2 ,..., x n се разглежда като набор от n независими случайни променливи, разпределени по същия начин като (подхода, обяснен по-горе в текста).

Преди това бяха обсъдени и доказани следните равенства:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Достатъчно е просто да докажем (пропускаме доказателството), че случайната променлива в този случай също е разпределена по нормалния закон.

Нека означим неизвестната стойност M с a и изберем числото d > 0 според дадената надеждност, така че да е изпълнено следното условие:

P(-a< d) = (1)

Тъй като случайната променлива се разпределя по нормалния закон с математическото очакване M = M = a и дисперсията D = D /n = 2 /n, получаваме:

P(-a< d) =P(a - d < < a + d) =

Остава да изберем d така, че равенството

За всяко едно може да се намери такова число t от таблицата, че (t) \u003d / 2. Това число t понякога се нарича квантил.

Сега от равенството

дефинирайте стойността на d:

Получаваме крайния резултат, като представяме формула (1) във формата:

Значението на последната формула е следното: с надеждност, доверителният интервал

обхваща неизвестния параметър a = M от популацията. Може да се каже по различен начин: точковата оценка определя стойността на параметъра M с точност d= t / и надеждност.

Задача. Нека има генерална съвкупност с някаква характеристика, разпределена по нормалния закон с дисперсия, равна на 6,25. Направена е извадка с обем n = 27 и е получена средната извадкова стойност на характеристиката = 12. Намерете доверителния интервал, покриващ неизвестното математическо очакване на изследваната характеристика на генералната съвкупност с надеждност = 0,99.

Решение. Първо, използвайки таблицата за функцията на Лаплас, намираме стойността на t от уравнението (t) \u003d / 2 \u003d 0,495. Въз основа на получената стойност t = 2,58 определяме точността на оценката (или половината от дължината на доверителния интервал) d: d = 2,52,58 / 1,24. От тук получаваме желания доверителен интервал: (10.76; 13.24).

статистическа хипотеза обща вариационна

Доверителен интервал за очакване на нормално разпределение с неизвестна дисперсия

Нека е случайна променлива, разпределена по нормалния закон с неизвестно математическо очакване M, което означаваме с буквата a . Нека направим извадка с размер n. Нека определим средната извадка и коригираната дисперсия на извадката s 2, като използваме известни формули.

Случайна стойност

разпределени по закона на Стюдънт с n - 1 степени на свобода.

Задачата е да се намери такова число t според дадената надеждност и броя на степените на свобода n - 1, така че равенството

или еквивалентно равенство

Тук в скоби е записано условието стойността на неизвестния параметър a да принадлежи към определен интервал, който е доверителният интервал. Неговите граници зависят от надеждността, както и от параметрите на вземане на проби и s.

За да определим стойността на t по величина, трансформираме равенството (2) във формата:

Сега, според таблицата за случайна променлива t, разпределена по закона на Стюдънт, според вероятността 1 - и броя на степените на свобода n - 1, намираме t. Формула (3) дава отговора на проблема.

Задача. При контролни тестове на 20 електрически лампи средната продължителност на тяхната работа е равна на 2000 часа със стандартно отклонение (изчислено като корен квадратен от коригираната дисперсия на извадката) равно на 11 часа. Известно е, че продължителността на работа на лампата е случайна величина с нормално разпределение. Определете с надеждност 0,95 доверителния интервал за математическото очакване на тази случайна променлива.

Решение. Стойността 1 - в този случай е равна на 0,05. Според таблицата за разпределение на Стюдънт, при брой на степените на свобода, равен на 19, намираме: t = 2,093. Нека сега изчислим точността на оценката: 2,093121/ = 56,6. От тук получаваме желания доверителен интервал: (1943.4; 2056.6).