Биографии Характеристики Анализ

Доверителен интервал. Какво представлява и как може да се използва? Вероятности за доверие и нива на значимост

Разгледаните точкови оценки на параметрите на разпределението дават оценка под формата на число, най-близко до стойността на неизвестния параметър. Такива оценки се използват само за голям брой измервания. Колкото по-малък е размерът на извадката, толкова по-лесно е да направите грешка при избора на параметър. За практиката е важно не само да се получи точкова оценка, но и да се определи интервал, наречен фидуциар,между границите на които с даден ниво на увереност

където q - ниво на значимост; х н, х в - долната и горната граница на интервала, намира се истинската стойност на оценения параметър.

Като цяло доверителните интервали могат да бъдат изградени въз основа на Неравенствата на Чебишев.За всеки закон на разпределение на случайна променлива с моменти от първите два реда, горната граница на вероятността, че отклонението на случайната променлива x от центъра на разпределението X c ще попадне в интервала tS x се описва от неравенството на Чебишев

където S x - оценка на RMS разпределението; T е положително число.

За да се намери доверителният интервал, не е необходимо да се знае законът за разпределение на резултатите от наблюденията, но е необходимо да се знае RMS оценката. Интервалите, получени с помощта на неравенството на Чебишев, се оказват твърде широки за практика. По този начин, доверителен интервал от 0,9 за много закони за разпределение съответства на доверителен интервал от 1,6 S X . Неравенството на Чебишев дава в този случай 3.16 S X . В резултат на това не е широко възприето.

В метрологичната практика те се използват основно квантилни оценкидоверителен интервал. Под 100 П- процентен квантил x p разбирайте абсцисата на такава вертикална линия, вляво от която площта под кривата на плътността на разпределението е равна на P%. С други думи, квантил- това е стойността на случайна променлива (грешка) с дадена доверителна вероятност P. Например медианата на разпределението е 50% квантил x 0,5.

На практика се наричат ​​25- и 75% квантили гънки,или квантили на разпределение.Между тях се намират 50% от всички възможни стойности на случайната променлива, а останалите 50% са извън тях. Интервалът от стойности на случайна променлива x между x 0 05 и x 0 95 покрива 90% от всичките й възможни стойности и се нарича междуквантилна празнина с 90% вероятност.Дължината му е d 0,9 \u003d x 0,95 - x 0,05.

Въз основа на този подход концепцията стойности на квантилна грешка,тези. стойности на грешката с дадена вероятност за доверие P - границите на интервала на неопределеност ±дд = ± (x p - x 1-p) / 2 = ± dp /2. На неговата дължина има P% стойности на случайна променлива (грешка), a q = (1-P)% от общия им брой остават извън този интервал.

За да се получи интервална оценка за нормално разпределена случайна променлива, е необходимо:

Определете точковата оценка MO x̅ и RMS S x случайна променлива по формули (6.8) и (6.11), съответно;

Изберете доверителна вероятност Р от препоръчания диапазон от стойности 0,90; 0,95; 0,99;

Намерете горната x in и долната x n граница според уравненията

получени като се вземе предвид (6.1). Стойностите х н и х в се определят от таблиците със стойности на интегралната функция на разпределение F(t ) или функцията на Лаплас Ф(1).

Полученият доверителен интервал удовлетворява условието

(6.13)

където n - брой измерени стойности; zp - аргумент на функцията на Лаплас Ф(1), съответстващ на вероятността Р/2. В такъв случай zp се нарича квантилен фактор. Половината от дължината на доверителния интервал се нарича доверителна граница на грешката на резултата от измерването.

Пример 6.1. Извършени са 50 измервания на постоянно съпротивление. Определете доверителния интервал за стойността на MO на постоянното съпротивление, ако законът на разпределение е нормален с параметрите m x \u003d R \u003d 590 Ohm, S x \u003d 90 Ohm с доверителна вероятност P \u003d 0,9.

Тъй като хипотезата за нормалността на закона за разпределение не противоречи на експерименталните данни, доверителният интервал се определя по формулата

Следователно Ф(z р ) = 0,45. От таблицата, дадена в Приложение 1, намираме това zp = 1,65. Следователно доверителният интервал ще бъде записан във формуляра

Или 590 - 21< R < 590 + 21. Окончательно 509 Ом < Р< 611 Ом.

Ако законът за разпределение на случайна променлива се различава от нормалния, е необходимо да се изгради нейният математически модел и да се определи доверителният интервал с помощта на него.

Разгледаният метод за намиране на доверителни интервали е валиден за достатъчно голям брой наблюдения n кога с= S x . Трябва да се помни, че изчислената RMS оценка S x е само някакво приближение до истинската стойностс. Определянето на доверителния интервал за дадена вероятност е толкова по-малко надеждно, колкото по-малък е броят на наблюденията. Невъзможно е да се използват нормални формули за разпределение с малък брой наблюдения, ако не е възможно теоретично, въз основа на предварителни експерименти с достатъчно голям брой наблюдения, да се определи стандартното отклонение.

Изчисляване на доверителните интервали за случая, когато разпределението на резултатите от наблюдението е нормално, но дисперсията им е неизвестна, т.е. с малък брой наблюдения n е възможно да се извърши с помощта на разпределението на Стюдънт S(t, k ). Той описва плътността на разпределение на съотношението (дробите на Стюдънт):

където Q - истинската стойност на измерената стойност. x стойности̅, S x. и S x ̅ се изчисляват на базата на експериментални данни и представляват точкови оценки на МО, RMS на резултатите от измерването и RMS на средноаритметичното.

Вероятността частта на Студент в резултат на извършените наблюдения да приеме някаква стойност в интервала (- t p ; + t p )

(6.14)

където k - броят на степените на свобода, равен на (n - 1). Количества tp (наречен в този случай студентски коефициенти),изчислени с помощта на последните две формули за различни стойности на нивото на доверие и броят на измерванията са таблични (виж таблицата в Приложение 1). Следователно, използвайки разпределението на Стюдънт, може да се намери вероятността отклонението на средното аритметично от истинската стойност на измерената стойност да не надвишава

В случаите, когато разпределението на случайните грешки не е нормално, често се използва разпределението на Стюдънт с приближение, чиято степен остава неизвестна. Разпределението на Студент се използва, когато броят на измерваниятан < 30, поскольку уже при н = 20, ...,30 става нормално и вместо уравнение (6.14) може да се използва уравнение (6.13). Резултатът от измерването се записва като: ; П = R d, където R d - специфична стойност на нивото на доверие. Фактор T с голям брой измерваниян е равен на квантилния фактор z p. За малки n той е равен на коефициента на Студент.

Полученият резултат от измерването не е едно конкретно число, а е интервал, в който с определена вероятност P d се намира истинската стойност на измерената стойност. Осветяването на средата на интервала x изобщо не означава, че истинската стойност е по-близо до него, отколкото до останалите точки в интервала. Може да бъде навсякъде в интервала и с вероятност 1 - R d дори извън него.

Пример 6.2. Определянето на специфичните магнитни загуби за различни проби от една партида електротехническа стомана марка 2212 дава следните резултати: 1,21; 1,17; 1,18; 1.13; 1,19; 1,14; 1,20 и 1,18 W/kg. Ако приемем, че няма системна грешка и случайната грешка се разпределя според нормалния закон, е необходимо да се определи доверителният интервал за стойностите на доверителната вероятност от 0,9 и 0,95. За да разрешите проблема, използвайте формулата на Лаплас и разпределението на Стюдънт.

Използвайки формули (6.8) в (6.11), намираме оценки на средноаритметичната стойност и RMS на резултатите от измерването. Те са съответно равни на 1,18 и 0,0278 W/kg. Ако приемем, че RMS оценката е равна на самото отклонение, намираме:


Следователно, използвайки стойностите на функцията на Лаплас, дадени в таблицата на Приложение 1, ние определяме товаzp = 1,65. За P = 0,95 коеф zp =1,96. Доверителните интервали, съответстващи на P = 0,9 и 0,95, са 1,18 ± 0,016 и 1,18 ± 0,019 W/kg.

В случай, че няма причина да се смята, че стандартното отклонение и неговата оценка са равни, доверителният интервал се определя въз основа на разпределението на Стюдънт:

Според таблицата в Приложение 1 намираме това t 0,9 = 1,9 и t 0,95 = 2,37. Следователно доверителните интервали са съответно равни на 1,18±0,019 и 1,18±0,023 W/kg.

Тестови въпроси.

1. При какви условия грешката в измерването може да се счита за случайна променлива?

2. Избройте свойствата на интегралните и диференциалните функции на разпределение на случайна променлива.

3. Назовете числените параметри на законите за разпределение.

4. Как може да се дефинира разпределителен център?

5. Какво представляват разпределителните моменти? Кои от тях са намерили приложение в метрологията?

6. Посочете основните класове разпределения, използвани в метрологията.

7. Дайте описание на разпределенията, включени в класа трапецовидни разпределения.

8. Какво представляват експоненциалните разпределения? Какви са техните свойства и характеристики?

9. Какво е нормално разпределение? Защо играе специална роля в метрологията?

10. Какво представлява функцията на Лаплас и за какво се използва?

11. Как се описва и използва фамилията дистрибуции на Student?

12. Какви точкови оценки на законите за разпределение знаете? Какви са изискванията към тях?

13. Какво е доверителен интервал? Какви "методи за неговото възлагане знаете?

В който с една или друга вероятност има общ параметър. Вероятностите, признати за достатъчни за уверена преценка относно общите параметри въз основа на примерни индикатори, се наричат фидуциар.

Концепцията за доверителните вероятности следва от принципа, че малко вероятните събития се считат за практически невъзможни, а събития, чиято вероятност е близка до единица, се приемат за почти сигурни. Обикновено за увереност се използват вероятностите Р 1 = 0,95, Р 2 = 0,99, Р 3 = 0,999. На определени стойности на вероятностите съответстват нива на значимост, което се разбира като разлика α = 1-Р. Вероятност от 0,95 съответства на ниво на значимост α 1 = 0,05 (5%), вероятност от 0,99 - α 2 = 0,01 (1%), вероятност от 0,999 - α 3 = 0,001 (0,1%).

Това означава, че при оценката на общите параметри въз основа на селективни показатели съществува риск да се направи грешка в първия случай 1 път на 20 теста, т.е. в 5% от случаите; във втория - 1 път на 100 опита, т.е. в 1% от случаите; в третия - 1 път на 1000 теста, т.е. в 0,1% от случаите. По този начин нивото на значимост показва вероятността за получаване на случайно отклонение от резултатите, установени с определена вероятност. Вероятностите, взети за увереност, определят доверителния интервал между тях. Те могат да се използват за основаване на оценката на определено количество и границите, в които то може да бъде при различни вероятности.

За различни вероятности доверителните интервали ще бъдат както следва:

Р 1 = 0.95 интервал - 1.96σ до + 1.96σ (фиг. 5)

Р 2 = 0.99 интервал - 2.58σ до + 2.58σ

Р 3 = 0.999 интервал - 3.03σ до + 3.03σ

Вероятностите за доверие съответстват на следните стойности на нормализираните отклонения:

Вероятността Р 1 = 0,95 съответства на t 1 = 1,96σ

Вероятността Р 2 = 0,99 съответства на t 2 = 2,58σ

Вероятността Р 3 = 0,999 съответства на t 3 = 3,03σ

Изборът на един или друг праг на доверие се извършва въз основа на важността на събитието. Нивото на значимост в този случай е вероятността да бъде решено да се пренебрегне това изследване или явление.

Средна грешка (m) или грешка на представителността.

Характеристиките на извадката като правило не съвпадат по абсолютна стойност със съответните общи параметри. Степента на отклонение на извадковия показател от общия му параметър се нарича статистическа грешка или грешка на представителността. Статистическите грешки са присъщи само на характеристиките на извадката, те възникват в процеса на избор на опция от генералната съвкупност.


Средната грешка се изчислява по формулата:

където σ е стандартното отклонение,

n е броят на измерванията (размер на извадката).

Изразено в същите единици като .

Стойността на средната грешка е обратно пропорционална на размера на извадката. Колкото по-голям е размерът на извадката, толкова по-малка е средната грешка и следователно толкова по-малко е несъответствието между стойностите на характеристиките в извадката и общата съвкупност.

Средната грешка на извадката може да се използва за оценка на средната стойност на съвкупността според нормалното разпределение. И така, в рамките на ±1 са 68,3% от всички извадкови средни аритметични, в рамките на ±2 - 95,5% от всички извадкови средни, в рамките на ±3 - 99,7% от всички извадкови средни.

Точност на оценката, ниво на достоверност (надеждност)

Доверителен интервал

При вземане на проби от малък обем трябва да се използват интервални оценки. това прави възможно избягването на груби грешки, за разлика от точковите оценки.

Извиква се интервална оценка, която се определя от две числа – краищата на интервала, покриващ оценявания параметър. Интервалните оценки позволяват да се установи точността и надеждността на оценките.

Нека статистическата характеристика *, намерена от извадковите данни, служи като оценка на неизвестния параметър. Ще приемем, че това е постоянно число (може да е случайна променлива). Ясно е, че * определя параметъра β по-точно, колкото по-малка е абсолютната стойност на разликата | - * |. С други думи, ако >0 и | - * |< , то чем меньше, тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Статистическите методи обаче не позволяват категорично да се твърди, че оценката * удовлетворява неравенството | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Надеждността (вероятността за доверие) на оценката за * е вероятността, с която неравенството | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Нека вероятността | - *|<, равна т.е.

Замяна на неравенството | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

R(*-< <*+)=.

Доверителният интервал се нарича (*-, *+), който покрива неизвестния параметър с дадена надеждност.

Доверителни интервали за оценка на математическото очакване на нормално разпределение, когато са известни.

Интервална оценка с надеждността на математическото очакване a на нормално разпределен количествен признак X от средната стойност на извадката x с известно стандартно отклонение на генералната съвкупност е доверителният интервал

x - t(/n^?)< a < х + t(/n^?),

където t(/n^?)= е точността на оценката, n е обемът на извадката, t е стойността на аргумента на функцията на Лаплас Ф(t), при която Ф(t)=/2.

От равенството t(/n^?)= можем да направим следните заключения:

1. с увеличаване на размера на извадката n броят намалява и следователно точността на оценката се увеличава;

2. повишаването на надеждността на оценката = 2Ф(t) води до нарастване на t (Ф(t) е нарастваща функция), следователно до нарастване; с други думи, увеличаването на надеждността на класическата оценка води до намаляване на нейната точност.

Пример. Случайната променлива X има нормално разпределение с известно стандартно отклонение =3. Намерете доверителните интервали за оценка на неизвестното очакване a от средните стойности на извадката x, ако размерът на извадката е n = 36 и надеждността на оценката е зададена на 0,95.

Решение. Да намерим t. От връзката 2Ф(t) = 0,95 получаваме Ф (t) = 0,475. Според таблицата намираме t=1,96.

Намерете точността на оценката:

измерване на доверителния интервал на точност

T(/n^?)= (1,96,3)//36 = 0,98.

Доверителният интервал е: (x - 0,98; x + 0,98). Например, ако x = 4,1, тогава доверителният интервал има следните граници на доверителност:

х - 0,98 = 4,1 - 0,98 = 3,12; х + 0,98 = 4,1 + 0,98 = 5,08.

По този начин стойностите на неизвестния параметър a, в съответствие с данните от извадката, удовлетворяват неравенството 3.12< а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Нека обясним значението на дадената надеждност. Надеждност = 0,95 показва, че ако се вземат достатъчно голям брой проби, тогава 95% от тях определят такива доверителни интервали, в които параметърът действително е затворен; само в 5% от случаите може да надхвърли доверителния интервал.

Ако се изисква да се оцени математическото очакване с предварително определена точност и надеждност, тогава минималният размер на извадката, който ще гарантира тази точност, се намира по формулата

Доверителни интервали за оценка на математическото очакване на нормално разпределение с неизвестно

Интервална оценка с надеждността на математическото очакване a на нормално разпределен количествен признак X от средната стойност на извадката x с неизвестно стандартно отклонение на генералната съвкупност е доверителният интервал

x - t()(s/n^?)< a < х + t()(s/n^?),

където s е "коригираното" стандартно отклонение на извадката, t() се намира в таблицата според даденото и n.

Пример. Количественият атрибут X на генералната съвкупност е нормално разпределен. Въз основа на размера на извадката n=16 бяха установени средната стойност на извадката x = 20,2 и „коригираното“ стандартно отклонение s = 0,8. Оценете неизвестната средна стойност, като използвате доверителен интервал с надеждност 0,95.

Решение. Нека намерим t(). Използвайки таблицата, за = 0,95 и n=16 намираме t()=2,13.

Нека намерим границите на доверие:

x - t () (s / n ^?) \u003d 20,2 - 2,13 *. 0,8/16^? = 19,774

x + t()(s/n^?) = 20,2 + 2,13 * 0,8/16^? = 20,626

И така, с надеждност от 0,95, неизвестният параметър a се съдържа в доверителен интервал от 19,774< а < 20,626

Оценка на истинската стойност на измерената стойност

Нека се направят n независими равни измервания на някаква физическа величина, чиято истинска стойност е неизвестна.

Резултатите от отделните измервания ще разглеждаме като случайни величини Хl, Х2,…Хn. Тези величини са независими (измерванията са независими). Те имат едно и също математическо очакване a (истинската стойност на измерената стойност), еднакви дисперсии ^2 (еквивалентни измервания) и са нормално разпределени (това предположение се потвърждава от опита).

По този начин всички предположения, направени при извличането на доверителните интервали, са изпълнени и следователно сме свободни да използваме формули. С други думи, истинската стойност на измереното количество може да бъде оценена от средноаритметичното на резултатите от отделните измервания, като се използват доверителни интервали.

Пример. Въз основа на данните от девет независими еднакво точни измервания на физична величина са установени средноаритметичното от резултатите от отделните измервания x = 42,319 и „коригираното“ стандартно отклонение s = 5,0. Изисква се оценка на истинската стойност на измерената величина с надеждност = 0,95.

Решение. Истинската стойност на измерената величина е равна на нейното математическо очакване. Следователно проблемът се свежда до оценка на математическото очакване (в неизвестното) с помощта на доверителен интервал, покриващ a с дадена надеждност = 0,95.

x - t()(s/n^?)< a < х + t()(s/n^?)

Използвайки таблицата, за y \u003d 0,95 и l \u003d 9 намираме

Намерете точността на оценката:

t()(s/n^?) = 2,31 * 5/9^?=3,85

Нека намерим границите на доверие:

x - t () (s / n ^?) \u003d 42,319 - 3,85 \u003d 38,469;

x + t () (s / n ^?) \u003d 42,319 + 3,85 \u003d 46,169.

Така че, с надеждност от 0,95, истинската стойност на измерената стойност се намира в доверителния интервал от 38,469< а < 46,169.

Доверителни интервали за оценка на стандартното отклонение на нормално разпределение.

Нека количественият атрибут X на генералната съвкупност е разпределен нормално. Изисква се да се оцени неизвестното общо стандартно отклонение от "коригираното" извадково стандартно отклонение s. За да направим това, използваме оценката на интервала.

Интервална оценка (с надеждност) на стандартното отклонение o на нормално разпределен количествен атрибут X от „коригираното“ извадково стандартно отклонение s е доверителният интервал

s (1 -- q)< < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

където q се намира съгласно таблицата за дадено n n.

Пример 1. Количественият признак X на генералната съвкупност е нормално разпределен. Въз основа на извадка с размер n = 25 беше намерено „коригирано“ стандартно отклонение s = 0,8. Намерете доверителния интервал, покриващ общото стандартно отклонение с надеждност 0,95.

Решение. Според таблицата, според данните = 0,95 и n = 25, намираме q = 0,32.

Необходимият доверителен интервал s (1 -- q)< < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

Пример 2. Количественият признак X на генералната съвкупност е нормално разпределен. Въз основа на извадка с размер n=10 беше намерено „коригирано“ стандартно отклонение s = 0,16. Намерете доверителния интервал, покриващ общото стандартно отклонение с надеждност 0,999.

Решение. Според таблицата на приложението, според данните = 0,999 и n=10, намираме 17= 1,80 (q > 1). Желаният доверителен интервал е:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

Степенточност на измерване

В теорията на грешките е обичайно да се характеризира точността на измерване (точността на инструмента), като се използва стандартното отклонение на случайните грешки на измерването. За оценка се използва "коригираното" стандартно отклонение s. Тъй като резултатите от измерването обикновено са взаимно независими, имат едно и също математическо очакване (истинската стойност на измереното количество) и същата дисперсия (в случай на еднакво точни измервания), теорията, представена в предходния параграф, е приложима за оценка на измерването точност.

Пример. Въз основа на 15 еднакво точни измервания е установено „коригирано“ стандартно отклонение s = 0,12. Намерете точността на измерване с надеждност 0,99.

Решение. Точността на измерване се характеризира със стандартното отклонение на случайните грешки, така че проблемът се свежда до намиране на доверителния интервал s (1 - q)< < s (1 + q) , покрывающего с заданной надежностью 0,99

Според таблицата за приложение за = 0,99 и n=15 намираме q = 0,73.

Желаният доверителен интервал

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Оценка на вероятността (биномно разпределение) чрез относителна честота

Интервалната оценка (с надеждност) на неизвестната вероятност p от биномното разпределение по отношение на относителната честота w е доверителният интервал (с приблизителни краища p1 и p2)

p1< p < p2,

където n е общият брой тестове; m е броят на повторенията на събитието; w е относителната честота, равна на отношението m/n; t е стойността на аргумента на функцията на Лаплас, при която Ф(t) = /2.

Коментирайте. За големи стойности на n (от порядъка на стотици) можете да вземете като приблизителни граници на доверителния интервал

Често оценителят трябва да анализира пазара на недвижими имоти в сегмента, в който се намира обектът на оценка. Ако пазарът е развит, може да бъде трудно да се анализира целия набор от представени обекти, следователно за анализ се използва извадка от обекти. Тази извадка не винаги е хомогенна, понякога се налага нейното изчистване от крайности - твърде високи или твърде ниски пазарни оферти. За целта се прилага доверителен интервал. Целта на това изследване е да се извърши сравнителен анализ на два метода за изчисляване на доверителния интервал и да се избере най-добрият вариант за изчисление при работа с различни проби в системата estimatica.pro.

Доверителен интервал - изчислен въз основа на извадката, интервалът от стойности на характеристиката, който с известна вероятност съдържа оценения параметър на генералната съвкупност.

Смисълът на изчисляването на доверителния интервал е да се изгради такъв интервал въз основа на данните от извадката, така че да може да се твърди с дадена вероятност, че стойността на оценения параметър е в този интервал. С други думи, доверителният интервал с определена вероятност съдържа неизвестната стойност на оцененото количество. Колкото по-широк е интервалът, толкова по-голяма е неточността.

Има различни методи за определяне на доверителния интервал. В тази статия ще разгледаме 2 начина:

  • чрез медианата и стандартното отклонение;
  • чрез критичната стойност на t-статистиката (коефициент на Стюдънт).

Етапи на сравнителен анализ на различни методи за изчисляване на CI:

1. формира извадка от данни;

2. обработваме го със статистически методи: изчисляваме средна стойност, медиана, дисперсия и др.;

3. изчисляваме доверителния интервал по два начина;

4. Анализирайте почистените проби и получените доверителни интервали.

Етап 1. Извадка от данни

Извадката е формирана чрез системата estimatica.pro. Извадката включва 91 оферти за продажба на 1-стайни апартаменти в 3-та ценова зона с тип планиране "Хрушчов".

Таблица 1. Първоначална проба

Цената на 1 кв.м., к.у.

Фиг. 1. Първоначална проба



Етап 2. Обработка на първоначалната проба

Обработката на извадката чрез статистически методи изисква изчисляване на следните стойности:

1. Средно аритметично

2. Медиана - число, което характеризира извадката: точно половината от елементите на извадката са по-големи от медианата, другата половина е по-малка от медианата

(за извадка с нечетен брой стойности)

3. Диапазон - разликата между максималните и минималните стойности в извадката

4. Дисперсия - използва се за по-точна оценка на вариацията в данните

5. Стандартното отклонение за извадката (наричано по-нататък RMS) е най-често срещаният индикатор за дисперсията на коригиращите стойности около средноаритметичната стойност.

6. Коефициент на вариация - отразява степента на дисперсия на коригиращите стойности

7. коефициент на колебание - отразява относителното колебание на екстремните стойности на цените в извадката около средната

Таблица 2. Статистически показатели на оригиналната извадка

Коефициентът на вариация, който характеризира хомогенността на данните, е 12,29%, но коефициентът на колебание е твърде голям. По този начин можем да заявим, че оригиналната извадка не е хомогенна, така че нека да преминем към изчисляване на доверителния интервал.

Етап 3. Изчисляване на доверителния интервал

Метод 1. Изчисляване чрез медиана и стандартно отклонение.

Доверителният интервал се определя, както следва: минималната стойност - стандартното отклонение се изважда от медианата; максималната стойност - стандартното отклонение се добавя към медианата.

Така доверителният интервал (47179 CU; 60689 CU)

Ориз. 2. Стойности в рамките на доверителен интервал 1.



Метод 2. Изграждане на доверителен интервал чрез критичната стойност на t-статистиката (коефициент на Стюдънт)

С.В. Грибовски в книгата "Математически методи за оценка на стойността на имуществото" описва метод за изчисляване на доверителния интервал чрез коефициента на Стюдент. При изчисляване по този метод самият оценител трябва да зададе нивото на значимост ∝, което определя вероятността, с която ще бъде изграден доверителният интервал. Обикновено се използват нива на значимост от 0,1; 0,05 и 0,01. Те съответстват на доверителни вероятности от 0,9; 0,95 и 0,99. С този метод истинските стойности на математическото очакване и дисперсията се считат за практически неизвестни (което почти винаги е вярно при решаване на практически задачи за оценка).

Формула за доверителен интервал:

n - размер на извадката;

Критичната стойност на t-статистиките (разпределенията на Стюдънт) с ниво на значимост ∝, броят на степените на свобода n-1, което се определя от специални статистически таблици или с помощта на MS Excel (→"Статистически"→ СТУДРАСПОБР);

∝ - ниво на значимост, приемаме ∝=0,01.

Ориз. 2. Стойности в рамките на доверителния интервал 2.

Стъпка 4. Анализ на различни начини за изчисляване на доверителния интервал

Два метода за изчисляване на доверителния интервал - чрез медианата и коефициента на Стюдънт - доведоха до различни стойности на интервалите. Съответно бяха получени две различни пречистени проби.

Таблица 3. Статистически показатели за три извадки.

Индекс

Първоначална проба

1 вариант

Вариант 2

Означава

дисперсия

Коеф. вариации

Коеф. трептения

Брой излезли от експлоатация обекти, бр.

Въз основа на извършените изчисления можем да кажем, че стойностите на доверителните интервали, получени по различни методи, се пресичат, така че можете да използвате всеки от методите за изчисление по преценка на оценителя.

Ние обаче вярваме, че при работа в системата estimatica.pro е препоръчително да изберете метод за изчисляване на доверителния интервал в зависимост от степента на развитие на пазара:

  • ако пазарът не е развит, приложете метода на изчисление чрез медианата и стандартното отклонение, тъй като броят на пенсионираните обекти в този случай е малък;
  • ако пазарът е развит, приложете изчислението чрез критичната стойност на t-статистиката (коефициент на Стюдънт), тъй като е възможно да се формира голяма първоначална извадка.

При изготвянето на статията са използвани:

1. Грибовски С.В., Сивец С.А., Левикина И.А. Математически методи за оценка на стойността на имущество. Москва, 2014 г

2. Данни от системата estimatica.pro

Анализът на случайните грешки се основава на теорията на случайните грешки, което позволява с определена гаранция да се изчисли действителната стойност на измереното количество и да се оценят възможните грешки.

В основата на теорията за случайните грешки са следните предположения:

при голям брой измервания еднакво често възникват случайни грешки със същата величина, но с различен знак;

големите грешки са по-рядко срещани от малките (вероятността за грешка намалява с увеличаване на нейната стойност);

при безкрайно голям брой измервания истинската стойност на измереното количество е равна на средноаритметичното от всички резултати от измерването;

появата на един или друг резултат от измерването като случайно събитие се описва от нормалния закон за разпределение.

На практика се прави разлика между общ и примерен набор от измервания.

Под общата популация предполагат целия набор от възможни стойности на измерване или възможни стойности на грешка
.

За примерна популация брой измервания ограничени и във всеки случай строго определени. Те смятат, че ако
, тогава средната стойност на този набор от измервания достатъчно близо до истинската си стойност.

1. Интервална оценка с помощта на доверителната вероятност

За голяма извадка и нормален закон на разпределение общата оценъчна характеристика на измерването е дисперсията
и коефициент на вариация :

;
. (1.1)

Дисперсията характеризира хомогенността на измерването. Колкото по-високо
, толкова по-голямо е разсейването на измерването.

Коефициентът на вариация характеризира променливостта. Колкото по-високо , толкова по-голяма е променливостта на измерванията спрямо средните стойности.

За да се оцени надеждността на резултатите от измерването, се въвеждат понятията доверителен интервал и доверителна вероятност.

Доверен се нарича интервал стойности , в който попада истинската стойност измерено количество с дадена вероятност.

Вероятност за увереност (надеждност) на измерване е вероятността истинската стойност на измереното количество да попадне в даден доверителен интервал, т.е. към зоната
. Тази стойност се определя в части от единица или в проценти.

,

където
- интегрална функция на Лаплас ( таблица 1.1 )

Интегралната функция на Лаплас се определя от следния израз:

.

Аргументът на тази функция е гаранционен фактор :

Таблица 1.1

Интегрална функция на Лаплас

Ако въз основа на определени данни се установи доверителна вероятност (често се приема за
), след това задайте точност на измерванията (доверителен интервал
) въз основа на съотношението

.

Половината от доверителния интервал е

, (1.3)

където
- аргумент на функцията на Лаплас, ако
(таблица 1.1 );

- Функции на ученика, ако
(таблица 1.2 ).

Така доверителният интервал характеризира точността на измерване на дадена проба, а нивото на доверителност характеризира надеждността на измерването.

Пример

Изпълнено
измервания на якостта на настилката на участък от магистрала със среден модул на еластичност
и изчислената стойност на стандартното отклонение
.

Необходимо определяне на необходимата точностизмервания за различни нива на доверие
, като се вземат стойностите На таблица 1.1 .

В този случай съответно |

Следователно, за даден измервателен инструмент и метод, доверителният интервал се увеличава с около пъти, ако увеличите просто на
.