Biografije Karakteristike Analiza

Interval povjerenja. Šta je to i kako se može koristiti? Vjerojatnosti povjerenja i nivoi značaja

Razmatrane tačkaste procjene parametara distribucije daju procjenu u obliku broja najbližeg vrijednosti nepoznatog parametra. Takve procjene se koriste samo za veliki broj mjerenja. Što je manji uzorak, lakše je pogriješiti pri odabiru parametra. Za praksu je važno ne samo dobiti procjenu tačke, već i odrediti interval tzv fiducijar, između čijih granica sa datim nivo samopouzdanja

gdje je q - nivo značajnosti; h n, h v - donja i gornja granica intervala, pronalazi se prava vrijednost procijenjenog parametra.

Općenito, intervali povjerenja mogu se izgraditi na osnovu Čebiševljeve nejednakosti. Za bilo koji zakon raspodjele slučajne varijable s momentima prva dva reda, gornja granica vjerovatnoće da će odstupanje slučajne varijable x od centra raspodjele X c pasti u interval tSx je opisana Čebiševljevom nejednakošću

gdje je S x - evaluacija RMS distribucije; t je pozitivan broj.

Za pronalaženje intervala povjerenja nije potrebno poznavati zakon distribucije rezultata posmatranja, ali je potrebno znati RMS procjenu. Pokazalo se da su intervali dobijeni upotrebom Čebiševe nejednakosti preširoki za praksu. Dakle, interval povjerenja od 0,9 za mnoge zakone distribucije odgovara intervalu povjerenja od 1,6 S X . Čebiševljeva nejednakost daje u ovom slučaju 3.16 S X . Kao rezultat toga, nije široko prihvaćen.

U metrološkoj praksi se uglavnom koriste kvantilne procjene interval povjerenja. Ispod 100 P-procentualni kvantil x p shvatiti apscisu takve vertikalne linije, lijevo od koje je površina ispod krive gustine raspodjele jednaka P%. Drugim riječima, kvantil- ovo je vrijednost slučajne varijable (greške) sa datom vjerovatnoćom pouzdanosti P. Na primjer, medijan distribucije je 50% kvantil x 0,5.

U praksi se nazivaju kvantili od 25 i 75%. nabori, ili kvantili distribucije. Između njih se nalazi 50% svih mogućih vrijednosti slučajne varijable, a preostalih 50% je izvan njih. Interval vrijednosti slučajne varijable x između x 0 05 i x 0 95 pokriva 90% svih mogućih vrijednosti i naziva se međukvantilni jaz sa verovatnoćom od 90%. Njegova dužina je d 0,9 \u003d x 0,95 - x 0,05.

Na osnovu ovog pristupa, koncept kvantilne vrijednosti greške, one. vrijednosti greške sa datom vjerovatnoćom pouzdanosti P - granice intervala nesigurnosti ±D D = ± (x p - x 1-p) / 2 = ± dp /2. Na njegovoj dužini nalazi se P% vrijednosti slučajne varijable (greške), a q = (1-P)% njihovog ukupnog broja ostaju izvan ovog intervala.

Da biste dobili procjenu intervala za normalno raspoređenu slučajnu varijablu, potrebno je:

Odrediti procjenu tačke MO x̅ i RMS S x slučajna varijabla prema formulama (6.8) i (6.11), respektivno;

Odaberite vjerovatnoću pouzdanosti R iz preporučenog raspona vrijednosti 0,90; 0,95; 0,99;

Nađite gornje x in i donje x n granice prema jednadžbi

dobijeno uzimajući u obzir (6.1). Vrijednosti h n i h v određuju se iz tablica vrijednosti integralne funkcije distribucije F(t ) ili Laplaceovu funkciju F(1).

Dobijeni interval pouzdanosti zadovoljava uslov

(6.13)

gdje je n - broj izmjerenih vrijednosti; zp - argument Laplaceove funkcije F(1) koji odgovara vjerovatnoći R/2. U ovom slučaju zp naziva se kvantilni faktor. Pola dužine intervala pouzdanosti naziva se granica pouzdanosti greške rezultata mjerenja.

Primjer 6.1. Izvršeno je 50 mjerenja konstantnog otpora. Odredite interval pouzdanosti za MO vrijednost konstantnog otpora ako je zakon raspodjele normalan s parametrima m x = R = 590 Ohm, S x \u003d 90 Ohm sa sigurnošću pouzdanosti P \u003d 0,9.

Budući da hipoteza o normalnosti zakona raspodjele nije u suprotnosti s eksperimentalnim podacima, interval povjerenja je određen formulom

Stoga F(z r ) = 0,45. Iz tabele date u Dodatku 1, to nalazimo zp = 1,65. Stoga će interval povjerenja biti zapisan u obliku

Ili 590 - 21< R < 590 + 21. Окончательно 509 Ом < R< 611 Ом.

Ako se zakon raspodjele slučajne varijable razlikuje od normalnog, potrebno je izgraditi njen matematički model i pomoću njega odrediti interval povjerenja.

Razmatrana metoda za pronalaženje intervala povjerenja vrijedi za dovoljno veliki broj opservacija n kada s= S x . Treba imati na umu da je izračunata RMS procjena S x je samo neka aproksimacija pravoj vrijednostis. Određivanje intervala pouzdanosti za datu vjerovatnoću je manje pouzdano, što je manji broj opservacija. Nemoguće je koristiti formule normalne distribucije sa malim brojem opažanja, ako teoretski nije moguće, na osnovu preliminarnih eksperimenata sa dovoljno velikim brojem opažanja, odrediti standardnu ​​devijaciju.

Izračunavanje intervala pouzdanosti za slučaj kada je distribucija rezultata posmatranja normalna, ali je njihova varijansa nepoznata, tj. sa malim brojem zapažanja n, moguće je izvesti korištenjem Studentove distribucije S(t, k ). On opisuje gustinu distribucije omjera (Studentovi razlomci):

gdje je Q - pravu vrijednost izmjerene vrijednosti. x vrijednosti̅ , S x . i S x ̅ izračunate su na osnovu eksperimentalnih podataka i predstavljaju bodovne procjene MO, RMS rezultata mjerenja i RMS aritmetičke sredine.

Vjerovatnoća da će Studentov razlomak kao rezultat izvršenih zapažanja poprimiti neku vrijednost u intervalu (- t p ; + t p )

(6.14)

gdje je k - broj stepena slobode, jednak (n - 1). Količine tp (naziva se u ovom slučaju studentski koeficijenti), izračunato korištenjem posljednje dvije formule za različite vrijednosti nivoa pouzdanosti i tabelarno su prikazani broj mjerenja (vidi tabelu u Dodatku 1). Stoga, koristeći Studentovu distribuciju, može se naći vjerovatnoća da odstupanje aritmetičke sredine od prave vrijednosti izmjerene vrijednosti ne prelazi

U onim slučajevima gde raspodela slučajnih grešaka nije normalna, često se koristi Studentova raspodela sa aproksimacijom čiji stepen ostaje nepoznat. Studentova raspodjela se koristi kada se broj mjerenja n < 30, поскольку уже при n = 20, ...,30 postaje normalno i umjesto jednačine (6.14) može se koristiti jednačina (6.13). Rezultat mjerenja se piše kao: ; P = R d, gdje je R d - specifična vrijednost nivoa pouzdanosti. Faktor t sa velikim brojem merenja n jednak je kvantilnom faktoru z p . Za male n jednak je Studentovom koeficijentu.

Rezultirajući rezultat mjerenja nije jedan određeni broj, već je interval unutar kojeg se, sa određenom vjerovatnoćom P d, nalazi prava vrijednost izmjerene vrijednosti. Isticanje sredine intervala x uopće ne znači da je prava vrijednost bliža njoj nego ostalim tačkama u intervalu. Može biti bilo gdje u intervalu, a sa vjerovatnoćom od 1 - R d čak i izvan njega.

Primjer 6.2. Određivanje specifičnih magnetnih gubitaka za različite uzorke jedne serije elektro čelika marke 2212 dalo je sljedeće rezultate: 1,21; 1.17; 1.18; 1.13; 1.19; 1.14; 1,20 i 1,18 W/kg. Pod pretpostavkom da ne postoji sistematska greška, a slučajna greška je raspoređena po normalnom zakonu, potrebno je odrediti interval poverenja za vrednosti verovatnoće poverenja od 0,9 i 0,95. Da biste riješili problem, koristite Laplaceovu formulu i Studentovu distribuciju.

Koristeći formule (6.8) u (6.11), nalazimo procjene srednje aritmetičke vrijednosti i RMS rezultata mjerenja. One su, respektivno, jednake 1,18 odnosno 0,0278 W/kg. Uz pretpostavku da je RMS procjena jednaka samom odstupanju, nalazimo:


Dakle, koristeći vrijednosti Laplaceove funkcije date u tabeli Dodatka 1, to utvrđujemozp = 1,65. Za P = 0,95 koeficijent zp =1,96. Intervali pouzdanosti koji odgovaraju P = 0,9 i 0,95 su 1,18 ± 0,016 i 1,18 ± 0,019 W/kg.

U slučaju kada nema razloga vjerovati da su standardna devijacija i njena procjena jednake, interval povjerenja se određuje na osnovu Studentove distribucije:

Prema tabeli u Dodatku 1, to nalazimo t 0,9 = 1,9 i t 0,95 = 2,37. Dakle, intervali pouzdanosti su, respektivno, jednaki 1,18±0,019 i 1,18±0,023 W/kg.

Test pitanja.

1. Pod kojim uslovima se greška mjerenja može smatrati slučajnom varijablom?

2. Navedite svojstva integralne i diferencijalne funkcije raspodjele slučajne varijable.

3. Imenujte numeričke parametre zakona raspodjele.

4. Kako se može definirati distributivni centar?

5. Šta su momenti distribucije? Koje su od njih našle primjenu u mjeriteljstvu?

6. Navedite glavne klase distribucija koje se koriste u mjeriteljstvu.

7. Opišite raspodjele uključene u klasu trapeznih raspodjela.

8. Šta su eksponencijalne distribucije? Koja su njihova svojstva i karakteristike?

9. Šta je normalna distribucija? Zašto igra posebnu ulogu u metrologiji?

10. Šta je Laplaceova funkcija i za šta se koristi?

11. Kako se opisuje i koristi porodica Studentovih distribucija?

12. Koje tačke procene zakona o distribuciji znate? Koji su zahtjevi za njih?

13. Šta je interval povjerenja? Koje „metode njegovog dodjeljivanja poznajete?

U kojoj, s jednom ili drugom vjerovatnoćom, postoji opći parametar. Vjerovatnoće koje su prepoznate kao dovoljne za pouzdano prosuđivanje o općim parametrima na osnovu indikatora uzorka nazivaju se fiducijarni.

Koncept vjerovatnoće povjerenja slijedi iz principa da se malo vjerovatni događaji smatraju praktično nemogućim, a događaji čija je vjerovatnoća bliska jedinici uzimaju se kao gotovo izvjesni. Obično se kao pouzdanost koriste vjerovatnoće R 1 = 0,95, R 2 = 0,99, R 3 = 0,999. Određene vrijednosti vjerovatnoće odgovaraju nivoa značaja, što se shvata kao razlika α = 1-R. Verovatnoća od 0,95 odgovara nivou značajnosti α 1 = 0,05 (5%), verovatnoća od 0,99 - α 2 = 0,01 (1%), verovatnoća od 0,999 - α 3 = 0,001 (0,1%).

To znači da pri procjeni općih parametara na osnovu selektivnih indikatora postoji rizik od greške u prvom slučaju 1 put u 20 testova, tj. u 5% slučajeva; u drugom - 1 put na 100 pokušaja, tj. u 1% slučajeva; u trećem - 1 put na 1000 testova, tj. u 0,1% slučajeva. Dakle, nivo značajnosti ukazuje na vjerovatnoću dobijanja slučajnog odstupanja od rezultata utvrđenih sa određenom vjerovatnoćom. Vjerovatnoće koje se uzimaju kao pouzdanost određuju interval povjerenja između njih. Mogu se koristiti za zasnivanje procjene određene veličine i granica u kojima se ona može nalaziti s različitim vjerovatnoćama.

Za različite vjerovatnoće, intervali povjerenja će biti sljedeći:

R 1 = 0,95 interval - 1,96σ do + 1,96σ (slika 5)

R 2 = 0,99 interval - 2,58σ do + 2,58σ

R 3 = 0,999 interval - 3,03σ do + 3,03σ

Vjerovatnoće povjerenja odgovaraju sljedećim vrijednostima normaliziranih odstupanja:

Vjerovatnoća R 1 = 0,95 odgovara t 1 = 1,96σ

Vjerovatnoća R 2 = 0,99 odgovara t 2 = 2,58σ

Vjerovatnoća R 3 = 0,999 odgovara t 3 = 3,03σ

Izbor jednog ili drugog praga povjerenja vrši se na osnovu važnosti događaja. Nivo značaja u ovom slučaju je vjerovatnoća da je odlučeno da se zanemari u ovoj studiji ili fenomenu.

Srednja greška (m) ili greška reprezentativnosti.

Karakteristike uzorka se u pravilu ne poklapaju u apsolutnoj vrijednosti sa odgovarajućim općim parametrima. Količina odstupanja indikatora uzorka od njegovog opšteg parametra naziva se statistička greška ili greška reprezentativnosti. Statističke greške su svojstvene samo karakteristikama uzorka, one nastaju u procesu odabira opcije iz opšte populacije.


Prosječna greška se izračunava po formuli:

gdje je σ standardna devijacija,

n je broj mjerenja (veličina uzorka).

Izraženo u istim jedinicama kao .

Vrijednost srednje greške je obrnuto proporcionalna veličini uzorka. Što je veća veličina uzorka, to je manja prosječna greška, a samim tim i manja razlika između vrijednosti karakteristika u uzorku i opće populacije.

Srednja greška uzorka može se koristiti za procjenu srednje vrijednosti populacije prema normalnoj distribuciji. Dakle, unutar ±1 je 68,3% svih aritmetičkih sredina uzorka, unutar ±2 - 95,5% svih srednjih uzoraka, unutar ±3 - 99,7% svih srednjih uzoraka.

Tačnost procjene, nivo pouzdanosti (pouzdanost)

Interval povjerenja

Prilikom uzorkovanja male količine, treba koristiti intervalne procjene. ovo omogućava izbjegavanje grubih grešaka, za razliku od bodovnih procjena.

Poziva se procjena intervala, koja je određena sa dva broja - krajevima intervala koji pokrivaju procijenjeni parametar. Intervalne procjene omogućavaju utvrđivanje tačnosti i pouzdanosti procjena.

Neka statistička karakteristika * pronađena iz podataka uzorka služi kao procjena nepoznatog parametra. Pretpostavićemo da je to konstantan broj (može biti slučajna varijabla). Jasno je da * preciznije određuje parametar β, što je manja apsolutna vrijednost razlike | - * |. Drugim riječima, ako je >0 i | - * |< , то чем меньше, тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Međutim, statističke metode ne dozvoljavaju kategorično tvrditi da procjena * zadovoljava nejednakost | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Pouzdanost (vjerovatnoća pouzdanosti) procjene za * je vjerovatnoća s kojom je nejednakost | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Neka je vjerovatnoća da | - *|<, равна т.е.

Zamjena nejednakosti | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

R(*-< <*+)=.

Interval pouzdanosti se naziva (*-, *+), koji pokriva nepoznati parametar sa datom pouzdanošću.

Intervali pouzdanosti za procjenu matematičkog očekivanja normalne distribucije kada su poznati.

Intervalna procjena s pouzdanošću matematičkog očekivanja a normalno raspoređene kvantitativne osobine X pomoću srednje vrijednosti uzorka x s poznatom standardnom devijacijom opće populacije je interval povjerenja

x - t(/n^?)< a < х + t(/n^?),

gdje je t(/n^?)= tačnost procjene, n je veličina uzorka, t je vrijednost argumenta Laplaceove funkcije F(t), pri kojoj je F(t)=/2.

Iz jednakosti t(/n^?)= možemo izvući sljedeće zaključke:

1. sa povećanjem veličine uzorka n, broj opada i samim tim se povećava tačnost procjene;

2. povećanje pouzdanosti procjene = 2F(t) dovodi do povećanja t (F(t) je rastuća funkcija), dakle, do povećanja; drugim riječima, povećanje pouzdanosti klasične procjene povlači smanjenje njene tačnosti.

Primjer. Slučajna varijabla X ima normalnu distribuciju sa poznatom standardnom devijacijom =3. Pronađite intervale povjerenja za procjenu nepoznatog očekivanja a od srednje vrijednosti uzorka x, ako je veličina uzorka n = 36, a pouzdanost procjene postavljena na 0,95.

Rješenje. Hajde da nađemo t. Iz relacije 2F(t) = 0,95 dobijamo F (t) = 0,475. Prema tabeli nalazimo t=1,96.

Pronađite tačnost procjene:

preciznost mjerenja intervala pouzdanosti

T(/n^?)= (1.96.3)/ /36 = 0.98.

Interval pouzdanosti je: (x - 0,98; x + 0,98). Na primjer, ako je x = 4,1, tada interval pouzdanosti ima sljedeće granice povjerenja:

x - 0,98 = 4,1 - 0,98 = 3,12; x + 0,98 = 4,1 + 0,98 = 5,08.

Dakle, vrijednosti nepoznatog parametra a, u skladu sa podacima uzorka, zadovoljavaju nejednakost 3.12< а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Objasnimo značenje date pouzdanosti. Pouzdanost = 0,95 ukazuje na to da ako se uzme dovoljno veliki broj uzoraka, onda 95% njih određuje takve intervale pouzdanosti u kojima je parametar zapravo zatvoren; samo u 5% slučajeva može preći interval pouzdanosti.

Ako je potrebno procijeniti matematičko očekivanje s unaprijed određenom tačnošću i pouzdanošću, tada se minimalna veličina uzorka koja će osigurati tu tačnost nalazi se po formuli

Intervali povjerenja za procjenu matematičkog očekivanja normalne distribucije sa nepoznatom

Intervalna procjena s pouzdanošću matematičkog očekivanja a normalno raspoređene kvantitativne osobine X pomoću srednje vrijednosti uzorka x s nepoznatom standardnom devijacijom opće populacije je interval povjerenja

x - t()(s/n^?)< a < х + t()(s/n^?),

gdje je s "ispravljena" standardna devijacija uzorka, t() se nalazi u tabeli prema datom i n.

Primjer. Kvantitativni atribut X opće populacije je normalno raspoređen. Na osnovu veličine uzorka n=16, pronađena je srednja vrijednost uzorka x = 20,2 i “ispravljena” standardna devijacija s = 0,8. Procijenite nepoznatu srednju vrijednost koristeći interval povjerenja s pouzdanošću od 0,95.

Rješenje. Nađimo t(). Koristeći tabelu, za = 0,95 i n=16 nalazimo t()=2,13.

Pronađimo granice povjerenja:

x - t () (s / n ^?) \u003d 20,2 - 2,13 *. 0.8/16^? = 19.774

x + t()(s/n^?) = 20,2 + 2,13 * 0,8/16^? = 20.626

Dakle, sa pouzdanošću od 0,95, nepoznati parametar a je sadržan u intervalu pouzdanosti od 19,774< а < 20,626

Procjena prave vrijednosti izmjerene vrijednosti

Neka se izvrši n nezavisnih jednakih mjerenja neke fizičke veličine, čija je prava vrijednost nepoznata.

Rezultate pojedinačnih mjerenja smatraćemo kao slučajne varijable Hl, H2,…Hn. Ove veličine su nezavisne (merenja su nezavisna). Imaju isto matematičko očekivanje a (prava vrijednost izmjerene vrijednosti), iste varijanse ^2 (ekvivalentna mjerenja) i normalno su raspoređeni (ova pretpostavka je potvrđena iskustvom).

Na taj način su ispunjene sve pretpostavke koje su napravljene prilikom izvođenja intervala povjerenja, te smo stoga slobodni da koristimo formule. Drugim riječima, prava vrijednost izmjerene veličine može se procijeniti iz aritmetičke sredine rezultata pojedinačnih mjerenja korištenjem intervala povjerenja.

Primjer. Na osnovu podataka devet nezavisnih jednako tačnih mjerenja fizičke veličine pronađena je aritmetička sredina rezultata pojedinačnih mjerenja x = 42,319 i „ispravljena“ standardna devijacija s = 5,0. Potrebno je procijeniti pravu vrijednost mjerene veličine sa pouzdanošću = 0,95.

Rješenje. Prava vrijednost mjerene veličine jednaka je njenom matematičkom očekivanju. Stoga se problem svodi na procjenu matematičkog očekivanja (u nepoznatom) korištenjem intervala povjerenja koji pokriva a sa datom pouzdanošću = 0,95.

x - t()(s/n^?)< a < х + t()(s/n^?)

Koristeći tablicu, za y = 0,95 i l = 9 nalazimo

Pronađite tačnost procjene:

t()(s/n^?) = 2,31 * 5/9^?=3,85

Pronađimo granice povjerenja:

x - t () (s / n ^?) = 42,319 - 3,85 = 38,469;

x + t () (s / n ^?) = 42,319 + 3,85 = 46,169.

Dakle, sa pouzdanošću od 0,95, prava vrijednost izmjerene vrijednosti leži u intervalu povjerenja od 38,469< а < 46,169.

Intervali povjerenja za procjenu standardne devijacije normalne distribucije.

Neka se kvantitativni atribut X opće populacije normalno distribuira. Potrebno je procijeniti nepoznatu opštu standardnu ​​devijaciju od "ispravljene" standardne devijacije uzorka s. Da bismo to učinili, koristimo procjenu intervala.

Intervalna procjena (sa pouzdanošću) standardne devijacije o normalno raspoređenog kvantitativnog atributa X od “ispravljenog” uzorka standardne devijacije s je interval povjerenja

s (1 -- q)< < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

gdje se q nalazi prema tabeli za dato n n.

Primjer 1. Kvantitativni atribut X opće populacije je normalno raspoređen. Na osnovu uzorka veličine n = 25, pronađena je “ispravljena” standardna devijacija s = 0,8. Pronađite interval pouzdanosti koji pokriva opštu standardnu ​​devijaciju sa pouzdanošću od 0,95.

Rješenje. Prema tabeli, prema podacima = 0,95 i n = 25, nalazimo q = 0,32.

Traženi interval pouzdanosti s (1 -- q)< < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

Primjer 2. Kvantitativni atribut X opće populacije je normalno raspoređen. Na osnovu uzorka veličine n=10, pronađena je “ispravljena” standardna devijacija s = 0,16. Pronađite interval pouzdanosti koji pokriva opštu standardnu ​​devijaciju sa pouzdanošću od 0,999.

Rješenje. Prema tablici primjene, prema podacima = 0,999 i n=10 nalazimo 17= 1,80 (q > 1). Željeni interval pouzdanosti je:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

Ocjena tačnost merenja

U teoriji grešaka uobičajeno je da se tačnost mjerenja (preciznost instrumenta) karakteriše korištenjem standardne devijacije slučajnih grešaka mjerenja. Za evaluaciju se koristi "ispravljena" standardna devijacija s. Budući da su rezultati mjerenja obično međusobno nezavisni, imaju isto matematičko očekivanje (pravu vrijednost mjerene veličine) i istu disperziju (u slučaju jednako tačnih mjerenja), teorija predstavljena u prethodnom paragrafu je primjenjiva za procjenu mjerenja. tačnost.

Primjer. Na osnovu 15 jednako tačnih mjerenja pronađena je “ispravljena” standardna devijacija s = 0,12. Pronađite tačnost mjerenja sa pouzdanošću od 0,99.

Rješenje. Preciznost mjerenja karakterizira standardna devijacija slučajnih grešaka, pa se problem svodi na pronalaženje intervala povjerenja s (1 - q)< < s (1 + q) , покрывающего с заданной надежностью 0,99

Prema tablici primjene za = 0,99 i n=15 nalazimo q = 0,73.

Željeni interval pouzdanosti

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Procjena vjerovatnoće (binomna distribucija) relativnom frekvencijom

Intervalna procjena (sa pouzdanošću) nepoznate vjerovatnoće p binomne distribucije u odnosu na relativnu frekvenciju w je interval povjerenja (sa približnim krajevima p1 i p2)

p1< p < p2,

gdje je n ukupan broj testova; m je broj pojavljivanja događaja; w je relativna frekvencija jednaka omjeru m/n; t je vrijednost argumenta Laplaceove funkcije, pri kojoj je F(t) = /2.

Komentar. Za velike vrijednosti n (reda stotina) mogu se uzeti kao približne granice intervala povjerenja

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se nalazi objekt procjene. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prikazanih objekata, stoga se za analizu koristi uzorak objekata. Ovaj uzorak nije uvijek homogen, ponekad ga je potrebno očistiti od krajnosti – previsoke ili preniske tržišne ponude. U tu svrhu se primjenjuje interval povjerenja. Svrha ovog istraživanja je da se izvrši komparativna analiza dvije metode za izračunavanje intervala povjerenja i odabere najbolja opcija proračuna pri radu sa različitim uzorcima u sistemu estimatica.pro.

Interval pouzdanosti - izračunava se na osnovu uzorka, intervala vrijednosti karakteristike, koja sa poznatom vjerovatnoćom sadrži procijenjeni parametar opće populacije.

Smisao izračunavanja intervala pouzdanosti je da se takav interval izgradi na osnovu podataka uzorka tako da se sa datom vjerovatnoćom može tvrditi da je vrijednost procijenjenog parametra u ovom intervalu. Drugim riječima, interval povjerenja sa određenom vjerovatnoćom sadrži nepoznatu vrijednost procijenjene veličine. Što je interval širi, to je veća nepreciznost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom članku ćemo razmotriti 2 načina:

  • kroz medijanu i standardnu ​​devijaciju;
  • kroz kritičnu vrijednost t-statistike (Studentov koeficijent).

Faze uporedne analize različitih metoda za izračunavanje CI:

1. formirati uzorak podataka;

2. obrađujemo ga statističkim metodama: izračunavamo srednju vrijednost, medijan, varijansu itd.;

3. interval pouzdanosti izračunavamo na dva načina;

4. Analizirati očišćene uzorke i dobijene intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sistema estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju jednosobnih stanova u 3. zoni cijena sa tipom planiranja "Hruščov".

Tabela 1. Početni uzorak

Cijena 1 m2 k.u.

Fig.1. Početni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka statističkim metodama zahtijeva izračunavanje sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan - broj koji karakteriše uzorak: tačno polovina elemenata uzorka je veća od medijane, druga polovina je manja od medijane

(za uzorak sa neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca - koristi se za precizniju procjenu varijacije u podacima

5. Standardna devijacija za uzorak (u daljem tekstu RMS) je najčešći indikator disperzije vrednosti podešavanja oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stepen disperzije vrednosti podešavanja

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijena u uzorku oko prosjeka

Tabela 2. Statistički pokazatelji originalnog uzorka

Koeficijent varijacije, koji karakteriše homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije prevelik. Dakle, možemo konstatovati da originalni uzorak nije homogen, pa pređimo na izračunavanje intervala pouzdanosti.

Faza 3. Proračun intervala povjerenja

Metoda 1. Proračun kroz medijanu i standardnu ​​devijaciju.

Interval pouzdanosti se određuje na sljedeći način: minimalna vrijednost - standardna devijacija se oduzima od medijane; maksimalna vrijednost - standardna devijacija se dodaje medijani.

Dakle, interval povjerenja (47179 CU; 60689 CU)

Rice. 2. Vrijednosti unutar intervala povjerenja 1.



Metoda 2. Izgradnja intervala povjerenja kroz kritičnu vrijednost t-statistike (Studentov koeficijent)

S.V. Gribovski u knjizi "Matematičke metode za procjenu vrijednosti imovine" opisuje metodu za izračunavanje intervala povjerenja kroz Studentov koeficijent. Prilikom izračunavanja ovom metodom, sam procjenitelj mora postaviti nivo značajnosti ∝, koji određuje vjerovatnoću sa kojom će se izgraditi interval povjerenja. Obično se koriste nivoi značajnosti od 0,1; 0,05 i 0,01. Oni odgovaraju vjerovatnoći pouzdanosti od 0,9; 0,95 i 0,99. Ovom metodom smatra se da su prave vrijednosti matematičkog očekivanja i varijanse praktički nepoznate (što je gotovo uvijek tačno kada se rješavaju praktični problemi evaluacije).

Formula intervala povjerenja:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentove distribucije) sa nivoom značajnosti ∝, brojem stupnjeva slobode n-1, koji se utvrđuje posebnim statističkim tabelama ili korištenjem MS Excel-a (→„Statistički”→ STUDRASPOBR);

∝ - nivo značajnosti, uzimamo ∝=0,01.

Rice. 2. Vrijednosti unutar intervala povjerenja 2.

Korak 4. Analiza različitih načina izračunavanja intervala pouzdanosti

Dvije metode izračunavanja intervala povjerenja - kroz medijanu i Studentov koeficijent - dovele su do različitih vrijednosti intervala. Shodno tome, dobijena su dva različita pročišćena uzorka.

Tabela 3. Statistički pokazatelji za tri uzorka.

Indeks

Početni uzorak

1 opcija

Opcija 2

Zlo

Disperzija

Coef. varijacije

Coef. oscilacije

Broj penzionisanih objekata, kom.

Na osnovu izvršenih proračuna možemo reći da se vrijednosti intervala povjerenja dobivene različitim metodama sijeku, tako da možete koristiti bilo koju od metoda proračuna prema nahođenju procjenitelja.

Međutim, smatramo da je pri radu u sistemu estimatica.pro preporučljivo odabrati metodu za izračunavanje intervala povjerenja, ovisno o stepenu razvijenosti tržišta:

  • ako tržište nije razvijeno, primijeniti metodu obračuna kroz medijanu i standardnu ​​devijaciju, jer je broj penzionisanih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, proračun primijeniti kroz kritičnu vrijednost t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

U pripremi članka korišteni su:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode za procjenu vrijednosti imovine. Moskva, 2014

2. Podaci iz sistema estimatica.pro

Analiza slučajnih grešaka zasniva se na teoriji slučajnih grešaka, što omogućava da se uz određenu garanciju izračuna stvarna vrijednost mjerene veličine i procijene moguće greške.

Osnova teorije slučajnih grešaka su sljedeće pretpostavke:

kod velikog broja mjerenja, slučajne greške iste veličine, ali različitog predznaka, javljaju se podjednako često;

velike greške su manje uobičajene od malih (vjerovatnoća greške se smanjuje s povećanjem njene vrijednosti);

kod beskonačno velikog broja mjerenja, prava vrijednost mjerene veličine jednaka je aritmetičkoj sredini svih rezultata mjerenja;

pojava jednog ili drugog rezultata mjerenja kao slučajnog događaja opisuje se normalnim zakonom raspodjele.

U praksi se pravi razlika između opšteg i uzorka skupa merenja.

Pod opštom populacijom podrazumijevaju cijeli skup mogućih mjernih vrijednosti ili mogućih vrijednosti greške
.

Za populaciju uzorka broj merenja ograničeno, iu svakom slučaju striktno određeno. Oni misle da ako
, zatim prosječna vrijednost ovog skupa mjerenja dovoljno blizu svoje prave vrednosti.

1. Intervalna procjena korištenjem vjerojatnosti povjerenja

Za veliki uzorak i zakon normalne distribucije, opšta karakteristika mjerenja je varijansa
i koeficijent varijacije :

;
. (1.1)

Disperzija karakterizira homogenost mjerenja. Što više
, veći je raspršivanje mjerenja.

Koeficijent varijacije karakterizira varijabilnost. Što više , veća je varijabilnost mjerenja u odnosu na srednje vrijednosti.

Za procjenu pouzdanosti rezultata mjerenja u obzir se uvode koncepti intervala povjerenja i vjerovatnoće povjerenja.

Trusted naziva se interval vrijednosti , u koje pada prava vrednost izmjerena veličina sa datom vjerovatnoćom.

Vjerojatnost povjerenja (pouzdanost) mjerenja je vjerovatnoća da prava vrijednost mjerene veličine padne u zadati interval povjerenja, tj. u zonu
. Ova vrijednost se određuje u dijelovima jedinice ili u procentima.

,

gdje
- integralna Laplaceova funkcija ( tabela 1.1 )

Integralna Laplaceova funkcija je definirana sljedećim izrazom:

.

Argument ove funkcije je faktor garancije :

Tabela 1.1

Integralna Laplaceova funkcija

Ako se na osnovu određenih podataka utvrdi vjerovatnoća povjerenja (često se smatra
), a zatim postavite tačnost mjerenja (interval povjerenja
) na osnovu omjera

.

Polovina intervala povjerenja je

, (1.3)

gdje
- argument Laplaceove funkcije, ako
(tabela 1.1 );

- Studentske funkcije, ako
(tabela 1.2 ).

Dakle, interval pouzdanosti karakteriše tačnost merenja datog uzorka, a nivo poverenja karakteriše pouzdanost merenja.

Primjer

Izvedeno
mjerenja čvrstoće kolovoza dionice autoputa sa prosječnim modulom elastičnosti
i izračunatu vrijednost standardne devijacije
.

Neophodno odrediti potrebnu tačnost mjerenja za različite nivoe pouzdanosti
, uzimajući vrijednosti on tabela 1.1 .

U ovom slučaju, respektivno |

Stoga, za dati mjerni alat i metodu, interval pouzdanosti se povećava za oko puta ako povećate samo na
.