Biografije Karakteristike Analiza

Interval pouzdanosti. Što je to i kako se može koristiti? Vjerojatnosti pouzdanosti i razine značajnosti

Razmotrene točkaste procjene parametara distribucije daju procjenu u obliku broja najbližeg vrijednosti nepoznatog parametra. Takve se procjene koriste samo za veliki broj mjerenja. Što je manji uzorak, lakše je pogriješiti pri odabiru parametra. Za praksu je važno ne samo dobiti procjenu točke, već i odrediti interval tzv fiducijar, između granica kojih s datim razina povjerenja

gdje je q - razina značajnosti; h n, h v - donja i gornja granica intervala, pronalazi se prava vrijednost procijenjenog parametra.

Općenito, intervali pouzdanosti mogu se graditi na temelju Čebiševljeve nejednakosti. Za bilo koji zakon distribucije slučajne varijable s momentima prva dva reda, gornja granica vjerojatnosti da će odstupanje slučajne varijable x od središta distribucije X c pasti u interval tS x opisuje se Čebiševljevom nejednakošću

gdje je S x - procjena RMS distribucije; t je pozitivan broj.

Za određivanje intervala pouzdanosti nije potrebno poznavati zakon raspodjele rezultata opažanja, ali je potrebno poznavati RMS procjenu. Intervali dobiveni Chebyshevljevom nejednakošću pokazali su se preširokim za praksu. Dakle, interval pouzdanosti od 0,9 za mnoge zakone distribucije odgovara intervalu pouzdanosti od 1,6 S X . Čebiševljeva nejednakost daje u ovom slučaju 3.16 S X . Kao rezultat toga, nije široko prihvaćen.

U mjeriteljskoj praksi uglavnom se koriste kvantilne procjene interval pouzdanosti. Pod, ispod 100 P-postotni kvantil x p razumjeti apscisu takve okomite crte, lijevo od koje je površina ispod krivulje gustoće raspodjele jednaka P%. Drugim riječima, kvantil- ovo je vrijednost slučajne varijable (greška) sa zadanom vjerojatnošću pouzdanosti P. Na primjer, medijan distribucije je 50% kvantil x 0,5.

U praksi se nazivaju kvantili od 25 i 75%. nabori, ili kvantili distribucije. Između njih leži 50% svih mogućih vrijednosti slučajne varijable, a preostalih 50% leži izvan njih. Interval vrijednosti slučajne varijable x između x 0 05 i x 0 95 pokriva 90% svih njezinih mogućih vrijednosti i naziva se interkvantilni jaz s 90% vjerojatnosti. Njegova duljina je d 0,9 \u003d x 0,95 - x 0,05.

Na temelju ovakvog pristupa koncept vrijednosti kvantilne pogreške, oni. vrijednosti pogreške s danom vjerojatnošću povjerenja P - granice intervala nesigurnosti ±D D = ± (x p - x 1-p) / 2 = ± dp /2. Na njegovoj duljini nalaze se P% vrijednosti slučajne varijable (greška), a q = (1-P)% njihovog ukupnog broja ostaju izvan ovog intervala.

Da bi se dobila intervalna procjena za normalno raspodijeljenu slučajnu varijablu, potrebno je:

Odredite procjenu točke MO x̅ i RMS S x slučajna varijabla prema formulama (6.8) odnosno (6.11);

Odaberite vjerojatnost pouzdanosti R iz preporučenog raspona vrijednosti 0,90; 0,95; 0,99;

Pronađite gornju x in i donju x n granicu prema jednadžbama

dobivena uzimajući u obzir (6.1). Vrijednosti h n i h v određuju se iz tablica vrijednosti funkcije integralne distribucije F(t ) ili Laplaceova funkcija F(1).

Rezultirajući interval pouzdanosti zadovoljava uvjet

(6.13)

gdje je n - broj izmjerenih vrijednosti; zp - argument Laplaceove funkcije F(1) koji odgovara vjerojatnosti R/2. U ovom slučaju zp naziva kvantilni faktor. Polovica duljine intervala pouzdanosti naziva se granica pouzdanosti pogreške rezultata mjerenja.

Primjer 6.1. Izvršeno je 50 mjerenja konstantnog otpora. Odredite interval pouzdanosti za MO vrijednost konstantnog otpora ako je zakon distribucije normalan s parametrima m x \u003d R \u003d 590 Ohm, S x \u003d 90 Ohma s vjerojatnošću pouzdanosti P \u003d 0,9.

Budući da hipoteza o normalnosti zakona distribucije nije u suprotnosti s eksperimentalnim podacima, interval pouzdanosti određuje se formulom

Stoga je F(z r ) = 0,45. Iz tablice dane u Dodatku 1. nalazimo da zp = 1,65. Stoga će interval pouzdanosti biti ispisan u obrascu

Ili 590 - 21< R < 590 + 21. Окончательно 509 Ом < R< 611 Ом.

Ako se zakon raspodjele slučajne varijable razlikuje od normalnog, potrebno je izgraditi njezin matematički model i pomoću njega odrediti interval pouzdanosti.

Razmatrana metoda za određivanje intervala pouzdanosti vrijedi za dovoljno velik broj opažanja n kada s= S x . Treba imati na umu da je izračunata RMS procjena S x je samo neka aproksimacija prave vrijednostis. Određivanje intervala pouzdanosti za danu vjerojatnost je to manje pouzdano što je manji broj opažanja. Nemoguće je koristiti formule normalne distribucije s malim brojem opažanja, ako nije moguće teoretski, na temelju preliminarnih eksperimenata s dovoljno velikim brojem opažanja, odrediti standardnu ​​devijaciju.

Izračun intervala pouzdanosti za slučaj kada je distribucija rezultata promatranja normalna, ali je njihova varijanca nepoznata, tj. s malim brojem opažanja n, moguće je izvesti korištenjem Studentove distribucije S(t, k ). Opisuje gustoću distribucije omjera (Studentove frakcije):

gdje je Q - prava vrijednost izmjerene vrijednosti. x vrijednosti̅ , S x . i S x ̅ izračunavaju se na temelju eksperimentalnih podataka i predstavljaju točkaste procjene MO, RMS rezultata mjerenja i RMS aritmetičke sredine.

Vjerojatnost da će Studentov razlomak kao rezultat izvedenih promatranja poprimiti neku vrijednost u intervalu (- t p ; + t p )

(6.14)

gdje je k - broj stupnjeva slobode, jednak (n - 1). Količine tp (u ovom slučaju se zove studentski koeficijenti), izračunati korištenjem posljednje dvije formule za različite vrijednosti razine pouzdanosti i broja mjerenja prikazani su u tabeli (vidi tablicu u Dodatku 1). Stoga se pomoću Studentove distribucije može pronaći vjerojatnost da odstupanje aritmetičke sredine od prave vrijednosti izmjerene veličine ne prelazi

U onim slučajevima gdje distribucija slučajnih pogrešaka nije normalna, često se koristi Studentova distribucija s aproksimacijom čiji stupanj ostaje nepoznat. Studentova distribucija koristi se kada se broj mjerenja n < 30, поскольку уже при n = 20, ...,30 postaje normalno i umjesto jednadžbe (6.14) može se koristiti jednadžba (6.13). Rezultat mjerenja zapisuje se kao: ; P = R d, gdje je R d - određena vrijednost razine pouzdanosti. Faktor t s velikim brojem mjerenja n jednak je faktoru kvantila z p . Za male n jednak je Studentovom koeficijentu.

Rezultirajući rezultat mjerenja nije jedan određeni broj, već je interval unutar kojeg se s određenom vjerojatnošću P d nalazi prava vrijednost izmjerene veličine. Označavanje sredine intervala x uopće ne znači da je stvarna vrijednost bliža njoj nego ostalim točkama u intervalu. Može biti bilo gdje u intervalu, a s vjerojatnošću 1 - R d čak i izvan njega.

Primjer 6.2. Određivanje specifičnih magnetskih gubitaka za različite uzorke jedne šarže elektrotehničkog čelika marke 2212 dalo je sljedeće rezultate: 1,21; 1.17; 1.18; 1.13; 1.19; 1.14; 1,20 i 1,18 W/kg. Uz pretpostavku da ne postoji sustavna pogreška, a slučajna pogreška je raspoređena prema normalnom zakonu, potrebno je odrediti interval pouzdanosti za vrijednosti vjerojatnosti pouzdanosti od 0,9 i 0,95. Za rješavanje problema upotrijebite Laplaceovu formulu i Studentovu distribuciju.

Koristeći formule (6.8) u (6.11), nalazimo procjene aritmetičke sredine i RMS rezultata mjerenja. One su redom jednake 1,18 i 0,0278 W/kg. Uz pretpostavku da je RMS procjena jednaka samom odstupanju, nalazimo:


Dakle, koristeći vrijednosti Laplaceove funkcije dane u tablici Dodatka 1, utvrđujemo dazp = 1,65. Za P = 0,95 koeficijent zp =1,96. Intervali pouzdanosti koji odgovaraju P = 0,9 i 0,95 su 1,18 ± 0,016 i 1,18 ± 0,019 W/kg.

U slučaju kada nema razloga vjerovati da su standardna devijacija i njezina procjena jednake, interval pouzdanosti određuje se na temelju Studentove distribucije:

Prema tablici u prilogu 1 nalazimo da t 0,9 = 1,9 i t 0,95 = 2,37. Stoga su intervali pouzdanosti jednaki 1,18±0,019 odnosno 1,18±0,023 W/kg.

Test pitanja.

1. Pod kojim uvjetima se greška mjerenja može smatrati slučajnom varijablom?

2. Nabrojati svojstva integralne i diferencijalne funkcije distribucije slučajne varijable.

3. Navedite numeričke parametre zakona raspodjele.

4. Kako se može definirati distribucijski centar?

5. Što su distribucijski momenti? Koji su od njih našli primjenu u mjeriteljstvu?

6. Navedite glavne klase razdioba koje se koriste u mjeriteljstvu.

7. Opišite razdiobe koje spadaju u klasu trapeznih razdioba.

8. Što su eksponencijalne razdiobe? Koja su njihova svojstva i karakteristike?

9. Što je normalna distribucija? Zašto ima posebnu ulogu u mjeriteljstvu?

10. Što je Laplaceova funkcija i čemu služi?

11. Kako se opisuje i koristi obitelj Studentovih distribucija?

12. Koje točke procjene zakona distribucije poznajete? Koji su zahtjevi za njih?

13. Što je interval pouzdanosti? Koje metode njegovog dodjeljivanja poznajete?

U kojem, s jednom ili drugom vjerojatnošću, postoji opći parametar. Vjerojatnosti koje se smatraju dovoljnima za pouzdanu prosudbu o općim parametrima na temelju pokazatelja uzorka nazivaju se fiducijarni.

Koncept vjerojatnosti povjerenja proizlazi iz načela da se malo vjerojatni događaji smatraju praktički nemogućima, a događaji čija je vjerojatnost blizu jedan uzimaju se kao gotovo sigurni. Obično se vjerojatnosti R 1 = 0,95, R 2 = 0,99, R 3 = 0,999 koriste kao pouzdanost. Određene vrijednosti vjerojatnosti odgovaraju razine značajnosti, što se razumijeva kao razlika α = 1-R. Vjerojatnost od 0,95 odgovara razini značajnosti α 1 = 0,05 (5%), vjerojatnost od 0,99 - α 2 = 0,01 (1%), vjerojatnost od 0,999 - α 3 = 0,001 (0,1%).

To znači da pri procjeni općih parametara na temelju selektivnih pokazatelja postoji rizik od pogreške u prvom slučaju 1 put u 20 testova, tj. u 5% slučajeva; u drugom - 1 put na 100 pokušaja, tj. u 1% slučajeva; u trećem - 1 put na 1000 testova, tj. u 0,1% slučajeva. Dakle, razina značajnosti ukazuje na vjerojatnost dobivanja slučajnog odstupanja od rezultata utvrđenih s određenom vjerojatnošću. Vjerojatnosti koje se uzimaju kao pouzdanost određuju interval pouzdanosti između njih. Oni se mogu koristiti za zasnivanje procjene određene veličine i granica u kojima se ona može nalaziti pri različitim vjerojatnostima.

Za različite vjerojatnosti, intervali pouzdanosti će biti sljedeći:

R 1 = 0,95 interval - 1,96σ do + 1,96σ (Sl. 5)

R 2 = 0,99 interval - 2,58σ do + 2,58σ

R 3 = 0,999 interval - 3,03σ do + 3,03σ

Vjerojatnosti pouzdanosti odgovaraju sljedećim vrijednostima normaliziranih odstupanja:

Vjerojatnost R 1 = 0,95 odgovara t 1 = 1,96σ

Vjerojatnost R 2 = 0,99 odgovara t 2 = 2,58σ

Vjerojatnost R 3 = 0,999 odgovara t 3 = 3,03σ

Odabir jednog ili drugog praga povjerenja provodi se na temelju važnosti događaja. Razina značajnosti u ovom slučaju je vjerojatnost da se odluči zanemariti u ovoj studiji ili fenomenu.

Srednja pogreška (m), ili pogreška reprezentativnosti.

Karakteristike uzorka, u pravilu, ne podudaraju se u apsolutnoj vrijednosti s odgovarajućim općim parametrima. Veličina odstupanja pokazatelja uzorka od općeg parametra naziva se statistička pogreška ili pogreška reprezentativnosti. Statističke pogreške svojstvene su samo karakteristikama uzorka, nastaju u procesu odabira opcije iz opće populacije.


Prosječna pogreška izračunava se formulom:

gdje je σ standardna devijacija,

n je broj mjerenja (veličina uzorka).

Izraženo u istim jedinicama kao .

Vrijednost srednje pogreške obrnuto je proporcionalna veličini uzorka. Što je veličina uzorka veća, to je manja prosječna pogreška, a time i manja razlika između vrijednosti obilježja u uzorku i općoj populaciji.

Srednja pogreška uzorka može se koristiti za procjenu srednje vrijednosti populacije prema normalnoj distribuciji. Dakle, unutar ±1 je 68,3% svih aritmetičkih sredina uzorka, unutar ±2 - 95,5% svih sredina uzorka, unutar ±3 - 99,7% svih sredina uzorka.

Točnost procjene, razina pouzdanosti (pouzdanost)

Interval pouzdanosti

Pri uzorkovanju malog volumena treba koristiti intervalne procjene. to omogućuje izbjegavanje velikih pogrešaka, za razliku od točkastih procjena.

Poziva se intervalska procjena koja je određena s dva broja - krajevima intervala koji pokriva procijenjeni parametar. Intervalne procjene omogućuju utvrđivanje točnosti i pouzdanosti procjena.

Neka statistička karakteristika * pronađena iz podataka uzorka posluži kao procjena nepoznatog parametra. Pretpostavit ćemo da je to konstantan broj (može biti slučajna varijabla). Jasno je da * točnije određuje parametar β što je manja apsolutna vrijednost razlike | - * |. Drugim riječima, ako je >0 i | - * |< , то чем меньше, тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Međutim, statističke metode ne dopuštaju kategoričku tvrdnju da procjena * zadovoljava nejednakost | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Pouzdanost (vjerojatnost pouzdanosti) procjene za * je vjerojatnost s kojom nejednakost | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Neka je vjerojatnost da | - *|<, равна т.е.

Zamjena nejednakosti | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

R(*-< <*+)=.

Naziva se interval pouzdanosti (*- , *+), koji pokriva nepoznati parametar sa zadanom pouzdanošću.

Intervali pouzdanosti za procjenu matematičkog očekivanja normalne distribucije kada su poznati.

Intervalna procjena s pouzdanošću matematičkog očekivanja a normalno raspodijeljenog kvantitativnog svojstva X prema srednjoj vrijednosti uzorka x s poznatom standardnom devijacijom opće populacije je interval pouzdanosti

x - t(/n^?)< a < х + t(/n^?),

gdje je t(/n^?)= točnost procjene, n je veličina uzorka, t je vrijednost argumenta Laplaceove funkcije F(t), pri kojoj je F(t)=/2.

Iz jednakosti t(/n^?)= možemo izvući sljedeće zaključke:

1. s povećanjem veličine uzorka n, broj se smanjuje, a time i točnost procjene raste;

2. povećanje pouzdanosti procjene = 2F(t) dovodi do povećanja t (F(t) je rastuća funkcija), dakle, do povećanja; drugim riječima, povećanje pouzdanosti klasične procjene povlači za sobom smanjenje njezine točnosti.

Primjer. Slučajna varijabla X ima normalnu distribuciju s poznatom standardnom devijacijom =3. Odredite intervale pouzdanosti za procjenu nepoznatog očekivanja a iz uzorka srednje vrijednosti x, ako je veličina uzorka n = 36, a pouzdanost procjene postavljena na 0,95.

Riješenje. Pronađimo t. Iz relacije 2F(t) = 0,95 dobivamo F (t) = 0,475. Prema tablici nalazimo t=1,96.

Pronađite točnost procjene:

točnost interval pouzdanosti mjerenje

T(/n^?)= (1.96.3)//36 = 0.98.

Interval pouzdanosti je: (x - 0,98; x + 0,98). Na primjer, ako je x = 4,1, tada interval pouzdanosti ima sljedeće granice pouzdanosti:

x - 0,98 = 4,1 - 0,98 = 3,12; x + 0,98 = 4,1 + 0,98 = 5,08.

Dakle, vrijednosti nepoznatog parametra a, u skladu s podacima uzorka, zadovoljavaju nejednakost 3.12< а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Objasnimo značenje dane pouzdanosti. Pouzdanost = 0,95 označava da ako se uzme dovoljno veliki broj uzoraka, tada 95% njih određuje takve intervale pouzdanosti u kojima je parametar zapravo zatvoren; samo u 5% slučajeva može prijeći interval pouzdanosti.

Ako je potrebno procijeniti matematičko očekivanje s unaprijed određenom točnošću i pouzdanošću, tada se minimalna veličina uzorka koja će osigurati tu točnost nalazi formulom

Intervali pouzdanosti za procjenu matematičkog očekivanja normalne distribucije s nepoznanicom

Intervalna procjena s pouzdanošću matematičkog očekivanja a normalno raspodijeljenog kvantitativnog obilježja X prema srednjoj vrijednosti uzorka x s nepoznatom standardnom devijacijom opće populacije je interval pouzdanosti

x - t()(s/n^?)< a < х + t()(s/n^?),

gdje je s "ispravljena" standardna devijacija uzorka, t() se nalazi u tablici prema danom i n.

Primjer. Kvantitativni atribut X opće populacije je normalno raspoređen. Na temelju veličine uzorka n=16, dobivena je sredina uzorka x = 20,2 i „korigirana“ standardna devijacija s = 0,8. Procijenite nepoznatu srednju vrijednost pomoću intervala pouzdanosti s pouzdanošću od 0,95.

Riješenje. Nađimo t(). Koristeći tablicu, za = 0,95 i n=16 nalazimo t()=2,13.

Pronađimo granice povjerenja:

x - t () (s / n ^?) \u003d 20,2 - 2,13 *. 0,8/16^? = 19.774

x + t()(s/n^?) = 20,2 + 2,13 * 0,8/16^? = 20,626

Dakle, uz pouzdanost od 0,95, nepoznati parametar a nalazi se u intervalu pouzdanosti od 19,774< а < 20,626

Procjena stvarne vrijednosti izmjerene vrijednosti

Neka se izvrši n neovisnih jednakih mjerenja neke fizikalne veličine čija prava vrijednost nije poznata.

Rezultate pojedinačnih mjerenja smatrat ćemo slučajnim varijablama Hl, H2,…Hn. Ove su veličine neovisne (mjerenja su neovisna). Imaju isto matematičko očekivanje a (prava vrijednost izmjerene vrijednosti), iste varijance ^2 (ekvivalentna mjerenja) i normalno su raspoređeni (ova pretpostavka je potvrđena iskustvom).

Time su ispunjene sve pretpostavke koje su napravljene prilikom izvođenja intervala pouzdanosti, te stoga slobodno možemo koristiti formule. Drugim riječima, prava vrijednost izmjerene veličine može se procijeniti iz aritmetičke sredine rezultata pojedinačnih mjerenja pomoću intervala pouzdanosti.

Primjer. Na temelju podataka devet neovisnih jednako točnih mjerenja fizikalne veličine, pronađena je aritmetička sredina rezultata pojedinačnih mjerenja x = 42,319 i „korigirana“ standardna devijacija s = 5,0. Potrebno je procijeniti pravu vrijednost izmjerene veličine s pouzdanošću = 0,95.

Riješenje. Prava vrijednost izmjerene veličine jednaka je njezinom matematičkom očekivanju. Stoga se problem svodi na procjenu matematičkog očekivanja (u nepoznatom) korištenjem intervala pouzdanosti koji pokriva a sa zadanom pouzdanošću = 0,95.

x - t()(s/n^?)< a < х + t()(s/n^?)

Koristeći tablicu, za y \u003d 0,95 i l \u003d 9 nalazimo

Pronađite točnost procjene:

t()(s/n^?) = 2,31 * 5/9^?=3,85

Pronađimo granice povjerenja:

x - t () (s / n ^?) \u003d 42,319 - 3,85 \u003d 38,469;

x + t () (s / n ^?) \u003d 42,319 + 3,85 \u003d 46,169.

Dakle, uz pouzdanost od 0,95, prava vrijednost izmjerene vrijednosti leži u intervalu pouzdanosti od 38,469< а < 46,169.

Intervali pouzdanosti za procjenu standardne devijacije normalne distribucije.

Neka je kvantitativni atribut X opće populacije normalno distribuiran. Potrebno je procijeniti nepoznatu opću standardnu ​​devijaciju iz "ispravljene" standardne devijacije uzorka s. Da bismo to učinili, koristimo procjenu intervala.

Intervalna procjena (s pouzdanošću) standardne devijacije o normalno raspodijeljenog kvantitativnog atributa X od "ispravljene" standardne devijacije uzorka s je interval pouzdanosti

s (1 -- q)< < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

gdje se q nalazi prema tablici za zadano n n.

Primjer 1. Kvantitativni atribut X opće populacije je normalno raspoređen. Na temelju uzorka veličine n = 25 nađena je „korigirana“ standardna devijacija s = 0,8. Odredite interval pouzdanosti koji pokriva opću standardnu ​​devijaciju s pouzdanošću od 0,95.

Riješenje. Prema tablici, prema podacima = 0,95 i n = 25, nalazimo q = 0,32.

Traženi interval pouzdanosti s (1 -- q)< < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

Primjer 2. Kvantitativni atribut X opće populacije je normalno raspoređen. Na temelju uzorka veličine n=10 nađena je „korigirana” standardna devijacija s = 0,16. Odredite interval pouzdanosti koji pokriva opću standardnu ​​devijaciju s pouzdanošću od 0,999.

Riješenje. Prema tablici primjene, prema podacima = 0,999 i n=10, nalazimo 17= 1,80 (q > 1). Željeni interval pouzdanosti je:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

Razred točnost mjerenja

U teoriji pogrešaka uobičajeno je karakterizirati točnost mjerenja (točnost instrumenta) pomoću standardne devijacije slučajnih pogrešaka mjerenja. Za procjenu se koristi "ispravljena" standardna devijacija s. Budući da su rezultati mjerenja obično međusobno neovisni, imaju isto matematičko očekivanje (pravu vrijednost mjerene veličine) i istu disperziju (u slučaju jednako točnih mjerenja), teorija prikazana u prethodnom odlomku primjenjiva je za ocjenu mjerenja točnost.

Primjer. Na temelju 15 jednako točnih mjerenja pronađena je "korigirana" standardna devijacija s = 0,12. Odredite točnost mjerenja s pouzdanošću od 0,99.

Riješenje. Točnost mjerenja karakterizira standardna devijacija slučajnih pogrešaka, pa se problem svodi na pronalaženje intervala pouzdanosti s (1 - q)< < s (1 + q) , покрывающего с заданной надежностью 0,99

Prema tablici primjene za = 0,99 i n=15 nalazimo q = 0,73.

Željeni interval pouzdanosti

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Procjena vjerojatnosti (binomna distribucija) relativnom frekvencijom

Intervalna procjena (s pouzdanošću) nepoznate vjerojatnosti p binomne distribucije s obzirom na relativnu frekvenciju w je interval pouzdanosti (s približnim krajevima p1 i p2)

p1< p < p2,

gdje je n ukupan broj testova; m je broj pojavljivanja događaja; w je relativna frekvencija jednaka omjeru m/n; t je vrijednost argumenta Laplaceove funkcije pri kojoj je F(t) = /2.

Komentar. Za velike vrijednosti n (reda stotine), mogu se uzeti kao približne granice intervala pouzdanosti

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se predmet procjene nalazi. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prezentiranih objekata, stoga se za analizu koristi uzorak objekata. Ovaj uzorak nije uvijek homogen, ponekad ga je potrebno očistiti od ekstrema – previsokih ili preniskih tržišnih ponuda. U tu svrhu primjenjuje se interval pouzdanosti. Svrha ovog rada je provesti komparativnu analizu dviju metoda za izračun intervala pouzdanosti i odabrati najbolju opciju izračuna pri radu s različitim uzorcima u sustavu estimatica.pro.

Interval pouzdanosti - izračunat na temelju uzorka, interval vrijednosti obilježja, koji s poznatom vjerojatnošću sadrži procijenjeni parametar opće populacije.

Smisao izračuna intervala pouzdanosti je da se na temelju podataka uzorka izgradi takav interval da se sa zadanom vjerojatnošću može ustvrditi da je vrijednost procijenjenog parametra u tom intervalu. Drugim riječima, interval pouzdanosti s određenom vjerojatnošću sadrži nepoznatu vrijednost procijenjene količine. Što je širi interval, veća je netočnost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom ćemo članku razmotriti 2 načina:

  • kroz medijan i standardnu ​​devijaciju;
  • preko kritične vrijednosti t-statistike (Studentov koeficijent).

Faze komparativne analize različitih metoda izračuna CI:

1. formirati uzorak podataka;

2. obrađujemo ga statističkim metodama: izračunavamo srednju vrijednost, medijan, varijancu itd.;

3. interval pouzdanosti izračunavamo na dva načina;

4. Analizirati očišćene uzorke i dobivene intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sustava estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju 1-sobnih stanova u 3. cjenovnoj zoni s tipom planiranja "Hruščov".

Tablica 1. Inicijalni uzorak

Cijena 1 m2, k.u.

Sl. 1. Inicijalni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka statističkim metodama zahtijeva izračun sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan - broj koji karakterizira uzorak: točno polovica elemenata uzorka je veća od medijana, druga polovica je manja od medijana

(za uzorak s neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca - koristi se za točniju procjenu varijacije u podacima

5. Standardna devijacija za uzorak (u daljnjem tekstu RMS) je najčešći pokazatelj disperzije vrijednosti prilagodbe oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stupanj disperzije vrijednosti prilagodbe

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijena u uzorku oko prosjeka

Tablica 2. Statistički pokazatelji izvornog uzorka

Koeficijent varijacije, koji karakterizira homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije prevelik. Dakle, možemo ustvrditi da izvorni uzorak nije homogen, pa prijeđimo na izračunavanje intervala pouzdanosti.

Faza 3. Izračun intervala pouzdanosti

Metoda 1. Izračun preko medijana i standardne devijacije.

Interval pouzdanosti određuje se na sljedeći način: minimalna vrijednost - standardna devijacija se oduzima od medijana; maksimalna vrijednost - standardna devijacija se dodaje medijanu.

Dakle, interval pouzdanosti (47179 CU; 60689 CU)

Riža. 2. Vrijednosti unutar intervala pouzdanosti 1.



Metoda 2. Izgradnja intervala pouzdanosti kroz kritičnu vrijednost t-statistike (Studentov koeficijent)

S.V. Gribovsky u knjizi "Matematičke metode za procjenu vrijednosti imovine" opisuje metodu za izračunavanje intervala pouzdanosti preko Studentovog koeficijenta. Pri proračunu ovom metodom procjenitelj mora sam postaviti razinu značajnosti ∝, koja određuje vjerojatnost s kojom će se izgraditi interval pouzdanosti. Obično se koriste razine značajnosti od 0,1; 0,05 i 0,01. Odgovaraju vjerojatnosti pouzdanosti od 0,9; 0,95 i 0,99. Ovom se metodom prave vrijednosti matematičkog očekivanja i varijance smatraju praktički nepoznatima (što je gotovo uvijek točno kada se rješavaju problemi praktične evaluacije).

Formula intervala pouzdanosti:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentove distribucije) s razinom značajnosti ∝, broj stupnjeva slobode n-1, koja se utvrđuje posebnim statističkim tablicama ili korištenjem MS Excel-a (→"Statistički"→ STUDRASPOBR);

∝ - razina značajnosti, uzimamo ∝=0,01.

Riža. 2. Vrijednosti unutar intervala pouzdanosti 2.

Korak 4. Analiza različitih načina za izračunavanje intervala pouzdanosti

Dvije metode izračunavanja intervala pouzdanosti - preko medijana i Studentovog koeficijenta - dovele su do različitih vrijednosti intervala. Sukladno tome, dobivena su dva različita pročišćena uzorka.

Tablica 3. Statistički pokazatelji za tri uzorka.

Indeks

Inicijalni uzorak

1 opcija

opcija 2

Zlobno

Disperzija

Coef. varijacije

Coef. oscilacije

Broj povučenih objekata, kom.

Na temelju izvedenih izračuna možemo reći da se vrijednosti intervala pouzdanosti dobivenih različitim metodama sijeku, tako da možete koristiti bilo koju od metoda izračuna prema nahođenju procjenitelja.

Ipak, smatramo da je pri radu u sustavu estimatica.pro preporučljivo odabrati metodu za izračun intervala pouzdanosti, ovisno o stupnju razvijenosti tržišta:

  • ako tržište nije razvijeno, primijeniti metodu izračuna kroz medijan i standardnu ​​devijaciju, budući da je broj povučenih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, primijeniti izračun preko kritične vrijednosti t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

U pripremi članka korišteni su:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode procjene vrijednosti nekretnina. Moskva, 2014

2. Podaci iz sustava estimatica.pro

Analiza slučajnih pogrešaka temelji se na teoriji slučajnih pogrešaka, koja omogućuje s određenom garancijom izračunavanje stvarne vrijednosti mjerene veličine i procjenu mogućih pogrešaka.

Osnova teorije slučajnih grešaka su sljedeće pretpostavke:

kod velikog broja mjerenja jednako se često javljaju slučajne pogreške iste veličine, ali različitog predznaka;

velike pogreške su rjeđe od malih (vjerojatnost pogreške opada s povećanjem njezine vrijednosti);

kod beskonačno velikog broja mjerenja prava vrijednost izmjerene veličine jednaka je aritmetičkoj sredini svih rezultata mjerenja;

pojavu jednog ili drugog rezultata mjerenja kao slučajnog događaja opisuje normalni zakon distribucije.

U praksi se pravi razlika između općeg i oglednog skupa mjerenja.

Pod općom populacijom podrazumijevaju cijeli skup mogućih mjernih vrijednosti ili mogućih vrijednosti pogreške
.

Za oglednu populaciju broj mjerenja ograničeno, iu svakom slučaju strogo definirano. Misle da ako
, zatim prosječna vrijednost ovog niza mjerenja dovoljno blizu svojoj pravoj vrijednosti.

1. Procjena intervala korištenjem vjerojatnosti pouzdanosti

Za veliki uzorak i normalan zakon distribucije, opća evaluacijska karakteristika mjerenja je varijanca
i koeficijent varijacije :

;
. (1.1)

Disperzija karakterizira homogenost mjerenja. Što je viši
, veća je raspršenost mjerenja.

Koeficijent varijacije karakterizira varijabilnost. Što je viši , veća je varijabilnost mjerenja u odnosu na srednje vrijednosti.

Za procjenu pouzdanosti rezultata mjerenja uvode se u razmatranje koncepti intervala pouzdanosti i vjerojatnosti pouzdanosti.

Pouzdan naziva se interval vrijednosti , u koje pada prava vrijednost izmjerena veličina sa zadanom vjerojatnošću.

Vjerojatnost povjerenja (pouzdanost) mjerenja je vjerojatnost da stvarna vrijednost izmjerene veličine pada unutar zadanog intervala pouzdanosti, tj. u zonu
. Ova se vrijednost određuje u dijelovima jedinice ili u postocima.

,

gdje
- integralna Laplaceova funkcija ( tablica 1.1 )

Integralna Laplaceova funkcija definirana je sljedećim izrazom:

.

Argument ove funkcije je jamstveni faktor :

Tablica 1.1

Integralna Laplaceova funkcija

Ako se na temelju određenih podataka utvrdi vjerojatnost povjerenja (često se smatra
), zatim postavite točnost mjerenja (interval pouzdanosti
) na temelju omjera

.

Polovica intervala pouzdanosti je

, (1.3)

gdje
- argument Laplaceove funkcije, ako
(tablica 1.1 );

- Funkcije učenika, ako
(tablica 1.2 ).

Dakle, interval pouzdanosti karakterizira točnost mjerenja danog uzorka, a razina pouzdanosti karakterizira pouzdanost mjerenja.

Primjer

Izvedena
mjerenja čvrstoće kolnika dionice autoceste s prosječnim modulom elastičnosti
te izračunata vrijednost standardne devijacije
.

Neophodno odrediti potrebnu točnost mjerenja za različite razine pouzdanosti
, uzimajući vrijednosti na tablica 1.1 .

U ovom slučaju, odnosno |

Stoga se za dati mjerni alat i metodu interval pouzdanosti povećava za oko puta ako povećate samo na
.