Biografije Karakteristike Analiza

1 interval povjerenja za matematičko očekivanje. Intervali povjerenja i etička pitanja

Interval povjerenja za matematičko očekivanje - ovo je takav interval izračunat iz podataka koji sa poznatom vjerovatnoćom sadrži matematičko očekivanje stanovništva. Prirodna procjena za matematičko očekivanje je aritmetička sredina njegovih promatranih vrijednosti. Stoga ćemo dalje tokom lekcije koristiti pojmove "prosjek", "prosječna vrijednost". U problemima izračunavanja intervala pouzdanosti, odgovor koji se najčešće traži je "Interval pouzdanosti prosječnog broja [vrijednosti u određenom problemu] je od [manje vrijednosti] do [ veća vrijednost]". Koristeći interval pouzdanosti, možete procijeniti ne samo prosječne vrijednosti, već i udio jedne ili druge karakteristike opće populacije. Prosječne vrijednosti, varijansa, standardna devijacija a greške kroz koje ćemo doći do novih definicija i formula se analiziraju u lekciji Karakteristike uzorka i populacije .

Tačkaste i intervalne procjene srednje vrijednosti

Ako je prosječna vrijednost opšte populacije procijenjena brojem (bodom), onda je za procjenu nepoznato srednja veličina opšte populacije uzima se specifična srednja vrednost koja se izračunava na osnovu uzorka posmatranja. U ovom slučaju, vrijednost uzorka srednje vrijednosti - slučajne varijable - ne poklapa se sa srednjom vrijednošću opće populacije. Stoga je prilikom navođenja srednje vrijednosti uzorka potrebno istovremeno navesti i grešku uzorka. Mjera greške uzorkovanja je standardna greška, koji je izražen u istim jedinicama kao i srednja vrijednost. Stoga se često koristi sljedeća notacija: .

Ako se traži da se procjena srednje vrijednosti poveže sa određenom vjerovatnoćom, tada se parametar opšte populacije od interesa mora procijeniti ne jednim brojem, već intervalom. Interval pouzdanosti je interval u kojem, sa određenom vjerovatnoćom, P nalazi se vrijednost procijenjenog indikatora opšte populacije. Interval povjerenja u kojem s vjerovatnoćom P = 1 - α je slučajna varijabla, izračunava se na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi, populacijska srednja vrijednost i varijansa nisu poznate, pa se varijansa populacije zamjenjuje varijansom uzorka, a populacijska srednja vrijednost uzorkom. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija opšte populacije;
  • ili standardna devijacija populacije nije poznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrasna procjena srednje vrijednosti populacije. Zauzvrat, varijansa uzorka nije nepristrasna procjena varijanse populacije . Da bi se dobila nepristrasna procjena varijanse populacije u formuli varijanse uzorka, veličina uzorka je n treba zamijeniti sa n-1.

Primjer 1 Od 100 nasumično odabranih kafića u određenom gradu prikupljaju se podaci da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite interval povjerenja od 95% broja zaposlenih u kafiću.

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Tako je interval povjerenja od 95% za prosječan broj zaposlenih u kafiću bio između 9,6 i 11,4.

Primjer 2 Za slučajni uzorak iz opće populacije od 64 opservacije, izračunate su sljedeće ukupne vrijednosti:

zbir vrijednosti u zapažanjima,

zbir kvadrata odstupanja vrijednosti od srednje vrijednosti .

Izračunajte 95% interval pouzdanosti za očekivanu vrijednost.

izračunajte standardnu ​​devijaciju:

,

izračunaj prosječnu vrijednost:

.

Zamijenite vrijednosti u izrazu za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

Tako se interval pouzdanosti od 95% za matematičko očekivanje ovog uzorka kretao od 7,484 do 11,266.

Primjer 3 Za slučajni uzorak iz opšte populacije od 100 opservacija, izračunata je srednja vrijednost od 15,2 i standardna devijacija od 3,2. Izračunajte interval pouzdanosti od 95% za očekivanu vrijednost, a zatim 99% interval pouzdanosti. Ako snaga uzorka i njena varijacija ostanu iste, ali se faktor pouzdanosti povećava, hoće li se interval povjerenja suziti ili proširiti?

Ove vrijednosti zamjenjujemo u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,05 .

Dobijamo:

.

Tako je interval pouzdanosti od 95% za prosjek ovog uzorka bio od 14,57 do 15,82.

Opet, zamjenjujemo ove vrijednosti u izraz za interval povjerenja:

gdje je kritična vrijednost standardne normalne distribucije za nivo značajnosti α = 0,01 .

Dobijamo:

.

Tako je interval pouzdanosti od 99% za prosjek ovog uzorka bio od 14,37 do 16,02.

Kao što vidite, kako se faktor pouzdanosti povećava, tako se povećava i kritična vrijednost standardne normalne distribucije, pa se stoga početna i krajnja točka intervala nalaze dalje od srednje vrijednosti, a time i interval povjerenja za matematičko očekivanje povećava.

Tačkaste i intervalne procjene specifične težine

Udio neke karakteristike uzorka može se tumačiti kao bodovna procjena specifična gravitacija str ista osobina u opštoj populaciji. Ako ovu vrijednost treba povezati s vjerovatnoćom, tada treba izračunati interval pouzdanosti specifične težine str karakteristika u opštoj populaciji sa vjerovatnoćom P = 1 - α :

.

Primjer 4 U određenom gradu postoje dva kandidata A i B kandidovanje za gradonačelnika. Nasumično je anketirano 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval povjerenja od 95% za udio stanovnika grada koji podržavaju kandidata A.

Neka se napravi uzorak iz opšte populacije koja je podložna zakonu normalno distribucija XN( m; ). Ova osnovna pretpostavka matematičke statistike zasniva se na središnjoj graničnoj teoremi. Neka je poznata opšta standardna devijacija , ali matematičko očekivanje teorijske distribucije je nepoznato m(srednja vrijednost).

U ovom slučaju, srednja vrijednost uzorka , dobijena tokom eksperimenta (odjeljak 3.4.2), također će biti slučajna varijabla m;
). Zatim "normalizovano" odstupanje
N(0;1) je standardna normalna slučajna varijabla.

Problem je pronaći procjenu intervala za m. Konstruirajmo dvostrani interval povjerenja za m tako da mu pravo matematičko očekivanje pripada sa datom vjerovatnoćom (pouzdanošću) .

Postavite takav interval za vrijednost
znači pronaći maksimalnu vrijednost ove količine
i minimum
, koje su granice kritičnog regiona:
.

Jer ova vjerovatnoća je
, zatim korijen ove jednadžbe
može se pronaći pomoću tabela Laplaceove funkcije (Tablica 3, Dodatak 1).

Onda sa vjerovatnoćom može se tvrditi da slučajna vrijednost
, odnosno željena opšta sredina pripada intervalu
. (3.13)

vrijednost
(3.14)

pozvao tačnost procjene.

Broj
kvantil normalna distribucija - može se naći kao argument Laplaceove funkcije (Tabela 3, Dodatak 1), s obzirom na omjer 2F( u)=, tj. F( u)=
.

nazad, do postavljena vrijednost odstupanja moguće je pronaći s kojom vjerovatnoćom nepoznata opšta sredina pripada intervalu
. Da biste to učinili, morate izračunati

. (3.15)

Neka se iz opće populacije uzme slučajni uzorak metodom ponovne selekcije. Iz jednadžbe
može se naći minimum volumen ponovnog uzorkovanja n potrebno da se osigura da interval pouzdanosti sa datom pouzdanošću nije premašio unapred podešenu vrednost . Potrebna veličina uzorka se procjenjuje pomoću formule:

. (3.16)

Istraživanje tačnost procjene
:

1) Sa povećanjem veličine uzorka n magnitude smanjuje se, a time i tačnost procjene povećava.

2) C povećati pouzdanost procjena vrijednost argumenta se povećava u(jer F(u) monotono raste) i stoga povećava . U ovom slučaju, povećanje pouzdanosti smanjuje tačnost njegove procjene .

Procjena
(3.17)

pozvao klasična(gde t je parametar koji zavisi od i n), jer karakterizira najčešće zakone distribucije.

3.5.3 Intervali pouzdanosti za procjenu očekivanja normalne distribucije sa nepoznatom standardnom devijacijom 

Neka bude poznato da opća populacija podliježe zakonu normalne distribucije XN( m;), gdje je vrijednost srednji kvadratni korijen odstupanja nepoznato.

Da bi se izgradio interval pouzdanosti za procjenu opšte srednje vrijednosti, u ovom slučaju se koristi statistika
, koji ima Studentovu distribuciju sa k= n–1 stepen slobode. Ovo proizilazi iz činjenice da N(0;1) (vidi tačku 3.5.2), i
(vidjeti tačku 3.5.3) i iz definicije Studentove distribucije (dio 1. tačka 2.11.2).

Nađimo tačnost klasične procjene Studentove distribucije: tj. naći t iz formule (3.17). Neka je vjerovatnoća ispunjenja nejednakosti
koju daje pouzdanost :

. (3.18)

Zbog TSt( n-1), očigledno je da t zavisi od i n, tako obično pišemo
.

(3.19)

gdje
je Studentova funkcija distribucije sa n-1 stepen slobode.

Rješavanje ove jednadžbe za m, dobijamo interval
koji sa pouzdanošću  pokriva nepoznati parametar m.

Vrijednost t , n-1, koji se koristi za određivanje intervala pouzdanosti slučajne varijable T(n-1), distribuira Student sa n-1 stepen slobode se zove Studentov koeficijent. Treba ga pronaći prema datim vrijednostima n i  iz tabela " Kritične tačke Raspodjela studenata. (Tabela 6, Dodatak 1), koji su rješenja jednadžbe (3.19).

Kao rezultat, dobijamo sljedeći izraz tačnost interval povjerenja za procjenu matematičkog očekivanja (opća sredina), ako je varijansa nepoznata:

(3.20)

Dakle, postoji opšta formula za konstruisanje intervala poverenja za matematička očekivanja opšte populacije:

gdje je tačnost intervala povjerenja ovisno o poznatoj ili nepoznatoj varijansi nalazi se prema formulama 3.16. i 3.20.

Zadatak 10. Obavljeni su neki testovi, čiji su rezultati navedeni u tabeli:

x i

Poznato je da se pridržavaju zakona normalne raspodjele s
. Pronađite procjenu m* za matematičko očekivanje m, izgradite interval pouzdanosti od 90% za to.

Rješenje:

dakle, m(2.53;5.47).

Zadatak 11. Dubina mora se mjeri instrumentom čija je sistematska greška 0, a slučajne greške se distribuiraju prema normalnom zakonu, sa standardnom devijacijom =15m. Koliko nezavisnih mjerenja treba izvršiti da bi se odredila dubina s greškama ne većim od 5 m sa nivoom pouzdanosti od 90%?

Rješenje:

Po uslovu problema imamo XN( m; ), gdje =15m, =5m, =0,9. Nađimo volumen n.

1) Sa zadatom pouzdanošću = 0,9, iz tabele 3 (Dodatak 1) nalazimo argument Laplaceove funkcije u = 1.65.

2) Poznavanje date tačnosti procjene =u=5, pronađi
. Imamo

. Dakle, broj suđenja n25.

Zadatak 12. Uzorkovanje temperature t za prvih 6 dana januara prikazan je u tabeli:

Pronađite interval pouzdanosti za očekivanje m opšta populacija sa pouzdanom verovatnoćom
i procijeniti opštu standardnu ​​devijaciju s.

Rješenje:


i
.

2) Nepristrasna procjena pronađite po formuli
:

=-175

=234.84

;
;

=-192

=116


.

3) Pošto je opšta varijansa nepoznata, ali je njena procena poznata, onda da se proceni matematičko očekivanje m koristimo Studentovu distribuciju (Tabela 6, Prilog 1) i formulu (3.20).

Jer n 1 =n 2 =6, onda ,
, s 1 =6,85 imamo:
, dakle -29,2-4,1<m 1 < -29.2+4.1.

Dakle -33.3<m 1 <-25.1.

Slično, imamo
, s 2 = 4,8, dakle

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33,3;-25,1) i m 2 (-34.9;-29.1).

U primijenjenim naukama, na primjer, u građevinskim disciplinama, za procjenu tačnosti objekata koriste se tabele intervala pouzdanosti, koje su date u relevantnoj referentnoj literaturi.

INTERVAL POVERENJA ZA OČEKIVANJE

1. Neka se to zna sl. količina x poštuje normalan zakon sa nepoznatom sredinom μ i poznatim σ 2: X~N(μ,σ 2), σ 2 je dato, μ nije poznato. S obzirom na β. Na osnovu uzorka x 1, x 2, … , x n, potrebno je konstruisati I β (θ) (sada θ=μ) zadovoljavajući (13)

Srednja vrijednost uzorka (takođe kažu i srednja vrijednost uzorka) poštuje normalni zakon sa istim centrom μ, ali manjom varijansom X~N (μ , D ), gdje je varijansa D =σ 2 =σ 2 /n.

Potreban nam je broj K β definisan za ξ~N(0,1) uslovom

Riječima: između tačaka -K β i K β x-ose nalazi se površina ispod krivulje gustine standardnog normalnog zakona, jednaka β

Na primjer, K 0,90 \u003d 1,645 kvantil nivoa 0,95 vrijednosti ξ

K 0,95 = 1,96. ; K 0,997 \u003d 3.

Konkretno, odvajajući 1,96 standardnih devijacija udesno i isto toliko lijevo od centra bilo kojeg normalnog zakona, uhvatićemo površinu ispod krivulje gustine jednaku 0,95, zbog čega je K 0 95 kvantil nivo 0,95 + 1/2 * 0,005 = 0,975 za ovaj zakon.

Željeni interval povjerenja za opći prosjek μ je I A (μ) = (x-σ, x + σ),

gdje je δ = (15)

Hajde da se opravdamo:

Prema onome što je rečeno, vrednost pada u interval J=μ±σ sa verovatnoćom β (slika 9). U ovom slučaju, vrijednost odstupa od centra μ manje od δ, i slučajnog intervala ± δ (sa slučajnim centrom i istom širinom kao J) će pokriti tačku μ. To je Ê J<=> μ Є ja β , i stoga R(μÊÍ β ) = R(Ê J )=β.

Dakle, interval konstante uzorka I β sadrži srednju vrijednost μ sa vjerovatnoćom β.

Jasno, što više n, to manje σ a interval je uži, i što je veća garancija β, to je širi interval povjerenja.

Primjer 21.

Za uzorak sa n=16 za normalnu vrijednost sa poznatom varijansom σ 2 =64 pronađeno je x=200. Konstruisati interval poverenja za opštu sredinu (drugim rečima, za matematičko očekivanje) μ, uz pretpostavku β=0,95.

Rješenje. I β (μ)= ± δ, gdje je δ = K β σ/ -> K β σ/ =1,96*8/ = 4

I 0,95 (μ)=200 4=(196;204).

Zaključujući da, uz garanciju od β=0,95, prava srednja vrednost pripada intervalu (196,204), shvatamo da je greška moguća.

Od 100 intervala povjerenja I 0,95 (μ), u prosjeku 5 ne sadrže μ.

Primjer 22.

U uslovima prethodnog primjera 21, šta treba uzeti n da bi se interval povjerenja prepolovio? Da biste imali 2δ=4, morate uzeti

U praksi se često koriste jednostrani intervali povjerenja. Dakle, ako su visoke vrijednosti μ korisne ili nisu strašne, ali niske nisu ugodne, kao u slučaju snage ili pouzdanosti, onda je razumno izgraditi jednostrani interval. Da biste to učinili, trebate podići njegovu gornju granicu što je više moguće. Ako izgradimo, kao u primjeru 21, dvostrani interval povjerenja za dati β, a zatim ga proširimo što je više moguće zbog jedne od granica, onda ćemo dobiti jednostrani interval s većom garancijom β" = β + (1-β) / 2 = (1+ β)/2, na primjer, ako je β = 0,90, onda je β = 0,90 + 0,10/2 = 0,95.

Na primjer, pretpostavit ćemo da govorimo o jačini proizvoda i podići gornju granicu intervala na . Tada za μ u primeru 21 dobijamo jednostrani interval poverenja (196,°°) sa donjom granicom od 196 i verovatnoćom poverenja β"=0,95+0,05/2=0,975.

Praktični nedostatak formule (15) je što se ona izvodi pod pretpostavkom da je disperzija = σ 2 (dakle = σ 2 /n) poznata; a to se retko dešava u stvarnom životu. Izuzetak je slučaj kada je veličina uzorka velika, recimo, n se mjeri stotinama ili hiljadama, i tada za σ 2 možemo praktično uzeti njegovu procjenu s 2 ili .

Primjer 23.

Pretpostavimo da je u nekom velikom gradu, kao rezultat uzorka istraživanja uslova života stanovnika, dobijena sljedeća tabela podataka (primjer sa posla).

Tabela 8

Izvorni podaci na primjer

To je prirodno pretpostaviti vrijednost X - ukupna (korisna) površina (u m 2) po osobi je u skladu sa normalnim zakonom. Srednja vrijednost μ i varijansa σ 2 nisu poznati. Za μ, potrebno je konstruirati interval pouzdanosti od 95%. Da bismo pronašli uzorku srednje vrijednosti i varijansu iz grupisanih podataka, sastavit ćemo sljedeću tablicu proračuna (Tabela 9).

Tabela 9

X i 5 Proračuni na grupisanim podacima

N grupa h Ukupna površina po 1 osobi, m 2 Broj stanovnika u grupi r j Interval x j r j x j rjxj 2
Do 5.0 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
preko 30.0 32.5 * 2697.5 87668.75
- 19005.0 412250.0

U ovoj pomoćnoj tabeli, prema formuli (2), izračunavaju se prvi i drugi početni statistički momenti a 1 i a 2

Iako je varijansa σ 2 ovdje nepoznata, zbog velike veličine uzorka, formula (15) se može primijeniti u praksi, postavljajući u njoj σ= =7,16.

Tada je δ=k 0,95 σ/ =1,96*7,16/ =0,46.

Interval pouzdanosti za opštu srednju vrednost pri β=0,95 je I 0,95 (μ) = ± δ = 19 ± 0,46 = (18,54; 19,46).

Dakle, prosječna vrijednost površine po osobi u ovom gradu sa garancijom od 0,95 leži u intervalu (18,54; 19,46).



2. Interval pouzdanosti za matematičko očekivanje μ u slučaju nepoznate varijanse σ 2 normalne vrijednosti. Ovaj interval za datu garanciju β se konstruiše prema formuli , gdje je ν = n-1 ,

(16)

Koeficijent t β,ν ima isto značenje za t - distribuciju sa ν stepeni slobode, kao i za β za distribuciju N(0,1), i to:

.

Drugim riječima, sl. Vrijednost tν pada u interval (-t β,ν ; +t β,ν) sa vjerovatnoćom β. Vrijednosti t β,ν date su u tabeli 10 za β=0,95 i β=0,99.

Tabela 10

Vrijednosti t β,ν

Vraćajući se na primjer 23, vidimo da je interval povjerenja u njemu izgrađen prema formuli (16) sa koeficijentom t β,υ =k 0..95 =1.96, budući da je n=1000.

Izgradimo interval pouzdanosti u MS EXCEL-u za procjenu srednje vrijednosti distribucije u slučaju poznate vrijednosti varijanse.

Naravno izbor nivo poverenja u potpunosti ovisi o zadatku koji se radi. Dakle, stepen poverenja putnika u pouzdanost aviona, naravno, treba da bude veći od stepena poverenja kupca u pouzdanost sijalice.

Formulacija zadatka

Pretpostavimo da od stanovništva uzimajući uzorak veličina n. Pretpostavlja se da standardna devijacija ova distribucija je poznata. Neophodan na osnovu ovoga uzorci proceniti nepoznato srednja distribucija(μ, ) i konstruisati odgovarajuće bilateralni interval povjerenja.

Point Estimation

Kao što je poznato iz statistika(nazovimo to X cf) je nepristrasna procjena srednje vrijednosti ovo stanovništva i ima distribuciju N(μ;σ 2 /n).

Bilješka: Šta ako treba da gradite interval povjerenja u slučaju distribucije, koja nije normalno? U ovom slučaju dolazi u pomoć, što govori da je s dovoljno velikom veličinom uzorci n iz distribucije ne- normalno, uzorkovanje distribucije statistike H av bice otprilike dopisivati ​​se normalna distribucija sa parametrima N(μ;σ 2 /n).

dakle, tačka procene srednji vrijednosti distribucije imamo je srednja vrijednost uzorka, tj. X cf. A sada da se zaposlimo interval povjerenja.

Izgradnja intervala povjerenja

Obično, poznavajući distribuciju i njene parametre, možemo izračunati vjerovatnoću da će slučajna varijabla uzeti vrijednost iz datog intervala. Sada uradimo suprotno: pronađite interval u koji slučajna varijabla pada sa datom vjerovatnoćom. Na primjer, iz svojstava normalna distribucija poznato je da je sa vjerovatnoćom od 95% slučajna varijabla raspoređena po normalan zakon, pasti će unutar intervala približno +/- 2 od srednja vrijednost(vidi članak o). Ovaj interval će nam poslužiti kao prototip za interval povjerenja.

Sada da vidimo da li znamo distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo navesti oblik distribucije i njegove parametre.

Znamo kakav je oblik distribucije normalna distribucija (zapamtite da govorimo o distribucija uzorkovanja statistika X cf).

Parametar μ nam je nepoznat (samo ga treba procijeniti pomoću interval povjerenja), ali imamo njegovu procjenu X cf, izračunato na osnovu uzorak, koji se mogu koristiti.

Drugi parametar je srednja standardna devijacija uzorka biće poznato, jednako je σ/√n.

Jer ne znamo μ, onda ćemo izgraditi interval +/- 2 standardne devijacije ne od srednja vrijednost, ali prema njegovoj poznatoj procjeni X cf. One. prilikom izračunavanja interval povjerenja to NEĆEMO pretpostaviti X cf pasti u interval +/- 2 standardne devijacije od μ sa vjerovatnoćom od 95%, a pretpostavićemo da je interval +/- 2 standardne devijacije od X cf sa vjerovatnoćom od 95% će pokriti μ - prosjek opšte populacije, iz koje uzorak. Ove dvije izjave su ekvivalentne, ali nam druga izjava omogućava konstruiranje interval povjerenja.

Osim toga, preciziramo interval: slučajna varijabla raspoređena po normalan zakon, sa vjerovatnoćom od 95% spada u interval +/- 1.960 standardne devijacije, ne +/- 2 standardne devijacije. Ovo se može izračunati pomoću formule \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. uzorak datoteke Razmak listova.

Sada možemo formulisati verovatnoćan iskaz koji će nam poslužiti za formiranje interval povjerenja:
„Verovatnoća da srednja populacija nalazi se od prosek uzorka unutar 1.960" standardne devijacije srednje vrijednosti uzorka", je jednako 95%.

Vrijednost vjerovatnoće spomenuta u izjavi ima poseban naziv , koji je povezan sa nivo značajnosti α (alfa) jednostavnim izrazom nivo poverenja =1 . U našem slučaju nivo značajnosti α =1-0,95=0,05 .

Sada, na osnovu ove vjerovatnoće, pišemo izraz za izračunavanje interval povjerenja:

gdje je Zα/2 standard normalna distribucija(takva vrijednost slučajne varijable z, šta P(z>=Zα/2 )=α/2).

Bilješka: Gornji α/2-kvantil definiše širinu interval povjerenja in standardne devijacije srednja vrijednost uzorka. Gornji α/2-kvantil standard normalna distribucija je uvijek veći od 0, što je vrlo zgodno.

U našem slučaju, pri α=0,05, gornji α/2-kvantil jednako 1.960. Za druge nivoe značajnosti α (10%; 1%) gornji α/2-kvantil Zα/2 može se izračunati pomoću formule \u003d NORM.ST.OBR (1-α / 2) ili, ako je poznato nivo poverenja, =NORM.ST.OBR((1+nivo pouzdanosti)/2).

Obično prilikom izgradnje intervali povjerenja za procjenu srednje vrijednosti koristiti samo gornji α/2-kvantil i nemojte koristiti niži α/2-kvantil. Ovo je moguće jer standard normalna distribucija simetrično oko x-ose ( gustina njegove distribucije simetrično oko prosjek, tj. 0). Stoga nema potrebe za kalkulacijom niži α/2-kvantil(jednostavno se zove α /2-kvantil), jer jednako je gornji α/2-kvantil sa znakom minus.

Podsjetimo da je, bez obzira na oblik distribucije x, odgovarajuća slučajna varijabla X cf distribuirano otprilike u redu N(μ;σ 2 /n) (vidi članak o). Stoga, u opšti slučaj, gornji izraz za interval povjerenja je samo približan. Ako je x distribuiran preko normalan zakon N(μ;σ 2 /n), zatim izraz za interval povjerenja je tačno.

Izračunavanje intervala pouzdanosti u MS EXCEL-u

Hajde da rešimo problem.
Vrijeme odziva elektronska komponenta na ulazni signal je važna karakteristika uređaja. Inženjer želi da nacrta interval pouzdanosti za prosječno vrijeme odgovora na nivou pouzdanosti od 95%. Iz prethodnog iskustva, inženjer zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je inženjer izvršio 25 mjerenja kako bi procijenio vrijeme odziva, prosječna vrijednost je bila 78 ms.

Rješenje: Inženjer želi znati vrijeme odziva elektronskog uređaja, ali razumije da vrijeme odziva nije fiksno, već slučajna varijabla koja ima svoju distribuciju. Dakle, najbolje čemu se može nadati je da odredi parametre i oblik ove distribucije.

Nažalost, iz uslova problema ne znamo oblik distribucije vremena odziva (ne mora biti normalno). , ova distribucija je također nepoznata. Samo je on poznat standardna devijacijaσ=8. Stoga, dok ne možemo izračunati vjerovatnoće i konstruirati interval povjerenja.

Međutim, iako ne znamo distribuciju vrijeme odvojen odgovor, znamo da prema CPT, distribucija uzorkovanja prosječno vrijeme odgovora je približno normalno(pretpostavićemo da su uslovi CPT se izvode, jer veličina uzorci dovoljno velika (n=25)) .

Nadalje, prosjek ova distribucija je jednaka srednja vrijednost distribucije odziva jedinica, tj. μ. ALI standardna devijacija ove distribucije (σ/√n) može se izračunati pomoću formule =8/ROOT(25) .

Takođe je poznato da je inženjer primio tačka procene parametar μ jednak 78 ms (X cf). Dakle, sada možemo izračunati vjerovatnoće, jer znamo oblik distribucije ( normalno) i njegove parametre (H sr i σ/√n).

Inženjer želi da zna očekivanu vrijednostμ distribucije vremena odziva. Kao što je gore navedeno, ovaj μ je jednak očekivanje distribucije uzorka prosječnog vremena odgovora. Ako koristimo normalna distribucija N(X cf; σ/√n), tada će željeni μ biti u opsegu +/-2*σ/√n sa vjerovatnoćom od približno 95%.

Nivo značaja jednako 1-0,95=0,05.

Konačno, pronađite lijevu i desnu granicu interval povjerenja.
Lijeva granica: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864
Desna granica: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / KORIJEN (25) = 81,136

Lijeva granica: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Desna granica: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Odgovori: interval povjerenja at 95% nivo pouzdanosti i σ=8msec jednaki 78+/-3.136ms

AT primjer fajla na listu Sigma poznat kreirao obrazac za proračun i konstrukciju bilateralni interval povjerenja za proizvoljno uzorci sa datim σ i nivo značajnosti.

CONFIDENCE.NORM() funkcija

Ako vrijednosti uzorci su u dometu B20:B79 , a nivo značajnosti jednako 0,05; zatim MS EXCEL formula:
=PROSJEČNO(B20:B79)-POVJERENJE(0,05,σ, BROJ(B20:B79))
će vratiti lijevu ivicu interval povjerenja.

Ista granica se može izračunati pomoću formule:
=PROSJEK(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(BROJ(B20:B79))

Bilješka: Funkcija CONFIDENCE.NORM() pojavila se u MS EXCEL 2010. Više rane verzije MS EXCEL je koristio funkciju TRUST().

Prvo, podsjetimo se sljedeće definicije:

Razmotrimo sljedeću situaciju. Neka varijante opšte populacije imaju normalnu distribuciju sa matematičkim očekivanjem $a$ i srednjom vrednošću standardna devijacija$\sigma $. Uzorak srednji u ovaj slučajće se tretirati kao slučajna varijabla. Kada je $X$ normalno raspoređena, srednja vrijednost uzorka će također imati normalnu distribuciju s parametrima

Nađimo interval pouzdanosti koji pokriva $a$ sa pouzdanošću $\gamma $.

Da bismo to učinili, potrebna nam je jednakost

Iz toga dobijamo

Odavde možemo lako pronaći $t$ iz tablice vrijednosti funkcije $F\left(t\right)$ i, kao rezultat, pronaći $\delta $.

Prisjetite se tablice vrijednosti funkcije $F\left(t\right)$:

Slika 1. Tabela vrijednosti funkcije $F\left(t\right).$

Integral pouzdanosti za procjenu očekivanja kada je $(\mathbf \sigma )$ nepoznat

U ovom slučaju koristićemo vrijednost korigirane varijanse $S^2$. Zamenivši $\sigma $ u gornjoj formuli sa $S$, dobijamo:

Primjer zadataka za pronalaženje intervala povjerenja

Primjer 1

Neka veličina $X$ ima normalnu distribuciju sa varijansom $\sigma =4$. Neka veličina uzorka bude $n=64$, a pouzdanost jednaka $\gamma =0,95$. Naći interval pouzdanosti za procjenu matematičkog očekivanja date distribucije.

Moramo pronaći interval ($\overline(x)-\delta ,\overline(x)+\delta)$.

Kao što smo vidjeli gore

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\ t)(2)\]

Parametar $t$ pronalazimo iz formule

\[F\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]

Iz tabele 1 dobijamo da je $t=1.96$.