Biografije Karakteristike Analiza

1 interval pouzdanosti za matematičko očekivanje. Intervali povjerenja i etička pitanja

Interval pouzdanosti Za matematičko očekivanje je interval izračunat iz podataka koji sadrže matematičko očekivanje s poznatom vjerojatnošću populacija. Prirodna procjena matematičkog očekivanja je aritmetička sredina njegovih promatranih vrijednosti. Stoga ćemo tijekom cijele lekcije koristiti pojmove "prosjek" i "prosječna vrijednost". U problemima izračuna intervala pouzdanosti, odgovor koji se najčešće traži je nešto poput "Interval pouzdanosti prosječnog broja [vrijednosti u određenom problemu] je od [manje vrijednosti] do [ višu vrijednost]". Pomoću intervala pouzdanosti možete procijeniti ne samo prosječne vrijednosti, već i specifičnu težinu određene karakteristike populacije. Prosječne vrijednosti, varijanca, standardna devijacija a pogreške kroz koje ćemo doći do novih definicija i formula raspravljamo u lekciji Obilježja uzorka i populacije .

Točkaste i intervalne procjene srednje vrijednosti

Ako je srednja vrijednost populacije procijenjena brojem (točkom), tada je za procjenu nepoznanice prosječne veličine opće populacije uzima se određeni prosjek koji se izračunava iz uzorka opažanja. U ovom slučaju vrijednost uzorkačke sredine – slučajne varijable – ne podudara se sa srednjom vrijednošću opće populacije. Stoga, kada označavate srednju vrijednost uzorka, morate istovremeno navesti pogrešku uzorkovanja. Mjera pogreške uzorkovanja je standardna pogreška, koji se izražava u istim jedinicama kao i prosjek. Stoga se često koristi sljedeća oznaka: .

Ako procjenu prosjeka treba povezati s određenom vjerojatnošću, tada se parametar od interesa u populaciji mora procijeniti ne jednim brojem, već intervalom. Interval povjerenja je interval u kojem se s određenom vjerojatnošću P nalazi se vrijednost procijenjenog pokazatelja populacije. Interval pouzdanosti u kojem je to vjerojatno P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi srednja vrijednost populacije i varijanca nisu poznati, pa se varijanca populacije zamjenjuje varijancom uzorka, a srednja vrijednost populacije sredinom uzorka. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija populacije;
  • ili je standardna devijacija populacije nepoznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrana procjena srednje vrijednosti populacije. S druge strane, varijanca uzorka nije nepristrana procjena varijance populacije. Za dobivanje nepristrane procjene varijance populacije u formuli varijance uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Od 100 nasumično odabranih kafića u određenom gradu prikupljen je podatak da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite 95% interval pouzdanosti za broj zaposlenih u kafiću.

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Tako se 95%-tni interval pouzdanosti za prosječan broj zaposlenih u kafiću kretao od 9,6 do 11,4.

Primjer 2. Za nasumični uzorak Iz populacije od 64 opažanja izračunate su sljedeće ukupne vrijednosti:

zbroj vrijednosti u promatranjima,

zbroj kvadrata odstupanja vrijednosti od prosjeka .

Izračunajte interval pouzdanosti od 95% za matematičko očekivanje.

Izračunajmo standardnu ​​devijaciju:

,

Izračunajmo prosječnu vrijednost:

.

Zamjenjujemo vrijednosti u izraz za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Dobivamo:

Stoga je 95%-tni interval pouzdanosti za matematičko očekivanje ovog uzorka bio u rasponu od 7,484 do 11,266.

Primjer 3. Za slučajni uzorak populacije od 100 opažanja, izračunata sredina je 15,2, a standardna devijacija je 3,2. Izračunajte 95% interval pouzdanosti za očekivanu vrijednost, zatim 99% interval pouzdanosti. Ako snaga uzorka i njezina varijacija ostanu nepromijenjeni, a koeficijent pouzdanosti raste, hoće li se interval pouzdanosti suziti ili proširiti?

Zamjenjujemo ove vrijednosti u izraz za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Dobivamo:

.

Stoga je 95% interval pouzdanosti za srednju vrijednost ovog uzorka bio u rasponu od 14,57 do 15,82.

Ponovno zamijenimo ove vrijednosti u izrazu za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,01 .

Dobivamo:

.

Stoga je 99% interval pouzdanosti za srednju vrijednost ovog uzorka bio u rasponu od 14,37 do 16,02.

Kao što vidimo, kako se koeficijent pouzdanosti povećava, kritična vrijednost standardne normalne distribucije također raste, i, posljedično, početna i završna točka intervala nalaze se dalje od srednje vrijednosti, a time se povećava interval pouzdanosti za matematičko očekivanje .

Točkaste i intervalne procjene specifične težine

Udio nekog atributa uzorka može se protumačiti kao procjena specifična gravitacija str istih karakteristika u općoj populaciji. Ako ovu vrijednost treba povezati s vjerojatnošću, tada treba izračunati interval pouzdanosti specifične težine str karakterističan u populaciji s vjerojatnošću P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A I B kandidiraju se za gradonačelnika. Nasumično je anketirano 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval pouzdanosti od 95% za udio stanovnika grada koji podržavaju kandidata A.

Neka se uzme uzorak iz opće populacije koja podliježe zakonu normalan distribucija xN( m; ). Ova osnovna pretpostavka matematičke statistike temelji se na središnjem graničnom teoremu. Neka je poznata opća standardna devijacija , ali matematičko očekivanje teorijske distribucije je nepoznato m(Prosječna vrijednost ).

U ovom slučaju, sredina uzorka , dobiven tijekom eksperimenta (odjeljak 3.4.2), također će biti slučajna varijabla m;
). Zatim "normalizirano" odstupanje
N(0;1) – je standardna normalna slučajna varijabla.

Zadatak je pronaći intervalnu procjenu za m. Konstruirajmo dvostrani interval pouzdanosti za m tako da mu pravo matematičko očekivanje pripada sa zadanom vjerojatnošću (pouzdanošću) .

Postavite takav interval za vrijednost
- to znači pronaći najveću vrijednost ove količine
i minimum
, koje su granice kritičnog područja:
.

Jer ova je vjerojatnost jednaka
, tada je korijen ove jednadžbe
mogu se pronaći pomoću Laplaceovih tablica funkcija (Tablica 3, Dodatak 1).

Zatim s vjerojatnošću može se tvrditi da slučajna vrijednost
, odnosno željeni opći prosjek pripada intervalu
. (3.13)

Veličina
(3.14)

nazvao točnost procjene.

Broj
kvantil normalna distribucija - može se pronaći kao argument Laplaceove funkcije (Tablica 3, Dodatak 1), uzimajući u obzir relaciju 2F( u)=, tj. F( u)=
.

Natrag, pored postavljena vrijednost odstupanja može se pronaći s kojom vjerojatnošću nepoznata opća sredina pripada intervalu
. Da biste to učinili, morate izračunati

. (3.15)

Neka se slučajni uzorak izdvoji iz opće populacije metodom ponovljenog odabira. Iz jednadžbe
može se naći minimum volumen ponovnog uzorkovanja n, potreban za interval pouzdanosti s danom pouzdanošću nije premašio prethodno postavljenu vrijednost . Potrebna veličina uzorka procjenjuje se pomoću formule:

. (3.16)

Idemo istraživati točnost procjene
:

1) Kako se veličina uzorka povećava n veličina smanjuje se, a time i točnost procjene povećava se.

2) C povećati pouzdanost procjene povećava se vrijednost argumenta u(jer F(u) monotono raste) i stoga povećava se . U ovom slučaju, povećanje pouzdanosti smanjuje točnost njegove procjene .

Evaluacija
(3.17)

nazvao klasični(Gdje t- određeni parametar ovisno o I n), jer karakterizira zakone raspodjele koji se najčešće susreću.

3.5.3 Intervali pouzdanosti za procjenu matematičkog očekivanja normalne distribucije s nepoznatom standardnom devijacijom 

Neka se zna da stanovništvo podliježe zakonu normalne raspodjele xN( m;), gdje je vrijednost korijen znači kvadrat odstupanja nepoznato.

Za konstruiranje intervala pouzdanosti za procjenu opće srednje vrijednosti u ovom slučaju koristi se statistika
, imajući Student distribuciju sa k= n–1 stupnjeva slobode. To proizlazi iz činjenice da N(0;1) (vidi odjeljak 3.5.2), i
(vidi odjeljak 3.5.3) i iz definicije Studentove distribucije (dio 1. odjeljak 2.11.2).

Pronađimo točnost klasične procjene Studentove distribucije: tj. pronaći ćemo t iz formule (3.17). Neka je vjerojatnost ispunjenja nejednakosti
dano pouzdanošću :

. (3.18)

Jer TSt( n-1), očito je da t ovisi o I n, tako obično pišu
.

(3.19)

Gdje
– Distribucijska funkcija učenika sa n-1 stupnjeva slobode.

Rješavanje ove jednadžbe za m, dobivamo interval
koji pouzdano  pokriva nepoznati parametar m.

Veličina t , n-1, koristi se za određivanje intervala pouzdanosti slučajne varijable T(n-1), raspodijeljen prema t-testu sa n-1 stupnjeva slobode naziva se Koeficijent učenika. Treba ga pronaći prema zadanim vrijednostima n i  iz tablica " Kritične točke Studentske distribucije. (Tablica 6, Dodatak 1), koji predstavljaju rješenja jednadžbe (3.19).

Kao rezultat toga, dobivamo sljedeći izraz točnost interval pouzdanosti za procjenu matematičkog očekivanja (opća sredina), ako je varijanca nepoznata:

(3.20)

Dakle, postoji opća formula za konstrukciju intervala pouzdanosti za matematička očekivanja populacije:

gdje je točnost intervala pouzdanosti ovisno o poznatoj ili nepoznatoj disperziji nalazi se prema formulama, odnosno 3.16. i 3.20.

Problem 10. Provedena su neka ispitivanja čiji su rezultati navedeni u tablici:

x ja

Poznato je da se pokoravaju zakonu normalne distribucije s
. Pronađite ocjenu m* za matematičko očekivanje m, konstruirajte 90% interval pouzdanosti za njega.

Riješenje:

Tako, m(2.53;5.47).

Problem 11. Dubina mora mjeri se uređajem čija je sustavna pogreška 0, a slučajne pogreške raspoređene su po normalnom zakonu, sa standardnom devijacijom =15m. Koliko neovisnih mjerenja treba napraviti da se odredi dubina s pogreškama od najviše 5 m na razini pouzdanosti od 90%?

Riješenje:

Prema uvjetima problema koji imamo xN( m; ), Gdje =15m, =5m, =0,9. Pronađimo volumen n.

1) Uz zadanu pouzdanost = 0,9, iz tablice 3 (Dodatak 1) nalazimo argument Laplaceove funkcije u = 1.65.

2) Poznavanje specificirane točnosti procjene =u=5, idemo pronaći
. Imamo

. Stoga broj testova n25.

Problem 12. Uzorkovanje temperature t za prvih 6 dana siječnja prikazan je u tablici:

Odredite interval pouzdanosti za matematičko očekivanje m populacija s vjerojatnošću povjerenja
i procijeniti opću standardnu ​​devijaciju s.

Riješenje:


I
.

2) Nepristrana procjena pronađite pomoću formule
:

=-175

=234.84

;
;

=-192

=116


.

3) Budući da je opća varijanca nepoznata, ali je poznata njezina procjena, tada za procjenu matematičkog očekivanja m koristimo Studentovu distribuciju (Tablica 6, Dodatak 1) i formulu (3.20).

Jer n 1 =n 2 =6, tada,
, s 1 =6,85 imamo:
, dakle -29,2-4,1<m 1 < -29.2+4.1.

Prema tome -33.3<m 1 <-25.1.

Slično imamo,
, s 2 = 4,8, dakle

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33,3;-25,1) i m 2 (-34.9;-29.1).

U primijenjenim znanostima, na primjer, u građevinskim disciplinama, za ocjenu točnosti objekata koriste se tablice intervala pouzdanosti, koje su dane u relevantnoj referentnoj literaturi.

INTERVAL POVJERANJA ZA MATEMATIČKO OČEKIVANJE

1. Neka se zna da sl. količina x pokorava normalno pravo s nepoznatom srednjom μ i poznatim σ 2: X~N(μ,σ 2), σ 2 je zadan, μ je nepoznat. β je naveden. Na temelju uzorka x 1, x 2, … , x n, potrebno je konstruirati I β (θ) (sada θ=μ), zadovoljavajući (13)

Srednja vrijednost uzorka (također nazvana srednja vrijednost uzorka) pridržava se normalnog zakona s istim središtem μ, ali manjom varijancom X~N (μ, D), gdje je varijanca D =σ 2 =σ 2 /n.

Trebat će nam broj K β, definiran za ξ~N(0,1) uvjetom

Riječima: između točaka -K β i K β na apscisnoj osi leži površina ispod krivulje gustoće standardnog normalnog zakona, jednaka β

Na primjer, K 0,90 = 1,645 kvantil 0,95 razine vrijednosti ξ

K 0,95 = 1,96. ; K 0,997 =3.

Konkretno, odvajajući 1,96 standardnih devijacija udesno i isto toliko ulijevo od središta bilo kojeg normalnog zakona, hvatamo površinu ispod krivulje gustoće jednaku 0,95, zbog čega je K 0 95 kvantil razine 0,95 + 1/2 * 0,005 = 0,975 za ovaj zakon.

Zahtijevani interval pouzdanosti za opću srednju vrijednost μ je I A (μ) = (x-σ, x+σ),

gdje je δ = (15)

Dajmo obrazloženje:

Prema rečenom, riječi. vrijednost pada u interval J=μ±σ s vjerojatnošću β (slika 9). U tom slučaju veličina odstupa od središta μ za manje od δ, a slučajni interval ± δ (sa slučajnim središtem i istom širinom kao J) će pokriti točku μ. To je Ê J<=> μ Є Iβ, pa prema tome R(μÊÍ β) = R(Ê J)=β.

Dakle, interval I β, konstantan preko uzorka, sadrži srednju vrijednost μ s vjerojatnošću β.

Jasno, što je n veći, to je manji σ a interval je uži, a što veće uzmemo jamstvo β, to je širi interval pouzdanosti.

Primjer 21.

Na temelju uzorka s n=16 za normalnu vrijednost s poznatom varijancom σ 2 =64, pronađeno je x=200. Konstruirajte interval pouzdanosti za opću sredinu (drugim riječima, za matematičko očekivanje) μ, uzimajući β=0,95.

Riješenje. I β (μ)= ± δ, gdje je δ = K β σ/ -> K β σ/ =1,96*8/ = 4

I 0,95 (μ)=200 4=(196;204).

Zaključujući da uz jamstvo β=0,95 pravi prosjek pripada intervalu (196,204), razumijemo da je pogreška moguća.

Od 100 intervala pouzdanosti I 0,95 (μ), u prosjeku 5 ne sadrži μ.

Primjer 22.

U uvjetima prethodnog primjera 21, koliko n treba poduzeti da se interval pouzdanosti prepolovi? Da bismo imali 2δ=4, moramo uzeti

U praksi se često koriste jednostrani intervali pouzdanosti. Dakle, ako su visoke vrijednosti μ korisne ili nisu štetne, ali su niske vrijednosti neugodne, kao u slučaju čvrstoće ili pouzdanosti, tada je razumno konstruirati jednostrani interval. Da biste to učinili, trebali biste podići njegovu gornju granicu što je više moguće. Ako konstruiramo, kao u primjeru 21, dvostrani interval pouzdanosti za dani β, a zatim ga proširimo što je više moguće na račun jedne od granica, dobit ćemo jednostrani interval s većim jamstvom β" = β + (1-β) / 2 = (1+ β)/2, na primjer, ako je β = 0,90, tada je β = 0,90 + 0,10/2 = 0,95.

Na primjer, pretpostavit ćemo da je riječ o jakosti proizvoda i podići gornju granicu intervala na . Zatim za μ u primjeru 21 dobivamo jednostrani interval pouzdanosti (196,°°) s donjom granicom od 196 i vjerojatnošću pouzdanosti β"=0,95+0,05/2=0,975.

Praktični nedostatak formule (15) je taj što je izvedena pod pretpostavkom da je poznata varijanca = σ 2 (dakle = σ 2 /n); a to se rijetko događa u životu. Izuzetak je slučaj kada je veličina uzorka velika, recimo n se mjeri u stotinama ili tisućama, i tada se za σ 2 može praktično uzeti njegova procjena s 2 ili .

Primjer 23.

Pretpostavimo da je u velikom gradu, kao rezultat uzorka istraživanja životnih uvjeta stanovnika, dobivena sljedeća tablica podataka (primjer s posla).

Tablica 8

Izvorni podaci npr

Prirodno je pretpostaviti da vrijednost X je ukupna (upotrebljiva) površina (u m2) po osobi i pokorava se normalnom zakonu. Srednja vrijednost μ i varijanca σ 2 su nepoznate. Za μ potrebno je konstruirati 95% interval pouzdanosti. Kako bismo pronašli srednje vrijednosti uzorka i varijancu pomoću grupiranih podataka, sastavit ćemo sljedeću tablicu izračuna (tablica 9).

Tablica 9

Izračunavanje X i 5 iz grupiranih podataka

N grupa 3 Ukupna površina po osobi, m2 Broj stanovnika u skupini r j Sredina intervala x j r j x j rjxj 2
Do 5.0 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
više od 30,0 32.5 * 2697.5 87668.75
- 19005.0 412250.0

U ovoj pomoćnoj tablici prvi i drugi početni statistički moment izračunati su pomoću formule (2) a 1 I A 2

Iako je varijanca σ 2 ovdje nepoznata, zbog velikog uzorka možemo praktično primijeniti formulu (15) stavljajući u nju σ = = 7,16.

Tada je δ=k 0,95 σ/ =1,96*7,16/ =0,46.

Interval pouzdanosti za opći prosjek pri β=0,95 jednak je I 0,95 (μ) = ± δ = 19 ± 0,46 = (18,54; 19,46).

Posljedično, prosječna vrijednost površine po osobi u određenom gradu s jamstvom od 0,95 nalazi se u intervalu (18,54; 19,46).



2. Interval pouzdanosti za matematičko očekivanje μ u slučaju nepoznate varijance σ 2 normalne vrijednosti. Ovaj interval za dano jamstvo β konstruira se prema formuli, gdje je ν = n-1,

(16)

Koeficijent t β,ν ima isto značenje za t distribuciju s ν stupnjeva slobode kao β za distribuciju N(0,1), naime:

.

Drugim riječima, sl. Vrijednost tν pada u interval (-t β,ν ; +t β,ν) s vjerojatnošću β. Vrijednosti t β,ν dane su u tablici 10 za β=0,95 i β=0,99.

Tablica 10.

Vrijednosti t β,ν

Vraćajući se na primjer 23, vidimo da je u njemu interval pouzdanosti konstruiran prema formuli (16) s koeficijentom t β,υ =k 0..95 =1.96, budući da je n=1000.

Konstruirajmo interval pouzdanosti u MS EXCEL-u za procjenu srednje vrijednosti distribucije u slučaju poznate vrijednosti disperzije.

Naravno izbor razina povjerenja potpuno ovisi o problemu koji se rješava. Dakle, stupanj povjerenja zračnog putnika u pouzdanost zrakoplova nedvojbeno bi trebao biti veći od stupnja povjerenja kupca u pouzdanost električne žarulje.

Formulacija problema

Pretpostavimo da iz populacija nakon što je uzeto uzorak veličina n. Pretpostavlja se da standardna devijacija ova raspodjela je poznata. Na temelju ovoga potrebno je uzorci procijeniti nepoznato srednja vrijednost distribucije(μ, ) i konstruirajte odgovarajuće dvostran interval pouzdanosti.

Procjena bodova

Kako je poznato iz statistika(označimo to X prosj) je nepristrana procjena srednje vrijednosti ovaj populacija i ima raspodjelu N(μ;σ 2 /n).

Bilješka: Što učiniti ako trebate graditi interval pouzdanosti u slučaju distribucije koja nije normalan? U ovom slučaju, dolazi do spašavanja, koji navodi da s dovoljno velikom veličinom uzorci n iz distribucije ne biti normalan, uzorak distribucije statistike X prosj htjeti približno dopisivati ​​se normalna distribucija s parametrima N(μ;σ 2 /n).

Tako, bodovna procjena prosjek vrijednosti raspodjele imamo - ovo srednja vrijednost uzorka, tj. X prosj. Sada počnimo interval pouzdanosti.

Konstruiranje intervala povjerenja

Obično, znajući distribuciju i njene parametre, možemo izračunati vjerojatnost da će slučajna varijabla uzeti vrijednost iz intervala koji navedemo. Sada učinimo suprotno: pronađimo interval u koji će slučajna varijabla pasti sa zadanom vjerojatnošću. Na primjer, iz svojstava normalna distribucija poznato je da s vjerojatnošću od 95%, slučajna varijabla raspodijeljena preko normalno pravo, bit će unutar raspona od približno +/- 2 od Prosječna vrijednost(vidi članak o). Ovaj interval će nam poslužiti kao prototip interval pouzdanosti.

Sada da vidimo znamo li distribuciju , izračunati ovaj interval? Da bismo odgovorili na pitanje, moramo naznačiti oblik distribucije i njezine parametre.

Znamo oblik distribucije - ovo je normalna distribucija (zapamtite o čemu govorimo distribucija uzorkovanja statistika X prosj).

Parametar μ nam je nepoznat (samo ga treba procijeniti pomoću interval pouzdanosti), ali imamo njegovu procjenu X prosjek, izračunato na temelju uzorci, koji se mogu koristiti.

Drugi parametar - standardna devijacija srednje vrijednosti uzorka smatrat ćemo ga poznatim, jednak je σ/√n.

Jer ne znamo μ, tada ćemo izgraditi interval +/- 2 standardne devijacije ne od Prosječna vrijednost, a iz njegove poznate procjene X prosj. Oni. prilikom izračunavanja interval pouzdanosti to NEĆEMO pretpostaviti X prosj spada u raspon +/- 2 standardne devijacije od μ s vjerojatnošću od 95%, a pretpostavit ćemo da je interval +/- 2 standardne devijacije iz X prosj s 95% vjerojatnosti će pokriti μ – prosjek opće populacije, iz kojeg je uzeto uzorak. Ova dva iskaza su ekvivalentna, ali nam drugi iskaz omogućuje konstruiranje interval pouzdanosti.

Nadalje, pojasnimo interval: slučajna varijabla raspodijeljena preko normalno pravo, s vjerojatnošću od 95% spada u interval +/- 1,960 standardne devijacije, ne +/- 2 standardne devijacije. To se može izračunati pomoću formule =NORM.ST.REV((1+0,95)/2), cm. primjer datoteke Sheet Interval.

Sada možemo formulirati vjerojatnosnu tvrdnju koja će nam poslužiti za oblikovanje interval pouzdanosti:
„Vjerojatnost da populacijska srednja vrijednost koji se nalazi od prosjek uzorka unutar 1.960" standardna odstupanja srednje vrijednosti uzorka", jednako 95%".

Vrijednost vjerojatnosti navedena u izjavi ima poseban naziv , koji je povezan sa razina značajnosti α (alfa) jednostavnim izrazom razina povjerenja =1 . U našem slučaju razina značajnosti α =1-0,95=0,05 .

Sada, na temelju ove vjerojatnosne izjave, pišemo izraz za izračunavanje interval pouzdanosti:

gdje je Z α/2 standard normalna distribucija(ova vrijednost slučajne varijable z, Što P(z>=Z α/2 )=α/2).

Bilješka: Gornji α/2-kvantil definira širinu interval pouzdanosti V standardne devijacije srednja vrijednost uzorka. Gornji α/2-kvantil standard normalna distribucija uvijek veće od 0, što je vrlo zgodno.

U našem slučaju, s α=0,05, gornji α/2-kvantil jednako 1,960. Za ostale razine značajnosti α (10%; 1%) gornji α/2-kvantil Z α/2 može se izračunati pomoću formule =NORM.ST.REV(1-α/2) ili, ako je poznato razina povjerenja, =NORM.ST.OBR((1+razina pouzdanosti)/2).

Obično prilikom gradnje intervali pouzdanosti za procjenu srednje vrijednosti koristiti samo gornji α/2-kvantil i ne koristite niži α/2-kvantil. To je moguće jer standard normalna distribucija simetrično u odnosu na os x ( njegovu gustoću distribucije simetrično oko prosjek, tj. 0). Stoga nema potrebe kalkulirati niži α/2-kvantil(jednostavno se zove α /2-kvantil), jer jednako je gornji α/2-kvantil sa znakom minus.

Podsjetimo, unatoč obliku distribucije vrijednosti x, odgovarajuća slučajna varijabla X prosj distribuiran približno Fino N(μ;σ 2 /n) (vidi članak o). Stoga, u opći slučaj, gornji izraz za interval pouzdanosti samo je aproksimacija. Ako je vrijednost x raspodijeljena na normalno pravo N(μ;σ 2 /n), zatim izraz za interval pouzdanosti je točan.

Izračun intervala pouzdanosti u MS EXCEL-u

Idemo riješiti problem.
Vrijeme odziva elektronička komponenta na ulazni signal je važna karakteristika uređaja. Inženjer želi konstruirati interval pouzdanosti za prosječno vrijeme odgovora na razini pouzdanosti od 95%. Iz prethodnog iskustva, inženjer zna da je standardna devijacija vremena odziva 8 ms. Poznato je da je za procjenu vremena odziva inženjer napravio 25 mjerenja, prosječna vrijednost bila je 78 ms.

Riješenje: Inženjer želi znati vrijeme odziva elektroničkog uređaja, ali razumije da vrijeme odziva nije fiksna vrijednost, već slučajna varijabla koja ima vlastitu distribuciju. Dakle, najbolje čemu se može nadati je da odredi parametre i oblik ove distribucije.

Nažalost, iz uvjeta problema ne znamo oblik distribucije vremena odziva (ne mora biti normalan). , ova distribucija je također nepoznata. Samo on je poznat standardna devijacijaσ=8. Stoga, dok ne možemo izračunati vjerojatnosti i konstruirati interval pouzdanosti.

Međutim, unatoč tome što nam nije poznata distribucija vrijeme odvojeni odgovor, to znamo prema CPT, distribucija uzorkovanja prosječno vrijeme odziva je otprilike normalan(pretpostavit ćemo da uvjeti CPT provode se, jer veličina uzorci prilično velik (n=25)) .

Štoviše, prosjek ova raspodjela je jednaka Prosječna vrijednost distribucija jednog odgovora, tj. μ. A standardna devijacija ove distribucije (σ/√n) može se izračunati pomoću formule =8/ROOT(25) .

Također je poznato da je inženjer primio bodovna procjena parametar μ jednak 78 ms (X prosj.). Dakle, sada možemo izračunati vjerojatnosti, jer znamo oblik distribucije ( normalan) i njegove parametre (X avg i σ/√n).

Inženjer želi znati očekivana vrijednostμ raspodjele vremena odgovora. Kao što je gore navedeno, ovo μ je jednako matematičko očekivanje distribucije uzorka prosječnog vremena odgovora. Ako koristimo normalna distribucija N(X avg; σ/√n), tada će željeni μ biti u rasponu +/-2*σ/√n s vjerojatnošću od približno 95%.

Razina značajnosti jednako 1-0,95=0,05.

Na kraju, pronađimo lijevu i desnu granicu interval pouzdanosti.
Lijevi rub: =78-NORM.ST.REV(1-0.05/2)*8/ROOT(25) = 74,864
Desni rub: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Lijevi rub: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Desni rub: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Odgovor: interval pouzdanosti na 95% razina pouzdanosti i σ=8msec jednaki 78+/-3,136 ms.

U primjer datoteke na Sigma listu poznat, stvorio obrazac za obračun i konstrukciju dvostran interval pouzdanosti za proizvoljno uzorci sa zadanim σ i razina značaja.

Funkcija CONFIDENCE.NORM().

Ako vrijednosti uzorci su u rasponu B20:B79 , A razina značajnosti jednako 0,05; zatim MS EXCEL formula:
=PROSJEK(B20:B79)-POVJERENJE.NORM(0,05;σ; BROJ(B20:B79))
vratit će lijevu granicu interval pouzdanosti.

Ista granica može se izračunati pomoću formule:
=PROSJEK(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(BROJ(B20:B79))

Bilješka: Funkcija CONFIDENCE NORM() pojavila se u MS EXCEL 2010. U više ranije verzije Korištena je MS EXCEL funkcija TRUST().

Za početak, podsjetimo se sljedeće definicije:

Razmotrimo sljedeću situaciju. Neka opcije populacije imaju normalnu distribuciju s matematičkim očekivanjem $a$ i srednjom vrijednosti kvadratno odstupanje$\sigma$. Srednja vrijednost uzorka u u ovom slučajuće se tretirati kao slučajna varijabla. Kada je količina $X$ normalno raspodijeljena, srednja vrijednost uzorka također će biti normalno raspodijeljena s parametrima

Nađimo interval pouzdanosti koji pokriva vrijednost $a$ s pouzdanošću $\gamma $.

Da bismo to učinili, potrebna nam je jednakost

Od njega dobivamo

Odavde možemo lako pronaći $t$ iz tablice vrijednosti funkcije $F\left(t\right)$ i, kao posljedicu, pronaći $\delta $.

Prisjetimo se tablice vrijednosti funkcije $F\left(t\right)$:

Slika 1. Tablica vrijednosti funkcije $F\lijevo(t\desno).$

Integral pouzdanosti za procjenu matematičkog očekivanja za nepoznato $(\mathbf \sigma )$

U ovom slučaju koristit ćemo ispravljenu vrijednost varijance $S^2$. Zamjenom $\sigma $ sa $S$ u gornjoj formuli, dobivamo:

Primjeri problema za pronalaženje intervala pouzdanosti

Primjer 1

Neka veličina $X$ ima normalnu distribuciju s varijancom $\sigma =4$. Neka veličina uzorka bude $n=64$, a pouzdanost $\gamma =0,95$. Odredite interval pouzdanosti za procjenu matematičkog očekivanja ove distribucije.

Moramo pronaći interval ($\overline(x)-\delta ,\overline(x)+\delta)$.

Kao što smo vidjeli gore

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

Parametar $t$ može se pronaći iz formule

\[F\lijevo(t\desno)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Iz tablice 1 nalazimo da je $t=1,96$.