Biografier Kjennetegn Analyse

1 konfidensintervall for den matematiske forventningen. Konfidensintervaller og etiske problemstillinger

Konfidensintervall til matematisk forventning - dette er et slikt intervall beregnet fra dataene, som med en kjent sannsynlighet inneholder den matematiske forventningen befolkning. Det naturlige estimatet for den matematiske forventningen er det aritmetiske gjennomsnittet av dens observerte verdier. Derfor vil vi videre i løpet av leksjonen bruke begrepene «gjennomsnittlig», «gjennomsnittsverdi». I problemer med å beregne konfidensintervallet, er svaret som oftest kreves "Konfidensintervallet til det gjennomsnittlige tallet [verdi i en spesifikk oppgave] er fra [mindre verdi] til [ større verdi]". Ved å bruke konfidensintervallet kan du evaluere ikke bare gjennomsnittsverdiene, men også andelen av en eller annen funksjon i den generelle befolkningen. Gjennomsnittsverdier, varians, standardavvik og feilen som vi kommer til nye definisjoner og formler gjennom blir analysert i leksjonen Utvalg og populasjonskarakteristikker .

Punkt- og intervallestimat av gjennomsnittet

Hvis gjennomsnittsverdien av den generelle befolkningen er estimert med et tall (poeng), så for estimat av det ukjente medium størrelse av den generelle befolkningen tas et spesifikt gjennomsnitt, som beregnes fra et utvalg observasjoner. I dette tilfellet sammenfaller ikke verdien av utvalgets gjennomsnitt - en tilfeldig variabel - med gjennomsnittsverdien for den generelle befolkningen. Derfor, når du angir gjennomsnittsverdien til prøven, er det også nødvendig å indikere prøvefeilen samtidig. Målingen av prøvetakingsfeil er standard feil, som uttrykkes i de samme enhetene som gjennomsnittet. Derfor brukes ofte følgende notasjon: .

Hvis anslaget av gjennomsnittet er nødvendig for å være assosiert med en viss sannsynlighet, må parameteren til den generelle populasjonen av interesse estimeres ikke med et enkelt tall, men med et intervall. Et konfidensintervall er et intervall der, med en viss sannsynlighet, P verdien av den estimerte indikatoren for den generelle befolkningen er funnet. Konfidensintervall der med sannsynlighet P = 1 - α er en tilfeldig variabel, beregnes som følger:

,

α = 1 - P, som finnes i vedlegget til nesten enhver bok om statistikk.

I praksis er ikke populasjonsgjennomsnittet og variansen kjent, så populasjonsvariansen erstattes med utvalgsvariansen, og populasjonsgjennomsnittet med utvalgsgjennomsnittet. Dermed beregnes konfidensintervallet i de fleste tilfeller som følger:

.

Konfidensintervallformelen kan brukes til å estimere populasjonsgjennomsnittet if

  • standardavviket for den generelle befolkningen er kjent;
  • eller standardavviket til populasjonen er ikke kjent, men utvalgsstørrelsen er større enn 30.

Utvalgets gjennomsnitt er et objektivt estimat av populasjonsgjennomsnittet. I sin tur utvalget varians er ikke et objektivt estimat av populasjonsvariasjonen. For å få et objektivt estimat av populasjonsvariansen i utvalgets variansformel, er utvalgets størrelse n bør erstattes med n-1.

Eksempel 1 Det samles inn informasjon fra 100 tilfeldig utvalgte kafeer i en bestemt by om at gjennomsnittlig antall ansatte i dem er 10,5 med et standardavvik på 4,6. Bestem konfidensintervallet på 95 % av antall kaféarbeidere.

hvor er den kritiske verdien av standard normalfordelingen for signifikansnivået α = 0,05 .

Dermed var 95 % konfidensintervallet for gjennomsnittlig antall kaféansatte mellom 9,6 og 11,4.

Eksempel 2 Til tilfeldig utvalg fra den generelle befolkningen på 64 observasjoner ble følgende totale verdier beregnet:

summen av verdier i observasjoner,

summen av kvadrerte avvik av verdier fra gjennomsnittet .

Beregn 95 % konfidensintervall for forventet verdi.

beregne standardavviket:

,

beregne gjennomsnittsverdien:

.

Bytt ut verdiene i uttrykket med konfidensintervallet:

hvor er den kritiske verdien av standard normalfordelingen for signifikansnivået α = 0,05 .

Vi får:

Dermed varierte 95 % konfidensintervallet for den matematiske forventningen til denne prøven fra 7.484 til 11.266.

Eksempel 3 For et tilfeldig utvalg fra en generell populasjon på 100 observasjoner ble det beregnet en middelverdi på 15,2 og et standardavvik på 3,2. Beregn 95 % konfidensintervallet for forventet verdi, deretter 99 % konfidensintervallet. Hvis prøvestyrken og dens variasjon forblir den samme, men konfidensfaktoren øker, vil konfidensintervallet bli smalere eller utvides?

Vi erstatter disse verdiene i uttrykket for konfidensintervallet:

hvor er den kritiske verdien av standard normalfordelingen for signifikansnivået α = 0,05 .

Vi får:

.

Dermed var 95 % konfidensintervallet for gjennomsnittet av dette utvalget fra 14,57 til 15,82.

Igjen erstatter vi disse verdiene i uttrykket for konfidensintervallet:

hvor er den kritiske verdien av standard normalfordelingen for signifikansnivået α = 0,01 .

Vi får:

.

Dermed var 99 % konfidensintervallet for gjennomsnittet av dette utvalget fra 14,37 til 16,02.

Som du kan se, når konfidensfaktoren øker, øker også den kritiske verdien av standard normalfordelingen, og derfor er start- og sluttpunktene til intervallet plassert lenger fra gjennomsnittet, og dermed konfidensintervallet for den matematiske forventningen øker.

Punkt- og intervallestimat av egenvekt

Andelen av enkelte funksjoner i utvalget kan tolkes som et punktestimat egenvekt s samme egenskap i befolkningen generelt. Hvis denne verdien må assosieres med en sannsynlighet, bør konfidensintervallet til egenvekten beregnes s funksjon i den generelle befolkningen med en sannsynlighet P = 1 - α :

.

Eksempel 4 Det er to kandidater i en bestemt by EN og B stiller som ordfører. 200 innbyggere i byen ble tilfeldig spurt, hvorav 46 % svarte at de ville stemme på kandidaten EN, 26 % - for kandidaten B og 28 % vet ikke hvem de vil stemme på. Bestem 95 % konfidensintervall for andelen av byens innbyggere som støtter kandidaten EN.

La det tas et utvalg fra en generell populasjon underlagt loven vanlig fordeling XN( m; ). Denne grunnleggende antagelsen om matematisk statistikk er basert på sentralgrensesetningen. La det generelle standardavviket være kjent , men den matematiske forventningen til den teoretiske fordelingen er ukjent m(gjennomsnittlig verdi ).

I dette tilfellet betyr prøvens gjennomsnitt , oppnådd under forsøket (avsnitt 3.4.2), vil også være en tilfeldig variabel m;
). Deretter det "normaliserte" avviket
N(0;1) er en standard normal tilfeldig variabel.

Problemet er å finne et intervallestimat for m. La oss konstruere et tosidig konfidensintervall for m slik at den sanne matematiske forventningen tilhører ham med en gitt sannsynlighet (pålitelighet) .

Sett et slikt intervall for verdien
betyr å finne den maksimale verdien av denne mengden
og minimum
, som er grensene for den kritiske regionen:
.

Fordi denne sannsynligheten er
, så roten til denne ligningen
kan finnes ved hjelp av tabellene til Laplace-funksjonen (tabell 3, vedlegg 1).

Da med sannsynlighet det kan hevdes at tilfeldig verdi
, det vil si at det ønskede generelle gjennomsnittet tilhører intervallet
. (3.13)

verdien
(3.14)

kalt presisjon estimater.

Antall
kvantil normalfordeling - kan finnes som et argument for Laplace-funksjonen (tabell 3, vedlegg 1), gitt forholdet 2Ф( u)=, dvs. F( u)=
.

tilbake, av angi verdi avvik det er mulig å finne med hvilken sannsynlighet den ukjente generelle middelverdien tilhører intervallet
. For å gjøre dette, må du beregne

. (3.15)

La det tas et tilfeldig utvalg fra den generelle populasjonen ved omvalgsmetoden. Fra ligningen
kan bli funnet minimum gjensamplingsvolum n kreves for å sikre at konfidensintervallet med en gitt pålitelighet ikke overskredet den forhåndsinnstilte verdien . Den nødvendige prøvestørrelsen estimeres ved å bruke formelen:

. (3.16)

Utforsker estimeringsnøyaktighet
:

1) Med økende utvalgsstørrelse n omfanget avtar, og derav nøyaktigheten av estimatet øker.

2) C øke påliteligheten av estimater verdien av argumentet økes u(fordi F(u) øker monotont) og dermed øker . I dette tilfellet, økningen i pålitelighet reduserer nøyaktigheten av vurderingen .

anslag
(3.17)

kalt klassisk(hvor t er en parameter som avhenger av og n), fordi det kjennetegner distribusjonslovene som oftest forekommer.

3.5.3 Konfidensintervaller for å estimere forventningen til en normalfordeling med et ukjent standardavvik 

La det være kjent at den generelle befolkningen er underlagt loven om normalfordeling XN( m;), hvor verdien rot betyr kvadrat avvik ukjent.

For å bygge et konfidensintervall for å estimere det generelle gjennomsnittet, brukes i dette tilfellet statistikk
, som har en Students fordeling med k= n–1 frihetsgrader. Dette følger av det faktum at N(0;1) (se punkt 3.5.2), og
(se punkt 3.5.3) og fra definisjonen av Students fordeling (del 1. punkt 2.11.2).

La oss finne nøyaktigheten til det klassiske estimatet av Students fordeling: dvs. finne t fra formel (3.17). La sannsynligheten for å oppfylle ulikheten
gitt av pålitelighet :

. (3.18)

Fordi det TSt( n-1), er det åpenbart at t kommer an på og n, så vi pleier å skrive
.

(3.19)

hvor
er Students distribusjonsfunksjon med n-1 frihetsgrader.

Løser denne ligningen for m, får vi intervallet
som med reliabilitet  dekker den ukjente parameteren m.

Verdi t , n-1 , brukes til å bestemme konfidensintervallet til en tilfeldig variabel T(n-1), distribuert av Student med n-1 frihetsgrader kalles Elevens koeffisient. Det bør finnes ved gitte verdier n og  fra tabellene " Kritiske punkter Studentutdelinger. (Tabell 6, vedlegg 1), som er løsningene av likning (3.19).

Som et resultat får vi følgende uttrykk nøyaktighet konfidensintervall for å estimere den matematiske forventningen (generelt gjennomsnitt), hvis variansen er ukjent:

(3.20)

Dermed er det en generell formel for å konstruere konfidensintervaller for den matematiske forventningen til den generelle befolkningen:

hvor er nøyaktigheten til konfidensintervallet avhengig av kjent eller ukjent varians er funnet i henhold til formlene henholdsvis 3.16. og 3.20.

Oppgave 10. Noen tester ble utført, hvis resultater er oppført i tabellen:

x Jeg

Det er kjent at de følger normalfordelingsloven med
. Finn et anslag m* for matematisk forventning m, bygg et 90 % konfidensintervall for det.

Beslutning:

Så, m(2.53;5.47).

Oppgave 11. Havdybden måles med et instrument hvis systematiske feil er 0, og tilfeldige feil fordeles etter normalloven, med standardavvik =15m. Hvor mange uavhengige målinger bør gjøres for å bestemme dybden med feil på ikke mer enn 5 m med et konfidensnivå på 90 %?

Beslutning:

Av tilstanden til problemet har vi XN( m; ), hvor =15m, =5m, =0,9. La oss finne volumet n.

1) Med en gitt reliabilitet = 0,9 finner vi fra tabell 3 (vedlegg 1) argumentet til Laplace-funksjonen u = 1.65.

2) Kjenne til den gitte estimeringsnøyaktigheten =u=5, finn
. Vi har

. Derfor antall forsøk n25.

Oppgave 12. Temperaturprøvetaking t for de første 6 dagene i januar er presentert i tabellen:

Finn konfidensintervall for forventning m generell befolkning med tillitssannsynlighet
og anslå det generelle standardavviket s.

Beslutning:


og
.

2) Uhildet estimat finne etter formel
:

=-175

=234.84

;
;

=-192

=116


.

3) Siden den generelle variansen er ukjent, men estimatet er kjent, så for å estimere den matematiske forventningen m vi bruker Students fordeling (tabell 6, vedlegg 1) og formel (3.20).

Fordi n 1 =n 2 =6, deretter ,
, s 1 =6,85 vi har:
, derav -29,2-4,1<m 1 < -29.2+4.1.

Derfor -33.3<m 1 <-25.1.

På samme måte har vi
, s 2 = 4,8, altså

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33,3;-25,1) og m 2 (-34.9;-29.1).

I anvendt vitenskap, for eksempel i konstruksjonsdisipliner, brukes tabeller over konfidensintervaller for å vurdere nøyaktigheten til objekter, som er gitt i relevant referanselitteratur.

KONFIDENSINTERVALL FOR FORVENTNING

1. La det være kjent at sl. mengde x adlyder normal lov med ukjent gjennomsnitt μ og kjent σ 2: X~N(μ,σ 2), σ 2 er gitt, μ er ikke kjent. Gitt β. Basert på prøven x 1, x 2, … , x n, er det nødvendig å konstruere I β (θ) (nå θ=μ) som tilfredsstiller (13)

Prøvegjennomsnittet (de sier også prøvesnittet) følger normalloven med samme senter μ, men en mindre varians X~N (μ , D ), hvor variansen er D =σ 2 =σ 2 /n.

Vi trenger tallet K β definert for ξ~N(0,1) av betingelsen

Med ord: mellom punktene -K β og K β på x-aksen ligger arealet under tetthetskurven til standard normalloven, lik β

For eksempel, K 0,90 \u003d 1,645 kvantil av nivået 0,95 av verdien ξ

K 0,95 = 1,96. ; K 0,997 \u003d 3.

Spesielt sett til side 1,96 standardavvik til høyre og samme mengde til venstre fra midten av enhver normal lov, vil vi fange opp arealet under tetthetskurven lik 0,95, på grunn av hvilken K 0 95 er kvantilen til nivå 0,95 + 1/2 * 0,005 = 0,975 for denne loven.

Ønsket konfidensintervall for det generelle gjennomsnittet μ er I A (μ) = (x-σ, x + σ),

hvor δ = (15)

La oss begrunne:

Etter det som er sagt, verdien faller inn i intervallet J=μ±σ med sannsynlighet β (fig. 9). I dette tilfellet avviker verdien fra sentrum μ mindre enn δ, og det tilfeldige intervallet ± δ (med et tilfeldig senter og samme bredde som J) vil dekke punktet μ. Det er Є J<=> μ Є jeg β, og derfor Р(μЄІ β ) = Р( Є J )=β.

Så, prøvekonstantintervallet I β inneholder gjennomsnittet μ med sannsynlighet β.

Det er klart at jo mer n, jo mindre σ og intervallet er smalere, og jo større vi tar garantien β, desto bredere er konfidensintervallet.

Eksempel 21.

For en prøve med n=16 for en normalverdi med kjent varians σ 2 =64 funnet x=200. Konstruer et konfidensintervall for det generelle gjennomsnittet (med andre ord for den matematiske forventningen) μ, forutsatt at β=0,95.

Beslutning. I β (μ)= ± δ, hvor δ = К β σ/ -> К β σ/ =1,96*8/ = 4

I 0,95 (μ)=200 4=(196;204).

Når vi konkluderer med at, med en garanti på β=0,95, det sanne gjennomsnittet tilhører intervallet (196,204), forstår vi at en feil er mulig.

Av 100 konfidensintervaller I 0,95 (μ), inneholder i gjennomsnitt 5 ikke μ.

Eksempel 22.

I betingelsene i forrige eksempel 21, hva bør tas n for å halvere konfidensintervallet? For å ha 2δ=4 må man ta

I praksis brukes ofte ensidige konfidensintervaller. Så hvis høye verdier av μ er nyttige eller ikke forferdelige, men lave er ikke hyggelige, som i tilfelle av styrke eller pålitelighet, er det rimelig å bygge et ensidig intervall. For å gjøre dette, bør du øke den øvre grensen så mye som mulig. Hvis vi bygger, som i eksempel 21, et tosidig konfidensintervall for en gitt β, og deretter utvider det så mye som mulig på grunn av en av grensene, så får vi et ensidig intervall med en større garanti β" = β + (1-β) / 2 = (1+ β)/2, for eksempel hvis β = 0,90, så er β = 0,90 + 0,10/2 = 0,95.

For eksempel vil vi anta at vi snakker om styrken til produktet og heve den øvre grensen for intervallet til . Så for μ i eksempel 21 får vi et ensidig konfidensintervall (196,°°) med en nedre grense på 196 og en konfidenssannsynlighet β"=0,95+0,05/2=0,975.

Den praktiske ulempen med formel (15) er at den er utledet under antagelsen om at dispersjonen = σ 2 (derav = σ 2 /n) er kjent; og det skjer sjelden i det virkelige liv. Unntaket er tilfellet når prøvestørrelsen er stor, for eksempel n måles i hundrevis eller tusenvis, og for σ 2 kan vi praktisk talt ta anslaget s 2 eller .

Eksempel 23.

Anta, i en eller annen stor by, som et resultat av en utvalgsundersøkelse av beboernes levekår, ble følgende datatabell innhentet (eksempel fra jobb).

Tabell 8

Kildedata for eksempel

Det er naturlig å anta det verdi X - det totale (nyttige) arealet (i m 2) per person overholder normalloven. Gjennomsnittet μ og variansen σ 2 er ikke kjent. For μ kreves det å konstruere et 95 % konfidensintervall. For å finne utvalgets gjennomsnitt og varians fra de grupperte dataene, vil vi sette sammen følgende beregningstabell (tabell 9).

Tabell 9

X- og 5-beregninger på grupperte data

N gruppe h Totalt areal per 1 person, m 2 Antall innbyggere i gruppen r j Intervall x j r j x j rjxj 2
Opp til 5.0 2.5 20.0 50.0
5.0-10.0 7.5 712.5 5343.75
10.0-15.0 12.5 2550.0 31875.0
15.0-20.0 17.5 4725.0 82687.5
20.0-25.0 22.5 4725.0 106312.5
25.0-30.0 27.5 3575.0 98312.5
over 30,0 32.5 * 2697.5 87668.75
- 19005.0 412250.0

I denne hjelpetabellen, i henhold til formel (2), beregnes de første og andre innledende statistiske momentene en 1 og en 2

Selv om variansen σ 2 er ukjent her, på grunn av den store prøvestørrelsen, kan formel (15) brukes i praksis, og sette σ= =7,16 i den.

Da er δ=k 0,95 σ/ =1,96*7,16/ =0,46.

Konfidensintervallet for det generelle gjennomsnittet ved β=0,95 er I 0,95 (μ) = ± δ = 19 ± 0,46 = (18,54; 19,46).

Derfor ligger gjennomsnittsverdien av området per person i denne byen med en garanti på 0,95 i intervallet (18,54; 19,46).



2. Konfidensintervall for den matematiske forventningen μ ved en ukjent varians σ 2 av normalverdien. Dette intervallet for en gitt garanti β er konstruert i henhold til formelen, hvor ν = n-1,

(16)

Koeffisienten t β,ν har samme betydning for t - fordeling med ν frihetsgrader, som for β for fordelingen N(0,1), nemlig:

.

Med andre ord, sl. Verdien tν faller inn i intervallet (-t β,ν ; +t β,ν) med sannsynlighet β. Verdiene av t β,ν er gitt i tabell 10 for β=0,95 og β=0,99.

Tabell 10

Verdier t β,ν

For å gå tilbake til eksempel 23, ser vi at konfidensintervallet i det ble bygget i henhold til formelen (16) med koeffisienten t β,υ =k 0..95 =1.96, siden n=1000.

La oss bygge et konfidensintervall i MS EXCEL for å estimere middelverdien av fordelingen i tilfelle av en kjent verdi av variansen.

Selvfølgelig valget nivå av tillit helt avhengig av oppgaven. Dermed bør graden av tillit hos flypassasjeren til påliteligheten til flyet, selvfølgelig, være høyere enn graden av tillit hos kjøperen til lyspærens pålitelighet.

Oppgaveformulering

La oss anta at fra befolkning har tatt prøve størrelse n. Det antas at standardavvik denne fordelingen er kjent. Nødvendig på bakgrunn av dette prøver vurdere det ukjente distribusjonsmiddel(μ, ) og konstruer tilsvarende bilateralt konfidensintervall.

Poengvurdering

Som kjent fra statistikk(la oss kalle det X jfr) er objektivt estimat av gjennomsnittet dette befolkning og har fordelingen N(μ;σ 2 /n).

Merk: Hva om du trenger å bygge konfidensintervall ved distribusjon, som er ikke vanlig? I dette tilfellet kommer til unnsetning, som sier at med en tilstrekkelig stor størrelse prøver n fra distribusjon ikke- vanlig, sampling distribusjon av statistikk Х av vil være omtrent tilsvare normal distribusjon med parametere N(μ;σ 2 /n).

Så, punktestimat midten distribusjonsverdier vi har er prøvegjennomsnitt, dvs. X jfr. La oss nå bli opptatt konfidensintervall.

Bygge et konfidensintervall

Vanligvis, ved å kjenne fordelingen og dens parametere, kan vi beregne sannsynligheten for at en tilfeldig variabel vil ta en verdi fra et gitt intervall. La oss nå gjøre det motsatte: finn intervallet der den tilfeldige variabelen faller med en gitt sannsynlighet. For eksempel fra eiendommer normal distribusjon det er kjent at med en sannsynlighet på 95 % er en tilfeldig variabel fordelt over normal lov, vil falle innenfor intervallet ca +/- 2 fra middelverdi(se artikkel om). Dette intervallet vil fungere som vår prototype for konfidensintervall.

La oss nå se om vi kjenner fordelingen , å beregne dette intervallet? For å svare på spørsmålet må vi spesifisere distribusjonsformen og dens parametere.

Vi vet distribusjonsformen er normal distribusjon (husk at vi snakker om prøvetakingsfordeling statistikk X jfr).

Parameteren μ er ukjent for oss (den må bare estimeres ved hjelp av konfidensintervall), men vi har anslaget X jf, beregnet ut fra prøve, som kan brukes.

Den andre parameteren er prøve gjennomsnittlig standardavvik vil bli kjent, den er lik σ/√n.

Fordi vi vet ikke μ, da bygger vi intervallet +/- 2 standardavvik ikke fra middelverdi, men fra dets kjente anslag X jfr. De. ved beregning konfidensintervall det vil vi IKKE anta X jfr vil falle innenfor intervallet +/- 2 standardavvik fra μ med en sannsynlighet på 95 %, og vi vil anta at intervallet er +/- 2 standardavvik fra X jfr med en sannsynlighet på 95 % vil dekke μ - gjennomsnittet av den generelle befolkningen, hvorfra prøve. Disse to påstandene er likeverdige, men den andre påstanden lar oss konstruere konfidensintervall.

I tillegg avgrenser vi intervallet: en tilfeldig variabel fordelt over normal lov, med 95 % sannsynlighet faller innenfor intervallet +/- 1,960 standardavvik, ikke +/- 2 standardavvik. Dette kan beregnes ved hjelp av formelen \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. eksempelfil Arkavstand.

Nå kan vi formulere en sannsynlighetserklæring som vil tjene oss til å danne konfidensintervall:
"Sannsynligheten for at gjennomsnittlig befolkning ligger fra prøvegjennomsnitt innenfor 1.960" standardavvik for prøvegjennomsnittet", er lik 95 %.

Sannsynlighetsverdien nevnt i utsagnet har et spesielt navn , som er knyttet til signifikansnivå α (alfa) ved et enkelt uttrykk tillitsnivå =1 . I vårt tilfelle Signifikansnivå α =1-0,95=0,05 .

Nå, basert på denne sannsynlighetserklæringen, skriver vi et uttrykk for beregning konfidensintervall:

hvor Zα/2 standard normal distribusjon(en slik verdi av en tilfeldig variabel z, hva P(z>=Zα/2 )=α/2).

Merk: Øvre α/2-kvantil definerer bredden konfidensintervall i standardavvik prøvegjennomsnitt. Øvre α/2-kvantil standard normal distribusjon er alltid større enn 0, noe som er veldig praktisk.

I vårt tilfelle, ved α=0,05, øvre α/2-kvantil tilsvarer 1,960. For andre signifikansnivåer α (10 %; 1 %) øvre α/2-kvantil Zα/2 kan beregnes ved hjelp av formelen \u003d NORM.ST.OBR (1-α / 2) eller, hvis kjent tillitsnivå, =NORM.ST.OBR((1+konfidensnivå)/2).

Vanligvis når man bygger konfidensintervaller for å estimere gjennomsnittet kun bruk øvre α/2-kvantil og ikke bruk lavere α/2-kvantil. Dette er mulig pga standard normal distribusjon symmetrisk om x-aksen ( tettheten av distribusjonen symmetrisk om gjennomsnittlig, dvs. 0). Derfor er det ikke nødvendig å beregne lavere α/2-kvantil(det kalles ganske enkelt α /2-kvantil), fordi det er likt øvre α/2-kvantil med et minustegn.

Husk at, uavhengig av formen på fordelingen av x, den tilsvarende tilfeldige variabelen X jfr distribuert omtrent fint N(μ;σ 2 /n) (se artikkel om). Derfor, i generell sak, uttrykket ovenfor for konfidensintervall er bare omtrentlig. Hvis x er fordelt over normal lov N(μ;σ 2 /n), deretter uttrykket for konfidensintervall er nøyaktig.

Beregning av konfidensintervall i MS EXCEL

La oss løse problemet.
Responstid Elektronisk komponent til inngangssignalet er viktig egenskap enheter. En ingeniør ønsker å plotte et konfidensintervall for gjennomsnittlig responstid på et konfidensnivå på 95 %. Av tidligere erfaring vet ingeniøren at standardavviket for responstiden er 8 ms. Det er kjent at ingeniøren gjorde 25 målinger for å estimere responstiden, gjennomsnittsverdien var 78 ms.

Beslutning: En ingeniør vil vite responstiden til en elektronisk enhet, men han forstår at responstiden ikke er fast, men en tilfeldig variabel som har sin egen fordeling. Så det beste han kan håpe på er å bestemme parametrene og formen til denne fordelingen.

Ut fra problemets tilstand vet vi dessverre ikke formen for fordelingen av responstiden (det trenger ikke være vanlig). , denne fordelingen er også ukjent. Bare han er kjent standardavvikσ=8. Derfor, mens vi ikke kan beregne sannsynlighetene og konstruere konfidensintervall.

Men selv om vi ikke kjenner fordelingen tid separat svar, det vet vi iht CPT, prøvetakingsfordeling gjennomsnittlig responstid er ca vanlig(vi vil anta at betingelsene CPT utføres, fordi størrelsen prøver stor nok (n=25)) .

Dessuten, gjennomsnitt denne fordelingen er lik middelverdi enhetsresponsfordelinger, dvs. μ. OG standardavvik av denne fordelingen (σ/√n) kan beregnes ved å bruke formelen =8/ROOT(25) .

Det er også kjent at ingeniøren mottok punktestimat parameter μ lik 78 ms (X cf). Derfor kan vi nå beregne sannsynlighetene, fordi vi kjenner distribusjonsformen ( vanlig) og dens parametere (Х ср og σ/√n).

Ingeniøren vil vite det forventet verdiμ av responstidsfordelingen. Som nevnt ovenfor er denne μ lik forventning til utvalgsfordelingen av gjennomsnittlig responstid. Hvis vi bruker normal distribusjon N(X cf; σ/√n), da vil den ønskede μ være i området +/-2*σ/√n med en sannsynlighet på omtrent 95 %.

Signifikansnivå tilsvarer 1-0,95=0,05.

Finn til slutt venstre og høyre kantlinje konfidensintervall.
Venstre kantlinje: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROT (25) = 74,864
Høyre kantlinje: \u003d 78 + NORM. ST. OBR (1-0.05 / 2) * 8 / ROT (25) \u003d 81.136

Venstre kantlinje: =NORM.INV(0,05/2; 78; 8/SQRT(25))
Høyre kantlinje: =NORM.INV(1-0,05/2; 78; 8/SQRT(25))

Svar: konfidensintervall95 % konfidensnivå og σ=8msek er lik 78+/-3,136 ms

eksempelfil på ark Sigma kjent laget et skjema for beregning og konstruksjon bilateralt konfidensintervall for vilkårlig prøver med en gitt σ og Signifikansnivå.

CONFIDENCE.NORM() funksjon

Hvis verdiene prøver er i området B20:B79 , a Signifikansnivå lik 0,05; deretter MS EXCEL formel:
=GJENNOMSNITT(B20:B79)-TILLIT(0,05;σ; ANTALL(B20:B79))
vil returnere venstre kantlinje konfidensintervall.

Den samme grensen kan beregnes ved hjelp av formelen:
=GJENNOMSNITT(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(ANTALL(B20:B79))

Merk: CONFIDENCE.NORM()-funksjonen dukket opp i MS EXCEL 2010. Mer tidlige versjoner MS EXCEL brukte TRUST()-funksjonen.

Først, la oss huske følgende definisjon:

La oss vurdere følgende situasjon. La variantene av den generelle befolkningen ha en normalfordeling med matematisk forventning $a$ og gjennomsnitt standardavvik$\sigma $. Eksempel betyr inn denne saken vil bli behandlet som en tilfeldig variabel. Når $X$ er normalfordelt, vil utvalgets gjennomsnitt også ha en normalfordeling med parametere

La oss finne et konfidensintervall som dekker $a$ med pålitelighet $\gamma $.

For å gjøre dette trenger vi likhet

Fra det får vi

Herfra kan vi enkelt finne $t$ fra verditabellen til funksjonen $Ф\left(t\right)$ og som et resultat finne $\delta $.

Husk verditabellen til funksjonen $Ф\left(t\right)$:

Figur 1. Tabell over verdier for funksjonen $Ф\left(t\right).$

Konfidensintegral for å estimere forventningen når $(\mathbf \sigma )$ er ukjent

I dette tilfellet vil vi bruke verdien av den korrigerte variansen $S^2$. Ved å erstatte $\sigma $ i formelen ovenfor med $S$ får vi:

Et eksempel på oppgaver for å finne et konfidensintervall

Eksempel 1

La mengden $X$ ha en normalfordeling med varians $\sigma =4$. La prøvestørrelsen være $n=64$ og påliteligheten lik $\gamma =0,95$. Finn konfidensintervallet for å estimere den matematiske forventningen til den gitte fordelingen.

Vi må finne intervallet ($\overline(x)-\delta ,\overline(x)+\delta)$.

Som vi så ovenfor

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\ t)(2)\]

Vi finner parameteren $t$ fra formelen

\[Ф\venstre(t\høyre)=\frac(\gamma )(2)=\frac(0,95)(2)=0,475\]

Fra tabell 1 får vi at $t=1,96$.