Biografier Kjennetegn Analyse

Metode for konfidensintervaller. Intervallestimater

Etter å ha mottatt punktestimat det er ønskelig å ha data om påliteligheten til et slikt estimat. Det er klart at verdien bare er en omtrentlig verdi av parameteren q. Det beregnede punktestimatet kan være nær den estimerte parameteren, eller det kan være svært forskjellig fra det. Et punktestimat inneholder ikke informasjon om nøyaktigheten av estimeringsprosedyren. Det er spesielt viktig å ha informasjon om påliteligheten til estimater for små utvalg. I slike tilfeller bør intervallestimater brukes.

oppgave intervall estimering i selve generelt syn kan formuleres som følger: i henhold til prøven, konstruere numerisk intervall, med hensyn til hvilket vi, med en forhåndsvalgt sannsynlighet, kan si at den estimerte parameteren ligger innenfor dette intervallet. Det er flere tilnærminger her. Den vanligste metoden for intervallestimering er konfidensintervallmetoden.

Konfidensintervallfor parameter q kalles et intervall som inneholder ukjent verdi parameter befolkning med en gitt sannsynlighet g , dvs.

.

Tallet g kalles selvtillitsnivå, og tallet a=1–g – nivå av pålitelighet. Konfidenssannsynligheten er gitt a priori og bestemt av spesifikke forhold. Vanligvis brukes g=0,9; 0,95; 0,99 (henholdsvis a=0,1; 0,05; 0,01).

Lengde konfidensintervall, som karakteriserer nøyaktigheten til intervallestimatet, avhenger av utvalgsstørrelsen n og konfidensnivå g. Med en økning i verdien n lengden på konfidensintervallet avtar, og når sannsynligheten g nærmer seg enhet, øker den.

Ofte bygges konfidensintervallet symmetrisk med hensyn til punktestimatet, dvs. som

, (3.15)

Her kalles tallet D marginal(eller standard) prøvetakingsfeil. Det er imidlertid ikke alltid mulig å bygge symmetriske intervaller; dessuten må man noen ganger begrense ensidige konfidensintervaller:

eller .

Siden det i økonometriske problemer ofte er nødvendig å bygge konfidensintervaller for parametrene til tilfeldige variabler som har normal distribusjon , presenterer vi ordningene for deres plassering.



3.4.2. Konfidensintervall for å estimere det generelle
gjennomsnitt med kjent generell varians

La kvantitativt attributt X populasjon har en normalfordeling med en gitt varians s 2 og en ukjent matematisk forventning en. For å evaluere parameteren en prøve trukket ut X 1 , X 2 , …, X n, bestående av n uavhengige normalfordelte tilfeldige variabler med parametere en og s, hvor s er kjent og verdien en evaluert av eksempel:

.

La oss anslå nøyaktigheten av denne omtrentlige likheten. For å gjøre dette setter vi sannsynligheten g og prøver å finne et tall D slik at relasjonen

.

Deretter bruker vi egenskapene til normalfordelingen. Det er kjent at summen er normal utdelte mengder har også en normalfordeling. Derfor har gjennomsnittsverdien en normalfordeling, hvor den matematiske forventningen og variansen er lik

Følgelig

.

La oss nå bruke formelen for å finne sannsynlighetene for avvik for en normalfordelt tilfeldig variabel fra matematisk forventning:

,

hvor F( x) er Laplace-funksjonen. Erstatte X videre og videre, får vi

,

hvor . Fra den siste likestillingen finner vi det marginal prøvetakingsfeil vil være lik

.

Med tanke på det selvtillitsnivå er gitt og lik g, får vi det endelige resultatet.

Intervallestimatet for det generelle gjennomsnittet (matematisk forventning) har formen

, (3.17)

eller mer kort

hvor tallet t g bestemmes fra likheten .

Vi presenterer verdiene t g for allment aksepterte konfidensnivåer:

, , .

La oss diskutere hvordan det påvirker nøyaktigheten av parameterestimering en prøvestørrelse n, verdien av standardavviket s, samt verdien av konfidensnivået g.

a) Ved økning n nøyaktigheten av estimatet økes. Dessverre er økningen i nøyaktighet (dvs. reduksjon i lengden på konfidensintervallet) proporsjonal med , og ikke 1/ n, dvs. skjer mye langsommere enn økningen i antall observasjoner. For eksempel, hvis vi ønsker å øke nøyaktigheten av slutninger med en faktor på 10 ved rent statistiske midler, må vi øke utvalgsstørrelsen med en faktor på 100.

b) Jo større s, jo lavere nøyaktighet. Avhengigheten av nøyaktighet på denne parameteren er lineær.

c) Jo høyere konfidenssannsynligheten g, desto mer verdi parameter t g, dvs. jo lavere nøyaktighet. Dessuten, mellom g og t g det er en ikke-lineær sammenheng. Når g øker, vil verdien t g øker kraftig (kl ). Derfor kan vi med stor sikkerhet (med et høyt konfidensnivå) bare garantere en relativt lav nøyaktighet. (Konfidensintervallet vil være bredt.) Og vice versa: når vi spesifiserer for en ukjent parameter en relativt snevre grenser, risikerer vi å gjøre feil – med relativt stor sannsynlighet.

Merk at verdien

kalt gjennomsnittlig prøvetakingsfeil. Til ingen resampling denne formelen vil ta formen

. (3.20)

Da vil den marginale prøvetakingsfeilen D være t-multippel gjennomsnittsfeil:

Eksempel 3.7. Basert på langsiktig vektovervåking X pakker med nøtter fylles automatisk, er det funnet at standardavviket for vekten til pakkene er s=10 G. Veide 25 pakker, mens gjennomsnittsvekten var . I hvilket intervall med 95 % pålitelighet ligger den sanne verdien av gjennomsnittlig pakkevekt?

.

For å bestemme 95 % konfidensintervall beregner vi marginal feil prøver

Derfor vil 95 % konfidensintervall for den sanne verdien av gjennomsnittlig pakkevekt være

,

Ved første øyekast kan det se ut til at det oppnådde resultatet kun representerer et teoretisk resultat, siden standardavviket s som regel også er ukjent og beregnes fra prøvedata. Men hvis prøven er stor nok, er resultatet som oppnås ganske akseptabelt for praktisk bruk, siden fordelingsfunksjonen vil avvike lite fra den normale, og variansestimatet s 2 vil være nær nok den sanne verdien av s 2 . Dessuten brukes resultatet som oppnås ofte i tilfellet når fordelingen av den generelle befolkningen er forskjellig fra den normale. Dette skyldes det faktum at summen av uavhengige tilfeldige variabler, på grunn av den sentrale grensesetning, med store prøver har en fordeling nær normalen. en

Eksempel 3.8. La oss anta det som et resultat prøveundersøkelse levekår for byens innbyggere på grunnlag av selvtilfeldig re-sampling, følgende variantserie:

Tabell 3.5

Konstruer et 95 % konfidensintervall for egenskapen som studeres.

Løsning. La oss beregne prøven gjennomsnittlig verdi og variansen til egenskapen som studeres.

Tabell 3.6

Det totale arealet av boliger per 1 person, m 2 Antall innbyggere n i Midt i intervallet x i
Opp til 5.0 2,5 20,0 50,0
5,0–10,0 7,5 712,5 5343,8
10,0–15,0 12,5 2550,0 31875,0
15,0–20,0 17,5 4725,0 82687,5
20,0–25,0 22,5 4725,0 106312,5
25,0–30,0 27,5 3575,0 98312,5
30,0 og over 32,5 2697,5 87668,8
Total 19005,0 412250,0

; ; .

Gjennomsnittlig feil prøven vil være

.

La oss definere den marginale prøvetakingsfeilen med en sannsynlighet på 0,95 ():

La oss sette grensene for det generelle gjennomsnittet

.

Basert på den gjennomførte utvalgsundersøkelsen med en sannsynlighet på 0,95 kan vi altså konkludere med det gjennomsnittlig størrelse det totale arealet per 1 person i byen som helhet varierer fra 18,6 til 19,4 m 2. en

3.4.3. Konfidensintervall for å estimere det generelle
gjennomsnitt med ukjent generell varians

Ovenfor ble problemet med å konstruere et intervallestimat for den matematiske forventningen til en normalfordeling løst når variansen er kjent. Men i praksis er variansen vanligvis også ukjent og beregnes fra samme utvalg som den matematiske forventningen. Dette fører til behovet for å bruke en annen formel når man skal bestemme konfidensintervallet for den matematiske forventningen til en tilfeldig variabel med normalfordeling. Denne problemformuleringen er spesielt relevant for små utvalgsstørrelser.

La det kvantitative tegnet X befolkningen har en normalfordeling N(en,s), og begge parametere en og s er ukjent. I følge prøven X 1 , X 2 , …, X n, beregne det aritmetiske gjennomsnittet og korrigert varians:

, .

For å finne konfidensintervallet i dette tilfellet bygges det statistikk

å ha en Students fordeling med antall frihetsgrader n=n–1, uavhengig av verdiene til parameterne a og s. Ved å velge et konfidensnivå g og kjenne prøvestørrelsen n, kan vi finne et tall t slik at likheten

,

.

Herfra finner vi

intervallestimat for det generelle gjennomsnittet (matematisk forventning) med ukjente s:

, (3.22)

eller mer kort

Antall t (Elevens koeffisient) er funnet fra tabeller for Students distribusjon. Merk at det er en funksjon av to argumenter: konfidenssannsynligheten g og antall frihetsgrader k=n–1, dvs. t=t(g,n).

Det må utvises forsiktighet ved bruk av tabeller for Students distribusjoner. Først, vanligvis i tabeller, i stedet for konfidensnivået g, brukes pålitelighetsnivået a=1–g. For det andre, veldig ofte verdiene til den såkalte. ensidig Students t-test

Eller .

I dette tilfellet bør verdiene tas i tabellene hvis pålitelighetsnivået brukes i tabellen, eller hvis konfidensnivået brukes i tabellen.

Til tross for den tilsynelatende likheten mellom formlene (3.17) og (3.22), er det en betydelig forskjell mellom dem, som ligger i det faktum at studentens koeffisient t avhenger ikke bare av konfidensnivået, men også av utvalgsstørrelsen. Denne forskjellen er spesielt merkbar for små prøver. (Husk at for store utvalg forsvinner praktisk talt forskjellen mellom Studentens fordeling og normalfordelingen.) I dette tilfellet fører bruken av normalfordelingen til en uberettiget innsnevring av konfidensintervallet, dvs. til en uberettiget økning i nøyaktighet. For eksempel hvis n=5 og g=0,99, så, ved å bruke Students fordeling, får vi t=4.6, og ved å bruke normalfordelingen, - t=2,58, dvs. konfidensintervall i siste tilfelle nesten to ganger smalere enn intervallet ved bruk av Students fordeling.

Eksempel 3.9. En aksjemarkedsanalytiker vurderer gjennomsnittlig avkastning på enkelte aksjer. tilfeldig utvalg 15 dager viste at gjennomsnittlig (årlig) avkastning med et gjennomsnitt standardavvik. Forutsatt at aksjeavkastningen er underlagt normal lov distribusjon, konstruer et 95 % konfidensintervall for den gjennomsnittlige avkastningen til aksjetypen av interesse for analytikeren.

Løsning. Fordi prøvestørrelsen n=15, da er det nødvendig å anvende Students fordeling med frihetsgrader. I følge tabellene for Elevens fordeling finner vi

.

Ved å bruke denne verdien bygger vi et 95 % konfidensintervall:

.

Derfor kan en analytiker være 95 % sikker på at gjennomsnittlig årlig avkastning på aksjen er mellom 8,44 % og 12,3 %. en

Ta i betraktning konstruksjon konfidensintervall for å estimere den matematiske forventningen.

La være volumprøven fra den generelle befolkningen av volum
;- prøvegjennomsnitt; - prøve standardavvik.

Konfidensintervall for pålitelighetsnivået for matematisk forventning (generelt gjennomsnitt) har formen

,

hvor -marginal prøvetakingsfeil, som avhenger av prøvestørrelsen , selvtillitsnivå og er lik halvparten av konfidensintervallet.

generell sekundær ukjent fungerer som et konfidensintervall:

hvor - prøvegjennomsnitt; -rettet opp prøve standardavvik; - parameter, som er funnet i henhold til studentens distribusjonstabell for (
) grader av frihet og tillit sannsynlighet .

Intervallestimering med pålitelighet generell sekundær ved normalfordeling av befolkningen generelt med berømt standardavvik fungerer som et konfidensintervall:

hvor - prøvegjennomsnitt;
- prøvestandardavvik; - verdien av argumentet til Laplace-funksjonen
, ved hvilken
;- prøvestørrelse.

konklusjoner. Konfidensintervall for gjennomsnittet, representerer området av verdier rundt poengsummen der, med det gitte konfidensnivået, det "sanne" (ukjente) gjennomsnittet av funksjonen er funnet.

Det er for eksempel velkjent at jo mer "usikker" en værmelding er (dvs. jo bredere konfidensintervallet er), jo mer sannsynlig er det at det stemmer.

Eksempel. Finn et konfidensintervall med en reliabilitet på 0,95 for å estimere den matematiske forventningen til en normalfordelt tilfeldig variabel hvis standardavviket er kjent
, prøvegjennomsnitt
og prøvestørrelse
.

La oss bruke formelen
. Betydning finn fra verditabellen til Laplace-funksjonen
, vurderer
, dvs.
. Vi finner i henhold til tabellen for verdien av funksjonen
argumentverdi
. Vi får konfidensintervallet:

; eller
.

Testoppgaver

1. Lengden på konfidensintervallet avtar med økende:

1) prøveverdier 2) prøvestørrelse

3) konfidensnivå 4) prøvegjennomsnitt

2. Lengden på konfidensintervallet med økende utvalgsstørrelse:

1) avtar; 2) øker;

3) endres ikke; 4) svinger.

3. Lengden på konfidensintervallet med økende konfidens:

1) endringer, 2) reduseres,

3) øker, 4) er konstant.

4. Merk to riktige svar. Symboler og i konfidensintervallet betyr formelen:

1) parameterestimering; 2) konfidensintervall;

3) prøvestørrelse; 4) tillitssannsynlighet.

Svar. en. 2). 2. 1 3. 2). 4. 4) og 3).

Test spørsmål

    Hva menes med begrepet "intervallestimering av fordelingsparameteren"?

    Definer et konfidensintervall.

    Hva er estimeringsnøyaktighet og estimeringspålitelighet?

    Hva er et konfidensnivå? Hvilke verdier krever det?

    Hvordan vil lengden på konfidensintervallet endre seg hvis du øker: 1) prøvestørrelsen, 2) konfidensnivået? Begrunn svaret.

    Skriv ned formelen for å finne konfidensintervallet til den matematiske forventningen til en normalfordelt tilfeldig variabel hvis generell variasjon: 1) kjent; 2) er ukjent.

Side 2


Kvaliteten på de første dataene (statistikken) om pålitelighetsindikatorene til elektrisk utstyr (sammen med indikatorene for skade fra strømbrudd og informasjon om driftsmoduser og strømbrudd) vurderes etter nøyaktighet - bredden på konfidensintervallet som dekker indikatoren, og pålitelighet - sannsynligheten for ikke å gjøre en feil når du velger dette intervallet. Nøyaktighet matematiske modeller pålitelighet estimeres av deres tilstrekkelighet til et reelt objekt, og nøyaktigheten til pålitelighetsberegningsmetoden - av tilstrekkeligheten til den oppnådde løsningen til den ideelle.

Nå avhenger variasjonskoeffisienten til strømningshastigheten, så vel som selve strømningshastigheten, i hovedsak av &0 / &1 - Så, for eksempel, med pi 1 m og ku / k 5, synker den gjennomsnittlige strømningshastigheten sammenlignet med den opprinnelige. ca. 2 ganger, og bredden på konfidensintervallet er nesten 3 ganger. Åpenbart gir raffineringen av parametrene til bunnhullsonen i dette tilfellet betydelig informasjon og forbedrer kvaliteten på prognosen betydelig.


Invariansen av antall forsøk n på hvert trinn har en betydelig effekt på nøyaktigheten av resultatene. Bredden på konfidensintervallet avtar med økende utvalgsstørrelse.

Konfidensintervaller kalles intervaller innenfor som er med visse (konfidens) sannsynligheter sanne verdier estimerte parametere. Vanligvis er bredden på konfidensintervallet uttrykt i form av standardavviket til resultatene av individuelle observasjoner ax.

Bredden på konfidensintervallet avhenger av ønsket statistisk pålitelighet e, utvalgsstørrelsen n og fordelingen tilfeldige verdier, spesielt fra spredning. Lengden og bredden på konfidensintervallene bestemmes også av den tilgjengelige (tilfeldige) prøven.

Bredden på konfidensintervallet i dette tilfellet viser seg imidlertid å være uakseptabelt stort. Men i dette tilfellet er bredden på konfidensintervallet for stort.


Derfor er grensene for konfidensintervallet (23 85 - 2 776 - 0 13; 23 85 2 776X X0 13) (23 49; 24 21) MPa. Det kan ses av resultatene at bredden på konfidensintervallet for samme sannsynlighet bør være nesten 15 ganger større på grunn av at kl. færre det er mindre tillit til dem.

Det følger av relasjon (2.29) at sannsynligheten for at konfidensintervallet (0 - D; i D) med tilfeldige grenser vil dekke den kjente parameteren 0 er lik y. Verdien D, lik halvparten av bredden av konfidensintervallet, kalles nøyaktigheten av estimatet, og sannsynligheten y er konfidenssannsynligheten (eller påliteligheten) til estimatet.

Intervallet (04, 042) kalles konfidensintervallet, dets grenser 04 og 0W, som er tilfeldige variabler, henholdsvis den nedre og øvre konfidensgrensen. Ethvert intervallestimat kan karakteriseres ved en kombinasjon av to tall: bredden på konfidensintervallet H 04 - 0I, som er et mål på nøyaktigheten av å estimere parameteren 0, og konfidenssannsynligheten y, som karakteriserer graden av pålitelighet ( påliteligheten) av resultatene.

Under disse forholdene bestemmes konfidensgrensene: for Meg og en bruker - fordeling, og for Mn - ved å bruke Students fordeling. Det kan ses av grafene at med et lite antall n observerte feil, er bredden på konfidensintervallet, som karakteriserer et mulig avvik i estimatet av fordelingsparameteren, stor. Den faktiske verdien av parameteren kan avvike flere ganger fra verdien oppnådd fra erfaringen til den tilsvarende statistisk evaluering. Når n øker, smalner grensene for konfidensintervallet gradvis. For å oppnå tilstrekkelig nøyaktige og pålitelige estimater, kreves det at under testen stort antall feil, som igjen krever en betydelig mengde testing, spesielt med høy pålitelighet av objekter.

Estimeringsnøyaktighet, konfidensnivå (pålitelighet)

Konfidensintervall

Ved prøvetaking av et lite volum bør intervallestimater brukes. dette unngår tabber, i motsetning til punktanslag.

Et intervallestimat kalles, som bestemmes av to tall - endene av intervallet som dekker den estimerte parameteren. Intervallestimater lar deg fastslå nøyaktigheten og påliteligheten til estimater.

La statistisk karakteristikk* fungerer som et estimat for den ukjente parameteren. Vi antar konstant antall(kanskje også tilfeldig variabel). Det er klart at * bestemmer parameteren β mer presist, jo mindre absolutt verdi forskjeller | - * |. Med andre ord, hvis >0 og | - * |< , то чем меньше, тем оценка точнее. Таким образом, positivt tall karakteriserer nøyaktigheten av estimatet.

men statistiske metoder ikke tillat oss å fastslå kategorisk at estimatet * tilfredsstiller ulikheten | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Reliabiliteten (konfidenssannsynlighet) til estimatet for * er sannsynligheten som ulikheten | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

La sannsynligheten for at | - *|<, равна т.е.

Erstatter ulikheten | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

R(*-< <*+)=.

Konfidensintervallet kalles (*- , *+), som dekker den ukjente parameteren med en gitt pålitelighet.

Konfidensintervaller for å estimere den matematiske forventningen til en normalfordeling når kjent.

Et intervallestimat med påliteligheten til den matematiske forventningen a til en normalfordelt kvantitativ egenskap X ved utvalgets gjennomsnitt x med et kjent standardavvik for den generelle populasjonen er konfidensintervallet

x - t(/n^?)< a < х + t(/n^?),

der t(/n^?)= er estimeringsnøyaktigheten, n er prøvestørrelsen, t er verdien av argumentet til Laplace-funksjonen Ф(t), der Ф(t)=/2.

Fra likheten t(/n^?)= kan vi trekke følgende konklusjoner:

1. med en økning i utvalgsstørrelsen n, reduseres antallet og derfor øker nøyaktigheten av estimatet;

2. en økning i påliteligheten til estimatet = 2Ф(t) fører til en økning i t (Ф(t) er en økende funksjon), derfor til en økning; med andre ord, en økning i påliteligheten til det klassiske estimatet innebærer en reduksjon i nøyaktigheten.

Eksempel. Den stokastiske variabelen X har en normalfordeling med kjent standardavvik =3. Finn konfidensintervallene for å estimere den ukjente forventningen a fra utvalget betyr x, hvis prøvestørrelsen er n = 36 og estimatpåliteligheten er satt til 0,95.

Løsning. La oss finne t. Fra relasjonen 2Ф(t) = 0,95 får vi Ф (t) = 0,475. I følge tabellen finner vi t=1,96.

Finn nøyaktigheten av estimatet:

nøyaktighet konfidensintervallmåling

T(/n^?)= (1 ,96 . 3)/ /36 = 0,98.

Konfidensintervallet er: (x - 0,98; x + 0,98). For eksempel, hvis x = 4.1, har konfidensintervallet følgende konfidensgrenser:

x - 0,98 = 4,1 - 0,98 = 3,12; x + 0,98 = 4,1 + 0,98 = 5,08.

Dermed tilfredsstiller verdiene til den ukjente parameteren a, i samsvar med prøvedataene, ulikheten 3.12< а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

La oss forklare betydningen av den gitte påliteligheten. Reliabilitet = 0,95 indikerer at hvis det tas et tilstrekkelig stort antall prøver, så bestemmer 95 % av dem slike konfidensintervaller som parameteren faktisk er innelukket i; bare i 5 % av tilfellene kan det gå utover konfidensintervallet.

Hvis det er nødvendig å estimere den matematiske forventningen med en forhåndsbestemt nøyaktighet og pålitelighet, er minimumsprøvestørrelsen som vil sikre denne nøyaktigheten funnet av formelen

Konfidensintervaller for å estimere den matematiske forventningen til en normalfordeling med en ukjent

Et intervallestimat med påliteligheten til den matematiske forventningen a til en normalfordelt kvantitativ egenskap X ved utvalgets gjennomsnitt x med et ukjent standardavvik for den generelle populasjonen er konfidensintervallet

x - t()(s/n^?)< a < х + t()(s/n^?),

hvor s er det "korrigerte" prøvestandardavviket, finnes t() i tabellen i henhold til gitt og n.

Eksempel. Kvantitativ attributt X for den generelle befolkningen er normalfordelt. Basert på prøvestørrelsen n=16 ble prøvegjennomsnittet x = 20,2 og det «korrigerte» standardavviket s = 0,8 funnet. Estimer det ukjente gjennomsnittet ved å bruke et konfidensintervall med en pålitelighet på 0,95.

Løsning. La oss finne t(). Ved å bruke tabellen, for = 0,95 og n=16 finner vi t()=2,13.

La oss finne konfidensgrensene:

x - t () (s / n ^?) \u003d 20,2 - 2,13 *. 0,8/16^? = 19,774

x + t()(s/n^?) = 20,2 + 2,13 * 0,8/16^? = 20,626

Så, med en reliabilitet på 0,95, er den ukjente parameteren a inneholdt i et konfidensintervall på 19,774< а < 20,626

Estimering av den sanne verdien av den målte verdien

La det gjøres n uavhengige like målinger av en fysisk mengde, hvis sanne verdi er ukjent.

Vi vil vurdere resultatene av individuelle målinger som tilfeldige variabler Хl, Х2,...Хn. Disse mengdene er uavhengige (målingene er uavhengige). De har den samme matematiske forventningen a (den sanne verdien av den målte verdien), de samme variansene ^2 (ekvivalente målinger) og er normalfordelte (denne antagelsen bekreftes av erfaring).

Dermed er alle forutsetningene som ble gjort ved utledning av konfidensintervaller oppfylt, og derfor står vi fritt til å bruke formler. Med andre ord kan den sanne verdien av den målte størrelsen estimeres fra det aritmetiske gjennomsnittet av resultatene av individuelle målinger ved bruk av konfidensintervaller.

Eksempel. Basert på dataene fra ni uavhengige like-nøyaktige målinger av en fysisk mengde, ble det aritmetiske gjennomsnittet av resultatene av individuelle målinger x = 42.319 og det "korrigerte" standardavviket s = 5.0 funnet. Det er nødvendig å estimere den sanne verdien av den målte mengden med pålitelighet = 0,95.

Løsning. Den sanne verdien av den målte størrelsen er lik dens matematiske forventning. Derfor er problemet redusert til å estimere den matematiske forventningen (i det ukjente) ved å bruke et konfidensintervall som dekker a med en gitt reliabilitet = 0,95.

x - t()(s/n^?)< a < х + t()(s/n^?)

Ved å bruke tabellen, for y \u003d 0,95 og l \u003d 9 finner vi

Finn nøyaktigheten av estimatet:

t()(s/n^?) = 2,31 * 5/9^?=3,85

La oss finne konfidensgrensene:

x - t () (s / n ^?) \u003d 42.319 - 3.85 \u003d 38.469;

x + t () (s / n ^?) \u003d 42.319 + 3.85 \u003d 46.169.

Så, med en pålitelighet på 0,95, ligger den sanne verdien av den målte verdien i konfidensintervallet på 38,469< а < 46,169.

Konfidensintervaller for å estimere standardavviket til en normalfordeling.

La den kvantitative egenskapen X for den generelle befolkningen være normalfordelt. Det er nødvendig å estimere det ukjente generelle standardavviket fra det "korrigerte" prøvestandardavviket. For å gjøre dette bruker vi intervallanslaget.

Et intervallestimat (med pålitelighet) av standardavviket o for en normalfordelt kvantitativ attributt X fra det "korrigerte" prøvestandardavviket s er konfidensintervallet

s (1 -- q)< < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

hvor q finnes i henhold til tabellen for gitt n n.

Eksempel 1. Kvantitativ attributt X for den generelle befolkningen er normalfordelt. Basert på et utvalg av størrelse n = 25 ble det funnet et "korrigert" standardavvik s = 0,8. Finn konfidensintervallet som dekker det generelle standardavviket med en pålitelighet på 0,95.

Løsning. I følge tabellen, ifølge dataene = 0,95 og n = 25, finner vi q = 0,32.

Det nødvendige konfidensintervallet s (1 -- q)< < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

Eksempel 2. Kvantitativ attributt X for den generelle befolkningen er normalfordelt. Basert på et utvalg av størrelse n=10 ble det funnet et "korrigert" standardavvik s = 0,16. Finn konfidensintervallet som dekker det generelle standardavviket med en pålitelighet på 0,999.

Løsning. I følge applikasjonstabellen, i henhold til data = 0,999 og n=10, finner vi 17= 1,80 (q > 1). Ønsket konfidensintervall er:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

Karakter målenøyaktighet

I teorien om feil er det vanlig å karakterisere målenøyaktigheten (instrumentnøyaktigheten) ved å bruke standardavviket for tilfeldige målefeil. Det "korrigerte" standardavviket s brukes til evaluering. Siden måleresultatene vanligvis er gjensidig uavhengige, har samme matematiske forventning (den sanne verdien av den målte mengden) og samme spredning (i tilfelle av like nøyaktige målinger), er teorien presentert i forrige avsnitt anvendelig for å vurdere målingen nøyaktighet.

Eksempel. Basert på 15 like nøyaktige målinger ble det funnet et "korrigert" standardavvik s = 0,12. Finn målenøyaktigheten med en pålitelighet på 0,99.

Løsning. Målenøyaktighet er preget av standardavviket til tilfeldige feil, så problemet reduseres til å finne konfidensintervallet s (1 - q)< < s (1 + q) , покрывающего с заданной надежностью 0,99

I følge brukstabellen for = 0,99 og n=15 finner vi q = 0,73.

Ønsket konfidensintervall

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Estimering av sannsynlighet (binomialfordeling) etter relativ frekvens

Intervallestimatet (med pålitelighet) av den ukjente sannsynligheten p for binomialfordelingen med hensyn til den relative frekvensen w er konfidensintervallet (med omtrentlige ender p1 og p2)

p1< p < p2,

hvor n er det totale antallet tester; m er antall forekomster av hendelsen; w er den relative frekvensen lik forholdet m/n; t er verdien av argumentet til Laplace-funksjonen, hvor Ф(t) = /2.

Kommentar. For store verdier av n (i størrelsesorden hundrevis), kan man ta som omtrentlige grenser for konfidensintervallet