Biografier Kjennetegn Analyse

Et eksakt estimat av den matematiske forventningen til en normalfordeling. Estimater av matematisk forventning og varians

Den matematiske forventningen er sannsynlighetsfordelingen til en tilfeldig variabel

Matematisk forventning, definisjon, matematisk forventning av diskrete og kontinuerlige tilfeldige variabler, selektiv, betinget forventning, beregning, egenskaper, oppgaver, estimering av forventning, varians, fordelingsfunksjon, formler, regneeksempler

Utvid innholdet

Skjul innhold

Den matematiske forventningen er definisjonen

Et av de viktigste konseptene i matematisk statistikk og sannsynlighetsteori, som karakteriserer fordelingen av verdier eller sannsynligheter tilfeldig variabel. Vanligvis uttrykt som et vektet gjennomsnitt av alle mulige parametere for en tilfeldig variabel. Mye brukt i teknisk analyse, forskning nummerserie, studiet av kontinuerlige og lange prosesser. Det er viktig for å vurdere risiko, forutsi prisindikatorer ved handel i finansmarkeder, og brukes i utviklingen av strategier og metoder for spilltaktikk i teorien om gambling.

Den matematiske forventningen er middelverdien av en tilfeldig variabel, sannsynlighetsfordelingen til en tilfeldig variabel vurderes i sannsynlighetsteori.

Den matematiske forventningen er mål på middelverdien til en tilfeldig variabel i sannsynlighetsteori. Matematisk forventning til en tilfeldig variabel x angitt M(x).

Den matematiske forventningen er

Den matematiske forventningen er i sannsynlighetsteori, det vektede gjennomsnittet av alle mulige verdier som denne tilfeldige variabelen kan ta.

Den matematiske forventningen er summen av produktene av alle mulige verdier av en tilfeldig variabel med sannsynlighetene for disse verdiene.

Den matematiske forventningen er gjennomsnittlig nytte av en bestemt avgjørelse, forutsatt at en slik beslutning kan vurderes innenfor rammen av teorien store tall og lang avstand.


Den matematiske forventningen er i gamblingteori, mengden gevinster som en spiller i gjennomsnitt kan tjene eller tape for hver innsats. På gamblers språk kalles dette noen ganger "gamer's edge" (hvis positivt for spilleren) eller "house edge" (hvis negativt for spilleren).

Den matematiske forventningen er Prosentandel av fortjeneste per seier multiplisert med gjennomsnittlig fortjeneste minus sannsynlighet for tap multiplisert med gjennomsnittlig tap.


Matematisk forventning til en tilfeldig variabel i matematisk teori

En av de viktige numeriske egenskapene til en tilfeldig variabel er den matematiske forventningen. La oss introdusere konseptet med et system av tilfeldige variabler. Tenk på et sett med tilfeldige variabler som er resultatet av det samme tilfeldige eksperimentet. Hvis er en av de mulige verdiene til systemet, tilsvarer hendelsen en viss sannsynlighet som tilfredsstiller Kolmogorov-aksiomene. En funksjon definert for alle mulige verdier av tilfeldige variabler kalles en felles distribusjonslov. Denne funksjonen lar deg beregne sannsynlighetene for eventuelle hendelser fra. Spesielt den felles loven om fordeling av tilfeldige variabler og, som tar verdier fra settet og, er gitt av sannsynligheter.


Begrepet "forventning" ble introdusert av Pierre Simon Marquis de Laplace (1795) og stammer fra konseptet "forventet verdi av utbetaling", som først dukket opp på 1600-tallet i teorien om gambling i verkene til Blaise Pascal og Christian Huygens . Imidlertid ble den første komplette teoretiske forståelsen og evalueringen av dette konseptet gitt av Pafnuty Lvovich Chebyshev (midten av 1800-tallet).


Fordelingsloven til tilfeldige numeriske variabler (fordelingsfunksjonen og fordelingsserien eller sannsynlighetstetthet) beskriver fullstendig oppførselen til en tilfeldig variabel. Men i en rekke problemer er det tilstrekkelig å kjenne til noen numeriske kjennetegn ved mengden som studeres (for eksempel dens gjennomsnittsverdi og mulig avvik fra den) for å svare på spørsmålet som stilles. Hoved numeriske egenskaper tilfeldige variabler er den matematiske forventningen, variansen, modusen og medianen.

Den matematiske forventningen til en diskret tilfeldig variabel er summen av produktene av dens mulige verdier og deres tilsvarende sannsynligheter. Noen ganger kalles den matematiske forventningen det vektede gjennomsnittet, siden det er omtrent lik det aritmetiske gjennomsnittet av de observerte verdiene til den tilfeldige variabelen kl. store tall eksperimenter. Fra definisjonen av matematisk forventning følger det at verdien ikke er mindre enn den minste mulige verdien av en tilfeldig variabel og ikke mer enn den største. Den matematiske forventningen til en tilfeldig variabel er en ikke-tilfeldig (konstant) variabel.


Matematisk forventning har en enkel fysisk mening: hvis en enhetsmasse er plassert på en rett linje, plasserer du litt masse på noen punkter (for diskret distribusjon), eller "smøre" den med en viss tetthet (for en absolutt kontinuerlig fordeling), så vil punktet som tilsvarer den matematiske forventningen være koordinaten til "tyngdepunktet" til den rette linjen.


Gjennomsnittsverdien av en tilfeldig variabel er et visst tall, som så å si er dens "representativ" og erstatter den i grove omtrentlige beregninger. Når vi sier: "gjennomsnittlig lampedriftstid er 100 timer" eller "gjennomsnittlig treffpunkt er forskjøvet i forhold til målet med 2 m til høyre", angir vi med dette en viss numerisk karakteristikk av en tilfeldig variabel som beskriver dens plassering på numerisk akse, dvs. stillingsbeskrivelse.

Av egenskapene til en posisjon i sannsynlighetsteori, spilles den viktigste rollen av den matematiske forventningen til en tilfeldig variabel, som noen ganger bare kalles gjennomsnittsverdien til en tilfeldig variabel.


Tenk på en tilfeldig variabel X, som har mulige verdier x1, x2, …, xn med sannsynligheter p1, p2, …, pn. Vi må karakterisere med et eller annet tall plasseringen av verdiene til den tilfeldige variabelen på x-aksen, tatt i betraktning det faktum at disse verdiene har forskjellige sannsynligheter. Til dette formålet er det naturlig å bruke det såkalte «vektede gjennomsnittet» av verdiene xi, og hver verdi xi under gjennomsnittsberegning bør tas i betraktning med en "vekt" proporsjonal med sannsynligheten for denne verdien. Dermed vil vi beregne gjennomsnittet av den tilfeldige variabelen X, som vi vil betegne M|X|:


Dette vektede gjennomsnittet kalles den matematiske forventningen til den tilfeldige variabelen. Derfor introduserte vi i betraktning et av de viktigste begrepene i sannsynlighetsteori - begrepet matematisk forventning. Den matematiske forventningen til en tilfeldig variabel er summen av produktene av alle mulige verdier av en tilfeldig variabel og sannsynlighetene for disse verdiene.

X på grunn av en særegen avhengighet av det aritmetiske gjennomsnittet av de observerte verdiene til en tilfeldig variabel med et stort antall eksperimenter. Denne avhengigheten er av samme type som avhengigheten mellom frekvens og sannsynlighet, nemlig: med et stort antall eksperimenter nærmer det aritmetiske gjennomsnittet av de observerte verdiene til en tilfeldig variabel seg (konvergerer i sannsynlighet) dens matematiske forventning. Fra tilstedeværelsen av et forhold mellom frekvens og sannsynlighet, kan man som en konsekvens utlede eksistensen av et lignende forhold mellom det aritmetiske gjennomsnittet og den matematiske forventningen. Faktisk, vurder en tilfeldig variabel X, preget av en rekke distribusjoner:


La det produseres N uavhengige eksperimenter, i hver av dem verdien X godtar viss verdi. Anta verdien x1 dukket opp m1 ganger, verdi x2 dukket opp m2 ganger, generell betydning xi dukket opp min ganger. La oss beregne det aritmetiske gjennomsnittet av de observerte verdiene til X, som i motsetning til den matematiske forventningen M|X| vi vil betegne M*|X|:

Med en økning i antall eksperimenter N frekvenser pi vil nærme seg (konvergere i sannsynlighet) de tilsvarende sannsynlighetene. Derfor er det aritmetiske gjennomsnittet av de observerte verdiene til den tilfeldige variabelen M|X| med en økning i antall eksperimenter, vil den nærme seg (konvergere i sannsynlighet) til sin matematiske forventning. Sammenhengen mellom det aritmetiske gjennomsnittet og den matematiske forventningen formulert ovenfor utgjør innholdet i en av formene til loven om store tall.

Vi vet allerede at alle former for loven om store tall angir det faktum at visse gjennomsnitt er stabile over et stort antall eksperimenter. Her vi snakker om stabiliteten til det aritmetiske gjennomsnittet fra en serie observasjoner av samme verdi. Med et lite antall eksperimenter er det aritmetiske gjennomsnittet av resultatene tilfeldig; med tilstrekkelig økning i antall eksperimenter blir det "nesten ikke tilfeldig" og, stabiliserende, nærmer det seg en konstant verdi - den matematiske forventningen.


Egenskapen til stabilitet av gjennomsnitt for et stort antall eksperimenter er lett å verifisere eksperimentelt. For eksempel veiing av en hvilken som helst kropp i laboratoriet på nøyaktige vekter, som et resultat av veiing får vi en ny verdi hver gang; for å redusere observasjonsfeilen veier vi kroppen flere ganger og bruker det aritmetiske gjennomsnittet av de oppnådde verdiene. Det er lett å se at med en ytterligere økning i antall eksperimenter (veiinger) reagerer det aritmetiske gjennomsnittet mindre og mindre på denne økningen, og med et tilstrekkelig stort antall eksperimenter slutter det praktisk talt å endre seg.

Det skal bemerkes at den viktigste egenskapen til posisjonen til en tilfeldig variabel - den matematiske forventningen - ikke eksisterer for alle tilfeldige variabler. Det er mulig å lage eksempler på slike tilfeldige variabler som den matematiske forventningen ikke eksisterer for, siden den tilsvarende sum eller integral divergerer. For praksis er imidlertid slike saker ikke av vesentlig interesse. Vanligvis har de tilfeldige variablene vi har å gjøre med et begrenset utvalg av mulige verdier og har selvfølgelig en forventning.


I tillegg til de viktigste egenskapene til posisjonen til en tilfeldig variabel - den matematiske forventningen, brukes andre posisjonskarakteristikker noen ganger i praksis, spesielt modusen og medianen til den tilfeldige variabelen.


Modusen til en tilfeldig variabel er dens mest sannsynlige verdi. Begrepet "mest sannsynlig verdi" gjelder strengt tatt kun for diskontinuerlige mengder; Til kontinuerlig verdi modusen er verdien der sannsynlighetstettheten er maksimal. Figurene viser modusen for henholdsvis diskontinuerlige og kontinuerlige stokastiske variabler.


Hvis fordelingspolygonen (fordelingskurven) har mer enn ett maksimum, sies fordelingen å være "polymodal".



Noen ganger er det distribusjoner som har i midten ikke et maksimum, men et minimum. Slike fordelinger kalles "antimodale".


I generell sak modusen og den matematiske forventningen til en tilfeldig variabel er ikke sammenfallende. I et spesielt tilfelle, når fordelingen er symmetrisk og modal (dvs. har en modus) og det er en matematisk forventning, så faller den sammen med modusen og symmetrisenteret til fordelingen.

En annen egenskap ved posisjonen brukes ofte - den såkalte medianen til en tilfeldig variabel. Denne egenskapen brukes vanligvis bare for kontinuerlige tilfeldige variabler, selv om den også formelt kan defineres for en diskontinuerlig variabel. Geometrisk er medianen abscissen til punktet der området avgrenset av distribusjonskurven er todelt.


Ved en symmetrisk modal fordeling faller medianen sammen med gjennomsnittet og modusen.

Matematisk forventning er gjennomsnittsverdien av en tilfeldig variabel - en numerisk karakteristikk av sannsynlighetsfordelingen til en tilfeldig variabel. På den mest generelle måten, den matematiske forventningen til en tilfeldig variabel X(w) er definert som Lebesgue-integralet med hensyn til sannsynlighetsmålet R i original sannsynlighetsrom:


Den matematiske forventningen kan også beregnes som Lebesgue-integralet av X etter sannsynlighetsfordeling px mengder X:


På en naturlig måte kan man definere begrepet en tilfeldig variabel med uendelig matematisk forventning. Et typisk eksempel er returtidene i noen tilfeldige turer.

Ved hjelp av matematisk forventning bestemmes mange numeriske og funksjonelle kjennetegn ved fordelingen (som den matematiske forventningen til de tilsvarende funksjonene til en tilfeldig variabel), for eksempel genereringsfunksjon, karakteristisk funksjon, øyeblikk av enhver rekkefølge, spesielt spredning , kovarians.

Matematisk forventning er en karakteristikk av plasseringen av verdiene til en tilfeldig variabel (gjennomsnittsverdien av dens fordeling). I denne egenskapen fungerer den matematiske forventningen som en "typisk" fordelingsparameter, og dens rolle er lik rollen til det statiske momentet - koordinaten til tyngdepunktet til massefordelingen - i mekanikk. Fra andre egenskaper ved stedet, ved hjelp av hvilke fordelingen er beskrevet i generelle termer - medianer, moduser, skiller den matematiske forventningen seg i den større verdien den og den tilsvarende spredningskarakteristikken - spredning - har i grensesetninger sannsynlighetsteori. Med den største fullstendighet avsløres betydningen av matematisk forventning av loven om store tall (Chebyshevs ulikhet) og den styrkede loven om store tall.

Matematisk forventning til en diskret tilfeldig variabel

La det være en tilfeldig variabel som kan ta en av flere numeriske verdier (for eksempel kan antall poeng i et terningkast være 1, 2, 3, 4, 5 eller 6). Ofte i praksis, for en slik verdi, oppstår spørsmålet: hvilken verdi tar den "i gjennomsnitt" på i stort antall tester? Hva blir vår gjennomsnittlige avkastning (eller tap) fra hver av de risikofylte operasjonene?


La oss si at det er en slags lotteri. Vi ønsker å forstå om det er lønnsomt eller ikke å delta i det (eller til og med delta gjentatte ganger, regelmessig). La oss si at hver fjerde billett vinner, premien vil være 300 rubler, og prisen på en hvilken som helst billett vil være 100 rubler. Med et uendelig antall deltakelser er det dette som skjer. I tre fjerdedeler av tilfellene vil vi tape, hvert tredje tap vil koste 300 rubler. I hvert fjerde tilfelle vinner vi 200 rubler. (premie minus kostnad), det vil si for fire deltakelser, taper vi i gjennomsnitt 100 rubler, for en - i gjennomsnitt 25 rubler. Totalt vil den gjennomsnittlige satsen på vår ruin være 25 rubler per billett.

Vi kaster terning. Hvis det ikke er juks (uten å flytte tyngdepunktet osv.), hvor mange poeng vil vi da ha i gjennomsnitt om gangen? Siden hvert alternativ er like sannsynlig, tar vi det dumme aritmetiske gjennomsnittet og får 3,5. Siden dette er GJENNOMSNITT, er det ingen grunn til å være indignert over at ikke noe spesielt kast vil gi 3,5 poeng - vel, denne kuben har ikke et ansikt med et slikt tall!

La oss nå oppsummere eksemplene våre:


La oss ta en titt på bildet rett ovenfor. Til venstre er en tabell over fordelingen av en tilfeldig variabel. Verdien av X kan ha en av n mulige verdier (gitt i den øverste raden). Det kan ikke være andre verdier. Under hver mulig verdi er sannsynligheten signert nedenfor. Til høyre er en formel, der M(X) kalles den matematiske forventningen. Betydningen av denne verdien er at med et stort antall tester (med stort utvalg) gjennomsnittsverdien vil ha en tendens til denne svært matematiske forventningen.

La oss gå tilbake til den samme spillekuben. Den matematiske forventningen til antall poeng i et kast er 3,5 (beregn deg selv ved å bruke formelen hvis du ikke tror det). La oss si at du kastet den et par ganger. falt ut 4 og 6. I snitt ble det 5, altså langt fra 3,5. De kastet den igjen, 3 falt ut, det vil si i gjennomsnitt (4 + 6 + 3) / 3 = 4,3333 ... På en eller annen måte langt fra den matematiske forventningen. Gjør nå et vanvittig eksperiment - rull kuben 1000 ganger! Og er snittet ikke akkurat 3,5, så vil det være i nærheten av det.

La oss beregne den matematiske forventningen for det ovenfor beskrevne lotteriet. Tabellen vil se slik ut:


Da vil den matematiske forventningen være, som vi har fastslått ovenfor.


En annen ting er at den også er "på fingrene", uten formel ville det vært vanskelig om det var flere alternativer. Vel, la oss si at det var 75 % tapte billetter, 20 % vinnerlodd og 5 % vinnerlodd.

Nå noen egenskaper ved matematisk forventning.

Det er lett å bevise det:


En konstant multiplikator kan tas ut av forventningstegnet, det vil si:


Dette er et spesielt tilfelle av linearitetsegenskapen til den matematiske forventningen.

En annen konsekvens av lineariteten til den matematiske forventningen:

det vil si at den matematiske forventningen til summen av tilfeldige variabler er lik summen av de matematiske forventningene til tilfeldige variabler.

La X, Y være uavhengige tilfeldige variabler, Deretter:

Dette er også lett å bevise) XY i seg selv er en tilfeldig variabel, mens hvis startverdiene kunne ta n Og m verdier, da XY kan ta nm-verdier. Sannsynligheten for hver av verdiene beregnes basert på det faktum at sannsynlighetene uavhengige arrangementer multiplisere. Som et resultat får vi dette:


Matematisk forventning om en kontinuerlig tilfeldig variabel

Kontinuerlige tilfeldige variabler har en slik karakteristikk som fordelingstettheten (sannsynlighetstettheten). Det kjennetegner faktisk situasjonen at noen verdier fra settet reelle tall en tilfeldig variabel tar oftere, noen - sjeldnere. Tenk for eksempel på dette diagrammet:


Her X- faktisk en tilfeldig variabel, f(x)- distribusjonstetthet. Ved å dømme etter denne grafen, under eksperimentene, verdien X vil ofte være et tall nær null. sjansene til å overskride 3 eller være mindre -3 snarere rent teoretisk.


La, for eksempel, det er en enhetlig fordeling:



Dette er ganske i samsvar med den intuitive forståelsen. La oss si at hvis vi får mange tilfeldige reelle tall med en ensartet fordeling, hvert av segmentene |0; 1| , da bør det aritmetiske gjennomsnittet være omtrent 0,5.

Egenskapene til matematisk forventning - linearitet, etc., som gjelder for diskrete tilfeldige variabler, er også gjeldende her.

Forholdet mellom matematisk forventning og andre statistiske indikatorer

I statistisk analyse, sammen med matematisk forventning, er det et system av gjensidig avhengige indikatorer som gjenspeiler fenomenenes homogenitet og stabiliteten til prosesser. Ofte har variasjonsindikatorer ikke uavhengig betydning og brukes til videre dataanalyse. Unntaket er variasjonskoeffisienten, som karakteriserer homogeniteten til dataene, som er verdifull statistisk karakteristikk.


Graden av variasjon eller stabilitet av prosesser i statistisk vitenskap kan måles ved hjelp av flere indikatorer.

Mest viktig indikator karakteriserer variabiliteten til en tilfeldig variabel er Spredning, som er nærmest og direkte relatert til den matematiske forventningen. Denne parameteren brukes aktivt i andre typer statistisk analyse (hypotesetesting, analyse av årsak-virkningsforhold osv.). Som det gjennomsnittlige lineære avviket reflekterer variansen også i hvilken grad dataene spres rundt medium størrelse.


Det er nyttig å oversette tegnspråket til ordspråket. Det viser seg at variansen er gjennomsnittskvadraten av avvikene. Det vil si at gjennomsnittsverdien først beregnes, deretter tas forskjellen mellom hver opprinnelige og gjennomsnittlig verdi, kvadreres, legges sammen og deretter divideres med antall verdier i denne populasjonen. Forskjell mellom egen verdi og gjennomsnittet gjenspeiler målet på avviket. Det kvadreres for å sikre at alle avvik utelukkende blir positive tall og for å unngå gjensidig kansellering av positive og negative avvik når du oppsummerer dem. Så, gitt de kvadrerte avvikene, beregner vi ganske enkelt det aritmetiske gjennomsnittet. Gjennomsnitt - kvadrat - avvik. Avvik kvadreres, og gjennomsnittet vurderes. Svaret på det magiske ordet "spredning" er bare tre ord.

Imidlertid, i ren form, slik som det aritmetiske gjennomsnittet, eller indeksen, brukes ikke variansen. Det er snarere en hjelpe- og mellomindikator som brukes til andre typer statistiske analyser. Hun har ikke engang en normal måleenhet. Etter formelen å dømme er dette kvadratet til den opprinnelige dataenheten.

La oss måle en tilfeldig variabel N ganger måler vi for eksempel vindhastigheten ti ganger og ønsker å finne gjennomsnittsverdien. Hvordan er middelverdien knyttet til fordelingsfunksjonen?

Eller vi kaster terningen et stort antall ganger. Antall poeng som vil falle på terningen under hvert kast er en tilfeldig variabel og kan ta alle naturlige verdier fra 1 til 6. N den streber etter spesifikt nummer- matematisk forventning Mx. I denne saken Mx = 3,5.

Hvordan oppsto denne verdien? Slipp inn N prøvelser n1 når 1 poeng er tapt, n2 ganger - 2 poeng og så videre. Så antall utfall der ett poeng falt:


Tilsvarende for utfallene når 2, 3, 4, 5 og 6 poeng falt ut.


La oss nå anta at vi kjenner fordelingsloven til den tilfeldige variabelen x, det vil si at vi vet at den tilfeldige variabelen x kan ta verdiene x1, x2, ..., xk med sannsynligheter p1, p2, ... , pk.

Den matematiske forventningen Mx til en tilfeldig variabel x er:


Den matematiske forventningen er ikke alltid et rimelig anslag på en tilfeldig variabel. Så for å anslå gjennomsnittet lønn det er mer rimelig å bruke begrepet median, det vil si en slik verdi at antallet personer som mottar mindre enn medianlønnen og mer, er det samme.

Sannsynligheten p1 for at den tilfeldige variabelen x er mindre enn x1/2 og sannsynligheten p2 for at den tilfeldige variabelen x er større enn x1/2 er den samme og lik 1/2. Medianen er ikke entydig bestemt for alle distribusjoner.


Standard eller standardavvik i statistikk kalles graden av avvik for observasjonsdata eller sett fra AVERAGE-verdien. Angitt med bokstavene s eller s. Et lite standardavvik indikerer at dataene er gruppert rundt gjennomsnittet, og et stort standardavvik indikerer at de opprinnelige dataene er langt fra det. Standardavvik er lik kvadratrot mengde kalt dispersjon. Det er gjennomsnittet av summen av kvadrerte forskjeller av de første dataene som avviker fra gjennomsnittet. Standardavviket til en tilfeldig variabel er kvadratroten av variansen:


Eksempel. Under testforhold når du skyter mot et mål, beregner variansen og standardavviket til en tilfeldig variabel:


Variasjon- fluktuasjon, variasjon av verdien av attributtet i enheter av befolkningen. Separate numeriske verdier av en funksjon som forekommer i den studerte befolkningen kalles varianter av verdier. Insuffisiens av gjennomsnittsverdien for komplette egenskaper aggregatet får oss til å supplere gjennomsnittsverdiene med indikatorer som lar oss vurdere typiskheten til disse gjennomsnittene ved å måle fluktuasjonen (variasjonen) av egenskapen som studeres. Variasjonskoeffisienten beregnes med formelen:


Spennvariasjon(R) er forskjellen mellom maksimum og minimumsverdier egenskap i studiepopulasjonen. Denne indikatoren gir mest generell idé om fluktuasjonen av egenskapen som studeres, da den viser forskjellen bare mellom grenseverdiene til alternativene. Avhengighet ekstreme verdier tegn gir variasjonsområdet ustabilt, tilfeldig karakter.


Gjennomsnittlig lineært avvik er det aritmetiske gjennomsnittet av de absolutte (modulo) avvikene til alle verdiene til den analyserte populasjonen fra deres gjennomsnittsverdi:


Matematisk forventning i gamblingteori

Den matematiske forventningen er det gjennomsnittlige beløpet en spiller gambling kan vinne eller tape på en gitt innsats. Dette er et veldig viktig konsept for en spiller, fordi det er grunnleggende for vurderingen av de fleste spillsituasjoner. Matematisk forventning er også det beste verktøyet for å analysere grunnleggende kortoppsett og spillsituasjoner.

La oss si at du spiller mynt med en venn, og gjør en lik $1 innsats hver gang, uansett hva som dukker opp. Haler - du vinner, hoder - du taper. Sjansene for at det kommer opp er én til én, og du satser $1 til $1. Dermed er din matematiske forventning null, fordi matematisk sett kan du ikke vite om du leder eller taper etter to kast eller etter 200.


Timegevinsten din er null. Timeutbetaling er beløpet du forventer å vinne i løpet av en time. Du kan slå en mynt 500 ganger i løpet av en time, men du vil ikke vinne eller tape fordi oddsene dine er verken positive eller negative. Hvis du ser, fra synspunktet til en seriøs spiller, er et slikt spillsystem ikke dårlig. Men det er bare bortkastet tid.

Men anta at noen vil satse $2 mot $1 i samme spill. Da har du umiddelbart en positiv forventning på 50 øre fra hver innsats. Hvorfor 50 øre? I gjennomsnitt vinner du ett spill og taper det andre. Spill den første dollaren og tap $1, sats den andre og vinn $2. Du har satset $1 to ganger og er foran med $1. Så hvert av dine innsatser på én dollar ga deg 50 cent.


Hvis mynten faller 500 ganger i løpet av en time, vil din timegevinst allerede være $250, fordi. i gjennomsnitt tapte du $1 250 ganger og vant $2 250 ganger. $500 minus $250 tilsvarer $250, som er den totale gevinsten. Merk at den forventede verdien, som er beløpet du vinner i gjennomsnitt på en enkelt innsats, er 50 cent. Du vant $250 ved å satse en dollar 500 ganger, som tilsvarer 50 cent av innsatsen din.

Matematisk forventning har ingenting med kortsiktige resultater å gjøre. Motstanderen din, som bestemte seg for å satse $2 mot deg, kunne slå deg på de ti første kastene på rad, men du, med en 2-til-1-spillfordel, alt annet likt, tjener 50 cent på hver $1 innsats under en hvilken som helst omstendigheter. Det spiller ingen rolle om du vinner eller taper ett spill eller flere spill, men kun under forutsetning av at du har nok penger til å enkelt kompensere for kostnadene. Hvis du fortsetter å satse på samme måte, vil gevinstene dine over lang tid komme opp til summen av forventede verdier i individuelle kast.


Hver gang du gjør en bedre innsats (en innsats som kan være lønnsom i det lange løp) når oddsen er i din favør, er du nødt til å vinne noe på det, enten du taper det eller ikke i en gitt hånd. Motsatt, hvis du gjorde et spill med dårligere utfall (et spill som er ulønnsomt i det lange løp) når oddsen ikke er i din favør, taper du noe, uansett om du vant eller tapte i denne hånden.

Du satser med det beste resultatet hvis forventningene dine er positive, og det er positivt hvis oddsen er i din favør. Ved å satse med det verste resultatet har du en negativ forventning, som skjer når oddsen er mot deg. Seriøse spillere satser bare med det beste resultatet, med det verste - de kaster seg. Hva betyr oddsen i din favør? Du kan ende opp med å vinne mer enn de faktiske oddsene gir. Den virkelige oddsen for å treffe haler er 1 til 1, men du får 2 til 1 på grunn av innsatsforholdet. I dette tilfellet er oddsen i din favør. Du får definitivt det beste resultatet med en positiv forventning på 50 cent per innsats.


Her er mer komplekst eksempel matematisk forventning. Vennen skriver ned tallene fra en til fem og satser $5 mot $1 på at du ikke vil velge nummeret. Er du enig i et slikt veddemål? Hva er forventningene her?

I gjennomsnitt tar du feil fire ganger. Basert på dette vil oddsen mot at du gjetter tallet være 4 til 1. Oddsen er at du vil tape en dollar på ett forsøk. Du vinner imidlertid 5 mot 1, med mulighet for å tape 4 mot 1. Derfor er oddsen i din favør, du kan ta innsatsen og håpe på det beste utfallet. Hvis du gjør denne innsatsen fem ganger, vil du i gjennomsnitt tape fire ganger $1 og vinne $5 én gang. Basert på dette, for alle fem forsøkene vil du tjene $1 med en positiv matematisk forventning på 20 cent per innsats.


En spiller som kommer til å vinne mer enn han satser, som i eksempelet ovenfor, fanger oddsen. Motsatt ødelegger han sjansene når han forventer å vinne mindre enn han satser. Spilleren kan ha enten positive eller negative forventninger avhengig av om han fanger eller ødelegger oddsen.

Hvis du satser $50 for å vinne $10 med 4 til 1 sjanse for å vinne, vil du få en negativ forventning på $2, fordi i gjennomsnitt vil du vinne fire ganger $10 og tape $50 én gang, noe som viser at tapet per innsats vil være $10. Men hvis du satser $30 for å vinne $10, med samme odds for å vinne 4 til 1, så har du i dette tilfellet en positiv forventning på $2, fordi du vinner igjen fire ganger $10 og taper $30 én gang, for en fortjeneste på $10. Disse eksemplene viser at den første innsatsen er dårlig og den andre er god.


Matematisk forventning er sentrum for enhver spillsituasjon. Når en bookmaker oppfordrer fotballfans til å satse $11 for å vinne $10, har de en positiv forventning på 50 cent for hver $10. Hvis kasinoet betaler ut jevne penger fra Craps pass-linjen, er husets positive forventning omtrent $1,40 for hver $100; dette spillet er strukturert slik at alle som satser på denne linjen taper 50,7 % i gjennomsnitt og vinner 49,3 % av tiden. Utvilsomt er det denne tilsynelatende minimale positive forventningen som gir enorm fortjeneste til kasinoeiere over hele verden. Som Vegas World kasinoeier Bob Stupak bemerket, "En tusendel av en prosent av en negativ sannsynlighet over en lang nok avstand vil ødelegge rikeste mann i verden".


Matematisk forventning når du spiller poker

Spillet poker er det mest avslørende og godt eksempel når det gjelder å bruke teorien og egenskapene til matematisk forventning.


Forventet verdi i poker er den gjennomsnittlige fordelen fra en bestemt avgjørelse, forutsatt at en slik avgjørelse kan vurderes innenfor rammen av teorien om store tall og lang avstand. Vellykket poker handler om å alltid akseptere trekk med en positiv matematisk forventning.

Den matematiske betydningen av den matematiske forventningen når du spiller poker ligger i det faktum at vi ofte møter tilfeldige variabler når vi tar en avgjørelse (vi vet ikke hvilke kort motstanderen har på hånden, hvilke kort som kommer på etterfølgende budrunder). Vi må vurdere hver av løsningene fra synspunktet om teorien om store tall, som sier at med et tilstrekkelig stort utvalg, vil gjennomsnittsverdien til en tilfeldig variabel ha en tendens til dens matematiske forventning.


Blant de spesielle formlene for å beregne den matematiske forventningen, er følgende mest anvendelig i poker:

Når du spiller poker, kan den matematiske forventningen beregnes for både innsatser og samtaler. I det første tilfellet bør fold equity tas i betraktning, i det andre, pottens egne odds. Når du evaluerer den matematiske forventningen til et bestemt trekk, bør det huskes at en fold alltid har en null matematisk forventning. Dermed vil det å kaste kort alltid være en mer lønnsom beslutning enn noe negativt trekk.

Forventning forteller deg hva du kan forvente (fortjeneste eller tap) for hver dollar du risikerer. Kasinoer tjener penger fordi den matematiske forventningen til alle spillene som praktiseres i dem er til fordel for casinoet. Med en tilstrekkelig lang rekke spill kan det forventes at klienten vil tape pengene sine, siden "sannsynligheten" er i favør av kasinoet. Imidlertid begrenser profesjonelle kasinospillere spillene sine til korte perioder, og øker dermed oddsen i deres favør. Det samme gjelder investering. Hvis forventningen din er positiv, kan du tjene mer penger gjøre mange handler på kort tid. Forventningen er din prosentandel av fortjeneste per seier ganger din gjennomsnittlige fortjeneste minus sannsynligheten for tap ganger ditt gjennomsnittlige tap.


Poker kan også vurderes i form av matematiske forventninger. Du kan anta at et bestemt trekk er lønnsomt, men i noen tilfeller er det kanskje ikke det beste, fordi et annet trekk er mer lønnsomt. La oss si at du treffer fullt hus i poker med fem kort. Motstanderen din satser. Du vet at hvis du går opp, vil han syne. Så høyning ser ut som den beste taktikken. Men hvis du høyner, vil de resterende to spillerne kaste seg. Men hvis du syner innsatsen, vil du være helt sikker på at de to andre spillerne etter deg vil gjøre det samme. Når du høyner innsatsen får du én enhet, og ganske enkelt ved å syne får du to. Så å ringe gir deg en høyere positiv forventet verdi og er den beste taktikken.

Den matematiske forventningen kan også gi en ide om hvilke pokertaktikker som er mindre lønnsomme og hvilke som er mer lønnsomme. For eksempel, hvis du spiller en bestemt hånd og du tror det gjennomsnittlige tapet ditt er 75 cent inkludert antene, bør du spille den hånden fordi dette er bedre enn å folde når ante er $1.


En annen viktig grunnå forstå essensen av matematisk forventning er at det gir deg en følelse av sinnsro om du vant et veddemål eller ikke: hvis du gjorde et godt veddemål eller kastet i tide, vil du vite at du har tjent eller spart en viss mengde penger som en svakere spiller ikke var i stand til å spare. Det er mye vanskeligere å kaste seg hvis du er frustrert over at motstanderen din har en bedre hånd på draw. Når det er sagt, blir pengene du sparer ved å ikke spille, i stedet for å satse, lagt til dine overnattings- eller månedlige gevinster.

Bare husk at hvis du byttet hender, ville motstanderen din syne deg, og som du vil se i artikkelen om Fundamental Theorem of Poker, er dette bare en av fordelene dine. Du bør glede deg når dette skjer. Du kan til og med lære å glede deg over å miste en hånd, fordi du vet at andre spillere i skoene dine ville tapt mye mer.


Som diskutert i myntspilleksemplet i begynnelsen, er timerenten knyttet til forventet verdi, og dette konseptet spesielt viktig for profesjonelle spillere. Når du skal spille poker, må du mentalt anslå hvor mye du kan vinne på en times spill. I de fleste tilfeller må du stole på din intuisjon og erfaring, men du kan også bruke noen matematiske beregninger. For eksempel, hvis du spiller draw lowball og du ser tre spillere satse $10 og deretter trekke to kort, noe som er en veldig dårlig taktikk, kan du selv beregne at hver gang de satser $10, taper de rundt $2. Hver av dem gjør dette åtte ganger i timen, noe som betyr at alle tre taper rundt $48 per time. Du er en av de resterende fire spillerne, som er omtrent like, så disse fire spillerne (og du blant dem) må dele $48, og hver vil tjene $12 per time. Timeprisen din i dette tilfellet er ganske enkelt din andel av pengebeløpet tapt av tre dårlige spillere per time.

Over en lang periode er spillerens totale gevinster summen av hans matematiske forventninger i separate fordelinger. Jo mer du spiller med positiv forventning, jo mer vinner du, og omvendt, jo flere hender du spiller med negativ forventning, jo mer taper du. Som et resultat bør du prioritere et spill som kan maksimere den positive forventningen din eller negere den negative forventningen din, slik at du kan maksimere din timegevinst.


Positive matematiske forventninger i spillstrategi

Hvis du vet hvordan du skal telle kort, kan du ha en fordel fremfor kasinoet hvis de ikke legger merke til det og sparker deg ut. Kasinoer elsker fulle gamblere og tåler ikke å telle kort. Fordelen vil tillate deg å vinne flere ganger enn du taper over tid. god ledelse kapital ved å bruke forventningsberegninger kan hjelpe deg med å utnytte fordelen din og redusere tapene dine. Uten en fordel er det bedre å gi pengene til veldedighet. I spillet på børsen er fordelen gitt av spillets system, som skaper mer profitt enn tap, prisforskjeller og provisjoner. Ingen pengebeløp vil redde et dårlig spillsystem.

En positiv forventning er definert av en verdi større enn null. Jo større dette tallet er, desto sterkere er den statistiske forventningen. Hvis verdien er mindre enn null, vil den matematiske forventningen også være negativ. Jo større modulen til en negativ verdi, jo verre situasjon. Hvis resultatet er null, er forventningen break even. Du kan bare vinne når du har en positiv matematisk forventning, et fornuftig spillsystem. Å spille på intuisjon fører til katastrofe.


Matematisk forventning og aksjehandel

Matematisk forventning er en ganske mye etterspurt og populær statistisk indikator i valutahandel i finansmarkeder. Først av alt brukes denne parameteren til å analysere suksessen til handel. Det er ikke vanskelig å gjette at jo flere gitt verdi, jo mer grunn til å vurdere den studerte handelen som vellykket. Selvfølgelig kan analysen av arbeidet til en næringsdrivende ikke bare utføres ved hjelp av denne parameteren. Imidlertid kan den beregnede verdien, i kombinasjon med andre metoder for å vurdere kvaliteten på arbeidet, øke nøyaktigheten av analysen betydelig.


Den matematiske forventningen beregnes ofte i handelskontoovervåkingstjenester, som lar deg raskt evaluere arbeidet som er utført på innskuddet. Som unntak kan vi sitere strategier som bruker "overstaying" av tapende handler. En handelsmann kan være heldig i noen tid, og derfor kan det ikke være tap i det hele tatt i arbeidet hans. I dette tilfellet vil det ikke være mulig å navigere bare etter forventningen, fordi risikoen som brukes i arbeidet ikke vil bli tatt i betraktning.

Ved handel på markedet brukes matematisk forventning oftest når man forutsier lønnsomheten til en handelsstrategi eller når man forutsier en traders inntekt basert på statistikken over hans tidligere handler.

Når det gjelder pengestyring, er det veldig viktig å forstå at når du handler med negative forventninger, er det ingen pengestyringsordning som definitivt kan gi høy fortjeneste. Hvis du fortsetter å spille børsen under disse betingelsene, vil du miste hele kontoen, uansett hvor stor den var i begynnelsen, uansett hvordan du administrerer pengene dine.

Dette aksiomet gjelder ikke bare for spill eller handler med negative forventninger, det er også sant for spill med jevne odds. Derfor er det eneste tilfellet hvor du har en sjanse til å dra nytte av det i det lange løp når du gjør avtaler med en positiv matematisk forventning.


Forskjellen mellom negativ forventning og positiv forventning er forskjellen mellom liv og død. Det spiller ingen rolle hvor positiv eller negativ forventningen er; det som betyr noe er om det er positivt eller negativt. Derfor, før du vurderer pengestyring, må du finne et spill med en positiv forventning.

Hvis du ikke har det spillet, vil ingen pengebeløp i verden spare deg. På den annen side, hvis du har en positiv forventning, så er det mulig, gjennom riktig pengestyring, å gjøre det om til en eksponentiell vekstfunksjon. Det spiller ingen rolle hvor liten den positive forventningen er! Det spiller med andre ord ingen rolle hvor lønnsomt et handelssystem basert på én kontrakt er. Hvis du har et system som vinner $10 per kontrakt på en enkelt handel (etter gebyrer og slipping), kan du bruke pengestyringsteknikker for å gjøre det mer lønnsomt enn et system som viser en gjennomsnittlig fortjeneste på $1000 per handel (etter fradrag av provisjoner og glidning).


Det som betyr noe er ikke hvor lønnsomt systemet var, men hvor sikkert det kan sies at systemet vil vise minst en minimal fortjeneste i fremtiden. Derfor er den viktigste forberedelsen en trader kan gjøre å sørge for at systemet viser en positiv forventet verdi i fremtiden.

For å ha en positiv forventet verdi i fremtiden er det svært viktig å ikke begrense frihetsgradene til systemet ditt. Dette oppnås ikke bare ved å eliminere eller redusere antall parametere som skal optimaliseres, men også ved å redusere så mye som mulig mer systemregler. Hver parameter du legger til, hver regel du gjør, hver minste endring du gjør i systemet reduserer antallet frihetsgrader. Ideelt sett vil du bygge en ganske primitiv og enkelt system, som konstant vil gi et lite overskudd i nesten alle markeder. Igjen er det viktig at du forstår at det ikke spiller noen rolle hvor lønnsomt et system er, så lenge det er lønnsomt. Pengene du tjener på handel vil tjenes gjennom effektiv ledelse penger.

Et handelssystem er rett og slett et verktøy som gir deg en positiv matematisk forventning slik at pengestyring kan brukes. Systemer som fungerer (viser minst en minimal fortjeneste) i bare ett eller noen få markeder, eller har forskjellige regler eller parametere for forskjellige markeder, vil mest sannsynlig ikke fungere i sanntid på lenge. Problemet med de fleste tekniske tradere er at de bruker for mye tid og krefter på optimalisering. forskjellige regler og verdiene til parametere for handelssystem. Dette gir helt motsatte resultater. I stedet for å kaste bort energi og datamaskin tid for å øke fortjenesten til handelssystemet, rett energien din til å øke pålitelighetsnivået for å oppnå et minimumsfortjeneste.

Å vite at pengestyring er rettferdig tallspill, som krever bruk av positive forventninger, kan traderen slutte å lete etter aksjehandelens "hellige gral". I stedet kan han begynne å teste sin handelsmetode, finne ut hvordan denne metoden er logisk forsvarlig, om den gir positive forventninger. Riktige metoder pengestyring, brukt på alle, til og med veldig middelmådige handelsmetoder, vil gjøre resten av arbeidet.


For at enhver handelsmann skal lykkes i arbeidet sitt, må han løse de tre mest viktige oppgaver: . For å sikre at antallet vellykkede transaksjoner overstiger de uunngåelige feilene og feilberegningene; Sett opp ditt handelssystem slik at muligheten til å tjene penger er så ofte som mulig; Oppnå et stabilt positivt resultat av driften din.

Og her, for oss, arbeidende handelsmenn, kan matematisk forventning gi god hjelp. Dette begrepet i sannsynlighetsteorien er en av nøkkelen. Den kan brukes til å gi et gjennomsnittlig anslag på noen tilfeldig verdi. Den matematiske forventningen til en tilfeldig variabel er som tyngdepunktet, hvis du forestiller deg alt mulige sannsynligheter punkter med ulik masse.


I forhold til en handelsstrategi, for å evaluere dens effektivitet, brukes den matematiske forventningen om fortjeneste (eller tap) oftest. Denne parameteren er definert som summen av produktene av gitte nivåer av fortjeneste og tap og sannsynligheten for at de inntreffer. For eksempel antar den utviklede handelsstrategien at 37% av alle operasjoner vil gi fortjeneste, og den resterende delen - 63% - vil være ulønnsom. Samtidig vil gjennomsnittlig inntekt fra en vellykket transaksjon være $7, og gjennomsnittlig tap vil være $1,4. La oss beregne den matematiske forventningen til handel ved å bruke følgende system:

Hva gjør gitt nummer? Den sier at, etter reglene i dette systemet, vil vi i gjennomsnitt motta 1,708 dollar fra hver avsluttede transaksjon. Siden det resulterende effektivitetsestimatet Over null, så kan et slikt system brukes til ekte arbeid. Hvis den matematiske forventningen som et resultat av beregningen viser seg å være negativ, indikerer dette allerede et gjennomsnittlig tap, og slik handel vil føre til ruin.

Mengden fortjeneste per handel kan også uttrykkes som relativ verdi som %. For eksempel:

– prosentandel av inntekt per 1 transaksjon - 5%;

– prosentandel av vellykkede handelsoperasjoner - 62 %;

– tapsprosent per 1 handel - 3%;

- prosentandelen mislykkede transaksjoner - 38%;

Det vil si at den gjennomsnittlige transaksjonen vil gi 1,96%.

Det er mulig å utvikle et system som, til tross for overvekt av tapende handler, vil gi et positivt resultat, siden MO>0.

Det er imidlertid ikke nok å vente alene. Det er vanskelig å tjene penger hvis systemet gir svært få handelssignaler. I dette tilfellet vil lønnsomheten være sammenlignbar med bankrenter. La hver operasjon bare innbringe 0,5 dollar i gjennomsnitt, men hva om systemet antar 1000 transaksjoner per år? Dette vil være en meget alvorlig mengde i løpet av relativt kort tid. Det følger logisk av dette at en annen kjennetegn Et godt handelssystem kan betraktes som en kort holdeperiode.


Kilder og lenker

dic.academic.ru - akademisk nettordbok

mathematics.ru - pedagogisk nettsted om matematikk

nsu.ru - pedagogisk nettsted for Novosibirsk State University

webmath.ru utdanningsportal for studenter, søkere og skoleelever.

exponenta.ru pedagogisk matematisk nettsted

ru.tradimo.com - gratis online handelsskole

crypto.hut2.ru - tverrfaglig informasjonsressurs

poker-wiki.ru - gratis leksikon av poker

sernam.ru Vitenskapsbibliotek utvalgte naturvitenskapelige publikasjoner

reshim.su - nettside LØS oppgaver kontrollerer kursarbeid

unfx.ru – Forex på UNFX: utdanning, handelssignaler, tillitsstyring

slovopedia.com - Stor encyklopedisk ordbok Slovopedia

pokermansion.3dn.ru - Din guide til pokerverdenen

statanaliz.info – informasjonsblogg « Statistisk analyse data"

forex-trader.rf - portal Forex-Trader

megafx.ru - oppdatert Forex-analyse

fx-by.com - alt for en trader

La tilfeldig utvalg generert av den observerte tilfeldige variabelen ξ, den matematiske forventningen og variansen som er ukjente. Som estimater for disse egenskapene ble det foreslått å bruke prøvegjennomsnittet

Og prøveavvik

. (3.14)

La oss vurdere noen egenskaper ved estimater av matematisk forventning og varians.

1. Beregn den matematiske forventningen til prøvegjennomsnittet:

Derfor er prøvegjennomsnittet en objektiv estimator for .

2. Husk at resultatene observasjoner er uavhengige tilfeldige variabler, som hver har samme distribusjonslov som verdien , som betyr at , , . Vi vil anta at variansen er endelig. Så, i henhold til Chebyshev-teoremet om loven om store tall, for enhver ε > 0 har vi likheten ,

som kan skrives slik: . (3.16) Ved å sammenligne (3.16) med definisjonen av konsistensegenskapen (3.11), ser vi at estimatet er et konsistent estimat av forventningen .

3. Finn variansen til prøvegjennomsnittet:

. (3.17)

Dermed avtar variansen til forventningsestimatet omvendt med utvalgsstørrelsen.

Det kan bevises at hvis den tilfeldige variabelen ξ er normalfordelt, så er utvalgsgjennomsnittet et effektivt estimat av den matematiske forventningen, det vil si at variansen tar minste verdi sammenlignet med ethvert annet estimat av den matematiske forventningen. For andre distribusjonslover for ξ er dette kanskje ikke tilfelle.

Prøvevariansen er et partisk estimat av variansen, siden . (3.18)

Faktisk, ved å bruke egenskapene til den matematiske forventningen og formelen (3.17), finner vi

.

For å få et objektivt estimat av variansen, må estimat (3.14) korrigeres, det vil si multiplisert med . Da får vi den objektive prøvevariansen

. (3.19)

Merk at formlene (3.14) og (3.19) bare er forskjellige i nevneren, og for store verdier utvalget og objektive varianser varierer lite. For en liten prøvestørrelse bør imidlertid relasjon (3.19) brukes.

For å estimere standardavviket til en tilfeldig variabel, brukes det såkalte «korrigerte» standardavviket, som er lik kvadratroten av den objektive variansen: .

Intervallestimater

I statistikk er det to tilnærminger til å estimere ukjente parametere for distribusjoner: punkt og intervall. I samsvar med punktestimering, som ble diskutert i forrige avsnitt, er kun punktet nær der den estimerte parameteren er angitt. Det er imidlertid ønskelig å vite hvor langt denne parameteren faktisk kan stå fra mulig implementering av estimater i ulike serier av observasjoner.

Svaret på dette spørsmålet - også omtrentlig - gir en annen måte å estimere parametrene - intervall. I samsvar med denne estimeringsmetoden finner man et intervall som, med en sannsynlighet nær én, dekker det ukjente numerisk verdi parameter.

Konseptet med intervallestimering

Poengvurdering er en tilfeldig variabel og for mulige implementeringer av prøven tar kun verdier omtrent lik den sanne verdien av parameteren. Jo mindre forskjellen er, desto mer nøyaktig er estimatet. Dermed, positivt tall, for hvilket , karakteriserer nøyaktigheten av estimatet og kalles estimeringsfeil (eller marginalfeil).

Tillit Sannsynlighet(eller pålitelighet) kalles sannsynlighet β , som ulikheten med , dvs.

. (3.20)

Erstatter ulikheten dens tilsvarende doble ulikhet , eller , vi får

Intervall dekker med sannsynlighet β , , ukjent parameter , kalles konfidensintervall (eller intervall estimering), tilsvarende konfidensnivået β .

En tilfeldig variabel er ikke bare et estimat, men også en feil: verdien avhenger av sannsynligheten β og som regel fra prøven. Derfor er konfidensintervallet tilfeldig og uttrykk (3.21) bør leses som følger: «Intervallet vil dekke parameteren med sannsynligheten β ", og ikke slik: "Parameteren vil falle inn i intervallet med en sannsynlighet β ”.

Betydning konfidensintervall består i det faktum at med gjentatt repetisjon av prøvevolumet i den relative andelen tilfeller lik β , konfidensintervall som tilsvarer konfidensnivået β , dekker den sanne verdien av den estimerte parameteren. Dermed, selvtillitsnivå β karakteriserer pålitelighet tillitsvurdering: jo mer β , jo mer sannsynlig at implementeringen av konfidensintervallet inneholder en ukjent parameter.

Grunnleggende egenskaper ved punktanslag

For at en vurdering skal ha praktisk verdi, må den ha følgende egenskaper.

1. Et parameterestimat kalles unbiased hvis dens matematiske forventning er lik den estimerte parameteren, dvs.

Hvis likhet (22.1) ikke er oppfylt, kan estimatet enten overvurdere verdien (M>) eller undervurdere den (M)<) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать systematisk feil mot overvurdering eller undervurdering.

2. Et estimat av en parameter kalles konsistent hvis den følger loven om store tall, dvs. konvergerer i sannsynlighet til den estimerte parameteren med en ubegrenset økning i antall eksperimenter (observasjoner), og derfor er følgende likhet oppfylt:

hvor > 0 er et vilkårlig lite tall.

For at (22.2) skal holde, er det tilstrekkelig at variansen til estimatet har en tendens til null som, dvs.

og dessuten at estimatoren skal være objektiv. Det er lett å gå fra formel (22.3) til (22.2) hvis vi bruker Chebyshevs ulikhet.

Så konsistensen av estimatet betyr at, med et tilstrekkelig stort antall eksperimenter og med en vilkårlig høy sikkerhet, vil avviket til estimatet fra sann verdi parameter mindre enn noen foran angi verdi. Dette rettferdiggjør økningen i utvalgsstørrelsen.

Siden er en tilfeldig variabel hvis verdi endres fra utvalg til utvalg, så vil målet på spredningen rundt den matematiske forventningen karakteriseres av variansen D. La og være to objektive estimater av parameteren, dvs. M = og M = , henholdsvis D og D og, hvis D< D , то в качестве оценки принимают.

3. Et objektivt estimat som har den minste variansen blant alle mulige objektive parameterestimater beregnet fra prøver av samme størrelse kalles et effektivt estimat.

I praksis, når man estimerer parametere, er det ikke alltid mulig å tilfredsstille krav 1, 2, 3 samtidig. Valget av et estimat bør imidlertid alltid innledes med en kritisk undersøkelse fra alle synspunkter. Ved prøvetaking praktiske metoder behandling av eksperimentelle data, er det nødvendig å bli veiledet av de formulerte egenskapene til estimater.

Estimering av matematisk forventning og varians for utvalget

Mest viktige egenskaper tilfeldig variabel er den matematiske forventningen og variansen. Vurder spørsmålet om hvilke utvalgsegenskaper som best estimerer den matematiske forventningen og variansen når det gjelder upartiskhet, effektivitet og konsistens.

Teorem 23.1. Det aritmetiske gjennomsnittet beregnet fra n uavhengige observasjoner over en tilfeldig variabel som har den matematiske forventningen M = , er et objektivt estimat av denne parameteren.

Bevis.

La - n uavhengige observasjoner over en tilfeldig variabel. Etter betingelse M = , og siden er tilfeldige variabler og har samme fordelingslov, da. Per definisjon er det aritmetiske gjennomsnittet

Tenk på den matematiske forventningen til det aritmetiske gjennomsnittet. Ved å bruke egenskapen til matematisk forventning har vi:

de. . I kraft av (22.1) er et objektivt estimat. ?

Teorem 23.2 . Det aritmetiske gjennomsnittet beregnet fra n uavhengige observasjoner på en tilfeldig variabel som har M = u er et konsistent estimat av denne parameteren.

Bevis.

La - n uavhengige observasjoner over en tilfeldig variabel. Da har vi i kraft av setning 23.1 M = .

For det aritmetiske gjennomsnittet skriver vi Chebyshev-ulikheten:

Ved å bruke dispersjonsegenskapene 4.5 og (23.1), har vi:

fordi ifølge teoremet.

Derfor,

Så variansen til det aritmetiske gjennomsnittet er n ganger mindre enn variansen til den tilfeldige variabelen. Deretter

som betyr at det er et konsistent estimat.

Kommentar : 1 . Vi aksepterer uten bevis et resultat som er svært viktig for praksis. Hvis N (a,), så det objektive estimatet av den matematiske forventningen en har en minimumsvarians lik, er derfor et effektivt estimat av parameteren a. ?

La oss gå videre til anslaget for variansen og sjekke det for konsistens og upartiskhet.

Teorem 23.3 . Hvis et tilfeldig utvalg består av n uavhengige observasjoner på en tilfeldig variabel med

M = og D =, deretter prøvevariansen

er ikke et objektivt estimat av D - generell varians.

Bevis.

La - n uavhengige observasjoner over en tilfeldig variabel. Betinget og for alle. Vi transformerer formelen (23.3) for prøvevariansen:


La oss forenkle uttrykket

Med hensyn til (23.1), hvorfra

Estimater av matematisk forventning og varians.

Vi ble kjent med begrepet fordelingsparametere i sannsynlighetsteori. For eksempel i normal lov fordeling gitt av

parametere er EN– matematisk forventning og EN er standardavviket. I Poisson-fordelingen er parameteren tallet a = eks.

Definisjon. Et statistisk estimat av en ukjent parameter for en teoretisk fordeling er dens omtrentlige verdi, som avhenger av prøvedataene(x 1, x 2, x 3,..., x k; s 1, s 2, s 3,..., p k), dvs. en funksjon av disse mengdene.

Her x 1, x 2, x 3,..., x k– funksjonsverdier, s 1, s 2, s 3,..., p k er de tilsvarende frekvensene. Det statistiske anslaget er en tilfeldig variabel.

Angi med θ er den estimerte parameteren, og gjennom θ * - hans statistisk evaluering. Verdi | θ *–θ | kalt vurderingsnøyaktighet. Jo mindre | θ *–θ |, jo bedre, den ukjente parameteren er mer nøyaktig definert.

Å score θ * hadde praktisk verdi, den skal ikke inneholde en systematisk feil og samtidig ha minst mulig varians. I tillegg, med en økning i utvalgsstørrelsen, vil sannsynligheten for vilkårlig små avvik | θ *–θ | skal være nær 1.

La oss formulere følgende definisjoner.

1. Et parameterestimat kalles upartisk hvis dens matematiske forventning er M(θ *) lik den estimerte parameteren θ, dvs.

M(θ *) = θ, (1)

og forskyv hvis

M(θ *) ≠ θ, (2)

2. Et estimat θ* kalles konsistent hvis for noen δ > 0

(3)

Likhet (3) lyder som følger: estimat θ * konvergerer i sannsynlighet til θ .

3. Et estimat θ* kalles effektivt hvis det for en gitt n har den minste variansen.

Teorem 1.Utvalgets gjennomsnitt Х В er et objektivt og konsistent estimat av den matematiske forventningen.

Bevis. La utvalget være representativt, dvs. alle elementer befolkning har samme sjanse til å bli inkludert i utvalget. Funksjonsverdier x 1, x 2, x 3,..., x n kan tas som uavhengige tilfeldige variabler X 1, X 2, X 3, ..., X n med samme fordelinger og numeriske egenskaper, inkludert de med like matematiske forventninger lik EN,

Siden hver av mengdene X 1, X 2, X 3, ..., X p har en fordeling som sammenfaller med fordelingen av den generelle befolkningen, da M(X)= a. Derfor

hvorav det følger at er et konsistent estimat M(X).

Ved å bruke ekstremumforskningsregelen kan vi bevise at det også er et effektivt estimat M(X).

La det være en tilfeldig variabel X med matematisk forventning m og spredning D, mens begge disse parameterne er ukjente. Over størrelsesorden X produsert N uavhengige eksperimenter, som resulterte i et sett med N numeriske resultater x 1, x 2, …, x N. Som et estimat på den matematiske forventningen er det naturlig å foreslå det aritmetiske gjennomsnittet av de observerte verdiene

(1)

Her som x i spesifikke verdier (tall) oppnådd som et resultat av N eksperimenter. Hvis vi tar andre (uavhengig av de forrige) N eksperimenter, så vil vi selvsagt få en annen verdi. Hvis du tar mer N eksperimenter, vil vi få en ny verdi til. Angi med X i tilfeldig variabel som følge av Jeg eksperimentet, deretter erkjennelsene X i vil være tallene oppnådd som et resultat av disse eksperimentene. Det er åpenbart at den tilfeldige variabelen X i vil ha samme sannsynlighetsfordelingstetthet som den opprinnelige tilfeldige variabelen X. Vi antar også at de tilfeldige variablene X i Og Xj er uavhengige kl Jeg, ikke lik j(ulike uavhengige i forhold til hverandre eksperimenter). Derfor omskriver vi formel (1) i en annen (statistisk) form:

(2)

La oss vise at estimatet er objektivt:

Dermed er den matematiske forventningen til prøvegjennomsnittet lik den sanne matematiske forventningen til den tilfeldige variabelen m. Dette er et ganske forutsigbart og forståelig faktum. Derfor kan utvalgets gjennomsnitt (2) tas som et estimat på den matematiske forventningen til en tilfeldig variabel. Nå oppstår spørsmålet: hva skjer med variansen til forventningsestimatet når antallet eksperimenter øker? Det viser analytiske beregninger

hvor er variansen til estimatet for den matematiske forventningen (2), og D- sann varians av den tilfeldige variabelen X.

Av ovenstående følger det at med økende N(antall eksperimenter) avtar variansen til estimatet, dvs. jo mer vi oppsummerer de uavhengige implementeringene, jo nærmere forventet verdi får vi estimatet.


Matematisk variansestimater

Ved første øyekast ser det mest naturlige anslaget ut til å være

(3)

hvor beregnes ved formel (2). La oss sjekke om estimatet er objektivt. Formel (3) kan skrives som følger:

Vi erstatter uttrykk (2) i denne formelen:

La oss finne den matematiske forventningen til variansestimatet:

(4)

Siden variansen til en tilfeldig variabel ikke er avhengig av hva den matematiske forventningen til den tilfeldige variabelen er, vil vi ta den matematiske forventningen lik 0, dvs. m = 0.

(5)
kl.(6)