Biografier Kjennetegn Analyse

Eksempel på standardavviksformel. standardavvik

Instruksjon

La det være flere tall som karakteriserer - eller homogene mengder. For eksempel resultater av målinger, veiinger, statistiske observasjoner, etc. Alle mengder som presenteres skal måles med samme måling. For å finne standardavviket, gjør følgende.

Bestem det aritmetiske gjennomsnittet av alle tall: legg sammen alle tallene og del summen på det totale antallet tall.

Bestem spredningen (spredningen) av tall: legg sammen kvadratene av avvikene funnet tidligere og del den resulterende summen med antall tall.

Det er sju pasienter på avdelingen med temperatur på 34, 35, 36, 37, 38, 39 og 40 grader Celsius.

Det er nødvendig å bestemme gjennomsnittsavviket fra gjennomsnittet.
Løsning:
"i avdelingen": (34+35+36+37+38+39+40)/7=37 ºС;

Temperaturavvik fra gjennomsnittet (i dette tilfellet normalverdien): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, viser det seg: -3, -2, -1, 0, 1, 2, 3 (ºС);

Del summen av tall oppnådd tidligere med tallet deres. For nøyaktigheten av beregningen er det bedre å bruke en kalkulator. Resultatet av divisjonen er det aritmetiske gjennomsnittet av summene.

Vær nøye med alle stadier av beregningen, da en feil i minst en av beregningene vil føre til en feil sluttindikator. Sjekk de mottatte beregningene på hvert trinn. Det aritmetiske gjennomsnittet har samme måler som summene av tallene, det vil si at hvis du bestemmer gjennomsnittlig oppmøte, vil alle indikatorer være "person".

Denne beregningsmetoden brukes kun i matematiske og statistiske beregninger. Så for eksempel har det aritmetiske gjennomsnittet i informatikk en annen beregningsalgoritme. Det aritmetiske gjennomsnittet er en svært betinget indikator. Den viser sannsynligheten for en hendelse, forutsatt at den bare har én faktor eller indikator. For den mest dyptgående analysen må mange faktorer tas i betraktning. Til dette benyttes beregning av mer generelle mengder.

Det aritmetiske gjennomsnittet er et av målene for sentral tendens, mye brukt i matematikk og statistiske beregninger. Å finne det aritmetiske gjennomsnittet av flere verdier er veldig enkelt, men hver oppgave har sine egne nyanser, som ganske enkelt er nødvendige å vite for å utføre korrekte beregninger.

Kvantitative resultater av slike eksperimenter.

Hvordan finne det aritmetiske gjennomsnittet

Søket etter det aritmetiske gjennomsnittet for en rekke tall bør begynne med å bestemme den algebraiske summen av disse verdiene. For eksempel, hvis matrisen inneholder tallene 23, 43, 10, 74 og 34, vil deres algebraiske sum være 184. Når du skriver, er det aritmetiske gjennomsnittet angitt med bokstaven μ (mu) eller x (x med en søyle) . Deretter skal den algebraiske summen deles på antall tall i matrisen. I dette eksemplet var det fem tall, så det aritmetiske gjennomsnittet vil være 184/5 og vil være 36,8.

Funksjoner ved å jobbe med negative tall

Hvis det er negative tall i matrisen, blir det aritmetiske gjennomsnittet funnet ved å bruke en lignende algoritme. Det er forskjell kun ved beregning i programmeringsmiljøet, eller hvis det er tilleggsbetingelser i oppgaven. I disse tilfellene kommer det ned til tre trinn å finne det aritmetiske gjennomsnittet av tall med forskjellige fortegn:

1. Finne det vanlige aritmetiske gjennomsnittet ved standardmetoden;
2. Finne det aritmetiske gjennomsnittet av negative tall.
3. Beregning av det aritmetiske gjennomsnittet av positive tall.

Svarene til hver av handlingene er skrevet atskilt med komma.

Naturlige og desimalbrøker

Hvis matrisen av tall er representert med desimalbrøker, skjer løsningen i henhold til metoden for å beregne det aritmetiske gjennomsnittet av heltall, men resultatet reduseres i henhold til kravene til oppgaven for nøyaktigheten av svaret.

Når du arbeider med naturlige brøker, bør de reduseres til en fellesnevner, som multipliseres med antall tall i matrisen. Telleren til svaret vil være summen av de gitte tellerne av de opprinnelige brøkelementene.

Ved statistisk testing av hypoteser, ved måling av en lineær sammenheng mellom tilfeldige variabler.

Standardavvik:

Standardavvik(et estimat av standardavviket til den tilfeldige variabelen Gulv, vegger rundt oss og taket, x i forhold til dens matematiske forventning basert på et objektivt estimat av variansen):

hvor - varians; - Gulvet, veggene rundt oss og taket, Jeg-th prøveelement; - prøvestørrelse; - aritmetisk gjennomsnitt av prøven:

Det skal bemerkes at begge estimatene er partiske. I det generelle tilfellet er det umulig å konstruere et objektivt estimat. Imidlertid er et estimat basert på et objektivt variansestimat konsistent.

tre sigma regel

tre sigma regel() - nesten alle verdier av en normalfordelt tilfeldig variabel ligger i intervallet. Mer strengt – med ikke mindre enn 99,7 % sikkerhet, ligger verdien av en normalfordelt tilfeldig variabel i det angitte intervallet (forutsatt at verdien er sann, og ikke oppnådd som et resultat av prøvebehandling).

Hvis den sanne verdien er ukjent, bør du ikke bruke, men gulvet, veggene rundt oss og taket, s. Dermed blir regelen om tre sigma oversatt til regelen om tre etasjer, vegger rundt oss og taket, s .

Tolkning av verdien av standardavviket

En stor verdi av standardavviket viser en stor spredning av verdier i det presenterte settet med gjennomsnittsverdien til settet; en liten verdi, henholdsvis, indikerer at verdiene i settet er gruppert rundt gjennomsnittsverdien.

For eksempel har vi tre tallsett: (0, 0, 14, 14), (0, 6, 8, 14) og (6, 6, 8, 8). Alle tre settene har gjennomsnittsverdier på 7 og standardavvik på henholdsvis 7, 5 og 1. Det siste settet har et lite standardavvik fordi verdiene i settet er gruppert rundt gjennomsnittet; det første settet har den største verdien av standardavviket - verdiene i settet avviker sterkt fra gjennomsnittsverdien.

I generell forstand kan standardavviket betraktes som et mål på usikkerhet. For eksempel, i fysikk, brukes standardavviket til å bestemme feilen til en serie påfølgende målinger av en viss mengde. Denne verdien er veldig viktig for å bestemme plausibiliteten til fenomenet som studeres sammenlignet med verdien forutsagt av teorien: hvis middelverdien av målingene er veldig forskjellig fra verdiene forutsagt av teorien (stort standardavvik), så de oppnådde verdiene eller metoden for å oppnå dem bør kontrolleres på nytt.

Praktisk bruk

I praksis lar standardavviket deg bestemme hvor mye verdiene i settet kan avvike fra gjennomsnittsverdien.

Klima

Anta at det er to byer med samme gjennomsnittlige daglige maksimumstemperatur, men den ene ligger ved kysten og den andre er i innlandet. Kystbyer er kjent for å ha mange forskjellige daglige maksimumstemperaturer mindre enn byer i innlandet. Derfor vil standardavviket til de maksimale døgntemperaturene i kystbyen være mindre enn i den andre byen, til tross for at de har samme gjennomsnittsverdi på denne verdien, som i praksis betyr at sannsynligheten for at den maksimale lufttemperaturen på hver dag i året vil være sterkere forskjellig fra gjennomsnittsverdien, høyere for en by som ligger inne på kontinentet.

Sport

La oss anta at det er flere fotballag som er rangert i henhold til et sett med parametere, for eksempel antall mål scoret og sluppet inn, scoringssjanser osv. Det er mest sannsynlig at det beste laget i denne gruppen vil ha de beste verdiene i flere parametere. Jo mindre lagets standardavvik for hver av de presenterte parameterne, desto mer forutsigbart er lagets resultat, slike lag er balansert. På den annen side har et lag med stort standardavvik vanskelig for å spå resultatet, noe som igjen forklares med ubalanse, for eksempel et sterkt forsvar men et svakt angrep.

Bruken av standardavviket til parametrene til laget lar en til en viss grad forutsi resultatet av kampen mellom to lag, vurdere styrker og svakheter til lagene, og derav de valgte kampmetodene.

Teknisk analyse

se også

Litteratur

* Borovikov, V. STATISTIKK. Kunsten å analysere datadata: For fagfolk / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 s. - ISBN 5-272-00078-1.

Det er definert som en generaliserende karakteristikk av størrelsen på variasjonen til en egenskap i aggregatet. Det er lik kvadratroten av gjennomsnittlig kvadrat av avvikene til de individuelle verdiene til funksjonen fra det aritmetiske gjennomsnittet, dvs. roten til og kan bli funnet slik:

1. For den primære raden:

2. For en variantserie:

Transformasjonen av standardavviksformelen fører den til en form som er mer praktisk for praktiske beregninger:

Standardavvik bestemmer hvor mye, i gjennomsnitt, spesifikke alternativer avviker fra deres gjennomsnittsverdi, og dessuten er det et absolutt mål på egenskapsfluktuasjonen og uttrykkes i de samme enhetene som alternativene, og er derfor godt tolket.

Eksempler på å finne standardavviket: ,

For alternative funksjoner ser formelen for standardavviket slik ut:

hvor p er andelen enheter i populasjonen som har en bestemt egenskap;

q - andelen enheter som ikke har denne funksjonen.

Begrepet gjennomsnittlig lineært avvik

Gjennomsnittlig lineært avvik er definert som det aritmetiske gjennomsnittet av de absolutte verdiene av avvikene til individuelle opsjoner fra .

1. For den primære raden:

2. For en variantserie:

hvor summen av n er summen av frekvensene til variasjonsseriene.

Et eksempel på å finne gjennomsnittlig lineært avvik:

Fordelen med gjennomsnittlig absolutt avvik som mål på spredning over variasjonsområdet er åpenbar, siden dette målet er basert på å ta hensyn til alle mulige avvik. Men denne indikatoren har betydelige ulemper. Vilkårlig avvisning av algebraiske tegn på avvik kan føre til at de matematiske egenskapene til denne indikatoren er langt fra elementære. Dette kompliserer i stor grad bruken av gjennomsnittlig absolutt avvik for å løse problemer knyttet til sannsynlighetsberegninger.

Derfor brukes det gjennomsnittlige lineære avviket som et mål på variasjonen til et trekk sjelden i statistisk praksis, nemlig når summering av indikatorer uten å ta hensyn til tegn gir økonomisk mening. Med dens hjelp analyseres for eksempel omsetningen i utenrikshandelen, sammensetningen av ansatte, produksjonsrytmen osv.

rot betyr kvadrat

RMS brukt, for eksempel for å beregne den gjennomsnittlige størrelsen på sidene av n kvadratiske seksjoner, gjennomsnittsdiametrene til stammer, rør, etc. Det er delt inn i to typer.

Rotens middelkvadrat er enkel. Hvis det, når du erstatter individuelle verdier av en egenskap med en gjennomsnittsverdi, er nødvendig å holde summen av kvadrater av de opprinnelige verdiene uendret, vil gjennomsnittet være et kvadratisk gjennomsnitt.

Det er kvadratroten av kvotienten av summen av kvadrater av individuelle funksjonsverdier delt på antallet:

Gjennomsnittlig kvadrat vektet beregnes med formelen:

hvor f er et tegn på vekt.

Gjennomsnittlig kubikk

Gjennomsnittlig kubikk brukt, for eksempel ved bestemmelse av gjennomsnittlig sidelengde og terninger. Den er delt inn i to typer.
Gjennomsnittlig kubikk enkel:

Ved beregning av gjennomsnittsverdier og spredning i intervallfordelingsserien, erstattes de sanne verdiene for attributtet med de sentrale verdiene for intervallene, som er forskjellige fra det aritmetiske gjennomsnittet av verdiene inkludert i intervall. Dette fører til en systematisk feil i beregningen av variansen. V.F. Sheppard bestemte det feil i variansberegningen, forårsaket av å bruke de grupperte dataene, er 1/12 av kvadratet av intervallverdien, både oppover og nedover i størrelsen på variansen.

Sheppard-tillegg bør brukes hvis fordelingen er nær normalen, refererer til en funksjon med en kontinuerlig variasjon, bygget på en betydelig mengde initialdata (n> 500). Men basert på det faktum at begge feilene, som virker i forskjellige retninger, kompenserer hverandre i en rekke tilfeller, er det noen ganger mulig å nekte å innføre endringer.

Jo mindre varians og standardavvik er, jo mer homogen blir populasjonen og jo mer typisk vil gjennomsnittet være.
I praksis med statistikk blir det ofte nødvendig å sammenligne variasjoner av ulike funksjoner. For eksempel er det av stor interesse å sammenligne variasjoner i arbeidstakernes alder og deres kvalifikasjoner, tjenestetid og lønn, kostnad og fortjeneste, tjenestetid og arbeidsproduktivitet mv. For slike sammenligninger er indikatorer på den absolutte variasjonen av egenskaper uegnet: det er umulig å sammenligne variasjonen i arbeidserfaring, uttrykt i år, med variasjonen av lønn, uttrykt i rubler.

For å utføre slike sammenligninger, samt sammenligninger av fluktuasjonen til samme attributt i flere populasjoner med forskjellig aritmetisk gjennomsnitt, brukes en relativ variasjonsindikator - variasjonskoeffisienten.

Strukturelle gjennomsnitt

For å karakterisere den sentrale trenden i statistiske fordelinger er det ofte rasjonelt å bruke, sammen med det aritmetiske gjennomsnittet, en viss verdi av attributtet X, som på grunn av visse trekk ved dens plassering i distribusjonsserien kan karakterisere nivået.

Dette er spesielt viktig når ekstremverdiene til funksjonen i distribusjonsserien har uklare grenser. I denne forbindelse er den nøyaktige bestemmelsen av det aritmetiske gjennomsnittet som regel umulig eller veldig vanskelig. I slike tilfeller kan gjennomsnittsnivået bestemmes ved å ta for eksempel funksjonsverdien som er plassert i midten av frekvensserien eller som forekommer oftest i den aktuelle serien.

Slike verdier avhenger bare av frekvensenes natur, dvs. strukturen til fordelingen. De er typiske når det gjelder plassering i frekvensserien, derfor betraktes slike verdier som egenskaper for distribusjonssenteret og har derfor blitt definert som strukturelle gjennomsnitt. De brukes til å studere den interne strukturen og strukturen til serien med distribusjon av attributtverdier. Disse indikatorene inkluderer.

Et av hovedverktøyene for statistisk analyse er beregningen av standardavviket. Denne indikatoren lar deg lage et estimat av standardavviket for et utvalg eller for den generelle populasjonen. La oss lære hvordan du bruker standardavviksformelen i Excel.

La oss umiddelbart definere hva standardavviket er og hvordan formelen ser ut. Denne verdien er kvadratroten av det aritmetiske gjennomsnittet av kvadratene av forskjellen mellom alle verdiene i serien og deres aritmetiske gjennomsnitt. Det er et identisk navn for denne indikatoren - standardavvik. Begge navnene er helt like.

Men selvfølgelig, i Excel, trenger ikke brukeren å beregne dette, siden programmet gjør alt for ham. La oss lære hvordan du beregner standardavvik i Excel.

Beregning i Excel

Du kan beregne den angitte verdien i Excel ved å bruke to spesialfunksjoner STDEV.V(ifølge prøven) og STDEV.G(ifølge befolkningen generelt). Prinsippet for deres operasjon er helt det samme, men de kan kalles på tre måter, som vi vil diskutere nedenfor.

Metode 1: Funksjonsveiviser


Metode 2: Formler-fanen


Metode 3: Skriv inn formelen manuelt

Det er også en måte hvor du ikke trenger å kalle argumentvinduet i det hele tatt. For å gjøre dette, skriv inn formelen manuelt.


Som du kan se, er mekanismen for å beregne standardavviket i Excel veldig enkel. Brukeren trenger bare å legge inn tall fra populasjonen eller lenke til celler som inneholder dem. Alle beregninger utføres av programmet selv. Det er mye vanskeligere å forstå hva den beregnede indikatoren er og hvordan resultatene av beregningen kan brukes i praksis. Men å forstå dette hører allerede mer til statistikkens område enn å lære å jobbe med programvare.

I denne artikkelen vil jeg snakke om hvordan finne standardavvik. Dette materialet er ekstremt viktig for en full forståelse av matematikk, så en matteveileder bør vie en egen leksjon eller til og med flere til å studere det. I denne artikkelen finner du en lenke til en detaljert og forståelig videoopplæring som forklarer hva standardavviket er og hvordan du finner det.

standardavvik gjør det mulig å estimere spredningen av verdier oppnådd som et resultat av å måle en bestemt parameter. Det er betegnet med et symbol (gresk bokstav "sigma").

Formelen for beregningen er ganske enkel. For å finne standardavviket må du ta kvadratroten av variansen. Så nå må du spørre: "Hva er varians?"

Hva er spredning

Definisjonen av varians er som følger. Dispersjon er det aritmetiske gjennomsnittet av kvadrerte avvik av verdier fra gjennomsnittet.

For å finne variansen, utfør følgende beregninger sekvensielt:

  • Bestem gjennomsnittet (enkelt aritmetisk gjennomsnitt av en rekke verdier).
  • Trekk deretter gjennomsnittet fra hver av verdiene og kvadrat den resulterende forskjellen (vi fikk forskjell i annen).
  • Det neste trinnet er å beregne det aritmetiske gjennomsnittet av kvadratene av forskjellene som er oppnådd (Du kan finne ut hvorfor nøyaktig kvadratene er nedenfor).

La oss se på et eksempel. La oss si at du og vennene dine bestemmer deg for å måle høyden på hundene dine (i millimeter). Som et resultat av mål fikk du følgende høydemål (på manken): 600 mm, 470 mm, 170 mm, 430 mm og 300 mm.

La oss beregne gjennomsnittet, variansen og standardavviket.

La oss finne gjennomsnittet først. Som du allerede vet, for dette må du legge til alle de målte verdiene og dividere med antall målinger. Beregningsfremgang:

Gjennomsnittlig mm.

Så gjennomsnittet (aritmetisk gjennomsnitt) er 394 mm.

Nå må vi definere avvik av høyden til hver av hundene fra gjennomsnittet:

Til slutt, for å beregne variansen, hver av de oppnådde forskjellene kvadreres, og så finner vi det aritmetiske gjennomsnittet av resultatene som er oppnådd:

Dispersjon mm 2 .

Dermed er spredningen 21704 mm 2 .

Hvordan finne standardavviket

Så hvordan beregner man standardavviket nå, vel vitende om variansen? Som vi husker, ta kvadratroten av det. Det vil si at standardavviket er:

mm (avrundet til nærmeste hele tall i mm).

Ved å bruke denne metoden fant vi ut at noen hunder (f.eks. Rottweilere) er veldig store hunder. Men det finnes også veldig små hunder (for eksempel dachser, men du bør ikke fortelle dem dette).

Det mest interessante er at standardavviket har nyttig informasjon. Nå kan vi vise hvilke av de oppnådde resultatene av å måle vekst som er innenfor intervallet som vi får hvis vi setter til side fra gjennomsnittet (på begge sider av det) standardavviket.

Det vil si at ved å bruke standardavviket får vi en "standard" metode som lar deg finne ut hvilken av verdiene som er normal (statistisk gjennomsnitt), og som er ekstraordinært stor eller omvendt liten.

Hva er standardavvik

Men ... ting blir litt annerledes hvis vi analyserer prøvetaking data. I vårt eksempel vurderte vi den generelle befolkningen. Det vil si at våre 5 hunder var de eneste hundene i verden som interesserte oss.

Men hvis dataene er et utvalg (verdier valgt fra en stor populasjon), må beregningene gjøres annerledes.

Hvis det er verdier, så:

Alle andre beregninger gjøres på samme måte, inkludert fastsettelse av gjennomsnittet.

For eksempel, hvis våre fem hunder bare er et utvalg av en populasjon av hunder (alle hunder på planeten), må vi dele med 4 i stedet for 5 nemlig:

Prøveavvik = mm 2.

I dette tilfellet er standardavviket for prøven lik mm (avrundet til nærmeste hele tall).

Vi kan si at vi har gjort noen "korreksjon" i tilfellet når verdiene våre bare er et lite utvalg.

Merk. Hvorfor akkurat kvadratene av forskjellene?

Men hvorfor tar vi kvadratene av forskjellene når vi beregner variansen? La oss innrømme at du ved måling av en parameter mottok følgende sett med verdier: 4; fire; -fire; -fire. Hvis vi bare legger til de absolutte avvikene fra gjennomsnittet (forskjellen) seg imellom ... negative verdier oppheves med positive:

.

Det viser seg at dette alternativet er ubrukelig. Da er det kanskje verdt å prøve de absolutte verdiene til avvikene (det vil si modulene til disse verdiene)?

Ved første øyekast viser det seg ikke dårlig (den resulterende verdien kalles forresten gjennomsnittlig absolutt avvik), men ikke i alle tilfeller. La oss prøve et annet eksempel. La målingen resultere i følgende sett med verdier: 7; en; -6; -2. Da er det gjennomsnittlige absolutte avviket:

Blimey! Vi fikk igjen resultatet 4, selv om forskjellene har en mye større spredning.

La oss nå se hva som skjer hvis vi kvadrerer forskjellene (og så tar kvadratroten av summen deres).

For det første eksemplet får du:

.

For det andre eksemplet får du:

Nå er det en helt annen sak! Rot-middel-kvadrat-avviket er jo større, jo større spredning av forskjellene ... som er det vi strebet etter.

Faktisk bruker denne metoden den samme ideen som når man beregner avstanden mellom punktene, bare brukt på en annen måte.

Og fra et matematisk synspunkt er bruken av kvadrater og kvadratrøtter mer nyttig enn vi kunne få på grunnlag av de absolutte verdiene av avvikene, på grunn av hvilke standardavviket er anvendelig for andre matematiske problemer.

Sergey Valerievich fortalte deg hvordan du finner standardavviket