Biografier Kjennetegn Analyse

dampspredning. Avviksberegning i Microsoft Excel

Spredning i statistikk ligger som individuelle verdier funksjon i kvadrat fra . Avhengig av de første dataene, bestemmes de av de enkle og vektede variansformlene:

1. (for ugrupperte data) beregnes med formelen:

2. Vektet varians (for en variantserie):

hvor n er frekvensen (repeterbarhetsfaktor X)

Et eksempel på å finne variansen

Denne siden beskriver standard eksempel finne variansen, kan du også se på andre oppgaver for å finne den

Eksempel 1. Vi har følgende data for en gruppe på 20 elever korrespondanseavdelingen. Det er nødvendig å bygge en intervallserie av funksjonsfordelingen, beregne middelverdien av funksjonen og studere variansen

La oss bygge intervallgruppering. La oss bestemme rekkevidden til intervallet med formelen:

hvor X maks er maksimumsverdien for grupperingsfunksjonen;
X min er minimumsverdien for grupperingsfunksjonen;
n er antall intervaller:

Vi aksepterer n=5. Trinnet er: h \u003d (192 - 159) / 5 \u003d 6.6

La oss lage en intervallgruppering

For ytterligere beregninger vil vi bygge en hjelpetabell:

X'i er midten av intervallet. (for eksempel midten av intervallet 159 - 165,6 = 162,3)

Gjennomsnittlig vekst av studenter bestemmes av formelen til det aritmetiske vektede gjennomsnittet:

Vi bestemmer spredningen med formelen:

Variansformelen kan konverteres som følger:

Av denne formelen følger det at variansen er forskjellen mellom gjennomsnittet av kvadratene til alternativene og kvadratet og gjennomsnittet.

Spredning i variantserie Med med like intervaller ved metoden for momenter kan beregnes på følgende måte når du bruker den andre egenskapen til variansen (deler alle alternativer med verdien av intervallet). Definisjon av varians, beregnet ved metoden for øyeblikk, i henhold til følgende formel er mindre tidkrevende:

hvor i er verdien av intervallet;
A - betinget null, som er praktisk å bruke midten av intervallet med den høyeste frekvensen;
m1 er kvadratet av momentet av første orden;
m2 - moment av andre orden

(hvis i den statistiske populasjonen attributtet endres på en slik måte at det bare er to gjensidig utelukkende alternativer, så kalles en slik variabilitet alternativ) kan beregnes med formelen:

Bytter inn denne formelen dispersjon q \u003d 1- p, får vi:

Typer spredning

Total varians måler variasjonen av en egenskap over hele befolkningen som helhet under påvirkning av alle faktorene som forårsaker denne variasjonen. Det er lik middelkvadrat for avvikene individuelle verdier egenskap x av den totale gjennomsnittsverdien av x og kan defineres som enkel varians eller vektet varians.

karakteriserer tilfeldig variasjon, dvs. en del av variasjonen, som skyldes påvirkning av uregnskapsmessige faktorer og ikke er avhengig av tegn-faktoren som ligger til grunn for grupperingen. Denne variansen er lik middelkvadraten av avvikene til de individuelle verdiene til attributtet innenfor X-gruppen fra det aritmetiske gjennomsnittet av gruppen og kan beregnes som en enkel varians eller som en vektet varians.

På denne måten, variasjonsmål innen gruppe variasjon av en egenskap i en gruppe og bestemmes av formelen:

hvor xi - gruppegjennomsnitt;
ni er antall enheter i gruppen.

For eksempel, intra-gruppe avvik, som må bestemmes i oppgaven med å studere påvirkningen av arbeidernes kvalifikasjoner på nivået av arbeidsproduktivitet i verkstedet, viser variasjoner i produksjon i hver gruppe forårsaket av alle mulige faktorer (teknisk tilstand av utstyr, tilgjengelighet av verktøy og materialer, arbeidernes alder, arbeidsintensitet osv.), bortsett fra forskjeller i kvalifikasjonskategorien (innen gruppen har alle arbeidere samme kvalifikasjon).

Gjennomsnittlig fra innsiden gruppeavvik reflekterer tilfeldig, dvs. den delen av variasjonen som skjedde under påvirkning av alle andre faktorer, med unntak av grupperingsfaktoren. Det beregnes med formelen:

Det karakteriserer den systematiske variasjonen av den resulterende egenskapen, som skyldes påvirkningen av egenskapsfaktoren som ligger til grunn for grupperingen. Det er lik middelkvadraten av avvikene til gruppemiddelet fra det totale gjennomsnittet. Intergruppevarians beregnes ved hjelp av formelen:

Variansaddisjonsregel i statistikk

I følge varians addisjonsregel den totale variansen er lik summen av gjennomsnittet av intragruppe- og intergruppevariansene:

Betydningen av denne regelen er at den totale variansen som oppstår under påvirkning av alle faktorer er lik summen av variansene som oppstår under påvirkning av alle andre faktorer, og variansen som oppstår på grunn av grupperingsfaktoren.

Ved å bruke formelen for å legge til varianser, kan vi bestemme med to kjente avvik den tredje ukjente, samt for å bedømme styrken til innflytelsen til grupperingsfunksjonen.

Dispersjonsegenskaper

1. Hvis alle verdiene til attributtet reduseres (økes) med det samme konstant verdi, så endres ikke variansen.
2. Hvis alle verdiene til attributtet reduseres (økes) med samme antall ganger n, vil variansen følgelig reduseres (økes) med n^2 ganger.

Ofte i statistikk, når man analyserer et fenomen eller en prosess, er det nødvendig å ta hensyn til ikke bare informasjon om gjennomsnittsnivåene til de studerte indikatorene, men også spredning eller variasjon i verdiene til individuelle enheter , som er viktig egenskap studert populasjon.

Aksjekurser, volum av tilbud og etterspørsel, renter i ulike perioder tid og på forskjellige steder.

De viktigste indikatorene som karakteriserer variasjonen , er området, variansen, standardavviket og variasjonskoeffisienten.

Spennvariasjon er forskjellen mellom maksimum og minimumsverdier skilt: R = Xmax – Xmin. Ulempen med denne indikatoren er at den kun evaluerer grensene for egenskapsvariasjonen og ikke reflekterer svingningene innenfor disse grensene.

Spredning uten denne mangelen. Det beregnes som midtre firkant avvik av de karakteristiske verdiene fra deres gjennomsnittsverdi:

Forenklet måte å beregne varians på utføres ved hjelp av følgende formler (enkle og vektet):

Eksempler på bruken av disse formlene er presentert i oppgave 1 og 2.

En mye brukt indikator i praksis er standardavvik :

Gjennomsnitt standardavvik definert som Kvadratrot fra variansen og har samme dimensjon som egenskapen som studeres.

De vurderte indikatorene tillater å oppnå absolutt verdi variasjoner, dvs. vurdere det i måleenheter for egenskapen som studeres. I motsetning til dem, variasjonskoeffisienten måler fluktuasjon i relative termer - i forhold til gjennomsnittsnivået, som i mange tilfeller er å foretrekke.

Formel for beregning av variasjonskoeffisienten.

Eksempler på å løse problemer om temaet "Indikatorer for variasjon i statistikk"

Oppgave 1 . Når du studerte påvirkningen av reklame på størrelsen på det gjennomsnittlige månedlige innskuddet i bankene i regionen, ble 2 banker undersøkt. Følgende resultater oppnås:

Definere:
1) for hver bank: a) gjennomsnittlig størrelse månedlig innskudd; b) spredning av bidraget;
2) gjennomsnittlig månedlig innskudd for to banker sammen;
3) Spredning av innskuddet for 2 banker, avhengig av reklame;
4) Spredning av innskuddet for 2 banker, avhengig av alle faktorer unntatt reklame;
5) Total varians ved bruk av addisjonsregelen;
6) Bestemmelseskoeffisient;
7) Korrelasjonsrelasjon.

Løsning

1) La oss lage en beregningstabell for en bank med reklame . For å bestemme gjennomsnittlig månedlig innskudd finner vi midtpunktene til intervallene. I dette tilfellet blir verdien av det åpne intervallet (det første) betinget likestilt med verdien av intervallet ved siden av det (det andre).

Vi finner den gjennomsnittlige størrelsen på bidraget ved å bruke den vektede aritmetiske gjennomsnittsformelen:

29 000/50 = 580 rubler

Spredningen av bidraget er funnet ved formelen:

23 400/50 = 468

Vi vil utføre lignende handlinger for en bank uten annonser :

2) Finn gjennomsnittlig innskudd for to banker sammen. Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 rubler.

3) Variansen til innskuddet, for to banker, avhengig av reklame, vil vi finne ved formelen: σ 2 =pq (formel for variansen til en alternativ funksjon). Her er p=0,5 andelen faktorer som er avhengig av reklame; q=1-0,5, deretter σ2 =0,5*0,5=0,25.

4) Siden andelen av andre faktorer er 0,5, så er variansen til innskuddet for to banker, som avhenger av alle faktorer unntatt reklame, også 0,25.

5) Bestem den totale variansen ved å bruke addisjonsregelen.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 fakta + σ 2 hvile \u003d 552,08 + 345,96 \u003d 898,04

6) Bestemmelseskoeffisient η 2 = σ 2 fakta / σ 2 = 345,96/898,04 = 0,39 = 39 % - størrelsen på bidraget avhenger av annonsering med 39 %.

7) Empirisk korrelasjonsforhold η = √η 2 = √0,39 = 0,62 - forholdet er ganske nært.

Oppgave 2 . Det er en gruppering av foretak i henhold til verdien av salgbare produkter:

Bestem: 1) spredningen av verdien av salgbare produkter; 2) standardavvik; 3) variasjonskoeffisient.

Løsning

1) Etter betingelse presenteres en intervallfordelingsserie. Det må uttrykkes diskret, det vil si finne midten av intervallet (x "). I grupper med lukkede intervaller finner vi midten ved et enkelt aritmetisk gjennomsnitt. I grupper med øvre grense, som forskjellen mellom denne øvre grensen og halvparten av intervallet etter det (200-(400 -200):2=100).

I grupper med en nedre grense - summen av denne nedre grensen og halvparten av størrelsen på forrige intervall (800+(800-600):2=900).

Beregningen av gjennomsnittsverdien av salgbare produkter gjøres i henhold til formelen:

Хср = k × ((Σ ((x "-a): k) × f): Σf) + a. Her er en \u003d 500 størrelsen på alternativet med høyeste frekvens, k=600-400=200 - intervallstørrelse ved høyeste frekvens. La oss sette resultatet i en tabell:

Så, gjennomsnittlig verdi salgbare produkter for perioden under studiet som helhet er Xav = (-5:37) × 200 + 500 = 472,97 tusen rubler.

2) Vi finner dispersjonen ved å bruke følgende formel:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 \u003d 35,675,67-730,62 \u003d 34,945,05

3) standardavvik: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tusen rubler.

4) variasjonskoeffisient: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52%

Sannsynlighetsteori - spesiell seksjon matematikk, som bare studeres av studenter ved høyere utdanningsinstitusjoner. Elsker du beregninger og formler? Du er ikke redd for utsiktene til å bli kjent med normalfordelingen, ensembleentropi, matematisk forventning og diskret varians tilfeldig variabel? Da vil dette emnet være av stor interesse for deg. La oss ta en titt på noen av de viktigste enkle konsepter denne grenen av vitenskapen.

La oss huske det grunnleggende

Selv om du husker mest enkle konsepter sannsynlighetsteori, ikke overse de første avsnittene i artikkelen. Faktum er at uten en klar forståelse av det grunnleggende, vil du ikke kunne jobbe med formlene som er diskutert nedenfor.

Så det er noen tilfeldig hendelse, noe eksperiment. Som et resultat av de utførte handlingene kan vi få flere utfall – noen av dem er mer vanlige, andre mindre vanlige. Sannsynligheten for en hendelse er forholdet mellom antall faktisk mottatte utfall av en type til totalt antall mulig. Kun å vite klassisk definisjon av dette konseptet, kan du begynne å studere matematisk forventning og spredninger av kontinuerlige tilfeldige variabler.

Gjennomsnitt

Tilbake på skolen, i matematikktimene, begynte du å jobbe med det aritmetiske gjennomsnittet. Dette konseptet er mye brukt i sannsynlighetsteori, og derfor kan det ikke ignoreres. Det viktigste for oss dette øyeblikket er at vi vil møte det i formlene for den matematiske forventningen og variansen til en tilfeldig variabel.

Vi har en tallrekke og ønsker å finne det aritmetiske gjennomsnittet. Alt som kreves av oss er å summere alt tilgjengelig og dele på antall elementer i sekvensen. La oss ha tall fra 1 til 9. Summen av elementene blir 45, og vi deler denne verdien på 9. Svar: - 5.

Spredning

snakker vitenskapelig språk, variansen er den gjennomsnittlige kvadratet av avvikene til de oppnådde funksjonsverdiene fra det aritmetiske gjennomsnittet. Den ene er betegnet med en stor latinsk bokstav D. Hva trengs for å beregne den? For hvert element i sekvensen beregner vi forskjellen mellom det tilgjengelige tallet og det aritmetiske gjennomsnittet og kvadrerer det. Det vil være nøyaktig så mange verdier som det kan være utfall for arrangementet vi vurderer. Deretter oppsummerer vi alt mottatt og deler med antall elementer i sekvensen. Hvis vi har fem mulige utfall, så del på fem.

Variansen har også egenskaper som du må huske for å bruke den når du løser problemer. For eksempel, hvis den tilfeldige variabelen økes med X ganger, øker variansen med X ganger kvadratet (dvs. X*X). Den er aldri mindre enn null og avhenger ikke av skiftet av verdier med lik verdi opp eller ned. I tillegg for uavhengige tester variansen av summen er lik summen av variansene.

Nå må vi definitivt vurdere eksempler på variansen til en diskret tilfeldig variabel og den matematiske forventningen.

La oss si at vi kjører 21 eksperimenter og får 7 forskjellige utfall. Vi observerte hver av dem henholdsvis 1,2,2,3,4,4 og 5 ganger. Hva blir variansen?

Først beregner vi det aritmetiske gjennomsnittet: summen av elementene er selvfølgelig 21. Vi deler den på 7 og får 3. Nå trekker vi 3 fra hvert tall i den opprinnelige sekvensen, kvadrerer hver verdi og legger sammen resultatene . Det viser seg 12. Nå gjenstår det for oss å dele tallet på antall elementer, og det ser ut til at det er alt. Men det er en hake! La oss diskutere det.

Avhengighet av antall eksperimenter

Det viser seg at når man beregner variansen, kan nevneren være ett av to tall: enten N eller N-1. Her er N antall utførte eksperimenter eller antall elementer i sekvensen (som i hovedsak er det samme). Hva er det avhengig av?

Hvis antall tester måles i hundrevis, må vi sette N i nevneren, hvis i enheter, så N-1. Forskerne bestemte seg for å tegne grensen ganske symbolsk: i dag går den langs tallet 30. Hvis vi utførte mindre enn 30 eksperimenter, vil vi dele mengden med N-1, og hvis mer, så med N.

En oppgave

La oss gå tilbake til vårt eksempel på å løse varians- og forventningsproblemet. Vi fikk et mellomtall på 12, som måtte deles på N eller N-1. Siden vi utførte 21 eksperimenter, som er mindre enn 30, vil vi velge det andre alternativet. Så svaret er: variansen er 12 / 2 = 2.

Forventet verdi

La oss gå videre til det andre konseptet, som vi må vurdere i denne artikkelen. Den matematiske forventningen er resultatet av å legge til alle mulige utfall multiplisert med de tilsvarende sannsynlighetene. Det er viktig å forstå at den oppnådde verdien, så vel som resultatet av beregning av variansen, kun oppnås én gang for hele oppgaven, uansett hvor mange utfall den vurderer.

Den matematiske forventningsformelen er ganske enkel: vi tar utfallet, multipliserer det med sannsynligheten, legger til det samme for det andre, tredje resultatet osv. Alt relatert til dette konseptet er lett å beregne. For eksempel er summen av matematiske forventninger lik den matematiske forventningen til summen. Det samme gjelder for arbeidet. Slik enkle operasjoner langt fra enhver mengde i sannsynlighetsteorien lar oss oppfylle med den. La oss ta en oppgave og beregne verdien av to konsepter vi har studert samtidig. I tillegg ble vi distrahert av teori – det er på tide å øve.

Et eksempel til

Vi kjørte 50 forsøk og fikk 10 typer utfall - tall fra 0 til 9 - som dukket opp i forskjellige prosentdel. Disse er henholdsvis: 2 %, 10 %, 4 %, 14 %, 2 %, 18 %, 6 %, 16 %, 10 %, 18 %. Husk at for å få sannsynlighetene, må du dele prosentverdiene med 100. Dermed får vi 0,02; 0,1 osv. La oss presentere et eksempel på løsning av problemet for variansen til en tilfeldig variabel og den matematiske forventningen.

Vi beregner det aritmetiske gjennomsnittet ved å bruke formelen som vi husker med barneskole: 50/10 = 5.

La oss nå oversette sannsynlighetene til antall utfall "i stykker" for å gjøre det mer praktisk å telle. Vi får 1, 5, 2, 7, 1, 9, 3, 8, 5 og 9. Trekk det aritmetiske gjennomsnittet fra hver oppnådd verdi, hvoretter vi kvadrerer hvert av de oppnådde resultatene. Se hvordan du gjør dette med det første elementet som eksempel: 1 - 5 = (-4). Videre: (-4) * (-4) = 16. For andre verdier, gjør disse operasjonene selv. Hvis du gjorde alt riktig, får du 90 etter å ha lagt til alt.

La oss fortsette å beregne variansen og gjennomsnittet ved å dele 90 på N. Hvorfor velger vi N og ikke N-1? Det stemmer, fordi antall utførte eksperimenter overstiger 30. Altså: 90/10 = 9. Vi fikk spredningen. Hvis du får et annet nummer, fortvil ikke. Mest sannsynlig gjorde du en banal feil i beregningene. Dobbeltsjekk det du skrev, så faller alt på plass.

Til slutt, la oss huske den matematiske forventningsformelen. Vi vil ikke gi alle beregningene, vi vil bare skrive svaret som du kan sjekke etter å ha fullført alle nødvendige prosedyrer. Forventet verdi vil være 5,48. Vi husker bare hvordan du utfører operasjoner, ved å bruke eksemplet med de første elementene: 0 * 0,02 + 1 * 0,1 ... og så videre. Som du kan se, multipliserer vi ganske enkelt verdien av utfallet med sannsynligheten.

Avvik

Et annet konsept som er nært knyttet til spredning og matematisk forventning er standardavviket. Den er merket heller med latinske bokstaver sd, eller gresk liten "sigma". Dette konseptet viser hvordan verdiene i gjennomsnitt avviker fra den sentrale funksjonen. For å finne verdien må du beregne kvadratroten av variansen.

Hvis du lager en graf normal distribusjon og vil se direkte på den standardavvik, kan dette gjøres i flere trinn. Ta halvparten av bildet til venstre eller høyre for modusen (sentral verdi), tegn en vinkelrett på den horisontale aksen slik at arealene til de resulterende figurene er like. Verdien av segmentet mellom midten av fordelingen og den resulterende projeksjonen på den horisontale aksen vil være standardavviket.

Programvare

Som det fremgår av beskrivelsene av formlene og eksemplene som presenteres, er beregning av varians og matematisk forventning ikke den enkleste prosedyren fra et aritmetisk synspunkt. For ikke å kaste bort tid, er det fornuftig å bruke programmet som brukes i høyere utdanningsinstitusjoner- det heter "R". Den har funksjoner som lar deg beregne verdier for mange konsepter fra statistikk og sannsynlighetsteori.

For eksempel definerer du en vektor med verdier. Dette gjøres som følger: vektor<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Til slutt

Spredning og matematisk forventning er uten hvilke det er vanskelig å beregne noe i fremtiden. I hovedløpet av forelesninger ved universiteter vurderes de allerede i de første månedene av å studere emnet. Det er nettopp på grunn av manglende forståelse for disse enkle begrepene og manglende evne til å beregne dem at mange studenter umiddelbart begynner å falle bak i programmet og senere får dårlige karakterer på slutten av økten, noe som fratar dem stipend.

Øv minst en uke i en halvtime om dagen, løs oppgaver som ligner på de som er presentert i denne artikkelen. Deretter, på en hvilken som helst sannsynlighetsteoritest, vil du takle eksempler uten uvedkommende tips og jukseark.

Dispersjon i statistikk er definert som standardavviket til de individuelle verdiene til et trekk i kvadrat fra det aritmetiske gjennomsnittet. En vanlig måte å beregne kvadrerte avvik for alternativer fra gjennomsnittet og deretter gjennomsnittet av dem.

I økonomisk og statistisk analyse er det vanlig å evaluere variasjonen til en funksjon oftest ved å bruke standardavviket, som er kvadratroten av variansen.

(3)

Det karakteriserer den absolutte fluktuasjonen av verdiene til variabelattributtet og uttrykkes i de samme enhetene som variantene. I statistikk blir det ofte nødvendig å sammenligne variasjonen av ulike funksjoner. For slike sammenligninger brukes en relativ variasjonsindikator, variasjonskoeffisienten.

Dispersjonsegenskaper:

1) hvis du trekker et hvilket som helst tall fra alle alternativene, vil ikke variansen endres;

2) hvis alle verdiene til varianten er delt med et tall b, vil variansen reduseres med b^2 ganger, dvs.

3) hvis du beregner det gjennomsnittlige kvadratet av avvik fra et hvilket som helst tall med et ulikt aritmetisk gjennomsnitt, vil det være større enn variansen. I dette tilfellet, med en veldefinert verdi per kvadrat av forskjellen mellom gjennomsnittsverdien av pos.

Variansen kan defineres som forskjellen mellom gjennomsnittet i annen og gjennomsnittet i andre.

17. Gruppe- og intergruppevariasjoner. Avvikstilleggsregel

Hvis den statistiske populasjonen er delt inn i grupper eller deler i henhold til karakteristikken som studeres, kan følgende typer spredning beregnes for en slik populasjon: gruppe (privat), gruppegjennomsnitt (privat) og intergruppe.

Total varians- reflekterer variasjonen av en egenskap på grunn av alle forhold og årsaker som opererer i en gitt statistisk populasjon.

Gruppeavvik- er lik middelkvadraten av avvikene til individuelle verdier av attributtet i gruppen fra det aritmetiske gjennomsnittet for denne gruppen, kalt gruppemiddelet. I dette tilfellet er ikke gruppegjennomsnittet sammenfallende med det totale gjennomsnittet for hele befolkningen.

Gruppevarians gjenspeiler variasjonen av en egenskap kun på grunn av forholdene og årsakene som opererer i gruppen.

Gjennomsnittlig gruppeavvik- er definert som det vektede aritmetiske gjennomsnittet av gruppedispersjonene, med vektene som volumene til gruppene.

Intergruppevarians- er lik middelkvadraten av avvikene til gruppemiddelet fra det totale gjennomsnittet.

Intergroup varians karakteriserer variasjonen av det resulterende attributtet på grunn av grupperingsattributtet.

Det er et visst forhold mellom de betraktede typene dispersjoner: den totale spredningen er lik summen av gjennomsnittlig gruppe og intergruppespredning.

Denne relasjonen kalles variansaddisjonsregelen.

18. Dynamiske serier og dens bestanddeler. Typer av dynamiske serier.

Serie i statistikk- dette er digitale data som viser endringen i et fenomen i tid eller rom og som gjør det mulig å foreta en statistisk sammenligning av fenomener både i prosessen med deres utvikling i tid og i ulike former og typer prosesser. Takket være dette er det mulig å oppdage gjensidig avhengighet av fenomener.

Prosessen med utvikling av bevegelse av sosiale fenomener i tid i statistikk kalles vanligvis dynamikk. For å vise dynamikken bygges serier av dynamikk (kronologisk, tidsmessig), som er serier med tidsvarierende verdier av en statistisk indikator (for eksempel antall straffedømte over 10 år), ordnet i kronologisk rekkefølge. Deres bestanddeler er de numeriske verdiene til en gitt indikator og periodene eller tidspunktene de refererer til.

Den viktigste egenskapen til tidsserier- deres størrelse (volum, verdi) av dette eller det fenomenet, oppnådd i en viss periode eller ved et bestemt øyeblikk. Følgelig er størrelsen på vilkårene for serien av dynamikk nivået. Skille innledende, midtre og siste nivåer i den dynamiske serien. Første nivå viser verdien av det første, siste - verdien av det siste medlemmet i serien. Gjennomsnittlig nivå representerer det gjennomsnittlige kronologiske variasjonsområdet og beregnes avhengig av om tidsserien er intervall eller øyeblikkelig.

En annen viktig egenskap ved den dynamiske serien- tiden som har gått fra den første til den endelige observasjonen, eller antall slike observasjoner.

Det finnes ulike typer tidsserier, de kan klassifiseres i henhold til følgende kriterier.

1) Avhengig av måten å uttrykke nivåer på, er seriene med dynamikk delt inn i serier av absolutte og avledede indikatorer (relative og gjennomsnittlige verdier).

2) Avhengig av hvordan nivåene i serien uttrykker fenomenets tilstand på bestemte tidspunkter (i begynnelsen av måneden, kvartalet, året osv.) eller verdien for bestemte tidsintervaller (for eksempel per dag, måned, år osv.) n.), skille mellom henholdsvis moment- og intervallserier av dynamikk. Momentserier i det analytiske arbeidet til rettshåndhevende organer brukes relativt sjelden.

I statistikkteorien skilles dynamikk også ut i henhold til en rekke andre klassifiseringstrekk: avhengig av avstanden mellom nivåene - med ekvidistante nivåer og ulik nivå i tid; avhengig av tilstedeværelsen av hovedtrenden i prosessen som studeres - stasjonær og ikke-stasjonær. Når du analyserer dynamiske serier, presenteres følgende nivåer i serien som komponenter:

Y t \u003d TP + E (t)

der TR er en deterministisk komponent som bestemmer den generelle trenden for endring over tid eller en trend.

E (t) er en tilfeldig komponent som forårsaker nivåsvingninger.

La oss regne innMSUTMERKEvarians og standardavvik for utvalget. Vi beregner også variansen til en tilfeldig variabel hvis fordelingen er kjent.

Vurder først spredning, deretter standardavvik.

Prøveavvik

Prøveavvik (prøveavvik,prøveforskjell) karakteriserer spredningen av verdier i matrisen i forhold til .

Alle 3 formlene er matematisk likeverdige.

Det kan sees fra den første formelen at prøveavvik er summen av kvadrerte avvik for hver verdi i matrisen fra gjennomsnittet delt på prøvestørrelsen minus 1.

spredning prøver funksjonen DISP() brukes, eng. navnet på VAR, dvs. Forskjell. Siden MS EXCEL 2010, anbefales det å bruke dens analoge DISP.V() , eng. navnet VARS, dvs. Eksempelvarians. I tillegg, fra og med versjonen av MS EXCEL 2010, er det en DISP.G () funksjon, eng. VARP-navn, dvs. BefolkningsVARIanse som beregner spredning til befolkning. Hele forskjellen kommer ned til nevneren: i stedet for n-1 som DISP.V() , har DISP.G() bare n i nevneren. Før MS EXCEL 2010 ble VARP()-funksjonen brukt til å beregne populasjonsvariansen.

Prøveavvik
=FIRKANT(Sample)/(ANTALL(Sample)-1)
=(SUMSQ(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/ (COUNT(Sample)-1)- den vanlige formelen
=SUM((Sample -AVERAGE(Sample))^2)/ (ANTALL(Sample)-1) –

Prøveavvik er lik 0 bare hvis alle verdier er like med hverandre og følgelig er like middelverdi. Vanligvis, jo høyere verdi spredning, jo større spredning av verdier i matrisen.

Prøveavvik er et punktestimat spredning fordeling av den tilfeldige variabelen som prøve. Om bygging konfidensintervaller ved evaluering spredning kan leses i artikkelen.

Varians av en tilfeldig variabel

Å beregne spredning tilfeldig variabel, du må vite det.

Til spredning tilfeldig variabel X bruker ofte notasjonen Var(X). Spredning er lik kvadratet av avviket fra gjennomsnittet E(X): Var(X)=E[(X-E(X)) 2 ]

spredning beregnet med formelen:

hvor x i er verdien som den tilfeldige variabelen kan ta, og μ er gjennomsnittsverdien (), p(x) er sannsynligheten for at den tilfeldige variabelen vil ta verdien x.

Hvis den tilfeldige variabelen har , da spredning beregnet med formelen:

Dimensjon spredning tilsvarer kvadratet på måleenheten til de opprinnelige verdiene. For eksempel, hvis verdiene i prøven er målinger av vekten til delen (i kg), vil dimensjonen til variansen være kg 2 . Dette kan derfor være vanskelig å tolke for å karakterisere spredningen av verdier, en verdi lik kvadratroten av spredningstandardavvik.

Noen eiendommer spredning:

Var(X+a)=Var(X), der X er en tilfeldig variabel og a er en konstant.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Denne spredningsegenskapen brukes i artikkel om lineær regresjon.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), hvor X og Y er tilfeldige variabler, er Cov(X;Y) kovariansen til disse tilfeldige variablene.

Hvis tilfeldige variabler er uavhengige, så deres kovarians er 0, og derfor Var(X+Y)=Var(X)+Var(Y). Denne egenskapen til variansen brukes i utdataene.

La oss vise at for uavhengige størrelser Var(X-Y)=Var(X+Y). Faktisk, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Denne egenskapen til variansen brukes til å plotte .

Eksempel på standardavvik

Eksempel på standardavvik er et mål på hvor vidt spredt verdiene i prøven er i forhold til deres .

Per definisjon, standardavvik er lik kvadratroten av spredning:

Standardavvik tar ikke hensyn til størrelsen på verdiene i prøvetaking, men bare graden av spredning av verdier rundt dem midten. La oss ta et eksempel for å illustrere dette.

La oss beregne standardavviket for 2 prøver: (1; 5; 9) og (1001; 1005; 1009). I begge tilfeller er s=4. Det er åpenbart at forholdet mellom standardavviket og verdiene til matrisen er betydelig forskjellig for prøvene. For slike tilfeller, bruk Variasjonskoeffisienten(Variasjonskoeffisient, CV) - forhold standardavvik til gjennomsnittet aritmetikk, uttrykt i prosent.

I MS EXCEL 2007 og tidligere versjoner for beregning Eksempel på standardavvik funksjonen =STDEV() brukes, eng. navnet STDEV, dvs. standardavvik. Siden MS EXCEL 2010 anbefales det å bruke dens analoge = STDEV.B () , eng. navn STDEV.S, dvs. Eksempel på standardavvik.

I tillegg, fra og med versjonen av MS EXCEL 2010, er det en funksjon STDEV.G () , eng. navn STDEV.P, dvs. Populasjonsstandard DEViation som beregner standardavvik til befolkning. Hele forskjellen kommer ned til nevneren: i stedet for n-1 som STDEV.V() , har STDEV.G() bare n i nevneren.

Standardavvik kan også beregnes direkte fra formlene nedenfor (se eksempelfil)
=SQRT(SQUADROTIV(Sample)/(COUNT(Sample)-1))
=SQRT((SUMSQ(Sample)-COUNT(Sample)*AVERAGE(Sample)^2)/(COUNT(Sample)-1))

Andre spredningstiltak

SQUADRIVE()-funksjonen beregner med umm av kvadrerte avvik av verdier fra deres midten. Denne funksjonen vil returnere det samme resultatet som formelen =VAR.G( Prøve)*KRYSS AV( Prøve) , hvor Prøve- en referanse til et område som inneholder en rekke prøveverdier (). Beregninger i QUADROTIV()-funksjonen gjøres i henhold til formelen:

SROOT()-funksjonen er også et mål på spredningen til et sett med data. SIROTL()-funksjonen beregner gjennomsnittet av de absolutte verdiene av avvikene til verdier fra midten. Denne funksjonen vil returnere samme resultat som formelen =SUMPRODUKT(ABS(Sample-AVERAGE(Sample)))/ANTALL(Sample), hvor Prøve- en referanse til et område som inneholder en rekke utvalgsverdier.

Beregninger i funksjonen SROOTKL () gjøres i henhold til formelen: