Biografier Kjennetegn Analyse

Gjennomsnittsverdi mellom to tall. Vektet gjennomsnitt - hva er det og hvordan beregnes det? Beregning av gjennomsnittsverdien etter tilstand

Dette begrepet har andre betydninger, se gjennomsnittsbetydningen.

Gjennomsnitt(i matematikk og statistikk) sett med tall - summen av alle tall delt på antallet. Det er et av de vanligste målene for sentral tendens.

Det ble foreslått (sammen med det geometriske gjennomsnittet og det harmoniske gjennomsnittet) av pytagoreerne.

Spesielle tilfeller av det aritmetiske gjennomsnittet er gjennomsnittet (av den generelle populasjonen) og utvalgets gjennomsnitt (av utvalgene).

Introduksjon

Angi settet med data X = (x 1 , x 2 , …, x n), så er prøvegjennomsnittet vanligvis angitt med en horisontal strek over variabelen (x ¯ (\displaystyle (\bar (x))), uttalt " x med strek").

Den greske bokstaven μ brukes for å betegne det aritmetiske gjennomsnittet av hele befolkningen. For en tilfeldig variabel som det er definert en middelverdi for, er μ sannsynlighetsmiddel eller den matematiske forventningen til en tilfeldig variabel. Hvis settet X er en samling av tilfeldige tall med et sannsynlighetsmiddel μ, deretter for en hvilken som helst prøve x Jeg fra denne samlingen μ = E( x Jeg) er forventningen til denne prøven.

I praksis er forskjellen mellom μ og x ¯ (\displaystyle (\bar (x))) at μ er en typisk variabel fordi du kan se utvalget i stedet for hele populasjonen. Derfor, hvis utvalget er representert tilfeldig (i form av sannsynlighetsteori), kan x ¯ (\displaystyle (\bar (x))) (men ikke μ) behandles som en tilfeldig variabel med en sannsynlighetsfordeling på utvalget ( sannsynlighetsfordeling av gjennomsnittet).

Begge disse mengdene beregnes på samme måte:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Hvis en X er en tilfeldig variabel, deretter den matematiske forventningen X kan betraktes som det aritmetiske gjennomsnittet av verdiene i gjentatte målinger av mengden X. Dette er en manifestasjon av loven om store tall. Derfor brukes prøvegjennomsnittet for å estimere den ukjente matematiske forventningen.

I elementær algebra er det bevist at gjennomsnittet n+ 1 tall over gjennomsnittet n tall hvis og bare hvis det nye tallet er større enn det gamle gjennomsnittet, mindre hvis og bare hvis det nye tallet er mindre enn gjennomsnittet, og endres ikke hvis og bare hvis det nye tallet er lik gjennomsnittet. Jo mer n, jo mindre er forskjellen mellom de nye og gamle gjennomsnittene.

Legg merke til at det er flere andre "midler" tilgjengelig, inkludert kraftlovens middelverdi, Kolmogorov-middelverdien, harmonisk middelverdi, aritmetisk-geometrisk middelverdi og ulike vektede middelverdier (f. .

Eksempler

  • For tre tall må du legge dem til og dele på 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • For fire tall må du legge dem til og dele på 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Eller lettere 5+5=10, 10:2. Fordi vi la til 2 tall, som betyr at hvor mange tall vi legger til, deler vi på så mye.

Kontinuerlig tilfeldig variabel

For en kontinuerlig distribuert verdi f (x) (\displaystyle f(x)) er det aritmetiske gjennomsnittet på intervallet [ a ; b ] (\displaystyle ) er definert via en bestemt integral:

F (x) ¯ [a; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Noen problemer med å bruke gjennomsnittet

Mangel på robusthet

Hovedartikkel: Robusthet i statistikk

Selv om det aritmetiske gjennomsnittet ofte brukes som middel eller sentrale trender, gjelder ikke dette konseptet for robust statistikk, som betyr at det aritmetiske gjennomsnittet er sterkt påvirket av "store avvik". Det er bemerkelsesverdig at for fordelinger med stor skjevhet, kan det aritmetiske gjennomsnittet ikke samsvare med begrepet "gjennomsnitt", og verdiene av gjennomsnittet fra robust statistikk (for eksempel medianen) kan bedre beskrive den sentrale trenden.

Det klassiske eksemplet er beregningen av gjennomsnittsinntekten. Det aritmetiske gjennomsnittet kan feiltolkes som en median, noe som kan føre til konklusjonen at det er flere med mer inntekt enn det egentlig er. «Mean» inntekt tolkes slik at de flestes inntekter er nær dette tallet. Denne "gjennomsnittlige" (i betydningen det aritmetiske gjennomsnittet) inntekten er høyere enn inntekten til folk flest, siden en høy inntekt med stort avvik fra gjennomsnittet gjør det aritmetiske gjennomsnittet sterkt skjevt (i motsetning til dette "motstår" medianinntekten) en slik skjevhet). Denne «gjennomsnittlige» inntekten sier imidlertid ingenting om antall personer i nærheten av medianinntekten (og sier ingenting om antall personer nær den modale inntekten). Men hvis begrepene «gjennomsnitt» og «flertall» tas lett på, så kan man feilaktig konkludere med at folk flest har høyere inntekter enn de faktisk er. For eksempel vil en rapport om "gjennomsnittlig" nettoinntekt i Medina, Washington, beregnet som det aritmetiske gjennomsnittet av alle årlige nettoinntekter til innbyggere, gi et overraskende høyt tall på grunn av Bill Gates. Tenk på prøven (1, 2, 2, 2, 3, 9). Det aritmetiske gjennomsnittet er 3,17, men fem av de seks verdiene er under dette gjennomsnittet.

Sammensatt rente

Hovedartikkel: ROI

Hvis tall multiplisere, men ikke brette, må du bruke det geometriske gjennomsnittet, ikke det aritmetiske gjennomsnittet. Oftest skjer denne hendelsen når man beregner avkastningen på investeringen i finans.

For eksempel, hvis aksjer falt 10 % det første året og steg 30 % i det andre året, er det feil å beregne den "gjennomsnittlige" økningen over disse to årene som det aritmetiske gjennomsnittet (−10 % + 30 %) / 2 = 10%; det riktige gjennomsnittet i dette tilfellet er gitt av den sammensatte årlige vekstraten, hvorfra den årlige veksten bare er ca. 8,16653826392% ≈ 8,2%.

Grunnen til dette er at prosenter har et nytt utgangspunkt hver gang: 30 % er 30 % fra et tall mindre enn prisen ved begynnelsen av det første året: hvis aksjen startet på $30 og falt 10%, er den verdt $27 ved starten av det andre året. Hvis aksjen er opp 30%, er den verdt $35,1 ved slutten av det andre året. Det aritmetiske gjennomsnittet av denne veksten er 10 %, men siden aksjen kun har vokst med $5,1 på 2 år, gir en gjennomsnittlig økning på 8,2% et sluttresultat på $35,1:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $35,1]. Hvis vi bruker det aritmetiske gjennomsnittet på 10 % på samme måte, får vi ikke den faktiske verdien: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Rentesammensatt ved utgangen av år 2: 90 % * 130 % = 117 % , dvs. en total økning på 17 %, og gjennomsnittlig årlig rentes rente er 117 % ≈ 108,2 % (\displaystyle (\sqrt (117\%)) \ca. 108,2\%) , det vil si en gjennomsnittlig årlig økning på 8,2%.

Veibeskrivelse

Hovedartikkel: Destinasjonsstatistikk

Ved beregning av det aritmetiske gjennomsnittet av en variabel som endres syklisk (for eksempel fase eller vinkel), bør det utvises spesiell forsiktighet. For eksempel vil gjennomsnittet av 1° og 359° være 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Dette tallet er feil av to grunner.

  • For det første er vinkelmål bare definert for området fra 0° til 360° (eller fra 0 til 2π når det måles i radianer). Dermed kan det samme tallparet skrives som (1° og −1°) eller som (1° og 719°). Gjennomsnittene for hvert par vil være forskjellige: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ ))))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • For det andre, i dette tilfellet, vil en verdi på 0° (tilsvarer 360°) være det geometrisk beste gjennomsnittet, siden tallene avviker mindre fra 0° enn fra noen annen verdi (verdi 0° har den minste variansen). Sammenligne:
    • tallet 1° avviker fra 0° med bare 1°;
    • tallet 1° avviker fra det beregnede gjennomsnittet på 180° ganger 179°.

Gjennomsnittsverdien for en syklisk variabel, beregnet i henhold til formelen ovenfor, vil bli kunstig forskjøvet i forhold til det reelle gjennomsnittet til midten av det numeriske området. På grunn av dette beregnes gjennomsnittet på en annen måte, nemlig tallet med den minste variansen (midtpunkt) er valgt som gjennomsnittsverdi. Dessuten, i stedet for å subtrahere, brukes modulo-avstand (dvs. periferisk avstand). For eksempel er den modulære avstanden mellom 1° og 359° 2°, ikke 358° (på en sirkel mellom 359° og 360°==0° - én grad, mellom 0° og 1° - også 1°, totalt -2°).

Typer gjennomsnittsverdier og metoder for deres beregning

På stadiet av statistisk behandling kan en rekke forskningsoppgaver settes, for løsningen som det er nødvendig å velge riktig gjennomsnitt. I dette tilfellet er det nødvendig å bli veiledet av følgende regel: verdiene som representerer telleren og nevneren til gjennomsnittet må være logisk relatert til hverandre.

  • kraftgjennomsnitt;
  • strukturelle gjennomsnitt.

La oss introdusere følgende notasjon:

Verdiene som gjennomsnittet er beregnet for;

Gjennomsnitt, der linjen ovenfor indikerer at gjennomsnittet av individuelle verdier finner sted;

Frekvens (repeterbarhet av individuelle egenskapsverdier).

Ulike midler er avledet fra den generelle potensmiddelformelen:

(5.1)

for k = 1 - aritmetisk gjennomsnitt; k = -1 - harmonisk gjennomsnitt; k = 0 - geometrisk gjennomsnitt; k = -2 - rotmiddelkvadrat.

Gjennomsnitt er enten enkle eller vektede. vektede gjennomsnitt kalles mengder som tar hensyn til at noen varianter av verdiene til attributtet kan ha forskjellige tall, og derfor må hver variant multipliseres med dette tallet. Med andre ord er «vektene» antall befolkningsenheter i ulike grupper, dvs. hvert alternativ er "vektet" etter sin frekvens. Frekvensen f kalles statistisk vekt eller veiing gjennomsnitt.

Aritmetisk gjennomsnitt- den vanligste typen medium. Den brukes når beregningen utføres på ugrupperte statistiske data, hvor du ønsker å få gjennomsnittlig summand. Det aritmetiske gjennomsnittet er en slik gjennomsnittsverdi av en funksjon, ved mottak av hvilken det totale volumet av funksjonen i populasjonen forblir uendret.

Den aritmetiske gjennomsnittsformelen ( enkel) har formen

hvor n er populasjonsstørrelsen.

For eksempel beregnes gjennomsnittslønnen til ansatte i en bedrift som det aritmetiske gjennomsnittet:

De avgjørende indikatorene her er lønnen til hver ansatt og antall ansatte i bedriften. Ved beregning av gjennomsnittet forble den totale lønnen den samme, men fordelte seg så å si likt på alle arbeidere. For eksempel er det nødvendig å beregne gjennomsnittslønnen til ansatte i et lite selskap der 8 personer er ansatt:

Ved beregning av gjennomsnitt kan individuelle verdier av attributtet som gjennomsnittsberegnes, gjentas, så gjennomsnittet beregnes ved hjelp av grupperte data. I dette tilfellet snakker vi om å bruke aritmetisk gjennomsnitt vektet, som ser ut som

(5.3)

Så vi må beregne den gjennomsnittlige aksjekursen til et aksjeselskap på børsen. Det er kjent at transaksjoner ble utført innen 5 dager (5 transaksjoner), antall aksjer solgt til salgskurs ble fordelt som følger:

1 - 800 ac. - 1010 rubler

2 - 650 ac. - 990 gni.

3 - 700 ak. - 1015 rubler.

4 - 550 ac. - 900 gni.

5 - 850 ak. - 1150 rubler.

Det første forholdet for å bestemme gjennomsnittlig aksjekurs er forholdet mellom det totale antallet transaksjoner (TCA) og antall solgte aksjer (KPA):

OSS = 1010 800+990 650+1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

I dette tilfellet var gjennomsnittlig aksjekurs lik

Det er nødvendig å kjenne egenskapene til det aritmetiske gjennomsnittet, som er veldig viktig både for bruken og for beregningen. Det er tre hovedegenskaper som mest av alt førte til utbredt bruk av det aritmetiske gjennomsnittet i statistiske og økonomiske beregninger.

Eiendom en (null): summen av positive avvik av individuelle verdier av en egenskap fra middelverdien er lik summen av negative avvik. Dette er en veldig viktig egenskap, siden den viser at eventuelle avvik (både med + og med -) på grunn av tilfeldige årsaker vil bli gjensidig kansellert.

Bevis:

Eiendom to (minimum): summen av kvadrerte avvik av de individuelle verdiene til egenskapen fra det aritmetiske gjennomsnittet er mindre enn fra noe annet tall (a), dvs. er minimumsantallet.

Bevis.

Komponer summen av kvadrerte avvik fra variabelen a:

(5.4)

For å finne ekstremumet til denne funksjonen, er det nødvendig å likestille dens deriverte med hensyn til a til null:

Herfra får vi:

(5.5)

Derfor nås ekstremumet av summen av kvadrerte avvik ved . Dette ekstremumet er minimum, siden funksjonen ikke kan ha et maksimum.

Eiendom tre: det aritmetiske gjennomsnittet av en konstant er lik denne konstanten: at a = const.

I tillegg til disse tre viktigste egenskapene til det aritmetiske gjennomsnittet finnes det såkalte designegenskaper, som gradvis mister sin betydning på grunn av bruken av elektroniske datamaskiner:

  • hvis den individuelle verdien av attributtet til hver enhet multipliseres eller divideres med et konstant tall, vil det aritmetiske gjennomsnittet øke eller reduseres med samme beløp;
  • det aritmetiske gjennomsnittet vil ikke endres hvis vekten (frekvensen) av hver funksjonsverdi er delt med et konstant tall;
  • hvis de individuelle verdiene av attributtet til hver enhet reduseres eller økes med samme beløp, vil det aritmetiske gjennomsnittet reduseres eller økes med samme beløp.

Gjennomsnittlig harmonisk. Dette gjennomsnittet kalles det resiproke aritmetiske gjennomsnittet, siden denne verdien brukes når k = -1.

Enkelt harmonisk middel brukes når vektene til de karakteristiske verdiene er de samme. Formelen kan avledes fra basisformelen ved å erstatte k = -1:

For eksempel må vi beregne gjennomsnittshastigheten til to biler som har kjørt samme vei, men med forskjellige hastigheter: den første ved 100 km/t, den andre ved 90 km/t. Ved å bruke den harmoniske middelmetoden beregner vi gjennomsnittshastigheten:

I statistisk praksis brukes oftere harmonisk vektet, hvis formel har formen

Denne formelen brukes i tilfeller der vektene (eller volumene av fenomener) for hver attributt ikke er like. I det opprinnelige forholdet er telleren kjent for å beregne gjennomsnittet, men nevneren er ukjent.

Når vi for eksempel beregner gjennomsnittsprisen, må vi bruke forholdet mellom solgt beløp og antall solgte enheter. Vi vet ikke antall solgte enheter (vi snakker om forskjellige varer), men vi vet summen av salg av disse forskjellige varene. Anta at du vil finne ut gjennomsnittsprisen på solgte varer:

Vi får

Geometrisk gjennomsnitt. Oftest finner det geometriske gjennomsnittet sin anvendelse ved å bestemme den gjennomsnittlige vekstraten (gjennomsnittlig vekstrater), når de individuelle verdiene av egenskapen presenteres som relative verdier. Den brukes også hvis det er nødvendig å finne gjennomsnittet mellom minimums- og maksimumsverdiene til en karakteristikk (for eksempel mellom 100 og 1000000). Det finnes formler for enkelt og vektet geometrisk gjennomsnitt.

For en enkel geometrisk gjennomsnitt

For det vektede geometriske gjennomsnittet

RMS. Hovedomfanget av dens anvendelse er måling av variasjonen av en egenskap i befolkningen (beregning av standardavviket).

Enkel rotmiddelkvadratformel

Vektet Root Mean Square Formel

(5.11)

Som et resultat kan vi si at den vellykkede løsningen av problemene med statistisk forskning avhenger av riktig valg av typen gjennomsnittsverdi i hvert enkelt tilfelle. Valget av gjennomsnittet forutsetter følgende rekkefølge:

a) etablering av en generaliserende indikator for befolkningen;

b) bestemmelse av et matematisk forhold mellom verdier for en gitt generaliserende indikator;

c) erstatning av individuelle verdier med gjennomsnittsverdier;

d) beregning av gjennomsnittet ved hjelp av tilsvarende ligning.

Middelverdier og variasjon

gjennomsnittlig verdi- dette er en generaliserende indikator som karakteriserer en kvalitativt homogen populasjon i henhold til en viss kvantitativ egenskap. For eksempel gjennomsnittsalderen på personer som er dømt for tyveri.

I rettsstatistikk brukes gjennomsnitt for å karakterisere:

Gjennomsnittlige betingelser for behandling av saker i denne kategorien;

Middels størrelse krav;

Gjennomsnittlig antall tiltalte per sak;

Gjennomsnittlig skademengde;

Gjennomsnittlig arbeidsmengde for dommere mv.

Gjennomsnittsverdien er alltid navngitt og har samme dimensjon som attributtet til en egen enhet av populasjonen. Hver gjennomsnittsverdi karakteriserer den studerte populasjonen i henhold til en hvilken som helst varierende attributt, derfor, bak ethvert gjennomsnitt, er det en rekke fordelinger av enheter av denne populasjonen i henhold til den studerte attributten. Valget av typen gjennomsnitt bestemmes av innholdet i indikatoren og de første dataene for beregning av gjennomsnittet.

Alle typer gjennomsnitt som brukes i statistiske studier faller inn i to kategorier:

1) effektgjennomsnitt;

2) strukturelle gjennomsnitt.

Den første kategorien av gjennomsnitt inkluderer: aritmetisk gjennomsnitt, harmonisk gjennomsnitt, geometrisk gjennomsnitt og rot betyr kvadrat . Den andre kategorien er mote og median. Dessuten kan hver av de listede typene effektgjennomsnitt ha to former: enkel og vektet . Den enkle formen for gjennomsnittet brukes for å få gjennomsnittet av egenskapen som studeres når beregningen er basert på ugruppert statistikk, eller når hver variant forekommer bare én gang i populasjonen. Vektet gjennomsnitt kalles verdier som tar hensyn til at alternativene for verdiene til en funksjon kan ha forskjellige tall, og derfor må hvert alternativ multipliseres med den tilsvarende frekvensen. Med andre ord blir hvert alternativ "veid" av sin frekvens. Frekvensen kalles den statistiske vekten.

enkel aritmetisk gjennomsnitt- den vanligste typen medium. Det er lik summen av individuelle karakteristiske verdier delt på det totale antallet av disse verdiene:

,

hvor x 1, x 2, …, x N er de individuelle verdiene til den variable egenskapen (alternativer), og N er antall populasjonsenheter.

Aritmetisk vektet gjennomsnitt brukes når dataene presenteres i form av distribusjonsserier eller grupperinger. Det beregnes som summen av produktene til alternativene og deres tilsvarende frekvenser, delt på summen av frekvensene til alle alternativene:

hvor x i- mening Jeg–te varianter av funksjonen; fi- Frekvens Jeg-alternativene.

Dermed blir hver variantverdi vektet etter sin frekvens, og det er grunnen til at frekvensene noen ganger kalles statistiske vekter.

Kommentar. Når det gjelder det aritmetiske gjennomsnittet uten å spesifisere typen, menes det enkle aritmetiske gjennomsnittet.

Tabell 12

Løsning. For beregningen bruker vi formelen for det aritmetiske vektede gjennomsnittet:

Det er altså i gjennomsnitt to tiltalte per straffesak.

Hvis beregningen av gjennomsnittsverdien utføres i henhold til data gruppert i form av intervallfordelingsserier, må du først bestemme medianverdiene for hvert intervall x "i, deretter beregne gjennomsnittsverdien ved å bruke den vektede aritmetisk middelformel, der x" i er erstattet i stedet for x i.

Eksempel. Data om alderen til kriminelle som er dømt for tyveri er presentert i tabellen:

Tabell 13

Bestem gjennomsnittsalderen for kriminelle som er dømt for tyveri.

Løsning. For å bestemme gjennomsnittsalderen til kriminelle basert på intervallvariasjonsserien, må du først finne medianverdiene til intervallene. Siden en intervallserie med åpne første og siste intervaller er gitt, blir verdiene til disse intervallene tatt lik verdiene til tilstøtende lukkede intervaller. I vårt tilfelle er verdien av det første og siste intervallet 10.

Nå finner vi gjennomsnittsalderen til kriminelle ved å bruke den vektede aritmetiske gjennomsnittsformelen:

Dermed er gjennomsnittsalderen for lovbrytere som er dømt for tyveri cirka 27 år.

Gjennomsnittlig harmonisk enkel er det resiproke av det aritmetiske gjennomsnittet av de gjensidige verdiene til attributtet:

hvor 1/ x i er de gjensidige verdiene til variantene, og N er antall befolkningsenheter.

Eksempel. For å fastslå gjennomsnittlig årlig arbeidsmengde for dommere ved en tingrett ved behandling av straffesaker, ble det gjennomført en kartlegging av arbeidsmengden til 5 dommere ved denne domstolen. Gjennomsnittlig tid brukt på én straffesak for hver av de undersøkte dommerne viste seg å være lik (i dager): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Finn gjennomsnittskostnadene for én straffesak og gjennomsnittlig årlig arbeidsbelastning på dommerne i denne tingretten ved behandling av straffesaker.

Løsning. For å bestemme gjennomsnittlig tid brukt på en straffesak, bruker vi den harmoniske enkle formelen:

For å forenkle beregningene i eksemplet, la oss ta antall dager i et år lik 365, inkludert helger (dette påvirker ikke beregningsmetoden, og når man beregner en lignende indikator i praksis, er det nødvendig å erstatte antall arbeidere dager i et bestemt år i stedet for 365 dager). Da vil gjennomsnittlig årlig arbeidsmengde for dommere i denne tingretten ved behandling av straffesaker være: 365 (dager): 5,56 ≈ 65,6 (saker).

Hvis vi brukte den enkle aritmetiske gjennomsnittsformelen for å bestemme gjennomsnittlig tid brukt på en straffesak, ville vi fått:

365 (dager): 5,64 ≈ 64,7 (tilfeller), dvs. gjennomsnittlig arbeidsmengde for dommere var mindre.

La oss sjekke gyldigheten av denne tilnærmingen. For å gjøre dette bruker vi data om tid brukt på én straffesak for hver dommer og beregner antall straffesaker behandlet av hver av dem per år.

Vi får deretter:

365(dager) : 6 ≈ 61 (tilfelle), 365(dager) : 5,6 ≈ 65,2 (tilfelle), 365(dager) : 6,3 ≈ 58 (tilfelle),

365(dager) : 4,9 ≈ 74,5 (tilfeller), 365(dager) : 5,4 ≈ 68 (tilfeller).

Nå beregner vi gjennomsnittlig årlig arbeidsmengde for dommere i denne tingretten når de vurderer straffesaker:

De. den gjennomsnittlige årlige belastningen er den samme som ved bruk av det harmoniske gjennomsnittet.

Dermed er bruken av det aritmetiske gjennomsnittet i dette tilfellet ulovlig.

I tilfeller der variantene av en funksjon er kjent, deres volumetriske verdier (produktet av variantene etter frekvens), men selve frekvensene er ukjente, brukes den harmoniske vektede gjennomsnittsformelen:

,

hvor x i er verdiene til egenskapsvariantene, og w i er de volumetriske verdiene til variantene ( w i = x i f i).

Eksempel. Data om prisen på en enhet av samme type varer produsert av ulike institusjoner i kriminalomsorgen, og om volumet av implementeringen er gitt i tabell 14.

Tabell 14

Finn den gjennomsnittlige salgsprisen på produktet.

Løsning. Ved beregning av gjennomsnittsprisen må vi bruke forholdet mellom solgt beløp og antall solgte enheter. Vi vet ikke antall solgte enheter, men vi vet mengden varesalg. Derfor, for å finne gjennomsnittsprisen på solgte varer, bruker vi den harmoniske vektede gjennomsnittsformelen. Vi får

Hvis du bruker den aritmetiske gjennomsnittsformelen her, kan du få en gjennomsnittspris som vil være urealistisk:

Geometrisk gjennomsnitt beregnes ved å trekke ut roten av grad N fra produktet av alle verdiene av funksjonsalternativene:

hvor x 1, x 2, …, x N er de individuelle verdiene til den variable egenskapen (alternativer), og

N er antall befolkningsenheter.

Denne typen gjennomsnitt brukes til å beregne gjennomsnittlig vekstrate for tidsserier.

rot betyr kvadrat brukes til å beregne standardavviket, som er en indikator på variasjon, og vil bli diskutert nedenfor.

For å bestemme befolkningens struktur brukes spesielle gjennomsnitt, som inkluderer median og mote , eller de såkalte strukturelle gjennomsnittene. Hvis det aritmetiske gjennomsnittet beregnes basert på bruken av alle varianter av attributtverdiene, karakteriserer medianen og modusen verdien av varianten som inntar en viss gjennomsnittlig plassering i den rangerte (ordnede) serien. Rekkefølgen av enheter i den statistiske populasjonen kan utføres i stigende eller synkende rekkefølge av variantene av egenskapen som studeres.

Median (meg) er verdien som tilsvarer varianten i midten av den rangerte serien. Dermed er medianen den varianten av den rangerte serien, på begge sider som det i denne serien skal være like mange befolkningsenheter.

For å finne medianen må du først bestemme serienummeret i den rangerte serien ved å bruke formelen:

hvor N er volumet av serien (antall populasjonsenheter).

Hvis serien består av et oddetall medlemmer, er medianen lik varianten med tallet N Me . Hvis serien består av et partall av medlemmer, er medianen definert som det aritmetiske gjennomsnittet av to tilstøtende alternativer plassert i midten.

Eksempel. Gitt en rangert serie 1, 2, 3, 3, 6, 7, 9, 9, 10. Volumet av serien er N = 9, som betyr N Me = (9 + 1) / 2 = 5. Derfor, Me = 6, dvs. femte alternativ. Hvis en rad er gitt 1, 5, 7, 9, 11, 14, 15, 16, dvs. serie med et partall av medlemmer (N = 8), deretter N Me = (8 + 1) / 2 = 4,5. Så medianen er lik halvparten av summen av det fjerde og femte alternativet, dvs. Meg = (9 + 11) / 2 = 10.

I en diskret variasjonsserie bestemmes medianen av de akkumulerte frekvensene. Variantfrekvenser, som starter med den første, summeres til mediantallet er overskredet. Verdien av de siste summerte alternativene vil være medianen.

Eksempel. Finn median antall tiltalte per straffesak ved å bruke dataene i tabell 12.

Løsning. I dette tilfellet er volumet av variasjonsserien N = 154, derfor er N Me = (154 + 1) / 2 = 77,5. Oppsummerer frekvensene til det første og andre alternativet, får vi: 75 + 43 = 118, dvs. vi har passert mediantallet. Så meg = 2.

I intervallvariasjonsserien til fordelingen, angi først intervallet som medianen vil ligge i. Han blir kalt median . Dette er det første intervallet hvis kumulative frekvens overstiger halvparten av volumet av intervallvariasjonsserien. Deretter bestemmes den numeriske verdien av medianen av formelen:

hvor x meg er den nedre grensen for medianintervallet; i er verdien av medianintervallet; S Me-1 er den kumulative frekvensen til intervallet som går foran medianen; f meg er frekvensen til medianintervallet.

Eksempel. Finn medianalderen for lovbrytere som er dømt for tyveri, basert på statistikken presentert i tabell 13.

Løsning. Statistiske data er representert ved en intervallvariasjonsserie, som betyr at vi først bestemmer medianintervallet. Volumet av populasjonen N = 162, derfor er medianintervallet intervallet 18-28, fordi dette er det første intervallet, hvis akkumulerte frekvens (15 + 90 = 105) overstiger halvparten av volumet (162: 2 = 81) av intervallvariasjonsserien. Nå er den numeriske verdien av medianen bestemt av formelen ovenfor:

Dermed er halvparten av de tyveridømte under 25 år.

Mote (Mo) navngi verdien av attributtet, som oftest finnes i enheter av befolkningen. Mote brukes til å identifisere verdien av egenskapen som har størst distribusjon. For en diskret serie vil modusen være varianten med høyest frekvens. For eksempel for en diskret serie presentert i tabell 3 Mo= 1, siden denne verdien av alternativene tilsvarer den høyeste frekvensen - 75. For å bestemme modusen til intervallserien, må du først bestemme modal intervall (intervall som har den høyeste frekvensen). Deretter, innenfor dette intervallet, blir verdien av funksjonen funnet, som kan være en modus.

Verdien finner du av formelen:

hvor x Mo er den nedre grensen for det modale intervallet; i er verdien av det modale intervallet; f Mo er frekvensen til det modale intervallet; f Mo-1 er frekvensen til intervallet før modalen; f Mo+1 er frekvensen til intervallet etter modalen.

Eksempel. Finn aldersmåten til kriminelle som er dømt for tyveri, data som presenteres i tabell 13.

Løsning. Den høyeste frekvensen tilsvarer intervallet 18-28, derfor må modusen være i dette intervallet. Verdien bestemmes av formelen ovenfor:

Dermed er det største antallet kriminelle som er dømt for tyveri 24 år.

Gjennomsnittsverdien gir en generaliserende karakteristikk av helheten av fenomenet som studeres. Imidlertid kan to populasjoner med samme gjennomsnittsverdier avvike betydelig fra hverandre når det gjelder graden av fluktuasjon (variasjon) i verdien av den studerte egenskapen. For eksempel, i en domstol ble følgende fengselsstraff tildelt: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 år, og i en annen - 5, 5, 6, 6, 7, 7 , 7, 8, 8, 8 år. I begge tilfeller er det aritmetiske gjennomsnittet 6,7 år. Imidlertid skiller disse aggregatene seg betydelig fra hverandre i spredningen av individuelle verdier av den tildelte fengselstiden i forhold til gjennomsnittsverdien.

Og for den første domstolen, hvor denne variasjonen er ganske stor, gjenspeiler ikke den gjennomsnittlige soningstiden hele befolkningen godt. Således, hvis de individuelle verdiene til attributtet avviker lite fra hverandre, vil det aritmetiske gjennomsnittet være en ganske veiledende karakteristikk av egenskapene til denne populasjonen. Ellers vil det aritmetiske gjennomsnittet være en upålitelig egenskap for denne populasjonen, og dens anvendelse i praksis er ineffektiv. Derfor er det nødvendig å ta hensyn til variasjonen i verdiene til den studerte egenskapen.

Variasjon- dette er forskjeller i verdiene til en egenskap i forskjellige enheter av en gitt populasjon i samme periode eller tidspunkt. Begrepet "variasjon" er av latinsk opprinnelse - variatio, som betyr forskjell, endring, fluktuasjon. Det oppstår som et resultat av at de individuelle verdiene til attributtet dannes under kombinert påvirkning av ulike faktorer (forhold), som kombineres på forskjellige måter i hvert enkelt tilfelle. For å måle variasjonen til en egenskap, brukes ulike absolutte og relative indikatorer.

Hovedindikatorene for variasjon inkluderer følgende:

1) variasjonsområde;

2) gjennomsnittlig lineært avvik;

3) dispersjon;

4) standardavvik;

5) variasjonskoeffisient.

La oss kort dvele ved hver av dem.

Spennvariasjon R er den mest tilgjengelige absolutte indikatoren når det gjelder enkel beregning, som er definert som forskjellen mellom de største og minste verdiene av attributtet for enhetene i denne populasjonen:

Variasjonsområdet (spekteret av fluktuasjoner) er en viktig indikator på variasjonen til en funksjon, men den gjør det mulig å se kun ekstreme avvik, noe som begrenser omfanget. For en mer nøyaktig karakterisering av variasjonen til en egenskap basert på dens fluktuasjon, brukes andre indikatorer.

Gjennomsnittlig lineært avvik representerer det aritmetiske gjennomsnittet av de absolutte verdiene av avvikene til de individuelle verdiene for egenskapen fra gjennomsnittet og bestemmes av formlene:

1) til ugrupperte data

2) til variantserie

Det mest brukte målet på variasjon er imidlertid spredning . Det karakteriserer målet for spredningen av verdiene til den studerte egenskapen i forhold til gjennomsnittsverdien. Variansen er definert som gjennomsnittet av avvikene i annen.

enkel variasjon for ugrupperte data:

.

Vektet varians for variantserien:

Kommentar. I praksis er det bedre å bruke følgende formler for å beregne variansen:

For en enkel variasjon

.

For vektet avvik

Standardavvik er kvadratroten av variansen:

Standardavviket er et mål på påliteligheten til gjennomsnittet. Jo mindre standardavviket er, jo mer homogen er populasjonen og jo bedre gjenspeiler det aritmetiske gjennomsnittet hele populasjonen.

Spredningsmålene vurdert ovenfor (variasjonsområde, varians, standardavvik) er absolutte indikatorer, som det ikke alltid er mulig å bedømme graden av fluktuasjon av en egenskap. I noen problemer er det nødvendig å bruke relative spredningsindekser, hvorav en er variasjonskoeffisienten.

Variasjonskoeffisienten- uttrykt som en prosentandel av forholdet mellom standardavviket og det aritmetiske gjennomsnittet:

Variasjonskoeffisienten brukes ikke bare for en komparativ vurdering av variasjonen av ulike egenskaper eller samme egenskap i ulike populasjoner, men også for å karakterisere homogeniteten i populasjonen. Den statistiske populasjonen anses som kvantitativt homogen dersom variasjonskoeffisienten ikke overstiger 33 % (for fordelinger nær normalfordelingen).

Eksempel. Det er følgende data om fengselsvilkårene for 50 domfelte levert for å sone straffen idømt av retten i en kriminalomsorgsinstitusjon: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Konstruer en distribusjonsserie etter fengselsstraff.

2. Finn gjennomsnitt, varians og standardavvik.

3. Beregn variasjonskoeffisienten og trekk en konklusjon om homogeniteten eller heterogeniteten til den studerte populasjonen.

Løsning. For å konstruere en diskret distribusjonsserie er det nødvendig å bestemme variantene og frekvensene. Alternativet i denne oppgaven er fengselstiden, og frekvensen er antall individuelle alternativer. Etter å ha beregnet frekvensene, får vi følgende diskrete distribusjonsserie:

Finn gjennomsnittet og variansen. Siden de statistiske dataene er representert av en diskret variasjonsserie, vil vi bruke formlene for det aritmetiske vektede gjennomsnittet og variansen for å beregne dem. Vi får:

= = 4,1;

= 5,21.

Nå beregner vi standardavviket:

Vi finner variasjonskoeffisienten:

Følgelig er den statistiske populasjonen kvantitativt heterogen.

enkel aritmetisk gjennomsnitt

Gjennomsnittlige verdier

Gjennomsnittsverdier er mye brukt i statistikk.

gjennomsnittlig verdi- dette er en generaliserende indikator der uttrykket for virkningen av generelle forhold, mønstre for utvikling av fenomenet som studeres, finnes.

Statistiske gjennomsnitt er beregnet på grunnlag av massedata fra en korrekt statistisk organisert observasjon (kontinuerlig og utvalg). Det statistiske gjennomsnittet vil imidlertid være objektivt og typisk dersom det beregnes ut fra massedata for en kvalitativt homogen populasjon (massefenomener). For eksempel, hvis vi beregner gjennomsnittslønnen i aksjeselskaper og statseide foretak, og utvider resultatet til hele befolkningen, så er gjennomsnittet fiktivt, siden det er beregnet på en heterogen befolkning, og et slikt gjennomsnitt taper alle betydning.

Ved hjelp av gjennomsnittet er det så å si en utjevning av forskjeller i trekkets størrelse som oppstår av en eller annen grunn i individuelle observasjonsenheter.

For eksempel avhenger gjennomsnittlig produksjon til en individuell selger av mange faktorer: kvalifikasjoner, tjenestetid, alder, tjenesteform, helse og så videre. Gjennomsnittlig produksjon gjenspeiler de generelle egenskapene til hele befolkningen.

Gjennomsnittsverdien måles i de samme enhetene som selve funksjonen.

Hver gjennomsnittsverdi karakteriserer den studerte populasjonen i henhold til en hvilken som helst egenskap. For å få et fullstendig og helhetlig bilde av befolkningen som studeres når det gjelder en rekke essensielle egenskaper, er det nødvendig å ha et system med gjennomsnittsverdier som kan beskrive fenomenet fra ulike vinkler.

Det finnes forskjellige typer gjennomsnitt:

    aritmetisk gjennomsnitt;

    gjennomsnittlig harmonisk;

    geometrisk gjennomsnitt;

    rot betyr kvadratisk;

    gjennomsnittlig kubikk.

Gjennomsnittene for alle typene som er oppført ovenfor, er igjen delt inn i enkle (uvektet) og vektet.

Vurder hvilke typer gjennomsnitt som brukes i statistikk.

Det enkle aritmetiske gjennomsnittet (uvektet) er lik summen av de individuelle verdiene til karakteristikken, delt på antallet av disse verdiene.

Separate verdier av en funksjon kalles varianter og er merket med х i (
); antall befolkningsenheter er betegnet med n, gjennomsnittsverdien av funksjonen - ved . Derfor er det enkle aritmetiske gjennomsnittet:

eller

Eksempel 1 Tabell 1

Data om produksjon av produkter A av arbeidere per skift

I dette eksemplet er variabelattributtet utgivelsen av produkter per skift.

De numeriske verdiene til attributtet (16, 17, etc.) kalles opsjoner. La oss bestemme den gjennomsnittlige produksjonen av produkter av arbeiderne i denne gruppen:

PCS.

Et enkelt aritmetisk gjennomsnitt brukes i tilfeller der det er individuelle verdier av en karakteristikk, dvs. dataene er ikke gruppert. Hvis dataene presenteres i form av distribusjonsserier eller grupperinger, beregnes gjennomsnittet annerledes.

Aritmetisk vektet gjennomsnitt

Det aritmetiske vektede gjennomsnittet er lik summen av produktene av hver individuelle verdi av attributtet (alternativet) med den tilsvarende frekvensen, delt på summen av alle frekvenser.

Antallet identiske funksjonsverdier i distribusjonsserien kalles frekvens eller vekt og er betegnet med f i .

I samsvar med dette ser det aritmetiske vektede gjennomsnittet slik ut:

eller

Det kan sees fra formelen at gjennomsnittet ikke bare avhenger av verdiene til attributtet, men også av deres frekvenser, dvs. på sammensetningen av befolkningen, på dens struktur.

Eksempel 2 tabell 2

Arbeiderlønnsdata

I følge dataene fra den diskrete distribusjonsserien kan det sees at de samme verdiene til attributtet (alternativene) gjentas flere ganger. Så variant x 1 forekommer samlet 2 ganger, og variant x 2 - 6 ganger osv.

Beregn gjennomsnittlig lønn per arbeider:

Lønnsfondet for hver gruppe arbeidere er lik produktet av opsjoner og frekvens (
), og summen av disse produktene gir det totale lønnsfondet til alle arbeidere (
).

Hvis beregningen ble utført ved å bruke den enkle aritmetiske gjennomsnittsformelen, ville den gjennomsnittlige inntekten være 3000 rubler. (). Ved å sammenligne det oppnådde resultatet med de første dataene, er det åpenbart at gjennomsnittslønnen bør være betydelig høyere (mer enn halvparten av arbeiderne mottar lønn over 3000 rubler). Derfor vil beregningen av det enkle aritmetiske gjennomsnittet i slike tilfeller være feil.

Statistisk materiale som resultat av bearbeiding kan presenteres ikke bare i form av diskrete distribusjonsserier, men også i form av intervallvariasjonsserier med lukkede eller åpne intervaller.

Vurder beregningen av det aritmetiske gjennomsnittet for slike serier.

Gjennomsnittet er:

Mener

Mener- numerisk karakteristikk av et sett med tall eller funksjoner; - noen tall innelukket mellom den minste og største av verdiene deres.

  • 1 Grunnleggende informasjon
  • 2 Hierarki av virkemidler i matematikk
  • 3 I sannsynlighetsteori og statistikk
  • 4 Se også
  • 5 Merknader

Grunnleggende informasjon

Utgangspunktet for dannelsen av teorien om gjennomsnitt var studiet av proporsjoner ved Pythagoras-skolen. Samtidig ble det ikke gjort et strengt skille mellom begrepene gjennomsnitt og proporsjon. En betydelig drivkraft til utviklingen av proporsjonsteorien fra et aritmetisk synspunkt ble gitt av greske matematikere - Nicomachus av Geras (sent I - tidlig II århundre e.Kr.) og Pappus av Alexandria (III århundre e.Kr.). Det første stadiet i utviklingen av begrepet gjennomsnitt er det stadiet da gjennomsnittet begynte å bli betraktet som det sentrale medlemmet av en kontinuerlig andel. Men begrepet middel som progresjonens sentrale verdi gjør det ikke mulig å utlede begrepet middel med hensyn til en sekvens av n ledd, uavhengig av rekkefølgen de følger hverandre i. For dette formålet er det nødvendig å ty til en formell generalisering av gjennomsnitt. Neste trinn er overgangen fra kontinuerlige proporsjoner til progresjoner - aritmetisk, geometrisk og harmonisk.

I statistikkens historie er den utbredte bruken av gjennomsnitt for første gang assosiert med navnet på den engelske forskeren W. Petty. W. Petty var en av de første som forsøkte å gi gjennomsnittsverdien en statistisk betydning, og koblet den sammen med økonomiske kategorier. Men Petty produserte ikke en beskrivelse av konseptet med gjennomsnittsverdien, dens tildeling. A. Quetelet anses å være grunnleggeren av teorien om gjennomsnittsverdier. Han var en av de første som konsekvent utviklet teorien om gjennomsnitt, og prøvde å bringe et matematisk grunnlag for den. A. Quetelet pekte ut to typer gjennomsnitt - faktiske gjennomsnitt og aritmetiske gjennomsnitt. Riktig gjennomsnitt representerer en ting, et tall, virkelig eksisterende. Egentlig bør gjennomsnitt eller statistiske gjennomsnitt utledes fra fenomener av samme kvalitet, identiske i deres interne betydning. Aritmetiske gjennomsnitt er tall som gir en nærmest mulig ide om mange tall, forskjellige, om enn homogene.

Hver type gjennomsnitt kan enten være et enkelt gjennomsnitt eller et vektet gjennomsnitt. Riktigheten av valget av gjennomsnittsformen følger av den materielle naturen til studieobjektet. Enkle gjennomsnittsformler brukes hvis de individuelle verdiene for den gjennomsnittlige funksjonen ikke gjentas. Når, i praktiske studier, individuelle verdier av egenskapen som studeres forekommer flere ganger i enheter av befolkningen som studeres, er frekvensen av repetisjon av individuelle egenskapsverdier til stede i beregningsformlene for kraftgjennomsnitt. I dette tilfellet kalles de vektede gjennomsnittsformler.

Wikimedia Foundation. 2010.

Gjennomsnittsverdien er den mest verdifulle fra et analytisk synspunkt og en universell uttrykksform for statistiske indikatorer. Det vanligste gjennomsnittet - det aritmetiske gjennomsnittet - har en rekke matematiske egenskaper som kan brukes i beregningen. Samtidig, når du beregner et spesifikt gjennomsnitt, er det alltid tilrådelig å stole på dens logiske formel, som er forholdet mellom volumet av attributtet og volumet av befolkningen. For hvert gjennomsnitt er det bare ett sant referanseforhold, som, avhengig av tilgjengelige data, kan kreve ulike former for midler. I alle tilfeller der gjennomsnittsverdiens art tilsier tilstedeværelsen av vekter, er det imidlertid umulig å bruke deres uvektede formler i stedet for de vektede gjennomsnittsformlene.

Gjennomsnittsverdien er den mest karakteristiske verdien av attributtet for populasjonen og størrelsen på attributtet til populasjonen fordelt på like deler mellom enhetene i befolkningen.

Karakteristikken som gjennomsnittsverdien beregnes for kalles gjennomsnitt .

Gjennomsnittsverdien er en indikator som beregnes ved å sammenligne absolutte eller relative verdier. Gjennomsnittsverdien er

Gjennomsnittsverdien gjenspeiler påvirkningen av alle faktorer som påvirker fenomenet som studeres, og er resultatet for dem. Med andre ord, tilbakebetaling av individuelle avvik og eliminering av påvirkning av tilfeller, gjennomsnittsverdien, som gjenspeiler det generelle målet for resultatene av denne handlingen, fungerer som et generelt mønster av fenomenet som studeres.

Betingelser for bruk av gjennomsnitt:

Ø homogenitet i den studerte populasjonen. Hvis noen elementer i befolkningen som er utsatt for påvirkning av en tilfeldig faktor har signifikant forskjellige verdier av den studerte egenskapen fra resten, vil disse elementene påvirke størrelsen på gjennomsnittet for denne befolkningen. I dette tilfellet vil ikke gjennomsnittet uttrykke den mest typiske verdien av funksjonen for populasjonen. Hvis fenomenet som studeres er heterogent, er det nødvendig å bryte det ned i grupper som inneholder homogene elementer. I dette tilfellet beregnes gruppegjennomsnitt - gruppegjennomsnitt, som uttrykker den mest karakteristiske verdien av fenomenet i hver gruppe, og deretter beregnes den totale gjennomsnittsverdien for alle elementer, som karakteriserer fenomenet som helhet. Det beregnes som gjennomsnittet av gruppemiddelet, vektet med antall befolkningselementer som inngår i hver gruppe;

Ø et tilstrekkelig antall enheter i aggregatet;

Ø maksimums- og minimumsverdiene for egenskapen i den studerte befolkningen.

Gjennomsnittlig verdi (indikator)- dette er en generalisert kvantitativ karakteristikk av en egenskap i en systematisk populasjon under spesifikke forhold for sted og tid.

I statistikk brukes følgende former (typer) av gjennomsnitt, kalt kraft og strukturelle:

Ø aritmetisk gjennomsnitt(enkel og vektet);

enkel

I matematikk er det aritmetiske gjennomsnittet av tall (eller ganske enkelt gjennomsnittet) summen av alle tallene i et gitt sett delt på antallet. Dette er det mest generaliserte og utbredte konseptet for gjennomsnittsverdien. Som du allerede har forstått, for å finne gjennomsnittsverdien, må du summere alle tallene som er gitt deg, og dele resultatet med antall ledd.

Hva er det aritmetiske gjennomsnittet?

La oss se på et eksempel.

Eksempel 1. Tallene er gitt: 6, 7, 11. Du må finne gjennomsnittsverdien deres.

Løsning.

La oss først finne summen av alle gitte tall.

Nå deler vi den resulterende summen med antall ledd. Siden vi har henholdsvis tre ledd, skal vi dele på tre.

Derfor er gjennomsnittet av tallene 6, 7 og 11 8. Hvorfor 8? Ja, fordi summen av 6, 7 og 11 vil være det samme som tre åttere. Dette vises tydelig på illustrasjonen.

Gjennomsnittsverdien minner litt om «justeringen» av en tallserie. Som du kan se, har haugene med blyanter blitt ett nivå.

Tenk på et annet eksempel for å konsolidere den oppnådde kunnskapen.

Eksempel 2 Tall er gitt: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Du må finne deres aritmetiske gjennomsnitt.

Løsning.

Vi finner summen.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Del på antall ledd (i dette tilfellet 15).

Derfor er gjennomsnittsverdien av denne tallserien 22.

Vurder nå negative tall. La oss huske hvordan vi skal oppsummere dem. For eksempel har du to tall 1 og -4. La oss finne summen deres.

1 + (-4) = 1 – 4 = -3

Når du vet dette, bør du vurdere et annet eksempel.

Eksempel 3 Finn gjennomsnittsverdien til en tallserie: 3, -7, 5, 13, -2.

Løsning.

Finne summen av tall.

3 + (-7) + 5 + 13 + (-2) = 12

Siden det er 5 ledd, deler vi den resulterende summen med 5.

Derfor er det aritmetiske gjennomsnittet av tallene 3, -7, 5, 13, -2 2,4.

I vår tid med teknologisk fremgang er det mye mer praktisk å bruke dataprogrammer for å finne gjennomsnittsverdien. Microsoft Office Excel er en av dem. Å finne gjennomsnittet i Excel er raskt og enkelt. Dessuten er dette programmet inkludert i programvarepakken fra Microsoft Office. Vurder en kort instruksjon om hvordan du finner det aritmetiske gjennomsnittet ved å bruke dette programmet.

For å beregne gjennomsnittsverdien av en tallserie, må du bruke AVERAGE-funksjonen. Syntaksen for denne funksjonen er:
=Gjennomsnitt(argument1, argument2, ... argument255)
der argument1, argument2, ... argument255 er enten tall eller cellereferanser (celler betyr områder og matriser).

For å gjøre det klarere, la oss teste kunnskapen vi har fått.

  1. Skriv inn tallene 11, 12, 13, 14, 15, 16 i cellene C1 - C6.
  2. Velg celle C7 ved å klikke på den. I denne cellen vil vi vise gjennomsnittsverdien.
  3. Klikk på "Formler"-fanen.
  4. Velg Flere funksjoner > Statistisk for å åpne rullegardinlisten.
  5. Velg GJENNOMSNITT. Etter det skal en dialogboks åpnes.
  6. Velg og dra cellene C1-C6 dit for å angi området i dialogboksen.
  7. Bekreft handlingene dine med "OK"-knappen.
  8. Hvis du gjorde alt riktig, i celle C7 bør du ha svaret - 13.7. Når du klikker på celle C7, vil funksjonen (=Gjennomsnitt(C1:C6)) vises i formellinjen.

Det er veldig nyttig å bruke denne funksjonen til regnskap, fakturaer, eller når du bare skal finne gjennomsnittet av et veldig langt tallområde. Derfor brukes det ofte på kontorer og store selskaper. Dette lar deg holde journalene i orden og gjør det mulig å raskt beregne noe (for eksempel gjennomsnittlig inntekt per måned). Du kan også bruke Excel til å finne gjennomsnittet av en funksjon.

Gjennomsnitt

Dette begrepet har andre betydninger, se gjennomsnittsbetydningen.

Gjennomsnitt(i matematikk og statistikk) sett med tall - summen av alle tall delt på antallet. Det er et av de vanligste målene for sentral tendens.

Det ble foreslått (sammen med det geometriske gjennomsnittet og det harmoniske gjennomsnittet) av pytagoreerne.

Spesielle tilfeller av det aritmetiske gjennomsnittet er gjennomsnittet (av den generelle populasjonen) og utvalgets gjennomsnitt (av utvalgene).

Introduksjon

Angi settet med data X = (x 1 , x 2 , …, x n), så er prøvegjennomsnittet vanligvis angitt med en horisontal strek over variabelen (x ¯ (\displaystyle (\bar (x))), uttalt " x med strek").

Den greske bokstaven μ brukes for å betegne det aritmetiske gjennomsnittet av hele befolkningen. For en tilfeldig variabel som det er definert en middelverdi for, er μ sannsynlighetsmiddel eller den matematiske forventningen til en tilfeldig variabel. Hvis settet X er en samling av tilfeldige tall med et sannsynlighetsmiddel μ, deretter for en hvilken som helst prøve x Jeg fra denne samlingen μ = E( x Jeg) er forventningen til denne prøven.

I praksis er forskjellen mellom μ og x ¯ (\displaystyle (\bar (x))) at μ er en typisk variabel fordi du kan se utvalget i stedet for hele populasjonen. Derfor, hvis utvalget er representert tilfeldig (i form av sannsynlighetsteori), kan x ¯ (\displaystyle (\bar (x))) (men ikke μ) behandles som en tilfeldig variabel med en sannsynlighetsfordeling på utvalget ( sannsynlighetsfordeling av gjennomsnittet).

Begge disse mengdene beregnes på samme måte:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Hvis en X er en tilfeldig variabel, deretter den matematiske forventningen X kan betraktes som det aritmetiske gjennomsnittet av verdiene i gjentatte målinger av mengden X. Dette er en manifestasjon av loven om store tall. Derfor brukes prøvegjennomsnittet for å estimere den ukjente matematiske forventningen.

I elementær algebra er det bevist at gjennomsnittet n+ 1 tall over gjennomsnittet n tall hvis og bare hvis det nye tallet er større enn det gamle gjennomsnittet, mindre hvis og bare hvis det nye tallet er mindre enn gjennomsnittet, og endres ikke hvis og bare hvis det nye tallet er lik gjennomsnittet. Jo mer n, jo mindre er forskjellen mellom de nye og gamle gjennomsnittene.

Legg merke til at det er flere andre "midler" tilgjengelig, inkludert kraftlovens middelverdi, Kolmogorov-middelverdien, harmonisk middelverdi, aritmetisk-geometrisk middelverdi og ulike vektede middelverdier (f. .

Eksempler

  • For tre tall må du legge dem til og dele på 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • For fire tall må du legge dem til og dele på 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Eller lettere 5+5=10, 10:2. Fordi vi la til 2 tall, som betyr at hvor mange tall vi legger til, deler vi på så mye.

Kontinuerlig tilfeldig variabel

For en kontinuerlig distribuert verdi f (x) (\displaystyle f(x)) er det aritmetiske gjennomsnittet på intervallet [ a ; b ] (\displaystyle ) er definert via en bestemt integral:

F (x) ¯ [a; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Noen problemer med å bruke gjennomsnittet

Mangel på robusthet

Hovedartikkel: Robusthet i statistikk

Selv om det aritmetiske gjennomsnittet ofte brukes som middel eller sentrale trender, gjelder ikke dette konseptet for robust statistikk, som betyr at det aritmetiske gjennomsnittet er sterkt påvirket av "store avvik". Det er bemerkelsesverdig at for fordelinger med stor skjevhet, kan det aritmetiske gjennomsnittet ikke samsvare med begrepet "gjennomsnitt", og verdiene av gjennomsnittet fra robust statistikk (for eksempel medianen) kan bedre beskrive den sentrale trenden.

Det klassiske eksemplet er beregningen av gjennomsnittsinntekten. Det aritmetiske gjennomsnittet kan feiltolkes som en median, noe som kan føre til konklusjonen at det er flere med mer inntekt enn det egentlig er. «Mean» inntekt tolkes slik at de flestes inntekter er nær dette tallet. Denne "gjennomsnittlige" (i betydningen det aritmetiske gjennomsnittet) inntekten er høyere enn inntekten til folk flest, siden en høy inntekt med stort avvik fra gjennomsnittet gjør det aritmetiske gjennomsnittet sterkt skjevt (i motsetning til dette "motstår" medianinntekten) en slik skjevhet). Denne «gjennomsnittlige» inntekten sier imidlertid ingenting om antall personer i nærheten av medianinntekten (og sier ingenting om antall personer nær den modale inntekten). Men hvis begrepene «gjennomsnitt» og «flertall» tas lett på, så kan man feilaktig konkludere med at folk flest har høyere inntekter enn de faktisk er. For eksempel vil en rapport om "gjennomsnittlig" nettoinntekt i Medina, Washington, beregnet som det aritmetiske gjennomsnittet av alle årlige nettoinntekter til innbyggere, gi et overraskende høyt tall på grunn av Bill Gates. Tenk på prøven (1, 2, 2, 2, 3, 9). Det aritmetiske gjennomsnittet er 3,17, men fem av de seks verdiene er under dette gjennomsnittet.

Sammensatt rente

Hovedartikkel: ROI

Hvis tall multiplisere, men ikke brette, må du bruke det geometriske gjennomsnittet, ikke det aritmetiske gjennomsnittet. Oftest skjer denne hendelsen når man beregner avkastningen på investeringen i finans.

For eksempel, hvis aksjer falt 10 % det første året og steg 30 % i det andre året, er det feil å beregne den "gjennomsnittlige" økningen over disse to årene som det aritmetiske gjennomsnittet (−10 % + 30 %) / 2 = 10%; det riktige gjennomsnittet i dette tilfellet er gitt av den sammensatte årlige vekstraten, hvorfra den årlige veksten bare er ca. 8,16653826392% ≈ 8,2%.

Grunnen til dette er at prosenter har et nytt utgangspunkt hver gang: 30 % er 30 % fra et tall mindre enn prisen ved begynnelsen av det første året: hvis aksjen startet på $30 og falt 10%, er den verdt $27 ved starten av det andre året. Hvis aksjen er opp 30%, er den verdt $35,1 ved slutten av det andre året. Det aritmetiske gjennomsnittet av denne veksten er 10 %, men siden aksjen kun har vokst med $5,1 på 2 år, gir en gjennomsnittlig økning på 8,2% et sluttresultat på $35,1:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $35,1]. Hvis vi bruker det aritmetiske gjennomsnittet på 10 % på samme måte, får vi ikke den faktiske verdien: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Rentesammensatt ved utgangen av år 2: 90 % * 130 % = 117 % , dvs. en total økning på 17 %, og gjennomsnittlig årlig rentes rente er 117 % ≈ 108,2 % (\displaystyle (\sqrt (117\%)) \ca. 108,2\%) , det vil si en gjennomsnittlig årlig økning på 8,2%.

Veibeskrivelse

Hovedartikkel: Destinasjonsstatistikk

Ved beregning av det aritmetiske gjennomsnittet av en variabel som endres syklisk (for eksempel fase eller vinkel), bør det utvises spesiell forsiktighet. For eksempel vil gjennomsnittet av 1° og 359° være 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Dette tallet er feil av to grunner.

  • For det første er vinkelmål bare definert for området fra 0° til 360° (eller fra 0 til 2π når det måles i radianer). Dermed kan det samme tallparet skrives som (1° og −1°) eller som (1° og 719°). Gjennomsnittene for hvert par vil være forskjellige: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ ))))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • For det andre, i dette tilfellet, vil en verdi på 0° (tilsvarer 360°) være det geometrisk beste gjennomsnittet, siden tallene avviker mindre fra 0° enn fra noen annen verdi (verdi 0° har den minste variansen). Sammenligne:
    • tallet 1° avviker fra 0° med bare 1°;
    • tallet 1° avviker fra det beregnede gjennomsnittet på 180° ganger 179°.

Gjennomsnittsverdien for en syklisk variabel, beregnet i henhold til formelen ovenfor, vil bli kunstig forskjøvet i forhold til det reelle gjennomsnittet til midten av det numeriske området. På grunn av dette beregnes gjennomsnittet på en annen måte, nemlig tallet med den minste variansen (midtpunkt) er valgt som gjennomsnittsverdi. Dessuten, i stedet for å subtrahere, brukes modulo-avstand (dvs. periferisk avstand). For eksempel er den modulære avstanden mellom 1° og 359° 2°, ikke 358° (på en sirkel mellom 359° og 360°==0° - én grad, mellom 0° og 1° - også 1°, totalt -2°).

Vektet gjennomsnitt - hva er det og hvordan beregnes det?

I prosessen med å studere matematikk blir elevene kjent med begrepet det aritmetiske gjennomsnittet. I fremtiden, i statistikk og noen andre vitenskaper, står studentene også overfor beregning av andre gjennomsnitt. Hva kan de være og hvordan skiller de seg fra hverandre?

Gjennomsnitt: Betydning og forskjeller

Ikke alltid nøyaktige indikatorer gir en forståelse av situasjonen. For å vurdere denne eller den situasjonen, er det noen ganger nødvendig å analysere et stort antall tall. Og da kommer gjennomsnittene til unnsetning. De lar deg vurdere situasjonen generelt.

Siden skoledagene husker mange voksne eksistensen av det aritmetiske gjennomsnittet. Det er veldig enkelt å beregne - summen av en sekvens av n ledd er delelig med n. Det vil si at hvis du trenger å beregne det aritmetiske gjennomsnittet i sekvensen av verdier 27, 22, 34 og 37, må du løse uttrykket (27 + 22 + 34 + 37) / 4, siden 4 verdier brukes i beregningene. I dette tilfellet vil den ønskede verdien være lik 30.

Ofte, som en del av skolekurset, studeres også det geometriske gjennomsnittet. Beregningen av denne verdien er basert på å trekke ut roten av den n-te graden fra produktet av n ledd. Hvis vi tar de samme tallene: 27, 22, 34 og 37, vil resultatet av beregningene være 29,4.

Det harmoniske gjennomsnittet i en allmennutdanningsskole er vanligvis ikke gjenstand for studier. Imidlertid brukes det ganske ofte. Denne verdien er den resiproke av det aritmetiske gjennomsnittet og beregnes som en kvotient av n - antall verdier og summen 1/a 1 +1/a 2 +...+1/a n . Hvis vi igjen tar den samme tallserien for beregning, vil harmoniske være 29,6.

Vektet gjennomsnitt: Funksjoner

Imidlertid kan det hende at alle de ovennevnte verdiene ikke brukes overalt. For eksempel, i statistikk, når du beregner noen gjennomsnittsverdier, spiller "vekten" av hvert tall som brukes i beregningen en viktig rolle. Resultatene er mer avslørende og korrekte fordi de tar hensyn til mer informasjon. Denne gruppen av verdier blir samlet referert til som "vektet gjennomsnitt". De blir ikke bestått på skolen, så det er verdt å dvele mer ved dem.

Først av alt er det verdt å forklare hva som menes med "vekten" til en bestemt verdi. Den enkleste måten å forklare dette på er med et spesifikt eksempel. Kroppstemperaturen til hver pasient måles to ganger daglig på sykehuset. Av de 100 pasientene på ulike avdelinger på sykehuset vil 44 ha normal temperatur - 36,6 grader. Ytterligere 30 vil ha en økt verdi - 37,2, 14 - 38, 7 - 38,5, 3 - 39, og de resterende to - 40. Og hvis vi tar det aritmetiske gjennomsnittet, vil denne verdien generelt for sykehuset være over 38 grader ! Men nesten halvparten av pasientene har helt normal temperatur. Og her vil det være mer riktig å bruke det vektede gjennomsnittet, og "vekten" til hver verdi vil være antall personer. I dette tilfellet vil resultatet av beregningen være 37,25 grader. Forskjellen er åpenbar.

Ved vektede gjennomsnittsberegninger kan "vekten" tas som antall forsendelser, antall personer som jobber på en gitt dag, generelt alt som kan måles og påvirke sluttresultatet.

Varianter

Det vektede gjennomsnittet tilsvarer det aritmetiske gjennomsnittet omtalt i begynnelsen av artikkelen. Imidlertid tar den første verdien, som allerede nevnt, også hensyn til vekten av hvert tall som brukes i beregningene. I tillegg er det også vektet geometriske og harmoniske verdier.

Det er en annen interessant variant som brukes i tallserier. Dette er et vektet glidende gjennomsnitt. Det er på grunnlag av det at trender beregnes. I tillegg til verdiene selv og deres vekt, brukes også periodisitet der. Og når man beregner gjennomsnittsverdien på et tidspunkt, tas også verdier for tidligere tidsperioder i betraktning.

Å beregne alle disse verdiene er ikke så vanskelig, men i praksis brukes vanligvis bare det vanlige vektede gjennomsnittet.

Beregningsmetoder

I databehandlingens tidsalder er det ikke nødvendig å manuelt beregne det vektede gjennomsnittet. Det vil imidlertid være nyttig å kjenne til beregningsformelen slik at du kan kontrollere og om nødvendig korrigere de oppnådde resultatene.

Det vil være lettest å vurdere beregningen på et spesifikt eksempel.

Det er nødvendig å finne ut hva som er gjennomsnittslønnen i denne bedriften, tatt i betraktning antall arbeidere som mottar en bestemt lønn.

Så, beregningen av det vektede gjennomsnittet utføres ved å bruke følgende formel:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

For eksempel vil regnestykket være:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Det er åpenbart ingen spesielle problemer med å manuelt beregne det vektede gjennomsnittet. Formelen for å beregne denne verdien i en av de mest populære applikasjonene med formler - Excel - ser ut som funksjonen SUMPRODUCT (serie med tall; serie av vekter) / SUM (serie av vekter).

Hvordan finne gjennomsnittsverdien i excel?

hvordan finne aritmetisk gjennomsnitt i excel?

Vladimir09854

Enkel peasy. For å finne gjennomsnittsverdien i excel trenger du bare 3 celler. I den første skriver vi ett tall, i det andre - et annet. Og i den tredje cellen vil vi skåre en formel som vil gi oss gjennomsnittsverdien mellom disse to tallene fra den første og andre cellen. Hvis celle nr. 1 heter A1, celle nr. 2 heter B1, så i cellen med formelen må du skrive slik:

Denne formelen beregner det aritmetiske gjennomsnittet av to tall.

For skjønnheten i beregningene våre kan vi fremheve cellene med linjer, i form av en plate.

Det er også en funksjon i selve Excel for å bestemme gjennomsnittsverdien, men jeg bruker den gammeldagse metoden og skriver inn formelen jeg trenger. Dermed er jeg sikker på at Excel vil regne akkurat som jeg trenger, og ikke kommer med noen form for egen avrunding.

M3sergey

Dette er veldig enkelt hvis dataene allerede er lagt inn i cellene. Hvis du bare er interessert i et tall, velg bare ønsket område / områder, og verdien av summen av disse tallene, deres aritmetiske gjennomsnitt og deres tall vil vises i statuslinjen nederst til høyre.

Du kan velge en tom celle, klikke på trekanten (rullegardinlisten) "Autosum" og velge "Gjennomsnitt" der, deretter vil du godta det foreslåtte området for beregning, eller velge ditt eget.

Til slutt kan du bruke formlene direkte - klikk "Sett inn funksjon" ved siden av formellinjen og celleadressen. AVERAGE-funksjonen er i kategorien "Statistisk", og tar som argumenter både tall og cellereferanser osv. Der kan du også velge mer komplekse alternativer, for eksempel AVERAGEIF - beregning av gjennomsnittet etter betingelse.

Finn gjennomsnitt i excel er en ganske enkel oppgave. Her må du forstå om du vil bruke denne gjennomsnittsverdien i noen formler eller ikke.

Hvis du bare trenger å få verdien, er det nok å velge ønsket rekkevidde av tall, hvoretter excel automatisk beregner gjennomsnittsverdien - den vises i statuslinjen, overskriften "Gjennomsnitt".

I tilfelle du vil bruke resultatet i formler, kan du gjøre dette:

1) Summer cellene ved å bruke SUM-funksjonen og del det hele på antall tall.

2) Et mer riktig alternativ er å bruke en spesialfunksjon kalt AVERAGE. Argumentene til denne funksjonen kan være tall gitt sekvensielt, eller en rekke tall.

Vladimir Tikhonov

ring rundt verdiene​ som skal være involvert i beregningen, klikk på "Formler"-fanen, der vil du se "AutoSum" til venstre og ved siden av en trekant som peker ned. klikk på denne trekanten og velg "Gjennomsnitt". Voila, ferdig) nederst i kolonnen vil du se gjennomsnittsverdien :)

Ekaterina Mutalapova

La oss starte med begynnelsen og i rekkefølge. Hva betyr gjennomsnitt?

Middelverdien er verdien som er det aritmetiske gjennomsnittet, dvs. beregnes ved å legge til et sett med tall og deretter dele den totale summen av tall med antallet. For eksempel, for tallene 2, 3, 6, 7, 2 vil det være 4 (summen av tallene 20 er delt på tallet 5)

I et Excel-regneark, for meg personlig, var den enkleste måten å bruke formelen =GJENNOMSNITT. For å beregne gjennomsnittsverdien må du legge inn data i tabellen, skrive funksjonen =AVERAGE() under datakolonnen, og i parentes angi rekkevidden av tall i cellene, utheve kolonnen med dataene. Etter det, trykk ENTER, eller bare venstreklikk på en celle. Resultatet vil vises i cellen under kolonnen. Umiddelbart er beskrivelsen uforståelig, men faktisk er det snakk om minutter.

Eventyrer 2000

Excel-programmet er mangefasettert, så det er flere alternativer som lar deg finne gjennomsnittet:

Første alternativ. Du summerer ganske enkelt alle cellene og deler på antallet;

Andre alternativ. Bruk en spesiell kommando, skriv i den nødvendige cellen formelen "=GJENNOMSNITT (og her spesifiser celleområdet)";

Tredje alternativ. Hvis du velger det nødvendige området, så merk at på siden nedenfor vises også gjennomsnittsverdien i disse cellene.

Dermed er det mange måter å finne gjennomsnittsverdien på, du trenger bare å velge den beste for deg og bruke den hele tiden.

I Excel, ved å bruke AVERAGE-funksjonen, kan du beregne det enkle aritmetiske gjennomsnittet. For å gjøre dette må du angi en rekke verdier. Trykk på lik og velg i Statistical-kategorien, blant annet velg AVERAGE-funksjonen

Ved hjelp av statistiske formler kan du også beregne det aritmetiske vektede gjennomsnittet, som anses som mer nøyaktig. For å beregne det trenger vi verdiene til indikatoren og frekvensen.

Hvordan finne gjennomsnittet i Excel?

Situasjonen er denne. Det er følgende tabell:

Kolonnene i rødt inneholder tallverdiene til karakterene for fagene. I "Gjennomsnitt"-kolonnen må du beregne gjennomsnittsverdien.
Problemet er dette: det er totalt 60-70 objekter, og noen av dem er på et annet ark.
Jeg så i et annet dokument, gjennomsnittet er allerede beregnet, og i cellen er det en formel som
="arknavn"!|E12
men dette ble gjort av en programmerer som fikk sparken.
Fortell meg, vær så snill, hvem forstår dette.

Hector

I funksjonslinjen setter du inn "GJENNOMSNITT" fra de foreslåtte funksjonene og velger hvor de skal beregnes (B6: N6) for for eksempel Ivanov. Jeg vet ikke sikkert om naboark, men dette er helt sikkert inneholdt i standard Windows-hjelp

Fortell meg hvordan jeg beregner gjennomsnittsverdien i Word

Fortell meg hvordan jeg beregner gjennomsnittsverdien i Word. Nemlig gjennomsnittsverdien på vurderingene, og ikke antall personer som fikk karakterer.

Julia pavlova

Word kan gjøre mye med makroer. Trykk ALT+F11 og skriv et makroprogram.
I tillegg vil Insert-Object... tillate deg å bruke andre programmer, til og med Excel, for å lage et ark med en tabell inne i et Word-dokument.
Men i dette tilfellet må du skrive ned tallene dine i tabellkolonnen, og sette gjennomsnittet i den nederste cellen i samme kolonne, ikke sant?
For å gjøre dette, sett inn et felt i den nederste cellen.
Sett inn-felt...-Formel
Feltinnhold
[=GJENNOMSNITT(OVER)]
returnerer gjennomsnittet av summen av cellene ovenfor.
Hvis feltet er valgt og høyre museknapp trykkes, kan det oppdateres hvis tallene er endret,
vis koden eller feltverdien, endre koden direkte i feltet.
Hvis noe går galt, slett hele feltet i cellen og lag det på nytt.
AVERAGE betyr gjennomsnitt, OVER - ca, det vil si en rad med celler over.
Jeg visste ikke alt dette selv, men jeg fant det lett i HELP, selvfølgelig og tenkte litt.

Emne: Statistikk

Alternativ nummer 2

Gjennomsnittsverdier brukt i statistikk

Innledning……………………………………………………………………………………………….3

Teoretisk oppgave

Gjennomsnittsverdien i statistikk, dens essens og bruksbetingelser.

1.1. Essensen av gjennomsnittsverdien og bruksbetingelser………….4

1.2. Typer gjennomsnittsverdier………………………………………………………8

Praktisk oppgave

Oppgave 1,2,3………………………………………………………………………………14

Konklusjon……………………………………………………………………………………….21

Liste over brukt litteratur………………………………………………...23

Introduksjon

Denne testen består av to deler - teoretisk og praktisk. I den teoretiske delen vil en så viktig statistisk kategori som gjennomsnittsverdien bli vurdert i detalj for å identifisere dens essens og anvendelsesbetingelser, samt for å identifisere typene gjennomsnitt og metoder for deres beregning.

Statistikk studerer som kjent masse sosioøkonomiske fenomener. Hvert av disse fenomenene kan ha et annet kvantitativt uttrykk for det samme trekk. For eksempel lønnen til samme yrke av arbeidere eller prisene på markedet for samme produkt, etc. Gjennomsnittlige verdier kjennetegner de kvalitative indikatorene for kommersiell aktivitet: distribusjonskostnader, fortjeneste, lønnsomhet, etc.

For å studere enhver populasjon i henhold til varierende (kvantitativt skiftende) egenskaper, bruker statistikken gjennomsnitt.

Middels essens

Gjennomsnittsverdien er en generaliserende kvantitativ karakteristikk av helheten av samme type fenomener i henhold til en varierende egenskap. I økonomisk praksis brukes et bredt spekter av indikatorer, beregnet som gjennomsnitt.

Den viktigste egenskapen til gjennomsnittsverdien er at den representerer verdien av et bestemt attributt i hele befolkningen som et enkelt tall, til tross for dets kvantitative forskjeller i individuelle enheter av befolkningen, og uttrykker det vanlige som er iboende i alle enheter av populasjonen. befolkningen som studeres. Gjennom egenskapen til en enhet av befolkningen karakteriserer den altså hele befolkningen som helhet.

Gjennomsnitt er relatert til loven om store tall. Essensen av dette forholdet ligger i det faktum at når man gjennomsnitt tilfeldige avvik av individuelle verdier, på grunn av driften av loven om store tall, opphever de hverandre og i gjennomsnitt avsløres hovedutviklingstrenden, nødvendighet, regelmessighet. Gjennomsnittsverdier tillater sammenligning av indikatorer relatert til populasjoner med forskjellig antall enheter.

I moderne forhold for utviklingen av markedsforhold i økonomien tjener gjennomsnitt som et verktøy for å studere objektive mønstre av sosioøkonomiske fenomener. Økonomisk analyse bør imidlertid ikke begrenses bare til gjennomsnittsindikatorer, siden generelle gunstige gjennomsnitt kan skjule både store og alvorlige mangler i aktivitetene til individuelle økonomiske enheter, og spirene til en ny, progressiv. For eksempel gjør fordelingen av befolkningen etter inntekt det mulig å identifisere dannelsen av nye sosiale grupper. Derfor, sammen med gjennomsnittlige statistiske data, er det nødvendig å ta hensyn til egenskapene til individuelle enheter av befolkningen.

Gjennomsnittsverdien er resultatet av alle faktorer som påvirker fenomenet som studeres. Det vil si at når man beregner gjennomsnittsverdiene, kansellerer påvirkningen av tilfeldige (perturbative, individuelle) faktorer hverandre, og dermed er det mulig å bestemme mønsteret som er iboende i fenomenet som studeres. Adolf Quetelet understreket at betydningen av metoden for gjennomsnitt ligger i muligheten for en overgang fra det entall til det generelle, fra tilfeldig til regelmessig, og eksistensen av gjennomsnitt er en kategori av objektiv virkelighet.

Statistikk studerer massefenomener og prosesser. Hvert av disse fenomenene har både felles for hele settet og spesielle, individuelle egenskaper. Forskjellen mellom individuelle fenomener kalles variasjon. En annen egenskap ved massefenomener er deres iboende nærhet til egenskapene til individuelle fenomener. Så samspillet mellom elementene i settet fører til begrensning av variasjonen av i det minste en del av egenskapene deres. Denne trenden eksisterer objektivt. Det er i dens objektivitet at årsaken til den bredeste anvendelsen av gjennomsnittsverdier i praksis og i teorien ligger.

Gjennomsnittsverdien i statistikk er en generaliserende indikator som karakteriserer det typiske nivået av et fenomen under spesifikke forhold for sted og tid, og reflekterer størrelsen på en variabel egenskap per enhet av en kvalitativt homogen populasjon.

I økonomisk praksis brukes et bredt spekter av indikatorer, beregnet som gjennomsnitt.

Ved hjelp av metoden for gjennomsnitt løser statistikk mange problemer.

Hovedverdien til gjennomsnittene er deres generaliserende funksjon, det vil si å erstatte mange forskjellige individuelle verdier av en funksjon med en gjennomsnittsverdi som karakteriserer hele settet med fenomener.

Hvis gjennomsnittsverdien generaliserer kvalitativt homogene verdier av en egenskap, er det en typisk egenskap for en egenskap i en gitt populasjon.

Imidlertid er det feil å redusere rollen til gjennomsnittsverdier bare til å karakterisere de typiske verdiene til funksjoner i populasjoner som er homogene når det gjelder denne funksjonen. I praksis bruker moderne statistikk mye oftere gjennomsnitt som generaliserer klart homogene fenomener.

Gjennomsnittsverdien av nasjonalinntekten per innbygger, gjennomsnittlig utbytte av kornavlinger i hele landet, gjennomsnittlig forbruk av ulike matvarer er kjennetegnene til staten som et enkelt økonomisk system, dette er de såkalte systemgjennomsnittene.

Systemgjennomsnitt kan karakterisere både romlige eller objektsystemer som eksisterer samtidig (stat, industri, region, planeten Jorden, etc.) og dynamiske systemer forlenget over tid (år, tiår, sesong, etc.).

Den viktigste egenskapen til gjennomsnittsverdien er at den gjenspeiler fellesskapet som er iboende i alle enheter av befolkningen som studeres. Verdiene til attributtet til individuelle enheter av befolkningen svinger i en eller annen retning under påvirkning av mange faktorer, blant dem kan det være både grunnleggende og tilfeldige. For eksempel er aksjekursen til et selskap som helhet bestemt av dets økonomiske stilling. Samtidig kan disse aksjene på visse dager og på enkelte børser, på grunn av de rådende omstendighetene, selges til høyere eller lavere kurs. Essensen av gjennomsnittet ligger i det faktum at det kansellerer avvikene til verdiene til attributtet til individuelle enheter i befolkningen, på grunn av virkningen av tilfeldige faktorer, og tar hensyn til endringene forårsaket av handlingen til hovedfaktorer. Dette gjør at gjennomsnittet kan reflektere det typiske nivået til attributtet og abstrahere fra de individuelle egenskapene som ligger i individuelle enheter.

Å beregne gjennomsnittet er en vanlig generaliseringsteknikk; gjennomsnittsindikatoren reflekterer det generelle som er typisk (typisk) for alle enheter av den studerte populasjonen, samtidig som den ignorerer forskjellene mellom individuelle enheter. I ethvert fenomen og dets utvikling er det en kombinasjon av tilfeldighet og nødvendighet.

Gjennomsnittet er en oppsummering av regelmessighetene til prosessen i forholdene den fortsetter under.

Hvert gjennomsnitt karakteriserer den studerte befolkningen i henhold til en funksjon, men for å karakterisere en hvilken som helst populasjon, beskrive dens typiske egenskaper og kvalitative egenskaper, er det nødvendig med et system med gjennomsnittsindikatorer. Derfor, i praksisen med innenlandsk statistikk for studiet av sosioøkonomiske fenomener, beregnes som regel et system med gjennomsnittsindikatorer. Så for eksempel blir indikatoren for gjennomsnittlig lønn evaluert sammen med indikatorer for gjennomsnittlig produksjon, kapital-til-vekt-forhold og kraft-til-vekt-forhold for arbeidskraft, graden av mekanisering og automatisering av arbeid, etc.

Gjennomsnittet bør beregnes under hensyntagen til det økonomiske innholdet i indikatoren som studeres. Derfor, for en bestemt indikator som brukes i sosioøkonomisk analyse, kan bare én sann verdi av gjennomsnittet beregnes basert på den vitenskapelige beregningsmetoden.

Gjennomsnittsverdien er en av de viktigste generaliserende statistiske indikatorene som karakteriserer helheten av samme type fenomener i henhold til en eller annen kvantitativt varierende egenskap. Gjennomsnitt i statistikk er generaliserende indikatorer, tall som uttrykker de typiske karakteristiske dimensjonene til sosiale fenomener i henhold til en kvantitativt varierende egenskap.

Typer gjennomsnitt

Typene gjennomsnittsverdier varierer først og fremst i hvilken egenskap, hvilken parameter for den opprinnelige varierende massen av individuelle verdier av egenskapen skal holdes uendret.

Aritmetisk gjennomsnitt

Det aritmetiske gjennomsnittet er en slik gjennomsnittsverdi av en funksjon, i beregningen av hvilken det totale volumet av funksjonen i aggregatet forblir uendret. Ellers kan vi si at det aritmetiske gjennomsnittet er gjennomsnittlig summand. Når det beregnes, er det totale volumet av attributtet mentalt fordelt likt mellom alle enheter av befolkningen.

Det aritmetiske gjennomsnittet brukes hvis verdiene til det gjennomsnittlige trekk (x) og antall populasjonsenheter med en bestemt trekkverdi (f) er kjent.

Det aritmetiske gjennomsnittet kan være enkelt og vektet.

enkel aritmetisk gjennomsnitt

En enkel brukes hvis hver funksjonsverdi x forekommer én gang, dvs. for hver x er funksjonsverdien f=1, eller hvis de opprinnelige dataene ikke er bestilt og det ikke er kjent hvor mange enheter som har bestemte funksjonsverdier.

Formelen for det aritmetiske gjennomsnittet er enkel.

,

Gjennomsnittsverdier refererer til generaliserende statistiske indikatorer som gir en oppsummering (endelig) karakteristikk av sosiale massefenomener, siden de er bygget på grunnlag av et stort antall individuelle verdier med varierende attributt. For å klargjøre essensen av gjennomsnittsverdien, er det nødvendig å vurdere funksjonene ved dannelsen av verdiene til tegnene på disse fenomenene, i henhold til hvilke gjennomsnittsverdien beregnes.

Det er kjent at enhetene til hvert massefenomen har mange funksjoner. Uansett hvilket av disse tegnene vi tar, vil verdiene for individuelle enheter være forskjellige, de endres, eller, som de sier i statistikk, varierer fra en enhet til en annen. Så, for eksempel, lønnen til en ansatt bestemmes av hans kvalifikasjoner, arten av arbeidet, lengden på tjenesten og en rekke andre faktorer, og varierer derfor over et veldig bredt spekter. Den kumulative innflytelsen av alle faktorer bestemmer inntektsbeløpet til hver ansatt, men vi kan snakke om gjennomsnittlig månedslønn til arbeidere i forskjellige sektorer av økonomien. Her opererer vi med en typisk, karakteristisk verdi av et variabelattributt, referert til en enhet av en stor populasjon.

Gjennomsnittet gjenspeiler det generell, som er typisk for alle enheter av den studerte befolkningen. Samtidig balanserer den innflytelsen fra alle faktorer som virker på størrelsen på egenskapen til individuelle enheter i befolkningen, som om de gjensidig kansellerer dem. Nivået (eller størrelsen) av ethvert sosialt fenomen bestemmes av virkningen av to grupper av faktorer. Noen av dem er generelle og viktigste, kontinuerlig i drift, nært knyttet til naturen til fenomenet eller prosessen som studeres, og danner det typisk for alle enheter av den studerte populasjonen, noe som gjenspeiles i gjennomsnittsverdien. Andre er det individuell, deres handling er mindre uttalt og er episodisk, tilfeldig. De virker i motsatt retning, forårsaker forskjeller mellom de kvantitative egenskapene til individuelle enheter av befolkningen, og søker å endre den konstante verdien av egenskapene som studeres. Virkningen av individuelle tegn er slukket i gjennomsnittsverdien. I den kumulative påvirkningen av typiske og individuelle faktorer, som er balansert og gjensidig opphevet i generaliserende egenskaper, er de grunnleggende lov om store tall.

Til sammen smelter de individuelle verdiene til skiltene sammen til en felles masse og oppløses så å si. Derfor og gjennomsnittlig verdi fungerer som "upersonlig", som kan avvike fra de individuelle verdiene av funksjoner, ikke kvantitativt sammenfallende med noen av dem. Gjennomsnittsverdien gjenspeiler den generelle, karakteristiske og typiske for hele befolkningen på grunn av den gjensidige kanselleringen i den av tilfeldige, atypiske forskjeller mellom tegnene til dens individuelle enheter, siden verdien bestemmes så å si av den felles resultanten av alle årsaker.

For at gjennomsnittsverdien skal reflektere den mest typiske verdien av en egenskap, bør den imidlertid ikke bestemmes for noen populasjoner, men kun for populasjoner som består av kvalitativt homogene enheter. Dette kravet er hovedbetingelsen for vitenskapelig basert anvendelse av gjennomsnitt og innebærer en nær sammenheng mellom metoden for gjennomsnitt og metoden for grupperinger i analysen av sosioøkonomiske fenomener. Derfor er gjennomsnittsverdien en generaliserende indikator som karakteriserer det typiske nivået av en variabel egenskap per enhet av en homogen populasjon under spesifikke forhold for sted og tid.

For å bestemme essensen av gjennomsnittsverdier, må det understrekes at riktig beregning av enhver gjennomsnittsverdi innebærer oppfyllelse av følgende krav:

  • kvalitativ homogenitet av populasjonen som gjennomsnittsverdien er beregnet på. Dette betyr at beregningen av gjennomsnittsverdier bør baseres på grupperingsmetoden, som sikrer utvalget av homogene fenomener av samme type;
  • utelukkelse av påvirkningen på beregningen av gjennomsnittsverdien av tilfeldige, rent individuelle årsaker og faktorer. Dette oppnås når beregningen av gjennomsnittet er basert på tilstrekkelig massivt materiale der driften av loven om store tall er manifestert, og alle ulykker opphever hverandre;
  • ved beregning av gjennomsnittsverdien, er det viktig å fastslå formålet med beregningen og den såkalte definerende indikator-tlf(eiendom) som den skal rettes mot.

Den bestemmende indikatoren kan fungere som summen av verdiene til gjennomsnittsattributtet, summen av dens gjensidige verdier, produktet av verdiene osv. Forholdet mellom den definerende indikatoren og gjennomsnittsverdien uttrykkes som følger: hvis alle verdiene av gjennomsnittsattributtet erstattes av gjennomsnittsverdien, så vil summen eller produktet i dette tilfellet ikke endre den definerende indikatoren. På grunnlag av denne forbindelsen av den bestemmende indikatoren med gjennomsnittsverdien, bygges et innledende kvantitativt forhold for direkte beregning av gjennomsnittsverdien. Evnen til gjennomsnitt til å bevare egenskapene til statistiske populasjoner kalles definere eiendom.

Gjennomsnittsverdien beregnet for befolkningen som helhet kalles generelt gjennomsnitt; gjennomsnittsverdier beregnet for hver gruppe - gruppegjennomsnitt. Det generelle gjennomsnittet gjenspeiler de generelle trekkene til fenomenet som studeres, gruppegjennomsnittet gir en beskrivelse av fenomenet som utvikler seg under de spesifikke forholdene til denne gruppen.

Beregningsmetoder kan være forskjellige, derfor skilles det i statistikk mellom flere typer gjennomsnitt, hvorav de viktigste er det aritmetiske gjennomsnittet, det harmoniske gjennomsnittet og det geometriske gjennomsnittet.

I økonomisk analyse er bruken av gjennomsnitt hovedverktøyet for å vurdere resultatene av vitenskapelig og teknologisk fremgang, sosiale tiltak og søken etter reserver for økonomisk utvikling. Samtidig bør det huskes at overdreven fokus på gjennomsnitt kan føre til partiske konklusjoner når man utfører økonomiske og statistiske analyser. Dette skyldes det faktum at gjennomsnittsverdier, som er generaliserende indikatorer, opphever og ignorerer de forskjellene i de kvantitative egenskapene til individuelle enheter av befolkningen som virkelig eksisterer og kan være av uavhengig interesse.

Typer gjennomsnitt

I statistikk brukes ulike typer gjennomsnitt, som er delt inn i to store klasser:

  • kraftgjennomsnitt (harmonisk gjennomsnitt, geometrisk gjennomsnitt, aritmetisk gjennomsnitt, gjennomsnittlig kvadrat, gjennomsnittlig kubikk);
  • strukturelle gjennomsnitt (modus, median).

Å beregne makt betyr alle tilgjengelige karakteristiske verdier må brukes. Mote og median bestemmes kun av distribusjonsstrukturen, derfor kalles de strukturelle, posisjonelle gjennomsnitt. Medianen og modusen brukes ofte som en gjennomsnittskarakteristikk i de populasjonene der beregningen av gjennomsnittlig eksponentiell er umulig eller upraktisk.

Den vanligste typen gjennomsnitt er det aritmetiske gjennomsnittet. Under aritmetisk gjennomsnitt forstås som en slik verdi av et trekk som hver enhet av befolkningen ville ha hvis summen av alle verdiene av funksjonen ble fordelt jevnt mellom alle enheter i befolkningen. Beregningen av denne verdien reduseres til summeringen av alle verdiene av variabelattributtet og delingen av det resulterende beløpet med det totale antallet befolkningsenheter. For eksempel fullførte fem arbeidere en ordre for produksjon av deler, mens den første produserte 5 deler, den andre - 7, den tredje - 4, den fjerde - 10, den femte - 12. Siden i de første dataene var verdien av hver alternativet forekom bare én gang, for å bestemme den gjennomsnittlige produksjonen til en arbeider bør du bruke den enkle aritmetiske gjennomsnittsformelen:

dvs. i vårt eksempel er den gjennomsnittlige produksjonen til en arbeider lik

Sammen med det enkle aritmetiske gjennomsnittet studerer de vektet aritmetisk gjennomsnitt. La oss for eksempel beregne gjennomsnittsalderen for studenter i en gruppe på 20 personer hvis alder varierer fra 18 til 22 år, der xi- varianter av den gjennomsnittlige funksjonen, fi- frekvens, som viser hvor mange ganger det forekommer i-th verdi i aggregatet (tabell 5.1).

Tabell 5.1

Gjennomsnittlig alder på studenter

Ved å bruke den vektede aritmetiske gjennomsnittsformelen får vi:


Det er en viss regel for å velge et vektet aritmetisk gjennomsnitt: hvis det er en serie data på to indikatorer, for den ene er det nødvendig å beregne

gjennomsnittsverdien, og samtidig de numeriske verdiene av nevneren til dens logiske formel er kjent, og verdiene til telleren er ukjente, men kan finnes som et produkt av disse indikatorene, bør gjennomsnittsverdien beregnes ved å bruke den aritmetiske vektede gjennomsnittsformelen.

I noen tilfeller er arten av de innledende statistiske dataene slik at beregningen av det aritmetiske gjennomsnittet mister sin mening og den eneste generaliserende indikatoren kan bare være en annen type gjennomsnittsverdi - gjennomsnittlig harmonisk. For tiden har beregningsegenskapene til det aritmetiske gjennomsnittet mistet sin relevans i beregningen av generaliserende statistiske indikatorer på grunn av den utbredte introduksjonen av elektroniske datamaskiner. Den gjennomsnittlige harmoniske verdien, som også er enkel og vektet, har fått stor praktisk betydning. Hvis de numeriske verdiene til telleren til den logiske formelen er kjent, og verdiene til nevneren er ukjente, men kan finnes som en privat divisjon av en indikator med en annen, beregnes gjennomsnittsverdien av den vektede harmonisk middelformel.

La det for eksempel bli kjent at bilen kjørte de første 210 km med en hastighet på 70 km/t, og de resterende 150 km med en hastighet på 75 km/t. Det er umulig å bestemme gjennomsnittshastigheten til bilen gjennom hele reisen på 360 km ved å bruke den aritmetiske gjennomsnittsformelen. Siden alternativene er hastighetene i individuelle seksjoner xj= 70 km/t og X2= 75 km/t, og vekter (fi) er de tilsvarende segmentene av banen, vil produktene av alternativer etter vekt verken ha fysisk eller økonomisk betydning. I dette tilfellet er det fornuftig å dele opp segmentene av banen i de tilsvarende hastighetene (alternativer xi), dvs. tiden brukt på å passere individuelle deler av banen (f. / xi). Hvis segmentene av banen er betegnet med fi, blir hele banen uttrykt som Σfi, og tiden brukt på hele banen uttrykkes som Σ fi / xi , Deretter kan gjennomsnittshastigheten finnes som kvotienten av den totale avstanden delt på den totale tiden brukt:

I vårt eksempel får vi:

Hvis når du bruker den gjennomsnittlige harmoniske vekten til alle alternativene (f) er like, kan du i stedet for den vektede enkel (uvektet) harmonisk middelverdi:

hvor xi - individuelle alternativer; n- antall varianter av den gjennomsnittlige funksjonen. I eksemplet med hastighet, kan et enkelt harmonisk middel brukes hvis segmentene av banen som ble kjørt med forskjellige hastigheter var like.

Enhver gjennomsnittsverdi bør beregnes slik at når den erstatter hver variant av den gjennomsnittlige funksjonen, endres ikke verdien til en endelig, generaliserende indikator, som er assosiert med gjennomsnittsindikatoren. Så når du erstatter de faktiske hastighetene på individuelle deler av banen med deres gjennomsnittsverdi (gjennomsnittshastighet), bør den totale avstanden ikke endres.

Formen (formelen) for gjennomsnittsverdien bestemmes av arten (mekanismen) til forholdet mellom denne endelige indikatoren og den gjennomsnittlige, derfor den endelige indikatoren, hvis verdi ikke bør endres når opsjonene erstattes av deres gjennomsnittsverdi , er kalt definerende indikator. For å utlede gjennomsnittsformelen må du komponere og løse en ligning ved å bruke forholdet mellom gjennomsnittsindikatoren og den bestemmende. Denne ligningen er konstruert ved å erstatte variantene av den gjennomsnittlige funksjonen (indikatoren) med deres gjennomsnittsverdi.

I tillegg til det aritmetiske gjennomsnittet og det harmoniske gjennomsnittet, brukes også andre typer (former) av gjennomsnittet i statistikk. Alle er spesielle tilfeller. gradsgjennomsnitt. Hvis vi beregner alle typer kraftlovgjennomsnitt for de samme dataene, så blir verdiene

de vil være like, regelen gjelder her hovedfag medium. Når eksponenten for gjennomsnittet øker, øker også selve gjennomsnittet. De mest brukte formlene i praktisk forskning for å beregne ulike typer kraftmiddelverdier er presentert i tabell. 5.2.

Tabell 5.2


Den geometriske gjennomsnittet brukes når tilgjengelig. n vekstfaktorer, mens de individuelle verdiene til egenskapen som regel er relative verdier av dynamikken, bygget i form av kjedeverdier, i forhold til forrige nivå på hvert nivå i dynamikkserien. Gjennomsnittet preger altså den gjennomsnittlige vekstraten. geometrisk betyr enkel beregnet med formelen

Formel geometrisk gjennomsnitt vektet har følgende form:

Formlene ovenfor er identiske, men den ene brukes med gjeldende koeffisienter eller vekstrater, og den andre - ved absolutte verdier av nivåene i serien.

rot betyr kvadrat brukes ved beregning med verdiene til kvadratfunksjoner, brukes til å måle fluktuasjonsgraden til de individuelle verdiene av attributtet rundt det aritmetiske gjennomsnittet i distribusjonsserien og beregnes med formelen

Gjennomsnittlig kvadrat vektet beregnet med en annen formel:

Gjennomsnittlig kubikk brukes ved beregning med verdiene til kubiske funksjoner og beregnes med formelen

vektet gjennomsnittlig kubikk:

Alle gjennomsnittsverdiene ovenfor kan representeres som en generell formel:

hvor er gjennomsnittsverdien; - individuell verdi; n- antall enheter av den studerte befolkningen; k- eksponent, som bestemmer typen gjennomsnitt.

Når du bruker samme kildedata, jo mer k i den generelle potensmiddelformelen, jo større er gjennomsnittsverdien. Det følger av dette at det er et regelmessig forhold mellom verdiene av maktmidler:

Gjennomsnittsverdiene beskrevet ovenfor gir en generalisert ide om befolkningen som studeres, og fra dette synspunktet er deres teoretiske, anvendte og kognitive betydning udiskutabel. Men det hender at verdien av gjennomsnittet ikke faller sammen med noen av de virkelig eksisterende alternativene, derfor, i tillegg til de vurderte gjennomsnittene, er det i statistisk analyse tilrådelig å bruke verdiene til spesifikke alternativer som opptar en ganske bestemt plassering i en ordnet (rangert) serie med attributtverdier. Blant disse mengdene er de mest brukte strukturell, eller beskrivende, gjennomsnittlig- modus (Mo) og median (Me).

Mote- verdien av egenskapen som oftest finnes i denne populasjonen. Med hensyn til variasjonsserien er modusen den hyppigst forekommende verdien av den rangerte serien, dvs. varianten med høyest frekvens. Mote kan brukes til å bestemme de mest besøkte butikkene, den vanligste prisen for ethvert produkt. Den viser størrelsen på egenskapen som er karakteristisk for en betydelig del av befolkningen, og bestemmes av formelen

hvor x0 er den nedre grensen for intervallet; h- intervallverdi; fm- intervallfrekvens; fm_ 1 - frekvensen til forrige intervall; fm+ 1 - frekvens for neste intervall.

median varianten som ligger i midten av den rangerte raden kalles. Medianen deler serien i to like deler på en slik måte at det på begge sider av den er like mange befolkningsenheter. Samtidig er verdien av variabelattributtet i den ene halvparten av populasjonsenhetene mindre enn medianen, i den andre halvparten er den større enn den. Medianen brukes når man undersøker et element hvis verdi er større enn eller lik eller samtidig mindre enn eller lik halvparten av elementene i distribusjonsserien. Medianen gir en generell ide om hvor verdiene til funksjonen er konsentrert, med andre ord hvor er deres sentrum.

Den beskrivende karakteren til medianen manifesteres i det faktum at den karakteriserer den kvantitative grensen for verdiene til det varierende attributtet, som eies av halvparten av befolkningsenhetene. Problemet med å finne medianen for en diskret variasjonsserie løses enkelt. Hvis alle enheter i serien er gitt serienummer, er serienummeret til medianvarianten definert som (n + 1) / 2 med et oddetall av medlemmer n. Hvis antallet medlemmer av serien er et partall, da vil medianen være gjennomsnittet av to varianter med serienummer n/ 2 og n / 2 + 1.

Ved bestemmelse av medianen i intervallvariasjonsserier bestemmes først intervallet den befinner seg i (medianintervallet). Dette intervallet er karakterisert ved at dets akkumulerte sum av frekvenser er lik eller overstiger halvparten av summen av alle frekvenser i serien. Beregningen av medianen til intervallvariasjonsserien utføres i henhold til formelen

hvor X0- den nedre grensen for intervallet; h- intervallverdi; fm- intervallfrekvens; f- antall medlemmer av serien;

∫m-1 - summen av de akkumulerte leddene i serien som går foran denne.

Sammen med medianen, for en mer fullstendig karakterisering av strukturen til den studerte befolkningen, brukes andre verdier av alternativer, som inntar en ganske bestemt posisjon i den rangerte serien. Disse inkluderer kvartiler og desiler. Kvartiler deler serien med summen av frekvenser i 4 like deler, og desiler - i 10 like deler. Det er tre kvartiler og ni desiler.

Medianen og modusen, i motsetning til det aritmetiske gjennomsnittet, eliminerer ikke individuelle forskjeller i verdiene til et variabelt attributt, og er derfor ekstra og svært viktige kjennetegn ved den statistiske populasjonen. I praksis brukes de ofte i stedet for gjennomsnittet eller sammen med det. Det er spesielt hensiktsmessig å beregne medianen og modusen i de tilfellene når den studerte populasjonen inneholder et visst antall enheter med en veldig stor eller veldig liten verdi av variabelattributtet. Disse verdiene av alternativer, som ikke er veldig karakteristiske for befolkningen, mens de påvirker verdien av det aritmetiske gjennomsnittet, påvirker ikke verdiene til medianen og modusen, noe som gjør sistnevnte svært verdifulle indikatorer for økonomisk og statistisk analyse .

Variasjonsindikatorer

Hensikten med en statistisk studie er å identifisere hovedegenskapene og mønstrene til den studerte statistiske populasjonen. I prosessen med summarisk behandling av statistiske observasjonsdata bygger vi distribusjonslinjer. Det er to typer distribusjonsserier - attributive og variasjonsrekker, avhengig av om attributtet som er lagt til grunn for grupperingen er kvalitativt eller kvantitativt.

variasjon kalt distribusjonsserier bygget på kvantitativ basis. Verdiene av kvantitative egenskaper for individuelle enheter av befolkningen er ikke konstante, mer eller mindre forskjellige fra hverandre. Denne forskjellen i verdien av en egenskap kalles variasjoner. Separate numeriske verdier av egenskapen som forekommer i den studerte befolkningen kalles verdialternativer. Tilstedeværelsen av variasjon i individuelle enheter av befolkningen skyldes påvirkningen av et stort antall faktorer på dannelsen av egenskapsnivået. Studiet av karakteren og graden av variasjon av tegn i individuelle enheter av befolkningen er det viktigste spørsmålet i enhver statistisk studie. Variasjonsindikatorer brukes for å beskrive målet på egenskapsvariabilitet.

En annen viktig oppgave for statistisk forskning er å bestemme rollen til individuelle faktorer eller deres grupper i variasjonen av visse trekk ved befolkningen. For å løse et slikt problem i statistikk brukes spesielle metoder for å studere variasjon, basert på bruk av et system med indikatorer som måler variasjon. I praksis står forskeren overfor et tilstrekkelig stort antall alternativer for verdiene til attributtet, noe som ikke gir en ide om fordelingen av enheter i henhold til verdien av attributtet i aggregatet. For å gjøre dette er alle varianter av attributtverdiene ordnet i stigende eller synkende rekkefølge. Denne prosessen kalles rad rangering. Den rangerte serien gir umiddelbart en generell ide om verdiene som funksjonen tar til sammen.

Mangelen på gjennomsnittsverdien for en uttømmende karakterisering av befolkningen gjør det nødvendig å supplere gjennomsnittsverdiene med indikatorer som gjør det mulig å vurdere typiskheten til disse gjennomsnittene ved å måle fluktuasjonen (variasjonen) av egenskapen som studeres. Bruken av disse variasjonsindikatorene gjør det mulig å gjøre den statistiske analysen mer fullstendig og meningsfull, og dermed bedre forstå essensen av de studerte sosiale fenomenene.

De enkleste tegnene på variasjon er minimum og maksimum - dette er den minste og største verdien av funksjonen i befolkningen. Antallet repetisjoner av individuelle varianter av funksjonsverdier kalles repetisjonsfrekvens. La oss angi frekvensen av gjentakelse av funksjonsverdien fi, summen av frekvenser lik volumet av den studerte populasjonen vil være:

hvor k- antall varianter av attributtverdier. Det er praktisk å erstatte frekvenser med frekvenser - w.i. Frekvens- relativ frekvensindikator - kan uttrykkes i brøkdeler av en enhet eller en prosentandel og lar deg sammenligne variasjonsserier med et annet antall observasjoner. Formelt sett har vi:

For å måle variasjonen til en egenskap, brukes ulike absolutte og relative indikatorer. De absolutte variasjonsindikatorene inkluderer gjennomsnittlig lineært avvik, variasjonsområdet, varians, standardavvik.

Spennvariasjon(R) er forskjellen mellom maksimums- og minimumsverdiene for egenskapen i den studerte populasjonen: R= Xmax - Xmin. Denne indikatoren gir bare den mest generelle ideen om fluktuasjonen av egenskapen som studeres, da den viser forskjellen bare mellom grenseverdiene til variantene. Det er fullstendig urelatert til frekvensene i variasjonsserien, det vil si distribusjonens natur, og dens avhengighet kan gi den en ustabil, tilfeldig karakter bare fra de ekstreme verdiene til attributtet. Variasjonsområdet gir ingen informasjon om egenskapene til de studerte populasjonene og lar oss ikke vurdere graden av typiskhet til de oppnådde gjennomsnittsverdiene. Omfanget av denne indikatoren er begrenset til ganske homogene populasjoner, mer presist karakteriserer den variasjonen av en egenskap, en indikator basert på å ta hensyn til variasjonen til alle verdiene til egenskapen.

For å karakterisere variasjonen til en egenskap, er det nødvendig å generalisere avvikene til alle verdier fra en hvilken som helst verdi som er typisk for befolkningen som studeres. Slike indikatorer

variasjoner, for eksempel gjennomsnittlig lineært avvik, varians og standardavvik, er basert på vurderingen av avvik i verdiene til attributtet til individuelle enheter av populasjonen fra det aritmetiske gjennomsnittet.

Gjennomsnittlig lineært avvik er det aritmetiske gjennomsnittet av de absolutte verdiene av avvikene til individuelle alternativer fra deres aritmetiske gjennomsnitt:


Den absolutte verdien (modulen) av variantavviket fra det aritmetiske gjennomsnittet; f- Frekvens.

Den første formelen brukes hvis hvert av alternativene forekommer i aggregatet bare én gang, og den andre - i serie med ulik frekvens.

Det er en annen måte å snitte avvikene til alternativer fra det aritmetiske gjennomsnittet på. Denne metoden, som er svært vanlig i statistikk, reduseres til å beregne kvadrerte avvik for opsjoner fra gjennomsnittsverdien og deretter snitte dem. I dette tilfellet får vi en ny indikator på variasjon - variansen.

Spredning(σ 2) - gjennomsnittet av kvadrerte avvik av variantene av egenskapsverdiene fra deres gjennomsnittsverdi:

Den andre formelen brukes hvis variantene har sine egne vekter (eller frekvenser av variasjonsserien).

I økonomisk og statistisk analyse er det vanlig å evaluere variasjonen av et attributt oftest ved å bruke standardavviket. Standardavvik(σ) er kvadratroten av variansen:

De gjennomsnittlige lineære og gjennomsnittlige kvadratiske avvikene viser hvor mye verdien av attributtet svinger i gjennomsnitt for enhetene i populasjonen som studeres, og uttrykkes i samme enheter som variantene.

I statistisk praksis blir det ofte nødvendig å sammenligne variasjonen av ulike funksjoner. For eksempel er det av stor interesse å sammenligne variasjoner i alder på personell og deres kvalifikasjoner, tjenestetid og lønn osv. For slike sammenligninger er indikatorer for den absolutte variabiliteten til tegn - gjennomsnittlig lineært og standardavvik - ikke egnet. . Det er faktisk umulig å sammenligne svingningen i arbeidserfaring, uttrykt i år, med svingningen i lønn, uttrykt i rubler og kopek.

Når man sammenligner variasjonen til ulike egenskaper i aggregatet, er det praktisk å bruke relative variasjonsindikatorer. Disse indikatorene beregnes som forholdet mellom absolutte indikatorer og det aritmetiske gjennomsnittet (eller medianen). Ved å bruke som en absolutt variasjonsindikator variasjonsområdet, det gjennomsnittlige lineære avviket, standardavviket, får man de relative fluktuasjonsindikatorene:


Den mest brukte indikatoren på relativ volatilitet, som karakteriserer homogeniteten til befolkningen. Settet anses som homogent dersom variasjonskoeffisienten ikke overstiger 33 % for fordelinger nær normalen.