Biografier Kjennetegn Analyse

Hvordan finne det aritmetiske gjennomsnittet i statistikk. Gjennomsnittsverdier i statistikk

Dette begrepet har andre betydninger, se gjennomsnittlig betydning.

Aritmetisk gjennomsnitt(i matematikk og statistikk) sett med tall - summen av alle tall delt på antallet. Det er et av de vanligste målene for sentral tendens.

Det ble foreslått (sammen med det geometriske gjennomsnittet og det harmoniske gjennomsnittet) av pytagoreerne.

Spesielle tilfeller av det aritmetiske gjennomsnittet er gjennomsnittet ( befolkning) og prøvegjennomsnitt (prøver).

Introduksjon

La oss betegne settet med data X = (x 1 , x 2 , …, x n), så indikeres prøvegjennomsnittet vanligvis med en horisontal strek over variabelen (x ¯ (\displaystyle (\bar (x))), uttalt " x med en strek").

Den greske bokstaven μ brukes for å betegne det aritmetiske gjennomsnittet av hele befolkningen. For en tilfeldig variabel som middelverdien er bestemt for, er μ sannsynlig gjennomsnitt eller matematisk forventning tilfeldig variabel. Hvis settet X er en samling tilfeldige tall med et sannsynlig gjennomsnitt μ, deretter for en hvilken som helst prøve x jeg fra dette settet μ = E( x jeg) er den matematiske forventningen til denne prøven.

I praksis er forskjellen mellom μ og x ¯ (\displaystyle (\bar (x))) at μ er en typisk variabel fordi du kan se et utvalg i stedet for hele populasjonen. Derfor, hvis utvalget er representert tilfeldig (i form av sannsynlighetsteori), kan x ¯ (\displaystyle (\bar (x))) (men ikke μ) behandles som en tilfeldig variabel med en sannsynlighetsfordeling på utvalget ( sannsynlighetsfordelingen av gjennomsnittet).

Begge disse mengdene beregnes på samme måte:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Hvis X er en tilfeldig variabel, deretter den matematiske forventningen X kan betraktes som det aritmetiske gjennomsnittet av verdier i gjentatte målinger av en mengde X. Dette er en manifestasjon av loven store antall. Derfor brukes prøvegjennomsnittet for å estimere den ukjente forventede verdien.

I elementær algebra er det bevist at gjennomsnittet n+ 1 tall over gjennomsnittet n tall hvis og bare hvis det nye tallet er større enn det gamle gjennomsnittet, mindre hvis og bare hvis det nye tallet er mindre enn gjennomsnittet, og endres ikke hvis og bare hvis det nye tallet er lik gjennomsnittet. Jo flere n, jo mindre er forskjellen mellom de nye og gamle gjennomsnittene.

Legg merke til at det er flere andre "gjennomsnitt", inkludert potensmiddelverdien, Kolmogorov-middelverdien, det harmoniske gjennomsnittet, det aritmetisk-geometriske gjennomsnittet og forskjellige vektede gjennomsnitt (f.eks. vektet aritmetisk gjennomsnitt, vektet geometrisk gjennomsnitt, vektet harmonisk gjennomsnitt).

Eksempler

  • For tre tall må du legge dem til og dele på 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • For fire tall må du legge dem til og dele på 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Eller enklere 5+5=10, 10:2. Fordi vi la til 2 tall, som betyr hvor mange tall vi legger til, deler vi på så mange.

Kontinuerlig tilfeldig variabel

For en kontinuerlig distribuert mengde f (x) (\displaystyle f(x)), er det aritmetiske gjennomsnittet på intervallet [ a ; b ] (\displaystyle ) bestemmes gjennom en bestemt integral:

F (x) ¯ [a; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Noen problemer med å bruke gjennomsnittet

Mangel på robusthet

Hovedartikkel: Robusthet i statistikk

Selv om aritmetiske gjennomsnitt ofte brukes som gjennomsnitt eller sentrale tendenser, gjelder ikke dette begrepet for robust statistikk, som betyr at det aritmetiske gjennomsnittet er underlagt sterk innflytelse"store avvik" Det er bemerkelsesverdig at for fordelinger med stor skjevhetskoeffisient, kan det aritmetiske gjennomsnittet ikke samsvare med begrepet "middelverdi", og verdiene av gjennomsnittet fra robust statistikk (for eksempel medianen) kan bedre beskrive den sentrale tendens.

Et klassisk eksempel er beregning av gjennomsnittsinntekt. Det aritmetiske gjennomsnittet kan feiltolkes som en median, noe som kan føre til at det er flere med høyere inntekt enn det faktisk er. "Gjennomsnittlig" inntekt tolkes som at folk flest har inntekter rundt dette tallet. Denne «gjennomsnittlige» (i betydningen det aritmetiske gjennomsnittet) inntekten er høyere enn inntektene til folk flest, siden en høy inntekt med stort avvik fra gjennomsnittet gjør det aritmetiske gjennomsnittet svært skjevt (i motsetning til dette er gjennomsnittsinntekten ved medianen). "motstår" slik skjevhet). Denne «gjennomsnittlige» inntekten sier imidlertid ingenting om antall personer i nærheten av medianinntekten (og sier ingenting om antall personer nær den modale inntekten). Men hvis du tar lett på begrepene «gjennomsnittlig» og «folk flest», kan du trekke den feilaktige konklusjonen at folk flest har høyere inntekter enn de faktisk har. For eksempel vil en rapport om den "gjennomsnittlige" nettoinntekten i Medina, Washington, beregnet som det aritmetiske gjennomsnittet av alle årlige nettoinntekter til innbyggere, gi et overraskende stort tall på grunn av Bill Gates. Tenk på prøven (1, 2, 2, 2, 3, 9). Det aritmetiske gjennomsnittet er 3,17, men fem av seks verdier er under dette gjennomsnittet.

Sammensatt rente

Hovedartikkel: Avkastning på investeringen

Hvis tallene multiplisere, ikke brette, må du bruke det geometriske gjennomsnittet, ikke det aritmetiske gjennomsnittet. Oftest oppstår denne hendelsen ved beregning av avkastningen på investeringen i finans.

For eksempel, hvis en aksje falt 10 % det første året og steg 30 % i det andre, er det feil å beregne den "gjennomsnittlige" økningen over disse to årene som det aritmetiske gjennomsnittet (−10 % + 30 %) / 2 = 10%; det korrekte gjennomsnittet i dette tilfellet er gitt av den sammensatte årlige vekstraten, som gir en årlig vekstrate på bare ca. 8,16653826392% ≈ 8,2%.

Grunnen til dette er at prosenter har et nytt utgangspunkt hver gang: 30 % er 30 % fra et tall mindre enn prisen ved begynnelsen av det første året: hvis en aksje startet på $30 og falt 10%, er den verdt $27 ved starten av det andre året. Hvis aksjen steg 30 %, ville den være verdt 35,1 dollar på slutten av det andre året. Det aritmetiske gjennomsnittet av denne veksten er 10 %, men siden aksjen kun har steget med $5,1 over 2 år, gir den gjennomsnittlige veksten på 8,2% et sluttresultat på $35,1:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $35,1]. Hvis vi bruker gjennomsnittet på samme måte aritmetisk verdi 10 %, får vi ikke den faktiske verdien: [$30 (1 + 0,1) (1 + 0,1) = $36,3].

Rentesammensatt ved slutten av 2 år: 90 % * 130 % = 117 %, det vil si at den totale økningen er 17 %, og gjennomsnittlig årlig renters rente 117 % ≈ 108,2 % (\displaystyle (\sqrt (117\%))\ca. 108,2\%), dvs. gjennomsnittlig årlig vekst 8,2 %.

Veibeskrivelse

Hovedartikkel: Destinasjonsstatistikk

Når man beregner det aritmetiske gjennomsnittet av en variabel som endres syklisk (som fase eller vinkel), må man være spesielt forsiktig. For eksempel vil gjennomsnittet av 1° og 359° være 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Dette tallet er feil av to grunner.

  • For det første vinkelmål er definert bare for området fra 0° til 360° (eller fra 0 til 2π målt i radianer). Så det samme tallparet kan skrives som (1° og −1°) eller som (1° og 719°). Gjennomsnittsverdiene for hvert par vil være forskjellige: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ circ )) .
  • For det andre, i i dette tilfellet, vil en verdi på 0° (tilsvarer 360°) være et geometrisk bedre gjennomsnitt, siden tallene avviker mindre fra 0° enn fra noen annen verdi (verdien 0° har den minste variansen). Sammenligne:
    • tallet 1° avviker fra 0° med bare 1°;
    • tallet 1° avviker fra det beregnede gjennomsnittet på 180° ganger 179°.

Gjennomsnittsverdien for en syklisk variabel beregnet ved hjelp av formelen ovenfor vil bli kunstig forskjøvet i forhold til det reelle gjennomsnittet mot midten av det numeriske området. På grunn av dette beregnes gjennomsnittet på en annen måte, nemlig tallet med den minste variansen (midtpunktet) velges som gjennomsnittsverdi. Dessuten, i stedet for subtraksjon, brukes den modulære avstanden (det vil si omkretsavstanden). For eksempel er den modulære avstanden mellom 1° og 359° 2°, ikke 358° (på en sirkel mellom 359° og 360°==0° - én grad, mellom 0° og 1° - også 1°, totalt -2°).

4.3. Gjennomsnittsverdier. Essensen og betydningen av gjennomsnittsverdier

Gjennomsnittlig størrelse i statistikk er en generell indikator som kjennetegner typisk nivå fenomener i spesifikke forhold for sted og tid, som gjenspeiler verdien av en varierende egenskap per enhet av en kvalitativt homogen populasjon. I økonomisk praksis brukes et bredt spekter av indikatorer, beregnet som gjennomsnittsverdier.

For eksempel er en generell indikator på inntekten til arbeidere i et aksjeselskap (JSC) gjennomsnittsinntekten til en arbeider, bestemt av forholdet mellom lønnsfondet og sosiale utbetalinger for perioden under vurdering (år, kvartal, måned ) til antall arbeidere i JSC.

Å beregne gjennomsnittet er en av de vanlige generaliseringsteknikkene; gjennomsnittsindikatoren reflekterer hva som er felles (typisk) for alle enheter av befolkningen som studeres, samtidig som den ignorerer forskjellene mellom individuelle enheter. I hvert fenomen og dets utvikling er det en kombinasjon ulykker Og nødvendighet. Ved beregning av gjennomsnitt, på grunn av loven om store tall, kansellerer tilfeldigheten og balanserer ut, så det er mulig å abstrahere fra de uviktige egenskapene til fenomenet, fra de kvantitative verdiene til attributtet i hvert enkelt tilfelle. Evnen til å abstrahere fra tilfeldighet individuelle verdier, svingninger og konkluderte vitenskapelig verdi gjennomsnittlig som generalisere egenskaper ved populasjoner.

Når behovet for generalisering oppstår, fører beregningen av slike egenskaper til erstatning av mange forskjellige individuelle verdier av attributtet gjennomsnittlig en indikator som karakteriserer hele settet av fenomener, som gjør det mulig å identifisere mønstre som ligger i masse sosiale fenomener som er usynlige i individuelle fenomener.

Gjennomsnittet gjenspeiler det karakteristiske, typiske, reelle nivået til fenomenene som studeres, karakteriserer disse nivåene og deres endringer i tid og rom.

Gjennomsnittet er en oppsummerende karakteristikk av prosessens lover under forholdene der den oppstår.

4.4. Typer gjennomsnitt og metoder for å beregne dem

Valget av typen gjennomsnitt bestemmes av det økonomiske innholdet i en viss indikator og kildedata. I hvert enkelt tilfelle brukes en av gjennomsnittsverdiene: aritmetikk, garmonisk, geometrisk, kvadratisk, kubisk osv. De oppførte gjennomsnittene tilhører klassen beroligende gjennomsnittlig.

I tillegg til effektgjennomsnitt brukes strukturelle gjennomsnitt i statistisk praksis, som anses å være modus og median.

La oss dvele mer detaljert på kraftgjennomsnitt.

Aritmetisk gjennomsnitt

Den vanligste typen gjennomsnitt er gjennomsnittlig aritmetikk. Den brukes i tilfeller der volumet av en varierende karakteristikk for hele befolkningen er summen av verdiene av egenskapene til dens individuelle enheter. Sosiale fenomener er preget av additiviteten (sammendraget) av volumene til en varierende karakteristikk, dette bestemmer anvendelsesområdet for det aritmetiske gjennomsnittet og forklarer dets utbredelse som en generell indikator, for eksempel: det totale lønnsfondet er summen av lønn; alle arbeidere er bruttoavlingen summen av produkter produsert fra hele såsesongen.

For å beregne det aritmetiske gjennomsnittet, må du dele summen av alle funksjonsverdier med antallet.

Det aritmetiske gjennomsnittet brukes i skjemaet enkelt gjennomsnitt og vektet gjennomsnitt. Den innledende, definerende formen er det enkle gjennomsnittet.

Enkelt aritmetisk gjennomsnitt lik den enkle summen av de individuelle verdiene for karakteristikken som gjennomsnittliggjøres, delt på det totale antallet av disse verdiene (den brukes i tilfeller der det er ugruppert individuelle verdier skilt):

Hvor
- individuelle verdier av variabelen (varianter); m - antall enheter i befolkningen.

Videre vil summeringsgrensene ikke være angitt i formlene. For eksempel må du finne den gjennomsnittlige produksjonen til én arbeider (mekaniker) hvis du vet hvor mange deler hver av 15 arbeidere produserte, dvs. en rekke individuelle verdier av karakteristikken er gitt, stk.:

21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

Det enkle aritmetiske gjennomsnittet beregnes ved hjelp av formel (4.1), 1 stk.:

Gjennomsnittet av alternativene som gjentas annet nummer tider, eller som de sier, har forskjellig vekt, kalles vektet. Vektene er antall enheter i ulike grupper av befolkningen (identiske alternativer er kombinert til en gruppe).

Aritmetisk gjennomsnitt vektet- gjennomsnitt av grupperte verdier, - beregnes ved hjelp av formelen:

, (4.2)

Hvor
- vekt (hyppighet av gjentakelse av identiske tegn);

- summen av produktene av størrelsen på funksjoner og deres frekvenser;

- det totale antallet befolkningsenheter.

Vi illustrerer teknikken for å beregne det vektede aritmetiske gjennomsnittet ved å bruke eksemplet diskutert ovenfor. For å gjøre dette vil vi gruppere kildedataene og plassere dem i en tabell. 4.1.

Tabell 4.1

Fordeling av arbeidere for deleproduksjon

I henhold til formel (4.2) er det vektede aritmetiske gjennomsnittet lik, stk.:

I noen tilfeller kan vekter ikke presenteres som absolutte verdier, men som relative (i prosenter eller brøkdeler av en enhet). Da vil formelen for det aritmetiske vektede gjennomsnittet se slik ut:

Hvor
- særegenhet, dvs. andelen av hver frekvens i den totale summen av alle

Hvis frekvenser telles i brøker (koeffisienter), da
= 1, og formelen for det aritmetisk vektede gjennomsnittet har formen:

Beregning av det vektede aritmetiske gjennomsnittet fra gruppemidler utføres i henhold til formelen:

,

Hvor f-antall enheter i hver gruppe.

Resultatene av beregning av det aritmetiske gjennomsnittet fra gruppemidler er presentert i tabell. 4.2.

Tabell 4.2

Fordeling av arbeidere etter gjennomsnittlig tjenestetid

I dette eksemplet er ikke alternativene individuelle data om tjenestetiden til individuelle arbeidere, men gjennomsnittet for hvert verksted. Vekten f er antall arbeidere i butikkene. Derfor vil gjennomsnittlig arbeidserfaring for arbeidere i hele bedriften være år:

.

Beregning av det aritmetiske gjennomsnittet i distribusjonsrekker

Hvis verdiene til karakteristikken som gjennomsnittliggjøres er spesifisert i form av intervaller ("fra - til"), dvs. intervallserien til fordelingen, når man beregner det aritmetiske gjennomsnittet, blir midtpunktene til disse intervallene tatt som verdiene til egenskapene i gruppene, noe som resulterer i dannelsen av en diskret serie. Tenk på følgende eksempel (tabell 4.3).

La oss gå fra en intervallserie til en diskret serie ved å erstatte intervallverdier deres gjennomsnittsverdier/(enkelt gjennomsnitt

Tabell 4.3

Fordeling av JSC-arbeidere etter månedlig lønnsnivå

Grupper av arbeidere

Antall arbeidere

Midt i intervallet

lønn, gni.

mennesker, f

gni., X

900 eller mer

verdiene til åpne intervaller (første og siste) er betinget likestilt med intervallene ved siden av dem (andre og nest siste).

Med denne beregningen av gjennomsnittet tillates en viss unøyaktighet, siden det forutsettes en enhetlig fordeling av enhetene av karakteristikken i gruppen. Men jo smalere intervall og jo flere enheter i intervallet, jo mindre feil.

Etter at midtpunktene til intervallene er funnet, gjøres beregningene på samme måte som i diskrete serier, - alternativer multipliseres med frekvenser (vekter) og summen av produktene er delt på summen av frekvenser (vekter), tusen rubler:

.

Så, mellomnivå godtgjørelse for JSC-arbeidere er 729 rubler. per måned.

Å beregne det aritmetiske gjennomsnittet innebærer ofte mye tid og arbeid. Men i en rekke tilfeller kan prosedyren for å beregne gjennomsnittet forenkles og forenkles hvis du bruker egenskapene. La oss presentere (uten bevis) noen grunnleggende egenskaper aritmetisk gjennomsnitt.

Eiendom 1. Hvis alle individuelle verdier av en egenskap (dvs. alle alternativer) redusere eller øke jegganger, deretter gjennomsnittsverdien ny karakteristikk vil tilsvarende avta eller øke i jegen gang.

Eiendom 2. Hvis alle varianter av karakteristikken som gjennomsnittsberegnes, reduseressy eller øke med tallet A, så tilsvarer det aritmetiske gjennomsnittetvil faktisk redusere eller øke med samme tall A.

Eiendom 3. Hvis vektene til alle gjennomsnittlige opsjoner reduseres eller øke med Til ganger, vil det aritmetiske gjennomsnittet ikke endres.

Som gjennomsnittlige vekter, i stedet for absolutte indikatorer, kan du bruke egenvekt V samlet resultat(andeler eller prosenter). Dette forenkler beregningene av gjennomsnittet.

For å forenkle beregningene av gjennomsnittet, følger de veien for å redusere verdiene til opsjoner og frekvenser. Den største forenklingen oppnås når, som EN verdien av et av de sentrale alternativene, som har høyest frekvens, velges som / - verdien av intervallet (for serier med like intervaller). Mengden A kalles referansepunktet, derfor kalles denne metoden for å beregne gjennomsnittet "metoden for å telle fra betinget null" eller «i veien for øyeblikk».

La oss anta at alle alternativer X først redusert med samme tall A, og deretter redusert med jeg en gang. Vi får en ny variasjonsserie av distribusjon av nye opsjoner .

Da nye alternativer vil komme til uttrykk:

,

og deres nye aritmetiske gjennomsnitt , -første ordre øyeblikk-formel:

.

Det er lik gjennomsnittet av innledende alternativer, redusert først med EN, og så inn jeg en gang.

For å få det virkelige gjennomsnittet, er det nødvendig med et første-ordens øyeblikk m 1 , gange med jeg og legg til EN:

.

Denne metodenå beregne det aritmetiske gjennomsnittet fra en variasjonsserie kalles «i veien for øyeblikk». Denne metoden brukes i serie med med like intervaller.

Beregningen av det aritmetiske gjennomsnittet ved bruk av momentmetoden er illustrert av dataene i tabell. 4.4.

Tabell 4.4

Fordeling av små foretak i regionen etter verdi av anleggsmidler (FPF) i 2000.

Grupper av foretak etter OPF-verdi, tusen rubler.

Antall foretak f

Midtpunkter i intervaller x

14-16 16-18 18-20 20-22 22-24

Å finne det første bestillingsmomentet

.

Deretter tar du A = 19 og vet det jeg= 2, beregn X, tusen rubler:

Typer gjennomsnittsverdier og metoder for deres beregning

På stadiet av statistisk behandling kan en rekke forskningsproblemer settes, for løsningen som det er nødvendig å velge riktig gjennomsnitt. I dette tilfellet er det nødvendig å bli ledet av følgende regel: mengdene som representerer telleren og nevneren til gjennomsnittet må være logisk relatert til hverandre.

  • kraftgjennomsnitt;
  • strukturelle gjennomsnitt.

La oss introdusere følgende konvensjoner:

Mengdene som gjennomsnittet er beregnet for;

Gjennomsnitt, der linjen ovenfor indikerer at gjennomsnittsberegning av individuelle verdier finner sted;

Frekvens (repeterbarhet av individuelle karakteristiske verdier).

Ulike gjennomsnitt er avledet fra generell formel gjennomsnittlig effekt:

(5.1)

når k = 1 - aritmetisk gjennomsnitt; k = -1 - harmonisk gjennomsnitt; k = 0 - geometrisk gjennomsnitt; k = -2 - rotmiddelkvadrat.

Gjennomsnittsverdier kan være enkle eller vektet. Vektet gjennomsnitt kalles mengder som tar hensyn til at noen varianter av attributtverdier kan ha forskjellige tall, og derfor må hvert alternativ multipliseres med dette tallet. Med andre ord er «skalaene» antall samlede enheter i ulike grupper, dvs. Hvert alternativ er "vektet" etter frekvensen. Frekvensen f kalles statistisk vekt eller gjennomsnittlig vekt.

Aritmetisk gjennomsnitt- den vanligste typen gjennomsnitt. Den brukes når beregningen utføres på ugrupperte statistiske data, hvor du må få gjennomsnittstermen. Det aritmetiske gjennomsnittet er gjennomsnittsverdien av en karakteristikk, ved oppnåelse av denne forblir det totale volumet av karakteristikken i aggregatet uendret.

Formel for aritmetisk gjennomsnitt ( enkel) har formen

hvor n er populasjonsstørrelsen.

For eksempel beregnes gjennomsnittslønnen til en bedrifts ansatte som det aritmetiske gjennomsnittet:

De avgjørende indikatorene her er lønnen til hver ansatt og antall ansatte i bedriften. Ved beregning av gjennomsnittet totalt beløp lønnen forble den samme, men fordelt likt på alle arbeidere. For eksempel må du beregne gjennomsnittslønnen til arbeidere i et lite selskap som sysselsetter 8 personer:

Ved beregning av gjennomsnittsverdier kan individuelle verdier av karakteristikken som er gjennomsnittet gjentas, så gjennomsnittsverdien beregnes ved hjelp av grupperte data. I dette tilfellet vi snakker om om bruk aritmetisk gjennomsnitt vektet, som har formen

(5.3)

Så vi må beregne gjennomsnittsprisen på aksjer i et aksjeselskap ved børshandel. Det er kjent at transaksjonene ble utført innen 5 dager (5 transaksjoner), antall aksjer solgt til salgskurs ble fordelt som følger:

1 - 800 ak. - 1010 gni.

2 - 650 ak. - 990 gni.

3 - 700 ak. - 1015 gni.

4 - 550 ak. - 900 gni.

5 - 850 ak. - 1150 gni.

Det første forholdet for å bestemme gjennomsnittsprisen på aksjer er forholdet mellom det totale antallet transaksjoner (TVA) og antall solgte aksjer (KPA).

Den vanligste typen gjennomsnitt er det aritmetiske gjennomsnittet.

Enkel aritmetisk gjennomsnitt

Et enkelt aritmetisk gjennomsnitt er gjennomsnittsleddet, for å bestemme hvilket totalvolumet av en gitt attributt i dataene er likt fordelt mellom alle enheter inkludert i den gitte populasjonen. Dermed er gjennomsnittlig årlig produksjon per ansatt mengden produksjon som ville blitt produsert av hver ansatt hvis hele produksjonsvolumet var likt fordelt mellom alle ansatte i organisasjonen. Den aritmetiske gjennomsnittlige enkelverdien beregnes ved å bruke formelen:

Enkelt aritmetisk gjennomsnitt– Lik forholdet mellom summen av individuelle verdier av en egenskap og antall egenskaper i aggregatet

Eksempel 1 .

Et team på 6 arbeidere mottar 3 3,2 3,3 3,5 3,8 3,1 tusen rubler per måned.
Finn gjennomsnittslønn

Løsning: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 tusen rubler.

Aritmetisk gjennomsnitt vektet

Hvis volumet til datasettet er stort og representerer en distribusjonsserie, beregnes det vektede aritmetiske gjennomsnittet. Slik bestemmes den veide gjennomsnittsprisen per produksjonsenhet: den totale produksjonskostnaden (summen av produktene av dens mengde med prisen på en produksjonsenhet) deles på den totale produksjonsmengden.

La oss forestille oss dette i form av følgende formel: Vektet aritmetisk gjennomsnitt

— lik forholdet mellom (summen av produktene av verdien av et trekk og gjentakelsesfrekvensen av dette trekk) til (summen av frekvensene til alle trekk Det brukes når varianter av populasjonen som studeres forekommer). ulikt antall ganger. Eksempel 2

.

Finn gjennomsnittslønnen til verkstedarbeidere per måned

Gjennomsnittlig lønn kan oppnås ved å dele den totale lønnen med det totale antallet arbeidere:

Svar: 3,35 tusen rubler.

Aritmetisk gjennomsnitt for intervallserier

Når du beregner det aritmetiske gjennomsnittet for en intervallvariasjonsserie, bestemmer du først gjennomsnittet for hvert intervall som halvsummen av øvre og nedre grense, og deretter gjennomsnittet av hele serien. Ved åpne intervaller bestemmes verdien av det nedre eller øvre intervallet av størrelsen på intervallene ved siden av dem. Gjennomsnitt beregnet fra intervallserier er omtrentlige. Eksempel 3. Definere

middelalder

Ved beregning av gjennomsnitt kan ikke bare absolutte, men også relative verdier (frekvens) brukes som vekter:

Det aritmetiske gjennomsnittet har en rekke egenskaper som mer fullstendig avslører essensen og forenkler beregninger:

1. Produktet av gjennomsnittet ved summen av frekvenser er alltid lik summen av produktene av varianten etter frekvenser, dvs.

2. Middels aritmetisk sum varierende mengder er lik summen av de aritmetiske gjennomsnittene av disse størrelsene:

3. Den algebraiske summen av avvik av individuelle verdier av en karakteristikk fra gjennomsnittet er null:

4. Summen av kvadrerte avvik for opsjoner fra gjennomsnittet er mindre enn summen av kvadrerte avvik fra enhver annen vilkårlig verdi, dvs.

For å finne gjennomsnittsverdien i Excel (uansett om det er en numerisk, tekst, prosentverdi eller annen verdi), er det mange funksjoner. Og hver av dem har sine egne egenskaper og fordeler. I denne oppgaven kan visse betingelser stilles.

For eksempel beregnes gjennomsnittsverdiene til en serie tall i Excel ved hjelp av statistiske funksjoner. Du kan også legge inn manuelt egen formel. La oss vurdere ulike alternativer.

Hvordan finne det aritmetiske gjennomsnittet av tall?

For å finne det aritmetiske gjennomsnittet, må du legge sammen alle tallene i settet og dele summen på mengden. For eksempel en elevs karakterer i informatikk: 3, 4, 3, 5, 5. Hva er inkludert i kvartalet: 4. Vi fant det aritmetiske gjennomsnittet ved å bruke formelen: =(3+4+3+5+5) /5.

Hvordan gjøre dette raskt ved hjelp av Excel-funksjoner? La oss for eksempel ta en serie med tilfeldige tall i en streng:

Eller: lag den aktive cellen og skriv inn formelen manuelt: =AVERAGE(A1:A8).

La oss nå se hva annet AVERAGE-funksjonen kan gjøre.


La oss finne det aritmetiske gjennomsnittet av de to første og tre siste tallene. Formel: =GJENNOMSNITT(A1:B1,F1:H1). Resultat:



Tilstand gjennomsnittlig

Betingelsen for å finne det aritmetiske gjennomsnittet kan være et numerisk kriterium eller et tekstkriterium. Vi vil bruke funksjonen: =AVERAGEIF().

Finn gjennomsnittet aritmetiske tall, som er større enn eller lik 10.

Funksjon: =AVERAGEIF(A1:A8,">=10")


Resultatet av bruk av AVERAGEIF-funksjonen under betingelsen ">=10":

Det tredje argumentet – «Gjennomsnittlig rekkevidde» – er utelatt. For det første er det ikke nødvendig. For det andre inneholder området som er analysert av programmet BARE numeriske verdier. Cellene spesifisert i det første argumentet vil bli søkt i henhold til betingelsen spesifisert i det andre argumentet.

Oppmerksomhet! Søkekriteriet kan spesifiseres i cellen. Og lag en lenke til den i formelen.

La oss finne gjennomsnittsverdien av tallene ved å bruke tekstkriteriet. For eksempel gjennomsnittlig salg av produktet "tabeller".

Funksjonen vil se slik ut: =AVERAGEIF($A$2:$A$12,A7,$B$2:$B$12). Område – en kolonne med produktnavn. Søkekriteriet er en lenke til en celle med ordet "tabeller" (du kan sette inn ordet "tabeller" i stedet for lenke A7). Gjennomsnittlig område – de cellene som data vil bli hentet fra for å beregne gjennomsnittsverdien.

Som et resultat av å beregne funksjonen får vi følgende verdi:

Oppmerksomhet! For et tekstkriterium (betingelse) må gjennomsnittsområdet spesifiseres.

Hvordan beregne den vektede gjennomsnittsprisen i Excel?

Hvordan fant vi ut den vektede gjennomsnittsprisen?

Formel: =SUMPRODUKT(C2:C12;B2:B12)/SUM(C2:C12).


Ved å bruke SUMPRODUCT-formelen finner vi ut den totale inntekten etter å ha solgt hele varemengden. Og SUM-funksjonen summerer opp mengden varer. Ved å dele de totale inntektene fra varesalget på det totale antallet vareenheter, fant vi vektet gjennomsnittspris. Denne indikatoren tar hensyn til "vekten" til hver pris. Hennes andel i total masse verdier.

Standardavvik: formel i Excel

Det er et skille mellom standardavvik for den generelle populasjonen og for utvalget. I det første tilfellet er dette roten til generell variasjon. I den andre, fra utvalget varians.

For å beregne denne statistiske indikatoren er det utarbeidet en spredningsformel. Roten trekkes ut av den. Men i Excel er det en ferdig funksjon for å finne standardavviket.


Standardavviket er knyttet til skalaen til kildedataene. Dette er ikke nok for en figurativ representasjon av variasjonen i det analyserte området. For å oppnå det relative nivået av dataspredning, beregnes variasjonskoeffisienten:

standardavvik / aritmetisk gjennomsnitt

Formelen i Excel ser slik ut:

STDEV (verdiområde) / AVERAGE (verdiområde).

Variasjonskoeffisienten beregnes i prosent. Derfor setter vi prosentformatet i cellen.

5.1. Begrepet gjennomsnitt

Gjennomsnittlig verdi – Dette er en generell indikator som karakteriserer det typiske nivået av fenomenet. Det uttrykker verdien av en egenskap per enhet av befolkningen.

Gjennomsnittet generaliserer alltid den kvantitative variasjonen til en egenskap, dvs. i gjennomsnittsverdier elimineres individuelle forskjeller mellom enheter i populasjonen på grunn av tilfeldige omstendigheter. I motsetning til gjennomsnittet absolutt verdi, som karakteriserer nivået av en egenskap for en individuell enhet av en populasjon, tillater ikke en å sammenligne verdiene til en egenskap blant enheter som tilhører forskjellige populasjoner. Så hvis du trenger å sammenligne lønnsnivåene til arbeidere ved to bedrifter, kan du ikke sammenligne to ansatte i forskjellige bedrifter på dette grunnlaget. Kompensasjonen til arbeidstakere som er valgt ut for sammenligning er kanskje ikke typisk for disse virksomhetene. Sammenligner vi størrelsen på lønnsmidlene ved de aktuelle virksomhetene, tas det ikke hensyn til antall ansatte, og det er derfor umulig å fastslå hvor lønnsnivået er høyere. Til syvende og sist er det kun gjennomsnittlige indikatorer som kan sammenlignes, dvs. Hvor mye tjener en ansatt i gjennomsnitt ved hver bedrift? Det er derfor behov for å beregne gjennomsnittsverdien som en generaliserende karakteristikk av befolkningen.

Å beregne gjennomsnittet er en av de vanlige generaliseringsteknikkene; gjennomsnittsindikatoren fornekter det som er felles (typisk) for alle enheter av befolkningen som studeres, samtidig som den ignorerer forskjellene til individuelle enheter. I ethvert fenomen og dets utvikling er det en kombinasjon av tilfeldighet og nødvendighet. Ved beregning av gjennomsnitt, på grunn av virkningen av loven om store tall, kansellerer tilfeldigheten og balanserer ut, så det er mulig å abstrahere fra de uviktige egenskapene til fenomenet, fra de kvantitative verdiene til karakteristikken i hvert enkelt tilfelle . Evnen til å abstrahere fra tilfeldighetene til individuelle verdier og svingninger ligger i den vitenskapelige verdien av gjennomsnitt som generaliserende egenskaper ved aggregater.

For at gjennomsnittet skal være virkelig representativt, må det beregnes under hensyntagen til visse prinsipper.

La oss dvele ved noen generelle prinsipper for bruk av gjennomsnitt.
1. Gjennomsnittet skal bestemmes for populasjoner som består av kvalitativt homogene enheter.
2. Gjennomsnittet skal beregnes for en befolkning bestående av tilstrekkelig stort antall enheter.
3. Gjennomsnittet skal beregnes for en befolkning hvis enheter er i normal, naturlig tilstand.
4. Gjennomsnittet bør beregnes under hensyntagen til det økonomiske innholdet i indikatoren som studeres.

5.2. Typer gjennomsnitt og metoder for å beregne dem

La oss nå vurdere typene gjennomsnittsverdier, funksjonene i deres beregning og bruksområder. Gjennomsnittsverdier er delt inn i to store klasser: kraftgjennomsnitt, strukturelle gjennomsnitt.

TIL gjennomsnittlig effekt Disse inkluderer de mest kjente og ofte brukte typene, som geometrisk gjennomsnitt, aritmetisk gjennomsnitt og kvadratisk gjennomsnitt.

Som strukturelle gjennomsnitt modus og median vurderes.

La oss fokusere på kraftgjennomsnitt. Effektgjennomsnitt, avhengig av presentasjonen av kildedataene, kan være enkle eller vektet. Enkelt gjennomsnitt Den beregnes basert på ugrupperte data og har følgende generelle form:

hvor X i er varianten (verdien) av karakteristikken som gjennomsnittliggjøres;

n – tallalternativ.

Vektet gjennomsnitt beregnes basert på grupperte data og har et generelt utseende

,

hvor X i er varianten (verdien) av karakteristikken som gjennomsnittliggjøres eller midtverdien av intervallet som varianten måles i;
m - gjennomsnittlig gradindeks;
f i – frekvens som viser hvor mange ganger det forekommer i-e verdi gjennomsnittskarakteristikk.

La oss gi som et eksempel beregningen av gjennomsnittsalderen for studenter i en gruppe på 20 personer:


Vi beregner gjennomsnittsalderen ved å bruke den enkle gjennomsnittsformelen:

La oss gruppere kildedataene. Vi får følgende distribusjonsserie:

Som et resultat av gruppering får vi en ny indikator - frekvens, som indikerer antall elever i alderen X år. Derfor vil gjennomsnittsalderen til elevene i gruppen beregnes ved hjelp av den vektede gjennomsnittsformelen:

Generelle formler for beregning av effektgjennomsnitt har en eksponent (m). Avhengig av hvilken verdi det tar, skiller de følgende typer kraftgjennomsnitt:
harmonisk gjennomsnitt hvis m = -1;
geometrisk gjennomsnitt, hvis m –> 0;
aritmetisk gjennomsnitt hvis m = 1;
gjennomsnittlig kvadrat hvis m = 2;
gjennomsnittlig kubikk hvis m = 3.

Formler for effektgjennomsnitt er gitt i tabell. 4.4.

Hvis du beregner alle typer gjennomsnitt for de samme innledende dataene, vil verdiene deres vise seg å være forskjellige. Hovedregelen for gjennomsnitt gjelder her: med en økning i eksponenten m, den tilsvarende gjennomsnittsverdi:

I statistisk praksis brukes aritmetiske gjennomsnitt og harmonisk vektede gjennomsnitt oftere enn andre typer vektede gjennomsnitt.

Tabell 5.1

Typer kraftmidler

En slags makt
gjennomsnittlig
Indikator
grad (m)
Beregningsformel
Enkel Vektet
Harmonisk -1
Geometrisk 0
Aritmetikk 1
Kvadratisk 2
Kubisk 3

Det harmoniske gjennomsnittet har en mer kompleks struktur enn det aritmetiske gjennomsnittet. Det harmoniske gjennomsnittet brukes til beregninger når ikke enhetene til populasjonen - bærerne av karakteristikken - brukes som vekter, men produktet av disse enhetene med verdiene til karakteristikken (dvs. m = Xf). Den gjennomsnittlige harmoniske enkle bør ty til i tilfeller av å bestemme, for eksempel, gjennomsnittlig arbeidskostnad, tid, materialer per produksjonsenhet, per en del for to (tre, fire, etc.) bedrifter, arbeidere som er engasjert i produksjonen av samme type produkt, samme del, produkt.

Hovedkravet til formelen for å beregne gjennomsnittsverdien er at alle stadier av beregningen har en reell meningsfull begrunnelse; den resulterende gjennomsnittsverdien bør erstatte de individuelle verdiene for attributtet for hvert objekt uten å forstyrre forbindelsen mellom individuelle og sammendragsindikatorer. Med andre ord, gjennomsnittsverdien må beregnes slik at når hver enkelt verdi av gjennomsnittsindikatoren erstattes av gjennomsnittsverdien, forblir en endelig oppsummeringsindikator uendret, relatert emne eller på annen måte med gjennomsnittet. Denne summen kalles definerende siden arten av forholdet til individuelle verdier bestemmer den spesifikke formelen for å beregne gjennomsnittsverdien. La oss demonstrere denne regelen ved å bruke eksemplet med det geometriske gjennomsnittet.

Formel for geometrisk gjennomsnitt

brukes oftest ved beregning av gjennomsnittsverdi basert på individuell relativ dynamikk.

Det geometriske gjennomsnittet brukes hvis det er gitt en sekvens av kjedens relative dynamikk, som for eksempel indikerer en økning i produksjonen sammenlignet med nivået året før: i 1, i 2, i 3,..., i n. Det er åpenbart at produksjonsvolumet i i fjor bestemmes av startnivået (q 0) og påfølgende økning over årene:

q n =q 0 × i 1 × i 2 ×...×i n .

Ved å ta q n som den bestemmende indikatoren og erstatte de individuelle verdiene til dynamikkindikatorene med gjennomsnittlige, kommer vi til forholdet

Herfra

5.3. Strukturelle gjennomsnitt

En spesiell type gjennomsnitt - strukturelle gjennomsnitt - brukes til å studere indre struktur serie med distribusjon av attributtverdier, samt for å estimere gjennomsnittsverdien (krafttype), hvis beregningen ikke kan utføres i henhold til tilgjengelige statistiske data (for eksempel hvis det i eksemplet som vurderes ikke var data om både volumet produksjon og kostnadsbeløp for grupper av foretak).

Indikatorer brukes oftest som strukturelle gjennomsnitt mote – den hyppigst gjentatte verdien av attributtet – og medianer – verdien av en egenskap som deler den ordnede sekvensen av verdiene i to like deler. Som et resultat overstiger ikke verdien av attributten mediannivået for den ene halvparten av enhetene i populasjonen, og for den andre halvparten er den ikke mindre enn den.

Hvis karakteristikken som studeres har diskrete verdier, er det ingen spesielle vanskeligheter med å beregne modus og median. Hvis data om verdiene til attributt X presenteres i form av ordnede intervaller for endringen (intervallserier), blir beregningen av modusen og medianen noe mer komplisert.

,

Siden medianverdien deler hele populasjonen i to like deler, havner den i ett av intervallene til karakteristikken X. Ved hjelp av interpolasjon finner man verdien av medianen i dette medianintervallet:
hvor X Me er den nedre grensen for medianintervallet;
h Me – dens verdi; (Sum m)/2 – halvparten av totalt antall
observasjoner eller halve volumet av indikatoren som brukes som vekting i formlene for å beregne gjennomsnittsverdien (i absolutte eller relative termer);
S Me-1 – summen av observasjoner (eller volumet av vektattributtet) akkumulert før begynnelsen av medianintervallet;

m Me – antall observasjoner eller volumet av vektegenskapen i medianintervallet (også i absolutte eller relative termer). I vårt eksempel kan til og med tre oppnås medianverdier

– basert på egenskapene til antall foretak, produksjonsvolum og totale produksjonskostnader:

I halvparten av foretakene overstiger kostnaden per produksjonsenhet 125,19 tusen rubler, halvparten av det totale volumet av produkter produseres med en kostnad per produkt på mer enn 124,79 tusen rubler. og 50% av de totale kostnadene dannes når kostnadene for ett produkt er over 125,07 tusen rubler. Merk også at det er en viss tendens til en økning i kostnadene, siden Me 2 = 124,79 tusen rubler, og gjennomsnittsnivået er 123,15 tusen rubler.

Når du beregner den modale verdien av en karakteristikk basert på dataene til en intervallserie, er det nødvendig å ta hensyn til det faktum at intervallene er identiske, siden repeterbarhetsindikatoren for verdiene til karakteristikken X avhenger av dette en intervallserie med like intervaller, bestemmes størrelsen på modusen som
hvor X Mo er den nedre verdien av det modale intervallet;
m Mo -1 – det samme for intervallet før det modale;
m Mo+1 – det samme for intervallet etter det modale;
h – verdien av endringsintervallet for karakteristikken i grupper.

For vårt eksempel kan vi beregne tre modale verdier basert på egenskapene til antall foretak, volumet av produkter og mengden av kostnader. I alle tre tilfeller er det modale intervallet det samme, siden for det samme intervallet er antallet bedrifter, produksjonsvolumet og den totale mengden produksjonskostnader størst:

Dermed er det oftest foretak med et kostnadsnivå på 126,75 tusen rubler, oftest produseres produkter med et kostnadsnivå på 126,69 tusen rubler, og oftest forklares produksjonskostnadene med et kostnadsnivå på 123,73 tusen rubler.

5.4. Variasjonsindikatorer

De spesifikke forholdene der hvert av de studerte objektene er lokalisert, så vel som funksjonene i deres egen utvikling (sosial, økonomisk, etc.) er uttrykt av de tilsvarende numeriske nivåene statistiske indikatorer. Slik, variasjon, de. avviket mellom nivåene til den samme indikatoren i forskjellige objekter er objektiv av natur og bidrar til å forstå essensen av fenomenet som studeres.

Det er flere metoder som brukes for å måle variasjon i statistikk.

Det enkleste er å beregne indikatoren variasjonsspekter H som forskjellen mellom maksimum (X maks) og minimum (X min) observerte verdier for karakteristikken:

H=X maks - X min.

Imidlertid viser variasjonsområdet bare de ekstreme verdiene av egenskapen. Repeterbarheten til mellomverdier er ikke tatt i betraktning her.

Strengere egenskaper er indikatorer på variasjon i forhold til gjennomsnittsnivået til attributtet. Den enkleste indikatoren av denne typen er gjennomsnittlig lineært avvik L som det aritmetiske gjennomsnittet av de absolutte avvikene til en karakteristikk fra dets gjennomsnittlige nivå:

Når individuelle X-verdier er repeterbare, bruk den vektede aritmetiske gjennomsnittsformelen:

(Husk det algebraisk sum avvik fra gjennomsnittsnivået er null.)

Den gjennomsnittlige lineære avviksindikatoren har funnet bred anvendelse i praksis. Med dens hjelp analyseres for eksempel sammensetningen av arbeidere, produksjonsrytmen, ensartetheten i forsyninger av materialer, og systemer for materielle insentiver utvikles. Men dessverre kompliserer denne indikatoren sannsynlighetsberegninger og kompliserer bruken av matematiske statistikkmetoder. Derfor, i statistisk forskning, er den indikatoren som oftest brukes til å måle variasjon

Variansen til karakteristikken (s 2) bestemmes basert på kvadratisk potensmiddel:

.

Indikatoren s lik kalles gjennomsnittlig kvadratavvik.

I generell teori I statistikk er spredningsindikatoren et estimat av sannsynlighetsteoriindikatoren med samme navn og (som summen av kvadrerte avvik) et estimat av spredningen i matematisk statistikk, som gjør det mulig å bruke bestemmelsene i disse teoretiske disiplinene for analyse av sosioøkonomiske prosesser.

Hvis variasjonen estimeres fra et lite antall observasjoner tatt fra en ubegrenset populasjon, bestemmes gjennomsnittsverdien av karakteristikken med en viss feil. Den beregnede verdien av dispersjonen viser seg å være forskjøvet mot en reduksjon. For å få et objektivt estimat prøveavvik, hentet fra de tidligere gitte formlene, må multipliseres med verdien n / (n - 1). Som et resultat, med et lite antall observasjoner (< 30) дисперсию признака рекомендуется вычислять по формуле

Vanligvis, allerede for n > (15÷20), blir avviket mellom de partiske og upartiske estimatene ubetydelig. Av samme grunn blir det vanligvis ikke tatt hensyn til skjevheter i formelen for å legge til varianser.

Hvis det tas flere prøver fra den generelle populasjonen og hver gang gjennomsnittsverdien av en egenskap bestemmes, oppstår problemet med å vurdere variabiliteten til gjennomsnittene. Estimatavvik gjennomsnittsverdi mulig basert på bare én prøveobservasjon i henhold til formelen

,

hvor n er prøvestørrelsen; s 2 – varians av karakteristikken beregnet fra prøvedataene.

Størrelse kalles gjennomsnittlig feil prøver og er en karakteristikk av avviket til prøvegjennomsnittsverdien til attributt X fra dens sanne gjennomsnittsverdi. Den gjennomsnittlige feilindikatoren brukes til å vurdere påliteligheten til resultatene av prøveobservasjon.

Relative spredningsindikatorer. For å karakterisere variabilitetsmålet til karakteristikken som studeres, beregnes variabilitetsindikatorer i relative verdier. De gjør det mulig å sammenligne arten av spredning i forskjellige fordelinger (ulike observasjonsenheter av samme egenskap i to populasjoner, med forskjellige betydninger gjennomsnitt, når man sammenligner ulike populasjoner). Beregningen av indikatorer for det relative spredningsmålet utføres som forholdet mellom den absolutte spredningsindikatoren og det aritmetiske gjennomsnittet, multiplisert med 100 %.

1. Oscillasjonskoeffisient reflekterer relative svingninger ekstreme verdier skilt rundt midten

.

2. Relativ lineær avstengning karakteriserer andelen av gjennomsnittsverdien av tegnet på absolutte avvik fra gjennomsnittsverdien

.

3. Variasjonskoeffisient:

er det vanligste variabilitetsmålet som brukes til å vurdere typiske gjennomsnittsverdier.

I statistikk regnes populasjoner med variasjonskoeffisient større enn 30–35 % som heterogene.

Denne metoden for å vurdere variasjon har også en betydelig ulempe. Faktisk, la for eksempel den opprinnelige befolkningen av arbeidere med en gjennomsnittlig erfaring på 15 år, med et standardavvik på s = 10 år, "vokse seg eldre" med ytterligere 15 år. Nå = 30 år, og standardavviket er fortsatt 10. Den tidligere heterogene befolkningen (10/15 × 100 = 66,7 %), og viser seg dermed å være ganske homogen over tid (10/30 × 100 = 33,3 %).

Boyarsky A.Ya. Teoretisk forskning ifølge statistikk: Lør. Vitenskapelig Trudov. – M.: Statistikk, 1974. s. 19–57.

Tidligere

For å analysere og oppnå statistiske konklusjoner basert på resultatene av sammendraget og grupperingen, beregnes generaliserende indikatorer - gjennomsnittlige og relative verdier.

Gjennomsnittsproblem – karakterisere alle enheter i en statistisk populasjon med én karakteristisk verdi.

Gjennomsnittsverdier kjennetegner kvalitetsindikatorer gründervirksomhet: distribusjonskostnader, fortjeneste, lønnsomhet, etc.

Gjennomsnittlig verdi- dette er en generaliserende karakteristikk av enheter av befolkningen i henhold til noen varierende karakteristikk.

Gjennomsnittlige verdier lar deg sammenligne nivåene av samme egenskap i forskjellige populasjoner og finne årsakene til disse avvikene.

I analysen av fenomenene som studeres, er rollen til gjennomsnittsverdier enorm. engelsk økonom V. Petty (1623-1687) mye brukte gjennomsnittsverdier. V. Petty ønsket å bruke gjennomsnittsverdier som et mål på kostnadene for utgiftene for den gjennomsnittlige daglige maten til en arbeider. Stabiliteten til gjennomsnittsverdien er en refleksjon av regelmessigheten til prosessene som studeres. Han mente at informasjon kan transformeres, selv om det ikke er nok originaldata.

Den engelske forskeren G. King (1648-1712) brukte gjennomsnittlige og relative verdier når han analyserte data om befolkningen i England.

Den teoretiske utviklingen til den belgiske statistikeren A. Quetelet (1796-1874) er basert på naturens inkonsekvens sosiale fenomener– meget stabil i massen, men rent individuelt.

Ifølge A. Quetelet permanente årsaker handle likt på hvert fenomen som studeres og lage disse fenomenene lignende venn på hverandre, lag mønstre som er felles for dem alle.

En konsekvens av læren til A. Quetelet var identifiseringen av gjennomsnittsverdier som hovedteknikken for statistisk analyse. Han sa at statistiske gjennomsnitt ikke representerer en kategori av objektiv virkelighet.

A. Quetelet uttrykte sitt syn på gjennomsnittet i sin teori om gjennomsnittsmannen. En gjennomsnittlig person er en person som har alle egenskapene til en gjennomsnittlig størrelse (gjennomsnittlig dødelighet eller fødselsrate, gjennomsnittlig høyde og vekt, gjennomsnittlig løpehastighet, gjennomsnittlig tilbøyelighet til ekteskap og selvmord, gode gjerninger osv.). For A. Quetelet gjennomsnittlig person– Dette er idealet til en person. Inkonsekvensen i A. Quetelets teori om gjennomsnittsmennesket ble bevist i russisk statistisk litteratur på slutten av 1800- og 1900-tallet.

Den berømte russiske statistikeren Yu E. Yanson (1835-1893) skrev at A. Quetelet antar eksistensen i naturen av en type gjennomsnittsperson som noe gitt, som livet har avviket gjennomsnittsmenneskene i et gitt samfunn og en gitt tid fra. , og dette fører ham til et fullstendig mekanisk syn og til bevegelseslovene i det sosiale livet: bevegelse er en gradvis økning i en persons gjennomsnittlige egenskaper, en gradvis gjenoppretting av typen; følgelig en slik utjevning av alle manifestasjoner av livet til den sosiale kroppen, utover hvilken enhver fremadrettet bevegelse opphører.

Essensen av denne teorien har funnet sin videre utvikling i verkene til en rekke statistiske teoretikere som en teori om sanne mengder. A. Quetelet hadde tilhengere - den tyske økonomen og statistikeren V. Lexis (1837-1914), som overførte teorien om sanne verdier til økonomiske fenomener det offentlige liv. Teorien hans er kjent som stabilitetsteori. En annen versjon av den idealistiske teorien om gjennomsnitt er basert på filosofien

Grunnleggeren er den engelske statistikeren A. Bowley (1869–1957) - en av de mest fremtredende teoretikere i nyere tid innen teorien om gjennomsnitt. Hans konsept med gjennomsnitt er skissert i boken hans Elements of Statistics.

A. Boley vurderer gjennomsnittsverdier kun fra den kvantitative siden, og skiller dermed kvantitet fra kvalitet. Ved å bestemme betydningen av gjennomsnittsverdier (eller "deres funksjon"), legger A. Boley frem det machianske prinsippet om tenkning. A. Boley skrev at funksjonen til gjennomsnittsverdier skulle uttrykke en kompleks gruppe

ved hjelp av noen få primtall. Statistiske data bør forenkles, grupperes og reduseres til gjennomsnitt. Disse synspunktene: delt av R. Fisher (1890-1968), J. Yule (1871 - 1951), Frederick S. Mills (1892), etc.

På 30-tallet XX århundre og påfølgende år anses gjennomsnittsverdien som en sosialt signifikant egenskap, hvis informasjonsinnhold avhenger av dataenes homogenitet.

De mest fremtredende representantene for den italienske skolen R. Benini (1862-1956) og C. Gini (1884-1965), som betraktet statistikk som en gren av logikk, utvidet omfanget av statistisk induksjon, men kognitive prinsipper De koblet logikk og statistikk med naturen til fenomenene som studeres, etter tradisjonene for sosiologisk tolkning av statistikk.

I verkene til K. Marx og V. I. Lenin er gjennomsnittsverdier gitt en spesiell rolle.

K. Marx hevdet at individuelle avvik fra generelt nivå og gjennomsnittsnivået blir en generell karakteristikk massefenomen Gjennomsnittsverdien blir en slik karakteristisk for et massefenomen bare hvis et betydelig antall enheter tas og disse enhetene er kvalitativt homogene. Marx skrev at gjennomsnittsverdien som ble funnet burde være gjennomsnittet av "...mange forskjellige individuelle verdier av samme type."

Gjennomsnittsverdien får spesiell betydning i en markedsøkonomi. Det hjelper å bestemme den nødvendige og generelle, tendensen til mønsteret økonomisk utvikling direkte gjennom entall og tilfeldig.

Gjennomsnittlige verdier er generelle indikatorer der virkningen av generelle forhold og mønsteret til fenomenet som studeres kommer til uttrykk.

Statistiske gjennomsnitt er beregnet på grunnlag av massedata fra statistisk korrekt organisert masseobservasjon. Hvis det statistiske gjennomsnittet beregnes fra massedata for en kvalitativt homogen populasjon (massefenomener), så vil det være objektivt.

Gjennomsnittsverdien er abstrakt, da den karakteriserer verdien av en abstrakt enhet.

Gjennomsnittet er abstrahert fra mangfoldet av egenskapen i individuelle objekter. Abstraksjon er et skritt vitenskapelig forskning. I gjennomsnittsverdien realiseres den dialektiske enheten mellom individet og det alminnelige.

Gjennomsnittsverdier bør brukes basert på en dialektisk forståelse av kategoriene individ og generell, individ og masse.

Den midterste viser noe vanlig som er inneholdt i et spesifikt enkelt objekt.

For å identifisere mønstre i massesosiale prosesser er gjennomsnittsverdien av stor betydning.

Individets avvik fra det generelle er en manifestasjon av utviklingsprosessen.

Gjennomsnittsverdien gjenspeiler det karakteristiske, typiske, reelle nivået til fenomenene som studeres. Oppgaven til gjennomsnittsverdier er å karakterisere disse nivåene og deres endringer i tid og rom.

Gjennomsnittet er en vanlig verdi fordi det dannes i normal, naturlig, generelle betingelser eksistensen av et spesifikt massefenomen sett under ett.

Objektiv eiendom statistisk prosess eller fenomenet reflekteres av gjennomsnittsverdien.

De individuelle verdiene til det statistiske attributtet som studeres er forskjellige for hver enhet av befolkningen. Gjennomsnittsverdien av individuelle verdier av en type er et produkt av nødvendighet, som er resultatet av den kombinerte handlingen til alle enheter av befolkningen, manifestert i en masse gjentatte ulykker.

Noen enkeltfenomener har egenskaper som finnes i alle fenomener, men i forskjellige mengder er høyden eller alderen til en person. Andre tegn på et individuelt fenomen er kvalitativt forskjellige i forskjellige fenomener, det vil si at de er til stede i noen og ikke observert i andre (en mann vil ikke bli en kvinne). Gjennomsnittsverdien beregnes for egenskaper som er kvalitativt homogene og kun kvantitativt forskjellige, som er iboende i alle fenomener i en gitt populasjon.

Gjennomsnittsverdien er en refleksjon av verdiene til karakteristikken som studeres og måles i samme dimensjon som denne karakteristikken.

Teorien om dialektisk materialisme lærer at alt i verden forandrer seg og utvikler seg. Og også egenskapene som er preget av gjennomsnittsverdier endres, og følgelig selve gjennomsnittene.

Skjer i livet kontinuerlig prosess skape noe nytt. Bæreren av en ny kvalitet er enkeltobjekter, så øker antallet av disse objektene, og det nye blir masse, typisk.

Gjennomsnittsverdien karakteriserer populasjonen som studeres etter kun én egenskap. For en fullstendig og omfattende representasjon av befolkningen som studeres i henhold til en rekke spesifikke egenskaper, er det nødvendig å ha et system med gjennomsnittsverdier som kan beskrive fenomenet fra forskjellige vinkler.

2. Typer gjennomsnitt

I statistisk behandling materiale, er det forskjellige problemer som må løses, og derfor brukes forskjellige gjennomsnittsverdier i statistisk praksis. Matematisk statistikk bruker ulike gjennomsnitt, for eksempel: aritmetisk gjennomsnitt; geometrisk gjennomsnitt; harmonisk middel; gjennomsnittlig firkant.

For å bruke en av de ovennevnte typene gjennomsnitt, er det nødvendig å analysere befolkningen som studeres, bestemme det materielle innholdet i fenomenet som studeres, alt dette gjøres på grunnlag av konklusjoner trukket fra prinsippet om meningsfullhet av resultater når veiing eller summering.

I studiet av gjennomsnitt brukes følgende indikatorer og notasjoner.

Tegnet som gjennomsnittet er funnet med kalles gjennomsnittskarakteristikk og er angitt med x; verdien av gjennomsnittskarakteristikken for enhver enhet i en statistisk populasjon kalles dens individuelle betydning, eller alternativer, og betegnet som x 1 , X 2 , x 3 ,... X n ; frekvens er repeterbarheten til individuelle verdier av en karakteristikk, angitt med bokstaven f.

Aritmetisk gjennomsnitt

En av de vanligste typene medium er aritmetisk gjennomsnitt, som beregnes når volumet av den gjennomsnittlige karakteristikken dannes som summen av dens verdier i individuelle enheter av den statistiske populasjonen som studeres.

For å beregne det aritmetiske gjennomsnittet deles summen av alle nivåer av attributtet på antallet.


Hvis noen alternativer forekommer flere ganger, kan summen av nivåene til attributtet oppnås ved å multiplisere hvert nivå med det tilsvarende antall enheter i populasjonen og deretter legge til det aritmetiske gjennomsnittet beregnet på denne måten, kalt vektet aritmetisk gjennomsnitt.

Formelen for det vektede aritmetiske gjennomsnittet er som følger:


hvor х i er alternativer,

f i – frekvenser eller vekter.

Det bør benyttes et vektet gjennomsnitt i alle tilfeller der opsjonene har ulike tall.

Det aritmetiske gjennomsnittet ser ut til å fordele seg likt mellom individuelle objekter total verdi en egenskap som faktisk varierer for hver av dem.

Beregningen av gjennomsnittsverdier utføres ved å bruke data gruppert i form av intervallfordelingsserier, når variantene av karakteristikken som gjennomsnittet beregnes fra, presenteres i form av intervaller (fra - til).

Egenskaper til aritmetikken betyr:

1) det aritmetiske gjennomsnittet av summen av varierende størrelser er lik summen av gjennomsnittene aritmetiske størrelser: Hvis x i = y i +z i, så


Denne egenskapen viser i hvilke tilfeller det er mulig å oppsummere gjennomsnittsverdier.

2) den algebraiske summen av avvik av individuelle verdier med varierende karakteristikk fra gjennomsnittet er lik null, siden summen av avvik i én retning kompenseres med summen av avvik i den andre retningen:


Denne regelen viser at gjennomsnittet er resultanten.

3) hvis alle opsjoner i en serie økes eller reduseres med samme tall?, vil gjennomsnittet øke eller reduseres med samme tall?:


4) hvis alle varianter av serien økes eller reduseres med A ganger, vil gjennomsnittet også øke eller reduseres med A ganger:


5) den femte egenskapen til gjennomsnittet viser oss at den ikke avhenger av størrelsen på skalaene, men avhenger av forholdet mellom dem. Ikke bare relative, men også absolutte verdier kan tas som skalaer.

Hvis alle frekvensene i serien er delt eller multiplisert med det samme tallet d, vil ikke gjennomsnittet endres.


Harmonisk middel. For å bestemme det aritmetiske gjennomsnittet er det nødvendig å ha en rekke alternativer og frekvenser, dvs. verdier X Og f.

La oss anta at de individuelle verdiene til karakteristikken er kjent X og fungerer X/, og frekvenser f er ukjent, så for å beregne gjennomsnittet, betegner vi produktet = X/; hvor:



Gjennomsnittet i denne formen kalles det harmoniske vektede gjennomsnittet og er betegnet x skade. opp

Følgelig er det harmoniske gjennomsnittet identisk med det aritmetiske gjennomsnittet. Det gjelder når de faktiske vektene er ukjente f, og arbeidet er kjent f.eks = z

Når det fungerer f.eks identiske eller like enheter (m = 1), brukes det harmoniske enkle gjennomsnittet, beregnet med formelen:


Hvor X- separate alternativer;

n- nummer.

Geometrisk gjennomsnitt

Hvis det er n vekstkoeffisienter, er formelen for gjennomsnittskoeffisienten:


Dette er den geometriske gjennomsnittsformelen.

Det geometriske gjennomsnittet er lik roten av potensen n fra produktet av vekstkoeffisienter som karakteriserer forholdet mellom verdien av hver påfølgende periode til verdien av den forrige.

Hvis verdier uttrykt i skjemaet er gjenstand for gjennomsnittsberegning kvadratiske funksjoner, er middelkvadrat påført. For eksempel, ved å bruke rotmiddelkvadrat, kan du bestemme diameteren på rør, hjul osv.

Rotgjennomsnittet bestemmes ved å trekke ut kvadratrot fra kvotienten for å dele summen av kvadrater av de individuelle verdiene til attributtet med antallet.


Det veide gjennomsnittlige kvadratet er lik:

3. Strukturelle gjennomsnitt. Modus og median

For å karakterisere strukturen til en statistisk populasjon brukes indikatorer som kalles strukturelle gjennomsnitt. Disse inkluderer modus og median.

Mote (M O ) - det vanligste alternativet. Mote er verdien av attributtet som tilsvarer maksimumspunktet til den teoretiske fordelingskurven.

Mote representerer den hyppigst forekommende eller typiske betydningen.

Mote brukes i kommersiell praksis for å studere forbrukernes etterspørsel og rekordpriser.

I en diskret serie er modus varianten med høyest frekvens. I intervall variantserie mote anses å være den sentrale varianten av intervallet, som har høyeste frekvens(bestemt).

Innenfor intervallet må du finne verdien av attributtet som er modusen.


Hvor X O– nedre grense for det modale intervallet;

h– verdien av det modale intervallet;

f m– frekvensen av det modale intervallet;

f t-1 – frekvensen av intervallet før det modale;

f m+1 – frekvensen til intervallet etter det modale.

Modusen avhenger av størrelsen på gruppene og den nøyaktige plasseringen av gruppegrensene.

Mote– tallet som faktisk forekommer oftest (er en bestemt verdi), har i praksis den bredeste anvendelsen (den vanligste typen kjøper).

Median (M e er en mengde som deler antallet av en bestilt variasjonsserie i to like deler: den ene delen har verdier av den varierende karakteristikken som er mindre enn gjennomsnittsvarianten, og den andre har større verdier.

Median er et element som er større enn eller lik og samtidig mindre enn eller lik halvparten av de gjenværende elementene i distribusjonsserien.

Egenskapen til medianen er at summen av de absolutte avvikene til attributtverdiene fra medianen er mindre enn fra noen annen verdi.

Ved å bruke medianen kan du få mer nøyaktige resultater enn ved bruk av andre former for gjennomsnitt.

Rekkefølgen for å finne medianen i intervallvariasjonsserien er som følger: vi ordner de individuelle verdiene til karakteristikken i henhold til rangering; vi bestemmer de akkumulerte frekvensene for en gitt rangert serie; Ved å bruke de akkumulerte frekvensdataene finner vi medianintervallet:


Hvor x meg– nedre grense for medianintervallet;

jeg Meg– verdien av medianintervallet;

f/2– halv sum av frekvenser i serien;

S Meg-1 – summen av akkumulerte frekvenser før medianintervallet;

f Meg– frekvensen av medianintervallet.

Medianen deler tallet på en serie i to, derfor er det der den akkumulerte frekvensen er halvparten eller mer enn halvparten av den totale summen av frekvenser, og den forrige (akkumulerte) frekvensen er mindre enn halvparten av populasjonens antall.