Biografier Kjennetegn Analyse

Gjennomsnittsverdier i statistikk. Gjennomsnittlige verdier

Gjennomsnittsverdier refererer til generaliserende statistiske indikatorer som gir en oppsummerende (endelig) karakteristikk av sosiale massefenomener, siden de er bygget på grunnlag av et stort antall individuelle verdier variabelt tegn. For å klargjøre essensen av gjennomsnittsverdien, er det nødvendig å vurdere funksjonene ved dannelsen av verdiene til tegnene på disse fenomenene, i henhold til hvilke gjennomsnittsverdien beregnes.

Det er kjent at enheter av hver massefenomen har mange funksjoner. Uansett hvilket av disse tegnene vi tar, vil verdiene for individuelle enheter være forskjellige, de endres, eller, som de sier i statistikk, varierer fra en enhet til en annen. Så, for eksempel, lønnen til en ansatt bestemmes av hans kvalifikasjoner, arten av arbeidet, lengden på tjenesten og en rekke andre faktorer, og varierer derfor over et veldig bredt spekter. Den kumulative innflytelsen av alle faktorer bestemmer inntektsbeløpet til hver ansatt, men vi kan snakke om gjennomsnittlig månedslønn til arbeidere i forskjellige sektorer av økonomien. Her opererer vi med en typisk karakteristisk verdi variabelattributt, referert til en enhet av en stor populasjon.

Gjennomsnittet gjenspeiler det generell, som er typisk for alle enheter av den studerte befolkningen. Samtidig balanserer den innflytelsen fra alle faktorer som virker på størrelsen på egenskapen til individuelle enheter i befolkningen, som om de gjensidig kansellerer dem. Nivået (eller størrelsen) av ethvert sosialt fenomen bestemmes av virkningen av to grupper av faktorer. Noen av dem er generelle og viktigste, kontinuerlig i drift, nært knyttet til naturen til fenomenet eller prosessen som studeres, og danner det typisk for alle enheter av den studerte populasjonen, noe som gjenspeiles i gjennomsnittsverdien. Andre er individuell, deres handling er mindre uttalt og er episodisk, tilfeldig karakter. De opererer i motsatt retning, forårsake forskjeller mellom de kvantitative egenskapene til individuelle enheter av befolkningen, prøver å endre konstant verdi studerte egenskaper. Virkningen av individuelle tegn er slukket i gjennomsnittsverdien. I den kumulative påvirkningen av typiske og individuelle faktorer, som er balansert og gjensidig opphevet i generaliserende egenskaper, manifesterer den seg i generelt syn kjent fra matematisk statistikk fundamental lov store tall.

Til sammen smelter de individuelle verdiene til funksjonene inn i Total vekt og liksom oppløses. Derfor og gjennomsnittlig verdi fungerer som "upersonlig", som kan avvike fra de individuelle verdiene av funksjoner, ikke kvantitativt sammenfallende med noen av dem. Gjennomsnittsverdien gjenspeiler den generelle, karakteristiske og typiske for hele befolkningen på grunn av den gjensidige kanselleringen i den av tilfeldige, atypiske forskjeller mellom tegnene til dens individuelle enheter, siden verdien bestemmes så å si av den felles resultanten av alle årsaker.

For at gjennomsnittsverdien skal reflektere den mest typiske verdien av en egenskap, bør den imidlertid ikke bestemmes for noen populasjoner, men kun for populasjoner som består av kvalitativt homogene enheter. Dette kravet er hovedbetingelsen for vitenskapelig basert anvendelse av gjennomsnitt og impliserer nær forbindelse metoden for gjennomsnitt og metoden for grupperinger i analysen av sosioøkonomiske fenomener. Derfor er gjennomsnittsverdien en generaliserende indikator som karakteriserer typisk nivå variabel egenskap per enhet av en homogen populasjon under spesifikke forhold for sted og tid.

For å bestemme essensen av gjennomsnittsverdier, må det understrekes at riktig beregning av enhver gjennomsnittsverdi innebærer oppfyllelse av følgende krav:

  • kvalitativ homogenitet av populasjonen som gjennomsnittsverdien er beregnet på. Dette betyr at beregningen av gjennomsnittsverdier bør baseres på grupperingsmetoden, som sikrer utvalget av homogene fenomener av samme type;
  • utelukkelse av påvirkningen på beregningen av gjennomsnittsverdien av tilfeldige, rent individuelle årsaker og faktorer. Dette oppnås når beregningen av gjennomsnittet er basert på tilstrekkelig massivt materiale der driften av loven om store tall er manifestert, og alle ulykker opphever hverandre;
  • ved beregning av gjennomsnittsverdien, er det viktig å fastslå formålet med beregningen og den såkalte definerende indikator-tlf(eiendom) som den skal rettes mot.

Den bestemmende indikatoren kan fungere som summen av verdiene til den gjennomsnittlige funksjonen, summen av dens gjensidige verdier, produktet av verdiene, etc. Forholdet mellom den definerende indikatoren og gjennomsnittsverdien uttrykkes som følger: hvis alle verdiene av gjennomsnittsattributtet erstattes av gjennomsnittsverdien, vil summen eller produktet deres i dette tilfellet ikke endre den definerende indikatoren. På grunnlag av denne forbindelsen av den bestemmende indikatoren med gjennomsnittsverdien, bygges et innledende kvantitativt forhold for direkte beregning av gjennomsnittsverdien. Evnen til gjennomsnitt til å bevare egenskapene til statistiske populasjoner kalles definere eiendom.

Gjennomsnittsverdien beregnet for befolkningen som helhet kalles generelt gjennomsnitt; gjennomsnittsverdier beregnet for hver gruppe - gruppegjennomsnitt. Det samlede gjennomsnittet gjenspeiler vanlige trekk av fenomenet som studeres, karakteriserer gruppegjennomsnittet fenomenet som utvikler seg under de spesifikke forholdene til den gitte gruppen.

Beregningsmetoder kan være forskjellige, derfor skilles det i statistikk mellom flere typer gjennomsnitt, hvorav de viktigste er det aritmetiske gjennomsnittet, det harmoniske gjennomsnittet og det geometriske gjennomsnittet.

økonomisk analyse bruk av gjennomsnitt er hovedverktøyet for å evaluere resultater vitenskapelige og teknologiske fremskritt, sosiale arrangementer, søk etter reserver for økonomisk utvikling. Samtidig bør det huskes det overbærenhet gjennomsnitt kan føre til partiske konklusjoner når man utfører økonomiske og statistiske analyser. Dette skyldes det faktum at gjennomsnittsverdier, som er generaliserende indikatorer, opphever og ignorerer de forskjellene i de kvantitative egenskapene til individuelle enheter av befolkningen som virkelig eksisterer og kan være av uavhengig interesse.

Typer gjennomsnitt

I statistikk bruker de forskjellige typer gjennomsnittsverdier, som er delt inn i to store klasser:

  • kraftgjennomsnitt (harmonisk gjennomsnitt, geometrisk gjennomsnitt, aritmetisk gjennomsnitt, gjennomsnittlig kvadrat, gjennomsnittlig kubikk);
  • strukturelle gjennomsnitt (modus, median).

Å beregne makt betyr alle tilgjengelige karakteristiske verdier må brukes. Mote og median bestemmes kun av distribusjonsstrukturen, derfor kalles de strukturelle, posisjonelle gjennomsnitt. Median og modus brukes ofte som gjennomsnittlig karakteristikk i de populasjonene der beregningen av gjennomsnittseffekten er umulig eller upraktisk.

Den vanligste typen gjennomsnitt er det aritmetiske gjennomsnittet. Under aritmetisk gjennomsnitt forstås som verdien av egenskapen som hver enhet av befolkningen ville ha hvis Det samlede resultatet av alle verdiene av attributtet ble fordelt jevnt mellom alle enheter av befolkningen. Beregningen av denne verdien reduseres til summeringen av alle verdiene av variabelattributtet og dividere det resulterende beløpet med Total samlede enheter. For eksempel fullførte fem arbeidere en ordre for produksjon av deler, mens den første produserte 5 deler, den andre - 7, den tredje - 4, den fjerde - 10, den femte - 12. Siden i de første dataene var verdien av hver alternativet forekom bare én gang, for å bestemme den gjennomsnittlige produksjonen til en arbeider bør du bruke den enkle aritmetiske gjennomsnittsformelen:

dvs. i vårt eksempel er den gjennomsnittlige produksjonen til en arbeider lik

Sammen med det enkle aritmetiske gjennomsnittet studerer de vektet aritmetisk gjennomsnitt. La oss for eksempel regne ut gjennomsnittsalder studenter i en gruppe på 20, hvis alder varierer fra 18 til 22, hvor xi- varianter av den gjennomsnittlige funksjonen, fi- frekvens, som viser hvor mange ganger det forekommer i-th verdi i aggregatet (tabell 5.1).

Tabell 5.1

Gjennomsnittlig alder på studenter

Ved å bruke den vektede aritmetiske gjennomsnittsformelen får vi:


Det er en viss regel for å velge et vektet aritmetisk gjennomsnitt: hvis det er en serie data på to indikatorer, for den ene er det nødvendig å beregne

gjennomsnittsverdien, og samtidig de numeriske verdiene av nevneren til dens logiske formel er kjent, og verdiene til telleren er ukjente, men kan finnes som et produkt av disse indikatorene, bør gjennomsnittsverdien beregnes ved å bruke den aritmetiske vektede gjennomsnittsformelen.

I noen tilfeller er arten av de innledende statistiske dataene slik at beregningen av det aritmetiske gjennomsnittet mister sin mening og den eneste generaliserende indikatoren kan bare være en annen type gjennomsnittsverdi - gjennomsnittlig harmonisk. For tiden har beregningsegenskapene til det aritmetiske gjennomsnittet mistet sin relevans i beregningen av generaliserende statistiske indikatorer på grunn av den utbredte introduksjonen av elektroniske datamaskiner. stor praktisk verdi oppnådde et gjennomsnitt harmonisk verdi, som også er enkel og vektet. Hvis de numeriske verdiene til telleren til den logiske formelen er kjent, og verdiene til nevneren er ukjente, men kan finnes som en privat divisjon av en indikator med en annen, beregnes gjennomsnittsverdien av den vektede harmonisk middelformel.

La det for eksempel bli kjent at bilen kjørte de første 210 km med en hastighet på 70 km/t, og de resterende 150 km med en hastighet på 75 km/t. Det er umulig å bestemme gjennomsnittshastigheten til bilen gjennom hele reisen på 360 km ved å bruke den aritmetiske gjennomsnittsformelen. Siden alternativene er hastigheter på separate seksjoner xj= 70 km/t og X2= 75 km/t, og vekter (fi) anses å være de tilsvarende segmentene av banen, så vil produktene av alternativer etter vekt ikke ha verken fysiske eller økonomisk sans. PÅ denne saken betydningen erverves av brøkdelene av delingen av stisegmentene i de tilsvarende hastighetene (alternativer xi), dvs. tiden brukt på å passere individuelle seksjoner av stien (f.eks. / xi). Hvis segmentene av banen er betegnet med fi, blir hele banen uttrykt som Σfi, og tiden brukt på hele banen uttrykkes som Σ fi / xi , Deretter gjennomsnittshastighet kan finnes som kvotienten av den totale banen delt på den totale tiden brukt:

I vårt eksempel får vi:

Hvis når du bruker den gjennomsnittlige harmoniske vekten til alle alternativene (f) er like, kan du i stedet for den vektede enkel (uvektet) harmonisk middelverdi:

hvor xi - individuelle alternativer; n- antall varianter av den gjennomsnittlige funksjonen. I eksemplet med hastighet, kan et enkelt harmonisk middel brukes hvis segmentene av banen som ble kjørt med forskjellige hastigheter var like.

Enhver gjennomsnittsverdi bør beregnes slik at når den erstatter hver variant av den gjennomsnittlige funksjonen, endres ikke verdien til en endelig, generaliserende indikator, som er assosiert med gjennomsnittsindikatoren. Så når du erstatter de faktiske hastighetene på individuelle deler av banen med deres gjennomsnittsverdi (gjennomsnittshastighet), bør den totale avstanden ikke endres.

Formen (formelen) for gjennomsnittsverdien bestemmes av arten (mekanismen) til forholdet mellom denne endelige indikatoren og den gjennomsnittlige, derfor den endelige indikatoren, hvis verdi ikke bør endres når opsjonene erstattes av deres gjennomsnittsverdi , er kalt definerende indikator. For å utlede gjennomsnittsformelen må du komponere og løse en ligning ved å bruke forholdet mellom gjennomsnittsindikatoren og den bestemmende. Denne ligningen er konstruert ved å erstatte variantene av den gjennomsnittlige funksjonen (indikatoren) med deres gjennomsnittsverdi.

I tillegg til det aritmetiske gjennomsnittet og det harmoniske gjennomsnittet, brukes også andre typer (former) av gjennomsnittet i statistikk. Alle er spesielle tilfeller. gradsgjennomsnitt. Hvis vi beregner alle typer kraftlovgjennomsnitt for de samme dataene, så blir verdiene

de vil være like, regelen gjelder her hovedfag medium. Når eksponenten for gjennomsnittet øker, øker også selve gjennomsnittet. Den mest brukte i praktisk forskning formler for beregning av ulike typer effektgjennomsnitt er presentert i tabell. 5.2.

Tabell 5.2


Den geometriske gjennomsnittet brukes når tilgjengelig. n vekstfaktorer, mens de individuelle verdiene til egenskapen som regel er relative verdier av dynamikken, bygget i form av kjedeverdier, i forhold til forrige nivå på hvert nivå i dynamikkserien. Gjennomsnittet karakteriserer derfor, gjennomsnittlig koeffisient vekst. geometrisk betyr enkel beregnet med formelen

Formel geometrisk gjennomsnitt vektet har følgende form:

Ovennevnte formler er identiske, men den ene brukes med gjeldende koeffisienter eller vekstrater, og den andre - ved absolutte verdier av nivåene i serien.

rot betyr kvadrat brukes ved beregning med mengder kvadratiske funksjoner, brukes til å måle graden av fluktuasjon av de individuelle verdiene til en egenskap rundt det aritmetiske gjennomsnittet i distribusjonsserien og beregnes ved hjelp av formelen

Gjennomsnittlig kvadrat vektet beregnet med en annen formel:

Gjennomsnittlig kubikk brukes ved beregning med mengder kubiske funksjoner og beregnes med formelen

vektet gjennomsnittlig kubikk:

Alle gjennomsnittsverdiene ovenfor kan representeres som en generell formel:

hvor er gjennomsnittsverdien; - individuell verdi; n- antall enheter av den studerte befolkningen; k- eksponent, som bestemmer typen gjennomsnitt.

Når du bruker samme kildedata, jo mer k i generell formel kraftgjennomsnitt, jo større gjennomsnitt. Det følger av dette at det er et regelmessig forhold mellom verdiene av maktmidler:

Gjennomsnittsverdiene beskrevet ovenfor gir en generalisert ide om befolkningen som studeres, og fra dette synspunktet er deres teoretiske, anvendte og kognitive betydning udiskutabel. Men det hender at verdien av gjennomsnittet ikke faller sammen med noen av de virkelige eksisterende alternativer, derfor, i tillegg til de vurderte gjennomsnittene, er det i statistisk analyse tilrådelig å bruke verdiene til spesifikke alternativer som opptar en veldefinert posisjon i en ordnet (rangert) serie med karakteristiske verdier. Blant disse mengdene er de mest brukte strukturell, eller beskrivende, gjennomsnittlig- modus (Mo) og median (Me).

Mote- verdien av egenskapen som oftest finnes i denne populasjonen. Med hensyn til variasjonsserien er modusen den hyppigst forekommende verdien av den rangerte serien, dvs. varianten med høyest frekvens. Mote kan brukes til å bestemme de mest besøkte butikkene, den vanligste prisen for ethvert produkt. Den viser størrelsen på egenskapen som er karakteristisk for en betydelig del av befolkningen, og bestemmes av formelen

hvor x0 er den nedre grensen for intervallet; h- intervallverdi; fm- intervallfrekvens; fm_ 1 - frekvensen til forrige intervall; fm+ 1 - frekvens for neste intervall.

median varianten som ligger i midten av den rangerte raden kalles. Medianen deler serien i to like deler på en slik måte at det på begge sider av den er like mange befolkningsenheter. Samtidig er verdien av variabelattributtet i den ene halvparten av populasjonsenhetene mindre enn medianen, i den andre halvparten er den større enn den. Medianen brukes når man undersøker et element hvis verdi er større enn eller lik eller samtidig mindre enn eller lik halvparten av elementene i distribusjonsserien. Median gir generell idé om hvor verdiene til funksjonen er konsentrert, med andre ord hvor deres sentrum er plassert.

Den beskrivende karakteren til medianen manifesteres i det faktum at den karakteriserer den kvantitative grensen for verdiene til det varierende attributtet, som eies av halvparten av befolkningsenhetene. Problemet med å finne medianen for en diskret variasjonsserie løses enkelt. Hvis alle enheter i serien er gitt sekvensnummer, da er serienummeret til medianvarianten definert som (n + 1) / 2 med et oddetall av ledd n. Hvis antall ledd i serien er et partall, vil medianen være gjennomsnittsverdien av to varianter med serienummer n/ 2 og n / 2 + 1.

Ved bestemmelse av medianen i intervallvariasjonsserier bestemmes først intervallet den befinner seg i (medianintervallet). Dette intervallet er karakterisert ved at dets akkumulerte sum av frekvenser er lik eller overstiger halvparten av summen av alle frekvenser i serien. Beregningen av medianen til intervallvariasjonsserien utføres i henhold til formelen

hvor X0- den nedre grensen for intervallet; h- intervallverdi; fm- intervallfrekvens; f- antall medlemmer av serien;

∫m-1 - summen av de akkumulerte leddene i serien som går foran denne.

Sammen med medianen for mer komplette egenskaper strukturene til den studerte befolkningen bruker også andre verdier av alternativer som inntar en ganske bestemt posisjon i den rangerte serien. Disse inkluderer kvartiler og desiler. Kvartiler deler serien med summen av frekvenser i 4 like deler, og desiler - i 10 like deler. Det er tre kvartiler og ni desiler.

Medianen og modusen, i motsetning til det aritmetiske gjennomsnittet, avbryter ikke individuelle forskjeller i verdiene til en variabel attributt og er derfor ekstra og veldig viktige egenskaper statistisk aggregat. I praksis brukes de ofte i stedet for gjennomsnittet eller sammen med det. Det er spesielt hensiktsmessig å beregne medianen og modusen i de tilfellene når den studerte populasjonen inneholder et visst antall enheter med en veldig stor eller veldig liten verdi av variabelattributtet. Disse verdiene av alternativer, som ikke er veldig karakteristiske for befolkningen, mens de påvirker verdien av det aritmetiske gjennomsnittet, påvirker ikke verdiene til medianen og modusen, noe som gjør sistnevnte svært verdifulle indikatorer for økonomisk og statistisk analyse .

Variasjonsindikatorer

mål statistisk forskning er avslørende grunnleggende egenskaper og mønstre for den studerte statistiske populasjonen. I ferd med konsolidert databehandling statistisk observasjon bygger distribusjonslinjer. Det er to typer distribusjonsserier - attributive og variasjonsrekker, avhengig av om attributtet som er lagt til grunn for grupperingen er kvalitativt eller kvantitativt.

variasjon kalt distribusjonsserier bygget på kvantitativ basis. Verdiene av kvantitative egenskaper for individuelle enheter av befolkningen er ikke konstante, mer eller mindre forskjellige fra hverandre. Denne forskjellen i verdien av en egenskap kalles variasjoner. Skille numeriske verdier egenskaper som forekommer i den studerte populasjonen kalles verdialternativer. Tilstedeværelsen av variasjon i individuelle enheter av befolkningen skyldes påvirkningen et stort antall faktorer på dannelsen av egenskapsnivået. Studiet av arten og graden av variasjon av tegn i individuelle enheter av befolkningen er kritisk problem enhver statistisk studie. Variasjonsindikatorer brukes for å beskrive målet på egenskapsvariabilitet.

En annen viktig oppgave statistisk forskning er å bestemme rollen til individuelle faktorer eller deres grupper i variasjonen av visse tegn på befolkningen. For å løse dette problemet i statistikk, spesielle metoder variasjonsstudier basert på bruk av et målkort som måler variasjon. I praksis står forskeren overfor nok stor kvantitet alternativer for verdiene til attributtet, som ikke gir en ide om fordelingen av enheter etter verdien av attributtet i aggregatet. For å gjøre dette er alle varianter av attributtverdiene ordnet i stigende eller synkende rekkefølge. Denne prosessen kalles rad rangering. Den rangerte serien gir umiddelbart en generell ide om verdiene som funksjonen tar til sammen.

Mangelen på gjennomsnittsverdien for en uttømmende karakterisering av befolkningen gjør det nødvendig å supplere gjennomsnittsverdiene med indikatorer som gjør det mulig å vurdere typiskheten til disse gjennomsnittene ved å måle fluktuasjonen (variasjonen) av egenskapen som studeres. Bruken av disse variasjonsindikatorene gjør det mulig å gjøre den statistiske analysen mer fullstendig og meningsfull, og dermed bedre forstå essensen av de studerte sosiale fenomenene.

av de fleste enkle tegn variasjoner er minimum og maksimum - er den minste og høyeste verdi egenskap til sammen. Antallet repetisjoner av individuelle varianter av funksjonsverdier kalles gjentakelsesfrekvens. La oss angi frekvensen av gjentakelse av funksjonsverdien fi, summen av frekvenser lik volumet til den studerte populasjonen vil være:

hvor k- antall varianter av attributtverdier. Det er praktisk å erstatte frekvenser med frekvenser - w.i. Frekvens- relativ frekvensindikator - kan uttrykkes i brøkdeler av en enhet eller prosent og lar deg sammenligne variasjonsserier med annet nummer observasjoner. Formelt sett har vi:

For å måle variasjonen av en egenskap, ulike absolutte og relativ ytelse. De absolutte variasjonsindikatorene inkluderer gjennomsnittlig lineært avvik, variasjonsområdet, varians, gjennomsnitt standardavvik.

Spennvariasjon(R) er forskjellen mellom maksimums- og minimumsverdiene for egenskapen i den studerte populasjonen: R= Xmax - Xmin. Denne indikatoren gir bare den mest generelle ideen om fluktuasjonen av egenskapen som studeres, da den viser forskjellen bare mellom grenseverdiene til alternativene. Det er fullstendig urelatert til frekvensene i variasjonsserien, dvs. til arten av distribusjonen, og dens avhengighet kan gi den en ustabil, tilfeldig karakter bare på ekstreme verdier skilt. Variasjonsområdet gir ingen informasjon om egenskapene til de studerte populasjonene og lar oss ikke vurdere graden av typiskhet til de oppnådde gjennomsnittsverdiene. Omfanget av denne indikatoren er begrenset til ganske homogene populasjoner, mer presist karakteriserer den variasjonen av en egenskap, en indikator basert på å ta hensyn til variasjonen til alle verdiene til egenskapen.

For å karakterisere variasjonen til en egenskap, er det nødvendig å generalisere avvikene til alle verdier fra en hvilken som helst verdi som er typisk for befolkningen som studeres. Slike indikatorer

variasjoner, for eksempel gjennomsnittlig lineært avvik, varians og standardavvik, er basert på vurderingen av avvik i verdiene til attributtet til individuelle enheter av populasjonen fra det aritmetiske gjennomsnittet.

Gjennomsnittlig lineært avvik er det aritmetiske gjennomsnittet av de absolutte verdiene av avvikene til individuelle alternativer fra deres aritmetiske gjennomsnitt:


Absolutt verdi(modul) avvik av varianten fra det aritmetiske gjennomsnittet; f- Frekvens.

Den første formelen brukes hvis hvert av alternativene forekommer i aggregatet bare én gang, og den andre - i serie med ulik frekvens.

Det er en annen måte å snitte avvikene til alternativer fra det aritmetiske gjennomsnittet på. Denne metoden, som er svært vanlig i statistikk, reduseres til å beregne kvadrerte avvik for opsjoner fra gjennomsnittsverdien og deretter snitte dem. I dette tilfellet får vi en ny indikator på variasjon - variansen.

Spredning(σ 2) - gjennomsnittet av kvadrerte avvik av variantene av egenskapsverdiene fra deres gjennomsnittsverdi:

Den andre formelen brukes hvis variantene har sine egne vekter (eller frekvenser av variasjonsserien).

I økonomisk og statistisk analyse er det vanlig å evaluere variasjonen av et attributt oftest ved å bruke standardavviket. Standardavvik(σ) er kvadratroten av variansen:

De gjennomsnittlige lineære og gjennomsnittlige kvadratiske avvikene viser hvor mye verdien av attributtet svinger i gjennomsnitt for enhetene i populasjonen som studeres, og uttrykkes i samme enheter som variantene.

I statistisk praksis blir det ofte nødvendig å sammenligne variasjonen av ulike funksjoner. For eksempel, stor interesse presenterer en sammenligning av variasjoner i ansattes alder og deres kvalifikasjoner, tjenestetid og lønn osv. For slike sammenligninger indikatorer for den absolutte variabiliteten til tegn - gjennomsnittlig lineært og standardavvik - er ikke egnet. Det er faktisk umulig å sammenligne svingningen i arbeidserfaring, uttrykt i år, med svingningen i lønn, uttrykt i rubler og kopek.

Når man sammenligner variasjonen til ulike egenskaper i aggregatet, er det praktisk å bruke relative variasjonsindikatorer. Disse indikatorene er beregnet som forholdet absolutte indikatorer til det aritmetiske gjennomsnittet (eller medianen). Ved å bruke som en absolutt variasjonsindikator variasjonsområdet, det gjennomsnittlige lineære avviket, standardavviket, får man de relative fluktuasjonsindikatorene:


Den mest brukte indikatoren på relativ volatilitet, som karakteriserer homogeniteten til befolkningen. Settet anses som homogent dersom variasjonskoeffisienten ikke overstiger 33 % for fordelinger nær normalen.

Gjennomsnittsverdien er den mest verdifulle fra et analytisk synspunkt og en universell uttrykksform for statistiske indikatorer. Det vanligste gjennomsnittet - det aritmetiske gjennomsnittet - har en rekke matematiske egenskaper, som kan brukes i beregningen. Samtidig, når du beregner et spesifikt gjennomsnitt, er det alltid tilrådelig å stole på dens logiske formel, som er forholdet mellom volumet av attributtet og volumet av befolkningen. For hvert gjennomsnitt er det bare ett sant referanseforhold, som, avhengig av tilgjengelige data, kan kreve ulike former medium. I alle tilfeller der den gjennomsnittlige verdiens natur innebærer tilstedeværelse av vekter, er det imidlertid umulig å bruke deres uvektede formler i stedet for de vektede gjennomsnittsformlene.

Gjennomsnittsverdien er den mest karakteristiske verdien av attributtet for populasjonen og størrelsen på attributtet til populasjonen fordelt på like deler mellom enhetene i befolkningen.

Karakteristikken som gjennomsnittsverdien beregnes for kalles gjennomsnitt .

Gjennomsnittsverdien er en indikator som beregnes ved å sammenligne absolutte eller relative verdier. Gjennomsnittsverdien er

Gjennomsnittsverdien gjenspeiler påvirkningen av alle faktorer som påvirker fenomenet som studeres, og er resultatet for dem. Med andre ord, ved å kansellere individuelle avvik og eliminere påvirkning av saker, virker gjennomsnittsverdien, som gjenspeiler det generelle målet for resultatene av denne handlingen, generelt mønster fenomenet som studeres.

Betingelser for bruk av gjennomsnitt:

Ø homogenitet i den studerte populasjonen. Hvis noen elementer i befolkningen som er utsatt for påvirkning av en tilfeldig faktor har signifikant forskjellige verdier av den studerte egenskapen fra resten, vil disse elementene påvirke størrelsen på gjennomsnittet for denne befolkningen. I dette tilfellet vil ikke gjennomsnittet uttrykke den mest typiske verdien av funksjonen for populasjonen. Hvis fenomenet som studeres er heterogent, er det nødvendig å bryte det ned i grupper som inneholder homogene elementer. I dette tilfellet beregnes gruppegjennomsnitt - gruppegjennomsnitt, som uttrykker den mest karakteristiske verdien av fenomenet i hver gruppe, og deretter beregnes den totale gjennomsnittsverdien for alle elementer, som karakteriserer fenomenet som helhet. Det beregnes som gjennomsnittet av gruppemiddelet, vektet med antall befolkningselementer som inngår i hver gruppe;

Ø et tilstrekkelig antall enheter i aggregatet;

Ø maks og minimumsverdi egenskap i studiepopulasjonen.

Gjennomsnittlig verdi (indikator)- dette er en generalisert kvantitativ karakteristikk av en egenskap i en systematisk populasjon under spesifikke forhold for sted og tid.

Brukes i statistikk følgende skjemaer(typer) av gjennomsnittsverdier, kalt kraft og strukturelle:

Ø aritmetisk gjennomsnitt(enkel og vektet);

enkel

Den vanligste formen for statistiske indikatorer er gjennomsnittsverdien, som er en generalisert kvantitativ karakteristikk tegn i den statistiske populasjonen under spesifikke forhold for sted og tid. Indikatoren i form av en gjennomsnittsverdi uttrykker typiske trekk og gir en generalisert beskrivelse av samme type fenomener i henhold til et av de forskjellige tegnene. Den utbredte bruken av gjennomsnitt forklares med at de har en rekke positive egenskaper som gjør dem til et uunnværlig verktøy for å analysere fenomener og prosesser i økonomien.

Den viktigste eiendommen gjennomsnittsverdien ligger i det faktum at den reflekterer fellesskapet som er iboende i alle enheter av befolkningen som studeres. Verdiene til attributtet til individuelle enheter av befolkningen svinger i en eller annen retning under påvirkning av mange faktorer, blant dem kan det være både grunnleggende og tilfeldige. For eksempel er aksjekursen til et selskap hovedsakelig bestemt av de økonomiske resultatene av dets aktiviteter. Samtidig kan disse aksjene på visse dager og på enkelte børser, på grunn av de rådende omstendighetene, selges til høyere eller lavere kurs. Essensen av gjennomsnittet ligger i det faktum at det kansellerer avvikene til verdiene til attributtet til individuelle enheter i befolkningen, på grunn av virkningen av tilfeldige faktorer, og tar hensyn til endringene forårsaket av handlingen til hovedfaktorer. Dette gjør at middelet kan gjenspeile det typiske nivået til funksjonen og abstrahere fra individuelle funksjoner individuelle enheter.

Typiskheten til gjennomsnittet er direkte relatert til befolkningens homogenitet. Gjennomsnittsverdien vil gjenspeile det typiske nivået til attributtet bare når det er beregnet fra en kvalitativt homogen populasjon. Så hvis vi beregner gjennomsnittskursen for aksjene til alle foretak som selges på en gitt dag på en gitt børs, får vi et fiktivt gjennomsnitt. Dette vil forklares med at populasjonen som er brukt for beregningen er ekstremt heterogen. I dette og lignende tilfeller brukes gjennomsnittsmetoden i kombinasjon med grupperingsmetoden: hvis populasjonen er heterogen, må de generelle gjennomsnittene erstattes eller suppleres med gruppegjennomsnitt, d.v.s. gjennomsnitt, beregnet etter kvalitativ homogene grupper.



Følgende konvensjoner brukes i teorien om gjennomsnitt.

1. Tegnet som gjennomsnittet bestemmes med kalles gjennomsnittlig funksjon og er betegnet.

2. Verdien av gjennomsnittsattributtet for hver enhet av populasjonen kalles dens individuell verdi og er betegnet.

3. Repeterbarheten til individuelle verdier kalles frekvens og er betegnet f .

4. Den totale verdien av funksjonen er angitt W .

Noen kvantitativt attributt statistisk populasjon har én enkelt middelverdi. Det kan beregnes forskjellige måter avhengig av uttrykksformen til gjennomsnittstrekket (absolutt, relativ og gjennomsnittlig) og tilgjengelig informasjon. Avhengig av graden k forskjellige typer gjennomsnitt oppnås.

1.enkel aritmetisk gjennomsnitt - den vanligste typen medium

k =1

2.Aritmetisk vektet gjennomsnitt – brukes hvis de individuelle verdiene for egenskapen og deres frekvenser er kjent f . Hvert alternativ «vektes» etter sin frekvens, dvs. multiplisere med det. Frekvenser f kalles statistiske vekter eller ganske enkelt vekter av gjennomsnittet .

Eksempel. Basert på tilgjengelige data, beregner vi gjennomsnittlig arbeidserfaring for ansatte

3.Gjennomsnittlig harmonisk enkel brukes hvis det er nødvendig at summen av gjensidigheten til de individuelle verdiene til attributtet forblir uendret under gjennomsnittsberegning.

hvor er summen av de gjensidige verdiene til funksjonen.

Eksempel. En bil med last fra bedriften til lageret kjørte med en hastighet på 40 km/t, og tilbake tom med en hastighet på 60 km/t. Hva er gjennomsnittshastigheten til bilen for begge turene?

La transportavstanden være S km. S spiller ingen rolle i beregningen av gjennomsnittshastigheten. Ved endring av individuelle hastighetsverdier til gjennomsnittsverdien, er det nødvendig at tiden brukt på begge turene forblir uendret, ellers kan gjennomsnittshastigheten være alt - fra hastigheten til en skilpadde til lysets hastighet. Reisetidene er de samme. Så,

Reduserer alle vilkårene for likestillingen med S, får vi d.v.s. betingelsen for det harmoniske gjennomsnittet er oppfylt. Erstatter og , vi får

Det aritmetiske gjennomsnittet på 50 km/t er ikke riktig, pga resulterer i en annen bevegelsestid enn den faktisk er. Hvis avstanden er 96 km, da sanntid bevegelse vil være

I statistisk praksis brukes oftere det harmoniske vektede gjennomsnittet.

4.Gjennomsnittlig harmonisk vektet brukes hvis de individuelle verdiene til funksjonen er kjent og totale verdier skilt.

Eksempel

5.Gjennomsnittlig aggregat brukes hvis de totale verdiene for egenskapen og deres frekvenser er kjent.

Eksempel. Definere gjennomsnittlig kostnad produkter, hvis kjent.

6.rot betyr kvadrat brukes til å beregne standardavviket, som er en indikator på variasjon, så vel som i engineering

k =2

Gjennomsnittlig kvadrat vektet

7.Geometrisk gjennomsnitt brukes til å beregne gjennomsnittlig vekstrate etter kjedeordningen k= 0

k= 1 vi får det aritmetiske gjennomsnittet, k= 2 - kvadratisk, med k= 3 - kubikk, med k= 0 - geometrisk, k= -1 er det harmoniske middelet. Jo høyere eksponent k , emner mer verdi medium størrelse. Hvis alle startverdier for en funksjon er like, er alle gjennomsnitt lik const. Så vi har følgende relasjon, som kalles regelen om midlers majoritet :

Ved å bruke denne regelen kan statistikk, avhengig av humøret og ønsket til dens "ekspert", enten "drukne" eller "redde" en elev som fikk karakterene 2 og 5. Hva er hans gjennomsnittlige poengsum?

Etter det aritmetiske gjennomsnittet å dømme er gjennomsnittsskåren 3,5. Men hvis dekanen ønsker å "drukne" den uheldige personen og beregner det harmoniske gjennomsnittet, forblir studenten en gjennomsnittlig taper som ikke nådde topp tre.

Studentrådet kan imidlertid protestere mot dekanen og presentere gjennomsnittlig kubikkverdi . Studenten ser allerede «bra» ut og søker til og med om stipend.

Strukturelle gjennomsnitt - modus og median - i motsetning til kraftgjennomsnitt, som i stor grad er et abstrakt kjennetegn ved befolkningen, fungerer som bestemte mengder, som sammenfaller med visse alternativer aggregater. Dette gjør dem uunnværlige for å løse praktiske problemer.

Mote- dette er den vanligste verdien av attributtet i enheter av denne populasjonen. Til diskrete serier distribusjonsmodus bestemmes uten beregning, ved å se på frekvenskolonnen, og tilsvarer funksjonsverdien med høyest frekvens. Fra eksempel #1 høyeste frekvens f=20, som tilsvarer 4. takstkategori, altså M o =4.

For en intervallfordelingsserie bestemmes modusen av formelen

hvor er den nedre grensen for det modale intervallet;

verdien av det modale intervallet;

– frekvenser av intervallet, henholdsvis foran modal, modal og etter modal.

Modal tilsvarer intervallet med høyest frekvens.

La oss beregne modusen for eksempel nr. 2. Modalen tilsvarer intervallet 130-140. For han , = 140-130=10, =20,

Oftest er produksjonshastigheten til arbeidere 134%, oftest er planen overoppfylt med 34%.

Median- verdien av funksjonen som ligger i midten av den rangerte serien og deler den i to. Rangerte serier - en serie arrangert i stigende eller synkende rekkefølge av en funksjon. For diskret variantserie medianen er ikke beregnet, men bestemt ved å se på serien. For eksempel, for fem arbeidere, er den daglige produksjonshastigheten for deler henholdsvis 10, 12, 15, 16 og 18 stykker. M e er produksjonen til den tredje ansatte og er lik 15 deler. Med et jevnt antall attributtverdier tas medianen som halvsummen av attributtverdiene som opptar medianverdien. For eksempel, ved 10 verdier, halvsummen av den 5. og 6. verdien av attributtet.

For en intervallserie bestemmes medianen av formelen

hvor den nedre grensen for medianintervallet;

verdien av medianintervallet;

halvsummen av volumet av variasjonsserien;

akkumulert frekvens av intervallet før medianen;

frekvensen av medianintervallet.

Medianen er intervallet som tilsvarer halve volumet av serien. For å finne medianintervallet er det nødvendig å akkumulere frekvenser til et intervall som inneholder halve volumet av serien er funnet.

La oss beregne medianen for eksempel nr. 2. Medianintervallet er 120-130, fordi den kumulative frekvensen som tilsvarer den inneholder halve volumet av serien. For han

Halvparten av arbeiderne oppfyller produksjonsraten på mindre enn 129 %, og den andre halvparten av arbeiderne utfører produksjonsraten på mer enn 129 %.

Gjennomsnittsverdier refererer til generaliserende statistiske indikatorer som gir en oppsummering (endelig) karakteristikk av sosiale massefenomener, siden de er bygget på grunnlag av et stort antall individuelle verdier med varierende attributt.

Gjennomsnittsverdien gjenspeiler det generelle som er karakteristisk for alle enheter av den studerte populasjonen. Samtidig balanserer den innflytelsen fra alle faktorer som virker på størrelsen på egenskapen til individuelle enheter i befolkningen, som om de gjensidig kansellerer dem.

For at gjennomsnittsverdien skal reflektere den mest typiske verdien av en egenskap, bør den imidlertid ikke bestemmes for noen populasjoner, men kun for populasjoner som består av kvalitativt homogene enheter. Dette kravet er hovedbetingelsen for vitenskapelig underbygget anvendelse av gjennomsnittsverdier av mengder og innebærer et nært forhold mellom metoden for gjennomsnitt og metoden for grupperinger i analysen av sosioøkonomiske fenomener.

Gjennomsnittsverdien er en generaliserende indikator som karakteriserer det typiske nivået av en variabel egenskap per enhet av en homogen populasjon under spesifikke forhold for sted og tid.

Gjennomsnittet beregnet for befolkningen som helhet kalles det generelle gjennomsnittet, gjennomsnittene som er beregnet for hver gruppe kalles gruppegjennomsnitt. Det generelle gjennomsnittet gjenspeiler de generelle egenskapene til fenomenet som studeres, gruppegjennomsnittet gir en karakteristikk av størrelsen på fenomenet som utvikler seg under de spesifikke forholdene til denne gruppen.

I statistikk brukes ulike typer gjennomsnitt, som er delt inn i to store klasser:

1) kraftgjennomsnitt (harmonisk gjennomsnitt, geometrisk gjennomsnitt, aritmetisk gjennomsnitt, gjennomsnittlig kvadrat, gjennomsnittlig kubikk);

2) strukturelle gjennomsnitt (modus, median).

Den vanligste typen gjennomsnitt er det aritmetiske gjennomsnittet. Enkel aritmetisk gjennomsnittsformel:

Aritmetisk vektet gjennomsnitt:

hvor x Jeg– varianter av den gjennomsnittlige funksjonen; f - frekvens, som viser hvor mange ganger den i-te verdien forekommer i populasjonen.

Enkel harmonisk middelformel:

hvor x Jeg- separate alternativer; n er antall varianter av den gjennomsnittlige funksjonen. Det geometriske enkle gjennomsnittet beregnes med formelen:

Formelen for det geometriske vektede gjennomsnittet er:

Root mean square formel:

Vektet gjennomsnittlig kvadratisk formel:

Gjennomsnittlig kubikkformel:

Gjennomsnittlig kubikkveid:

3. Strukturelle gjennomsnitt: modus og median

Modus er verdien av en funksjon som forekommer oftest i en gitt populasjon. I forhold til variasjonsserien er modusen den hyppigst forekommende verdien av den rangerte serien. Den viser størrelsen på funksjonen, karakteristisk for en betydelig del av befolkningen, og bestemmes av formelen:

h er verdien av intervallet;

f m– intervallfrekvens;

f m-1– frekvensen til forrige intervall;

f m+1– frekvensen til neste intervall.

Medianen er varianten som ligger i midten av den rangerte serien. Medianen deler serien i to like deler på en slik måte at det på begge sider av den er like mange befolkningsenheter. Samtidig er verdien av variabeltrekket i den ene halvparten av populasjonsenhetene mindre enn medianen, mens den i den andre halvparten er større.

Den beskrivende karakteren til medianen manifesteres i det faktum at den karakteriserer den kvantitative grensen for verdiene til det varierende attributtet, som eies av halvparten av befolkningsenhetene.

Ved bestemmelse av medianen i intervallvariasjonsserier bestemmes først intervallet den befinner seg i (medianintervallet). Dette intervallet er karakterisert ved at dets akkumulerte sum av frekvenser er lik eller overstiger halvparten av summen av alle frekvenser i serien. Beregningen av medianen til intervallvariasjonsserien utføres i henhold til formelen:

hvor x0 er den nedre grensen for intervallet;

h er verdien av intervallet;

f m– intervallfrekvens;

f er antall medlemmer av serien;

sm- 1 - summen av de akkumulerte medlemmene i serien som går foran denne.

Sammen med medianen, for en mer fullstendig karakterisering av strukturen til den studerte befolkningen, brukes andre verdier av alternativer, som inntar en ganske bestemt posisjon i den rangerte serien. Disse inkluderer kvartiler og desiler. Kvartiler deler serien med summen av frekvenser i fire like deler, og desiler i ti like deler. Det er tre kvartiler og ni desiler.

Medianen og modusen, i motsetning til det aritmetiske gjennomsnittet, eliminerer ikke individuelle forskjeller i verdiene til en variabel attributt og er derfor ekstra og svært viktige kjennetegn ved en statistisk populasjon. I praksis brukes de ofte i stedet for gjennomsnittet eller sammen med det. Det er spesielt hensiktsmessig å beregne medianen og modusen i de tilfellene når den studerte populasjonen inneholder et visst antall enheter med en veldig stor eller veldig liten verdi av variabelattributtet.

De relative dimensjonene til en struktur er forholdet mellom dimensjonene til en del og helheten. De karakteriserer sammensetningen, strukturen til befolkningen. Presentasjonsskjema - egenvekt eller prosenter. Summen av de relative verdiene til strukturen er lik 1 eller 100%. Forskjellen mellom de respektive andelene til de to populasjonene kalles et prosentpoeng.

Absolutte verdier i statistikk er antall enheter og summene for grupper og for hele befolkningen, som er det direkte resultatet av oppsummering og gruppering av data.

Absolutte verdier er navngitte tall, det vil si at de har sine egne måleenheter (for eksempel stykker, tonn, hryvnias). Som en del av absolutte indikatorer skilles det ut indikatorer for befolkningsstørrelse (antall foretak) og volumet av funksjoner (produkter, fortjeneste). Det er tre grupper av funksjonsmålere - naturlig, arbeidskraft og verdi.

naturlige målere reflekterer de iboende fenomenene fysiske egenskaper(mål på vekt, lengde, tid). Noen ganger brukes kombinerte enheter, som er produktet av verdier av forskjellige dimensjoner (elektrisitetsproduksjon i kWh).

Det er ikke alltid mulig å oppnå absolutte verdier direkte ved å summere verdiene til attributtet for individuelle enheter. I dette tilfellet fører de enkelte leddene som inngår i absoluttverdien til et sammenlignbart uttrykk. Til dette bruker de ofte betinget naturlige målere. Så, for eksempel, når man beregner mengden drivstoff som forbrukes, blir dens forskjellige typer, i samsvar med deres brennverdi, uttrykt i enheter av standard drivstoff, hvis brennverdi er 7000 cal / kg.

Arbeidsmålere (arbeidstime, arbeidsskift) brukes ved måling av lønnskostnader for produksjon av produkter eller for utførelse av individuelle verk, for å bestemme arbeidsproduktivitet, og for å måle arbeidsressurser.

Kostnadsmålere gjøre det mulig å generalisere og sammenligne ulike fenomener. De brukes til å bestemme nøkkelindikatorer, som omsetning, overskudd, kapitalinvesteringer.

Ofte beregnes den absolutte verdien av indikatoren i henhold til en bestemt regel basert på andre indikatorer. For eksempel beregnes bruttofortjeneste som differansen mellom bruttoinntekt og bruttokostnader.

Mange absolutte verdier presenteres i form av en balanse, som gir mulighet for beregning av indikatoren i to seksjoner: etter dannelseskilder (inntektsdelen av balansen) og etter bruksanvisningen (utgiftsdelen). Det er også mulig å presentere absolutte indikatorer i en dynamisk balanseform. For eksempel kan økningen i antall utstyrsdeler i en bedrift for et år representeres som forskjellen mellom antall utstyr ved slutten og begynnelsen av året, eller den kan representeres som forskjellen mellom antall deler av nylig introdusert og pensjonert utstyr.



Kapittel 4.3. Relative verdier.

Relative verdier vises kvantitative relasjoner sosioøkonomiske fenomener. Algebraisk form deres er kvotienten for å dele to mengder med samme eller motsatte navn. Nevneren av forholdet anses som grunnlaget for sammenligning eller grunnlaget for den relative verdien.

Sammenligningsgrunnlaget kan være 100, 1000, 10 000 eller 100 000 enheter. Da vil den relative verdien uttrykkes henholdsvis som prosent (%), i ppm (% o), prodecimille (% oo), prosantimille (% ooo).

Relative verdier av forskjellig innhold og natur brukes.

Forholdet mellom forskjellige navn absolutte verdier gir relativ verdi intensitet . Dette er en navngitt verdi som kombinerer enhetene til telleren og nevneren. For eksempel produksjon per innbygger. Relative intensitetsverdier kjennetegner graden av spredning eller utvikling av et fenomen i et bestemt miljø. De inkluderer også demografiske koeffisienter (fruktbarhet, dødelighet, intensitet av migrasjonsstrømmer), som beregnes ved forholdet mellom antall hendelser (død, fødsel) i en viss tidsperiode til gjennomsnittlig befolkning befolkning i samme periode.

Sammenligning navnebror verdier lar deg velge følgende typer relative verdier: struktur, koordinering, dynamikk, planoppgave, planoppfyllelse, sammenligning av objektegenskaper.

Relative verdier for koordinering - dette er relasjonene mellom de enkelte delene av helheten eller forholdet mellom de enkelte delene av befolkningen til en av dem, tatt som sammenligningsgrunnlag. Eksempel, antall urbane innbyggere per 100 landlige; antall kvinner per 100 menn. Disse verdiene er uttrykt som prosenter, ppm eller multipler (for eksempel er det 114 kvinner per 100 menn).

For å vurdere intensiteten av utviklingen, bruk den relative størrelsen på dynamikken, som beregnes som forholdet mellom nivåene av fenomenet som studeres i to perioder.

Relative sammenligningsverdier beregnes som forhold mellom lignende indikatorer som karakteriserer forskjellige objekter eller territorier og har samme tidsmessige sikkerhet.

Noen prosesser planlegges og for indikatorene som reflekterer dem settes planmål. Ved å sammenligne de planlagte og faktiske verdiene til indikatorene, beregnes de relative verdiene: planmål og plangjennomføring.

Hvis vi angir det faktiske nivået for gjeldende periode y1, utgangspunkt y0 og planlagt nivå ypl, deretter den relative verdien:

Kd = y1 / y0,

2) planlagt mål

Kpz \u003d ypl / y0,

3) plangjennomføring

Kvp \u003d y1 / ypl .

Kapittel 4.4. Typer og former for gjennomsnittsverdier.

Gjennomsnittlig verdi kalt statistikk, som gir en generalisert beskrivelse av det varierende trekk ved homogene enheter av befolkningen under spesifikke forhold for sted og tid. Verdien av gjennomsnittet karakteriserer hele befolkningen og karakteriserer den i forhold til én gitt egenskap.

gjennomsnittlig verdi reflekterer det felles som er iboende i alle enheter av den studerte befolkningen.

Så for eksempel gjennomsnittet lønn gir en generaliserende kvantitativ karakteristikk av lønnstilstanden til det betraktede settet med arbeidere.

Essensen av midten ligger i det faktum at det gjensidig tilbakebetaler tilfeldige avvik karakteristiske verdier og tar hensyn til endringene forårsaket av hovedfaktoren.

Statistisk behandling metoden for gjennomsnittsverdier er å erstatte de individuelle verdiene til variabelattributtet med en balansert gjennomsnittsverdi X.

For eksempel var den individuelle produksjonen til 5 operatører av en forretningsbank per dag 136, 140, 154 og 162 operasjoner. For å få gjennomsnittlig antall transaksjoner per dag utført av én teller, må du legge sammen disse individuelle indikatorene og dele det resulterende beløpet på antall tellere:

Som det fremgår av eksemplet ovenfor, samsvarer ikke gjennomsnittlig antall transaksjoner med noen av de enkelte, siden ikke en eneste operatør foretok 150 transaksjoner. Men hvis vi forestiller oss at hver operatør utførte 150 operasjoner, så de totale mengden vil ikke endre seg, men vil også være lik 750. Dermed har vi kommet til hovedegenskapen til gjennomsnittsverdier: summen av de individuelle verdiene til attributtet er lik summen av gjennomsnittsverdiene.

Denne egenskapen understreker nok en gang at gjennomsnittsverdien er en generaliserende egenskap for hele den statistiske populasjonen.

Gjennomsnittsverdier er delt inn i to store klasser:

Effektgjennomsnitt:

Aritmetikk

harmonisk

Geometrisk

kvadratisk

Strukturelle gjennomsnitt:

Mote

Median

Den vanligste typen gjennomsnitt er det aritmetiske gjennomsnittet:

enkel aritmetisk gjennomsnitt

Aritmetisk vektet gjennomsnitt

Aritmetisk gjennomsnitt for en intervallserie.

Enkelt aritmetisk gjennomsnitt representerer gjennomsnittsleddet for å bestemme hvilket totalvolumet av en gitt attributt i datasettet som er likt fordelt mellom alle enheter som er inkludert i denne.

Så den gjennomsnittlige årlige produksjonen per arbeider er mengden produksjon som ville falle på hver ansatt hvis hele volumet av produksjonen var likt fordelt mellom alle ansatte i organisasjonen. Den aritmetiske gjennomsnittlige enkelverdien beregnes ved hjelp av formelen.