biografieën Kenmerken Analyse

Hoe het rekenkundig gemiddelde van statistieken te vinden. Gemiddelde waarden in statistieken

Deze term heeft andere betekenissen, zie de gemiddelde betekenis.

Gemiddeld(in wiskunde en statistiek) reeksen getallen - de som van alle getallen gedeeld door hun getal. Het is een van de meest voorkomende maten van centrale tendens.

Het werd voorgesteld (samen met het geometrische gemiddelde en het harmonische gemiddelde) door de Pythagoreeërs.

Speciale gevallen van het rekenkundig gemiddelde zijn het gemiddelde (van de algemene bevolking) en het steekproefgemiddelde (van steekproeven).

Invoering

Geef de set gegevens aan X = (x 1 , x 2 , …, x n), dan wordt het steekproefgemiddelde meestal aangegeven met een horizontale balk boven de variabele (x ¯ (\displaystyle (\bar (x))) , uitgesproken als " x met een streepje").

De Griekse letter μ wordt gebruikt om het rekenkundig gemiddelde van de gehele bevolking aan te duiden. Voor een willekeurige variabele waarvoor een gemiddelde waarde is gedefinieerd, is μ is waarschijnlijkheid gemiddelde of de wiskundige verwachting van een willekeurige variabele. Als de set X is een verzameling willekeurige getallen met een waarschijnlijkheidsgemiddelde μ, dan voor elke steekproef x i uit deze verzameling μ = E( x i) is de verwachting van dit monster.

In de praktijk is het verschil tussen μ en x ¯ (\displaystyle (\bar (x))) dat μ een typische variabele is omdat je de steekproef kunt zien in plaats van de hele populatie. Daarom, als de steekproef willekeurig wordt weergegeven (in termen van kanstheorie), dan kan x ¯ (\displaystyle (\bar (x))) (maar niet μ) worden behandeld als een willekeurige variabele met een kansverdeling op de steekproef ( kansverdeling van het gemiddelde).

Beide hoeveelheden worden op dezelfde manier berekend:

X ¯ = 1 n ∑ ik = 1 n x ik = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Als een X een willekeurige variabele is, dan is de wiskundige verwachting X kan worden beschouwd als het rekenkundig gemiddelde van de waarden bij herhaalde metingen van de hoeveelheid X. Dit is een manifestatie van de wet van de grote getallen. Daarom wordt het steekproefgemiddelde gebruikt om de onbekende wiskundige verwachting te schatten.

In de elementaire algebra is bewezen dat het gemiddelde n+ 1 cijfers boven het gemiddelde n getallen als en alleen als het nieuwe getal groter is dan het oude gemiddelde, minder als en alleen als het nieuwe getal kleiner is dan het gemiddelde, en verandert niet als en alleen als het nieuwe getal gelijk is aan het gemiddelde. Meer n, hoe kleiner het verschil tussen het nieuwe en het oude gemiddelde.

Merk op dat er verschillende andere "middelen" beschikbaar zijn, waaronder machtswetgemiddelde, Kolmogorov-gemiddelde, harmonisch gemiddelde, rekenkundig-geometrisch gemiddelde en verschillende gewogen gemiddelden (bijv. rekenkundig gewogen gemiddelde, geometrisch gewogen gemiddelde, harmonisch gewogen gemiddelde) .

Voorbeelden

  • Voor drie getallen moet je ze optellen en delen door 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Voor vier getallen moet je ze optellen en delen door 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Of makkelijker 5+5=10, 10:2. Omdat we 2 getallen hebben toegevoegd, wat betekent dat we delen door hoeveel getallen we optellen.

Continue willekeurige variabele

Voor een continu verdeelde waarde f (x) (\displaystyle f(x)) het rekenkundig gemiddelde op het interval [ a ; b ] (\ Displaystyle ) wordt gedefinieerd via een bepaalde integraal:

F (x) ¯ [ een ; b ] = 1 b − een een b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Enkele problemen bij het gebruik van het gemiddelde

Gebrek aan robuustheid

Hoofd artikel: Robuustheid in statistieken

Hoewel het rekenkundig gemiddelde vaak wordt gebruikt als middel of als centrale trend, is dit concept niet van toepassing op robuuste statistieken, waardoor het rekenkundig gemiddelde sterk wordt beïnvloed door "grote afwijkingen". Het is opmerkelijk dat voor distributies met een grote scheefheid het rekenkundig gemiddelde mogelijk niet overeenkomt met het concept "gemiddelde", en dat de waarden van het gemiddelde uit robuuste statistieken (bijvoorbeeld de mediaan) de centrale trend beter kunnen beschrijven.

Het klassieke voorbeeld is de berekening van het gemiddelde inkomen. Het rekenkundig gemiddelde kan verkeerd worden geïnterpreteerd als een mediaan, wat kan leiden tot de conclusie dat er meer mensen zijn met meer inkomen dan er in werkelijkheid zijn. "Gemiddeld" inkomen wordt zo geïnterpreteerd dat het inkomen van de meeste mensen dicht bij dit aantal ligt. Dit "gemiddelde" (in de zin van het rekenkundig gemiddelde) inkomen is hoger dan het inkomen van de meeste mensen, aangezien een hoog inkomen met een grote afwijking van het gemiddelde het rekenkundig gemiddelde sterk scheef maakt (het mediane inkomen daarentegen "weerstaat" zo'n scheef). Dit "gemiddelde" inkomen zegt echter niets over het aantal mensen in de buurt van het mediane inkomen (en niets over het aantal mensen in de buurt van het modale inkomen). Als de begrippen 'gemiddeld' en 'meerderheid' echter licht worden opgevat, kan men ten onrechte concluderen dat de meeste mensen een hoger inkomen hebben dan ze in werkelijkheid zijn. Een rapport over het "gemiddelde" netto-inkomen in Medina, Washington, berekend als het rekenkundig gemiddelde van alle jaarlijkse netto-inkomens van inwoners, zal bijvoorbeeld een verrassend hoog aantal opleveren vanwege Bill Gates. Beschouw het voorbeeld (1, 2, 2, 2, 3, 9). Het rekenkundig gemiddelde is 3,17, maar vijf van de zes waarden liggen onder dit gemiddelde.

Samengestelde rente

Hoofd artikel: ROI

Als nummers vermenigvuldigen, maar niet vouwen, moet u het geometrische gemiddelde gebruiken, niet het rekenkundige gemiddelde. Meestal gebeurt dit incident bij het berekenen van het rendement op investeringen in financiën.

Als de aandelen bijvoorbeeld in het eerste jaar met 10% zijn gedaald en in het tweede jaar met 30% zijn gestegen, is het onjuist om de "gemiddelde" stijging over deze twee jaar te berekenen als het rekenkundig gemiddelde (−10% + 30%) / 2 = 10%; het juiste gemiddelde wordt in dit geval gegeven door de samengestelde jaarlijkse groei, waarvan de jaarlijkse groei slechts ongeveer 8,16653826392% ≈ 8,2% is.

De reden hiervoor is dat percentages telkens een nieuw uitgangspunt hebben: 30% is 30% vanaf een aantal lager dan de prijs aan het begin van het eerste jaar: als het aandeel begon bij $ 30 en 10% daalde, is het aan het begin van jaar twee $ 27 waard. Als het aandeel 30% is gestegen, is het aan het einde van het tweede jaar $ 35,1 waard. Het rekenkundig gemiddelde van deze groei is 10%, maar aangezien het aandeel in 2 jaar slechts met $ 5,1 is gegroeid, geeft een gemiddelde stijging van 8,2% een eindresultaat van $ 35,1:

[$30 (1 - 0,1) (1 + 0,3) = $30 (1 + 0,082) (1 + 0,082) = $ 35,1]. Als we het rekenkundig gemiddelde van 10% op dezelfde manier gebruiken, krijgen we niet de werkelijke waarde: [$30 (1 + 0,1) (1 + 0,1) = $ 36,3].

Samengestelde rente aan het einde van jaar 2: 90% * 130% = 117%, d.w.z. een totale stijging van 17%, en de gemiddelde jaarlijkse samengestelde rente is 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \ongeveer 108,2\%), dat wil zeggen een gemiddelde jaarlijkse stijging van 8,2%.

Routebeschrijving

Hoofd artikel: Bestemmingsstatistieken

Bij het berekenen van het rekenkundig gemiddelde van een variabele die cyclisch verandert (bijvoorbeeld fase of hoek), moet speciale aandacht worden besteed. Het gemiddelde van 1° en 359° is bijvoorbeeld 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Dit nummer is om twee redenen onjuist.

  • Ten eerste worden hoekmaten alleen gedefinieerd voor het bereik van 0° tot 360° (of van 0 tot 2π indien gemeten in radialen). Dus hetzelfde paar getallen kan worden geschreven als (1° en -1°) of als (1° en 719°). De gemiddelden van elk paar zijn verschillend: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ)))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Ten tweede zou in dit geval een waarde van 0° (gelijk aan 360°) het geometrisch beste gemiddelde zijn, aangezien de getallen minder afwijken van 0° dan van enige andere waarde (waarde 0° heeft de kleinste variantie). Vergelijken:
    • het getal 1° wijkt slechts 1° af van 0°;
    • het getal 1° wijkt 179° af van het berekende gemiddelde van 180°.

De gemiddelde waarde voor een cyclische variabele, berekend volgens de bovenstaande formule, wordt kunstmatig verschoven ten opzichte van het werkelijke gemiddelde naar het midden van het numerieke bereik. Hierdoor wordt het gemiddelde op een andere manier berekend, namelijk het getal met de kleinste variantie (middelpunt) wordt gekozen als gemiddelde waarde. In plaats van aftrekken wordt ook modulo-afstand (d.w.z. omtreksafstand) gebruikt. De modulaire afstand tussen 1° en 359° is bijvoorbeeld 2°, niet 358° (op een cirkel tussen 359° en 360°==0° - één graad, tussen 0° en 1° - ook 1°, in totaal - 2 °).

4.3. Gemiddelde waarden. Essentie en betekenis van gemiddelden

Gemiddelde waarde in statistieken wordt een generaliserende indicator genoemd, die het typische niveau van een fenomeen in specifieke omstandigheden van plaats en tijd karakteriseert, en die de grootte van een variërend attribuut per eenheid van een kwalitatief homogene populatie weerspiegelt. In de economische praktijk wordt een breed scala aan indicatoren gebruikt, berekend als gemiddelden.

Een algemene indicator van het inkomen van werknemers in een naamloze vennootschap (JSC) is bijvoorbeeld het gemiddelde inkomen van één werknemer, bepaald door de verhouding tussen het loonfonds en de sociale uitkeringen voor de beschouwde periode (jaar, kwartaal, maand ) tot het aantal werknemers in de JSC.

Het berekenen van het gemiddelde is een veelgebruikte generalisatietechniek; de gemiddelde indicator geeft het algemene weer dat typisch (typisch) is voor alle eenheden van de bestudeerde populatie, terwijl het tegelijkertijd de verschillen tussen individuele eenheden negeert. In elk fenomeen en zijn ontwikkeling is er een combinatie kans en nodig hebben. Bij het berekenen van gemiddelden, vanwege de werking van de wet van de grote getallen, heft willekeur elkaar op, wordt in evenwicht gehouden, zodat u kunt abstraheren van de onbeduidende kenmerken van het fenomeen, van de kwantitatieve waarden van het attribuut in elk specifiek geval. In het vermogen om te abstraheren van de willekeur van individuele waarden, liggen fluctuaties de wetenschappelijke waarde van gemiddelden als samenvatten geaggregeerde kenmerken.

Waar generalisatie nodig is, leidt de berekening van dergelijke kenmerken tot de vervanging van veel verschillende individuele waarden van het attribuut medium een indicator die de totaliteit van verschijnselen kenmerkt, die het mogelijk maakt om de patronen te identificeren die inherent zijn aan massale sociale verschijnselen, niet waarneembaar in afzonderlijke verschijnselen.

Het gemiddelde geeft het karakteristieke, typische, reële niveau van de bestudeerde verschijnselen weer, kenmerkt deze niveaus en hun veranderingen in tijd en ruimte.

Het gemiddelde is een samenvattend kenmerk van de regelmatigheden van het proces onder de omstandigheden waarin het verloopt.

4.4. Soorten gemiddelden en methoden om ze te berekenen

De keuze van het type gemiddelde wordt bepaald door de economische inhoud van een bepaalde indicator en de initiële gegevens. In elk geval wordt een van de gemiddelde waarden toegepast: rekenkunde, garmonisch, geometrisch, kwadratisch, kubisch enz. De vermelde gemiddelden behoren tot de klasse stroom medium.

Naast power-law-gemiddelden worden in de statistische praktijk structurele gemiddelden gebruikt, die als de modus en mediaan worden beschouwd.

Laten we in meer detail stilstaan ​​​​bij machtsmiddelen.

rekenkundig gemiddelde

Het meest voorkomende type gemiddelde is gemiddeld rekenkundig. Het wordt gebruikt in gevallen waarin het volume van een variabel attribuut voor de gehele populatie de som is van de waarden van de attributen van zijn individuele eenheden. Sociale verschijnselen worden gekenmerkt door de optelling (som) van de volumes van een variërend attribuut, dit bepaalt de reikwijdte van het rekenkundig gemiddelde en verklaart de prevalentie ervan als een generaliserende indicator, bijvoorbeeld: het totale loonfonds is de som van de lonen van alle werknemers, is de bruto-oogst de som van de vervaardigde producten van het hele zaaigebied.

Om het rekenkundig gemiddelde te berekenen, moet u de som van alle kenmerkwaarden delen door hun aantal.

Het rekenkundig gemiddelde wordt toegepast in de vorm eenvoudig gemiddelde en gewogen gemiddelde. Het eenvoudige gemiddelde dient als de initiële, bepalende vorm.

eenvoudig rekenkundig gemiddelde is gelijk aan de eenvoudige som van de individuele waarden van het gemiddelde kenmerk, gedeeld door het totale aantal van deze waarden (het wordt gebruikt in gevallen waarin er niet-gegroepeerde individuele waarden van het kenmerk zijn):

waar
- individuele waarden van de variabele (opties); m - aantal bevolkingseenheden.

Verdere optellimieten in de formules worden niet aangegeven. Het is bijvoorbeeld nodig om de gemiddelde output van één arbeider (slotenmaker) te vinden, als bekend is hoeveel onderdelen elk van de 15 arbeiders produceerde, d.w.z. gegeven een aantal individuele waarden van de eigenschap, stuks:

21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

Het eenvoudig rekenkundig gemiddelde wordt berekend met de formule (4.1), 1 pc.:

Het gemiddelde van opties die een verschillend aantal keren worden herhaald, of waarvan wordt gezegd dat ze verschillende gewichten hebben, wordt genoemd gewogen. De gewichten zijn het aantal eenheden in verschillende bevolkingsgroepen (de groep combineert dezelfde opties).

Rekenkundig gewogen gemiddelde- gemiddelde gegroepeerde waarden, - wordt berekend met de formule:

, (4.2)

waar
- gewichten (frequentie van herhaling van dezelfde kenmerken);

- de som van de producten van de grootte van kenmerken door hun frequenties;

- het totale aantal bevolkingseenheden.

We zullen de techniek voor het berekenen van het rekenkundig gewogen gemiddelde illustreren met behulp van het hierboven besproken voorbeeld. Om dit te doen, groeperen we de initiële gegevens en plaatsen ze in de tabel. 4.1.

Tabel 4.1

De verdeling van arbeiders voor de ontwikkeling van onderdelen

Volgens de formule (4.2) is het rekenkundig gewogen gemiddelde gelijk, stuks:

In sommige gevallen kunnen de gewichten niet worden weergegeven door absolute waarden, maar door relatieve (in percentages of fracties van een eenheid). Dan ziet de formule voor het rekenkundig gewogen gemiddelde er als volgt uit:

waar
- bijzonder, d.w.z. aandeel van elke frequentie in de totale som van alle

Als de frequenties in breuken (coëfficiënten) worden geteld, dan:
= 1, en de formule voor het rekenkundig gewogen gemiddelde is:

Berekening van het rekenkundig gewogen gemiddelde uit de groepsgemiddelden uitgevoerd volgens de formule:

,

waar f-aantal eenheden in elke groep.

De resultaten van het berekenen van het rekenkundig gemiddelde van de groepsgemiddelden worden weergegeven in de tabel. 4.2.

Tabel 4.2

Verdeling van werknemers naar gemiddelde diensttijd

In dit voorbeeld zijn de opties geen individuele gegevens over de diensttijd van individuele werknemers, maar gemiddelden voor elke werkplaats. schubben f zijn het aantal werknemers in de winkels. Daarom zal de gemiddelde werkervaring van werknemers in de hele onderneming jaren zijn:

.

Berekening van het rekenkundig gemiddelde in de distributiereeks

Als de waarden van het gemiddelde kenmerk worden gegeven als intervallen ("van - tot"), d.w.z. intervalverdelingsreeks, dan worden bij het berekenen van het rekenkundig gemiddelde de middelpunten van deze intervallen genomen als de waarden van de kenmerken in groepen, waardoor een discrete reeks wordt gevormd. Beschouw het volgende voorbeeld (Tabel 4.3).

Laten we van een intervalreeks naar een discrete gaan door de intervalwaarden te vervangen door hun gemiddelde waarden / (eenvoudig gemiddelde

Tabel 4.3

Verdeling van AO-werknemers naar de hoogte van het maandloon

Groepen arbeiders voor

Aantal arbeiders

Het midden van het interval

loon, wrijf.

pers., f

wrijven., X

900 en meer

de waarden van open intervallen (eerste en laatste) worden voorwaardelijk gelijkgesteld aan de aangrenzende intervallen (tweede en voorlaatste).

Bij een dergelijke berekening van het gemiddelde is enige onnauwkeurigheid geoorloofd, aangezien een aanname wordt gedaan over de uniforme verdeling van eenheden van het attribuut binnen de groep. De fout is echter hoe kleiner, hoe smaller het interval en hoe meer eenheden in het interval.

Nadat de middelpunten van de intervallen zijn gevonden, worden de berekeningen op dezelfde manier uitgevoerd als in een discrete reeks - de opties worden vermenigvuldigd met de frequenties (gewichten) en de som van de producten wordt gedeeld door de som van de frequenties (gewichten) , duizend roebel:

.

Het gemiddelde beloningsniveau van werknemers in JSC is dus 729 roebel. per maand.

De berekening van het rekenkundig gemiddelde gaat vaak gepaard met veel tijd en arbeid. In sommige gevallen kan de procedure voor het berekenen van het gemiddelde echter worden vereenvoudigd en vergemakkelijkt door de eigenschappen ervan te gebruiken. Laten we (zonder bewijs) enkele basiseigenschappen van het rekenkundig gemiddelde presenteren.

Eigendom 1. Als alle individuele karakteristieke waarden (d.w.z. alle opties) verlagen of verhogen in ikeer, dan de gemiddelde waarde van een nieuwe functie zal dienovereenkomstig afnemen of toenemen in ieen keer.

Eigendom 2. Als alle varianten van het gemiddelde kenmerk worden verlaagdnaai of vermeerder met het cijfer A, dan het rekenkundig gemiddeldeaanzienlijk afnemen of toenemen met hetzelfde getal A.

Eigendom 3. Als de gewichten van alle gemiddelde opties worden verlaagd of verhogen tot tot keer verandert het rekenkundig gemiddelde niet.

Als gemiddelde gewichten kunt u in plaats van absolute indicatoren specifieke gewichten gebruiken in het totale totaal (aandelen of percentages). Dit vereenvoudigt de berekening van het gemiddelde.

Om de berekeningen van het gemiddelde te vereenvoudigen, volgen ze het pad van het verminderen van de waarden van opties en frequenties. De grootste vereenvoudiging wordt bereikt wanneer: MAAR de waarde van een van de centrale opties met de hoogste frequentie wordt geselecteerd als / - de waarde van het interval (voor rijen met dezelfde intervallen). De waarde van L wordt de oorsprong genoemd, dus deze methode voor het berekenen van het gemiddelde wordt de "methode om te tellen vanaf voorwaardelijke nul" of "methode van momenten".

Laten we aannemen dat alle opties X eerst verminderd met hetzelfde aantal A, en vervolgens verminderd in i een keer. We krijgen een nieuwe variatiedistributiereeks van nieuwe varianten .

Dan nieuwe opties zal worden uitgedrukt:

,

en hun nieuwe rekenkundige gemiddelde , -eerste bestelling moment- formule:

.

Het is gelijk aan het gemiddelde van de oorspronkelijke opties, eerst verminderd met MAAR, en dan binnen i een keer.

Om het echte gemiddelde te krijgen, heb je een moment van de eerste orde nodig m 1 , vermenigvuldigen met i en voeg toe MAAR:

.

Deze methode voor het berekenen van het rekenkundig gemiddelde uit een variatiereeks heet "methode van momenten". Deze methode wordt toegepast in rijen met gelijke intervallen.

De berekening van het rekenkundig gemiddelde door de methode van momenten wordt geïllustreerd door de gegevens in de tabel. 4.4.

Tabel 4.4

Verdeling van kleine ondernemingen in de regio naar de waarde van vaste productiemiddelen (OPF) in 2000

Groepen ondernemingen tegen kosten van OPF, duizend roebel

Aantal ondernemingen f

middelste intervallen, x

14-16 16-18 18-20 20-22 22-24

Het moment van de eerste bestelling vinden

.

Dan, uitgaande van A = 19 en wetende dat i= 2, bereken X, duizend roebel.:

Soorten gemiddelde waarden en methoden voor hun berekening

In het stadium van statistische verwerking kan een verscheidenheid aan onderzoekstaken worden ingesteld, voor de oplossing waarvan het nodig is om het juiste gemiddelde te kiezen. In dit geval moet u zich laten leiden door de volgende regel: de waarden die de teller en noemer van het gemiddelde vertegenwoordigen, moeten logisch aan elkaar gerelateerd zijn.

  • macht gemiddelden;
  • structurele gemiddelden.

Laten we de volgende notatie introduceren:

De waarden waarvoor het gemiddelde wordt berekend;

Gemiddeld, waarbij de regel hierboven aangeeft dat de middeling van individuele waarden plaatsvindt;

Frequentie (herhaalbaarheid van individuele eigenschapswaarden).

Verschillende middelen zijn afgeleid van de algemene machtsgemiddelde formule:

(5.1)

voor k = 1 - rekenkundig gemiddelde; k = -1 - harmonisch gemiddelde; k = 0 - geometrisch gemiddelde; k = -2 - wortelgemiddelde kwadraat.

Gemiddelden zijn eenvoudig of gewogen. gewogen gemiddelden worden hoeveelheden genoemd die er rekening mee houden dat sommige varianten van de waarden van het attribuut verschillende getallen kunnen hebben, en daarom moet elke variant met dit getal worden vermenigvuldigd. Met andere woorden, de "gewichten" zijn het aantal bevolkingseenheden in verschillende groepen, d.w.z. elke optie wordt "gewogen" op basis van de frequentie. De frequentie f heet statistisch gewicht of weeggemiddelde.

rekenkundig gemiddelde- het meest voorkomende type medium. Het wordt gebruikt wanneer de berekening wordt uitgevoerd op niet-gegroepeerde statistische gegevens, waar u de gemiddelde som wilt krijgen. Het rekenkundig gemiddelde is zo'n gemiddelde waarde van een kenmerk, bij ontvangst waarvan het totale volume van het kenmerk in de populatie ongewijzigd blijft.

De rekenkundig gemiddelde formule ( gemakkelijk) heeft de vorm

waarbij n de populatiegrootte is.

Het gemiddelde salaris van werknemers van een onderneming wordt bijvoorbeeld berekend als het rekenkundig gemiddelde:

De bepalende indicatoren zijn hierbij het loon van elke werknemer en het aantal werknemers van de onderneming. Bij de berekening van het gemiddelde bleef het totale loonbedrag gelijk, maar als het ware gelijk verdeeld over alle arbeiders. Het is bijvoorbeeld noodzakelijk om het gemiddelde salaris te berekenen van werknemers van een klein bedrijf waar 8 mensen werkzaam zijn:

Bij het berekenen van gemiddelden kunnen individuele waarden van het kenmerk dat gemiddeld wordt herhaald worden, zodat het gemiddelde wordt berekend met behulp van gegroepeerde gegevens. In dit geval hebben we het over het gebruik van rekenkundig gemiddelde gewogen, die eruitziet als

(5.3)

We moeten dus de gemiddelde aandelenkoers van een naamloze vennootschap op de beurs berekenen. Het is bekend dat transacties binnen 5 dagen (5 transacties) werden uitgevoerd, het aantal verkochte aandelen tegen de verkoopkoers was als volgt verdeeld:

1 - 800 ac. - 1010 roebel

2 - 650 wisselstroom. - 990 roebel.

3 - 700 ak. - 1015 roebel.

4 - 550 wisselstroom. - 900 roebel.

5 - 850 ak. - 1150 roebel.

De initiële ratio voor het bepalen van de gemiddelde aandelenkoers is de ratio van het totaal aantal transacties (OSS) tot het aantal verkochte aandelen (KPA).

Het meest voorkomende type gemiddelde is het rekenkundig gemiddelde.

eenvoudig rekenkundig gemiddelde

Het eenvoudige rekenkundige gemiddelde is de gemiddelde term om te bepalen welke het totale volume van een bepaald attribuut in de gegevens gelijkelijk is verdeeld over alle eenheden in deze populatie. De gemiddelde jaarlijkse output per werknemer is dus zo'n waarde van het outputvolume dat op elke werknemer zou vallen als het volledige outputvolume gelijk zou worden verdeeld over alle werknemers van de organisatie. De rekenkundige gemiddelde eenvoudige waarde wordt berekend met de formule:

eenvoudig rekenkundig gemiddelde— Gelijk aan de verhouding van de som van individuele waarden van een kenmerk tot het aantal kenmerken in het totaal

voorbeeld 1 . Een team van 6 werknemers ontvangt 3 3,2 3,3 3,5 3,8 3,1 duizend roebel per maand.

Vind het gemiddelde salaris
Oplossing: (3 + 3.2 + 3.3 +3.5 + 3.8 + 3.1) / 6 = 3.32 duizend roebel.

Rekenkundig gewogen gemiddelde

Als het volume van de dataset groot is en een distributiereeks vertegenwoordigt, wordt een gewogen rekenkundig gemiddelde berekend. Dit is hoe de gewogen gemiddelde prijs per productie-eenheid wordt bepaald: de totale productiekosten (de som van de producten van de hoeveelheid en de prijs van een productie-eenheid) wordt gedeeld door de totale hoeveelheid productie.

We geven dit weer in de vorm van de volgende formule:

Gewogen rekenkundig gemiddelde- is gelijk aan de verhouding (de som van de producten van de attribuutwaarde tot de herhalingsfrequentie van dit attribuut) tot (de som van de frequenties van alle attributen) Het wordt gebruikt wanneer de varianten van de bestudeerde populatie ongelijk voorkomen aantal keren.

Voorbeeld 2 . Vind het gemiddelde loon van winkelpersoneel per maand

Het gemiddelde loon kan worden verkregen door het totale loon te delen door het totale aantal werknemers:

Antwoord: 3.35 duizend roebel.

Rekenkundig gemiddelde voor een intervalreeks

Bij het berekenen van het rekenkundig gemiddelde voor een intervalvariatiereeks wordt het gemiddelde voor elk interval eerst bepaald als de halve som van de boven- en ondergrens en vervolgens het gemiddelde van de hele reeks. In het geval van open intervallen wordt de waarde van het onderste of bovenste interval bepaald door de waarde van de aangrenzende intervallen.

Uit intervalreeksen berekende gemiddelden zijn bij benadering.

Voorbeeld 3. Bepaal de gemiddelde leeftijd van de studenten in de avondafdeling.

Uit intervalreeksen berekende gemiddelden zijn bij benadering. De mate van hun onderlinge aanpassing hangt af van de mate waarin de feitelijke verdeling van populatie-eenheden binnen het interval uniform benadert.

Bij het berekenen van gemiddelden kunnen niet alleen absolute, maar ook relatieve waarden (frequentie) als gewichten worden gebruikt:

Het rekenkundig gemiddelde heeft een aantal eigenschappen die de essentie ervan beter onthullen en de berekening vereenvoudigen:

1. Het product van het gemiddelde en de som van de frequenties is altijd gelijk aan de som van de producten van de variant en de frequenties, d.w.z.

2. Het rekenkundig gemiddelde van de som van de variërende waarden is gelijk aan de som van het rekenkundig gemiddelde van deze waarden:

3. De algebraïsche som van de afwijkingen van de individuele waarden van het attribuut van het gemiddelde is nul:

4. De som van de gekwadrateerde afwijkingen van de opties van het gemiddelde is kleiner dan de som van de gekwadrateerde afwijkingen van een andere willekeurige waarde, d.w.z.

Om de gemiddelde waarde in Excel te vinden (of het nu een numerieke, tekstuele, procentuele of andere waarde is), zijn er veel functies. En elk van hen heeft zijn eigen kenmerken en voordelen. Bij deze taak kunnen immers bepaalde voorwaarden worden gesteld.

Zo worden de gemiddelde waarden van een reeks getallen in Excel berekend met behulp van statistische functies. U kunt ook handmatig uw eigen formule invoeren. Laten we verschillende opties bekijken.

Hoe het rekenkundig gemiddelde van getallen te vinden?

Om het rekenkundig gemiddelde te vinden, tel je alle getallen in de set bij elkaar op en deel je de som door het getal. Bijvoorbeeld de cijfers van een student in computerwetenschappen: 3, 4, 3, 5, 5. Wat geldt voor een kwart: 4. We hebben het rekenkundig gemiddelde gevonden met de formule: \u003d (3 + 4 + 3 + 5 + 5) / 5.

Hoe het snel te doen met Excel-functies? Neem bijvoorbeeld een reeks willekeurige getallen in een string:

Of: maak de cel actief en voer gewoon handmatig de formule in: =GEMIDDELDE(A1:A8).

Laten we nu eens kijken wat de GEMIDDELDE functie nog meer kan doen.


Zoek het rekenkundig gemiddelde van de eerste twee en de laatste drie getallen. Formule: =GEMIDDELDE(A1:B1;F1:H1). Resultaat:



Gemiddeld per staat

De voorwaarde voor het vinden van het rekenkundig gemiddelde kan een numeriek of een tekstcriterium zijn. We gebruiken de functie: =GEMIDDELDEALS().

Zoek het rekenkundig gemiddelde van getallen die groter zijn dan of gelijk zijn aan 10.

Functie: =GEMIDDELDEALS(A1:A8,">=10")


Het resultaat van het gebruik van de AVERAGEIF-functie op de voorwaarde ">=10":

Het derde argument - "Gemiddeld bereik" - wordt weggelaten. Ten eerste is het niet vereist. Ten tweede bevat het bereik dat door het programma wordt geanalyseerd ALLEEN numerieke waarden. In de cellen die zijn opgegeven in het eerste argument, wordt de zoekopdracht uitgevoerd volgens de voorwaarde die is opgegeven in het tweede argument.

Aandacht! Het zoekcriterium kan in een cel worden opgegeven. En in de formule om er naar te verwijzen.

Laten we de gemiddelde waarde van de getallen zoeken aan de hand van het tekstcriterium. Bijvoorbeeld de gemiddelde verkoop van het product "tafels".

De functie ziet er als volgt uit: =AVERAGEIF($A$2:$A$12;A7;$B$2:$B$12). Bereik - een kolom met productnamen. Het zoekcriterium is een link naar een cel met het woord "tabellen" (u kunt het woord "tabellen" invoegen in plaats van de link A7). Middelingsbereik - die cellen waaruit gegevens worden gehaald om de gemiddelde waarde te berekenen.

Als resultaat van het berekenen van de functie krijgen we de volgende waarde:

Aandacht! Voor een tekstcriterium (voorwaarde) moet het middelingsbereik worden opgegeven.

Hoe de gewogen gemiddelde prijs in Excel berekenen?

Hoe weten we de gewogen gemiddelde prijs?

Formule: =SOMPRODUCT(C2:C12,B2:B12)/SOM(C2:C12).


Met behulp van de SOMPRODUCT-formule komen we erachter wat de totale omzet is na de verkoop van de volledige hoeveelheid goederen. En de SOM-functie - somt de hoeveelheid goederen op. Door de totale opbrengst van de verkoop van goederen te delen door het totale aantal eenheden goederen, vonden we de gewogen gemiddelde prijs. Deze indicator houdt rekening met het "gewicht" van elke prijs. Zijn aandeel in de totale massa van waarden.

Standaarddeviatie: formule in Excel

Maak onderscheid tussen de standaarddeviatie voor de algemene bevolking en voor de steekproef. In het eerste geval is dit de wortel van de algemene variantie. In de tweede, van de steekproefvariantie.

Om deze statistische indicator te berekenen, wordt een spreidingsformule opgesteld. De wortel wordt er uit gehaald. Maar in Excel is er een kant-en-klare functie om de standaarddeviatie te vinden.


De standaarddeviatie is gekoppeld aan de schaal van de brongegevens. Dit is niet voldoende voor een figuurlijke weergave van de variatie van het geanalyseerde bereik. Om het relatieve spreidingsniveau in de gegevens te krijgen, wordt de variatiecoëfficiënt berekend:

standaarddeviatie / rekenkundig gemiddelde

De formule in Excel ziet er als volgt uit:

STDEV (waardenbereik) / GEMIDDELDE (waardenbereik).

De variatiecoëfficiënt wordt berekend als een percentage. Daarom stellen we het percentageformaat in de cel in.

5.1. Het concept van gemiddelde

Gemiddelde waarde - dit is een generaliserende indicator die het typische niveau van het fenomeen kenmerkt. Het drukt de waarde van het attribuut uit, gerelateerd aan de eenheid van de populatie.

Het gemiddelde generaliseert altijd de kwantitatieve variatie van het kenmerk, d.w.z. in gemiddelde waarden worden individuele verschillen in de eenheden van de populatie door willekeurige omstandigheden teniet gedaan. In tegenstelling tot het gemiddelde, laat de absolute waarde die het niveau van een kenmerk van een individuele populatie-eenheid kenmerkt, het niet toe om de waarden van het kenmerk te vergelijken voor eenheden die tot verschillende populaties behoren. Als u dus de beloningsniveaus van werknemers van twee ondernemingen moet vergelijken, kunt u op deze basis niet twee werknemers van verschillende ondernemingen vergelijken. De lonen van de werknemers die voor vergelijking zijn geselecteerd, zijn mogelijk niet typerend voor deze ondernemingen. Als we de omvang van de loonfondsen bij de betrokken ondernemingen vergelijken, dan wordt er geen rekening gehouden met het aantal werknemers en kan dus niet worden vastgesteld waar het loonniveau hoger is. Uiteindelijk kunnen alleen gemiddelden worden vergeleken, d.w.z. Hoeveel verdient een werknemer gemiddeld in elk bedrijf? Het is dus nodig om de gemiddelde waarde te berekenen als een generaliserend kenmerk van de populatie.

Het berekenen van het gemiddelde is een veelgebruikte generalisatietechniek; de gemiddelde indicator ontkent het algemene dat typisch (typisch) is voor alle eenheden van de bestudeerde populatie, maar negeert tegelijkertijd de verschillen tussen individuele eenheden. In elk fenomeen en zijn ontwikkeling is er een combinatie van toeval en noodzaak. Bij het berekenen van gemiddelden, vanwege de werking van de wet van de grote getallen, heft willekeur elkaar op, wordt in evenwicht gehouden, zodat u kunt abstraheren van de onbeduidende kenmerken van het fenomeen, van de kwantitatieve waarden van het attribuut in elk specifiek geval. In het vermogen om te abstraheren van de willekeur van individuele waarden, fluctuaties, ligt de wetenschappelijke waarde van gemiddelden als generaliserende kenmerken van aggregaten.

Om ervoor te zorgen dat het gemiddelde echt typerend is, moet het worden berekend met inachtneming van bepaalde principes.

Laten we stilstaan ​​bij enkele algemene principes voor de toepassing van gemiddelden.
1. Het gemiddelde dient te worden bepaald voor populaties bestaande uit kwalitatief homogene eenheden.
2. Het gemiddelde dient te worden berekend voor een populatie bestaande uit een voldoende groot aantal eenheden.
3. Het gemiddelde moet worden berekend voor de populatie, waarvan de eenheden zich in een normale, natuurlijke staat bevinden.
4. Bij de berekening van het gemiddelde moet rekening worden gehouden met de economische inhoud van de onderzochte indicator.

5.2. Soorten gemiddelden en methoden om ze te berekenen

Laten we nu eens kijken naar de soorten gemiddelden, de kenmerken van hun berekening en toepassingsgebieden. Gemiddelde waarden zijn onderverdeeld in twee grote klassen: vermogensgemiddelden, structurele gemiddelden.

Tot macht gemiddelde omvatten de meest bekende en meest gebruikte typen als geometrisch gemiddelde, rekenkundig gemiddelde en gemiddelde kwadraat.

Net zo structurele gemiddelden modus en mediaan worden beschouwd.

Laten we stilstaan ​​​​bij machtsgemiddelden. Vermogensgemiddelden kunnen, afhankelijk van de presentatie van de initiële gegevens, eenvoudig en gewogen zijn. eenvoudig gemiddelde wordt berekend op basis van niet-gegroepeerde gegevens en heeft de volgende algemene vorm:

waarbij X i de variant (waarde) is van het gemiddelde kenmerk;

n is het aantal opties.

Gewogen gemiddelde wordt berekend door gegroepeerde gegevens en heeft een algemene vorm

,

waarbij X i de variant (waarde) is van het gemiddelde kenmerk of de middelste waarde van het interval waarin de variant wordt gemeten;
m is de exponent van het gemiddelde;
f i - frequentie die aangeeft hoe vaak de i-e-waarde van het gemiddelde kenmerk voorkomt.

Laten we als voorbeeld de berekening geven van de gemiddelde leeftijd van studenten in een groep van 20 personen:


We berekenen de gemiddelde leeftijd met behulp van de eenvoudige gemiddelde formule:

Laten we de brongegevens groeperen. We krijgen de volgende distributiereeksen:

Als resultaat van groepering krijgen we een nieuwe indicator - frequentie, die het aantal studenten van X jaar aangeeft. Daarom wordt de gemiddelde leeftijd van de leerlingen in de groep berekend met behulp van de gewogen gemiddelde formule:

Algemene formules voor het berekenen van exponentiële gemiddelden hebben een exponent (m). Afhankelijk van de waarde die het kost, worden de volgende soorten vermogensgemiddelden onderscheiden:
harmonisch gemiddelde als m = -1;
geometrisch gemiddelde als m -> 0;
rekenkundig gemiddelde als m = 1;
wortelgemiddelde kwadraat als m = 2;
gemiddelde kubieke als m = 3.

De formules voor het machtsgemiddelde worden gegeven in de tabel. 4.4.

Als we alle soorten gemiddelden voor dezelfde initiële gegevens berekenen, zullen hun waarden niet hetzelfde zijn. Hier geldt de regel van de majorance van gemiddelden: met een toename van de exponent m, neemt ook de bijbehorende gemiddelde waarde toe:

In de statistische praktijk worden vaker dan andere typen gewogen gemiddelden rekenkundige en harmonisch gewogen gemiddelden gebruikt.

Tabel 5.1

Soorten machtsmiddelen

Type stroom
midden-
Inhoudsopgave
graden (m)
Rekenformule
Gemakkelijk gewogen
harmonische -1
Geometrisch 0
Rekenkundig 1
kwadratisch 2
kubieke 3

Het harmonische gemiddelde heeft een complexere structuur dan het rekenkundig gemiddelde. Het harmonische gemiddelde wordt gebruikt voor berekeningen wanneer de gewichten niet de eenheden van de populatie zijn - de dragers van de eigenschap, maar de producten van deze eenheden en de waarden van de eigenschap (d.w.z. m = Xf). De gemiddelde harmonische uitvaltijd moet worden gebruikt bij het bepalen van bijvoorbeeld de gemiddelde kosten van arbeid, tijd, materialen per eenheid output, per onderdeel voor twee (drie, vier, enz.) ondernemingen, werknemers die betrokken zijn bij de fabricage van de hetzelfde type product, hetzelfde onderdeel, product.

De belangrijkste vereiste voor de formule voor het berekenen van de gemiddelde waarde is dat alle fasen van de berekening een echt zinvolle rechtvaardiging hebben; de resulterende gemiddelde waarde moet de individuele waarden van het attribuut voor elk object vervangen zonder de verbinding tussen individuele en samenvattende indicatoren te verbreken. Met andere woorden, de gemiddelde waarde moet zo worden berekend dat wanneer elke individuele waarde van de gemiddelde indicator wordt vervangen door zijn gemiddelde waarde, een laatste samenvattende indicator, op de een of andere manier verbonden met de gemiddelde indicator, ongewijzigd blijft. Dit resultaat heet bepalend omdat de aard van de relatie met individuele waarden de specifieke formule bepaalt voor het berekenen van de gemiddelde waarde. Laten we deze regel laten zien aan de hand van het voorbeeld van het geometrische gemiddelde.

Geometrisch gemiddelde formule

meestal gebruikt bij het berekenen van de gemiddelde waarde van individuele relatieve waarden van de dynamiek.

Het geometrische gemiddelde wordt gebruikt als een reeks relatieve kettingwaarden van dynamiek wordt gegeven, die bijvoorbeeld een toename van de output aangeven in vergelijking met het niveau van het voorgaande jaar: i 1 , i 2 , i 3 ,..., in . Uiteraard wordt het productievolume van het afgelopen jaar bepaald door het initiële niveau (q 0) en de daaropvolgende groei door de jaren heen:

q n =q 0 × i 1 × i 2 ×...×i n .

Door q n als bepalende indicator te nemen en de individuele waarden van de dynamische indicatoren te vervangen door gemiddelde, komen we tot de relatie

Vanaf hier

5.3. Structurele gemiddelden

Een speciaal type gemiddelde waarden - structurele gemiddelden - wordt gebruikt om de interne structuur van de reeks distributie van attribuutwaarden te bestuderen, evenals om de gemiddelde waarde (vermogenstype) te schatten, als, volgens de beschikbare statistische gegevens, de berekening ervan kan niet worden uitgevoerd (bijvoorbeeld als er geen gegevens in het beschouwde voorbeeld zouden zijn) en op het productievolume en op het bedrag van de kosten door groepen ondernemingen).

Indicatoren worden meestal gebruikt als structurele gemiddelden. mode - de meest herhaalde kenmerkwaarde - en mediaan - de waarde van een functie die de geordende reeks van zijn waarden in twee gelijke delen verdeelt. Als gevolg hiervan overschrijdt de waarde van het attribuut in de ene helft van de populatie-eenheden het mediaanniveau niet, en in de andere helft is het niet minder dan het.

Als het onderzochte kenmerk discrete waarden heeft, zijn er geen bijzondere problemen bij het berekenen van de modus en mediaan. Als de gegevens over de waarden van het attribuut X worden gepresenteerd in de vorm van geordende intervallen van verandering (intervalreeks), wordt de berekening van de modus en mediaan iets gecompliceerder. Omdat de mediaanwaarde de gehele populatie in twee gelijke delen verdeelt, komt deze in een van de intervallen van het kenmerk X terecht. Met interpolatie wordt de mediaanwaarde in dit mediane interval gevonden:

,

waarbij X Me de ondergrens van het mediane interval is;
h Mij is de waarde ervan;
(Sum m) / 2 - de helft van het totale aantal waarnemingen of de helft van het volume van de indicator die wordt gebruikt als weging in de formules voor het berekenen van de gemiddelde waarde (in absolute of relatieve termen);
S Me-1 is de som van waarnemingen (of het volume van het weegkenmerk) verzameld vóór het begin van het mediane interval;
m Me is het aantal waarnemingen of het volume van het weegkenmerk in het mediane interval (ook in absolute of relatieve termen).

In ons voorbeeld kunnen zelfs drie mediane waarden worden verkregen - op basis van de tekens van het aantal ondernemingen, het productievolume en het totale bedrag aan productiekosten:

Dus voor de helft van de ondernemingen zijn de kosten van een productie-eenheid hoger dan 125,19 duizend roebel, de helft van het totale productievolume wordt geproduceerd met een kostenniveau per product van meer dan 124,79 duizend roebel. en 50% van de totale kosten wordt gevormd op het niveau van de kosten van één product boven 125,07 duizend roebel. We merken ook op dat er een zekere opwaartse trend in de kosten is, aangezien Me 2 = 124,79 duizend roebel, en het gemiddelde niveau is 123,15 duizend roebel.

Bij het berekenen van de modale waarde van een kenmerk volgens de gegevens van de intervalreeks, moet erop worden gelet dat de intervallen hetzelfde zijn, aangezien de indicator van de frequentie van kenmerkwaarden X hiervan afhangt. een intervalreeks met gelijke intervallen, wordt de moduswaarde bepaald als

waarbij X Mo de laagste waarde is van het modale interval;
m Mo is het aantal waarnemingen of het volume van het wegingskenmerk in het modale interval (in absolute of relatieve termen);
m Mo -1 - hetzelfde voor het interval voorafgaand aan de modale;
m Mo+1 - hetzelfde voor het interval dat volgt op de modale;
h is de waarde van het interval van verandering van de eigenschap in groepen.

Voor ons voorbeeld kunnen drie modale waarden worden berekend op basis van de tekens van het aantal ondernemingen, het productievolume en het bedrag aan kosten. In alle drie de gevallen is het modale interval hetzelfde, aangezien voor hetzelfde interval zowel het aantal ondernemingen, het productievolume als het totale bedrag aan productiekosten het grootst blijken te zijn:

Zo worden bedrijven met een kostenniveau van 126,75 duizend roebel het vaakst aangetroffen, producten met een kostenniveau van 126,69 duizend roebel worden het vaakst geproduceerd en meestal worden de productiekosten verklaard door een kostenniveau van 123,73 duizend roebel.

5.4. Variatie-indicatoren

De specifieke omstandigheden waarin elk van de bestudeerde objecten zich bevindt, evenals de kenmerken van hun eigen ontwikkeling (sociaal, economisch, enz.) worden uitgedrukt door de overeenkomstige numerieke niveaus van statistische indicatoren. Op deze manier, variatie, die. de discrepantie tussen de niveaus van dezelfde indicator in verschillende objecten is objectief en helpt om de essentie van het bestudeerde fenomeen te begrijpen.

Er zijn verschillende manieren om variatie in statistieken te meten.

De eenvoudigste is de berekening van de indicator overspanningsvariatie H als het verschil tussen de maximale (X max) en minimale (X min) waargenomen waarden van de eigenschap:

H=Xmax - Xmin.

Het variatiebereik toont echter alleen de extreme waarden van de eigenschap. Er wordt hier geen rekening gehouden met de herhaalbaarheid van tussenliggende waarden.

Strengere kenmerken zijn indicatoren van fluctuatie ten opzichte van het gemiddelde niveau van het attribuut. De eenvoudigste indicator van dit type is: gemiddelde lineaire afwijking L als het rekenkundig gemiddelde van de absolute afwijkingen van een eigenschap van het gemiddelde niveau:

Bij de herhaling van individuele waarden van X wordt de gewogen rekenkundige gemiddelde formule gebruikt:

(Bedenk dat de algebraïsche som van afwijkingen van het gemiddelde niveau nul is.)

De indicator van de gemiddelde lineaire afwijking wordt in de praktijk breed toegepast. Met zijn hulp worden bijvoorbeeld de samenstelling van arbeiders, het productieritme, de uniformiteit van de materiaaltoevoer geanalyseerd en systemen van materiële prikkels ontwikkeld. Maar helaas bemoeilijkt deze indicator berekeningen van een probabilistisch type, waardoor het moeilijk is om de methoden van wiskundige statistieken toe te passen. Daarom wordt de indicator in statistisch wetenschappelijk onderzoek het vaakst gebruikt om variatie te meten. spreiding.

De kenmerkvariantie (s 2) wordt bepaald op basis van het kwadratische machtsgemiddelde:

.

Een exponent s gelijk aan heet standaardafwijking.

In de algemene theorie van de statistiek is de variantie-indicator een schatting van de gelijknamige kanstheorie-indicator en (als de som van gekwadrateerde afwijkingen) een schatting van de variantie in wiskundige statistiek, wat het mogelijk maakt om de bepalingen van deze theoretische disciplines om sociaal-economische processen te analyseren.

Als de variatie wordt geschat op basis van een klein aantal waarnemingen uit een onbeperkte algemene populatie, wordt de gemiddelde waarde van het kenmerk bepaald met een fout. De berekende waarde van de spreiding lijkt naar beneden te zijn verschoven. Om een ​​onbevooroordeelde schatting te krijgen, moet de steekproefvariantie verkregen uit de bovenstaande formules worden vermenigvuldigd met n / (n - 1). Als gevolg hiervan, met een klein aantal waarnemingen (< 30) дисперсию признака рекомендуется вычислять по формуле

Gewoonlijk wordt al bij n > (15÷20) de discrepantie tussen de vertekende en onpartijdige schattingen onbeduidend. Om dezelfde reden wordt er meestal geen rekening gehouden met vertekening in de formule voor het optellen van varianties.

Als er meerdere steekproeven worden genomen uit de algemene populatie en telkens de gemiddelde waarde van het attribuut wordt bepaald, ontstaat het probleem van het inschatten van de variabiliteit van de gemiddelden. variantie schatten gemiddelde waarde kan ook gebaseerd zijn op slechts één voorbeeldwaarneming volgens de formule

,

waarbij n de steekproefomvang is; s 2 is de variantie van het kenmerk berekend op basis van de voorbeeldgegevens.

Waarde wordt genoemd gemiddelde bemonsteringsfout en is een kenmerk van de afwijking van de steekproefgemiddelde waarde van kenmerk X van zijn werkelijke gemiddelde waarde. De gemiddelde foutindicator wordt gebruikt bij het beoordelen van de betrouwbaarheid van de resultaten van steekproefobservatie.

Relatieve spreidingsindicatoren. Om de mate van fluctuatie van het onderzochte kenmerk te karakteriseren, worden de fluctuatie-indicatoren in relatieve termen berekend. Hiermee kunt u de aard van spreiding in verschillende distributies vergelijken (verschillende observatie-eenheden van dezelfde eigenschap in twee sets, met verschillende waarden van de gemiddelden, bij het vergelijken van verschillende sets). Berekening van maatstaven voor relatieve spreiding wordt uitgevoerd als de verhouding van de absolute spreidingsindex tot het rekenkundig gemiddelde, vermenigvuldigd met 100%.

1. Oscillatiecoëfficiënt weerspiegelt de relatieve fluctuatie van de extreme waarden van de eigenschap rond het gemiddelde

.

2. Relatieve lineaire uitschakeling kenmerkt het aandeel van de gemiddelde waarde van het teken van absolute afwijkingen van de gemiddelde waarde

.

3. Variatiecoëfficiënt:

is de meest gebruikelijke variantiemaatstaf die wordt gebruikt om de typischheid van gemiddelden te beoordelen.

In statistieken worden populaties met een variatiecoëfficiënt van meer dan 30-35% als heterogeen beschouwd.

Deze methode voor het schatten van variatie heeft ook een belangrijk nadeel. Laten we inderdaad bijvoorbeeld de initiële populatie van werknemers met een gemiddelde diensttijd van 15 jaar, met een standaarddeviatie s = 10 jaar, met nog eens 15 jaar "verouderen". Nu = 30 jaar, en de standaarddeviatie is nog steeds 10. De voorheen heterogene populatie (10/15 × 100 = 66,7% blijkt dus vrij homogeen te zijn in de tijd (10/30 × 100 = 33,3%).

Boyarsky A.Ya. Theoretisch onderzoek naar statistiek: za. Wetenschappelijk Procedure - M.: Statistieken, 1974. blz. 19-57.

Vorig

Om statistische conclusies over het resultaat van de samenvatting en groepering te analyseren en te verkrijgen, worden generaliserende indicatoren berekend - gemiddelde en relatieve waarden.

Het probleem van gemiddelden - om alle eenheden van de statistische populatie te karakteriseren met één waarde van het attribuut.

Gemiddelde waarden kenmerken de kwalitatieve indicatoren van ondernemersactiviteit: distributiekosten, winst, winstgevendheid, enz.

gemiddelde waarde- dit is een generaliserend kenmerk van de eenheden van de bevolking volgens een variërend kenmerk.

Gemiddelde waarden maken het mogelijk om de niveaus van dezelfde eigenschap in verschillende populaties te vergelijken en de redenen voor deze discrepanties te vinden.

Bij de analyse van de bestudeerde verschijnselen is de rol van gemiddelde waarden enorm. De Engelse econoom W. Petty (1623-1687) maakte veelvuldig gebruik van gemiddelden. V. Petty wilde gemiddelde waarden gebruiken als maatstaf voor de uitgaven voor het gemiddelde dagelijkse levensonderhoud van één werknemer. De stabiliteit van de gemiddelde waarde is een weerspiegeling van de patronen van de onderzochte processen. Hij geloofde dat informatie kan worden getransformeerd, zelfs als er niet genoeg initiële gegevens zijn.

De Engelse wetenschapper G. King (1648-1712) gebruikte gemiddelde en relatieve waarden bij het analyseren van gegevens over de bevolking van Engeland.

De theoretische ontwikkelingen van de Belgische statisticus A. Quetelet (1796-1874) zijn gebaseerd op de inconsistentie van de aard van sociale fenomenen - zeer stabiel in de massa, maar puur individueel.

Volgens A. Quetelet werken permanente oorzaken op dezelfde manier op elk fenomeen dat wordt bestudeerd en maken ze deze verschijnselen op elkaar lijkend, creëren ze patronen die ze allemaal gemeen hebben.

Een gevolg van de leer van A. Quetelet was de toewijzing van gemiddelde waarden als de belangrijkste methode voor statistische analyse. Hij zei dat statistische gemiddelden geen categorie van objectieve realiteit zijn.

A. Quetelet drukte zijn mening over het gemiddelde uit in zijn theorie van de gemiddelde persoon. Een gemiddelde persoon is een persoon die alle kwaliteiten in een gemiddelde grootte heeft (gemiddeld sterftecijfer of geboortecijfer, gemiddelde lengte en gewicht, gemiddelde loopsnelheid, gemiddelde neiging tot huwelijk en zelfmoord, tot goede daden, enz.). Voor A. Quetelet is de gemiddelde persoon het ideaal van een persoon. De inconsistentie van A. Quetelet's theorie van de gemiddelde man werd aan het eind van de 19e-20e eeuw bewezen in de Russische statistische literatuur.

De bekende Russische statisticus Yu. E. Yanson (1835-1893) schreef dat A. Quetelet het bestaan ​​in de natuur van het type van de gemiddelde persoon aanneemt als iets gegeven, waaruit het leven de gemiddelde mensen van een bepaalde samenleving heeft afgewezen en een bepaalde tijd, en dit leidt hem tot een volledig mechanische kijk op de bewegingswetten van het sociale leven: beweging is een geleidelijke toename van de gemiddelde eigenschappen van een persoon, een geleidelijk herstel van een type; bijgevolg een dergelijke nivellering van alle manifestaties van het leven van het sociale lichaam, waarna elke voorwaartse beweging ophoudt.

De essentie van deze theorie heeft zijn verdere ontwikkeling gevonden in de werken van een aantal statistische theoretici als de theorie van ware waarden. A. Quetelet had volgelingen - de Duitse econoom en statisticus W. Lexis (1837-1914), die de theorie van ware waarden overbracht op de economische verschijnselen van het sociale leven. Zijn theorie staat bekend als de stabiliteitstheorie. Een andere versie van de idealistische theorie van gemiddelden is gebaseerd op de filosofie

De oprichter is de Engelse statisticus A. Bowley (1869-1957), een van de meest vooraanstaande theoretici van de moderne tijd op het gebied van de theorie van gemiddelden. Zijn concept van gemiddelden wordt beschreven in het boek "Elements of Statistics".

A. Bowley beschouwt gemiddelden alleen vanuit de kwantitatieve kant, en scheidt daarbij kwantiteit van kwaliteit. Bij het bepalen van de betekenis van gemiddelde waarden (of "hun functie"), brengt A. Bowley het machistische denkprincipe naar voren. A. Bowley schreef dat de functie van gemiddelden een complexe groep moet uitdrukken

met een paar priemgetallen. Statistische gegevens moeten worden vereenvoudigd, gegroepeerd en gemiddeld.Deze opvattingen werden gedeeld door R. Fisher (1890-1968), J. Yule (1871-1951), Frederick S. Mills (1892) en anderen.

In de jaren '30. 20ste eeuw en de daaropvolgende jaren wordt de gemiddelde waarde beschouwd als een maatschappelijk significant kenmerk, waarvan de informatie-inhoud afhangt van de homogeniteit van de gegevens.

De meest prominente vertegenwoordigers van de Italiaanse school R. Benini (1862-1956) en C. Gini (1884-1965), die statistiek als een tak van logica beschouwden, breidden de reikwijdte van statistische inductie uit, maar ze associeerden de cognitieve principes van logica en statistieken met de aard van de bestudeerde verschijnselen, volgens de tradities van de sociologische interpretatie van statistieken.

In de werken van K. Marx en V. I. Lenin wordt een speciale rol toegekend aan gemiddelde waarden.

K. Marx betoogde dat individuele afwijkingen van het algemene niveau worden opgeheven in de gemiddelde waarde en dat het gemiddelde niveau een generaliserend kenmerk van het massaverschijnsel wordt. De gemiddelde waarde wordt alleen zo'n kenmerk van het massaverschijnsel als een significant aantal eenheden wordt genomen en deze eenheden zijn kwalitatief homogeen. Marx schreef dat de gevonden gemiddelde waarde het gemiddelde was van "... veel verschillende individuele waarden van dezelfde soort."

De gemiddelde waarde krijgt een bijzondere betekenis in een markteconomie. Het helpt bij het bepalen van de noodzakelijke en algemene, de trend van de wetten van economische ontwikkeling rechtstreeks door het individu en willekeurig.

Gemiddelde waarden zijn generaliserende indicatoren waarin de werking van algemene voorwaarden, de regelmatigheid van het bestudeerde fenomeen wordt uitgedrukt.

Statistische gemiddelden worden berekend op basis van massagegevens van een statistisch correct georganiseerde massawaarneming. Als het statistische gemiddelde wordt berekend uit massagegevens voor een kwalitatief homogene populatie (massaverschijnselen), dan is het objectief.

De gemiddelde waarde is abstract, omdat deze de waarde van een abstracte eenheid kenmerkt.

Het gemiddelde wordt geabstraheerd van de diversiteit van het kenmerk in individuele objecten. Abstractie is een fase van wetenschappelijk onderzoek. De dialectische eenheid van het individuele en het algemene wordt gerealiseerd in de gemiddelde waarde.

Gemiddelde waarden moeten worden toegepast op basis van een dialectisch begrip van de categorieën van het individu en het algemene, het individu en de massa.

De middelste weerspiegelt iets gemeenschappelijks dat wordt opgeteld in een bepaald enkel object.

Om patronen in massale maatschappelijke processen te herkennen, is de gemiddelde waarde van groot belang.

De afwijking van het individu van het algemene is een manifestatie van het ontwikkelingsproces.

De gemiddelde waarde weerspiegelt het karakteristieke, typische, reële niveau van de verschijnselen die worden bestudeerd. Het doel van gemiddelden is om deze niveaus en hun veranderingen in tijd en ruimte te karakteriseren.

De gemiddelde indicator is een gewone waarde, omdat deze wordt gevormd in normale, natuurlijke, algemene voorwaarden voor het bestaan ​​​​van een specifiek massaverschijnsel, als geheel beschouwd.

Een objectieve eigenschap van een statistisch proces of fenomeen weerspiegelt de gemiddelde waarde.

De individuele waarden van het bestudeerde statistische kenmerk zijn verschillend voor elke eenheid van de populatie. De gemiddelde waarde van individuele waarden van één soort is een product van noodzaak, dat het resultaat is van de cumulatieve actie van alle eenheden van de bevolking, die zich manifesteert in een massa zich herhalende ongevallen.

Sommige individuele verschijnselen hebben tekens die in alle verschijnselen voorkomen, maar in verschillende hoeveelheden - dit is de lengte of leeftijd van een persoon. Andere tekenen van een individueel fenomeen zijn kwalitatief verschillend in verschillende verschijnselen, dat wil zeggen, ze zijn aanwezig in sommige en worden niet waargenomen in andere (een man wordt geen vrouw). De gemiddelde waarde wordt berekend voor tekens die kwalitatief homogeen zijn en alleen kwantitatief verschillen, die inherent zijn aan alle verschijnselen in een gegeven verzameling.

De gemiddelde waarde is een weerspiegeling van de waarden van de eigenschap die wordt bestudeerd en wordt gemeten in dezelfde dimensie als deze eigenschap.

De theorie van het dialectisch materialisme leert dat alles in de wereld verandert en zich ontwikkelt. En ook de tekens die worden gekenmerkt door gemiddelde waarden veranderen, en dienovereenkomstig de gemiddelden zelf.

Het leven is een continu proces van het creëren van iets nieuws. De drager van de nieuwe kwaliteit zijn afzonderlijke objecten, dan neemt het aantal van deze objecten toe en wordt het nieuwe massa, typisch.

De gemiddelde waarde kenmerkt de onderzochte populatie slechts op één basis. Voor een volledige en uitgebreide presentatie van de bestudeerde populatie voor een aantal specifieke kenmerken, is het noodzakelijk om een ​​systeem van gemiddelde waarden te hebben dat het fenomeen vanuit verschillende hoeken kan beschrijven.

2. Soorten gemiddelden

Bij de statistische verwerking van het materiaal ontstaan ​​verschillende problemen die moeten worden opgelost en daarom worden in de statistische praktijk verschillende gemiddelde waarden gebruikt. Wiskundige statistiek gebruikt verschillende gemiddelden, zoals: rekenkundig gemiddelde; geometrisch gemiddelde; gemiddelde harmonische; vierkantswortel.

Om een ​​​​van de bovenstaande soorten gemiddelden toe te passen, is het noodzakelijk om de onderzochte populatie te analyseren, de materiële inhoud van het bestudeerde fenomeen te bepalen, dit alles wordt gedaan op basis van conclusies die zijn getrokken uit het principe van de betekenis van de resultaten bij het wegen of optellen.

Bij de studie van gemiddelden worden de volgende indicatoren en notatie gebruikt.

Het criterium waarmee het gemiddelde wordt gevonden, wordt genoemd gemiddelde eigenschap en wordt aangegeven met x; de waarde van het gemiddelde kenmerk voor elke eenheid van de statistische populatie wordt genoemd zijn individuele betekenis of opties, en aangeduid als x 1 , X 2 , x 3 ,… X P ; frequentie is de herhaalbaarheid van individuele waarden van een eigenschap, aangegeven met de letter f.

rekenkundig gemiddelde

Een van de meest voorkomende soorten medium rekenkundig gemiddelde, die wordt berekend wanneer het volume van het gemiddelde kenmerk wordt gevormd als de som van de waarden voor individuele eenheden van de bestudeerde statistische populatie.

Om het rekenkundig gemiddelde te berekenen, wordt de som van alle functieniveaus gedeeld door hun aantal.


Als sommige opties meerdere keren voorkomen, dan kan de som van de attribuutniveaus worden verkregen door elk niveau te vermenigvuldigen met het overeenkomstige aantal populatie-eenheden, gevolgd door de som van de resulterende producten, het rekenkundig gemiddelde dat op deze manier wordt berekend, wordt de gewogen rekenkunde genoemd gemeen.

De formule voor het gewogen rekenkundig gemiddelde is als volgt:


waarbij x i opties zijn,

f i - frequenties of gewichten.

In alle gevallen waarin de varianten verschillende abundanties hebben, moet een gewogen gemiddelde worden gebruikt.

Het rekenkundig gemiddelde verdeelt als het ware gelijkelijk over de afzonderlijke objecten de totale waarde van het attribuut, die in feite voor elk van hen varieert.

Berekening van gemiddelde waarden wordt uitgevoerd op basis van gegevens die zijn gegroepeerd in de vorm van intervalverdelingsreeksen, wanneer de kenmerkvarianten waaruit het gemiddelde wordt berekend, worden weergegeven in de vorm van intervallen (van - tot).

Eigenschappen van het rekenkundig gemiddelde:

1) het rekenkundig gemiddelde van de som van de variërende waarden is gelijk aan de som van de rekenkundige gemiddelden: Als x i = y i + z i , dan


Deze eigenschap laat zien in welke gevallen het mogelijk is om de gemiddelde waarden samen te vatten.

2) de algebraïsche som van de afwijkingen van de individuele waarden van het variërende kenmerk van het gemiddelde is gelijk aan nul, aangezien de som van afwijkingen in de ene richting wordt gecompenseerd door de som van afwijkingen in de andere richting:


Deze regel laat zien dat het gemiddelde de resultante is.

3) als alle varianten van de reeks met hetzelfde getal worden verhoogd of verlaagd?, dan zal het gemiddelde met hetzelfde getal toenemen of afnemen?:


4) als alle varianten van de reeks met A keer worden verhoogd of verlaagd, dan zal het gemiddelde ook met A keer toenemen of afnemen:


5) de vijfde eigenschap van het gemiddelde laat zien dat het niet afhangt van de grootte van de gewichten, maar van de verhouding ertussen. Als gewichten kunnen niet alleen relatieve, maar ook absolute waarden worden genomen.

Als alle frequenties van de reeks worden gedeeld of vermenigvuldigd met hetzelfde getal d, verandert het gemiddelde niet.


Gemiddelde harmonische. Om het rekenkundig gemiddelde te bepalen, is het noodzakelijk om een ​​aantal opties en frequenties te hebben, d.w.z. waarden X en f.

Stel dat we de individuele waarden van de functie kennen X en werkt X/, en frequenties f zijn onbekend, dan geven we om het gemiddelde te berekenen het product = X/; waar:



Het gemiddelde in deze vorm wordt het harmonisch gewogen gemiddelde genoemd en wordt aangeduid met x schade. vzv.

Dienovereenkomstig is het harmonische gemiddelde identiek aan het rekenkundige gemiddelde. Het is van toepassing wanneer de werkelijke gewichten niet bekend zijn. f, en het product is bekend fx = z

Wanneer de werken fx gelijk aan of gelijk aan één (m = 1), wordt het harmonische eenvoudige gemiddelde gebruikt, berekend met de formule:


waar X- aparte opties;

n- nummer.

Geometrisch gemiddelde

Als er n groeifactoren zijn, dan is de formule voor de gemiddelde coëfficiënt:


Dit is de geometrische gemiddelde formule.

Het geometrische gemiddelde is gelijk aan de wortel van de graad n van het product van groeicoëfficiënten die de verhouding van de waarde van elke volgende periode tot de waarde van de vorige kenmerken.

Als waarden uitgedrukt als kwadraatfuncties onderhevig zijn aan middeling, wordt het wortelgemiddelde kwadraat gebruikt. Met behulp van het wortelgemiddelde kunt u bijvoorbeeld de diameters van buizen, wielen, enz. bepalen.

De gemiddelde kwadraten worden bepaald door de vierkantswortel van het quotiënt te nemen door de som van de kwadraten van de individuele kenmerkwaarden te delen door hun aantal.


Het gewogen wortelgemiddelde is:

3. Structurele gemiddelden. Modus en mediaan

Om de structuur van de statistische populatie te karakteriseren, worden indicatoren gebruikt die structurele gemiddelden. Deze omvatten modus en mediaan.

Mode (M over ) - de meest voorkomende optie. Mode de waarde van het kenmerk wordt genoemd, wat overeenkomt met het maximale punt van de theoretische verdelingscurve.

De modus vertegenwoordigt de meest voorkomende of typische waarde.

Mode wordt in de handelspraktijk gebruikt om de consumentenvraag en recordprijzen te bestuderen.

In een discrete reeks is de modus de variant met de hoogste frequentie. In de intervalvariatiereeks wordt de centrale variant van het interval, die de hoogste frequentie (bijzonderheid) heeft, als modus beschouwd.

Binnen het interval is het noodzakelijk om de waarde van het attribuut te vinden, wat de modus is.


waar X over is de ondergrens van het modale interval;

h is de waarde van het modale interval;

fm is de frequentie van het modale interval;

f t-1 - frequentie van het interval voorafgaand aan de modale;

fm+1 is de frequentie van het interval dat volgt op het modaal.

De modus is afhankelijk van de grootte van de groepen, van de exacte positie van de grenzen van de groepen.

Mode- het aantal dat eigenlijk het vaakst voorkomt (is een bepaalde waarde), wordt in de praktijk het meest gebruikt (het meest voorkomende type koper).

Mediaan (M e- dit is de waarde die het aantal geordende variatiereeksen in twee gelijke delen verdeelt: het ene deel heeft waarden van het variërende kenmerk die kleiner zijn dan de gemiddelde variant, en het andere deel is groot.

Mediaan is een element dat groter is dan of gelijk is aan en tegelijkertijd kleiner is dan of gelijk is aan de helft van de overige elementen van de distributiereeks.

De eigenschap van de mediaan is dat de som van de absolute afwijkingen van de kenmerkwaarden van de mediaan kleiner is dan van enige andere waarde.

Door de mediaan te gebruiken, kunt u nauwkeurigere resultaten krijgen dan met andere vormen van gemiddelden.

De volgorde van het vinden van de mediaan in de intervalvariatiereeks is als volgt: we rangschikken de individuele waarden van het attribuut op rangorde; bepaal de geaccumuleerde frequenties voor deze gerangschikte reeks; volgens de geaccumuleerde frequenties vinden we het mediane interval:


waar x mij is de ondergrens van het mediane interval;

i Mij is de waarde van het mediane interval;

f/2 is de halve som van de frequenties van de reeks;

S Mij-1 is de som van geaccumuleerde frequenties voorafgaand aan het mediane interval;

f Mij is de frequentie van het mediane interval.

De mediaan deelt het aantal rijen in tweeën, daarom is de cumulatieve frequentie de helft of meer dan de helft van het totale aantal frequenties, en de vorige (cumulatieve) frequentie is minder dan de helft van het aantal van de populatie.