Biograafiad Omadused Analüüs

Kuidas leida statistika aritmeetilist keskmist. Keskmised väärtused statistikas

Sellel terminil on muid tähendusi, vt keskmist tähendust.

Keskmine(matemaatikas ja statistikas) arvude komplektid - kõigi arvude summa jagatud nende arvuga. See on üks levinumaid keskse tendentsi näitajaid.

Selle pakkusid välja (koos geomeetrilise keskmise ja harmoonilise keskmisega) Pythagoreanid.

Aritmeetilise keskmise erijuhud on keskmine (üldkogumi) ja valimi keskmine (valimitest).

Sissejuhatus

Tähistage andmete kogum X = (x 1 , x 2 , …, x n), siis valimi keskmist tähistatakse tavaliselt horisontaalse ribaga muutuja kohal (x ¯ (\displaystyle (\bar (x))) , hääldatakse " x kriipsuga").

Kreeka tähte μ kasutatakse kogu populatsiooni aritmeetilise keskmise tähistamiseks. Juhusliku muutuja puhul, mille keskmine väärtus on määratletud, on μ tõenäosuse keskmine või juhusliku suuruse matemaatiline ootus. Kui komplekt X on juhuslike arvude kogum, mille tõenäosus keskmine on μ, siis mis tahes valimi jaoks x i sellest kogumist μ = E( x i) on selle valimi ootus.

Praktikas on μ ja x ¯ (\displaystyle (\bar (x)))) erinevus selles, et μ on tüüpiline muutuja, kuna näete pigem valimit kui kogu populatsiooni. Seega, kui valimit esitatakse juhuslikult (tõenäosusteooria mõttes), siis saab x ¯ (\displaystyle (\bar (x))) (aga mitte μ) käsitleda juhusliku muutujana, millel on tõenäosusjaotus valimil ( keskmise tõenäosusjaotus).

Mõlemad kogused arvutatakse samal viisil:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1) (n))\sum _(i=1)^(n)x_(i)=(\frac (1) (n))(x_ (1)+\cdots +x_(n)).

Kui a X on juhuslik muutuja, siis on matemaatiline ootus X Seda võib pidada koguse korduva mõõtmise väärtuste aritmeetiliseks keskmiseks X. See on suurte arvude seaduse ilming. Seetõttu kasutatakse tundmatu matemaatilise ootuse hindamiseks valimi keskmist.

Elementaaralgebras on tõestatud, et keskmine n+ 1 number üle keskmise n numbrid siis ja ainult siis, kui uus arv on suurem kui vana keskmine, vähem siis ja ainult siis, kui uus arv on keskmisest väiksem ning ei muutu siis ja ainult siis, kui uus arv on võrdne keskmisega. Rohkem n, seda väiksem on erinevus uue ja vana keskmise vahel.

Pange tähele, et saadaval on ka mitu muud "keskmist", sealhulgas võimsusseaduse keskmine, Kolmogorovi keskmine, harmooniline keskmine, aritmeetiline-geomeetriline keskmine ja erinevad kaalutud keskmised (nt aritmeetiliselt kaalutud keskmine, geomeetriliselt kaalutud keskmine, harmooniliselt kaalutud keskmine). .

Näited

  • Kolme numbri jaoks peate need liitma ja jagama 3-ga:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).
  • Nelja numbri jaoks peate need liitma ja jagama 4-ga:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).

Või lihtsam 5+5=10, 10:2. Kuna me lisasime 2 numbrit, mis tähendab, et mitu numbrit liidame, jagame selle arvuga.

Pidev juhuslik muutuja

Pidevalt jaotatud väärtuse f (x) (\displaystyle f(x)) aritmeetiline keskmine intervallil [ a ; b ] (\displaystyle ) defineeritakse kindla integraali kaudu:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Mõned keskmise kasutamise probleemid

Tugevuse puudumine

Põhiartikkel: Tugevus statistikas

Kuigi aritmeetilist keskmist kasutatakse sageli keskmiste või kesksete trendidena, ei kehti see mõiste usaldusväärse statistika puhul, mis tähendab, et aritmeetilist keskmist mõjutavad tugevalt "suured kõrvalekalded". Tähelepanuväärne on see, et suure kaldsusega jaotuste puhul ei pruugi aritmeetiline keskmine vastata „keskmise“ mõistele ja keskmise täpsusega keskmised väärtused tugevast statistikast (näiteks mediaan) võivad keskmist trendi paremini kirjeldada.

Klassikaline näide on keskmise sissetuleku arvutamine. Aritmeetilist keskmist võib mediaanina valesti tõlgendada, millest võib järeldada, et suurema sissetulekuga inimesi on rohkem kui tegelikult. "Keskmist" sissetulekut tõlgendatakse nii, et enamiku inimeste sissetulekud on selle numbri lähedal. See "keskmine" (aritmeetilise keskmise tähenduses) sissetulek on suurem kui enamiku inimeste sissetulek, kuna kõrge sissetulek, millel on suur kõrvalekalle keskmisest, muudab aritmeetilise keskmise tugevalt viltu (seevastu mediaansissetulek "vastupanu") selline viltu). See "keskmine" sissetulek ei ütle aga midagi keskmise sissetuleku lähedal asuvate inimeste arvu kohta (ega ei ütle midagi modaalse sissetuleku lähedal asuvate inimeste arvu kohta). Kui aga mõistetesse "keskmine" ja "enamus" suhtuda kergelt, võib ekslikult järeldada, et enamiku inimeste sissetulek on tegelikust suurem. Näiteks Washingtoni osariigi Medina "keskmise" netosissetuleku aruanne, mis arvutatakse elanike kõigi aastaste netosissetulekute aritmeetilise keskmisena, annab Bill Gatesi tõttu üllatavalt suure arvu. Vaatleme näidist (1, 2, 2, 2, 3, 9). Aritmeetiline keskmine on 3,17, kuid kuuest väärtusest viis on sellest keskmisest madalamad.

Liitintress

Põhiartikkel: ROI

Kui numbrid korrutada, kuid mitte voltida, peate kasutama geomeetrilist, mitte aritmeetilist keskmist. Kõige sagedamini juhtub see juhtum finantsinvesteeringute tasuvuse arvutamisel.

Näiteks kui aktsiad langesid esimesel aastal 10% ja tõusid teisel aastal 30%, siis on vale arvutada nende kahe aasta "keskmist" kasvu aritmeetilise keskmisena (−10% + 30%) / 2 = 10%; õige keskmise annab sel juhul liitaastane kasvumäär, millest aastane juurdekasv on vaid umbes 8,16653826392% ≈ 8,2%.

Põhjus on selles, et protsentidel on iga kord uus lähtepunkt: 30% on 30% numbrist, mis on väiksem kui esimese aasta alguses: kui aktsia algas 30 dollarist ja langes 10%, on teise aasta alguses väärt 27 dollarit. Kui aktsia on 30% plussis, on selle väärtus teise aasta lõpus 35,1 dollarit. Selle kasvu aritmeetiline keskmine on 10%, kuid kuna aktsia on kahe aastaga kasvanud vaid 5,1 dollari võrra, annab keskmine kasv 8,2% lõpptulemuseks 35,1 dollarit:

[30 $ (1 - 0,1) (1 + 0,3) = 30 $ (1 + 0,082) (1 + 0,082) = 35,1 $]. Kui kasutame samamoodi 10% aritmeetilist keskmist, ei saa me tegelikku väärtust: [30 $ (1 + 0,1) (1 + 0,1) = 36,3 $].

Liitintress 2. aasta lõpus: 90% * 130% = 117% ehk kokku kasv 17% ja keskmine aastane liitintress on 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \umbes 108,2\%) , see tähendab, et aasta keskmine kasv 8,2%.

Juhised

Põhiartikkel: Sihtkoha statistika

Mõne tsükliliselt muutuva muutuja (näiteks faasi või nurga) aritmeetilise keskmise arvutamisel tuleks olla eriti ettevaatlik. Näiteks 1° ja 359° keskmine oleks 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. See number on vale kahel põhjusel.

  • Esiteks on nurkmõõtmised määratletud ainult vahemikus 0° kuni 360° (või radiaanides mõõdetuna 0 kuni 2π). Seega võiks sama numbripaari kirjutada kui (1° ja −1°) või kui (1° ja 719°). Iga paari keskmised on erinevad: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Teiseks, sel juhul oleks väärtus 0° (võrdne 360°-ga) geomeetriliselt parim keskmine, kuna arvud erinevad 0°-st vähem kui mis tahes muust väärtusest (väärtus 0° on väikseima dispersiooniga). Võrdlema:
    • arv 1° erineb 0°-st ainult 1° võrra;
    • arv 1° erineb arvutatud keskmisest 180° 179° võrra.

Tsüklilise muutuja keskmine väärtus, mis arvutatakse ülaltoodud valemi järgi, nihutatakse kunstlikult tegeliku keskmise suhtes arvulise vahemiku keskele. Seetõttu arvutatakse keskmist teistmoodi, nimelt valitakse keskmiseks väärtuseks väikseima dispersiooniga arv (keskpunkt). Samuti kasutatakse lahutamise asemel mooduli kaugust (st ümbermõõdu kaugust). Näiteks mooduli kaugus 1° ja 359° vahel on 2°, mitte 358° (ringil vahemikus 359° ja 360° ==0° - üks kraad, vahemikus 0° kuni 1° - ka 1°, kokku -2 °).

4.3. Keskmised väärtused. Keskmiste olemus ja tähendus

Keskmine väärtus statistikas nimetatakse üldistavat indikaatorit, mis iseloomustab nähtuse tüüpilist taset konkreetsetes koha- ja ajatingimustes, peegeldades varieeruva atribuudi suurust kvalitatiivselt homogeense populatsiooni ühiku kohta. Majanduspraktikas kasutatakse laia valikut näitajaid, mis arvutatakse keskmistena.

Näiteks aktsiaseltsi (JSC) töötajate sissetulekute üldistavaks näitajaks on ühe töötaja keskmine sissetulek, mis on määratud vaadeldava perioodi (aasta, kvartal, kuu) palgafondi ja sotsiaalmaksete suhtega. ) JSC töötajate arvule.

Keskmise arvutamine on üks levinud üldistustehnika; keskmine näitaja peegeldab üldist, mis on tüüpiline (tüüpiline) uuritava üldkogumi kõikidele üksustele, samas eirab üksikute üksuste erinevusi. Igas nähtuses ja selle arengus on kombinatsioon juhus ja vaja. Keskmiste arvutamisel tühistab juhuslikkus suurte arvude seaduse toimimise tõttu üksteist, tasakaalustab, nii et saate igal konkreetsel juhul abstraheerida nähtuse ebaolulistest tunnustest, atribuudi kvantitatiivsetest väärtustest. Individuaalsete väärtuste juhuslikkusest abstraktsioonivõimes peitub kõikumistes keskmiste teaduslik väärtus kui kokkuvõtteid tehes koondomadused.

Kui on vajadus üldistamiseks, siis selliste omaduste arvutamine toob kaasa paljude erinevate atribuudi individuaalsete väärtuste asendamise. keskmine nähtuste tervikut iseloomustav näitaja, mis võimaldab tuvastada massilistele sotsiaalsetele nähtustele omaseid, üksikutes nähtustes hoomamatuid mustreid.

Keskmine peegeldab uuritavate nähtuste iseloomulikku, tüüpilist, tegelikku taset, iseloomustab neid tasemeid ja nende muutusi ajas ja ruumis.

Keskmine on protsessi seaduspärasuste kokkuvõtlik omadus selle kulgemise tingimustes.

4.4. Keskmiste tüübid ja nende arvutamise meetodid

Keskmise tüübi valiku määrab teatud näitaja majanduslik sisu ja lähteandmed. Igal juhul rakendatakse üht keskmistest väärtustest: aritmeetika, garmonic, geomeetriline, ruut, kuup jne. Loetletud keskmised kuuluvad klassi võimsus keskmine.

Lisaks võimuseaduse keskmistele kasutatakse statistilises praktikas struktuurseid keskmisi, mida peetakse režiimiks ja mediaaniks.

Vaatleme üksikasjalikumalt võimu vahendeid.

Aritmeetiline keskmine

Kõige tavalisem keskmise tüüp on keskmine aritmeetika. Seda kasutatakse juhtudel, kui muutuva atribuudi maht kogu populatsiooni jaoks on selle üksikute üksuste atribuutide väärtuste summa. Sotsiaalseid nähtusi iseloomustab varieeruva atribuudi mahtude liitmine (summeerimine), mis määrab aritmeetilise keskmise ulatuse ja selgitab selle levimust üldistava näitajana, näiteks: kogu palgafond on kõigi töötajate palkade summa. töötajaid, on brutosaak kogu külvipinnalt toodetud toodete summa.

Aritmeetilise keskmise arvutamiseks peate jagama kõigi tunnuste väärtuste summa nende arvuga.

Vormis rakendatakse aritmeetilist keskmist lihtkeskmine ja kaalutud keskmine. Lihtne keskmine toimib esialgse, määrava vormina.

lihtne aritmeetiline keskmine on võrdne keskmistatud tunnuse üksikute väärtuste lihtsummaga, mis on jagatud nende väärtuste koguarvuga (seda kasutatakse juhtudel, kui objektil on rühmitamata üksikud väärtused):

kus
- muutuja individuaalsed väärtused (valikud); m - rahvastikuüksuste arv.

Täiendavaid summeerimispiiranguid valemites ei näidata. Näiteks on vaja leida ühe töölise (lukksepa) keskmine toodang, kui on teada, mitu detaili 15 töötajast igaüks tootis, s.o. arvestades mitmeid tunnuse individuaalseid väärtusi, tk:

21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

Lihtne aritmeetiline keskmine arvutatakse valemiga (4.1), 1 tk.:

Nimetatakse nende valikute keskmine, mida korratakse erinev arv kordi või millel on väidetavalt erinev kaal kaalutud. Kaalud on ühikute arvud erinevates elanikkonnarühmades (rühm kombineerib samu valikuid).

Aritmeetiline kaalutud keskmine- keskmised grupeeritud väärtused, - arvutatakse järgmise valemiga:

, (4.2)

kus
- kaalud (samade tunnuste kordumise sagedus);

- tunnuste suurusjärkude korrutiste summa nende sageduste järgi;

- rahvastikuüksuste koguarv.

Illustreerime aritmeetilise kaalutud keskmise arvutamise tehnikat ülalkirjeldatud näite abil. Selleks rühmitame lähteandmed ja asetame need tabelisse. 4.1.

Tabel 4.1

Tööliste jagamine osade arendamiseks

Valemi (4.2) järgi on aritmeetiline kaalutud keskmine võrdne, tükki:

Mõnel juhul saab kaalusid esitada mitte absoluutväärtustega, vaid suhteliste väärtustega (ühiku protsentides või murdosades). Siis näeb aritmeetilise kaalutud keskmise valem välja järgmine:

kus
- konkreetsed, s.t. iga sageduse osakaal kõigi kogusummas

Kui sagedusi lugeda murdosades (koefitsientidena), siis
= 1 ja aritmeetiliselt kaalutud keskmise valem on:

Aritmeetilise kaalutud keskmise arvutamine rühma keskmistest viiakse läbi vastavalt valemile:

,

kus f-ühikute arv igas rühmas.

Grupi keskmiste aritmeetilise keskmise arvutamise tulemused on toodud tabelis. 4.2.

Tabel 4.2

Töötajate jaotus keskmise tööstaaži järgi

Selles näites ei ole valikuteks üksikud andmed üksikute töötajate tööstaaži kohta, vaid iga töökoja keskmised. kaalud f on poodide töötajate arv. Seega on töötajate keskmine töökogemus kogu ettevõttes aastat:

.

Aritmeetilise keskmise arvutamine jaotusreas

Kui keskmistatud atribuudi väärtused on antud intervallidena (“alates - kuni”), st. intervalljaotuse seeriad, siis aritmeetilise keskmise väärtuse arvutamisel võetakse nende intervallide keskpunktid tunnuste väärtusteks rühmades, mille tulemusena moodustub diskreetne jada. Vaatleme järgmist näidet (tabel 4.3).

Liigume intervallide seerialt diskreetsele, asendades intervalli väärtused nende keskmiste väärtustega / (lihtne keskmine

Tabel 4.3

AO töötajate jaotus kuupalga taseme järgi

Tööliste rühmad

Tööliste arv

Intervalli keskpaik

palk, hõõruda.

isikud, f

hõõruda., X

900 ja rohkem

avatud intervallide (esimene ja viimane) väärtused võrdsustatakse tinglikult nendega külgnevate intervallidega (teine ​​ja eelviimane).

Sellise keskmise arvutamisega on lubatud mõningane ebatäpsus, kuna eeldatakse atribuudi ühikute ühtlast jaotust rühmas. Viga on aga seda väiksem, seda kitsam on intervall ja seda rohkem ühikuid intervallis.

Pärast intervallide keskpunktide leidmist tehakse arvutused samamoodi nagu diskreetses reas - valikud korrutatakse sagedustega (kaaludega) ja korrutiste summa jagatakse sageduste (kaalude) summaga. , tuhat rubla:

.

Seega on JSC töötajate keskmine töötasu 729 rubla. kuus.

Aritmeetilise keskmise arvutamine on sageli seotud suure aja- ja töökuluga. Kuid mõnel juhul saab keskmise arvutamise protseduuri lihtsustada ja hõlbustada, kasutades selle omadusi. Esitame (ilma tõestuseta) mõned aritmeetilise keskmise põhiomadused.

Vara 1. Kui kõik individuaalsed iseloomulikud väärtused (st. kõik valikud) vähendada või suurendada ikorda, siis keskmine väärtus uue funktsiooni väärtus väheneb või suureneb vastavalt aastal iüks kord.

Vara 2. Kui kõiki keskmistatud tunnuse variante vähendatakseõmble või suurenda numbri A, seejärel aritmeetilise keskmise võrraoluliselt väheneda või suureneda sama arvu A võrra.

Vara 3. Kui kõigi keskmistatud valikute kaalu vähendatakse või suurendada kuni juurde korda, aritmeetiline keskmine ei muutu.

Keskmiste kaaludena saab absoluutnäitajate asemel kasutada konkreetseid kaalusid üldises kogusummas (osakaalud või protsendid). See lihtsustab keskmise arvutamist.

Keskmise arvutamise lihtsustamiseks järgivad nad valikute ja sageduste väärtuste vähendamise teed. Suurim lihtsus saavutatakse siis, kui AGAühe suurima sagedusega keskse valiku väärtus on valitud kui / - intervalli väärtus (samade intervallidega ridade puhul). L väärtust nimetatakse lähtepunktiks, seega seda keskmise arvutamise meetodit nimetatakse "tingimuslikust nullist loendamise meetodiks" või "hetkede meetod".

Oletame, et kõik võimalused X esmalt vähendati sama arvu A võrra ja seejärel sisse iüks kord. Saame uue variatsioonilise jaotuse seeria uutest variantidest .

Siis uued valikud väljendatakse:

,

ja nende uus aritmeetiline keskmine , -esimese tellimuse hetk- valem:

.

See on võrdne algsete valikute keskmisega, mida esmalt vähendatakse AGA, ja siis sisse iüks kord.

Tegeliku keskmise saamiseks vajate esimese tellimuse hetke m 1 , korrutage arvuga i ja lisage AGA:

.

Seda meetodit variatsioonirea aritmeetilise keskmise arvutamiseks nimetatakse "hetkede meetod". Seda meetodit rakendatakse võrdsete intervallidega ridadena.

Momentide meetodil aritmeetilise keskmise arvutamist illustreerivad tabelis olevad andmed. 4.4.

Tabel 4.4

Piirkonna väikeettevõtete jaotus tootmispõhivara väärtuse järgi (OPF) 2000. aastal

Ettevõtete rühmad OPF-i maksumuse järgi, tuhat rubla

Ettevõtete arv f

keskmised intervallid, x

14-16 16-18 18-20 20-22 22-24

Esimese tellimuse hetke leidmine

.

Siis, eeldades, et A = 19 ja teades seda i= 2, arvuta X, tuhat rubla.:

Keskmiste väärtuste tüübid ja nende arvutamise meetodid

Statistilise töötlemise etapis saab püstitada mitmesuguseid uurimisülesandeid, mille lahendamiseks on vaja valida sobiv keskmine. Sel juhul tuleb juhinduda järgmisest reeglist: väärtused, mis tähistavad keskmise lugejat ja nimetajat, peavad olema üksteisega loogiliselt seotud.

  • võimsuse keskmised;
  • struktuursed keskmised.

Tutvustame järgmist tähistust:

Väärtused, mille jaoks keskmine arvutatakse;

Keskmine, kus ülaltoodud rida näitab, et üksikute väärtuste keskmistamine toimub;

Sagedus (individuaalsete tunnuste väärtuste korratavus).

Üldise võimsuse keskmise valemist on tuletatud erinevad vahendid:

(5.1)

kui k = 1 - aritmeetiline keskmine; k = -1 - harmooniline keskmine; k = 0 - geomeetriline keskmine; k = -2 - ruutkeskmine.

Keskmised on kas lihtsad või kaalutud. kaalutud keskmised nimetatakse suurusteks, mis võtavad arvesse, et atribuudi väärtuste mõnel variandil võivad olla erinevad numbrid ja seetõttu tuleb iga variant selle arvuga korrutada. Teisisõnu, "kaalud" on rahvastikuüksuste arvud erinevates rühmades, s.o. iga valik on "kaalustatud" selle sagedusega. Sagedust f nimetatakse statistiline kaal või kaalu keskmine.

Aritmeetiline keskmine- levinuim kandja tüüp. Seda kasutatakse siis, kui arvutatakse rühmitamata statistiliste andmete põhjal, kus soovitakse saada keskmist liitmist. Aritmeetiline keskmine on tunnuse selline keskmine väärtus, mille saamisel jääb tunnuse kogumaht üldkogumis muutumatuks.

Aritmeetilise keskmise valem ( lihtne) omab vormi

kus n on populatsiooni suurus.

Näiteks arvutatakse ettevõtte töötajate keskmine palk aritmeetilise keskmisena:

Siin on määravad näitajad iga töötaja töötasu ja ettevõtte töötajate arv. Keskmise arvutamisel jäi töötasu kogusumma samaks, kuid jagunes justkui võrdselt kõigi töötajate vahel. Näiteks on vaja arvutada väikeettevõtte töötajate keskmine palk, kus töötab 8 inimest:

Keskmiste arvutamisel saab keskmistatud atribuudi üksikuid väärtusi korrata, seega arvutatakse keskmine rühmitatud andmete põhjal. Sel juhul räägime kasutamisest aritmeetiline keskmine kaalutud, mis näeb välja nagu

(5.3)

Seega tuleb välja arvutada aktsiaseltsi aktsia keskmine hind börsil. Teatavasti tehti tehinguid 5 päeva jooksul (5 tehingut), müügikursiga müüdud aktsiate arv jagunes järgmiselt:

1–800 ak. - 1010 rubla

2 - 650 ac. - 990 hõõruda.

3 - 700 ak. - 1015 rubla.

4 - 550 ak. - 900 rubla.

5 - 850 ak. - 1150 rubla.

Aktsia keskmise hinna määramise esialgne suhe on tehingute kogusumma (OSS) ja müüdud aktsiate arvu (KPA) suhe.

Kõige tavalisem keskmise tüüp on aritmeetiline keskmine.

lihtne aritmeetiline keskmine

Lihtne aritmeetiline keskmine on keskmine liige, mille määramisel jaotatakse antud atribuudi kogumaht andmetes võrdselt kõigi sellesse üldkogumisse kuuluvate üksuste vahel. Seega on keskmine aastane toodang töötaja kohta selline toodangu mahu väärtus, mis langeks igale töötajale, kui kogu toodangumaht oleks võrdselt jaotatud kõigi organisatsiooni töötajate vahel. Aritmeetiline keskmine lihtväärtus arvutatakse järgmise valemi abil:

lihtne aritmeetiline keskmine— võrdne tunnuse üksikute väärtuste summa ja koondtunnuste arvu suhtega

Näide 1 . 6-liikmeline meeskond saab 3 3,2 3,3 3,5 3,8 3,1 tuhat rubla kuus.

Leidke keskmine palk
Lahendus: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 tuhat rubla.

Aritmeetiline kaalutud keskmine

Kui andmestiku maht on suur ja esindab jaotusrida, arvutatakse kaalutud aritmeetiline keskmine. Nii määratakse toodanguühiku kaalutud keskmine hind: tootmise kogumaksumus (selle koguse toodete summa ja toodanguühiku hind) jagatakse kogu toodangu kogusega.

Esitame seda järgmise valemi kujul:

Kaalutud aritmeetiline keskmine- on võrdne suhtega (atribuudi väärtuse korrutised selle atribuudi kordussagedusega) ja (kõikide atribuutide sageduste summa) Seda kasutatakse juhul, kui uuritava üldkogumi variandid esinevad ebavõrdselt kordade arv.

Näide 2 . Leia poetöötajate keskmine palk kuus

Keskmise palga saab, jagades kogupalga töötajate koguarvuga:

Vastus: 3,35 tuhat rubla.

Intervallide jada aritmeetiline keskmine

Intervalli variatsioonirea aritmeetilise keskmise arvutamisel määratakse esmalt iga intervalli keskmine ülemise ja alumise piiri poolsummana ning seejärel kogu seeria keskmisena. Avatud intervallide puhul määrab alumise või ülemise intervalli väärtuse nendega külgnevate intervallide väärtus.

Intervalli seeriatest arvutatud keskmised on ligikaudsed.

Näide 3. Määrake õhtuse osakonna õpilaste keskmine vanus.

Intervalli seeriatest arvutatud keskmised on ligikaudsed. Nende lähendamise määr sõltub sellest, mil määral läheneb populatsiooniüksuste tegelik jaotus intervalli sees ühtlaseks.

Keskmiste arvutamisel saab kaaludena kasutada mitte ainult absoluutseid, vaid ka suhtelisi väärtusi (sagedust):

Aritmeetilisel keskmisel on mitmeid omadusi, mis paljastavad selle olemuse täielikumalt ja lihtsustavad arvutamist:

1. Keskmise ja sageduste summa korrutis on alati võrdne variandi ja sageduste korrutiste summaga, s.o.

2. Erinevate väärtuste summa aritmeetiline keskmine on võrdne nende väärtuste aritmeetiliste keskmiste summaga:

3. Atribuudi üksikute väärtuste keskmisest kõrvalekallete algebraline summa on null:

4. Võimaluste ruudus hälbete summa keskmisest on väiksem kui ruudu hälvete summa mis tahes muust suvalisest väärtusest, s.o.

Excelis keskmise väärtuse leidmiseks (olgu see siis numbriline, tekstiline, protsentuaalne või muu väärtus) on palju funktsioone. Ja igal neist on oma omadused ja eelised. Selles ülesandes saab ju seada teatud tingimused.

Näiteks arvutatakse Exceli arvuseeria keskmised väärtused statistiliste funktsioonide abil. Samuti saate oma valemi käsitsi sisestada. Vaatleme erinevaid võimalusi.

Kuidas leida arvude aritmeetilist keskmist?

Aritmeetilise keskmise leidmiseks liidate kõik komplekti kuuluvad arvud ja jagate summa arvuga. Näiteks õpilase hinded informaatikas: 3, 4, 3, 5, 5. Mis läheb veerandile: 4. Aritmeetilise keskmise leidsime valemiga: \u003d (3 + 4 + 3 + 5 + 5) / 5.

Kuidas seda Exceli funktsioonide abil kiiresti teha? Võtke näiteks juhuslike numbrite seeria stringis:

Või: muutke lahter aktiivseks ja sisestage lihtsalt käsitsi valem: = AVERAGE(A1:A8).

Nüüd vaatame, mida funktsioon AVERAGE veel suudab.


Leidke kahe esimese ja kolme viimase arvu aritmeetiline keskmine. Valem: =KESKMINE(A1:B1;F1:H1). Tulemus:



Tingimuste järgi keskmine

Aritmeetilise keskmise leidmise tingimuseks võib olla numbriline või tekstiline kriteerium. Kasutame funktsiooni: =AVERAGEIF().

Leidke 10-st suuremate või sellega võrdsete arvude aritmeetiline keskmine.

Funktsioon: =AVERAGEIF(A1:A8,">=10")


Funktsiooni AVERAGEIF kasutamise tulemus tingimusel ">=10":

Kolmas argument - "Averaging range" - jäetakse välja. Esiteks pole see nõutav. Teiseks sisaldab programmi poolt sõelutud vahemik AINULT arvväärtusi. Esimeses argumendis määratud lahtrites tehakse otsing vastavalt teises argumendis määratud tingimusele.

Tähelepanu! Otsingukriteeriumi saab määrata lahtris. Ja valemis, et teha sellele viide.

Leiame tekstikriteeriumi järgi arvude keskmise väärtuse. Näiteks toote keskmine müük "tabelid".

Funktsioon näeb välja selline: =AVERAGEIF($A$2:$A$12;A7;$B$2:$B$12). Vahemik – tootenimetustega veerg. Otsingukriteeriumiks on link lahtrile, kus on sõna "tabelid" (lingi A7 asemel võite sisestada sõna "tabelid"). Keskmistamisvahemik – need lahtrid, millest võetakse keskmise väärtuse arvutamiseks andmeid.

Funktsiooni arvutamise tulemusena saame järgmise väärtuse:

Tähelepanu! Tekstikriteeriumi (tingimuse) jaoks tuleb määrata keskmistamisvahemik.

Kuidas arvutada Excelis kaalutud keskmist hinda?

Kuidas me kaalutud keskmist hinda teame?

Valem: =SUMMA(C2:C12,B2:B12)/SUM(C2:C12).


SUMPRODUCT valemi abil saame teada kogutulu pärast kogu kaubakoguse müüki. Ja funktsioon SUM – võtab kokku kauba koguse. Jagades kaupade müügist saadud kogutulu kaubaühikute koguarvuga, saime kaalutud keskmise hinna. See indikaator võtab arvesse iga hinna "kaalu". Selle osa väärtuste kogumassist.

Standardhälve: valem Excelis

Eristage üldkogumi ja valimi standardhälvet. Esimesel juhul on see üldise dispersiooni juur. Teises valimi dispersioonist.

Selle statistilise näitaja arvutamiseks koostatakse dispersioonivalem. Sellest võetakse juur. Kuid Excelis on standardhälbe leidmiseks valmis funktsioon.


Standardhälve on seotud lähteandmete skaalaga. Sellest ei piisa analüüsitud vahemiku varieerumise kujundlikuks esitamiseks. Andmete suhtelise hajumise taseme saamiseks arvutatakse variatsioonikordaja:

standardhälve / aritmeetiline keskmine

Exceli valem näeb välja selline:

STDEV (väärtuste vahemik) / AVERAGE (väärtuste vahemik).

Variatsioonikoefitsient arvutatakse protsentides. Seetõttu määrame lahtris protsendivormingu.

5.1. Keskmise mõiste

Keskmine väärtus - see on üldistav näitaja, mis iseloomustab nähtuse tüüpilist taset. See väljendab atribuudi väärtust, mis on seotud üldkogumi ühikuga.

Keskmine üldistab alati tunnuse kvantitatiivset varieerumist, s.t. keskmistes väärtustes tühistatakse juhuslikest asjaoludest tulenevad individuaalsed erinevused populatsiooni ühikutes. Erinevalt keskmisest ei võimalda populatsiooni üksiku üksuse tunnuse taset iseloomustav absoluutväärtus võrrelda tunnuse väärtusi erinevatesse populatsioonidesse kuuluvate üksuste puhul. Seega, kui on vaja võrrelda kahe ettevõtte töötajate töötasusid, siis selle alusel ei saa võrrelda kahte erineva ettevõtte töötajat. Võrdluseks valitud töötajate palgad ei pruugi olla neile ettevõtetele tüüpilised. Kui võrrelda vaadeldavate ettevõtete palgafondide suurust, siis töötajate arvu arvesse ei võeta ja seetõttu pole võimalik kindlaks teha, kus on kõrgem palgatase. Lõppkokkuvõttes saab võrrelda ainult keskmisi, s.t. Kui palju üks töötaja igas ettevõttes keskmiselt teenib? Seega on vajadus arvutada välja keskmine väärtus kui üldkogumit üldistav tunnus.

Keskmise arvutamine on üks levinud üldistustehnika; keskmine näitaja eitab üldist, mis on tüüpiline (tüüpiline) uuritava üldkogumi kõikidele üksustele, samas eirab üksikute üksuste erinevusi. Igas nähtuses ja selle arengus on kombinatsioon juhusest ja vajadusest. Keskmiste arvutamisel tühistab juhuslikkus suurte arvude seaduse toimimise tõttu üksteist, tasakaalustab, nii et saate igal konkreetsel juhul abstraheerida nähtuse ebaolulistest tunnustest, atribuudi kvantitatiivsetest väärtustest. Individuaalsete väärtuste juhuslikkusest, kõikumistest abstraheerumise võimes peitub keskmiste teaduslik väärtus agregaatide üldistavate tunnustena.

Selleks, et keskmine oleks tõeliselt tüüpiline, tuleb see arvutada teatud põhimõtteid arvestades.

Peatugem mõnel üldpõhimõttel keskmiste rakendamisel.
1. Kvalitatiivselt homogeensetest üksustest koosnevate populatsioonide keskmine tuleks määrata.
2. Keskmine tuleks arvutada üldkogumi kohta, mis koosneb piisavalt suurest arvust ühikutest.
3. Keskmine tuleks arvutada elanikkonna kohta, mille ühikud on normaalses, loomulikus olekus.
4. Keskmine tuleks arvutada, võttes arvesse uuritava näitaja majanduslikku sisu.

5.2. Keskmiste tüübid ja nende arvutamise meetodid

Vaatleme nüüd keskmiste tüüpe, nende arvutamise omadusi ja rakendusvaldkondi. Keskmised väärtused jagunevad kahte suurde klassi: võimsuse keskmised, struktuursed keskmised.

To võimsuse keskmine hõlmavad selliseid kuulsamaid ja sagedamini kasutatavaid tüüpe nagu geomeetriline keskmine, aritmeetiline keskmine ja keskmine ruut.

Nagu struktuursed keskmised arvestatakse režiimi ja mediaani.

Peatugem võimsuse keskmistel. Võimsuse keskmised võivad olenevalt algandmete esitusest olla lihtsad ja kaalutud. lihtne keskmine arvutatakse rühmitamata andmete põhjal ja sellel on järgmine üldkuju:

kus X i on keskmistatud tunnuse variant (väärtus);

n on valikute arv.

Kaalutud keskmine arvutatakse rühmitatud andmete alusel ja sellel on üldine vorm

,

kus X i on keskmistatud tunnuse variant (väärtus) või vahemiku keskmine väärtus, milles varianti mõõdetakse;
m on keskmise eksponent;
f i - sagedus, mis näitab, mitu korda esineb keskmistatud tunnuse i-e väärtus.

Toome näitena õpilaste keskmise vanuse arvutamise 20-liikmelises rühmas:


Arvutame keskmise vanuse lihtsa keskmise valemi abil:

Rühmitame lähteandmed. Saame järgmised jaotussarjad:

Rühmitamise tulemusena saame uue näitaja - sagedus, mis näitab õpilaste arvu vanuses X aastat. Seetõttu arvutatakse rühma õpilaste keskmine vanus kaalutud keskmise valemi abil:

Eksponentkeskmiste arvutamise üldvalemitel on eksponent (m). Sõltuvalt sellest, millist väärtust see võtab, eristatakse järgmist tüüpi võimsuse keskmisi väärtusi:
harmooniline keskmine, kui m = -1;
geomeetriline keskmine, kui m –> 0;
aritmeetiline keskmine, kui m = 1;
ruutkeskmine, kui m = 2;
keskmine kuup, kui m = 3.

Võimsuse keskmise valemid on toodud tabelis. 4.4.

Kui arvutame samade algandmete jaoks igat tüüpi keskmised, ei ole nende väärtused samad. Siin kehtib keskmiste ülekaalu reegel: eksponendi m suurenemisega suureneb ka vastav keskmine väärtus:

Statistilises praktikas kasutatakse teistest kaalutud keskmistest sagedamini aritmeetilisi ja harmoonilisi kaalutud keskmisi.

Tabel 5.1

Jõuallikate tüübid

Võimsuse tüüp
keskel
Näitaja
kraadid (m)
Arvutusvalem
Lihtne kaalutud
harmooniline -1
Geomeetriline 0
Aritmeetika 1
ruutkeskne 2
kuupmeetrit 3

Harmoonilise keskmise ülesehitus on keerulisem kui aritmeetilisel keskmisel. Harmooniliste keskmist kasutatakse arvutustes, kui kaalud ei ole populatsiooni ühikud - tunnuse kandjad, vaid nende ühikute ja tunnuse väärtuste korrutised (st m = Xf). Keskmist harmoonilist seisakuaega tuleks kasutada näiteks kahe (kolme, nelja jne) ettevõtte, seadmete valmistamisega tegelevate töötajate keskmiste tööjõu-, aja-, materjalide kulu toodanguühiku, osa kohta. sama tüüpi toode, sama osa, toode.

Keskmise väärtuse arvutamise valemi põhinõue on, et arvutamise kõigil etappidel oleks reaalne sisukas põhjendus; Saadud keskmine väärtus peaks asendama iga objekti atribuudi individuaalsed väärtused, katkestamata seost üksikute ja kokkuvõtlike näitajate vahel. Teisisõnu, keskmine väärtus tuleks arvutada nii, et kui keskmistatud näitaja iga üksiku väärtuse asendamine selle keskmise väärtusega, jääb mõni lõplik koondnäitaja, mis on ühel või teisel viisil seotud keskmistatud näitajaga, muutumatuks. Seda tulemust nimetatakse määrav kuna selle seose olemus üksikute väärtustega määrab keskmise väärtuse arvutamise konkreetse valemi. Näitame seda reeglit geomeetrilise keskmise näitel.

Geomeetrilise keskmise valem

kasutatakse kõige sagedamini dünaamika üksikute suhteliste väärtuste keskmise väärtuse arvutamisel.

Geomeetrilist keskmist kasutatakse juhul, kui on antud dünaamika ahela suhteliste väärtuste jada, mis näitab näiteks toodangu mahu kasvu võrreldes eelmise aasta tasemega: i 1 , i 2 , i 3 , ..., i n . Ilmselt määrab viimase aasta toodangu mahu selle algtase (q 0) ja sellele järgnev kasv aastate lõikes:

q n =q 0 × i 1 × i 2 ×... × i n .

Võttes defineerivaks indikaatoriks q n ja asendades dünaamikanäitajate üksikud väärtused keskmiste väärtustega, jõuame seoseni

Siit

5.3. Struktuursed keskmised

Keskmiste väärtuste eritüüpi - struktuurseid keskmisi - kasutatakse atribuutide väärtuste jaotuse seeria sisemise struktuuri uurimiseks, samuti keskmise väärtuse (võimsuse tüübi) hindamiseks, kui olemasolevate statistiliste andmete kohaselt selle arvutust ei saa teha (näiteks kui vaadeldavas näites andmed puuduvad).ja toodangu mahu kohta ning kulude suuruse kohta ettevõtete gruppide kaupa).

Kõige sagedamini kasutatakse näitajaid struktuursete keskmistena. mood - kõige sagedamini korduv tunnusväärtus - ja mediaan - tunnuse väärtus, mis jagab selle väärtuste järjestatud jada kaheks võrdseks osaks. Sellest tulenevalt ei ületa ühes pooles populatsiooni üksustest tunnuse väärtus mediaantaset ja teises pooles ei ole see sellest väiksem.

Kui uuritaval tunnusel on diskreetsed väärtused, siis režiimi ja mediaani arvutamisel erilisi raskusi pole. Kui andmed atribuudi X väärtuste kohta esitatakse selle muutumise järjestatud intervallidena (intervallide seeriad), muutub režiimi ja mediaani arvutamine mõnevõrra keerulisemaks. Kuna mediaanväärtus jagab kogu populatsiooni kaheks võrdseks osaks, jõuab see tunnuse X ühte intervalli. Interpolatsiooni abil leitakse mediaanväärtus sellest mediaanintervallist:

,

kus X Me on mediaanintervalli alumine piir;
h Mina on selle väärtus;
(Sum m) / 2 - pool vaatluste koguarvust või pool näitaja mahust, mida kasutatakse keskmise väärtuse arvutamise valemites (absoluut- või suhtelises väärtuses);
S Me-1 on enne mediaanintervalli algust kogunenud vaatluste summa (või kaalumistunnuse maht);
m Me on vaatluste arv või kaalumistunnuse maht mediaanintervallis (ka absoluutses või suhtelises väärtuses).

Meie näites on ettevõtete arvu, tootmismahu ja tootmiskulude kogusumma märkide põhjal võimalik saada isegi kolm mediaanväärtust:

Seega ületab poolte ettevõtete toodanguühiku maksumus 125,19 tuhat rubla, pool toodangu kogumahust toodetakse kulude tasemega toote kohta üle 124,79 tuhande rubla. ja 50% kogumaksumusest moodustab ühe toote maksumuse tasemel, mis ületab 125,07 tuhat rubla. Samuti märgime, et kuludes on teatav tõusutrend, kuna Me 2 = 124,79 tuhat rubla ja keskmine tase on 123,15 tuhat rubla.

Tunnuse modaalväärtuse arvutamisel intervallide jada andmete järgi tuleb pöörata tähelepanu sellele, et intervallid oleksid samad, kuna sellest sõltub tunnuse väärtuste sageduse indikaator X. võrdsete intervallidega intervallide jada, režiimi väärtus määratakse kui

kus X Mo on modaalintervalli madalam väärtus;
m Mo on vaatluste arv või kaalumistunnuse maht modaalvahemikus (absoluut- või suhtelises väärtuses);
m Mo -1 - sama modaalile eelneva intervalli puhul;
m Mo+1 - sama modaalile järgneva intervalli puhul;
h on tunnuse muutumise intervalli väärtus rühmades.

Meie näite puhul saab ettevõtete arvu, tootmismahu ja kulude suuruse märkide põhjal arvutada kolm modaalväärtust. Kõigil kolmel juhul on modaalne intervall sama, kuna sama intervalli puhul osutuvad suurimaks nii ettevõtete arv, toodangu maht kui ka tootmiskulude kogusumma:

Nii puututakse kõige sagedamini kokku ettevõtetega, mille kulutase on 126,75 tuhat rubla, kõige sagedamini toodetakse tooteid, mille kulutase on 126,69 tuhat rubla, ja kõige sagedamini on tootmiskulusid seletatav kulutasemega 123,73 tuhat rubla.

5.4. Variatsiooninäitajad

Spetsiifilised tingimused, milles iga uuritav objekt asub, samuti nende enda arengu tunnused (sotsiaalsed, majanduslikud jne) väljenduvad statistiliste näitajate vastavate numbriliste tasemetega. Seega variatsioon, need. lahknevus sama näitaja tasemete vahel erinevates objektides on objektiivne ja aitab mõista uuritava nähtuse olemust.

Statistika varieerumise mõõtmiseks on mitu võimalust.

Lihtsaim on indikaatori arvutamine ulatuse variatsioon H kui erinevuse tunnuse maksimaalsete (X max) ja minimaalsete (X min) täheldatud väärtuste vahel:

H=X max – X min.

Variatsioonivahemik näitab aga ainult tunnuse äärmuslikke väärtusi. Siin ei võeta arvesse vahepealsete väärtuste korratavust.

Rangemad omadused on kõikumise näitajad atribuudi keskmise taseme suhtes. Seda tüüpi lihtsaim näitaja on keskmine lineaarne hälve L kui tunnuse keskmisest tasemest absoluutsete kõrvalekallete aritmeetiline keskmine:

X üksikute väärtuste kordamisel kasutatakse kaalutud aritmeetilise keskmise valemit:

(Meenutagem, et keskmisest tasemest kõrvalekallete algebraline summa on null.)

Keskmise lineaarse hälbe näitaja on praktikas leidnud laialdast rakendust. Tema abiga analüüsitakse näiteks töötajate koosseisu, tootmise rütmi, materjalide tarnimise ühtsust, töötatakse välja materiaalsete stiimulite süsteeme. Kuid kahjuks raskendab see näitaja tõenäosuslikku tüüpi arvutusi, raskendab matemaatilise statistika meetodite rakendamist. Seetõttu kasutatakse statistilistes teadusuuringutes näitajat kõige sagedamini variatsiooni mõõtmiseks. dispersioon.

Tunnuse dispersioon (s 2) määratakse ruutvõimsuse keskmise alusel:

.

Kutsutakse eksponenti s, mis on võrdne standardhälve.

Üldises statistikateoorias on dispersiooninäitaja samanimelise tõenäosusteooria näitaja hinnang ja (hälvete ruudu summana) matemaatilise statistika dispersiooni hinnang, mis võimaldab kasutada nendes sätestatut. teoreetilised distsipliinid sotsiaal-majanduslike protsesside analüüsimiseks.

Kui varieeruvust hinnatakse väikese arvu vaatluste põhjal, mis on võetud piiramatust üldkogumist, siis määratakse tunnuse keskmine väärtus teatud veaga. Dispersiooni arvutatud väärtus näib olevat nihutatud allapoole. Erapooletu hinnangu saamiseks tuleb ülaltoodud valemite abil saadud valimi dispersioon korrutada väärtusega n / (n - 1). Selle tulemusena väikese arvu vaatlustega (< 30) дисперсию признака рекомендуется вычислять по формуле

Tavaliselt muutub juba n > (15÷20) lahknevus kallutatud ja kallutamata hinnangute vahel tähtsusetuks. Samal põhjusel ei võeta kõrvalekallet tavaliselt dispersioonide lisamise valemis arvesse.

Kui üldkogumist võtta mitu valimit ja iga kord määrata tunnuse keskmine väärtus, siis tekib keskmiste varieeruvuse hindamise probleem. Hinnangu dispersioon keskmine väärtus võib põhineda ka ainult ühel näidisvaatlusel valemi järgi

,

kus n on valimi suurus; s 2 on näidisandmete põhjal arvutatud tunnuse dispersioon.

Väärtus kutsutakse tähendab diskreetimise viga ja see on tunnuse X valimi keskmise väärtuse kõrvalekalde tunnus selle tegelikust keskmisest väärtusest. Valimivaatluse tulemuste usaldusväärsuse hindamisel kasutatakse keskmise vea näitajat.

Suhtelised hajuvuse näitajad. Uuritava tunnuse kõikumise mõõdiku iseloomustamiseks arvutatakse kõikumise näitajad suhtelistena. Need võimaldavad teil võrrelda dispersiooni olemust erinevates jaotustes (sama tunnuse erinevad vaatlusühikud kahes komplektis, erinevate kogumite võrdlemisel erinevate keskmiste väärtustega). Suhtelise dispersiooni mõõteindikaatorite arvutamine toimub absoluutse dispersiooniindeksi ja aritmeetilise keskmise suhtena, mis on korrutatud 100%.

1. Võnkekoefitsient peegeldab tunnuse äärmuslike väärtuste suhtelist kõikumist keskmise ümber

.

2. Suhteline lineaarne seiskamine iseloomustab absoluuthälvete märgi keskmise väärtuse osakaalu keskmisest väärtusest.

.

3. Variatsioonikoefitsient:

on kõige levinum dispersioonimõõt, mida kasutatakse keskmiste tüüpilisuse hindamiseks.

Statistikas loetakse heterogeenseteks populatsioone, mille variatsioonikordaja on suurem kui 30–35%.

Sellel varieerumise hindamise meetodil on ka märkimisväärne puudus. Tõepoolest, olgu näiteks 15-aastase keskmise tööstaažiga töötajate esialgne kogum standardhälbega s = 10 aastat, “vanus” veel 15 aastat. Nüüd = 30 aastat ja standardhälve on endiselt 10. Varem heterogeenne populatsioon (10/15 × 100 = 66,7%), seega osutub ajas üsna homogeenseks (10/30 × 100 = 33,3%).

Boyarsky A.Ya. Statistika teoreetiline uurimus: laup. Teaduslik Toimetised. - M .: Statistika, 1974. lk 19–57.

Eelmine

Kokkuvõtte ja rühmitamise tulemuse analüüsimiseks ja statistiliste järelduste tegemiseks arvutatakse üldistavad näitajad - keskmised ja suhtelised väärtused.

Keskmiste probleem - iseloomustada kõiki statistilise üldkogumi üksusi atribuudi ühe väärtusega.

Keskmised väärtused iseloomustavad ettevõtlustegevuse kvalitatiivseid näitajaid: turustuskulud, kasum, kasumlikkus jne.

keskmine väärtus- see on üldkogumi ühikute üldistav tunnus mõne muutuva tunnuse järgi.

Keskmised väärtused võimaldavad võrrelda sama tunnuse taset erinevates populatsioonides ja leida nende erinevuste põhjused.

Uuritavate nähtuste analüüsimisel on keskmiste väärtuste roll tohutu. Inglise majandusteadlane W. Petty (1623-1687) kasutas laialdaselt keskmisi. V. Petty soovis ühe töötaja keskmisele päevarahale kulutatud kulutuste mõõtmiseks kasutada keskmisi väärtusi. Keskmise väärtuse stabiilsus peegeldab uuritavate protsesside mustreid. Ta uskus, et teavet saab teisendada ka siis, kui algandmeid pole piisavalt.

Inglise teadlane G. King (1648-1712) kasutas Inglismaa rahvastiku andmete analüüsimisel keskmisi ja suhtelisi väärtusi.

Belgia statistiku A. Quetelet' (1796-1874) teoreetilised arengud põhinevad sotsiaalsete nähtuste olemuse ebajärjekindlusel - massiliselt väga stabiilsed, kuid puhtalt individuaalsed.

A. Quetelet’ järgi mõjuvad püsivad põhjused igale uuritavale nähtusele ühtemoodi ja muudavad need nähtused üksteisega sarnaseks, loovad neile kõigile ühiseid mustreid.

A. Quetelet' õpetuste tagajärg oli keskmiste väärtuste määramine statistilise analüüsi peamise meetodina. Ta ütles, et statistilised keskmised ei ole objektiivse reaalsuse kategooria.

A. Quetelet väljendas oma seisukohti keskmise kohta oma keskmise inimese teoorias. Keskmine inimene on inimene, kellel on keskmises suuruses kõik omadused (keskmine suremus või sündimuskordaja, keskmine pikkus ja kaal, keskmine jooksukiirus, keskmine abiellumis- ja enesetapukalduvus, heategudeks jne). A. Quetelet’ jaoks on keskmine inimene inimese ideaal. A. Quetelet’ keskmise inimese teooria ebaühtlust tõestas vene statistikakirjandus 19.-20. sajandi lõpul.

Kuulus vene statistik Yu. E. Yanson (1835-1893) kirjutas, et A. Quetelet eeldab keskmise inimese tüübi olemasolu looduses kui midagi etteantud, millest elu on tõrjunud antud ühiskonna ja antud keskmised inimesed. aega ja see viib ta täiesti mehaanilise vaateni ühiskonnaelu liikumisseadustele: liikumine on inimese keskmiste omaduste järkjärguline tõus, tüübi järkjärguline taastamine; järelikult selline ühiskondliku keha elu kõigi ilmingute nivelleerimine, millest edasi lakkab igasugune edasiliikumine.

Selle teooria olemus on leidnud oma edasise arengu mitmete statistikateoreetikute töödes tõeliste väärtuste teooriana. A. Queteletil oli järgijaid - saksa majandusteadlane ja statistik W. Lexis (1837-1914), kes kandis tõeliste väärtuste teooria üle ühiskonnaelu majanduslikele nähtustele. Tema teooriat tuntakse stabiilsusteooriana. Filosoofial põhineb veel üks idealistliku keskmiste teooria versioon

Selle asutaja on inglise statistik A. Bowley (1869–1957), uusaja üks silmapaistvamaid teoreetikuid keskmiste teooria alal. Tema kontseptsioon keskmistest on välja toodud raamatus "Statistika elemendid".

A. Bowley arvestab keskmisi ainult kvantitatiivsest küljest, eraldades seeläbi kvantiteedi kvaliteedist. Keskmiste väärtuste (või "nende funktsiooni") tähenduse määramisel esitab A. Bowley Machi mõtlemise põhimõtte. A. Bowley kirjutas, et keskmiste funktsioon peaks väljendama kompleksset rühma

mõne algarvuga. Statistilisi andmeid tuleks lihtsustada, rühmitada ja keskmistada.Neid seisukohti jagasid R. Fisher (1890-1968), J. Yule (1871-1951), Frederick S. Mills (1892) jt.

30ndatel. 20. sajand ja järgnevatel aastatel käsitletakse keskmist väärtust sotsiaalselt olulise tunnusena, mille infosisu sõltub andmete homogeensusest.

Itaalia koolkonna silmapaistvamad esindajad R. Benini (1862-1956) ja C. Gini (1884-1965), pidades statistikat loogikaharuks, laiendasid statistilise induktsiooni ulatust, kuid nad seostasid loogika kognitiivseid printsiipe. ja statistika uuritavate nähtuste olemusega, järgides statistika sotsioloogilise tõlgendamise traditsioone.

K. Marxi ja V. I. Lenini töödes on keskmistele väärtustele omistatud eriline roll.

K. Marx väitis, et keskmises väärtuses tühistatakse individuaalsed kõrvalekalded üldisest tasemest ja keskmine tase muutub massinähtuse üldistavaks tunnuseks.Keskmine väärtus muutub massinähtuse selliseks tunnuseks alles siis, kui võetakse märkimisväärne arv ühikuid. ja need üksused on kvalitatiivselt homogeensed. Marx kirjutas, et leitud keskmine väärtus oli "... paljude erinevate sama tüüpi individuaalsete väärtuste keskmine".

Keskmine väärtus omandab turumajanduses erilise tähenduse. See aitab määrata majandusarengu seaduste vajalikku ja üldist, suundumust otse individuaalse ja juhusliku kaudu.

Keskmised väärtused on üldistavad näitajad, milles väljendub üldtingimuste toime, uuritava nähtuse regulaarsus.

Statistilised keskmised arvutatakse statistiliselt korrektselt korraldatud massivaatluse massiandmete põhjal. Kui statistiline keskmine arvutatakse kvalitatiivselt homogeense populatsiooni (massinähtuste) massiandmetest, siis on see objektiivne.

Keskmine väärtus on abstraktne, kuna see iseloomustab abstraktse ühiku väärtust.

Keskmine on võetud üksikute objektide tunnuse mitmekesisusest. Abstraktsioon on teadusliku uurimistöö etapp. Üksikisiku ja üldise dialektiline ühtsus realiseerub keskmises väärtuses.

Keskmisi väärtusi tuleks kohaldada indiviidi ja üldise, üksikisiku ja massi kategooriate dialektilise mõistmise alusel.

Keskmine peegeldab midagi ühist, mis liidetakse kindlas üksikus objektis.

Massiliste sotsiaalsete protsesside mustrite tuvastamiseks on keskmine väärtus väga oluline.

Indiviidi kõrvalekaldumine üldisest on arenguprotsessi ilming.

Keskmine väärtus peegeldab uuritavate nähtuste iseloomulikku, tüüpilist, tegelikku taset. Keskmiste eesmärk on iseloomustada neid tasemeid ja nende muutusi ajas ja ruumis.

Keskmine näitaja on harilik väärtus, kuna see moodustub normaalsetes, looduslikes, üldistes tingimustes konkreetse massinähtuse olemasoluks tervikuna.

Statistilise protsessi või nähtuse objektiivne omadus peegeldab keskmist väärtust.

Uuritud statistilise tunnuse individuaalsed väärtused on populatsiooni iga üksuse jaoks erinevad. Üht tüüpi individuaalsete väärtuste keskmine väärtus on vajaduse tulemus, mis on kõigi elanikkonna üksuste kumulatiivse tegevuse tulemus, mis väljendub korduvate õnnetuste massis.

Mõnel üksikul nähtusel on märke, mis esinevad kõigis nähtustes, kuid erinevates kogustes – see on inimese pikkus või vanus. Individuaalse nähtuse muud märgid on erinevate nähtuste puhul kvalitatiivselt erinevad, see tähendab, et need esinevad mõnel, kuid teistel neid ei täheldata (mehest ei saa naist). Keskmine väärtus arvutatakse märkide jaoks, mis on kvalitatiivselt homogeensed ja erinevad ainult kvantitatiivselt, mis on omased kõikidele antud hulga nähtustele.

Keskmine väärtus peegeldab uuritava tunnuse väärtusi ja seda mõõdetakse selle tunnusega samas mõõdus.

Dialektilise materialismi teooria õpetab, et kõik maailmas muutub ja areneb. Ja ka keskmiste väärtustega iseloomustavad märgid muutuvad ja vastavalt ka keskmised ise.

Elu on pidev protsess millegi uue loomiseks. Uue kvaliteedi kandjaks on üksikud objektid, siis nende objektide arv suureneb ja uus muutub tüüpiliseks massiks.

Keskmine väärtus iseloomustab uuritavat populatsiooni vaid ühel alusel. Uuritava elanikkonna mitmete spetsiifiliste tunnuste täielikuks ja igakülgseks esitlemiseks on vaja keskmiste väärtuste süsteemi, mis kirjeldaks nähtust erinevate nurkade alt.

2. Keskmiste tüübid

Materjali statistilisel töötlemisel tekivad mitmesugused lahendamist vajavad probleemid ja seetõttu kasutatakse statistikapraktikas erinevaid keskmisi väärtusi. Matemaatilises statistikas kasutatakse erinevaid keskmisi, näiteks: aritmeetiline keskmine; geomeetriline keskmine; keskmine harmooniline; ruutkeskmine.

Ühe ülaltoodud keskmise tüüpide rakendamiseks on vaja analüüsida uuritavat populatsiooni, määrata uuritava nähtuse materiaalne sisu, seda kõike tehakse tulemuste mõtestatuse põhimõttest tehtud järelduste alusel. kaalumisel või summeerimisel.

Keskmiste uurimisel kasutatakse järgmisi näitajaid ja tähistust.

Kriteerium, mille järgi keskmine leitakse, nimetatakse keskmistatud funktsioon ja on tähistatud x-ga; nimetatakse statistilise üldkogumi mis tahes ühiku keskmistatud tunnuse väärtust selle individuaalne tähendus või valikud, ja tähistatud kui x 1 , X 2 , x 3 ,… X P ; sagedus on tunnuse üksikute väärtuste korratavus, mida tähistatakse tähega f.

Aritmeetiline keskmine

Üks levinumaid meediumitüüpe aritmeetiline keskmine, mis arvutatakse siis, kui keskmistatud atribuudi maht moodustatakse selle väärtuste summana uuritava statistilise üldkogumi üksikute üksuste jaoks.

Aritmeetilise keskmise arvutamiseks jagatakse kõigi tunnuste tasemete summa nende arvuga.


Kui mõned valikud esinevad mitu korda, siis saab atribuutide tasemete summa saada, korrutades iga taseme vastava populatsiooniühikute arvuga, millele järgneb saadud korrutiste summa, sel viisil arvutatud aritmeetilist keskmist nimetatakse kaalutud aritmeetikaks. tähendab.

Kaalutud aritmeetilise keskmise valem on järgmine:


kus x i on valikud,

f i - sagedused või kaalud.

Kaalutud keskmist tuleks kasutada kõigil juhtudel, kui variandid on erineva arvukusega.

Aritmeetiline keskmine justkui jaotab üksikute objektide vahel võrdselt atribuudi koguväärtuse, mis tegelikult on igaühe puhul erinev.

Keskmiste väärtuste arvutamine toimub intervalljaotuse seeriate kujul rühmitatud andmete alusel, kui tunnuse variandid, millest keskmine arvutatakse, esitatakse intervallidena (alates - kuni).

Aritmeetilise keskmise omadused:

1) muutuvate väärtuste summa aritmeetiline keskmine on võrdne aritmeetiliste keskmiste summaga: Kui x i = y i + z i , siis


See omadus näitab, millistel juhtudel on võimalik keskmisi väärtusi kokku võtta.

2) varieeruva atribuudi üksikute väärtuste keskmisest kõrvalekallete algebraline summa on võrdne nulliga, kuna ühes suunas kõrvalekallete summa kompenseeritakse teise suuna hälvete summaga:


See reegel näitab, et keskmine on resultant.

3) kui kõiki seeria variante suurendatakse või vähendatakse sama arvu võrra?, siis keskmine suureneb või väheneb sama arvu võrra?:


4) kui kõiki seeria variante suurendatakse või vähendatakse A korda, siis ka keskmine suureneb või väheneb A korda:


5) keskmise viies omadus näitab meile, et see ei sõltu kaalude suurusest, vaid sõltub nendevahelisest suhtest. Kaaludena saab võtta mitte ainult suhtelisi, vaid ka absoluutväärtusi.

Kui kõik seeria sagedused jagada või korrutada sama arvuga d, siis keskmine ei muutu.


Keskmine harmooniline. Aritmeetilise keskmise määramiseks on vaja mitmeid valikuid ja sagedusi, st väärtusi X ja f.

Oletame, et me teame funktsiooni individuaalseid väärtusi X ja töötab X/, ja sagedused f on teadmata, siis keskmise arvutamiseks tähistame korrutist = X/; kus:



Keskmist sellel kujul nimetatakse harmooniliseks kaalutud keskmiseks ja seda tähistatakse x kahju. vzvv.

Sellest lähtuvalt on harmooniline keskmine identne aritmeetilise keskmisega. Seda kasutatakse juhul, kui tegelikud kaalud pole teada. f, ja toode on teada fx = z

Kui töötab fx sama või võrdne ühega (m = 1), kasutatakse harmoonilist lihtkeskmist, mis arvutatakse järgmise valemiga:


kus X- eraldi valikud;

n- number.

Geomeetriline keskmine

Kui kasvufaktoreid on n, on keskmise koefitsiendi valem järgmine:


See on geomeetrilise keskmise valem.

Geomeetriline keskmine on võrdne astme juurega n kasvukoefitsientide korrutisest, mis iseloomustavad iga järgneva perioodi väärtuse ja eelmise perioodi väärtuse suhet.

Kui ruutfunktsioonidena väljendatud väärtused kuuluvad keskmistamisele, kasutatakse ruutkeskmist. Näiteks ruutkeskmist kasutades saate määrata torude, rataste jne läbimõõdud.

Lihtne keskmine ruut määratakse jagatise ruutjuure võtmisega üksikute tunnuste väärtuste ruutude summa jagamisest nende arvuga.


Kaalutud ruutkeskmine on:

3. Struktuursed keskmised. Režiim ja mediaan

Statistilise üldkogumi struktuuri iseloomustamiseks kasutatakse näitajaid, mida nimetatakse struktuursed keskmised. Nende hulka kuuluvad režiim ja mediaan.

Mood (M umbes ) - kõige levinum variant. Mood nimetatakse tunnuse väärtust, mis vastab teoreetilise jaotuskõvera maksimumpunktile.

Režiim tähistab kõige sagedamini esinevat või tüüpilist väärtust.

Moodi kasutatakse kaubanduspraktikas tarbijate nõudluse uurimiseks ja hindade rekordimiseks.

Diskreetses seerias on režiimiks kõrgeima sagedusega variant. Intervalli variatsioonireas loetakse režiimiks intervalli keskmist varianti, millel on kõrgeim sagedus (eripära).

Intervalli sees on vaja leida atribuudi väärtus, milleks on režiim.


kus X umbes on modaalintervalli alumine piir;

h on modaalintervalli väärtus;

f m on modaalintervalli sagedus;

f t-1 - modaalile eelneva intervalli sagedus;

f m+1 on modaalile järgneva intervalli sagedus.

Režiim sõltub rühmade suurusest, rühmade piiride täpsest asukohast.

Mood- number, mis tegelikult esineb kõige sagedamini (on teatud väärtus), praktikas on sellel kõige laiem kasutus (kõige levinum ostja tüüp).

Mediaan (M e- see on väärtus, mis jagab järjestatud variatsiooniseeriate arvu kaheks võrdseks osaks: ühel osal on varieeruva tunnuse väärtused, mis on keskmisest variandist väiksemad ja teisel on suured.

Mediaan on element, mis on suurem või võrdne jaotuserea ülejäänud elementidest ja samaaegselt väiksem või võrdne poolega.

Mediaani omadus on see, et tunnuse väärtuste absoluutsete kõrvalekallete summa mediaanist on väiksem kui mis tahes muust väärtusest.

Mediaani kasutamine võimaldab saada täpsemaid tulemusi kui muude keskmiste vormide kasutamine.

Intervalli variatsioonirea mediaani leidmise järjekord on järgmine: järjestame atribuudi üksikud väärtused järjestuse järgi; määrata selle järjestatud seeria akumuleeritud sagedused; akumuleeritud sageduste järgi leiame mediaanintervalli:


kus x mina on mediaanintervalli alumine piir;

i Mina on mediaanintervalli väärtus;

f/2 on jada sageduste poolsumma;

S Mina-1 on mediaanintervallile eelnevate akumuleeritud sageduste summa;

f Mina on mediaanintervalli sagedus.

Mediaan jagab ridade arvu pooleks, seega on see koht, kus kumulatiivne sagedus on pool või rohkem kui pool sageduste koguarvust ja eelnev (kumulatiivne) sagedus on väiksem kui pool populatsiooni arvust.