Biografije Karakteristike Analiza

Kako odrediti aritmetičku sredinu. Izračunavanje prosjeka

Ovaj izraz ima druga značenja, pogledajte prosječno značenje.

Prosjek(u matematici i statistici) skupovi brojeva - zbir svih brojeva podijeljen njihovim brojem. To je jedna od najčešćih mjera centralne tendencije.

Predložili su ga (zajedno sa geometrijskom sredinom i harmonijskom sredinom) Pitagorejci.

Posebni slučajevi aritmetičke sredine su sredina (opšte populacije) i uzorkovana sredina (uzoraka).

Uvod

Označite skup podataka X = (x 1 , x 2 , …, x n), tada je srednja vrijednost uzorka obično označena horizontalnom crtom iznad varijable (x ¯ (\displaystyle (\bar (x))) , izgovara se " x sa crticom").

Grčko slovo μ koristi se za označavanje aritmetičke sredine cjelokupne populacije. Za slučajnu varijablu za koju je definirana srednja vrijednost, μ je srednja verovatnoća ili matematičko očekivanje slučajne varijable. Ako je set X je zbirka slučajnih brojeva sa srednjom vjerovatnoćom μ, tada za bilo koji uzorak x i iz ove kolekcije μ = E( x i) je očekivanje ovog uzorka.

U praksi, razlika između μ i x ¯ (\displaystyle (\bar (x))) je u tome što je μ tipična varijabla jer možete vidjeti uzorak, a ne cijelu populaciju. Stoga, ako je uzorak predstavljen nasumično (u smislu teorije vjerovatnoće), tada se x ¯ (\displaystyle (\bar (x))) (ali ne μ) može tretirati kao slučajna varijabla koja ima distribuciju vjerovatnoće na uzorku ( distribucija vjerovatnoće srednje vrijednosti).

Obje ove količine se izračunavaju na isti način:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\suma _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Ako a X je slučajna varijabla, zatim matematičko očekivanje X može se smatrati aritmetičkom sredinom vrijednosti u ponovljenim mjerenjima količine X. Ovo je manifestacija zakona velikih brojeva. Stoga se srednja vrijednost uzorka koristi za procjenu nepoznatog matematičkog očekivanja.

U elementarnoj algebri je dokazano da je srednja vrijednost n+ 1 broj iznad prosjeka n brojevi ako i samo ako je novi broj veći od starog prosjeka, manji ako i samo ako je novi broj manji od prosjeka i ne mijenja se ako i samo ako je novi broj jednak prosjeku. Više n, što je manja razlika između novog i starog prosjeka.

Imajte na umu da postoji nekoliko drugih dostupnih "sredstava", uključujući postepenu sredinu, Kolmogorovljevu sredinu, harmonijsku sredinu, aritmetičko-geometrijsku sredinu i različite ponderisane sredine (npr. aritmetičku ponderisanu sredinu, geometrijsku ponderisanu sredinu, harmonijsku ponderisanu sredinu) .

Primjeri

  • Za tri broja, trebate ih sabrati i podijeliti sa 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Za četiri broja, trebate ih sabrati i podijeliti sa 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Ili lakše 5+5=10, 10:2. Zato što smo dodali 2 broja, što znači da koliko brojeva saberemo, s tim i podijelimo.

Kontinuirana slučajna varijabla

Za kontinuirano distribuiranu vrijednost f (x) (\displaystyle f(x)) aritmetička sredina na intervalu [ a ; b ] (\displaystyle ) je definiran preko određenog integrala:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Neki problemi korištenja prosjeka

Nedostatak robusnosti

Glavni članak: Robusnost u statistici

Iako se aritmetička sredina često koristi kao srednja vrijednost ili centralni trend, ovaj koncept se ne primjenjuje na robusnu statistiku, što znači da je aritmetička sredina pod velikim utjecajem "velikih odstupanja". Važno je napomenuti da za distribucije s velikom asimetrijom, aritmetička sredina možda neće odgovarati konceptu "prosjeka", a vrijednosti srednje vrijednosti iz robusne statistike (na primjer, medijan) mogu bolje opisati središnji trend.

Klasičan primjer je obračun prosječnog dohotka. Aritmetička sredina se može pogrešno protumačiti kao medijana, što može dovesti do zaključka da ima više ljudi s većim prihodima nego što ih stvarno ima. "Srednji" prihod se tumači na način da su prihodi većine ljudi blizu ovom broju. Ovaj "prosječni" (u smislu aritmetičke sredine) prihod je veći od prihoda većine ljudi, budući da visok dohodak sa velikim odstupanjem od prosjeka čini aritmetičku sredinu snažno iskrivljenom (nasuprot tome, srednji dohodak se "opire" takva iskrivljenost). Međutim, ovaj "prosječni" prihod ne govori ništa o broju ljudi blizu srednjeg prihoda (i ne govori ništa o broju ljudi blizu modalnog prihoda). Međutim, ako se pojmovi "prosjek" i "većina" shvate olako, onda se može pogrešno zaključiti da većina ljudi ima prihode veće nego što jesu. Na primjer, izvještaj o "prosječnom" neto prihodu u Medini u Washingtonu, izračunatom kao aritmetički prosjek svih godišnjih neto prihoda stanovnika, daće iznenađujuće visok broj zbog Billa Gatesa. Razmotrite uzorak (1, 2, 2, 2, 3, 9). Aritmetička sredina je 3,17, ali pet od šest vrijednosti je ispod ove sredine.

Složena kamata

Glavni članak: ROI

Ako brojevi umnožiti, ali ne fold, trebate koristiti geometrijsku sredinu, a ne aritmetičku sredinu. Najčešće se ovaj incident dešava prilikom izračunavanja povrata ulaganja u finansije.

Na primjer, ako su dionice pale za 10% u prvoj godini i porasle za 30% u drugoj godini, onda je pogrešno izračunati "prosječno" povećanje u ove dvije godine kao aritmetičku sredinu (−10% + 30%) / 2 = 10%; tačan prosjek u ovom slučaju je dat složenom godišnjom stopom rasta, od koje je godišnji rast samo oko 8,16653826392% ≈ 8,2%.

Razlog tome je što procenti svaki put imaju novu početnu tačku: 30% je 30% od broja manjeg od cijene na početku prve godine: ako je dionica počela na 30 dolara i pala za 10%, vrijedi 27 dolara na početku druge godine. Ako dionica poraste za 30%, na kraju druge godine vrijedi 35,1 USD. Aritmetički prosjek ovog rasta je 10%, ali pošto je dionica porasla samo za 5,1 USD u 2 godine, prosječno povećanje od 8,2% daje konačni rezultat od 35,1 USD:

[30 USD (1 - 0,1) (1 + 0,3) = 30 USD (1 + 0,082) (1 + 0,082) = 35,1 USD]. Ako koristimo aritmetičku sredinu od 10% na isti način, nećemo dobiti stvarnu vrijednost: [30 USD (1 + 0,1) (1 + 0,1) = 36,3 USD].

Složena kamata na kraju 2. godine: 90% * 130% = 117% , odnosno ukupno povećanje od 17%, a prosječna godišnja složena kamata je 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \cca 108,2\%), odnosno prosječno godišnje povećanje od 8,2%.

Upute

Glavni članak: Statistika odredišta

Prilikom izračunavanja aritmetičke sredine neke varijable koja se ciklički mijenja (na primjer, faza ili ugao), treba obratiti posebnu pažnju. Na primjer, prosjek od 1° i 359° bi bio 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Ovaj broj je netačan iz dva razloga.

  • Prvo, ugaone mjere su definirane samo za raspon od 0° do 360° (ili od 0 do 2π kada se mjere u radijanima). Tako se isti par brojeva može napisati kao (1° i −1°) ili kao (1° i 719°). Prosjeci svakog para će biti različiti: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Drugo, u ovom slučaju, vrijednost od 0° (ekvivalentno 360°) bi bila geometrijski najbolja srednja vrijednost, budući da brojevi odstupaju manje od 0° nego od bilo koje druge vrijednosti (vrijednost 0° ima najmanju varijansu). uporedi:
    • broj 1° odstupa od 0° samo za 1°;
    • broj 1° odstupa od izračunatog prosjeka od 180° za 179°.

Prosječna vrijednost za cikličnu varijablu, izračunata prema gornjoj formuli, bit će umjetno pomjerena u odnosu na stvarni prosjek do sredine numeričkog raspona. Zbog toga se prosek izračunava na drugačiji način, odnosno kao prosečna vrednost se bira broj sa najmanjom varijansom (centralna tačka). Također, umjesto oduzimanja, koristi se modulo udaljenost (tj. obodna udaljenost). Na primjer, modularna udaljenost između 1° i 359° je 2°, a ne 358° (na krugu između 359° i 360°==0° - jedan stepen, između 0° i 1° - također 1°, ukupno - 2°).

Vrste prosječnih vrijednosti i metode za njihovo izračunavanje

U fazi statističke obrade mogu se postaviti različiti istraživački zadaci za čije je rješavanje potrebno odabrati odgovarajući prosjek. U ovom slučaju, potrebno je voditi se sljedećim pravilom: vrijednosti koje predstavljaju brojnik i nazivnik prosjeka moraju biti logički povezane jedna s drugom.

  • proseci snage;
  • strukturni proseci.

Hajde da uvedemo sljedeću notaciju:

Vrijednosti za koje se izračunava prosjek;

Prosjek, gdje linija iznad označava da se vrši usrednjavanje pojedinačnih vrijednosti;

Učestalost (ponovljivost vrijednosti pojedinačnih osobina).

Različite sredine su izvedene iz opšte formule srednje vrednosti snage:

(5.1)

za k = 1 - aritmetička sredina; k = -1 - harmonijska sredina; k = 0 - geometrijska sredina; k = -2 - srednji kvadrat.

Prosjeci su jednostavni ili ponderisani. ponderisani proseci nazivaju se količine koje uzimaju u obzir da neke varijante vrijednosti atributa mogu imati različite brojeve, pa se stoga svaka varijanta mora pomnožiti s tim brojem. Drugim riječima, "težine" su brojevi jedinica stanovništva u različitim grupama, tj. svaka opcija je "ponderisana" svojom frekvencijom. Frekvencija f se zove statistička težina ili težinski prosjek.

Aritmetička sredina- najčešći tip medija. Koristi se kada se proračun vrši na negrupisanim statističkim podacima, gdje se želi dobiti prosječan sabir. Aritmetička sredina je takva prosječna vrijednost osobine, nakon čijeg prijema ukupan obim obilježja u populaciji ostaje nepromijenjen.

Formula aritmetičke sredine ( jednostavno) ima oblik

gdje je n veličina populacije.

Na primjer, prosječna plata zaposlenih u preduzeću izračunava se kao aritmetički prosjek:

Odlučujući indikatori ovde su plate svakog zaposlenog i broj zaposlenih u preduzeću. Prilikom izračunavanja prosjeka ukupan iznos zarada je ostao isti, ali raspoređen, takoreći, jednako na sve radnike. Na primjer, potrebno je izračunati prosječnu platu zaposlenih u maloj kompaniji u kojoj je zaposleno 8 ljudi:

Prilikom izračunavanja prosjeka, pojedinačne vrijednosti atributa koji se prosječuje mogu se ponoviti, pa se prosjek izračunava pomoću grupisanih podataka. U ovom slučaju govorimo o korištenju ponderisana aritmetička sredina, što izgleda

(5.3)

Dakle, treba da izračunamo prosječnu cijenu dionica akcionarskog društva na berzi. Poznato je da su transakcije obavljene u roku od 5 dana (5 transakcija), a broj prodatih akcija po prodajnom kursu je raspoređen na sledeći način:

1 - 800 ak. - 1010 rubalja

2 - 650 ak. - 990 rub.

3 - 700 ak. - 1015 rubalja.

4 - 550 ak. - 900 rub.

5 - 850 ak. - 1150 rubalja.

Početni omjer za određivanje prosječne cijene dionice je omjer ukupnog iznosa transakcija (TCA) i broja prodatih dionica (KPA):

OSS = 1010 800+990 650+1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

U ovom slučaju, prosječna cijena dionice bila je jednaka

Neophodno je poznavati svojstva aritmetičke sredine, što je veoma važno kako za njenu upotrebu, tako i za njeno izračunavanje. Tri su glavna svojstva koja su najviše dovela do široke upotrebe aritmetičke sredine u statističkim i ekonomskim proračunima.

Svojstvo jedan (nula): zbir pozitivnih odstupanja pojedinačnih vrijednosti osobine od srednje vrijednosti jednak je zbiru negativnih odstupanja. Ovo je vrlo važno svojstvo, jer pokazuje da će se sva odstupanja (i sa + i sa -) zbog slučajnih uzroka međusobno poništavati.

dokaz:

Svojstvo dva (minimum): zbir kvadrata odstupanja pojedinačnih vrijednosti osobine od aritmetičke sredine je manji nego od bilo kojeg drugog broja (a), tj. je minimalni broj.

Dokaz.

Sastavite zbir kvadrata odstupanja od varijable a:

(5.4)

Da bismo pronašli ekstremu ove funkcije, potrebno je njenu derivaciju u odnosu na a izjednačiti sa nulom:

Odavde dobijamo:

(5.5)

Stoga se ekstremum zbira kvadrata odstupanja postiže na . Ovaj ekstrem je minimum, jer funkcija ne može imati maksimum.

Svojstvo tri: aritmetička sredina konstante jednaka je ovoj konstanti: pri a = const.

Pored ova tri najvažnija svojstva aritmetičke sredine, postoje i tzv svojstva dizajna, koji postepeno gube na značaju zbog upotrebe elektronskih računara:

  • ako se pojedinačna vrijednost atributa svake jedinice pomnoži ili podijeli sa konstantnim brojem, tada će se aritmetička sredina povećati ili smanjiti za isti iznos;
  • aritmetička sredina se neće promijeniti ako se težina (učestalost) svake vrijednosti karakteristike podijeli sa konstantnim brojem;
  • ako se pojedinačne vrijednosti atributa svake jedinice smanjuju ili povećavaju za isti iznos, tada će se aritmetička sredina smanjiti ili povećati za isti iznos.

Prosječan harmonik. Ovaj prosjek se naziva recipročnim aritmetičkim prosjekom, jer se ova vrijednost koristi kada je k = -1.

Jednostavna harmonijska sredina koristi se kada su težine karakterističnih vrijednosti iste. Njegova formula se može izvesti iz osnovne formule zamjenom k ​​= -1:

Na primjer, trebamo izračunati prosječnu brzinu dva automobila koji su prošli isti put, ali različitim brzinama: prvi 100 km/h, drugi 90 km/h. Koristeći metodu harmonijske sredine izračunavamo prosječnu brzinu:

U statističkoj praksi češće se koristi harmonsko ponderisanje čija formula ima oblik

Ova formula se koristi u slučajevima kada težine (ili zapremine fenomena) za svaki atribut nisu jednake. U originalnom omjeru, brojilac je poznat za izračunavanje prosjeka, ali je imenilac nepoznat.

Na primjer, kada izračunavamo prosječnu cijenu, moramo koristiti omjer prodanog iznosa i broja prodanih jedinica. Ne znamo broj prodatih jedinica (govorimo o različitoj robi), ali znamo zbroje prodaje ove različite robe. Pretpostavimo da želite saznati prosječnu cijenu prodane robe:

Dobijamo

Geometrijska sredina. Najčešće geometrijska sredina nalazi svoju primjenu u određivanju prosječne stope rasta (prosječne stope rasta), kada se pojedinačne vrijednosti osobine predstavljaju kao relativne vrijednosti. Također se koristi ako je potrebno pronaći prosjek između minimalne i maksimalne vrijednosti karakteristike (na primjer, između 100 i 1000000). Postoje formule za jednostavnu i ponderisanu geometrijsku sredinu.

Za jednostavnu geometrijsku sredinu

Za ponderisanu geometrijsku sredinu

RMS. Glavni opseg njegove primjene je mjerenje varijacije osobine u populaciji (izračunavanje standardne devijacije).

Jednostavna formula srednjeg kvadrata

Formula ponderisanog srednjeg kvadrata

(5.11)

Kao rezultat toga, možemo reći da uspješno rješavanje problema statističkih istraživanja zavisi od pravilnog izbora vrste prosječne vrijednosti u svakom konkretnom slučaju. Izbor prosjeka pretpostavlja sljedeći niz:

a) uspostavljanje generalizirajućeg indikatora stanovništva;

b) određivanje matematičkog odnosa vrijednosti za dati generalizujući indikator;

c) zamjena pojedinačnih vrijednosti prosječnim vrijednostima;

d) izračunavanje prosjeka korištenjem odgovarajuće jednačine.

Srednje vrijednosti i varijacije

prosječna vrijednost- ovo je generalizirajući pokazatelj koji karakteriše kvalitativno homogenu populaciju prema određenom kvantitativnom atributu. Na primjer, prosječna starost osoba osuđenih za krađu.

U pravosudnoj statistici, prosjeci se koriste za karakterizaciju:

Prosječni rokovi razmatranja predmeta ove kategorije;

Zahtjev srednje veličine;

Prosječan broj optuženih po predmetu;

Prosječan iznos štete;

Prosječno opterećenje sudija itd.

Prosječna vrijednost je uvijek imenovana i ima istu dimenziju kao atribut posebne jedinice populacije. Svaka prosječna vrijednost karakterizira proučavanu populaciju prema bilo kojem promjenjivom atributu, pa se iza svakog prosjeka nalazi niz distribucije jedinica ove populacije prema proučavanom atributu. Izbor vrste prosjeka određen je sadržajem indikatora i početnim podacima za izračunavanje prosjeka.

Sve vrste prosjeka koji se koriste u statističkim studijama spadaju u dvije kategorije:

1) proseci snage;

2) strukturni proseci.

Prva kategorija prosjeka uključuje: aritmetička sredina, harmonijska sredina, geometrijska sredina i srednji kvadratni korijen . Druga kategorija je moda i medijana. Štaviše, svaki od navedenih tipova proseka snage može imati dva oblika: jednostavno i ponderisano . Jednostavan oblik srednje vrijednosti koristi se za dobivanje srednje vrijednosti osobine koja se proučava kada se izračunavanje zasniva na negrupisanim statistikama, ili kada se svaka varijanta javlja samo jednom u populaciji. Ponderisani prosjeci se nazivaju vrijednostima koje uzimaju u obzir da opcije za vrijednosti neke karakteristike mogu imati različite brojeve, pa se stoga svaka opcija mora pomnožiti s odgovarajućom frekvencijom. Drugim riječima, svaka opcija je "vagana" svojom frekvencijom. Učestalost se naziva statistička težina.

jednostavna aritmetička sredina- najčešći tip medija. Ona je jednaka zbroju pojedinačnih karakterističnih vrijednosti podijeljenih s ukupnim brojem ovih vrijednosti:

,

gdje x 1 ,x 2 , … ,x N su pojedinačne vrijednosti varijabilne osobine (opcije), a N je broj jedinica populacije.

Aritmetički ponderisani prosjek koristi se kada su podaci predstavljeni u obliku distribucijskih serija ili grupa. Izračunava se kao zbroj proizvoda opcija i njihovih odgovarajućih frekvencija, podijeljen sa zbirom frekvencija svih opcija:

gdje x i- značenje i–th varijante obeležja; fi– frekvencija i-th opcije.

Dakle, svaka vrijednost varijante je ponderisana svojom frekvencijom, zbog čega se frekvencije ponekad nazivaju statističkim ponderima.

Komentar. Kada je u pitanju aritmetička sredina bez navođenja njenog tipa, misli se na prostu aritmetičku sredinu.

Tabela 12

Rješenje. Za izračun koristimo formulu aritmetičkog ponderiranog prosjeka:

Dakle, u proseku su dva okrivljena po krivičnom predmetu.

Ako se izračunavanje prosječne vrijednosti vrši prema podacima grupiranim u obliku nizova intervalne distribucije, tada prvo trebate odrediti srednje vrijednosti ​​​​​​​svakog intervala x"i, a zatim izračunati prosječnu vrijednost koristeći ponderisanu formula aritmetičke sredine, u kojoj je x" i zamijenjen umjesto x i.

Primjer. Podaci o starosti kriminalaca osuđenih za krađu prikazani su u tabeli:

Tabela 13

Odredite prosječnu starost kriminalaca osuđenih za krađu.

Rješenje. Da biste odredili prosječnu starost kriminalaca na osnovu serije varijacija intervala, prvo morate pronaći srednje vrijednosti intervala. Pošto je data intervalna serija sa otvorenim prvim i poslednjim intervalima, vrednosti ovih intervala se uzimaju jednake vrednostima susednih zatvorenih intervala. U našem slučaju, vrijednost prvog i posljednjeg intervala je 10.

Sada pronalazimo prosječnu starost kriminalaca koristeći formulu ponderirane aritmetičke sredine:

Dakle, prosječna starost počinitelja osuđenih za krađu je otprilike 27 godina.

Prosječan harmonik jednostavan je recipročna vrijednost aritmetičke sredine recipročnih vrijednosti značajke:

gdje je 1/ x i su recipročne vrijednosti varijanti, a N je broj jedinica populacije.

Primjer. U cilju utvrđivanja prosječnog godišnjeg opterećenja sudija okružnog suda prilikom razmatranja krivičnih predmeta, sprovedeno je istraživanje o opterećenosti 5 sudija ovog suda. Pokazalo se da je prosječno vrijeme provedeno na jednom krivičnom predmetu za svakog od ispitanih sudija jednako (u danima): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Pronađite prosječne troškove za jednog krivični predmet i prosječno godišnje opterećenje sudija ovog okružnog suda prilikom razmatranja krivičnih predmeta.

Rješenje. Da bismo odredili prosječno vrijeme provedeno na jednom krivičnom predmetu, koristimo harmonijsku jednostavnu formulu:

Da bismo pojednostavili izračune u primjeru, uzmimo broj dana u godini jednak 365, uključujući vikende (ovo ne utiče na metodu izračuna, a pri izračunavanju sličnog pokazatelja u praksi potrebno je zamijeniti broj radnih dana u određenoj godini umjesto 365 dana). Tada će prosječno godišnje opterećenje sudija ovog okružnog suda prilikom razmatranja krivičnih predmeta biti: 365 (dana): 5,56 ≈ 65,6 (predmeti).

Kada bismo koristili formulu jednostavne aritmetičke sredine da odredimo prosječno vrijeme provedeno na jednom krivičnom predmetu, dobili bismo:

365 (dana): 5,64 ≈ 64,7 (slučajevi), tj. prosječno opterećenje sudija bilo je manje.

Provjerimo valjanost ovog pristupa. Za to koristimo podatke o vremenu provedenom na jednom krivičnom predmetu za svakog sudiju i izračunavamo broj krivičnih predmeta koje svaki od njih razmatra godišnje.

Dobijamo shodno tome:

365 (dani) : 6 ≈ 61 (slučaj), 365 (dani) : 5,6 ≈ 65,2 (slučaj), 365 (dani) : 6,3 ≈ 58 (slučaj),

365 (dani) : 4,9 ≈ 74,5 (slučajevi), 365 (dani) : 5,4 ≈ 68 (slučajevi).

Sada izračunavamo prosječno godišnje opterećenje za sudije ovog okružnog suda prilikom razmatranja krivičnih predmeta:

One. prosječno godišnje opterećenje je isto kao i kada se koristi harmonijska sredina.

Dakle, upotreba aritmetičke sredine u ovom slučaju je nezakonita.

U slučajevima kada su poznate varijante neke karakteristike, njihove volumetrijske vrijednosti (proizvod varijanti sa frekvencijom), ali su same frekvencije nepoznate, primjenjuje se harmonijska ponderirana prosječna formula:

,

gdje x i su vrijednosti varijanti osobina, a w i su volumetrijske vrijednosti varijanti ( w i = x i f i).

Primjer. Podaci o cijeni jedinice iste vrste robe koju proizvode različite ustanove kazneno-popravnog sistema, te o obimu njene realizacije dati su u tabeli 14.

Tabela 14

Pronađite prosječnu prodajnu cijenu proizvoda.

Rješenje. Prilikom izračunavanja prosječne cijene moramo koristiti omjer prodanog iznosa i broja prodanih jedinica. Ne znamo broj prodatih jedinica, ali znamo količinu prodaje robe. Stoga, da bismo pronašli prosječnu cijenu prodate robe, koristimo formulu harmonijskog ponderiranog prosjeka. Dobijamo

Ako ovdje koristite formulu aritmetičke sredine, možete dobiti prosječnu cijenu koja će biti nerealna:

Geometrijska sredina izračunava se izdvajanjem korijena stepena N iz proizvoda svih vrijednosti opcija značajke:

gdje x 1 ,x 2 , … ,x N su pojedinačne vrijednosti varijabilne osobine (opcije), i

N je broj populacijskih jedinica.

Ova vrsta prosjeka se koristi za izračunavanje prosječnih stopa rasta vremenskih serija.

srednji kvadratni korijen se koristi za izračunavanje standardne devijacije, koja je indikator varijacije, a o njoj će se govoriti u nastavku.

Za utvrđivanje strukture stanovništva koriste se posebni prosjeci, koji uključuju medijana i moda , ili takozvani strukturni proseci. Ako se aritmetička sredina izračunava na osnovu upotrebe svih varijanti vrijednosti atributa, tada medijan i mod karakteriziraju vrijednost varijante koja zauzima određenu prosječnu poziciju u rangiranoj (uređenoj) seriji. Redoslijed jedinica statističke populacije može se vršiti uzlaznim ili silaznim redoslijedom varijanti osobine koja se proučava.

medijana (ja) je vrijednost koja odgovara varijanti u sredini rangirane serije. Dakle, medijan je ona varijanta rangiranog niza, na čijem obje strane u ovom nizu treba biti jednak broj jedinica stanovništva.

Da biste pronašli medijan, prvo morate odrediti njegov serijski broj u rangiranoj seriji koristeći formulu:

gdje je N volumen serije (broj jedinica stanovništva).

Ako se niz sastoji od neparnog broja članova, tada je medijan jednak varijanti sa brojem N Me. Ako se niz sastoji od parnog broja članova, tada se medijan definira kao aritmetička sredina dvije susjedne opcije koje se nalaze u sredini.

Primjer. Za rangiranu seriju 1, 2, 3, 3, 6, 7, 9, 9, 10. Obim serije je N = 9, što znači N Me = (9 + 1) / 2 = 5. Dakle, Me = 6, tj. peta opcija. Ako je red dat 1, 5, 7, 9, 11, 14, 15, 16, tj. niz sa parnim brojem članova (N = 8), tada je N Me = (8 + 1) / 2 = 4,5. Dakle, medijan je jednak polovini zbira četvrte i pete opcije, tj. Ja = (9 + 11) / 2 = 10.

U seriji diskretnih varijacija, medijan je određen akumuliranim frekvencijama. Varijantne frekvencije, počevši od prve, se zbrajaju sve dok se ne prekorači srednji broj. Vrijednost zadnjih zbrojenih opcija bit će medijana.

Primjer. Pronađite medijan broja optuženih po krivičnom predmetu koristeći podatke u tabeli 12.

Rješenje. U ovom slučaju, volumen serije varijacija je N = 154, dakle, N Me = (154 + 1) / 2 = 77,5. Sumirajući frekvencije prve i druge opcije, dobijamo: 75 + 43 = 118, tj. premašili smo srednji broj. Dakle, ja = 2.

U nizu varijacije intervala distribucije, prvo označite interval u kojem će se nalaziti medijan. On je zvao medijana . Ovo je prvi interval čija kumulativna frekvencija prelazi polovinu volumena serije varijacije intervala. Tada se numerička vrijednost medijane određuje formulom:

gdje x Me je donja granica srednjeg intervala; i je vrijednost srednjeg intervala; S Me-1 je kumulativna frekvencija intervala koji prethodi medijani; f Me je frekvencija srednjeg intervala.

Primjer. Pronađite srednju starost prestupnika osuđenih za krađu, na osnovu statistike predstavljene u Tabeli 13.

Rješenje. Statistički podaci su predstavljeni nizom varijacije intervala, što znači da prvo odredimo srednji interval. Obim populacije N = 162, dakle, srednji interval je interval 18-28, jer ovo je prvi interval, čija akumulirana frekvencija (15 + 90 = 105) premašuje polovinu volumena (162: 2 = 81) serije varijacije intervala. Sada je numerička vrijednost medijane određena gornjom formulom:

Tako je polovina osuđenih za krađu mlađa od 25 godina.

moda (pon.) imenovati vrijednost atributa, koji se najčešće nalazi u jedinicama populacije. Moda se koristi za identifikaciju vrijednosti osobine koja ima najveću distribuciju. Za diskretnu seriju, režim će biti varijanta sa najvećom frekvencijom. Na primjer, za diskretnu seriju prikazanu u tabeli 3 Mo= 1, pošto ova vrijednost opcija odgovara najvišoj frekvenciji - 75. Da biste odredili način intervalne serije, prvo odredite modalni interval (interval sa najvećom frekvencijom). Zatim se unutar ovog intervala pronađe vrijednost karakteristike, koja može biti mod.

Njegova vrijednost se nalazi po formuli:

gdje x Mo je donja granica modalnog intervala; i je vrijednost modalnog intervala; f Mo je frekvencija modalnog intervala; f Mo-1 je frekvencija intervala koji prethodi modalnom; f Mo+1 je frekvencija intervala nakon modalnog.

Primjer. Pronađite starosnu dob kriminalaca osuđenih za krađu, podaci o kojima su prikazani u tabeli 13.

Rješenje. Najviša frekvencija odgovara intervalu 18-28, stoga mod mora biti u ovom intervalu. Njegova vrijednost je određena gornjom formulom:

Dakle, najveći broj kriminalaca osuđenih za krađe ima 24 godine.

Prosječna vrijednost daje generalizirajuću karakteristiku ukupnosti fenomena koji se proučava. Međutim, dvije populacije s istim srednjim vrijednostima mogu se značajno razlikovati jedna od druge u smislu stupnja fluktuacije (varijacije) u vrijednosti proučavane osobine. Na primjer, na jednom sudu su određene kazne zatvora: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 godina, au drugom - 5, 5, 6, 6, 7, 7 godina. , 7 , 8, 8, 8 godina. U oba slučaja, aritmetička sredina je 6,7 godina. Međutim, ovi agregati se međusobno značajno razlikuju u širenju pojedinačnih vrijednosti određene kazne zatvora u odnosu na prosječnu vrijednost.

A za prvi sud, gde je ova varijacija prilično velika, prosečna zatvorska kazna ne odražava dobro celokupnu populaciju. Dakle, ako se pojedinačne vrijednosti atributa malo razlikuju jedna od druge, tada će aritmetička sredina biti prilično indikativna karakteristika svojstava ove populacije. U suprotnom će aritmetička sredina biti nepouzdana karakteristika ove populacije i njena primjena u praksi je neefikasna. Stoga je potrebno uzeti u obzir varijacije u vrijednostima proučavane osobine.

Varijacija- to su razlike u vrijednostima osobine u različitim jedinicama date populacije u istom periodu ili trenutku. Izraz "varijacija" je latinskog porijekla - variatio, što znači razlika, promjena, fluktuacija. Nastaje kao rezultat činjenice da se pojedinačne vrijednosti atributa formiraju pod kombiniranim utjecajem različitih faktora (uvjeta), koji se u svakom pojedinačnom slučaju kombiniraju na različite načine. Za mjerenje varijacije osobine koriste se različiti apsolutni i relativni indikatori.

Glavni pokazatelji varijacije uključuju sljedeće:

1) opseg varijacije;

2) prosečno linearno odstupanje;

3) disperzija;

4) standardna devijacija;

5) koeficijent varijacije.

Hajde da se ukratko zadržimo na svakom od njih.

Varijacija raspona R je najpristupačniji apsolutni indikator u smislu lakoće izračuna, koji se definira kao razlika između najveće i najmanje vrijednosti atributa za jedinice ove populacije:

Opseg varijacije (opseg fluktuacija) je važan pokazatelj varijabilnosti neke karakteristike, ali omogućava da se vide samo ekstremna odstupanja, što ograničava njen opseg. Za precizniju karakterizaciju varijacije osobine na osnovu njene fluktuacije, koriste se drugi indikatori.

Prosječna linearna devijacija predstavlja aritmetičku sredinu apsolutnih vrijednosti odstupanja pojedinačnih vrijednosti osobine od srednje vrijednosti i određuje se po formulama:

1) za negrupisani podaci

2) za varijantne serije

Međutim, najčešće korištena mjera varijacije je disperzija . Karakterizira mjeru širenja vrijednosti proučavane osobine u odnosu na njenu prosječnu vrijednost. Varijanca je definirana kao prosjek kvadrata odstupanja.

jednostavna varijansa za negrupirane podatke:

.

Ponderisana varijansa za seriju varijacija:

Komentar. U praksi je bolje koristiti sljedeće formule za izračunavanje varijanse:

Za jednostavnu varijantu

.

Za ponderisanu varijansu

Standardna devijacija je kvadratni korijen varijanse:

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je manja standardna devijacija, populacija je homogenija i aritmetička sredina bolje odražava cjelokupnu populaciju.

Gore razmatrane mjere disperzije (opseg varijacije, varijansa, standardna devijacija) su apsolutni indikatori po kojima nije uvijek moguće suditi o stepenu fluktuacije osobine. U nekim problemima potrebno je koristiti relativne indekse raspršenja, od kojih je jedan koeficijent varijacije.

Koeficijent varijacije- izraženo kao postotak omjera standardne devijacije i aritmetičke sredine:

Koeficijent varijacije se koristi ne samo za komparativnu procjenu varijacije različitih osobina ili iste osobine u različitim populacijama, već i za karakterizaciju homogenosti populacije. Statistička populacija se smatra kvantitativno homogenom ako koeficijent varijacije ne prelazi 33% (za raspodjele bliske normalnoj).

Primjer. O rokovima zatvora za 50 osuđenika dostavljenih na izdržavanje kazne izrečene po sudu u vaspitno-popravnom zavodu kazneno-popravnog sistema postoje podaci: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Konstruirajte distribucijsku seriju prema uslovima zatvora.

2. Pronađite srednju vrijednost, varijansu i standardnu ​​devijaciju.

3. Izračunati koeficijent varijacije i izvesti zaključak o homogenosti ili heterogenosti proučavane populacije.

Rješenje. Za konstruiranje diskretne serije distribucije potrebno je odrediti varijante i frekvencije. Opcija u ovom problemu je zatvorska kazna, a učestalost je broj pojedinačnih opcija. Nakon izračunavanja frekvencija, dobijamo sljedeće diskretne serije distribucije:

Pronađite srednju vrijednost i varijansu. Budući da su statistički podaci predstavljeni diskretnim varijacionim nizom, za njihovo izračunavanje koristićemo formule aritmetičkog ponderisanog prosjeka i varijanse. Dobijamo:

= = 4,1;

= 5,21.

Sada izračunavamo standardnu ​​devijaciju:

Nalazimo koeficijent varijacije:

Shodno tome, statistička populacija je kvantitativno heterogena.

jednostavna aritmetička sredina

Prosječne vrijednosti

Prosječne vrijednosti se široko koriste u statistici.

prosječna vrijednost- ovo je generalizirajući indikator u kojem se nalazi izraz djelovanja općih uslova, obrazaca razvoja fenomena koji se proučava.

Statistički prosjeci se izračunavaju na osnovu masovnih podataka ispravno statistički organizovanog posmatranja (kontinuirano i uzorkovano). Međutim, statistički prosjek će biti objektivan i tipičan ako se izračuna iz masovnih podataka za kvalitativno homogenu populaciju (masovne pojave). Na primjer, ako izračunamo prosječnu platu u akcionarskim društvima i državnim preduzećima, pa rezultat proširimo na cijelu populaciju, onda je prosjek fiktivan, jer se računa na heterogenu populaciju, a takav prosjek gubi sve značenje.

Uz pomoć prosjeka postoji, takoreći, izglađivanje razlika u veličini obilježja koje nastaju iz ovog ili onog razloga u pojedinačnim jedinicama promatranja.

Na primjer, prosječan učinak pojedinačnog prodavca zavisi od mnogih faktora: kvalifikacije, dužina radnog staža, godine, oblik usluge, zdravlje itd. Prosječan učinak odražava opšte karakteristike cjelokupne populacije.

Prosječna vrijednost se mjeri u istim jedinicama kao i sama karakteristika.

Svaka prosječna vrijednost karakterizira proučavanu populaciju prema bilo kojem atributu. Da bi se dobila potpuna i sveobuhvatna slika populacije koja se proučava u smislu niza bitnih karakteristika, potrebno je imati sistem prosječnih vrijednosti koji može opisati fenomen iz različitih uglova.

Postoje različite vrste prosjeka:

    aritmetička sredina;

    prosječni harmonik;

    geometrijska sredina;

    srednji kvadratni korijen;

    prosečan kubik.

Prosjeci svih gore navedenih tipova, zauzvrat, podijeljeni su na jednostavne (neponderisane) i ponderisane.

Razmotrite vrste prosjeka koji se koriste u statistici.

Prosta aritmetička sredina (neponderisana) jednaka je zbroju pojedinačnih vrijednosti karakteristike, podijeljenom sa brojem ovih vrijednosti.

Odvojene vrijednosti karakteristike nazivaju se varijante i označavaju se sa h i (
); broj populacijskih jedinica je označen sa n, a prosečna vrednost obeležja - sa . Dakle, jednostavna aritmetička sredina je:

ili

Primjer 1 Tabela 1

Podaci o proizvodnji proizvoda A po radnicima po smjeni

U ovom primjeru, varijabilni atribut je puštanje proizvoda po smjeni.

Numeričke vrijednosti atributa (16, 17, itd.) nazivaju se opcijama. Odredimo prosječnu proizvodnju proizvoda radnika ove grupe:

PCS.

Jednostavna aritmetička sredina koristi se u slučajevima kada postoje pojedinačne vrijednosti neke karakteristike, tj. podaci nisu grupisani. Ako su podaci prikazani u obliku distributivnih serija ili grupa, onda se prosjek izračunava drugačije.

Aritmetički ponderisani prosjek

Aritmetički ponderisani prosjek jednak je zbiru proizvoda svake pojedinačne vrijednosti atributa (opcije) na odgovarajuću frekvenciju, podijeljen sa zbirom svih frekvencija.

Broj identičnih vrijednosti karakteristika u seriji distribucije naziva se frekvencija ili težina i označava se sa f i .

U skladu s tim, aritmetički ponderisani prosjek izgleda ovako:

ili

Iz formule se vidi da prosjek ne zavisi samo od vrijednosti atributa, već i od njihovih frekvencija, tj. na sastav stanovništva, na njegovu strukturu.

Primjer 2 tabela 2

Podaci o platama radnika

Prema podacima serije diskretne distribucije, može se vidjeti da se iste vrijednosti atributa (opcija) ponavljaju više puta. Dakle, varijanta x 1 se pojavljuje u zbiru 2 puta, a varijanta x 2 - 6 puta, itd.

Izračunajte prosječnu platu po radniku:

Fond zarada za svaku grupu radnika jednak je umnošku opcija i učestalosti (
), a zbir ovih proizvoda daje ukupan fond zarada svih radnika (
).

Ako bi se izračunavanje vršilo po jednostavnoj formuli aritmetičkog prosjeka, prosječna zarada bi bila 3.000 rubalja. (). Upoređujući dobijeni rezultat sa početnim podacima, očigledno je da bi prosečna plata trebalo da bude znatno veća (više od polovine radnika prima platu iznad 3.000 rubalja). Stoga će izračunavanje proste aritmetičke sredine u takvim slučajevima biti pogrešno.

Statistički materijal kao rezultat obrade može se prikazati ne samo u obliku diskretnih distribucijskih serija, već iu obliku intervalnih varijacionih serija sa zatvorenim ili otvorenim intervalima.

Razmotrimo izračun aritmetičke sredine za takve serije.

Prosjek je:

Zlo

Zlo- numerička karakteristika skupa brojeva ili funkcija; - neki broj zatvoren između najmanje i najveće njihove vrijednosti.

  • 1 Osnovne informacije
  • 2 Hijerarhija sredstava u matematici
  • 3 U teoriji vjerovatnoće i statistici
  • 4 Vidi također
  • 5 Napomene

Osnovne informacije

Polazna tačka za formiranje teorije prosjeka bilo je proučavanje proporcija Pitagorine škole. Istovremeno, nije napravljena stroga razlika između pojmova prosjeka i proporcije. Značajan podsticaj razvoju teorije proporcija sa aritmetičke tačke gledišta dali su grčki matematičari - Nikomah iz Gerasa (kraj I - početak II veka nove ere) i Papus iz Aleksandrije (III vek nove ere). Prva faza u razvoju koncepta prosjeka je faza kada se prosjek počeo smatrati centralnim članom kontinuirane proporcije. Ali koncept srednje vrednosti kao centralne vrednosti progresije ne omogućava izvođenje koncepta srednje vrednosti u odnosu na niz od n članova, bez obzira na redosled kojim se oni slede. U tu svrhu potrebno je pribjeći formalnoj generalizaciji prosjeka. Sljedeća faza je prijelaz sa kontinuiranih proporcija na progresije - aritmetičke, geometrijske i harmonijske.

U istoriji statistike, po prvi put, široka upotreba prosjeka povezana je sa imenom engleskog naučnika W. Pettyja. W. Petty je bio jedan od prvih koji je pokušao prosječnoj vrijednosti dati statističko značenje, povezujući je sa ekonomskim kategorijama. Ali Petty nije dao opis koncepta prosječne vrijednosti, njene alokacije. A. Quetelet se smatra osnivačem teorije prosjeka. Bio je jedan od prvih koji je dosljedno razvijao teoriju prosjeka, pokušavajući da za nju donese matematičku osnovu. A. Quetelet je izdvojio dve vrste proseka – stvarne i aritmetičke proseke. Pravilno prosjeci predstavljaju stvar, broj, stvarno postojeću. Zapravo, proseci ili statistički proseci treba da budu izvedeni iz fenomena istog kvaliteta, identičnih po svom unutrašnjem značaju. Aritmetički prosjeci su brojevi koji daju najbližu moguću predstavu o mnogim brojevima, različitim, iako homogenim.

Svaki tip prosjeka može biti ili jednostavan prosjek ili ponderirani prosjek. Ispravnost izbora prosječne forme proizlazi iz materijalne prirode predmeta proučavanja. Jednostavne formule prosjeka se koriste ako se pojedinačne vrijednosti prosječne karakteristike ne ponavljaju. Kada se u praktičnim studijama pojedinačne vrijednosti ispitivane osobine javljaju nekoliko puta u jedinicama populacije koja se proučava, tada je učestalost ponavljanja vrijednosti pojedinačnih osobina prisutna u formulama za proračun prosječnih vrijednosti. U ovom slučaju, one se nazivaju ponderiranim prosječnim formulama.

Wikimedia Foundation. 2010.

prosječna vrijednost- ovo je generalizirajući pokazatelj koji karakteriše kvalitativno homogenu populaciju prema određenom kvantitativnom atributu. Na primjer, prosječna starost osoba osuđenih za krađu.

U pravosudnoj statistici, prosjeci se koriste za karakterizaciju:

Prosječni rokovi razmatranja predmeta ove kategorije;

Zahtjev srednje veličine;

Prosječan broj optuženih po predmetu;

Prosječan iznos štete;

Prosječno opterećenje sudija itd.

Prosječna vrijednost je uvijek imenovana i ima istu dimenziju kao atribut posebne jedinice populacije. Svaka prosječna vrijednost karakterizira proučavanu populaciju prema bilo kojem promjenjivom atributu, pa se iza svakog prosjeka nalazi niz distribucije jedinica ove populacije prema proučavanom atributu. Izbor vrste prosjeka određen je sadržajem indikatora i početnim podacima za izračunavanje prosjeka.

Sve vrste prosjeka koji se koriste u statističkim studijama spadaju u dvije kategorije:

1) proseci snage;

2) strukturni proseci.

Prva kategorija prosjeka uključuje: aritmetička sredina, harmonijska sredina, geometrijska sredina i srednji kvadratni korijen . Druga kategorija je moda i medijana. Štaviše, svaki od navedenih tipova proseka snage može imati dva oblika: jednostavno i ponderisano . Jednostavan oblik srednje vrijednosti koristi se za dobivanje srednje vrijednosti osobine koja se proučava kada se izračunavanje zasniva na negrupisanim statistikama, ili kada se svaka varijanta javlja samo jednom u populaciji. Ponderisani prosjeci se nazivaju vrijednostima koje uzimaju u obzir da opcije za vrijednosti neke karakteristike mogu imati različite brojeve, pa se stoga svaka opcija mora pomnožiti s odgovarajućom frekvencijom. Drugim riječima, svaka opcija je "vagana" svojom frekvencijom. Učestalost se naziva statistička težina.

jednostavna aritmetička sredina- najčešći tip medija. Ona je jednaka zbroju pojedinačnih karakterističnih vrijednosti podijeljenih s ukupnim brojem ovih vrijednosti:

gdje x 1 ,x 2 , … ,x N- pojedinačne vrijednosti varijabilnog atributa (opcije), i N - broj jedinica stanovništva.

Aritmetički ponderisani prosjek koristi se kada su podaci predstavljeni u obliku distribucijskih serija ili grupa. Izračunava se kao zbroj proizvoda opcija i njihovih odgovarajućih frekvencija, podijeljen sa zbirom frekvencija svih opcija:

gdje x i- značenje i-te varijante obilježja; fi- frekvencija i th opcije.

Dakle, svaka vrijednost varijante je ponderisana svojom frekvencijom, zbog čega se frekvencije ponekad nazivaju statističkim ponderima.


Komentar. Kada je u pitanju aritmetička sredina bez navođenja njenog tipa, misli se na prostu aritmetičku sredinu.

Tabela 12

Rješenje. Za izračun koristimo formulu aritmetičkog ponderiranog prosjeka:

Dakle, u proseku su dva okrivljena po krivičnom predmetu.

Ako se izračunavanje prosječne vrijednosti vrši prema podacima grupiranim u obliku nizova intervalne distribucije, tada prvo trebate odrediti srednje vrijednosti ​​​​​​​svakog intervala x"i, a zatim izračunati prosječnu vrijednost koristeći ponderisanu formula aritmetičke sredine, u kojoj je x" i zamijenjen umjesto x i.

Primjer. Podaci o starosti kriminalaca osuđenih za krađu prikazani su u tabeli:

Tabela 13

Odredite prosječnu starost kriminalaca osuđenih za krađu.

Rješenje. Da biste odredili prosječnu starost kriminalaca na osnovu serije varijacija intervala, prvo morate pronaći srednje vrijednosti intervala. Pošto je data intervalna serija sa otvorenim prvim i poslednjim intervalima, vrednosti ovih intervala se uzimaju jednake vrednostima susednih zatvorenih intervala. U našem slučaju, vrijednost prvog i posljednjeg intervala je 10.

Sada pronalazimo prosječnu starost kriminalaca koristeći formulu ponderirane aritmetičke sredine:

Dakle, prosječna starost počinitelja osuđenih za krađu je otprilike 27 godina.

Prosječan harmonik jednostavan je recipročna vrijednost aritmetičke sredine recipročnih vrijednosti značajke:

gdje je 1/ x i su recipročne vrijednosti opcija, a N je broj jedinica stanovništva.

Primjer. U cilju utvrđivanja prosječnog godišnjeg opterećenja sudija okružnog suda prilikom razmatranja krivičnih predmeta, sprovedeno je istraživanje o opterećenosti 5 sudija ovog suda. Pokazalo se da je prosječno vrijeme provedeno na jednom krivičnom predmetu za svakog od ispitanih sudija jednako (u danima): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Pronađite prosječne troškove za jednog krivični predmet i prosječno godišnje opterećenje sudija ovog okružnog suda prilikom razmatranja krivičnih predmeta.

Rješenje. Da bismo odredili prosječno vrijeme provedeno na jednom krivičnom predmetu, koristimo harmonijsku jednostavnu formulu:

Da bismo pojednostavili izračune u primjeru, uzmimo broj dana u godini jednak 365, uključujući vikende (ovo ne utiče na metodu izračuna, a pri izračunavanju sličnog pokazatelja u praksi potrebno je zamijeniti broj radnih dana u određenoj godini umjesto 365 dana). Tada će prosječno godišnje opterećenje sudija ovog okružnog suda prilikom razmatranja krivičnih predmeta biti: 365 (dana): 5,56 ≈ 65,6 (predmeti).

Kada bismo koristili formulu jednostavne aritmetičke sredine da odredimo prosječno vrijeme provedeno na jednom krivičnom predmetu, dobili bismo:

365 (dana): 5,64 ≈ 64,7 (slučajevi), tj. prosječno opterećenje sudija bilo je manje.

Provjerimo valjanost ovog pristupa. Za to koristimo podatke o vremenu provedenom na jednom krivičnom predmetu za svakog sudiju i izračunavamo broj krivičnih predmeta koje svaki od njih razmatra godišnje.

Dobijamo shodno tome:

365 (dani) : 6 ≈ 61 (slučaj), 365 (dani) : 5,6 ≈ 65,2 (slučaj), 365 (dani) : 6,3 ≈ 58 (slučaj),

365 (dani) : 4,9 ≈ 74,5 (slučajevi), 365 (dani) : 5,4 ≈ 68 (slučajevi).

Sada izračunavamo prosječno godišnje opterećenje za sudije ovog okružnog suda prilikom razmatranja krivičnih predmeta:

One. prosječno godišnje opterećenje je isto kao i kada se koristi harmonijska sredina.

Dakle, upotreba aritmetičke sredine u ovom slučaju je nezakonita.

U slučajevima kada su poznate varijante neke karakteristike, njihove volumetrijske vrijednosti (proizvod varijanti sa frekvencijom), ali su same frekvencije nepoznate, primjenjuje se harmonijska ponderirana prosječna formula:

,

gdje x i su vrijednosti opcija osobina, a w i su volumetrijske vrijednosti opcija ( w i = x i f i).

Primjer. Podaci o cijeni jedinice iste vrste robe koju proizvode različite ustanove kazneno-popravnog sistema, te o obimu njene realizacije dati su u tabeli 14.

Tabela 14

Pronađite prosječnu prodajnu cijenu proizvoda.

Rješenje. Prilikom izračunavanja prosječne cijene moramo koristiti omjer prodanog iznosa i broja prodanih jedinica. Ne znamo broj prodatih jedinica, ali znamo količinu prodaje robe. Stoga, da bismo pronašli prosječnu cijenu prodate robe, koristimo formulu harmonijskog ponderiranog prosjeka. Dobijamo

Ako ovdje koristite formulu aritmetičke sredine, možete dobiti prosječnu cijenu koja će biti nerealna:

Geometrijska sredina izračunava se izdvajanjem korijena stepena N iz proizvoda svih vrijednosti opcija značajke:

,

gdje x 1 ,x 2 , … ,x N- pojedinačne vrijednosti varijabilne osobine (opcije), i

N- broj populacijskih jedinica.

Ova vrsta prosjeka se koristi za izračunavanje prosječnih stopa rasta vremenskih serija.

srednji kvadratni korijen se koristi za izračunavanje standardne devijacije, koja je indikator varijacije, a o njoj će se govoriti u nastavku.

Za utvrđivanje strukture stanovništva koriste se posebni prosjeci, koji uključuju medijana i moda , ili takozvani strukturni proseci. Ako se aritmetička sredina izračunava na osnovu upotrebe svih varijanti vrijednosti atributa, tada medijan i mod karakteriziraju vrijednost varijante koja zauzima određenu prosječnu poziciju u rangiranoj (uređenoj) seriji. Redoslijed jedinica statističke populacije može se vršiti uzlaznim ili silaznim redoslijedom varijanti osobine koja se proučava.

medijana (ja) je vrijednost koja odgovara varijanti u sredini rangirane serije. Dakle, medijan je ona varijanta rangiranog niza, na čijem obje strane u ovom nizu treba biti jednak broj jedinica stanovništva.

Da biste pronašli medijan, prvo morate odrediti njegov serijski broj u rangiranoj seriji koristeći formulu:

gdje je N volumen serije (broj jedinica stanovništva).

Ako se niz sastoji od neparnog broja članova, tada je medijan jednak varijanti sa brojem N Me. Ako se niz sastoji od parnog broja članova, tada se medijan definira kao aritmetička sredina dvije susjedne opcije koje se nalaze u sredini.

Primjer. Za rangiranu seriju 1, 2, 3, 3, 6, 7, 9, 9, 10. Obim serije je N = 9, što znači N Me = (9 + 1) / 2 = 5. Dakle, Me = 6, tj. peta opcija. Ako je red dat 1, 5, 7, 9, 11, 14, 15, 16, tj. niz sa parnim brojem članova (N = 8), tada je N Me = (8 + 1) / 2 = 4,5. Dakle, medijan je jednak polovini zbira četvrte i pete opcije, tj. Ja = (9 + 11) / 2 = 10.

U seriji diskretnih varijacija, medijan je određen akumuliranim frekvencijama. Varijantne frekvencije, počevši od prve, se zbrajaju sve dok se ne prekorači srednji broj. Vrijednost zadnjih zbrojenih opcija bit će medijana.

Primjer. Pronađite medijan broja optuženih po krivičnom predmetu koristeći podatke u tabeli 12.

Rješenje. U ovom slučaju, volumen serije varijacija je N = 154, dakle, N Me = (154 + 1) / 2 = 77,5. Sumirajući frekvencije prve i druge opcije, dobijamo: 75 + 43 = 118, tj. premašili smo srednji broj. Dakle, ja = 2.

U nizu varijacije intervala distribucije, prvo označite interval u kojem će se nalaziti medijan. On je zvao medijana . Ovo je prvi interval čija kumulativna frekvencija prelazi polovinu volumena serije varijacije intervala. Tada se numerička vrijednost medijane određuje formulom:

gdje x Me- donja granica srednjeg intervala; i - vrijednost srednjeg intervala; S Me-1- akumulirana frekvencija intervala koji prethodi medijani; f Me- frekvencija srednjeg intervala.

Primjer. Pronađite srednju starost prestupnika osuđenih za krađu, na osnovu statistike predstavljene u Tabeli 13.

Rješenje. Statistički podaci su predstavljeni nizom varijacije intervala, što znači da prvo odredimo srednji interval. Obim populacije N = 162, dakle, srednji interval je interval 18-28, jer ovo je prvi interval, čija akumulirana frekvencija (15 + 90 = 105) premašuje polovinu volumena (162: 2 = 81) serije varijacije intervala. Sada je numerička vrijednost medijane određena gornjom formulom:

Tako je polovina osuđenih za krađu mlađa od 25 godina.

moda (pon.) imenovati vrijednost atributa, koji se najčešće nalazi u jedinicama populacije. Moda se koristi za identifikaciju vrijednosti osobine koja ima najveću distribuciju. Za diskretnu seriju, režim će biti varijanta sa najvećom frekvencijom. Na primjer, za diskretnu seriju prikazanu u tabeli 3 Mo= 1, pošto ova vrijednost opcija odgovara najvišoj frekvenciji - 75. Da biste odredili način intervalne serije, prvo odredite modalni interval (interval sa najvećom frekvencijom). Zatim se unutar ovog intervala pronađe vrijednost karakteristike, koja može biti mod.

Njegova vrijednost se nalazi po formuli:

gdje x Mo- donja granica modalnog intervala; i - vrijednost modalnog intervala; f Mo- frekvencija modalnog intervala; f Mo-1- učestalost intervala koji prethodi modalnom; f Mo+1- učestalost intervala nakon modalnog.

Primjer. Pronađite starosnu dob kriminalaca osuđenih za krađu, podaci o kojima su prikazani u tabeli 13.

Rješenje. Najviša frekvencija odgovara intervalu 18-28, stoga mod mora biti u ovom intervalu. Njegova vrijednost je određena gornjom formulom:

Dakle, najveći broj kriminalaca osuđenih za krađe ima 24 godine.

Prosječna vrijednost daje generalizirajuću karakteristiku ukupnosti fenomena koji se proučava. Međutim, dvije populacije s istim srednjim vrijednostima mogu se značajno razlikovati jedna od druge u smislu stupnja fluktuacije (varijacije) u vrijednosti proučavane osobine. Na primjer, na jednom sudu su određene kazne zatvora: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 godina, au drugom - 5, 5, 6, 6, 7, 7 godina. , 7 , 8, 8, 8 godina. U oba slučaja, aritmetička sredina je 6,7 godina. Međutim, ovi agregati se međusobno značajno razlikuju u širenju pojedinačnih vrijednosti određene kazne zatvora u odnosu na prosječnu vrijednost.

A za prvi sud, gde je ova varijacija prilično velika, prosečna zatvorska kazna ne odražava dobro celokupnu populaciju. Dakle, ako se pojedinačne vrijednosti atributa malo razlikuju jedna od druge, tada će aritmetička sredina biti prilično indikativna karakteristika svojstava ove populacije. U suprotnom će aritmetička sredina biti nepouzdana karakteristika ove populacije i njena primjena u praksi je neefikasna. Stoga je potrebno uzeti u obzir varijacije u vrijednostima proučavane osobine.

Varijacija- to su razlike u vrijednostima karakteristike u različitim jedinicama date populacije u istom periodu ili trenutku. Izraz "varijacija" je latinskog porijekla - variatio, što znači razlika, promjena, fluktuacija. Nastaje kao rezultat činjenice da se pojedinačne vrijednosti atributa formiraju pod kombiniranim utjecajem različitih faktora (uvjeta), koji se u svakom pojedinačnom slučaju kombiniraju na različite načine. Za mjerenje varijacije osobine koriste se različiti apsolutni i relativni indikatori.

Glavni pokazatelji varijacije uključuju sljedeće:

1) opseg varijacije;

2) prosečno linearno odstupanje;

3) disperzija;

4) standardna devijacija;

5) koeficijent varijacije.

Hajde da se ukratko zadržimo na svakom od njih.

Varijacija raspona R je najpristupačniji apsolutni indikator u smislu lakoće izračuna, koji se definira kao razlika između najveće i najmanje vrijednosti atributa za jedinice ove populacije:

Raspon varijacije (raspon fluktuacija) je važan pokazatelj varijabilnosti osobine, ali omogućava uočavanje samo ekstremnih odstupanja, što ograničava njen opseg. Za precizniju karakterizaciju varijacije osobine na osnovu njene fluktuacije, koriste se drugi indikatori.

Prosječna linearna devijacija predstavlja aritmetičku sredinu apsolutnih vrijednosti odstupanja pojedinačnih vrijednosti osobine od srednje vrijednosti i određuje se po formulama:

1) za negrupisani podaci

2) za varijantne serije

Međutim, najčešće korištena mjera varijacije je disperzija . Karakterizira mjeru širenja vrijednosti proučavane osobine u odnosu na njenu prosječnu vrijednost. Varijanca je definirana kao prosjek kvadrata odstupanja.

jednostavna varijansa za negrupirane podatke:

.

Ponderisana varijansa za seriju varijacija:

Komentar. U praksi je bolje koristiti sljedeće formule za izračunavanje varijanse:

Za jednostavnu varijantu

.

Za ponderisanu varijansu

Standardna devijacija je kvadratni korijen varijanse:

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je manja standardna devijacija, populacija je homogenija i aritmetička sredina bolje odražava cjelokupnu populaciju.

Gore razmatrane mjere disperzije (opseg varijacije, varijansa, standardna devijacija) su apsolutni indikatori po kojima nije uvijek moguće suditi o stepenu fluktuacije osobine. U nekim problemima potrebno je koristiti relativne indekse raspršenja, od kojih je jedan koeficijent varijacije.

Koeficijent varijacije- izraženo kao postotak omjera standardne devijacije i aritmetičke sredine:

Koeficijent varijacije se koristi ne samo za komparativnu procjenu varijacije različitih osobina ili iste osobine u različitim populacijama, već i za karakterizaciju homogenosti populacije. Statistička populacija se smatra kvantitativno homogenom ako koeficijent varijacije ne prelazi 33% (za raspodjele bliske normalnoj).

Primjer. O rokovima zatvora za 50 osuđenika dostavljenih na izdržavanje kazne izrečene po sudu u vaspitno-popravnom zavodu kazneno-popravnog sistema postoje podaci: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Konstruirajte distribucijsku seriju prema uslovima zatvora.

2. Pronađite srednju vrijednost, varijansu i standardnu ​​devijaciju.

3. Izračunati koeficijent varijacije i izvesti zaključak o homogenosti ili heterogenosti proučavane populacije.

Rješenje. Za konstruiranje diskretne serije distribucije potrebno je odrediti varijante i frekvencije. Varijanta u ovom problemu je zatvorska kazna, a učestalost broj pojedinačnih varijanti. Nakon izračunavanja frekvencija, dobijamo sljedeće diskretne serije distribucije:

Pronađite srednju vrijednost i varijansu. Budući da su statistički podaci predstavljeni diskretnim varijacionim nizom, za njihovo izračunavanje koristićemo formule aritmetičkog ponderisanog prosjeka i varijanse. Dobijamo:

= = 4,1;

= 5,21.

Sada izračunavamo standardnu ​​devijaciju:

Nalazimo koeficijent varijacije:

Shodno tome, statistička populacija je kvantitativno heterogena.

U cilju analize i dobijanja statističkih zaključaka o rezultatu sumiranja i grupisanja, izračunavaju se generalizujući indikatori - prosječne i relativne vrijednosti.

Problem prosjeka - okarakterisati sve jedinice statističke populacije jednom vrijednošću atributa.

Prosječne vrijednosti karakteriziraju kvalitativne pokazatelje poduzetničke aktivnosti: troškove distribucije, profit, profitabilnost itd.

prosječna vrijednost- ovo je generalizirajuća karakteristika jedinica stanovništva prema nekom promjenjivom atributu.

Prosječne vrijednosti omogućavaju upoređivanje nivoa iste osobine u različitim populacijama i pronalaženje razloga za ova odstupanja.

U analizi fenomena koji se proučavaju, uloga prosječnih vrijednosti je ogromna. Engleski ekonomista W. Petty (1623-1687) je uveliko koristio prosjeke. V. Petty je želio da koristi prosječne vrijednosti kao mjeru troškova potrošnje na prosječni dnevni život jednog radnika. Stabilnost prosječne vrijednosti je odraz obrazaca procesa koji se proučavaju. Vjerovao je da se informacije mogu transformirati čak i ako nema dovoljno početnih podataka.

Engleski naučnik G. King (1648-1712) koristio je prosječne i relativne vrijednosti kada je analizirao podatke o stanovništvu Engleske.

Teorijski razvoj belgijskog statističara A. Queteleta (1796-1874) zasniva se na nekonzistentnosti prirode društvenih pojava - visoko stabilnih u masi, ali čisto individualnih.

Prema A. Queteletu, trajni uzroci djeluju na isti način na svaki fenomen koji se proučava i čine te pojave sličnim jedni drugima, stvaraju obrasce zajedničke za sve njih.

Posljedica učenja A. Queteleta bila je alokacija prosječnih vrijednosti kao glavne metode statističke analize. On je rekao da statistički prosjeci nisu kategorija objektivne realnosti.

A. Quetelet je izrazio svoje stavove o prosjeku u svojoj teoriji prosječne osobe. Prosječna osoba je osoba koja ima sve kvalitete u prosječnoj veličini (prosječan mortalitet ili natalitet, prosječna visina i težina, prosječna brzina trčanja, prosječna sklonost braku i samoubistvu, dobrim djelima itd.). Za A. Queteleta, prosječna osoba je ideal osobe. Nedosljednost teorije prosječnog čovjeka A. Quetelet-a dokazana je u ruskoj statističkoj literaturi krajem 19.-20. vijeka.

Poznati ruski statističar Yu. E. Yanson (1835-1893) napisao je da A. Quetelet pretpostavlja postojanje u prirodi tipa prosječne osobe kao nečeg datog, od čega je život odbacio prosječne ljude datog društva i određenom vremenu, a to ga dovodi do potpuno mehaničkog pogleda na zakone kretanja društvenog života: kretanje je postepeno povećanje prosječnih svojstava osobe, postupna obnova tipa; sledstveno tome, takvo nivelisanje svih manifestacija života društvenog tela, iza koje prestaje svako kretanje napred.

Suština ove teorije našla je svoj dalji razvoj u radovima brojnih statističkih teoretičara kao teorija pravih vrijednosti. A. Quetelet je imao sljedbenike - njemačkog ekonomistu i statističara W. Lexisa (1837-1914), koji je prenio teoriju pravih vrijednosti na ekonomske fenomene društvenog života. Njegova teorija je poznata kao teorija stabilnosti. Druga verzija idealističke teorije prosjeka zasnovana je na filozofiji

Njegov osnivač je engleski statističar A. Bowley (1869–1957), jedan od najistaknutijih teoretičara modernog doba u oblasti teorije prosjeka. Njegov koncept prosjeka izložen je u knjizi "Elementi statistike".

A. Bowley razmatra prosjeke samo sa kvantitativne strane, odvajajući na taj način kvantitet od kvaliteta. Određujući značenje prosječnih vrijednosti (ili "njihove funkcije"), A. Bowley iznosi mahistički princip mišljenja. A. Bowley je napisao da funkcija prosjeka treba da izrazi kompleksnu grupu

sa nekoliko prostih brojeva. Statističke podatke treba pojednostaviti, grupisati i usrednjavati.Ove stavove dijele i R. Fisher (1890-1968), J. Yule (1871-1951), Frederick S. Mills (1892) i drugi.

30-ih godina. 20ti vijek i narednih godina, prosječna vrijednost se smatra društveno značajnom karakteristikom, čiji informativni sadržaj zavisi od homogenosti podataka.

Najistaknutiji predstavnici italijanske škole R. Benini (1862-1956) i C. Gini (1884-1965), smatrajući statistiku granom logike, proširili su obim statističke indukcije, ali su povezivali kognitivne principe logike. i statistike sa prirodom proučavanih pojava, slijedeći tradiciju sociološkog tumačenja statistike.

U djelima K. Marxa i V. I. Lenjina posebna je uloga dodijeljena prosječnim vrijednostima.

K. Marx je tvrdio da se pojedinačna odstupanja od opšteg nivoa poništavaju u prosječnoj vrijednosti i prosječni nivo postaje generalizirajuća karakteristika fenomena mase.Prosječna vrijednost postaje takva karakteristika fenomena mase samo ako se uzme značajan broj jedinica. a ove jedinice su kvalitativno homogene. Marx je napisao da je pronađena prosječna vrijednost prosjek "... mnogo različitih individualnih vrijednosti iste vrste".

Prosječna vrijednost dobija poseban značaj u tržišnoj ekonomiji. Pomaže u određivanju neophodnog i opšteg, trenda zakonitosti ekonomskog razvoja direktno kroz pojedinačne i nasumične.

Prosječne vrijednosti su generalizirajući pokazatelji u kojima se izražava djelovanje općih uslova, pravilnost proučavane pojave.

Statistički prosjeci se izračunavaju na osnovu masovnih podataka statistički ispravno organiziranog masovnog posmatranja. Ako se statistički prosjek izračuna iz masovnih podataka za kvalitativno homogenu populaciju (masovne pojave), onda će biti objektivan.

Prosječna vrijednost je apstraktna, jer karakterizira vrijednost apstraktne jedinice.

Prosjek se apstrahuje iz raznolikosti karakteristika u pojedinačnim objektima. Apstrakcija je faza naučnog istraživanja. Dijalektičko jedinstvo pojedinačnog i opšteg ostvaruje se u prosječnoj vrijednosti.

Prosječne vrijednosti treba primijeniti na osnovu dijalektičkog razumijevanja kategorija pojedinačnog i opšteg, pojedinačnog i mase.

Srednji odražava nešto zajedničko što je zbrojeno u određenom pojedinačnom objektu.

Za identifikaciju obrazaca u masovnim društvenim procesima, prosječna vrijednost je od velike važnosti.

Odstupanje pojedinca od opšteg je manifestacija procesa razvoja.

Prosječna vrijednost odražava karakterističan, tipičan, stvarni nivo fenomena koji se proučava. Svrha prosjeka je karakteriziranje ovih nivoa i njihovih promjena u vremenu i prostoru.

Prosječni indikator je obična vrijednost, jer se formira u normalnim, prirodnim, općim uslovima za postojanje specifične masovne pojave, posmatrane kao cjeline.

Objektivno svojstvo statističkog procesa ili fenomena odražava prosječnu vrijednost.

Pojedinačne vrijednosti proučavane statističke karakteristike su različite za svaku jedinicu populacije. Prosječna vrijednost pojedinačnih vrijednosti jedne vrste je proizvod nužde, koji je rezultat kumulativnog djelovanja svih jedinica populacije, manifestiranog u masi nesreća koje se ponavljaju.

Neki pojedinačni fenomeni imaju znakove koji postoje u svim pojavama, ali u različitim količinama - to je visina ili starost osobe. Ostali znaci pojedinačne pojave kvalitativno su različiti u različitim pojavama, odnosno kod nekih su prisutni, a kod drugih se ne primjećuju (muškarac neće postati žena). Prosječna vrijednost se izračunava za znakove koji su kvalitativno homogeni i koji se razlikuju samo kvantitativno, a koji su svojstveni svim pojavama u datom skupu.

Prosječna vrijednost je odraz vrijednosti osobine koja se proučava i mjeri se u istoj dimenziji kao i ova osobina.

Teorija dijalektičkog materijalizma uči da se sve na svijetu mijenja i razvija. A također se mijenjaju znakovi koje karakteriziraju prosječne vrijednosti, a shodno tome i sami prosjeci.

Život je kontinuirani proces stvaranja nečeg novog. Nosilac novog kvaliteta su pojedinačni objekti, tada se broj tih objekata povećava, a novi postaje masovni, tipični.

Prosječna vrijednost karakteriše proučavanu populaciju samo po jednom osnovu. Za potpun i sveobuhvatan prikaz proučavane populacije za niz specifičnosti, potrebno je imati sistem prosječnih vrijednosti koji može opisati fenomen iz različitih uglova.

2. Vrste prosjeka

U statističkoj obradi materijala javljaju se različiti problemi koje je potrebno riješiti, pa se stoga u statističkoj praksi koriste različite prosječne vrijednosti. Matematička statistika koristi različite proseke, kao što su: aritmetički prosek; geometrijska sredina; prosječni harmonik; srednji kvadratni korijen.

Da bi se primijenio jedan od navedenih tipova prosjeka, potrebno je analizirati populaciju koja se proučava, utvrditi materijalni sadržaj fenomena koji se proučava, a sve se to radi na osnovu zaključaka dobijenih iz principa smislenosti rezultata. prilikom vaganja ili zbrajanja.

U proučavanju prosjeka koriste se sljedeći indikatori i oznake.

Kriterijum po kojem se nalazi prosjek se zove prosječna karakteristika i označava se sa x; naziva se vrijednost prosječne karakteristike za bilo koju jedinicu statističke populacije njegovo individualno značenje ili opcije, i označeno kao x 1 , X 2 , x 3 ,… X P ; učestalost je ponovljivost pojedinačnih vrijednosti osobine, označene slovom f.

Aritmetička sredina

Jedna od najčešćih vrsta medija aritmetička sredina, koji se izračunava kada se obim prosječnog atributa formira kao zbir njegovih vrijednosti za pojedinačne jedinice proučavane statističke populacije.

Da bi se izračunala aritmetička sredina, zbir svih nivoa karakteristika se deli sa njihovim brojem.


Ako se neke opcije javljaju nekoliko puta, tada se zbroj nivoa atributa može dobiti množenjem svakog nivoa sa odgovarajućim brojem jedinica populacije, nakon čega slijedi dodavanje rezultirajućih proizvoda, aritmetička sredina izračunata na ovaj način naziva se ponderirana aritmetika znači.

Formula za ponderisanu aritmetičku sredinu je sljedeća:


gdje su x i opcije,

f i - frekvencije ili težine.

Ponderisani prosjek treba koristiti u svim slučajevima kada varijante imaju različite količine.

Aritmetički prosjek, takoreći, ravnomjerno raspoređuje između pojedinačnih objekata ukupnu vrijednost atributa, koja u stvari varira za svaki od njih.

Izračunavanje prosječnih vrijednosti vrši se prema podacima grupiranim u obliku intervalnih serija raspodjele, kada su varijante osobina iz kojih se izračunava prosjek prikazane u obliku intervala (od - do).

Svojstva aritmetičke sredine:

1) aritmetička sredina zbira promjenljivih vrijednosti jednaka je zbiru aritmetičkih sredina: Ako je x i = y i + z i , tada


Ovo svojstvo pokazuje u kojim slučajevima je moguće sumirati prosječne vrijednosti.

2) algebarski zbir odstupanja pojedinačnih vrijednosti varijabilne karakteristike od srednje vrijednosti jednak je nuli, jer je zbir odstupanja u jednom smjeru nadoknađen zbirom odstupanja u drugom smjeru:


Ovo pravilo pokazuje da je srednja vrijednost rezultanta.

3) ako se sve varijante serije povećaju ili smanje za isti broj?, tada će se prosjek povećati ili smanjiti za isti broj?:


4) ako se sve varijante serije povećaju ili smanje za A puta, tada će se i prosjek povećati ili smanjiti za A puta:


5) peto svojstvo prosjeka nam pokazuje da ono ne zavisi od veličine pondera, već zavisi od odnosa između njih. Kao težine mogu se uzeti ne samo relativne, već i apsolutne vrijednosti.

Ako se sve frekvencije serije podijele ili pomnože sa istim brojem d, tada se prosjek neće promijeniti.


Prosječan harmonik. Za određivanje aritmetičke sredine potrebno je imati niz opcija i frekvencija, odnosno vrijednosti X i f.

Pretpostavimo da znamo pojedinačne vrijednosti karakteristike X i radi X/, i frekvencije f su nepoznati, onda, za izračunavanje prosjeka, označavamo proizvod = X/; gdje:



Prosjek u ovom obliku naziva se harmonijski ponderirani prosjek i označava se x šteta. vzvv.

Shodno tome, harmonijska sredina je identična aritmetičkoj sredini. Primjenjivo je kada stvarne težine nisu poznate. f, a proizvod je poznat fx = z

Kada radi fx jednaka ili jednaka jedinici (m = 1), koristi se harmonijska prosta sredina izračunata po formuli:


gdje X- odvojene opcije;

n- broj.

Geometrijska sredina

Ako postoji n faktora rasta, onda je formula za prosječni koeficijent:


Ovo je formula geometrijske sredine.

Geometrijska sredina jednaka je korijenu stepena n iz proizvoda koeficijenata rasta koji karakterišu odnos vrednosti svakog narednog perioda prema vrednosti prethodnog.

Ako su vrijednosti izražene kao kvadratne funkcije podložne usrednjavanju, koristi se srednji kvadrat. Na primjer, koristeći srednji kvadrat, možete odrediti promjere cijevi, kotača itd.

Prosti srednji kvadrat određuje se uzimanjem kvadratnog korijena količnika iz dijeljenja zbira kvadrata vrijednosti pojedinačnih karakteristika njihovim brojem.


Ponderisani srednji kvadrat je:

3. Strukturni prosjeci. Mod i medijan

Za karakterizaciju strukture statističke populacije koriste se indikatori koji se nazivaju strukturni proseci. To uključuje mod i medijan.

Moda (M o ) - najčešća opcija. Moda naziva se vrijednost karakteristike, koja odgovara maksimalnoj tački teorijske krivulje distribucije.

Režim predstavlja najčešću ili tipičnu vrijednost.

Moda se koristi u komercijalnoj praksi za proučavanje potražnje potrošača i rekordnih cijena.

U diskretnoj seriji, mod je varijanta sa najvećom frekvencijom. U nizu varijacija intervala, modom se smatra centralna varijanta intervala, koja ima najveću frekvenciju (posebnost).

Unutar intervala je potrebno pronaći vrijednost atributa, a to je mod.


gdje X o je donja granica modalnog intervala;

h je vrijednost modalnog intervala;

f m je frekvencija modalnog intervala;

f t-1 - frekvencija intervala koji prethodi modalnom;

f m+1 je frekvencija intervala nakon modalnog.

Način rada zavisi od veličine grupa, od tačnog položaja granica grupa.

Moda- broj koji se zapravo najčešće javlja (je određena vrijednost), u praksi ima najširu primjenu (najčešći tip kupca).

Medijan (M e- to je vrijednost koja dijeli broj uređenih varijacionih nizova na dva jednaka dijela: jedan dio ima vrijednosti varijabilnog svojstva koje su manje od prosječne varijante, a drugi je veliki.

Medijan je element koji je veći ili jednak i istovremeno manji ili jednak polovini preostalih elemenata serije distribucije.

Svojstvo medijane je da je zbir apsolutnih odstupanja vrijednosti osobine od medijane manji nego od bilo koje druge vrijednosti.

Korištenje medijane vam omogućava da dobijete preciznije rezultate od korištenja drugih oblika prosjeka.

Redoslijed pronalaženja medijane u nizu varijacija intervala je sljedeći: pojedinačne vrijednosti atributa raspoređujemo po rangu; odrediti akumulirane frekvencije za ovu rangiranu seriju; prema akumuliranim frekvencijama, nalazimo srednji interval:


gdje x me je donja granica srednjeg intervala;

i Ja je vrijednost srednjeg intervala;

f/2 je polovični zbir frekvencija serije;

S Ja-1 je zbir akumuliranih frekvencija koje prethode srednjem intervalu;

f Ja je frekvencija srednjeg intervala.

Medijan dijeli broj redova na pola, dakle, to je mjesto gdje je akumulirana frekvencija polovina ili više od polovine ukupnog broja frekvencija, a prethodna (kumulativna) frekvencija je manja od polovine populacije.

Najčešći oblik statističkih pokazatelja koji se koristi u socio-ekonomskim istraživanjima je prosječna vrijednost, koja je generalizovana kvantitativna karakteristika znaka statističke populacije. Prosječne vrijednosti su, takoreći, "predstavnici" čitavog niza zapažanja. U mnogim slučajevima, prosjek se može odrediti preko početnog omjera prosjeka (ISS) ili njegove logičke formule: . Tako, na primjer, da bi se izračunala prosječna zarada zaposlenih u preduzeću, potrebno je ukupan fond zarada podijeliti sa brojem zaposlenih: Brojač početnog omjera prosjeka je njegov određujući indikator. Za prosječnu platu, takav određujući indikator je fond zarada. Za svaki indikator koji se koristi u socio-ekonomskoj analizi, može se sastaviti samo jedan pravi referentni omjer za izračunavanje prosjeka. Treba dodati i to da u svrhu preciznije procjene standardne devijacije za male uzorke (sa brojem elemenata manjim od 30) nazivnik izraza ispod korijena ne bi trebao koristiti n, a n- 1.

Pojam i vrste prosjeka

Prosječna vrijednost- ovo je generalizirajući pokazatelj statističke populacije, koji gasi individualne razlike u vrijednostima statističkih veličina, omogućavajući vam da međusobno uporedite različite populacije. Postoji 2 klase prosječne vrijednosti: snaga i strukturna. Strukturni prosjeci su moda i medijana , ali najčešće korišteni proseci snage razne vrste.

Prosjeci snage

Prosjeci snage mogu biti jednostavno i ponderisano.

Jednostavan prosjek se izračunava kada postoje dvije ili više negrupisanih statističkih vrijednosti, raspoređenih proizvoljnim redoslijedom prema sljedećoj općoj formuli zakona prosječne snage (za različite vrijednosti k (m)):

Ponderirani prosjek se izračunava iz grupisanih statistika koristeći sljedeću opštu formulu:

Gdje je x - prosječna vrijednost fenomena koji se proučava; x i – i-ta varijanta prosečnog obeležja;

f i je težina i-te opcije.

gdje su X vrijednosti pojedinačnih statističkih vrijednosti ili sredine intervala grupisanja;
m - eksponent, o čijoj vrijednosti zavise sljedeće vrste prosječnih snaga:
pri m = -1 harmonska sredina;
za m = 0, geometrijska sredina;
za m = 1, aritmetička sredina;
kod m = 2, srednji kvadratni korijen;
pri m = 3, prosječna kubna.

Koristeći opšte formule za jednostavne i ponderisane proseke pri različitim eksponentima m, dobijamo posebne formule svakog tipa, o kojima će se detaljnije govoriti u nastavku.

Aritmetička sredina

Aritmetička sredina - početni trenutak prvog reda, matematičko očekivanje vrijednosti slučajne varijable s velikim brojem pokušaja;

Aritmetička sredina je najčešće korišćena prosečna vrednost, koja se dobija zamenom m = 1 u opštu formulu. Aritmetička sredina jednostavno ima sljedeći oblik:

ili

Gdje su X vrijednosti veličina za koje je potrebno izračunati prosječnu vrijednost; N je ukupan broj X vrijednosti (broj jedinica u proučavanoj populaciji).

Na primjer, student je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5. Izračunajmo prosječan rezultat koristeći jednostavnu formulu aritmetičke sredine: (3+4+4+5)/4 = 16/4 = 4. Aritmetička sredina ponderisano ima sljedeći oblik:

Gdje je f broj vrijednosti sa istom X vrijednošću (frekvencijom). >Na primjer, student je položio 4 ispita i dobio sljedeće ocjene: 3, 4, 4 i 5. Izračunajte prosječan rezultat koristeći aritmetičku ponderiranu prosječnu formulu: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4. Ako su vrijednosti X date kao intervali, tada se za proračune koriste sredine X intervala, koje su definirane kao polovina zbroja gornje i donje granice intervala. A ako interval X nema donju ili gornju granicu (otvoreni interval), tada se za pronalaženje koristi raspon (razlika između gornje i donje granice) susjednog intervala X. Na primer, u preduzeću ima 10 zaposlenih sa radnim iskustvom do 3 godine, 20 - sa radnim iskustvom od 3 do 5 godina, 5 zaposlenih - sa radnim iskustvom preko 5 godina. Zatim izračunavamo prosječan radni staž zaposlenih koristeći aritmetičku ponderiranu prosječnu formulu, uzimajući kao X sredinu intervala radnog staža (2, 4 i 6 godina): (2*10+4*20+6*5)/(10+20+5) = 3,71 godina.

AVERAGE funkcija

Ova funkcija izračunava prosjek (aritmetiku) svojih argumenata.

PROSJEČAN(broj1, broj2, ...)

Broj1, broj2, ... su 1 do 30 argumenata za koje se izračunava prosjek.

Argumenti moraju biti brojevi ili imena, nizovi ili reference koje sadrže brojeve. Ako argument, koji je niz ili veza, sadrži tekstove, logičke vrijednosti ili prazne ćelije, tada se te vrijednosti zanemaruju; međutim, ćelije koje sadrže nulte vrijednosti se broje.

AVERAGE funkcija

Izračunava aritmetičku sredinu vrijednosti navedenih u listi argumenata. Osim brojeva, u proračunu mogu učestvovati tekstualne i logičke vrijednosti, kao što su TRUE i FALSE.

AVERAGE(vrijednost1, vrijednost2,...)

Vrijednost1, vrijednost2,... su od 1 do 30 ćelija, raspona ćelija ili vrijednosti za koje se izračunava prosjek.

Argumenti moraju biti brojevi, imena, nizovi ili reference. Nizovi i veze koje sadrže tekst tumače se kao 0 (nula). Prazan tekst ("") tumači se kao 0 (nula). Argumenti koji sadrže vrijednost TRUE interpretiraju se kao 1, a argumenti koji sadrže vrijednost FALSE interpretiraju se kao 0 (nula).

Najčešće se koristi aritmetička sredina, ali postoje slučajevi kada su potrebne druge vrste prosjeka. Razmotrimo dalje takve slučajeve.

Prosječan harmonik

Harmonična sredina za određivanje prosječne sume recipročnih vrijednosti;

Prosječan harmonik koristi se kada izvorni podaci ne sadrže frekvencije f za pojedinačne vrijednosti X, već su predstavljeni kao njihov proizvod Xf. Označavajući Xf=w, izražavamo f=w/X, a zamjenom ovih oznaka u ponderiranu aritmetičku srednju formulu, dobijamo ponderiranu harmonijsku srednju formulu:

Dakle, harmonički ponderisani prosjek se koristi kada su frekvencije f nepoznate, ali je w=Xf poznato. U slučajevima kada se sve w=1, odnosno pojedinačne vrijednosti X javljaju 1 put, primjenjuje se harmonijska jednostavna srednja formula: ili Na primjer, automobil je išao od tačke A do tačke B brzinom od 90 km/h i nazad brzinom od 110 km/h. Da bismo odredili prosječnu brzinu, primjenjujemo harmonijsku jednostavnu formulu, budući da primjer daje udaljenost w 1 = w 2 (udaljenost od tačke A do tačke B je ista kao od B do A), koja je jednaka proizvodu brzine (X) i vremena (f). Prosječna brzina = (1+1)/(1/90+1/110) = 99 km/h.

SRHARM funkcija

Vraća harmonijsku sredinu skupa podataka. Harmonična sredina je recipročna vrijednost aritmetičke sredine recipročnih vrijednosti.

SGARM(broj1, broj2, ...)

Broj1, broj2, ... su 1 do 30 argumenata za koje se izračunava prosjek. Možete koristiti niz ili referencu niza umjesto argumenata razdvojenih tačkom i zarezom.

Harmonična sredina je uvijek manja od geometrijske sredine, koja je uvijek manja od aritmetičke sredine.

Geometrijska sredina

Geometrijska sredina za procjenu prosječne stope rasta slučajnih varijabli, pronalaženje vrijednosti karakteristike jednako udaljene od minimalne i maksimalne vrijednosti;

Geometrijska sredina koristi se za određivanje prosječnih relativnih promjena. Geometrijska srednja vrijednost daje najprecizniji rezultat usrednjavanja ako je zadatak pronaći takvu vrijednost X, koja bi bila jednako udaljena i od maksimalne i od minimalne vrijednosti X. Na primjer, između 2005. i 2008indeks inflacije u Rusiji je: 2005. godine - 1.109; u 2006. godini - 1.090; u 2007. godini - 1.119; u 2008. godini - 1.133. Budući da je indeks inflacije relativna promjena (dinamički indeks), tada trebate izračunati prosječnu vrijednost koristeći geometrijsku sredinu: (1,109 * 1,090 * 1,119 * 1,133) ^ (1/4) = 1,1126, odnosno za period od 2005. do 2008. godine cijene su rasle u prosjeku za 11,26%. Pogrešno izračunavanje aritmetičke sredine dalo bi netačan rezultat od 11,28%.

SRGEOM funkcija

Vraća geometrijsku sredinu niza ili raspona pozitivnih brojeva. Na primjer, funkcija CAGEOM se može koristiti za izračunavanje prosječne stope rasta ako je dat složeni prihod sa varijabilnim stopama.

SRGEOM(broj1; broj2; ...)

Broj1, broj2, ... su 1 do 30 argumenata za koje se izračunava geometrijska sredina. Možete koristiti niz ili referencu niza umjesto argumenata razdvojenih tačkom i zarezom.

srednji kvadratni korijen

Srednji kvadrat je početni trenutak drugog reda.

srednji kvadratni korijen koristi se kada početne vrijednosti X mogu biti i pozitivne i negativne, na primjer, pri izračunavanju prosječnih odstupanja. Glavna upotreba kvadratne sredine je mjerenje varijacije X vrijednosti.

Prosječan kubik

Prosječni kubik je početni trenutak trećeg reda.

Prosječan kubik koristi se izuzetno rijetko, na primjer, pri izračunavanju indeksa siromaštva za zemlje u razvoju (HPI-1) i za razvijene zemlje (HPI-2), koje predlažu i izračunavaju UN.

Počevši pričati o prosječnim vrijednostima, najčešće se prisjećaju kako su završili školu i ušli u obrazovnu ustanovu. Zatim je, prema certifikatu, izračunata prosječna ocjena: sve ocjene (i dobre i ne baš dobre) su se zbrajale, a rezultirajući iznos podijeljen je njihovim brojem. Tako se izračunava najjednostavniji tip prosjeka koji se naziva prostim aritmetičkim prosjekom. U praksi se u statistici koriste različite vrste prosjeka: aritmetički, harmonijski, geometrijski, kvadratni, strukturni prosjeki. Jedan ili drugi njihov tip se koristi u zavisnosti od prirode podataka i ciljeva studije.

prosječna vrijednost je najčešći statistički pokazatelj, uz pomoć kojeg se daje generalizirajuća karakteristika ukupnosti iste vrste pojava prema jednom od različitih znakova. Pokazuje nivo atributa po jedinici populacije. Uz pomoć prosječnih vrijednosti vrši se poređenje različitih agregata prema različitim karakteristikama i proučavaju se obrasci razvoja pojava i procesa društvenog života.

U statistici se koriste dvije klase prosjeka: moć (analitički) i strukturni. Potonji se koriste za karakterizaciju strukture varijacionih serija i o njima će se dalje raspravljati u Pogl. osam.

Grupa moćnih sredina uključuje aritmetičke, harmonijske, geometrijske, kvadratne. Pojedinačne formule za njihov proračun mogu se svesti na oblik koji je zajednički za sve prosječne snage, tj

gdje je m eksponent srednje vrijednosti: sa m = 1 dobijamo formulu za izračunavanje aritmetičke sredine, sa m = 0 - geometrijsku sredinu, m = -1 - harmonijsku sredinu, sa m = 2 - srednju kvadratnu ;

x i - opcije (vrijednosti koje uzima atribut);

fi - frekvencije.

Glavni uslov pod kojim se sredstva po stepenu mogu koristiti u statističkoj analizi je homogenost populacije, koja ne bi trebala sadržavati početne podatke koji se oštro razlikuju po svojoj kvantitativnoj vrijednosti (u literaturi se nazivaju anomalnom opservacijom).

Pokažimo važnost ovog stanja na sljedećem primjeru.

Primjer 6.1. Izračunajte prosječnu platu zaposlenih u malom preduzeću.

Tabela 6.1. Plate zaposlenih
br. p / str Plata, rub. br. p / str Plata, rub.
1 5 950 11 7 000
2 6 790 12 5 950
3 6 790 13 6 790
4 5 950 14 5 950
5 7 000 5 6 790
6 6 790 16 7 000
7 5 950 17 6 790
8 7 000 18 7 000
9 6 790 19 7 000
10 6 790 20 5 950

Da bi se izračunala prosečna plata, potrebno je zbrojiti zarade obračunate svim zaposlenima u preduzeću (tj. pronaći fond zarada) i podeliti sa brojem zaposlenih:


A sada dodajmo našoj ukupnosti samo jednu osobu (direktor ovog preduzeća), ali sa platom od 50.000 rubalja. U ovom slučaju, izračunati prosjek će biti potpuno drugačiji:

Kao što vidite, prelazi 7.000 rubalja, itd. veća je od svih vrijednosti obilježja, osim jednog jedinog zapažanja.

Da se ovakvi slučajevi u praksi ne bi dešavali, a prosjek ne bi izgubio smisao (u primjeru 6.1 više ne igra ulogu generalizirajuće karakteristike populacije, što bi trebalo da bude), pri izračunavanju prosjeka, anomalan, vanredna zapažanja treba ili isključiti iz analize i zatim učiniti populaciju homogenom, ili podijeliti populaciju u homogene grupe i izračunati prosječne vrijednosti za svaku grupu i analizirati ne ukupan prosjek, već prosječne grupe.

6.1. Aritmetička sredina i njena svojstva

Aritmetička sredina se izračunava ili kao prosta vrijednost ili kao ponderirana vrijednost.

Prilikom izračunavanja prosječne plaće prema tabeli primjera 6.1, sabrali smo sve vrijednosti atributa i podijelili s njihovim brojem. Zapisujemo tok naših proračuna u obliku formule za aritmetičku sredinu jednostavnog

gdje je x i - opcije (pojedinačne vrijednosti atributa);

n je broj jedinica u populaciji.

Primjer 6.2. Sada da grupišemo naše podatke iz tabele u primeru 6.1, itd. konstruirajmo diskretnu varijantnu seriju raspodjele radnika prema visini nadnica. Rezultati grupisanja prikazani su u tabeli.

Napišimo izraz za izračunavanje nivoa prosječne plaće u kompaktnijem obliku:

U primjeru 6.2 primijenjena je formula ponderirane aritmetičke sredine

gdje je f i - frekvencije koje pokazuju koliko puta se vrijednost karakteristike x i y javlja u jedinicama populacije.

Izračunavanje aritmetičkog ponderisanog prosjeka se prikladno izvodi u tabeli, kao što je prikazano u nastavku (Tabela 6.3):

Tabela 6.3. Izračunavanje aritmetičke sredine u diskretnom nizu
Početni podaci Procijenjeni indikator
plata, rub. broj zaposlenih, ljudi platni fond, rub.
x i fi x i f i
5 950 6 35 760
6 790 8 54 320
7 000 6 42 000
Ukupno 20 132 080

Treba napomenuti da se jednostavna aritmetička sredina koristi u slučajevima kada podaci nisu grupisani ili grupirani, već su sve frekvencije međusobno jednake.

Često se rezultati posmatranja predstavljaju kao serija intervalne distribucije (vidi tabelu u primjeru 6.4). Zatim, pri izračunavanju prosjeka, sredine intervala se uzimaju kao x i. Ako su prvi i posljednji interval otvoreni (nemaju jednu od granica), onda su uvjetno "zatvoreni", uzimajući vrijednost susjednog intervala kao vrijednosti datog intervala, itd. prvi se zatvara na osnovu vrijednosti drugog, a posljednji - na vrijednosti pretposljednjeg.

Primjer 6.3. Na osnovu rezultata ankete uzorka jedne od grupa stanovništva, izračunavamo veličinu prosječnog novčanog dohotka po glavi stanovnika.

U gornjoj tabeli, sredina prvog intervala je 500. Zaista, vrijednost drugog intervala je 1000 (2000-1000); tada je donja granica prve 0 (1000-1000), a njena sredina 500. Isto radimo i sa zadnjim intervalom. Za sredinu uzimamo 25.000: vrijednost pretposljednjeg intervala je 10.000 (20.000-10.000), zatim je njegova gornja granica 30.000 (20.000 + 10.000), a srednja je 25.000.

Tabela 6.4. Izračunavanje aritmetičke sredine u intervalnoj seriji
Prosječni novčani prihod po glavi stanovnika, rub. Mjesečno Ukupno stanovništvo, % f i Intervalne sredine x i x i f i
Do 1.000 4,1 500 2 050
1 000-2 000 8,6 1 500 12 900
2 000-4 000 12,9 3 000 38 700
4 000-6 000 13,0 5 000 65 000
6 000-8 000 10,5 7 000 73 500
8 000-10 000 27,8 9 000 250 200
10 000-20 000 12,7 15 000 190 500
20.000 i više 10,4 25 000 260 000
Ukupno 100,0 - 892 850

Tada će prosječni mjesečni prihod po glavi stanovnika biti