Biografije Karakteristike Analiza

Kako pronaći prosječnu zapreminu. Zabavna matematika

5.1. Koncept prosjeka

Prosječna vrijednost - ovo je generalizujući indikator koji karakteriše tipičan nivo fenomena. Izražava vrijednost atributa u odnosu na jedinicu populacije.

Prosek uvek generalizuje kvantitativnu varijaciju osobine, tj. u prosječnim vrijednostima se poništavaju individualne razlike u jedinicama stanovništva zbog slučajnih okolnosti. Za razliku od prosjeka, apsolutna vrijednost koja karakterizira nivo obilježja pojedine jedinice populacije ne dopušta poređenje vrijednosti obilježja za jedinice koje pripadaju različitim populacijama. Dakle, ako treba da uporedite nivoe zarada radnika u dva preduzeća, onda ne možete porediti dva radnika različitih preduzeća po ovom osnovu. Plate radnika odabranih za poređenje možda nisu tipične za ova preduzeća. Ako uporedimo veličinu fondova zarada u preduzećima koja se razmatraju, onda se ne uzima u obzir broj zaposlenih i stoga je nemoguće utvrditi gde je nivo zarada veći. Na kraju krajeva, mogu se porediti samo proseci, tj. Koliko u svakom preduzeću u prosjeku zarađuje jedan radnik? Dakle, postoji potreba da se izračuna prosječna vrijednost kao generalizirajuća karakteristika populacije.

Izračunavanje prosjeka je jedna uobičajena tehnika generalizacije; prosječni indikator negira ono opšte koje je tipično (tipično) za sve jedinice proučavane populacije, istovremeno zanemaruje razlike između pojedinačnih jedinica. U svakoj pojavi i njenom razvoju postoji kombinacija slučajnosti i nužnosti. Prilikom izračunavanja prosjeka, zbog djelovanja zakona velikih brojeva, slučajnost se međusobno poništava, uravnotežuje, stoga je moguće apstrahirati od beznačajnih karakteristika fenomena, od kvantitativnih vrijednosti atributa u svakom konkretnom slučaj. U sposobnosti da se apstrahuje od slučajnosti pojedinačnih vrednosti, fluktuacija, leži naučna vrednost proseka kao generalizujućih karakteristika agregata.

Da bi prosjek bio istinski tipičan, mora se izračunati uzimajući u obzir određene principe.

Zaustavimo se na nekim općim principima za primjenu prosjeka.
1. Prosjek treba odrediti za populacije koje se sastoje od kvalitativno homogenih jedinica.
2. Prosjek treba izračunati za populaciju koja se sastoji od dovoljno velikog broja jedinica.
3. Prosjek treba izračunati za populaciju čije su jedinice u normalnom, prirodnom stanju.
4. Prosjek treba izračunati uzimajući u obzir ekonomski sadržaj indikatora koji se proučava.

5.2. Vrste prosjeka i metode za njihovo izračunavanje

Razmotrimo sada vrste prosjeka, karakteristike njihovog izračunavanja i područja primjene. Prosječne vrijednosti podijeljene su u dvije velike klase: prosječne snage, strukturne prosječne vrijednosti.

To snaga srednja uključuju one najpoznatije i najčešće korištene tipove kao što su geometrijska sredina, aritmetička sredina i srednji kvadrat.

As strukturni proseci uzimaju se u obzir mod i medijan.

Hajde da se zadržimo na prosecima snage. Prosjeci snage, u zavisnosti od prezentacije početnih podataka, mogu biti jednostavni i ponderisani. jednostavan prosek izračunava se iz negrupisanih podataka i ima sljedeći opći oblik:

gdje je X i varijanta (vrijednost) prosječne karakteristike;

n je broj opcija.

Prosjećna težina izračunava se na osnovu grupisanih podataka i ima opšti oblik

,

gdje je X i varijanta (vrijednost) prosječne karakteristike ili srednja vrijednost intervala u kojem se varijanta mjeri;
m je eksponent srednje vrijednosti;
f i - frekvencija koja pokazuje koliko puta se pojavljuje i-e vrijednost prosječne karakteristike.

Navedimo kao primjer izračunavanje prosječne starosti učenika u grupi od 20 ljudi:


Prosječnu starost izračunavamo koristeći jednostavnu prosječnu formulu:

Grupirajmo izvorne podatke. Dobijamo sljedeću distribucijsku seriju:

Kao rezultat grupisanja dobijamo novi indikator – učestalost, koji označava broj učenika starosti X godina. Stoga će se prosječna starost učenika u grupi izračunati pomoću ponderirane prosječne formule:

Opće formule za izračunavanje eksponencijalnih prosjeka imaju eksponent (m). Ovisno o tome koju vrijednost ima, razlikuju se sljedeće vrste prosječnih snaga:
harmonijska sredina ako je m = -1;
geometrijska sredina ako je m –> 0;
aritmetička sredina ako je m = 1;
srednji kvadrat ako je m = 2;
srednja kubna ako je m = 3.

Formule srednje vrijednosti snage date su u tabeli. 4.4.

Ako izračunamo sve vrste prosjeka za iste početne podatke, onda njihove vrijednosti neće biti iste. Ovdje se primjenjuje pravilo većine prosjeka: sa povećanjem eksponenta m raste i odgovarajuća prosječna vrijednost:

U statističkoj praksi, češće od drugih tipova ponderisanih prosjeka, koriste se aritmetički i harmonički ponderirani prosjeki.

Tabela 5.1

Vrste moćnih sredstava

Vrsta snage
srednji
Indeks
stepeni (m)
Formula za izračun
Jednostavno ponderisano
harmonic -1
Geometrijski 0
Aritmetika 1
kvadratni 2
kubni 3

Harmonska sredina ima složeniju strukturu od aritmetičke sredine. Harmonična sredina se koristi za proračune kada težine nisu jedinice populacije - nosioci osobine, već proizvodi tih jedinica i vrijednosti osobine (tj. m = Xf). Prosječno vrijeme harmonijskog zastoja treba koristiti u slučajevima određivanja, na primjer, prosječnih troškova rada, vremena, materijala po jedinici proizvodnje, po dijelu za dva (tri, četiri, itd.) preduzeća, radnika koji se bave proizvodnjom isti tip proizvoda, isti dio, proizvod.

Glavni zahtjev za formulu za izračunavanje prosječne vrijednosti je da sve faze proračuna imaju stvarno smisleno opravdanje; rezultirajuća prosječna vrijednost treba zamijeniti pojedinačne vrijednosti atributa za svaki objekt bez prekida veze između pojedinačnih i zbirnih pokazatelja. Drugim riječima, prosječnu vrijednost treba izračunati na način da kada se svaka pojedinačna vrijednost prosječnog indikatora zamijeni njegovom prosječnom vrijednošću, neki konačni zbirni pokazatelj, na ovaj ili onaj način povezan sa prosječnim, ostane nepromijenjen. Ovaj rezultat se zove utvrđivanje budući da priroda njegovog odnosa sa pojedinačnim vrijednostima određuje specifičnu formulu za izračunavanje prosječne vrijednosti. Pokažimo ovo pravilo na primjeru geometrijske sredine.

Formula geometrijske sredine

najčešće se koristi pri izračunavanju prosječne vrijednosti pojedinih relativnih vrijednosti dinamike.

Geometrijska sredina se koristi ako je dat niz lančanih relativnih vrijednosti dinamike, što ukazuje na npr. povećanje proizvodnje u odnosu na nivo prethodne godine: i 1 , i 2 , i 3 ,... , i n . Očigledno, obim proizvodnje u prošloj godini određen je njenim početnim nivoom (q 0) i kasnijim rastom tokom godina:

q n =q 0 × i 1 × i 2 ×...×i n .

Uzimajući q n kao indikator koji određuje i zamjenjujući pojedinačne vrijednosti indikatora dinamike prosječnim, dolazimo do relacije

Odavde

5.3. Strukturni proseci

Posebna vrsta prosječnih vrijednosti - strukturni prosjeci - koristi se za proučavanje unutrašnje strukture serije distribucije vrijednosti atributa, kao i za procjenu prosječne vrijednosti (vrste snage), ako, prema dostupnim statističkim podacima, njegov obračun se ne može izvršiti (npr. ako u razmatranom primeru nema podataka) i o obimu proizvodnje, i o visini troškova po grupama preduzeća).

Indikatori se najčešće koriste kao strukturni prosjeci. moda - najčešće ponavljana vrijednost karakteristike - i medijan - vrijednost značajke koja dijeli uređeni niz njegovih vrijednosti na dva dijela jednaka po broju. Kao rezultat toga, u jednoj polovini jedinica stanovništva vrijednost atributa ne prelazi srednji nivo, au drugoj polovini nije manja od njega.

Ako karakteristika koja se proučava ima diskretne vrijednosti, onda nema posebnih poteškoća u izračunavanju moda i medijana. Ako se podaci o vrijednostima atributa X prezentiraju u obliku uređenih intervala njegove promjene (intervalne serije), izračunavanje moda i medijana postaje nešto složenije. Budući da vrijednost medijane dijeli cijelu populaciju na dva dijela jednaka po broju, ona završava u jednom od intervala karakteristike X. Interpolacijom se srednja vrijednost nalazi u ovom srednjem intervalu:

,

gdje je X Me donja granica srednjeg intervala;
h Me je njegova vrijednost;
(Zbir m) / 2 - polovina ukupnog broja zapažanja ili polovina volumena indikatora koji se koristi kao ponder u formulama za izračunavanje prosječne vrijednosti (u apsolutnom ili relativnom smislu);
S Me-1 je zbir zapažanja (ili volumen ponderiranja) akumuliranih prije početka srednjeg intervala;
m Me je broj zapažanja ili volumen ponderirane karakteristike u srednjem intervalu (također u apsolutnom ili relativnom smislu).

U našem primjeru mogu se dobiti čak tri srednje vrijednosti - na osnovu znakova broja preduzeća, obima proizvodnje i ukupnog iznosa troškova proizvodnje:

Dakle, za polovinu preduzeća trošak jedinice proizvodnje prelazi 125,19 hiljada rubalja, polovina ukupnog obima proizvodnje proizvodi se sa nivoom troškova po proizvodu većim od 124,79 hiljada rubalja. a 50% ukupne cijene formira se na nivou cijene jednog proizvoda iznad 125,07 hiljada rubalja. Također napominjemo da postoji određeni trend rasta troškova, budući da je Me 2 = 124,79 hiljada rubalja, a prosječni nivo je 123,15 hiljada rubalja.

Prilikom izračunavanja modalne vrijednosti obilježja prema podacima intervalne serije, potrebno je obratiti pažnju na to da su intervali isti, budući da od toga ovisi indikator učestalosti vrijednosti svojstva X. Za intervalni niz sa jednakim intervalima, vrijednost moda se određuje kao

gdje je X Mo donja vrijednost modalnog intervala;
m Mo je broj zapažanja ili zapremina ponderisane karakteristike u modalnom intervalu (u apsolutnom ili relativnom smislu);
m Mo -1 - isto za interval koji prethodi modalnom;
m Mo+1 - isto za interval nakon modalnog;
h je vrijednost intervala promjene svojstva u grupama.

Za naš primjer, tri modalne vrijednosti mogu se izračunati na osnovu znakova broja preduzeća, obima proizvodnje i iznosa troškova. U sva tri slučaja modalni interval je isti, jer se za isti interval i broj preduzeća, obim proizvodnje i ukupan iznos troškova proizvodnje pokazuju najveći:

Tako se najčešće susreću preduzeća sa nivoom troškova od 126,75 hiljada rubalja, najčešće se proizvode proizvodi sa nivoom troškova od 126,69 hiljada rubalja, a najčešće se troškovi proizvodnje objašnjavaju nivoom troškova od 123,73 hiljade rubalja.

5.4. Indikatori varijacije

Specifični uslovi u kojima se nalazi svaki od proučavanih objekata, kao i karakteristike sopstvenog razvoja (društveni, ekonomski i dr.) izraženi su odgovarajućim numeričkim nivoima statističkih pokazatelja. Na ovaj način, varijacija, one. neslaganje između nivoa istog indikatora u različitim objektima je objektivno i pomaže da se shvati suština fenomena koji se proučava.

Postoji nekoliko načina za mjerenje varijacija u statistici.

Najjednostavniji je izračun indikatora varijacija raspona H kao razlika između maksimalne (X max) i minimalne (X min) uočene vrijednosti osobine:

H=X max - X min.

Međutim, raspon varijacije pokazuje samo ekstremne vrijednosti osobine. Ovdje se ne uzima u obzir ponovljivost međuvrijednosti.

Strože karakteristike su indikatori fluktuacije u odnosu na prosječni nivo atributa. Najjednostavniji indikator ove vrste je srednje linearno odstupanje L kao aritmetička sredina apsolutnih odstupanja osobine od njenog prosječnog nivoa:

Uz ponavljanje pojedinačnih vrijednosti X, koristi se formula ponderirane aritmetičke sredine:

(Podsjetite se da je algebarski zbir odstupanja od srednjeg nivoa nula.)

Pokazatelj prosječne linearne devijacije našao je široku primjenu u praksi. Uz njegovu pomoć, na primjer, analizira se sastav radnika, ritam proizvodnje, ujednačenost ponude materijala i razvijaju se sistemi materijalnih poticaja. Ali, nažalost, ovaj indikator komplikuje proračune vjerovatnog tipa, otežava primjenu metoda matematičke statistike. Stoga se u statističkim naučnim istraživanjima indikator najčešće koristi za mjerenje varijacije. disperzija.

Varijanca karakteristike (s 2) se određuje na osnovu kvadratne srednje srednje snage:

.

Poziva se eksponent s jednak standardna devijacija.

U općoj teoriji statistike, indikator disperzije je procjena istoimenog indikatora teorije vjerovatnoće i (kao zbir kvadrata odstupanja) procjena disperzije u matematičkoj statistici, što omogućava korištenje odredbi ovih teorijskih disciplina da se analizirati socio-ekonomske procese.

Ako je varijacija procijenjena na osnovu malog broja zapažanja uzetih iz neograničene opće populacije, tada se prosječna vrijednost karakteristike određuje s nekom greškom. Čini se da je izračunata vrijednost disperzije pomaknuta naniže. Da bi se dobila nepristrasna procjena, varijansa uzorka dobijena iz gornjih formula mora se pomnožiti sa n / (n - 1). Kao rezultat toga, uz mali broj zapažanja (< 30) дисперсию признака рекомендуется вычислять по формуле

Obično već kod n > (15÷20) neslaganje između pristrasnih i nepristrasnih procjena postaje beznačajno. Iz istog razloga, pristranost se obično ne uzima u obzir u formuli za dodavanje varijansi.

Ako se iz opće populacije uzme više uzoraka i svaki put se odredi prosječna vrijednost atributa, onda se javlja problem procjene varijabilnosti prosjeka. Procijenite varijansu srednja vrijednost takođe može biti zasnovano na samo jednom posmatranju uzorka prema formuli

,

gdje je n veličina uzorka; s 2 je varijansa karakteristike izračunata iz podataka uzorka.

Vrijednost se zove srednja greška uzorkovanja i karakteristika je odstupanja srednje vrijednosti uzorka karakteristike X od njene prave srednje vrijednosti. Indikator prosječne greške se koristi za procjenu pouzdanosti rezultata posmatranja uzorka.

Pokazatelji relativne disperzije. Da bi se okarakterisala mjera fluktuacije osobine koja se proučava, indikatori fluktuacije se izračunavaju u relativnim iznosima. Oni vam omogućavaju da uporedite prirodu disperzije u različitim distribucijama (različite jedinice promatranja iste osobine u dva skupa, s različitim vrijednostima srednjih vrijednosti, kada se upoređuju različite skupove). Izračunavanje indikatora mjere relativne disperzije vrši se kao omjer indeksa apsolutne disperzije i aritmetičke sredine, pomnožen sa 100%.

1. Koeficijent oscilacije odražava relativnu fluktuaciju ekstremnih vrijednosti osobine oko prosjeka

.

2. Relativno linearno isključenje karakteriše udio prosječne vrijednosti predznaka apsolutnih odstupanja od prosječne vrijednosti

.

3. Koeficijent varijacije:

je najčešća mjera varijanse koja se koristi za procjenu tipičnosti prosjeka.

U statistici se populacije sa koeficijentom varijacije većim od 30–35% smatraju heterogenim.

Ova metoda procjene varijacije također ima značajan nedostatak. Zaista, neka, na primjer, početna populacija radnika sa prosječnim stažom od 15 godina, sa standardnom devijacijom s = 10 godina, "stari" još 15 godina. Sada = 30 godina, a standardna devijacija je i dalje 10. Ranije heterogena populacija (10/15 × 100 = 66,7%), stoga se ispostavlja da je prilično homogeno tokom vremena (10/30 × 100 = 33,3%).

Boyarsky A.Ya. Teorijska istraživanja statistike: sub. Scientific Zbornik radova - M.: Statistika, 1974. str. 19–57.

Prethodno

Šta je aritmetička sredina

Aritmetička sredina nekoliko vrijednosti je omjer zbira ovih vrijednosti i njihovog broja.

Aritmetička sredina određenog niza brojeva naziva se zbir svih ovih brojeva, podijeljen sa brojem članova. Dakle, aritmetička sredina je prosječna vrijednost niza brojeva.

Koja je aritmetička sredina nekoliko brojeva? I jednaki su zbiru ovih brojeva, koji je podijeljen brojem članova u ovom zbroju.

Kako pronaći aritmetičku sredinu

Nema ništa teško u izračunavanju ili pronalaženju aritmetičke sredine nekoliko brojeva, dovoljno je sabrati sve prikazane brojeve, a rezultujući zbroj podijeliti s brojem članova. Dobiveni rezultat će biti aritmetička sredina ovih brojeva.


Razmotrimo ovaj proces detaljnije. Šta trebamo učiniti da izračunamo aritmetičku sredinu i dobijemo konačni rezultat ovog broja.

Prvo, da biste ga izračunali, morate odrediti skup brojeva ili njihov broj. Ovaj skup može uključivati ​​velike i male brojeve, a njihov broj može biti bilo koji.

Drugo, sve ove brojeve treba sabrati i dobiti njihov zbir. Naravno, ako su brojevi jednostavni, a njihov broj mali, onda se proračuni mogu obaviti pisanjem rukom. A ako je skup brojeva impresivan, onda je bolje koristiti kalkulator ili proračunsku tablicu.

I, četvrto, iznos dobiven sabiranjem mora se podijeliti s brojem brojeva. Kao rezultat, dobijamo rezultat, koji će biti aritmetička sredina ove serije.



Čemu služi aritmetička sredina?

Aritmetička sredina može biti korisna ne samo za rješavanje primjera i zadataka na časovima matematike, već i u druge svrhe neophodne u svakodnevnom životu osobe. Takvi ciljevi mogu biti izračunavanje aritmetičke sredine za izračunavanje prosječnog mjesečnog troška finansija ili izračunavanje vremena koje provodite na putu, također kako biste saznali posjećenost, produktivnost, brzinu, produktivnost i još mnogo toga.

Pa, na primjer, hajde da pokušamo izračunati koliko vremena provodite na putu do škole. Idući u školu ili se vraćajući kući, svaki put provodite drugačije vrijeme na putu, jer kada ste u žurbi, idete brže, a samim tim i put traje manje vremena. Ali, vraćajući se kući, možete ići polako, razgovarati sa kolegama iz razreda, diviti se prirodi, pa će vam za put biti potrebno više vremena.

Stoga nećete moći precizno odrediti vrijeme provedeno na putu, ali zahvaljujući aritmetičkoj sredini možete otprilike saznati vrijeme koje provedete na putu.

Pretpostavimo da ste prvog dana nakon vikenda proveli petnaest minuta na putu od kuće do škole, drugog dana vam je put trajao dvadeset minuta, u srijedu ste prešli put za dvadeset pet minuta, za isto vrijeme kada ste prešli put u četvrtak, a u petak se nije žurilo i vratili ste se pola sata.

Nađimo aritmetičku sredinu, dodajući vrijeme, za svih pet dana. dakle,

15 + 20 + 25 + 25 + 30 = 115

Sada podijelite ovaj iznos sa brojem dana

Kroz ovu metodu naučili ste da vam putovanje od kuće do škole traje otprilike dvadeset i tri minuta.

Zadaća

1. Koristeći jednostavne kalkulacije, pronađite aritmetički prosjek pohađanja vašeg razreda sedmično.

2. Pronađite aritmetičku sredinu:



3. Riješite problem:



Prosječne vrijednosti odnose se na generalizirajuće statističke pokazatelje koji daju zbirnu (konačnu) karakteristiku masovnih društvenih pojava, budući da se grade na osnovu velikog broja pojedinačnih vrijednosti različitog atributa. Da bi se razjasnila suština prosječne vrijednosti, potrebno je razmotriti karakteristike formiranja vrijednosti znakova tih pojava, prema kojima se izračunava prosječna vrijednost.

Poznato je da jedinice svakog fenomena mase imaju brojne karakteristike. Koji god od ovih znakova da uzmemo, njegove vrijednosti za pojedine jedinice bit će različite, mijenjaju se ili, kako kažu u statistici, variraju od jedinice do jedinice. Tako je, na primjer, plata zaposlenog određena njegovim kvalifikacijama, prirodom posla, dužinom radnog staža i nizom drugih faktora, te stoga varira u vrlo širokom rasponu. Kumulativni uticaj svih faktora određuje visinu zarade svakog zaposlenog, međutim, možemo govoriti o prosečnim mesečnim zaradama radnika u različitim sektorima privrede. Ovdje radimo s tipičnom, karakterističnom vrijednošću varijabilnog atributa, koji se odnosi na jedinicu velike populacije.

Prosek to odražava general,što je tipično za sve jedinice proučavane populacije. Istovremeno, balansira utjecaj svih faktora koji djeluju na veličinu atributa pojedinih jedinica stanovništva, kao da ih međusobno poništavaju. Nivo (ili veličina) bilo koje društvene pojave određen je djelovanjem dvije grupe faktora. Neki od njih su opšti i glavni, stalno delujući, usko povezani sa prirodom pojave ili procesa koji se proučava, i čine da tipično za sve jedinice proučavane populacije, što se ogleda u prosječnoj vrijednosti. Drugi jesu pojedinac, njihovo djelovanje je manje izraženo i epizodično, nasumično. Oni djeluju u suprotnom smjeru, uzrokuju razlike između kvantitativnih karakteristika pojedinih jedinica populacije, nastojeći promijeniti konstantnu vrijednost karakteristika koje se proučavaju. Djelovanje pojedinih znakova se gasi u prosječnoj vrijednosti. U kumulativnom uticaju tipičnih i pojedinačnih faktora, koji je uravnotežen i međusobno poništen u generalizirajućim karakteristikama, temeljni su zakon velikih brojeva.

U zbiru, pojedinačne vrijednosti znakova stapaju se u zajedničku masu i, takoreći, rastvaraju se. Stoga i prosječna vrijednost djeluje kao "bezlično", što može odstupiti od pojedinačnih vrijednosti osobina, ne poklapajući se kvantitativno ni sa jednom od njih. Prosječna vrijednost odražava opću, karakterističnu i tipičnu za cjelokupnu populaciju zbog međusobnog poništavanja slučajnih, atipičnih razlika između znakova njenih pojedinačnih jedinica, budući da je njena vrijednost određena, takoreći, zajedničkom rezultantom svih uzroci.

Međutim, da bi prosječna vrijednost odražavala najtipičniju vrijednost osobine, ne treba je određivati ​​ni za jednu populaciju, već samo za populacije koje se sastoje od kvalitativno homogenih jedinica. Ovaj uslov je osnovni uslov za naučno utemeljenu primenu proseka i podrazumeva blisku vezu između metode proseka i metode grupisanja u analizi društveno-ekonomskih pojava. Stoga je prosječna vrijednost generalizujući pokazatelj koji karakteriše tipičan nivo varijabilnog svojstva po jedinici homogene populacije u specifičnim uslovima mjesta i vremena.

Utvrđujući, dakle, suštinu prosječnih vrijednosti, mora se naglasiti da ispravan proračun svake prosječne vrijednosti podrazumijeva ispunjenje sljedećih zahtjeva:

  • kvalitativna homogenost populacije na kojoj se izračunava prosječna vrijednost. To znači da bi se izračunavanje prosječnih vrijednosti trebalo zasnivati ​​na metodi grupisanja, koja osigurava selekciju homogenih pojava istog tipa;
  • isključivanje uticaja na izračunavanje prosječne vrijednosti slučajnih, čisto individualnih uzroka i faktora. To se postiže kada se izračunavanje prosjeka zasniva na dovoljno masivnom materijalu u kojem se manifestuje djelovanje zakona velikih brojeva, a sve nezgode se međusobno poništavaju;
  • pri izračunavanju prosječne vrijednosti važno je utvrditi svrhu njenog izračunavanja i tzv definisanje indikatora-tel(imovina) na koju treba da bude orijentisan.

Odlučujući indikator može djelovati kao zbir vrijednosti prosječnog atributa, zbroj njegovih recipročnih vrijednosti, proizvod njegovih vrijednosti itd. Odnos između indikatora koji definira i prosječne vrijednosti izražava se na sljedeći način: ako sve vrijednosti prosječnog atributa zamjenjuju se prosječnom vrijednošću, tada njihov zbir ili proizvod u ovom slučaju neće promijeniti indikator koji određuje. Na osnovu ove povezanosti određujućeg indikatora sa prosječnom vrijednošću, gradi se početni kvantitativni odnos za direktno izračunavanje prosječne vrijednosti. Sposobnost prosjeka da očuvaju svojstva statističkih populacija naziva se definisanje imovine.

Zove se prosječna vrijednost izračunata za populaciju u cjelini opći prosjek; prosječne vrijednosti izračunate za svaku grupu - grupni proseci. Opšti prosek odražava opšte karakteristike fenomena koji se proučava, grupni prosek daje opis fenomena koji se razvija u specifičnim uslovima ove grupe.

Metode izračunavanja mogu biti različite, stoga se u statistici razlikuje nekoliko tipova prosjeka, od kojih su glavni aritmetički prosjek, harmonični prosjek i geometrijski prosjek.

U ekonomskoj analizi korištenje prosjeka je glavno sredstvo za procjenu rezultata naučno-tehnološkog napretka, društvenih mjera i traženja rezervi za ekonomski razvoj. Istovremeno, treba imati na umu da pretjerano fokusiranje na prosjeke može dovesti do pristrasnih zaključaka prilikom provođenja ekonomske i statističke analize. To je zbog činjenice da prosječne vrijednosti, kao generalizirajući pokazatelji, poništavaju i zanemaruju one razlike u kvantitativnim karakteristikama pojedinih jedinica stanovništva koje stvarno postoje i mogu biti od nezavisnog interesa.

Vrste prosjeka

U statistici se koriste različite vrste prosjeka, koji su podijeljeni u dvije velike klase:

  • prosječne snage (harmonska sredina, geometrijska sredina, aritmetička sredina, srednja kvadratna, srednja kubna);
  • strukturni proseci (mod, medijan).

Da izračunam moć znači moraju se koristiti sve dostupne karakteristične vrijednosti. Moda i medijana određene su samo strukturom distribucije, pa se nazivaju strukturnim, pozicionim prosjecima. Medijan i mod se često koriste kao prosječne karakteristike u onim populacijama u kojima je izračunavanje srednje eksponencijalne vrijednosti nemoguće ili nepraktično.

Najčešći tip prosjeka je aritmetički prosjek. Ispod aritmetička sredina Podrazumijeva se takva vrijednost obilježja koju bi imala svaka jedinica populacije kada bi zbir svih vrijednosti obilježja bio ravnomjerno raspoređen na sve jedinice populacije. Izračun ove vrijednosti svodi se na zbrajanje svih vrijednosti varijabilnog atributa i dijeljenje rezultirajućeg iznosa s ukupnim brojem jedinica stanovništva. Na primjer, pet radnika je izvršilo narudžbu za izradu dijelova, dok je prvi proizveo 5 dijelova, drugi - 7, treći - 4, četvrti - 10, peti - 12. Pošto je u početnim podacima vrijednost svakog opcija se dogodila samo jednom, za određivanje prosječne proizvodnje jednog radnika treba primijeniti jednostavnu formulu aritmetičke sredine:

tj. u našem primjeru je prosječan učinak jednog radnika jednak

Zajedno sa jednostavnom aritmetičkom sredinom, oni proučavaju ponderisana aritmetička sredina. Na primjer, izračunajmo prosječnu starost učenika u grupi od 20 ljudi čija se starost kreće od 18 do 22 godine, pri čemu xi- varijante prosečne karakteristike, fi- frekvencija, koja pokazuje koliko se puta javlja i-th vrijednost u agregatu (tabela 5.1).

Tabela 5.1

Prosječna starost učenika

Primjenom formule ponderirane aritmetičke sredine dobivamo:


Postoji određeno pravilo za odabir ponderiranog aritmetičkog prosjeka: ako postoji niz podataka o dva indikatora, za jedan od kojih je potrebno izračunati

prosječna vrijednost, a u isto vrijeme, poznate su numeričke vrijednosti nazivnika njegove logičke formule, a vrijednosti brojnika su nepoznate, ali se mogu naći kao proizvod ovih indikatora, onda treba izračunati prosječnu vrijednost koristeći formulu aritmetičkog ponderiranog prosjeka.

U nekim slučajevima priroda početnih statističkih podataka je takva da izračunavanje aritmetičke sredine gubi smisao i jedini generalizujući pokazatelj može biti samo druga vrsta prosječne vrijednosti - prosečan harmonik. Trenutno su računska svojstva aritmetičke sredine izgubila svoju važnost u izračunavanju generalizirajućih statističkih pokazatelja zbog širokog uvođenja elektronskih računara. Prosječna harmonijska vrijednost, koja je također jednostavna i ponderisana, dobila je veliki praktični značaj. Ako su numeričke vrijednosti brojnika logičke formule poznate, a vrijednosti nazivnika nepoznate, ali se mogu naći kao privatna podjela jednog indikatora drugim, tada se prosječna vrijednost izračunava ponderiranim harmonijska srednja formula.

Na primjer, neka se zna da je automobil prešao prvih 210 km brzinom od 70 km/h, a preostalih 150 km brzinom od 75 km/h. Nemoguće je odrediti prosječnu brzinu automobila na cijelom putu od 360 km pomoću formule aritmetičke sredine. Budući da su opcije brzine u pojedinim dionicama xj= 70 km/h i X2= 75 km/h, a težine (fi) su odgovarajući segmenti puta, onda proizvodi opcija po težinama neće imati ni fizičko ni ekonomsko značenje. U ovom slučaju ima smisla podijeliti segmente puta na odgovarajuće brzine (opcije xi), tj. vrijeme utrošeno na prolazak pojedinih dionica puta (fi / xi). Ako su segmenti putanje označeni sa fi, onda se ceo put izražava kao Σfi, a vreme provedeno na celoj putanji izražava se sa Σ fi / xi , Tada se prosječna brzina može naći kao količnik ukupne udaljenosti podijeljen s ukupnim utrošenim vremenom:

U našem primjeru dobijamo:

Ako su pri korištenju prosječne harmonijske težine sve opcije (f) jednake, tada umjesto ponderisane možete koristiti jednostavna (neponderisana) harmonijska sredina:

gdje xi - pojedinačne opcije; n- broj varijanti prosječne karakteristike. U primjeru sa brzinom, jednostavna harmonijska sredina mogla bi se primijeniti ako su segmenti puta koji se putuje različitim brzinama bili jednaki.

Bilo koju prosječnu vrijednost treba izračunati tako da se prilikom zamjene svake varijante prosječnog obilježja vrijednost nekog konačnog, generalizirajućeg indikatora, koji je pridružen prosječnom pokazatelju, ne promijeni. Dakle, pri zamjeni stvarnih brzina na pojedinim dionicama puta njihovom prosječnom vrijednošću (prosječnom brzinom), ukupna udaljenost ne bi se trebala mijenjati.

Oblik (formula) prosječne vrijednosti određen je prirodom (mehanizmom) odnosa ovog konačnog indikatora sa prosječnim, dakle konačnog indikatora čija se vrijednost ne bi trebala mijenjati kada se opcije zamijene njihovom prosječnom vrijednošću. , zove se indikator definicije. Da biste izveli prosječnu formulu, trebate sastaviti i riješiti jednačinu koristeći odnos prosječnog indikatora sa određujućim. Ova jednačina se konstruiše zamjenom varijanti prosječnog svojstva (indikatora) njihovom prosječnom vrijednošću.

Pored aritmetičke sredine i harmonijske sredine, u statistici se koriste i drugi tipovi (oblici) srednje vrednosti. Sve su to posebni slučajevi. prosek stepena. Ako izračunamo sve vrste prosjeka po stepenu za iste podatke, onda vrijednosti

oni će biti isti, ovdje vrijedi pravilo majorance srednje. Kako se eksponent srednje vrijednosti povećava, raste i sama sredina. Najčešće korištene formule u praktičnim istraživanjima za izračunavanje različitih tipova srednjih vrijednosti snage prikazane su u tabeli. 5.2.

Tabela 5.2


Geometrijska sredina se primjenjuje kada je dostupna. n faktori rasta, dok su pojedinačne vrijednosti osobine, po pravilu, relativne vrijednosti dinamike, građene u obliku lančanih vrijednosti, kao omjer prema prethodnom nivou svakog nivoa u nizu dinamike. Prosjek tako karakteriše prosječnu stopu rasta. geometrijska sredina jednostavna izračunato po formuli

Formula ponderisana geometrijska sredina ima sljedeći oblik:

Gore navedene formule su identične, ali jedna se primjenjuje na trenutne koeficijente ili stope rasta, a druga - na apsolutne vrijednosti nivoa serije.

srednji kvadratni korijen koristi se pri izračunavanju s vrijednostima kvadratnih funkcija, koristi se za mjerenje stepena fluktuacije pojedinačnih vrijednosti atributa oko aritmetičke sredine u seriji distribucije i izračunava se po formuli

Srednji kvadrat ponderisan izračunato po drugoj formuli:

Prosječan kubik koristi se pri izračunavanju sa vrijednostima kubnih funkcija i izračunava se po formuli

ponderisani prosječni kubik:

Sve gore navedene prosječne vrijednosti mogu se predstaviti kao opća formula:

gdje je prosječna vrijednost; - individualna vrijednost; n- broj jedinica proučavane populacije; k- eksponent, koji određuje vrstu prosjeka.

Kada koristite iste izvorne podatke, to više k u općoj formuli srednje vrijednosti snage, veća je srednja vrijednost. Iz ovoga slijedi da postoji pravilan odnos između vrijednosti sredstava moći:

Gore opisane prosječne vrijednosti daju generaliziranu predstavu o populaciji koja se proučava, a s ove točke gledišta njihov teorijski, primijenjen i kognitivni značaj je neosporan. Ali dešava se da se vrijednost prosjeka ne poklapa ni sa jednom od stvarno postojećih opcija, pa je, pored razmatranih prosjeka, u statističkoj analizi preporučljivo koristiti i vrijednosti specifičnih opcija koje zauzimaju prilično određena pozicija u uređenom (rangiranom) nizu vrijednosti atributa. Među ovim količinama najčešće se koriste strukturno, ili opisno, prosječno- mod (Mo) i medijan (Me).

Moda- vrijednost osobine koja se najčešće nalazi u ovoj populaciji. Što se tiče varijacione serije, mod je najčešća vrijednost rangirane serije, odnosno varijanta s najvećom frekvencijom. Moda se može koristiti za određivanje najposjećenijih trgovina, najčešća cijena za bilo koji proizvod. Pokazuje veličinu osobine karakteristične za značajan dio populacije, a određuje se formulom

gdje je x0 donja granica intervala; h- vrijednost intervala; fm- frekvencija intervala; fm_ 1 - frekvencija prethodnog intervala; fm+ 1 - frekvencija sljedećeg intervala.

Medijan naziva se varijanta koja se nalazi u centru rangiranog reda. Medijan dijeli niz na dva jednaka dijela na način da se na obje njegove strane nalazi isti broj populacijskih jedinica. Istovremeno, u jednoj polovini jedinica populacije vrijednost varijabilnog atributa je manja od medijane, au drugoj polovini je veća od nje. Medijan se koristi kada se ispituje element čija je vrijednost veća ili jednaka ili istovremeno manja ili jednaka polovini elemenata serije distribucije. Medijan daje opću ideju o tome gdje su koncentrisane vrijednosti karakteristike, drugim riječima, gdje je njihov centar.

Deskriptivna priroda medijane očituje se u činjenici da karakterizira kvantitativnu granicu vrijednosti varijabilnog atributa, koje posjeduje polovina jedinica populacije. Problem nalaženja medijane za diskretni varijacioni niz je jednostavno riješen. Ako su svim jedinicama serije dati serijski brojevi, tada se redni broj srednje varijante definira kao (n + 1) / 2 sa neparnim brojem članova n. Ako je broj članova niza paran broj, tada će medijan biti prosjek dvije varijante sa serijskim brojevima n/ 2 i n / 2 + 1.

Prilikom određivanja medijane u nizu varijacije intervala, prvo se određuje interval u kojem se nalazi (medijalni interval). Ovaj interval karakteriše činjenica da je njegov akumulirani zbir frekvencija jednak ili veći od polovine zbira svih frekvencija serije. Izračunavanje medijane serije intervalne varijacije vrši se prema formuli

gdje X0- donja granica intervala; h- vrijednost intervala; fm- frekvencija intervala; f- broj članova serije;

∫m-1 - zbir akumuliranih članova niza koji prethode ovom.

Uz medijanu, za potpuniju karakterizaciju strukture proučavane populacije, koriste se i druge vrijednosti opcija koje zauzimaju sasvim određenu poziciju u rangiranoj seriji. To uključuje kvartila i decila. Kvartili dijele niz zbirom frekvencija na 4 jednaka dijela, a decili - na 10 jednakih dijelova. Postoje tri kvartila i devet decila.

Medijan i mod, za razliku od aritmetičke sredine, ne gase individualne razlike u vrijednostima varijabilnog atributa i stoga su dodatne i vrlo važne karakteristike statističke populacije. U praksi se često koriste umjesto prosjeka ili uz njega. Posebno je svrsishodno izračunati medijan i mod u onim slučajevima kada proučavana populacija sadrži određeni broj jedinica s vrlo velikom ili vrlo malom vrijednošću varijabilnog atributa. Ove vrijednosti opcija koje nisu baš karakteristične za populaciju, iako utiču na vrijednost aritmetičke sredine, ne utiču na vrijednosti medijane i moda, što ove posljednje čini vrlo vrijednim pokazateljima za ekonomsku i statističku analizu. .

Indikatori varijacije

Svrha statističke studije je da identifikuje glavna svojstva i obrasce proučavane statističke populacije. U procesu sumarne obrade podataka statističkih posmatranja gradimo distributivni vodovi. Postoje dvije vrste distribucijskih serija – atributivne i varijacione, ovisno o tome da li je atribut uzet kao osnova grupiranja kvalitativni ili kvantitativan.

varijacijski nazvane distributivnim serijama izgrađenim na kvantitativnoj osnovi. Vrijednosti kvantitativnih karakteristika za pojedine jedinice stanovništva nisu konstantne, manje ili više se međusobno razlikuju. Ova razlika u vrijednosti osobine naziva se varijacije. Odvojene numeričke vrijednosti osobine koje se javljaju u proučavanoj populaciji nazivaju se opcije vrednosti. Prisustvo varijacije u pojedinim jedinicama populacije uzrokovano je uticajem velikog broja faktora na formiranje nivoa osobine. Proučavanje prirode i stepena varijacije znakova u pojedinim jedinicama stanovništva najvažnije je pitanje svake statističke studije. Indikatori varijacije se koriste za opisivanje mjere varijabilnosti osobina.

Drugi važan zadatak statističkog istraživanja je utvrđivanje uloge pojedinačnih faktora ili njihovih grupa u varijaciji pojedinih karakteristika populacije. Za rješavanje ovakvog problema u statistici koriste se posebne metode za proučavanje varijacije koje se zasnivaju na korištenju sistema indikatora koji mjere varijaciju. U praksi, istraživač se suočava s dovoljno velikim brojem opcija za vrijednosti atributa, što ne daje ideju o raspodjeli jedinica prema vrijednosti atributa u agregatu. Da biste to učinili, sve varijante vrijednosti atributa su raspoređene u rastućem ili opadajućem redoslijedu. Ovaj proces se zove rangiranje u redovima. Rangirana serija odmah daje opštu predstavu o vrednostima koje karakteristika zauzima u agregatu.

Nedovoljnost prosječne vrijednosti za iscrpnu karakterizaciju populacije čini nužnim da se prosječne vrijednosti dopune indikatorima koji omogućavaju procjenu tipičnosti ovih prosjeka mjerenjem fluktuacije (varijacije) osobine koja se proučava. Upotreba ovih indikatora varijacije omogućava da se statistička analiza učini potpunijom i sadržajnijom, a samim tim i bolje razumijevanje suštine proučavanih društvenih pojava.

Najjednostavniji znaci varijacije su minimum i maksimum - ovo je najmanja i najveća vrijednost karakteristike u populaciji. Naziva se broj ponavljanja pojedinačnih varijanti vrijednosti karakteristika stopa ponavljanja. Označimo učestalost ponavljanja vrijednosti karakteristike fi, zbir frekvencija jednak volumenu proučavane populacije će biti:

gdje k- broj varijanti vrijednosti atributa. Zgodno je zamijeniti frekvencije sa frekvencijama - w.i. Frekvencija- indikator relativne frekvencije - može se izraziti u dijelovima jedinice ili postotku i omogućava vam da uporedite serije varijacija sa različitim brojem opažanja. Formalno imamo:

Za mjerenje varijacije osobine koriste se različiti apsolutni i relativni indikatori. Apsolutni indikatori varijacije uključuju srednju linearnu devijaciju, opseg varijacije, varijansu, standardnu ​​devijaciju.

Varijacija raspona(R) je razlika između maksimalne i minimalne vrijednosti osobine u proučavanoj populaciji: R= Xmax - Xmin. Ovaj pokazatelj daje samo najopćenitiju ideju o fluktuaciji osobine koja se proučava, jer pokazuje razliku samo između graničnih vrijednosti varijanti. Potpuno je nepovezan sa frekvencijama u varijacionom nizu, odnosno sa prirodom distribucije, a njegova zavisnost može mu dati nestabilan, slučajan karakter samo od ekstremnih vrednosti atributa. Opseg varijacije ne daje nikakve informacije o karakteristikama proučavanih populacija i ne dozvoljava nam da procenimo stepen tipičnosti dobijenih prosečnih vrednosti. Opseg ovog indikatora ograničen je na prilično homogene populacije, tačnije, karakterizira varijaciju osobine, indikator koji se temelji na uzimanju u obzir varijabilnosti svih vrijednosti osobine.

Da bi se okarakterizirala varijacija neke osobine, potrebno je generalizirati odstupanja svih vrijednosti od bilo koje vrijednosti tipične za populaciju koja se proučava. Takvi pokazatelji

varijacije, kao što su srednja linearna devijacija, varijansa i standardna devijacija, zasnivaju se na razmatranju odstupanja vrijednosti atributa pojedinih jedinica populacije od aritmetičke sredine.

Prosječna linearna devijacija je aritmetička sredina apsolutnih vrijednosti odstupanja pojedinačnih opcija od njihove aritmetičke sredine:


Apsolutna vrijednost (modulus) varijantnog odstupanja od aritmetičke sredine; f- frekvencija.

Prva formula se primjenjuje ako se svaka od opcija pojavljuje u zbiru samo jednom, a druga - u nizu s nejednakim frekvencijama.

Postoji još jedan način da se prosječna odstupanja opcija od aritmetičke sredine. Ova metoda, koja je vrlo česta u statistici, svodi se na izračunavanje kvadrata odstupanja opcija od srednje vrijednosti i njihovo prosječenje. U ovom slučaju dobijamo novi indikator varijacije - varijansu.

Disperzija(σ 2) - prosjek kvadrata odstupanja varijanti vrijednosti osobine od njihove prosječne vrijednosti:

Druga formula se koristi ako varijante imaju vlastite težine (ili učestalosti serije varijacija).

U ekonomskoj i statističkoj analizi uobičajeno je da se varijacija nekog atributa procjenjuje najčešće koristeći standardnu ​​devijaciju. Standardna devijacija(σ) je kvadratni korijen varijanse:

Srednja linearna i srednja kvadratna devijacija pokazuju koliko se vrijednost atributa u prosjeku fluktuira za jedinice populacije koja se proučava, a izražavaju se u istim jedinicama kao i varijante.

U statističkoj praksi često postaje neophodno uporediti varijacije različitih karakteristika. Na primjer, od velikog je interesa uporediti varijacije u dobi osoblja i njihovim kvalifikacijama, stažu i plaćama itd. Za takva poređenja indikatori apsolutne varijabilnosti predznaka - prosječna linearna i standardna devijacija - nisu prikladni. . Nemoguće je, zapravo, uporediti fluktuaciju radnog staža, izraženu u godinama, sa fluktuacijom plata, izraženim u rubljama i kopejkama.

Kada se poredi varijabilnost različitih osobina u agregatu, zgodno je koristiti relativne indikatore varijacije. Ovi pokazatelji se izračunavaju kao omjer apsolutnih pokazatelja prema aritmetičkoj sredini (ili medijani). Koristeći kao apsolutni indikator varijacije raspon varijacije, prosječnu linearnu devijaciju, standardnu ​​devijaciju, dobijaju se relativni pokazatelji fluktuacije:


Najčešće korišćeni indikator relativne volatilnosti, koji karakteriše homogenost stanovništva. Skup se smatra homogenim ako koeficijent varijacije ne prelazi 33% za raspodjele bliske normalnim.

Prosječne vrijednosti se široko koriste u statistici. Prosječne vrijednosti karakteriziraju kvalitativne pokazatelje komercijalne djelatnosti: troškove distribucije, profit, profitabilnost itd.

Srednje Ovo je jedna od najčešćih generalizacija. Pravilno razumijevanje suštine prosjeka određuje njegov poseban značaj u tržišnoj privredi, kada prosjek, kroz jedan i slučajan, omogućava da se identifikuju opšte i neophodno, da se identifikuju trendovi obrazaca ekonomskog razvoja.

prosječna vrijednost - to su generalizujući indikatori u kojima nalaze izraz delovanja opštih uslova, obrazaca fenomena koji se proučava.

Statistički prosjeci se izračunavaju na osnovu masovnih podataka pravilno statistički organizovanog posmatranja mase (kontinuirano i selektivno). Međutim, statistički prosjek će biti objektivan i tipičan ako se izračuna iz masovnih podataka za kvalitativno homogenu populaciju (masovne pojave). Na primjer, ako izračunamo prosječne plate u zadrugama i državnim preduzećima, a rezultat proširimo na cjelokupnu populaciju, onda je prosjek fiktivan, jer se računa za heterogenu populaciju i takav prosjek gubi svaki smisao.

Uz pomoć prosjeka postoji, takoreći, izglađivanje razlika u veličini obilježja koje nastaju iz ovog ili onog razloga u pojedinačnim jedinicama promatranja.

Na primjer, prosječni učinak prodavača ovisi o mnogim faktorima: kvalifikacijama, dužini radnog staža, starosti, obliku usluge, zdravstvenom stanju itd.

Prosječan učinak odražava opću imovinu cjelokupne populacije.

Prosječna vrijednost je odraz vrijednosti proučavane osobine, stoga se mjeri u istoj dimenziji kao i ova osobina.

Svaka prosječna vrijednost karakterizira proučavanu populaciju prema bilo kojem atributu. Da bi se dobila potpuna i sveobuhvatna slika populacije koja se proučava u smislu niza bitnih karakteristika, generalno je potrebno imati sistem prosječnih vrijednosti koji može opisati fenomen iz različitih uglova.

Postoje različiti proseci:

    aritmetička sredina;

    geometrijska sredina;

    prosječni harmonik;

    srednji kvadratni korijen;

    hronološki prosek.

Razmotrite neke vrste prosjeka koji se najčešće koriste u statistici.

Aritmetička sredina

Prosta aritmetička sredina (neponderisana) jednaka je zbroju pojedinačnih vrijednosti karakteristike, podijeljenom sa brojem ovih vrijednosti.

Pojedinačne vrijednosti atributa nazivaju se varijantama i označavaju se sa x (); broj populacijskih jedinica je označen sa n, a prosečna vrednost obeležja - sa . Dakle, jednostavna aritmetička sredina je:

Prema podacima serije diskretne distribucije, može se vidjeti da se iste vrijednosti atributa (opcija) ponavljaju više puta. Dakle, varijanta x se pojavljuje u zbiru 2 puta, a varijanta x - 16 puta, itd.

Broj identičnih vrijednosti karakteristike u seriji distribucije naziva se frekvencija ili težina i označava se simbolom n.

Izračunajte prosječnu platu po radniku u rubljama:

Masa plata za svaku grupu radnika jednaka je proizvodu opcija i učestalosti, a zbir ovih proizvoda daje ukupnu masu plata svih radnika.

U skladu s tim, proračuni se mogu predstaviti u opštem obliku:

Rezultirajuća formula naziva se ponderirana aritmetička sredina.

Statistički materijal kao rezultat obrade može se prikazati ne samo u obliku diskretnih distribucijskih serija, već iu obliku intervalnih varijacionih serija sa zatvorenim ili otvorenim intervalima.

Izračun prosjeka za grupisane podatke vrši se prema formuli ponderirane aritmetičke sredine:

U praksi ekonomske statistike ponekad je potrebno izračunati prosjek po grupnim prosjekima ili prosjecima pojedinih dijelova populacije (parcijalni prosjek). U takvim slučajevima, grupni ili parcijalni proseci se uzimaju kao opcije (x), na osnovu kojih se ukupan prosek izračunava kao uobičajeni aritmetički ponderisani prosek.

Osnovna svojstva aritmetičke sredine .

Aritmetička sredina ima niz svojstava:

1. Smanjenjem ili povećanjem frekvencije svake vrijednosti atributa x za n puta, vrijednost aritmetičke sredine se neće promijeniti.

Ako se sve frekvencije podijele ili pomnože nekim brojem, tada se vrijednost prosjeka neće promijeniti.

2. Ukupni množitelj pojedinačnih vrijednosti atributa može se izvaditi iz predznaka prosjeka:

3. Prosječan zbir (razlika) dvije ili više veličina jednak je zbiru (razlici) njihovih prosjeka:

4. Ako je x \u003d c, gdje je c konstantna vrijednost, onda
.

5. Zbir odstupanja vrijednosti karakteristike X od aritmetičke sredine x jednak je nuli:

Prosječan harmonik.

Uz aritmetičku sredinu, statistika koristi harmonijsku sredinu, recipročnu vrijednost aritmetičke sredine recipročnih vrijednosti atributa. Kao i aritmetička sredina, može biti jednostavna i ponderirana.

Uz prosjeke, karakteristike varijacione serije su mod i medijan.

Moda - ovo je vrijednost osobine (varijante), koja se najčešće ponavlja u proučavanoj populaciji. Za diskretne distributivne serije, mod će biti vrijednost varijante s najvećom frekvencijom.

Za nizove intervalne distribucije sa jednakim intervalima, mod se određuje formulom:

gdje
- početna vrijednost intervala koji sadrži mod;

- vrijednost modalnog intervala;

- frekvencija modalnog intervala;

- učestalost intervala koji prethodi modalnom;

- učestalost intervala nakon modalnog.

Medijan je varijanta koja se nalazi u sredini reda varijacija. Ako je niz distribucije diskretan i ima neparan broj članova, tada će medijana biti varijanta koja se nalazi u sredini uređenog niza (uređeni niz je raspored jedinica stanovništva u rastućem ili opadajućem redoslijedu).

prosječna vrijednost- ovo je generalizirajući pokazatelj koji karakteriše kvalitativno homogenu populaciju prema određenom kvantitativnom atributu. Na primjer, prosječna starost osoba osuđenih za krađu.

U pravosudnoj statistici, prosjeci se koriste za karakterizaciju:

Prosječni rokovi razmatranja predmeta ove kategorije;

Zahtjev srednje veličine;

Prosječan broj optuženih po predmetu;

Prosječan iznos štete;

Prosječno opterećenje sudija itd.

Prosječna vrijednost je uvijek imenovana i ima istu dimenziju kao atribut posebne jedinice populacije. Svaka prosječna vrijednost karakterizira proučavanu populaciju prema bilo kojem promjenjivom atributu, pa se iza svakog prosjeka nalazi niz distribucije jedinica ove populacije prema proučavanom atributu. Izbor vrste prosjeka određen je sadržajem indikatora i početnim podacima za izračunavanje prosjeka.

Sve vrste prosjeka koji se koriste u statističkim studijama spadaju u dvije kategorije:

1) proseci snage;

2) strukturni proseci.

Prva kategorija prosjeka uključuje: aritmetička sredina, harmonijska sredina, geometrijska sredina i srednji kvadratni korijen . Druga kategorija je moda i medijana. Štaviše, svaki od navedenih tipova proseka snage može imati dva oblika: jednostavno i ponderisano . Jednostavan oblik srednje vrijednosti koristi se za dobivanje srednje vrijednosti osobine koja se proučava kada se izračunavanje zasniva na negrupisanim statistikama, ili kada se svaka varijanta javlja samo jednom u populaciji. Ponderisani prosjeci se nazivaju vrijednostima koje uzimaju u obzir da opcije za vrijednosti neke karakteristike mogu imati različite brojeve, pa se stoga svaka opcija mora pomnožiti s odgovarajućom frekvencijom. Drugim riječima, svaka opcija je "vagana" svojom frekvencijom. Učestalost se naziva statistička težina.

jednostavna aritmetička sredina- najčešći tip medija. Ona je jednaka zbroju pojedinačnih karakterističnih vrijednosti podijeljenih s ukupnim brojem ovih vrijednosti:

gdje x 1 ,x 2 , … ,x N- pojedinačne vrijednosti varijabilnog atributa (opcije), i N - broj jedinica stanovništva.

Aritmetički ponderisani prosjek koristi se kada su podaci predstavljeni u obliku distribucijskih serija ili grupa. Izračunava se kao zbroj proizvoda opcija i njihovih odgovarajućih frekvencija, podijeljen sa zbirom frekvencija svih opcija:

gdje x i- značenje i-te varijante obilježja; fi- frekvencija i th opcije.

Dakle, svaka vrijednost varijante je ponderisana svojom frekvencijom, zbog čega se frekvencije ponekad nazivaju statističkim ponderima.


Komentar. Kada je u pitanju aritmetička sredina bez navođenja njenog tipa, misli se na prostu aritmetičku sredinu.

Tabela 12

Rješenje. Za izračun koristimo formulu aritmetičkog ponderiranog prosjeka:

Dakle, u proseku su dva okrivljena po krivičnom predmetu.

Ako se izračunavanje prosječne vrijednosti vrši prema podacima grupiranim u obliku nizova intervalne distribucije, tada prvo trebate odrediti srednje vrijednosti ​​​​​​​svakog intervala x"i, a zatim izračunati prosječnu vrijednost koristeći ponderisanu formula aritmetičke sredine, u kojoj je x" i zamijenjen umjesto x i.

Primjer. Podaci o starosti kriminalaca osuđenih za krađu prikazani su u tabeli:

Tabela 13

Odredite prosječnu starost kriminalaca osuđenih za krađu.

Rješenje. Da biste odredili prosječnu starost kriminalaca na osnovu serije varijacija intervala, prvo morate pronaći srednje vrijednosti intervala. Pošto je data intervalna serija sa otvorenim prvim i poslednjim intervalima, vrednosti ovih intervala se uzimaju jednake vrednostima susednih zatvorenih intervala. U našem slučaju, vrijednost prvog i posljednjeg intervala je 10.

Sada pronalazimo prosječnu starost kriminalaca koristeći formulu ponderirane aritmetičke sredine:

Dakle, prosječna starost počinitelja osuđenih za krađu je otprilike 27 godina.

Prosječan harmonik jednostavan je recipročna vrijednost aritmetičke sredine recipročnih vrijednosti značajke:

gdje je 1/ x i su recipročne vrijednosti opcija, a N je broj jedinica stanovništva.

Primjer. U cilju utvrđivanja prosječnog godišnjeg opterećenja sudija okružnog suda prilikom razmatranja krivičnih predmeta, sprovedeno je istraživanje o opterećenosti 5 sudija ovog suda. Pokazalo se da je prosječno vrijeme provedeno na jednom krivičnom predmetu za svakog od ispitanih sudija jednako (u danima): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Pronađite prosječne troškove za jednog krivični predmet i prosječno godišnje opterećenje sudija ovog okružnog suda prilikom razmatranja krivičnih predmeta.

Rješenje. Da bismo odredili prosječno vrijeme provedeno na jednom krivičnom predmetu, koristimo harmonijsku jednostavnu formulu:

Da bismo pojednostavili izračune u primjeru, uzmimo broj dana u godini jednak 365, uključujući vikende (ovo ne utiče na metodu izračuna, a pri izračunavanju sličnog pokazatelja u praksi potrebno je zamijeniti broj radnih dana u određenoj godini umjesto 365 dana). Tada će prosječno godišnje opterećenje sudija ovog okružnog suda prilikom razmatranja krivičnih predmeta biti: 365 (dana): 5,56 ≈ 65,6 (predmeti).

Kada bismo koristili formulu jednostavne aritmetičke sredine da odredimo prosječno vrijeme provedeno na jednom krivičnom predmetu, dobili bismo:

365 (dana): 5,64 ≈ 64,7 (slučajevi), tj. prosječno opterećenje sudija bilo je manje.

Provjerimo valjanost ovog pristupa. Za to koristimo podatke o vremenu provedenom na jednom krivičnom predmetu za svakog sudiju i izračunavamo broj krivičnih predmeta koje svaki od njih razmatra godišnje.

Dobijamo shodno tome:

365 (dani) : 6 ≈ 61 (slučaj), 365 (dani) : 5,6 ≈ 65,2 (slučaj), 365 (dani) : 6,3 ≈ 58 (slučaj),

365 (dani) : 4,9 ≈ 74,5 (slučajevi), 365 (dani) : 5,4 ≈ 68 (slučajevi).

Sada izračunavamo prosječno godišnje opterećenje za sudije ovog okružnog suda prilikom razmatranja krivičnih predmeta:

One. prosječno godišnje opterećenje je isto kao i kada se koristi harmonijska sredina.

Dakle, upotreba aritmetičke sredine u ovom slučaju je nezakonita.

U slučajevima kada su poznate varijante neke karakteristike, njihove volumetrijske vrijednosti (proizvod varijanti sa frekvencijom), ali su same frekvencije nepoznate, primjenjuje se harmonijska ponderirana prosječna formula:

,

gdje x i su vrijednosti opcija osobina, a w i su volumetrijske vrijednosti opcija ( w i = x i f i).

Primjer. Podaci o cijeni jedinice iste vrste robe koju proizvode različite ustanove kazneno-popravnog sistema, te o obimu njene realizacije dati su u tabeli 14.

Tabela 14

Pronađite prosječnu prodajnu cijenu proizvoda.

Rješenje. Prilikom izračunavanja prosječne cijene moramo koristiti omjer prodanog iznosa i broja prodanih jedinica. Ne znamo broj prodatih jedinica, ali znamo količinu prodaje robe. Stoga, da bismo pronašli prosječnu cijenu prodate robe, koristimo formulu harmonijskog ponderiranog prosjeka. Dobijamo

Ako ovdje koristite formulu aritmetičke sredine, možete dobiti prosječnu cijenu koja će biti nerealna:

Geometrijska sredina izračunava se izdvajanjem korijena stepena N iz proizvoda svih vrijednosti opcija značajke:

,

gdje x 1 ,x 2 , … ,x N- pojedinačne vrijednosti varijabilne osobine (opcije), i

N- broj populacijskih jedinica.

Ova vrsta prosjeka se koristi za izračunavanje prosječnih stopa rasta vremenskih serija.

srednji kvadratni korijen se koristi za izračunavanje standardne devijacije, koja je indikator varijacije, a o njoj će se govoriti u nastavku.

Za utvrđivanje strukture stanovništva koriste se posebni prosjeci, koji uključuju medijana i moda , ili takozvani strukturni proseci. Ako se aritmetička sredina izračunava na osnovu upotrebe svih varijanti vrijednosti atributa, tada medijan i mod karakteriziraju vrijednost varijante koja zauzima određenu prosječnu poziciju u rangiranoj (uređenoj) seriji. Redoslijed jedinica statističke populacije može se vršiti uzlaznim ili silaznim redoslijedom varijanti osobine koja se proučava.

medijana (ja) je vrijednost koja odgovara varijanti u sredini rangirane serije. Dakle, medijan je ona varijanta rangiranog niza, na čijoj obje strane u ovom nizu treba biti jednak broj jedinica stanovništva.

Da biste pronašli medijan, prvo morate odrediti njegov serijski broj u rangiranoj seriji koristeći formulu:

gdje je N volumen serije (broj jedinica stanovništva).

Ako se niz sastoji od neparnog broja članova, tada je medijan jednak varijanti sa brojem N Me. Ako se niz sastoji od parnog broja članova, tada se medijan definira kao aritmetička sredina dvije susjedne opcije koje se nalaze u sredini.

Primjer. Za rangiranu seriju 1, 2, 3, 3, 6, 7, 9, 9, 10. Obim serije je N = 9, što znači N Me = (9 + 1) / 2 = 5. Dakle, Me = 6, tj. peta opcija. Ako je red dat 1, 5, 7, 9, 11, 14, 15, 16, tj. niz sa parnim brojem članova (N = 8), tada je N Me = (8 + 1) / 2 = 4,5. Dakle, medijan je jednak polovini zbira četvrte i pete opcije, tj. Ja = (9 + 11) / 2 = 10.

U seriji diskretnih varijacija, medijan je određen akumuliranim frekvencijama. Varijantne frekvencije, počevši od prve, se zbrajaju sve dok se ne prekorači srednji broj. Vrijednost zadnjih zbrojenih opcija bit će medijana.

Primjer. Pronađite medijan broja optuženih po krivičnom predmetu koristeći podatke u tabeli 12.

Rješenje. U ovom slučaju, volumen serije varijacija je N = 154, dakle, N Me = (154 + 1) / 2 = 77,5. Sumirajući frekvencije prve i druge opcije, dobijamo: 75 + 43 = 118, tj. premašili smo srednji broj. Dakle, ja = 2.

U nizu varijacije intervala distribucije, prvo označite interval u kojem će se nalaziti medijan. On je zvao medijana . Ovo je prvi interval čija kumulativna frekvencija prelazi polovinu volumena serije varijacije intervala. Tada se numerička vrijednost medijane određuje formulom:

gdje x Me- donja granica srednjeg intervala; i - vrijednost srednjeg intervala; S Me-1- akumulirana frekvencija intervala koji prethodi medijani; f Me- frekvencija srednjeg intervala.

Primjer. Pronađite srednju starost prestupnika osuđenih za krađu, na osnovu statistike predstavljene u Tabeli 13.

Rješenje. Statistički podaci su predstavljeni nizom varijacije intervala, što znači da prvo odredimo srednji interval. Obim populacije N = 162, dakle, srednji interval je interval 18-28, jer ovo je prvi interval, čija akumulirana frekvencija (15 + 90 = 105) premašuje polovinu volumena (162: 2 = 81) serije varijacije intervala. Sada je numerička vrijednost medijane određena gornjom formulom:

Tako je polovina osuđenih za krađu mlađa od 25 godina.

moda (pon.) imenovati vrijednost atributa, koji se najčešće nalazi u jedinicama populacije. Moda se koristi za identifikaciju vrijednosti osobine koja ima najveću distribuciju. Za diskretnu seriju, režim će biti varijanta sa najvećom frekvencijom. Na primjer, za diskretnu seriju prikazanu u tabeli 3 Mo= 1, pošto ova vrijednost opcija odgovara najvišoj frekvenciji - 75. Da biste odredili način intervalne serije, prvo odredite modalni interval (interval sa najvećom frekvencijom). Zatim se unutar ovog intervala pronađe vrijednost karakteristike, koja može biti mod.

Njegova vrijednost se nalazi po formuli:

gdje x Mo- donja granica modalnog intervala; i - vrijednost modalnog intervala; f Mo- frekvencija modalnog intervala; f Mo-1- učestalost intervala koji prethodi modalnom; f Mo+1- učestalost intervala nakon modalnog.

Primjer. Pronađite starosnu dob kriminalaca osuđenih za krađu, podaci o kojima su prikazani u tabeli 13.

Rješenje. Najviša frekvencija odgovara intervalu 18-28, stoga mod mora biti u ovom intervalu. Njegova vrijednost je određena gornjom formulom:

Dakle, najveći broj kriminalaca osuđenih za krađe ima 24 godine.

Prosječna vrijednost daje generalizirajuću karakteristiku ukupnosti fenomena koji se proučava. Međutim, dvije populacije s istim srednjim vrijednostima mogu se značajno razlikovati jedna od druge u smislu stupnja fluktuacije (varijacije) u vrijednosti proučavane osobine. Na primjer, u jednom sudu su određene kazne zatvora: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 godina, au drugom - 5, 5, 6, 6, 7, 7 godina. , 7 , 8, 8, 8 godina. U oba slučaja, aritmetička sredina je 6,7 godina. Međutim, ovi agregati se međusobno značajno razlikuju u širenju pojedinačnih vrijednosti određene kazne zatvora u odnosu na prosječnu vrijednost.

A za prvi sud, gde je ova varijacija prilično velika, prosečna zatvorska kazna ne odražava dobro celokupnu populaciju. Dakle, ako se pojedinačne vrijednosti atributa malo razlikuju jedna od druge, tada će aritmetička sredina biti prilično indikativna karakteristika svojstava ove populacije. U suprotnom će aritmetička sredina biti nepouzdana karakteristika ove populacije i njena primjena u praksi je neefikasna. Stoga je potrebno uzeti u obzir varijacije u vrijednostima proučavane osobine.

Varijacija- to su razlike u vrijednostima karakteristike u različitim jedinicama date populacije u istom periodu ili trenutku. Izraz "varijacija" je latinskog porijekla - variatio, što znači razlika, promjena, fluktuacija. Nastaje kao rezultat činjenice da se pojedinačne vrijednosti atributa formiraju pod kombiniranim utjecajem različitih faktora (uvjeta), koji se u svakom pojedinačnom slučaju kombiniraju na različite načine. Za mjerenje varijacije osobine koriste se različiti apsolutni i relativni indikatori.

Glavni pokazatelji varijacije uključuju sljedeće:

1) opseg varijacije;

2) prosečno linearno odstupanje;

3) disperzija;

4) standardna devijacija;

5) koeficijent varijacije.

Hajde da se ukratko zadržimo na svakom od njih.

Varijacija raspona R je najpristupačniji apsolutni indikator u smislu lakoće izračuna, koji se definira kao razlika između najveće i najmanje vrijednosti atributa za jedinice ove populacije:

Raspon varijacije (raspon fluktuacija) je važan pokazatelj varijabilnosti osobine, ali omogućava uočavanje samo ekstremnih odstupanja, što ograničava njen opseg. Za precizniju karakterizaciju varijacije osobine na osnovu njene fluktuacije, koriste se drugi indikatori.

Prosječna linearna devijacija predstavlja aritmetičku sredinu apsolutnih vrijednosti odstupanja pojedinačnih vrijednosti osobine od srednje vrijednosti i određuje se po formulama:

1) za negrupisani podaci

2) za varijantne serije

Međutim, najčešće korištena mjera varijacije je disperzija . Karakterizira mjeru širenja vrijednosti proučavane osobine u odnosu na njenu prosječnu vrijednost. Varijanca je definirana kao prosjek kvadrata odstupanja.

jednostavna varijansa za negrupirane podatke:

.

Ponderisana varijansa za seriju varijacija:

Komentar. U praksi je bolje koristiti sljedeće formule za izračunavanje varijanse:

Za jednostavnu varijantu

.

Za ponderisanu varijansu

Standardna devijacija je kvadratni korijen varijanse:

Standardna devijacija je mjera pouzdanosti srednje vrijednosti. Što je manja standardna devijacija, populacija je homogenija i aritmetička sredina bolje odražava cjelokupnu populaciju.

Gore razmatrane mjere disperzije (opseg varijacije, varijansa, standardna devijacija) su apsolutni indikatori po kojima nije uvijek moguće suditi o stepenu fluktuacije osobine. U nekim problemima potrebno je koristiti relativne indekse raspršenja, od kojih je jedan koeficijent varijacije.

Koeficijent varijacije- izraženo kao postotak omjera standardne devijacije i aritmetičke sredine:

Koeficijent varijacije se koristi ne samo za komparativnu procjenu varijacije različitih osobina ili iste osobine u različitim populacijama, već i za karakterizaciju homogenosti populacije. Statistička populacija se smatra kvantitativno homogenom ako koeficijent varijacije ne prelazi 33% (za raspodjele bliske normalnoj).

Primjer. O rokovima zatvora za 50 osuđenika dostavljenih na izdržavanje kazne izrečene po sudu u vaspitno-popravnom zavodu kazneno-popravnog sistema postoje podaci: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Konstruirajte distribucijsku seriju prema uslovima zatvora.

2. Pronađite srednju vrijednost, varijansu i standardnu ​​devijaciju.

3. Izračunati koeficijent varijacije i izvesti zaključak o homogenosti ili heterogenosti proučavane populacije.

Rješenje. Za konstruiranje diskretne serije distribucije potrebno je odrediti varijante i frekvencije. Varijanta u ovom problemu je zatvorska kazna, a učestalost broj pojedinačnih varijanti. Nakon izračunavanja frekvencija, dobijamo sljedeće diskretne serije distribucije:

Pronađite srednju vrijednost i varijansu. Budući da su statistički podaci predstavljeni diskretnim varijacionim nizom, za njihovo izračunavanje koristićemo formule aritmetičkog ponderisanog prosjeka i varijanse. Dobijamo:

= = 4,1;

= 5,21.

Sada izračunavamo standardnu ​​devijaciju:

Nalazimo koeficijent varijacije:

Shodno tome, statistička populacija je kvantitativno heterogena.