Biografije Karakteristike Analiza

Kako izračunati prosjek u Excelu. Kako napraviti prosječan rezultat u excelu? Standardna metoda proračuna

Kako izračunati prosjek brojeva u Excelu

Nađi sredinu aritmetički brojevi u Excelu možete koristiti .

Sintaksa AVERAGE

=PROSEK(broj1,[broj2],…) - ruska verzija

Argumenti AVERAGE

  • broj 1- prvi broj ili raspon brojeva, za izračunavanje aritmetičke sredine;
  • broj2(Neobavezno) – drugi broj ili raspon brojeva za izračunavanje aritmetičke sredine. Maksimalni iznos argumenti funkcije - 255.

Da biste izračunali, uradite sljedeće korake:

  • Odaberite bilo koju ćeliju;
  • Napišite formulu u njemu =PROSJEČNO(
  • Odaberite opseg ćelija za koji želite da napravite proračun;
  • Pritisnite taster "Enter" na tastaturi

Funkcija će izračunati prosječnu vrijednost u navedenom rasponu među ćelijama koje sadrže brojeve.

Kako pronaći prosječnu vrijednost danog teksta

Ako postoje prazni redovi ili tekst u rasponu podataka, onda ih funkcija tretira kao "nula". Ako podaci sadrže boolean izrazi FALSE ili TRUE, tada funkcija FALSE tretira kao “nula” i TRUE kao “1”.

Kako pronaći aritmetičku sredinu po uslovu

Funkcija se koristi za izračunavanje prosjeka prema uvjetu ili kriteriju. Na primjer, recimo da imamo podatke o prodaji proizvoda:

Naš zadatak je izračunati prosječnu prodaju olovaka. Da bismo to učinili, poduzet ćemo sljedeće korake:

  • U ćeliji A13 napišite naziv proizvoda „Olovke“;
  • U ćeliji B13 unesimo formulu:

=PROSJEČNOIF(A2:A10,A13,B2:B10)

Raspon ćelija” A2:A10” ukazuje na listu proizvoda u kojima ćemo tražiti riječ “olovke”. Argument A13 ovo je link na ćeliju s tekstom koji ćemo tražiti među cijelom listom proizvoda. Raspon ćelija” B2:B10” je raspon s podacima o prodaji proizvoda, među kojima će funkcija pronaći “Olovke” i izračunati prosječnu vrijednost.


U većini slučajeva, podaci su koncentrisani oko neke centralne tačke. Dakle, da bi se opisali bilo koji skup podataka, dovoljno je navesti prosječnu vrijednost. Hajde da pogledamo tri numeričke karakteristike, koji se koriste za procjenu srednje vrijednosti distribucije: aritmetičke sredine, medijane i moda.

Prosjek

Aritmetička sredina (koja se često naziva jednostavno srednja vrijednost) je najčešća procjena srednje vrijednosti distribucije. To je rezultat dijeljenja zbira svih opservabilnih numeričke vrijednosti za njihov broj. Za uzorak brojeva X 1, X 2, ..., Xn, srednja vrijednost uzorka (označena simbolom ) jednako \u003d (X 1 + X 2 + ... + Xn) / n, ili

gdje je srednja vrijednost uzorka, n- veličina uzorka, Xii-ti element uzorci.

Preuzmite bilješku u formatu ili, primjere u formatu

Razmotrite izračun prosjeka aritmetička vrijednost petogodišnji prosječni godišnji prinosi 15 investicijskih fondova sa vrlo visoki nivo rizik (slika 1).

Rice. 1. Prosječni godišnji prinos na 15 vrlo rizičnih investicijskih fondova

Srednja vrijednost uzorka se izračunava na sljedeći način:

Ovo je dobar prinos, posebno u poređenju sa povratom od 3-4% koji su štediše banke ili kreditne unije primili u istom vremenskom periodu. Ako sortirate vrijednosti povrata, lako je vidjeti da osam fondova ima prinos iznad, a sedam - ispod prosjeka. Aritmetička sredina djeluje kao ravnotežna tačka, tako da fondovi s niskim prihodima uravnotežuju fondove s visokim prihodima. Svi elementi uzorka su uključeni u izračunavanje prosjeka. Nijedan od ostalih procjenitelja srednje vrijednosti raspodjele nema ovo svojstvo.

Kada izračunati aritmetičku sredinu. Pošto aritmetička sredina zavisi od svih elemenata uzorka, prisustvo ekstremnih vrednosti značajno utiče na rezultat. U takvim situacijama, aritmetička sredina može iskriviti značenje brojčanih podataka. Stoga, kada se opisuje skup podataka koji sadrži ekstremne vrijednosti, potrebno je navesti medijan ili aritmetičku sredinu i medijan. Na primjer, ako se iz uzorka izuzme prinos fonda RS za razvoj u nastajanju, prosjek uzorka prinosa 14 fondova se smanjuje za skoro 1% na 5,19%.

Medijan

Medijan je srednja vrijednost uređenog niza brojeva. Ako niz ne sadrži ponavljajuće brojeve, tada će polovina njegovih elemenata biti manja od, a pola više od medijane. Ako uzorak sadrži ekstremne vrijednosti, bolje je koristiti medijanu umjesto aritmetičke sredine za procjenu srednje vrijednosti. Da bi se izračunao medijan uzorka, prvo se mora sortirati.

Ova formula je dvosmislena. Njegov rezultat ovisi o tome da li je broj paran ili neparan. n:

  • Ako uzorak sadrži neparan broj stavki, medijan je (n+1)/2-th element.
  • Ako uzorak sadrži paran broj elemenata, medijan leži između dva srednja elementa uzorka i jednak je aritmetičkoj sredini izračunatoj za ova dva elementa.

Da bismo izračunali medijan za uzorak od 15 vrlo rizičnih investicijskih fondova, prvo moramo sortirati neobrađene podatke (Slika 2). Tada će medijan biti suprotan broju srednjeg elementa uzorka; u našem primjeru broj 8. Excel ima posebnu funkciju =MEDIAN() koja radi i sa neuređenim nizovima.

Rice. 2. Medijan 15 fondova

Dakle, medijan je 6,5. To znači da polovina veoma rizičnih fondova ne prelazi 6,5, dok druga polovina to čini. Imajte na umu da je medijan od 6,5 nešto veći od medijana od 6,08.

Ako iz uzorka izbacimo profitabilnost fonda RS Emerging Growth, medijan preostalih 14 fondova će se smanjiti na 6,2%, odnosno ne toliko značajno kao aritmetička sredina (slika 3).

Rice. 3. Medijan 14 fondova

Moda

Termin je prvi uveo Pearson 1894. Moda je broj koji se najčešće pojavljuje u uzorku (najmoderniji). Moda dobro opisuje, na primjer, tipičnu reakciju vozača na semafor da zaustavi saobraćaj. Klasičan primjer korištenje mode - izbor veličine proizvedene serije cipela ili boje tapeta. Ako distribucija ima više načina, onda se kaže da je multimodalna ili multimodalna (ima dva ili više "vrhova"). Multimodalnost distribucije daje važna informacija o prirodi varijable koja se proučava. Na primjer, u sociološkim istraživanjima, ako varijabla predstavlja sklonost ili stav prema nečemu, onda multimodalnost može značiti da postoji nekoliko izrazito različitih mišljenja. Multimodalnost je također pokazatelj da uzorak nije homogen i da zapažanja mogu biti generirana pomoću dvije ili više „preklapanih“ distribucija. Za razliku od aritmetičke sredine, outliers ne utiču na mod. Za kontinuirano distribuirane slučajne varijable, kao što su prosječni godišnji prinosi investicijskih fondova, modus ponekad uopće ne postoji (ili nema smisla). Budući da ovi indikatori mogu poprimiti različite vrijednosti, ponavljajuće vrijednosti su izuzetno rijetke.

Kvartili

Kvartili su mjere koje se najčešće koriste za procjenu distribucije podataka kada se opisuju svojstva velikih numeričkih uzoraka. Dok medijan dijeli uređeni niz na pola (50% elemenata niza je manje od medijane, a 50% veće), kvartili razbijaju uređeni skup podataka na četiri dijela. Vrijednosti Q 1 , medijana i Q 3 su 25., 50. i 75. percentil, respektivno. Prvi kvartil Q 1 je broj koji uzorak dijeli na dva dijela: 25% elemenata je manje, a 75% je više od prvog kvartil.

Treći kvartil Q 3 je broj koji također dijeli uzorak na dva dijela: 75% elemenata je manje od, a 25% više od trećeg kvartila.

Za izračunavanje kvartila u verzijama Excel-a prije 2007. godine korištena je funkcija =QUARTILE(niz, dio). Počevši od Excel 2010, primjenjuju se dvije funkcije:

  • =QUARTILE.ON(niz, dio)
  • =QUARTILE.EXC(niz, dio)

Ove dvije funkcije daju malo razna značenja(Sl. 4). Na primjer, kada se izračunavaju kvartili uzorka koji sadrži podatke o prosječnom godišnjem prinosu 15 vrlo rizičnih investicijskih fondova, Q 1 = 1,8 ili -0,7 za QUARTILE.INC i QUARTILE.EXC, respektivno. Usput, funkcija QUARTILE korištena ranije odgovara moderna funkcija QUARTILE ON Da biste izračunali kvartile u Excelu koristeći gornje formule, niz podataka se može ostaviti neuređenim.

Rice. 4. Izračunajte kvartile u Excelu

Da još jednom naglasimo. Excel može izračunati kvartile za univarijaciju diskretne serije , koji sadrži vrijednosti slučajna varijabla. Izračun kvartila za distribuciju zasnovanu na frekvenciji dat je u odeljku ispod.

geometrijska sredina

Za razliku od aritmetičke sredine, geometrijska sredina mjeri koliko se varijabla promijenila tokom vremena. Geometrijska sredina je korijen n stepena od proizvoda n vrijednosti (u Excelu se koristi funkcija = CUGEOM):

G= (X 1 * X 2 * ... * X n) 1/n

Sličan parametar je prosjek geometrijska vrijednost stopa povrata je određena formulom:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

gdje R i- stopa povrata i-th vremenski period.

Na primjer, pretpostavimo da je početna investicija 100 000 USD. Do kraja prve godine padne na 50 000 USD, a do kraja druge godine se oporavlja na prvobitnih 100 000 USD. Stopa povrata na ovu investiciju tokom dvije- godišnji period je jednak 0, pošto su početni i konačni iznos sredstava međusobno jednaki. Međutim, aritmetička sredina godišnje stope dobit je = (-0,5 + 1) / 2 = 0,25 ili 25%, budući da je stopa prinosa u prvoj godini R 1 = (50.000 - 100.000) / 100.000 = -0.5, au drugoj R 2 = (100.000 – 50.000) / 50.000 = 1. Istovremeno, geometrijska sredina stope prinosa za dvije godine je: G = [(1–0,5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Dakle, geometrijska sredina preciznije odražava promjenu (tačnije, izostanak promjene) obima investicija tokom dvogodišnjeg perioda od aritmetičke sredine.

Zanimljivosti. Prvo, geometrijska sredina će uvijek biti manja od aritmetičke sredine istih brojeva. Osim u slučaju kada su svi uzeti brojevi međusobno jednaki. Drugo, s obzirom na svojstva pravougaonog trougla, možete razumjeti zašto se sredina naziva geometrijska. Visina pravokutnog trokuta, spuštenog na hipotenuzu, je prosječna proporcionalna između projekcija kateta na hipotenuzu, a svaka kateta je prosječna proporcionalna između hipotenuze i njene projekcije na hipotenuzu (slika 5). Ovo daje geometrijski način konstruisanja geometrijske sredine dva (dužina) segmenta: potrebno je da napravite krug na zbiru ova dva segmenta kao prečnik, zatim visinu, vraćenu od tačke njihove veze do preseka sa krug, dat će željenu vrijednost:

Rice. 5. Geometrijska priroda geometrijske sredine (slika sa Wikipedije)

Sekunda važna imovina brojčani podaci - njihovi varijacija karakterišući stepen disperzije podataka. Dva različita uzorka mogu se razlikovati i u srednjim vrijednostima i u varijacijama. Međutim, kao što je prikazano na sl. 6 i 7, dva uzorka mogu imati istu varijaciju, ali različite srednje vrijednosti, ili istu srednju vrijednost i potpuno različite varijacije. Podaci koji odgovaraju poligonu B na Sl. 7 mijenjaju mnogo manje od podataka iz kojih je izgrađen poligon A.

Rice. 6. Dvije simetrične distribucije u obliku zvona sa istim širenjem i različitim srednjim vrijednostima

Rice. 7. Dvije simetrične distribucije u obliku zvona sa istim srednjim vrijednostima i različitim rasipanjem

Postoji pet procjena varijacije podataka:

obim

Raspon je razlika između najvećeg i najmanjeg elementa uzorka:

Prevucite prstom = XMax-XMin

Opseg uzorka koji sadrži prosječne godišnje prinose 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem uređenog niza (vidi sliku 4): raspon = 18,5 - (-6,1) = 24,6. To znači da je razlika između najvećeg i najnižeg prosječnog godišnjeg prinosa za vrlo rizične fondove 24,6%.

Opseg mjeri ukupno širenje podataka. Iako je raspon uzorka vrlo jednostavna procjena ukupnog širenja podataka, njegova slabost je u tome što ne uzima u obzir tačno kako su podaci raspoređeni između minimalnih i maksimalnih elemenata. Ovaj efekat je dobro vidljiv na sl. 8 koja ilustruje uzorke koji imaju isti raspon. B skala pokazuje da ako uzorak sadrži barem jednu ekstremnu vrijednost, raspon uzorka je vrlo netačna procjena raspršenosti podataka.

Rice. 8. Poređenje tri uzorka istog raspona; trokut simbolizira potporu ravnoteže, a njegova lokacija odgovara prosječnoj vrijednosti uzorka

Interkvartilni raspon

Interkvartil ili srednji raspon je razlika između trećeg i prvog kvartila uzorka:

Interkvartilni raspon \u003d Q 3 - Q 1

Ova vrijednost omogućava procjenu širenja 50% elemenata i ne uzimajući u obzir uticaj ekstremnih elemenata. Interkvartilni raspon za uzorak koji sadrži podatke o prosječnim godišnjim prinosima 15 vrlo rizičnih investicijskih fondova može se izračunati korištenjem podataka na Sl. 4 (na primjer, za funkciju QUARTILE.EXC): Interkvartilni raspon = 9,8 - (-0,7) = 10,5. Interval između 9,8 i -0,7 često se naziva srednjom polovinom.

Treba napomenuti da vrijednosti Q 1 i Q 3, a time i interkvartilni raspon, ne zavise od prisustva outliera, jer njihov proračun ne uzima u obzir nijednu vrijednost koja bi bila manja od Q 1 ili veća od Q 3 . Ukupno kvantitativne karakteristike, kao što su medijan, prvi i treći kvartil i interkvartilni raspon, na koje ne utječu vanjske vrijednosti, nazivaju se robusnim mjerama.

Dok raspon i interkvartilni raspon daju procjenu ukupnog i srednjeg raspršenosti uzorka, respektivno, nijedna od ovih procjena ne uzima u obzir tačno kako su podaci raspoređeni. Varijanca i standardna devijacija oslobođeni ovog nedostatka. Ovi indikatori vam omogućavaju da procenite stepen fluktuacije podataka oko srednje vrednosti. Varijanca uzorka je aproksimacija aritmetičke sredine izračunate iz kvadrata razlike između svakog elementa uzorka i srednje vrijednosti uzorka. Za uzorak od X 1 , X 2 , ... X n varijansa uzorka (označena simbolom S 2 data je sljedećom formulom:

AT opšti slučaj Varijanca uzorka je zbir kvadratnih razlika između elemenata uzorka i srednje vrijednosti uzorka, podijeljen s vrijednošću jednakom veličini uzorka minus jedan:

gdje - aritmetička sredina, n- veličina uzorka, X i - i-ti element uzorka X. U Excelu prije verzije 2007 za proračun varijansa uzorka korištena je funkcija =VAR(), od verzije 2010 koristi se funkcija =VAR.B().

Najpraktičnija i široko prihvaćena procjena rasipanja podataka je standard selektivno odstupanje . Ovaj indikator je označen simbolom S i jednak je kvadratni korijen iz varijanse uzorka:

U Excelu prije verzije 2007, funkcija =STDEV() se koristila za izračunavanje standardne devijacije, od verzije 2010 koristi se funkcija =STDEV.B(). Za izračunavanje ovih funkcija, niz podataka može biti neuređen.

Ni varijansa uzorka ni standardna devijacija uzorka ne mogu biti negativni. Jedina situacija u kojoj indikatori S 2 i S mogu biti nula je ako su svi elementi uzorka jednaki. U ovome potpuno nevjerovatan slučaj raspon i interkvartilni raspon su također nula.

Numerički podaci su inherentno promjenjivi. Bilo koja varijabla može preuzeti skup različite vrijednosti. Na primjer, različiti zajednički fondovi imaju različite stope povrata i gubitka. Zbog varijabilnosti numeričkih podataka, veoma je važno proučavati ne samo procjene srednje vrijednosti koje su sumativne prirode, već i procjene varijanse koje karakterišu raspršenost podataka.

Varijanca i standardna devijacija nam omogućavaju da procijenimo širenje podataka oko srednje vrijednosti, drugim riječima, da odredimo koliko je elemenata uzorka manje od srednje vrijednosti, a koliko veće. Disperzija ima nešto vrijedno matematička svojstva. Međutim, njegova vrijednost je kvadrat jedinice mjere - kvadratni postotak, kvadratni dolar, kvadratni inč itd. Stoga je prirodna procjena varijanse standardna devijacija, koja se izražava u uobičajenim mjernim jedinicama - postocima prihoda, dolarima ili inčima.

Standardna devijacija vam omogućava da procenite količinu fluktuacije elemenata uzorka oko srednje vrednosti. U gotovo svim situacijama, većina posmatranih vrijednosti nalazi se unutar plus ili minus jedne standardne devijacije od srednje vrijednosti. Stoga, poznavajući aritmetičku sredinu elemenata uzorka i standardnu ​​devijaciju uzorka, moguće je odrediti interval kojem pripada većina podataka.

Standardna devijacija prinosa na 15 vrlo rizičnih investicijskih fondova je 6,6 (Slika 9). To znači da se profitabilnost najvećeg dijela sredstava razlikuje od prosječne vrijednosti za najviše 6,6% (tj. varira u rasponu od – S= 6,2 – 6,6 = –0,4 do +S= 12,8). Zapravo, ovaj interval sadrži petogodišnji prosječni godišnji prinos od 53,3% (8 od 15) sredstava.

Rice. 9. Standardna devijacija

Imajte na umu da u procesu sabiranja kvadrata razlika, stavke koje su dalje od srednje vrijednosti dobijaju veću težinu od stavki koje su bliže. Ovo svojstvo je glavni razlog zašto se aritmetička sredina najčešće koristi za procjenu sredine distribucije.

Koeficijent varijacije

Za razliku od prethodnih procjena raspršenosti, koeficijent varijacije je relativna procjena. Uvijek se mjeri kao postotak, a ne u izvornim jedinicama podataka. Koeficijent varijacije, označen simbolima CV, mjeri rasipanje podataka oko srednje vrijednosti. Koeficijent varijacije jednak je standardnoj devijaciji podijeljenoj sa aritmetičkom sredinom i pomnoženoj sa 100%:

gdje S- standardna devijacija uzorka, - srednja vrijednost uzorka.

Koeficijent varijacije vam omogućava da uporedite dva uzorka, čiji su elementi izraženi u različitim mjernim jedinicama. Na primjer, menadžer jedne službe za dostavu pošte namjerava unaprijediti vozni park kamiona. Prilikom utovara paketa, postoje dvije vrste ograničenja koja treba uzeti u obzir: težina (u funtama) i zapremina (u kubnim stopama) svakog paketa. Pretpostavimo da je u uzorku od 200 vreća prosječna težina 26,0 funti, standardna devijacija težine 3,9 funti, prosječna zapremina pakovanja 8,8 kubnih stopa, a standardna devijacija zapremine 2,2 kubna stopa. Kako uporediti širinu težine i zapremine pakovanja?

Pošto se jedinice mjere za težinu i zapreminu razlikuju jedna od druge, menadžer mora uporediti relativnu širinu ovih vrijednosti. Koeficijent varijacije težine je CV W = 3,9 / 26,0 * 100% = 15%, a koeficijent varijacije zapremine CV V = 2,2 / 8,8 * 100% = 25% . Dakle, relativni raspršivanje volumena paketa je mnogo veće od relativnog raspršenja njihovih težina.

Obrazac za distribuciju

Treće važno svojstvo uzorka je oblik njegove distribucije. Ova raspodjela može biti simetrična ili asimetrična. Da bismo opisali oblik distribucije, potrebno je izračunati njenu srednju vrijednost i medijan. Ako su ove dvije mjere iste, kaže se da je varijabla simetrično raspoređena. Ako je srednja vrijednost varijable veća od medijane, njena distribucija ima pozitivnu asistenciju (slika 10). Ako je medijan veći od srednje vrijednosti, distribucija varijable je negativno iskrivljena. Pozitivna iskrivljenost nastaje kada se srednja vrijednost poveća na neuobičajeno visoke vrijednosti. Negativna iskrivljenost nastaje kada se srednja vrijednost smanji na neobično male vrijednosti. Varijabla je simetrično raspoređena ako ne poprima nikakve ekstremne vrijednosti ni u jednom smjeru, tako da se velike i male vrijednosti varijable međusobno poništavaju.

Rice. 10. Tri vrste distribucija

Podaci prikazani na A skali imaju negativnu asistenciju. Ova slika prikazuje dugačak rep i lijevu kosinu uzrokovanu neobično malim vrijednostima. Ove izuzetno male vrijednosti pomiču srednju vrijednost ulijevo i ona postaje manja od medijane. Podaci prikazani na skali B raspoređeni su simetrično. Lijeva i desna polovina distribucije su njihove vlastite ogledala. Velike i male vrijednosti balansiraju jedna drugu, a srednja vrijednost i medijan su jednaki. Podaci prikazani na skali B imaju pozitivnu asistenciju. Ova slika prikazuje dugačak rep i nagnut udesno, uzrokovan prisustvom neobično visokih vrijednosti. Ove prevelike vrijednosti pomiču srednju vrijednost udesno i ona postaje veća od medijane.

U Excelu se deskriptivna statistika može dobiti pomoću dodatka Paket analiza. Prođite kroz meni PodaciAnaliza podataka, u prozoru koji se otvori odaberite liniju Deskriptivna statistika i kliknite Uredu. U prozoru Deskriptivna statistika obavezno naznačite ulazni interval(Sl. 11). Ako želite da vidite deskriptivnu statistiku na istom listu kao i originalni podaci, izaberite radio dugme izlazni interval i odredite ćeliju u koju želite postaviti lijevo gornji ugao izlazna statistika (u našem primjeru $C$1). Ako želite poslati podatke na novi list ili u nova knjiga jednostavno odaberite odgovarajuće radio dugme. Označite polje pored Konačna statistika. Opciono, možete i birati Nivo težine,k-ti najmanji ik-ti najveći.

Ako je na depozit Podaci u oblasti Analiza ne vidite ikonu Analiza podataka, prvo morate instalirati dodatak Paket analiza(vidi, na primjer,).

Rice. 11. Deskriptivna statistika petogodišnjih prosječnih godišnjih prinosa sredstava sa vrlo visokim nivoom rizika, izračunata uz pomoć dodatka Analiza podataka Excel programi

Excel izračunava cela linija statistika o kojoj se gore govori: srednja vrijednost, medijan, mod, standardna devijacija, varijansa, raspon ( interval), minimalnu, maksimalnu i veličinu uzorka ( provjeriti). Osim toga, Excel izračunava neke nove statistike za nas: standardnu ​​grešku, eksces i iskrivljenost. standardna greška jednaka je standardnoj devijaciji podijeljenoj s kvadratnim korijenom veličine uzorka. asimetrija karakterizira odstupanje od simetrije distribucije i predstavlja funkciju koja ovisi o kocki razlika između elemenata uzorka i srednje vrijednosti. Kurtoza je mjera relativne koncentracije podataka oko srednje vrijednosti naspram repova distribucije i ovisi o razlikama između uzorka i srednje vrijednosti podignute na četvrtu potenciju.

proračun deskriptivna statistika za stanovništva

Srednja vrijednost, raspršivanje i oblik distribucije o kojoj se gore raspravljalo su karakteristike zasnovane na uzorku. Međutim, ako skup podataka sadrži numerička mjerenja cijele populacije, tada se njegovi parametri mogu izračunati. Ovi parametri uključuju srednju vrijednost, varijansu i standardnu ​​devijaciju populacije.

Očekivana vrijednost jednaka je zbroju svih vrijednosti opće populacije podijeljene s volumenom opće populacije:

gdje µ - očekivana vrijednost, Xi- i-th varijabla opservacija X, N- obim opšte populacije. U Excelu za izračunavanje matematičko očekivanje koristi se ista funkcija kao i za aritmetičku sredinu: =AVERAGE().

Varijanca stanovništva jednak zbiru kvadrata razlika između elemenata opće populacije i mat. očekivanja podijeljena sa veličinom populacije:

gdje σ2 je varijansa opće populacije. Excel prije verzije 2007 koristi funkciju =VAR() za izračunavanje varijanse populacije, počevši od verzije 2010 =VAR.G().

standardna devijacija populacije jednak je kvadratnom korijenu varijanse populacije:

Excel prije verzije 2007 koristi =STDEV() za izračunavanje standardne devijacije populacije, počevši od verzije 2010 =STDEV.Y(). Imajte na umu da se formule za varijansu populacije i standardnu ​​devijaciju razlikuju od formula za varijansu uzorka i standardnu ​​devijaciju. Prilikom izračunavanja uzorak statistike S2 i S imenilac razlomka je n - 1, a prilikom izračunavanja parametara σ2 i σ - obim opšte populacije N.

pravilo

U većini situacija, veliki dio opažanja koncentrisan je oko medijane, formirajući klaster. U skupovima podataka s pozitivnom asimetrijom, ovaj klaster se nalazi lijevo (tj. ispod) matematičkog očekivanja, a u skupovima s negativnom asimetrijom, ovaj klaster se nalazi desno (tj. iznad) matematičkog očekivanja. Simetrični podaci imaju istu srednju vrijednost i medijanu, a opažanja se grupišu oko srednje vrijednosti, formirajući distribuciju u obliku zvona. Ako distribucija nema izraženu nakrivljenost, a podaci su koncentrirani oko određenog centra gravitacije, za procjenu varijabilnosti može se koristiti pravilo palca koje kaže: ako podaci imaju distribuciju u obliku zvona, onda otprilike 68% zapažanja su manje od jedne standardne devijacije od matematičkog očekivanja, približno 95% zapažanja je unutar dvije standardne devijacije očekivane vrijednosti, a 99,7% zapažanja je unutar tri standardne devijacije očekivane vrijednosti.

Stoga, standardna devijacija, koja je procjena prosječne fluktuacije oko matematičkog očekivanja, pomaže da se razumije kako su opservacije raspoređene i da se identifikuju odstupnici. Iz osnovnog pravila slijedi da se za zvonaste distribucije samo jedna vrijednost od dvadeset razlikuje od matematičkog očekivanja za više od dvije standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 2σ, mogu se smatrati izvanrednim. Osim toga, samo tri od 1000 opservacija razlikuju se od matematičkog očekivanja za više od tri standardne devijacije. Dakle, vrijednosti su izvan intervala µ ± 3σ su skoro uvek van granica. Za distribucije koje su jako nagnute ili nisu u obliku zvona, može se primijeniti Biename-Chebyshev pravilo.

Prije više od stotinu godina, matematičari Bienamay i Chebyshev su nezavisno otkrili korisno svojstvo standardna devijacija. Otkrili su da je za bilo koji skup podataka, bez obzira na oblik distribucije, postotak opažanja koji leže na udaljenosti koja ne prelazi k standardne devijacije od matematičkih očekivanja, ne manje (1 – 1/ 2)*100%.

Na primjer, ako k= 2, Biename-Chebyshev pravilo kaže da najmanje (1 - (1/2) 2) x 100% = 75% opservacija mora ležati u intervalu µ ± 2σ. Ovo pravilo važi za sve k prelazi jedan. Biename-Chebyshev pravilo je vrlo opšti karakter i vrijedi za distribucije bilo koje vrste. To ukazuje minimalni iznos zapažanja, udaljenost od koje do matematičkog očekivanja ne prelazi postavljena vrijednost. Međutim, ako je distribucija u obliku zvona, pravilo palca preciznije procjenjuje koncentraciju podataka oko srednje vrijednosti.

Izračunavanje deskriptivne statistike za distribuciju zasnovanu na frekvenciji

Ako izvorni podaci nisu dostupni, distribucija frekvencija postaje jedini izvor informacija. U takvim situacijama možete izračunati približne vrijednosti kvantitativnih pokazatelja distribucije, kao što su aritmetička sredina, standardna devijacija, kvartili.

Ako su podaci uzorka predstavljeni kao distribucija frekvencije, može se izračunati približna vrijednost aritmetičke sredine, uz pretpostavku da su sve vrijednosti unutar svake klase koncentrisane na sredini klase:

gdje - srednja vrijednost uzorka, n- broj zapažanja ili veličina uzorka, With- broj časova u distribuciji frekvencija, mj- srednja tačka j-ti razred, fj- frekvencija koja odgovara j-th class.

Za izračunavanje standardne devijacije od distribucije frekvencije, također se pretpostavlja da su sve vrijednosti unutar svake klase koncentrisane na sredini klase.

Da bismo razumeli kako se kvartili serije određuju na osnovu učestalosti, razmotrimo izračunavanje donjeg kvartila na osnovu podataka za 2013. o raspodeli ruskog stanovništva prema prosečnom novčanom dohotku po glavi stanovnika (slika 12).

Rice. 12. Udio stanovništva Rusije sa novčanim prihodima po glavi stanovnika u prosjeku mjesečno, rubalja

Za izračunavanje prvog kvartila intervala varijantne serije možete koristiti formulu:

gdje je Q1 vrijednost prvog kvartila, xQ1 je donja granica intervala koji sadrži prvi kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 25%); i je vrijednost intervala; Σf je zbir frekvencija cijelog uzorka; vjerovatno uvijek jednako 100%; SQ1–1 je kumulativna frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil; fQ1 je frekvencija intervala koji sadrži donji kvartil. Formula za treći kvartil razlikuje se po tome što na svim mjestima, umjesto Q1, trebate koristiti Q3, i zamijeniti ¾ umjesto ¼.

U našem primeru (Sl. 12), donji kvartil je u rasponu 7000,1 - 10,000, čija je kumulativna frekvencija 26,4%. Donja granica ovog intervala je 7000 rubalja, vrednost intervala je 3000 rubalja, akumulirana učestalost intervala koji prethodi intervalu koji sadrži donji kvartil je 13,4%, učestalost intervala koji sadrži donji kvartil je 13,0%. Dakle: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 = 9677 rubalja.

Zamke povezane s deskriptivnom statistikom

U ovoj napomeni pogledali smo kako opisati skup podataka koristeći različite statistike koje procjenjuju njegovu srednju vrijednost, raspršivanje i distribuciju. Sljedeći korak je analiza i interpretacija podataka. Do sada smo proučavali objektivna svojstva podataka, a sada prelazimo na njihovu subjektivnu interpretaciju. Istraživača čekaju dvije greške: pogrešno odabran predmet analize i pogrešna interpretacija rezultata.

Analiza učinka 15 vrlo rizičnih investicijskih fondova prilično je nepristrasna. Doveo je do potpuno objektivnih zaključaka: svi zajednički fondovi imaju različite prinose, raspon prinosa fonda kreće se od -6,1 do 18,5, a prosječan prinos je 6,08. Objektivnost analize podataka je osigurana pravi izbor ukupni kvantitativni pokazatelji distribucije. Razmotreno je nekoliko metoda za procjenu srednje vrijednosti i raspršenosti podataka, te su naznačene njihove prednosti i nedostaci. Kako odabrati pravu statistiku koja pruža objektivnu i nepristrasnu analizu? Ako je distribucija podataka malo iskrivljena, treba li odabrati medijan umjesto aritmetičke sredine? Koji indikator preciznije karakterizira širenje podataka: standardna devijacija ili raspon? Treba li naznačiti pozitivnu asistenciju distribucije?

S druge strane, interpretacija podataka je subjektivan proces. Različiti ljudi dolaze do različitih zaključaka, tumačeći iste rezultate. Svako ima svoje gledište. Ukupne prosječne godišnje prinose 15 fondova sa vrlo visokim nivoom rizika neko smatra dobrim i prilično je zadovoljan primljenim prihodima. Drugi mogu misliti da ova sredstva imaju preniske prinose. Dakle, subjektivnost treba nadoknaditi iskrenošću, neutralnošću i jasnoćom zaključaka.

Etička pitanja

Analiza podataka je neraskidivo povezana sa etičkim pitanjima. Treba biti kritičan prema informacijama koje šire novine, radio, televizija i internet. S vremenom ćete naučiti da budete skeptični ne samo prema rezultatima, već i prema ciljevima, predmetu i objektivnosti istraživanja. Čuveni britanski političar Benjamin Disraeli je to najbolje rekao: “Postoje tri vrste laži: laži, proklete laži i statistika”.

Kao što je navedeno u bilješci etička pitanja nastaju prilikom odabira rezultata koje treba prikazati u izvještaju. I pozitivno i negativni rezultati. Osim toga, prilikom izrade izvještaja ili pisanog izvještaja rezultati moraju biti prikazani iskreno, neutralno i objektivno. Razlikujte loše i nepoštene prezentacije. Da biste to učinili, potrebno je utvrditi koje su bile namjere govornika. Ponekad govornik izostavi važne informacije iz neznanja, a ponekad i namjerno (na primjer, ako koristi aritmetičku sredinu da procijeni srednju vrijednost jasno iskrivljenih podataka kako bi dobio željeni rezultat). Takođe je nepošteno potiskivati ​​rezultate koji ne odgovaraju gledištu istraživača.

Korišteni su materijali iz knjige Levin i dr. Statistika za menadžere. - M.: Williams, 2004. - str. 178–209

Funkcija QUARTILE je ostavljena da se kombinuje sa više rane verzije excel

Pretpostavimo da morate pronaći prosječan broj dana za zadatke koje treba da obave različiti zaposlenici. Ili želite da izračunate vremenski interval od 10 godina prosječna temperatura određenog dana. Izračunavanje prosječne vrijednosti niza brojeva na nekoliko načina.

Srednja vrijednost je funkcija mjere centralne tendencije, u kojoj je centar niza brojeva u statistička distribucija. Tri većina zajednički kriterijumi ističu se centralne tendencije.

    Prosjek Aritmetička sredina se izračunava dodavanjem niza brojeva, a zatim dijeljenjem broja tih brojeva. Na primjer, prosjek od 2, 3, 3, 5, 7 i 10 ima 30 podijeljeno sa 6, 5;

    Medijan Srednji broj niza brojeva. Polovina brojeva ima vrijednosti koje su veće od medijane, a polovina brojeva ima vrijednosti koje su manje od medijane. Na primjer, medijan od 2, 3, 3, 5, 7 i 10 je 4.

    Mode Broj koji se najčešće pojavljuje u grupi brojeva. Na primjer način rada 2, 3, 3, 5, 7 i 10 - 3.

Ove tri mjere centralne tendencije simetrične raspodjele niza brojeva su jedna te ista. U asimetričnoj raspodjeli većeg broja brojeva, oni mogu biti različiti.

Izračunajte prosječnu vrijednost ćelija koje se nalaze neprekidno u jednom redu ili jednoj koloni

Uradite sledeće.

Izračunavanje prosjeka rasutih ćelija

Da biste izvršili ovaj zadatak, koristite funkciju PROSJEČNO. Kopirajte donju tabelu na prazan list.

Izračunavanje ponderisanog prosjeka

SUMPRODUCT i iznosi. VOvaj primjer izračunava prosječna cijena jedinice mjere koje se plaćaju kroz tri kupovine, pri čemu je svaka kupovina za različit broj jedinica mjere po različitim cijenama po jedinici.

Kopirajte donju tabelu na prazan list.

Izračunavanje prosječne vrijednosti brojeva, bez uzimanja u obzir nulte vrijednosti

Da biste izvršili ovaj zadatak, koristite funkcije PROSJEČNO i ako. Kopirajte donju tabelu i imajte na umu da je u ovom primjeru, radi lakšeg razumijevanja, kopirajte na prazan list.

Aritmetička sredina u excelu. Excel tabele, su najprikladniji za bilo kakve proračune. Nakon što ste proučili Excel, moći ćete da rješavate zadatke iz hemije, fizike, matematike, geometrije, biologije, statistike, ekonomije i mnoge druge. Čak i ne razmišljamo o tome kakav je moćan alat na našim računarima, što znači da ga ne koristimo u punom potencijalu. Mnogi roditelji misle da je kompjuter samo skupa igračka. Ali uzalud! Naravno, da bi dete zaista učilo o tome, morate sami da naučite kako da radite na tome, a zatim da naučite dete. Pa, ovo je druga tema, ali danas želim s vama razgovarati o tome kako pronaći aritmetičku sredinu u Excelu.

Kako pronaći aritmetičku sredinu u Excelu

Već smo govorili o brzom u Excelu, a danas ćemo govoriti o aritmetičkoj sredini.

Odaberite ćeliju C12 i uz pomoć Čarobnjaci funkcija napišite u njemu formulu za izračunavanje aritmetičke sredine. Da biste to učinili, na standardnoj traci sa alatkama kliknite na dugme - Umetanje funkcije −fx (na gornjoj slici crvena strelica je na vrhu). Otvoriće se dijaloški okvir Funkcija Master .

  • Odaberite u polju KategorijeStatistički ;
  • Na terenu Odaberite funkciju: PROSJEČNO ;
  • Kliknite na dugme uredu .

Otvorit će se sljedeći prozor Argumenti i funkcije .

Na terenu Broj 1 videćete unos S2:S11- program je sam odredio opseg ćelija za koje je to potrebno pronađite aritmetičku sredinu.

Kliknite na dugme uredu i u ćeliji C12 aritmetička sredina rezultata će se pojaviti.

Ispostavilo se da izračunavanje aritmetičke sredine u excelu nije nimalo teško. I uvijek sam se bojao bilo kakvih formula. Eh, nismo u to vrijeme učili.

Ovo procesor tabela nositi se s gotovo svim proračunima. Idealan je za računovodstvo. Za proračune postoje posebni alati - formule. Mogu se primijeniti na raspon ili na pojedinačne ćelije. Da biste saznali minimalni ili maksimalni broj u grupi ćelija, nije ih potrebno sami tražiti. Bolje je koristiti ponuđene opcije za to. Također će biti korisno shvatiti kako izračunati prosječnu vrijednost u Excelu.

Ovo se posebno odnosi na tabele sa velikim količinama podataka. Ako kolona sadrži, na primjer, cijene proizvoda tržni centar. I morate saznati koji je proizvod najjeftiniji. Ako ga tražite "ručno", trebat će vam dosta vremena. Ali u Excelu se to može učiniti u samo nekoliko klikova. Uslužni program također izračunava aritmetičku sredinu. Na kraju krajeva, to su dvije jednostavne operacije: zbrajanje i dijeljenje.

Maksimum i minimum

Evo kako pronaći maksimalna vrijednost u excelu:

  1. Postavite kursor ćelije bilo gdje.
  2. Idite na meni "Formule".
  3. Kliknite na Umetni funkciju.
  4. Odaberite "MAX" sa liste. Ili upišite ovu riječ u polje "Traži" i kliknite na "Pronađi".
  5. U prozoru Argumenti unesite adrese opsega čiju maksimalnu vrijednost želite da znate. U Excelu, nazivi ćelija se sastoje od slova i broja ("B1", "F15", "W34"). A naziv raspona je prva i zadnja ćelija koje su uključene u njega.
  6. Umjesto adrese možete napisati nekoliko brojeva. Tada će sistem pokazati najveći od njih.
  7. Kliknite OK. Rezultat će se pojaviti u ćeliji u kojoj je bio kursor.

Sljedeći korak je specificiranje raspona vrijednosti

Sada će biti lakše shvatiti kako pronaći minimalnu vrijednost u Excelu. Algoritam akcija je potpuno identičan. Jednostavno odaberite "MIN" umjesto "MAX".

Prosjek

Aritmetička sredina se izračunava na sljedeći način: saberite sve brojeve iz skupa i podijelite s njihovim brojem. U Excel-u možete izračunati sume, saznati koliko ćelija ima u nizu i tako dalje. Ali previše je komplikovano i dugo. Treba puno koristiti različite funkcije. Imajte na umu informacije. Ili čak zapišite nešto na komad papira. Ali algoritam se može pojednostaviti.

Evo kako pronaći prosjek u Excelu:

  1. Pomerite kursor ćelije na bilo koju slobodno mjesto stolovi.
  2. Idite na karticu "Formule".
  3. Kliknite na "Insert Function".
  4. Odaberite PROSJEČNO.
  5. Ako ova stavka nije na listi, otvorite je pomoću opcije "Pronađi".
  6. U području Broj1 unesite adresu raspona. Ili upišite nekoliko brojeva u različita polja "Broj2", "Broj3".
  7. Kliknite OK. Željena vrijednost će se pojaviti u ćeliji.

Dakle, možete izvršiti proračune ne samo sa pozicijama u tabeli, već i sa proizvoljnim skupovima. Excel, zapravo, igra ulogu naprednog kalkulatora.

druge metode

Maksimum, minimum i prosjek se mogu pronaći na druge načine.

  1. Pronađite funkcijsku traku s oznakom "Fx". Nalazi se iznad glavnog radnog područja stola.
  2. Postavite kursor u bilo koju ćeliju.
  3. Unesite argument u polje "Fx". Počinje znakom jednakosti. Zatim dolazi formula i adresa opsega/ćelije.
  4. Trebali biste dobiti nešto poput "=MAX(B8:B11)" (maksimum), "=MIN(F7:V11)" (minimum), "=AVERAGE(D14:W15)" (prosjek).
  5. Kliknite na "kvačicu" pored polja funkcije. Ili jednostavno pritisnite Enter. Željena vrijednost će se pojaviti u odabranoj ćeliji.
  6. Formula se može kopirati direktno u samu ćeliju. Učinak će biti isti.

Excel-alat "Autofunkcije" će vam pomoći da pronađete i izračunate.

  1. Postavite kursor u ćeliju.
  2. Pronađite dugme čije ime počinje sa "Auto". Ovo zavisi od podrazumevane opcije izabrane u programu Excel (AutoSum, AutoNumber, AutoOffset, AutoIndex).
  3. Kliknite na crnu strelicu ispod nje.
  4. Odaberite MIN (minimum), MAX (maksimum) ili AVERAGE (prosjek).
  5. Formula će se pojaviti u označenoj ćeliji. Kliknite na bilo koju drugu ćeliju - bit će dodana funkciji. "Prevucite" kutiju oko nje da pokrijete raspon. Ili Ctrl-kliknite na mrežu da odaberete jedan po jedan element.
  6. Kada završite, pritisnite Enter. Rezultat će biti prikazan u ćeliji.

U Excelu je izračunavanje prosjeka prilično jednostavno. Nije potrebno dodavati, a zatim dijeliti iznos. Za to postoji posebna funkcija. Također možete pronaći minimum i maksimum u setu. Mnogo je lakše nego brojati ručno ili tražiti brojeve u ogromnoj tabeli. Stoga je Excel popularan u mnogim oblastima aktivnosti gdje se traži tačnost: poslovanje, revizija, vođenje kadrovske dokumentacije, finansije, trgovina, matematika, fizika, astronomija, ekonomija, nauka.