Biografije Karakteristike Analiza

Kako izračunati prosjek u Excelu. Kako napraviti prosječnu ocjenu u excelu? Standardna metoda izračuna

Kako izračunati prosjek brojeva u Excelu

Pronađite sredinu aritmetički brojevi u Excelu možete koristiti .

Sintaksa PROSJEČNO

=PROSJEK(broj1,[broj2],…) - ruska verzija

Argumenti PROSJEČNI

  • broj 1- prvi broj ili raspon brojeva, za izračunavanje aritmetičke sredine;
  • broj 2(Neobavezno) – drugi broj ili raspon brojeva za izračunavanje aritmetičke sredine. Maksimalni iznos argumenti funkcije - 255.

Da biste izračunali, napravite sljedeće korake:

  • Odaberite bilo koju ćeliju;
  • Napišite formulu u njemu =PROSJEČNO(
  • Odaberite raspon ćelija za koji želite napraviti izračun;
  • Pritisnite tipku "Enter" na tipkovnici

Funkcija će izračunati prosječnu vrijednost u navedenom rasponu među onim ćelijama koje sadrže brojeve.

Kako pronaći prosječnu vrijednost danog teksta

Ako u rasponu podataka ima praznih redaka ili teksta, funkcija ih tretira kao "nula". Ako podaci sadrže booleovski izrazi FALSE ili TRUE, tada funkcija FALSE tretira kao “nula” i TRUE kao “1”.

Kako pronaći aritmetičku sredinu po uvjetu

Funkcija se koristi za izračunavanje prosjeka prema uvjetu ili kriteriju. Na primjer, recimo da imamo podatke o prodaji proizvoda:

Naš zadatak je izračunati prosječnu prodaju olovaka. Da bismo to učinili, poduzet ćemo sljedeće korake:

  • U ćeliji A13 napišite naziv proizvoda "Olovke";
  • U ćeliji B13 unesimo formulu:

=PROSJEČNOIF(A2:A10,A13,B2:B10)

Raspon ćelija" A2:A10” pokazuje na popis proizvoda u kojima ćemo tražiti riječ “olovke”. Argument A13 ovo je poveznica na ćeliju s tekstom koji ćemo tražiti među cjelokupnim popisom proizvoda. Raspon ćelija" B2:B10” je raspon s podacima o prodaji proizvoda, među kojima će funkcija pronaći “Olovke” i izračunati prosječnu vrijednost.


U većini slučajeva podaci su koncentrirani oko neke središnje točke. Dakle, za opisivanje bilo kojeg skupa podataka dovoljno je navesti prosječnu vrijednost. Pogledajmo tri numeričke karakteristike, koji se koriste za procjenu srednje vrijednosti distribucije: aritmetičke sredine, medijana i moda.

Prosječno

Aritmetička sredina (koja se često naziva jednostavno srednja vrijednost) najčešća je procjena srednje vrijednosti distribucije. To je rezultat dijeljenja zbroja svih promatranih brojčane vrijednosti za njihov broj. Za uzorak brojeva X 1, X 2, ..., Xn, srednja vrijednost uzorka (označena simbolom ) jednako \u003d (X 1 + X 2 + ... + Xn) / n, ili

gdje je srednja vrijednost uzorka, n- veličina uzorka, xii-ti element uzorci.

Preuzmite bilješku u ili formatu, primjere u formatu

Razmotrimo izračun prosjeka aritmetička vrijednost petogodišnji prosječni godišnji prinosi 15 investicijskih fondova s ​​vrlo visoka razina rizik (slika 1).

Riža. 1. Prosječni godišnji prinos na 15 vrlo rizičnih investicijskih fondova

Srednja vrijednost uzorka izračunava se na sljedeći način:

Ovo je dobar povrat, posebno u usporedbi s povratom od 3-4% koji su štediše banke ili kreditne unije primili u istom vremenskom razdoblju. Ako sortirate vrijednosti povrata, lako je vidjeti da osam fondova ima prinos iznad, a sedam - ispod prosjeka. Aritmetička sredina djeluje kao ravnotežna točka, tako da fondovi s niskim dohotkom uravnotežuju sredstva s visokim dohotkom. U izračun prosjeka uključeni su svi elementi uzorka. Niti jedan od ostalih procjenitelja srednje vrijednosti raspodjele nema ovo svojstvo.

Kada izračunati aritmetičku sredinu. Budući da aritmetička sredina ovisi o svim elementima uzorka, prisutnost ekstremnih vrijednosti značajno utječe na rezultat. U takvim situacijama, aritmetička sredina može iskriviti značenje brojčanih podataka. Stoga, kada se opisuje skup podataka koji sadrži ekstremne vrijednosti, potrebno je navesti medijan ili aritmetičku sredinu i medijan. Na primjer, ako se iz uzorka izuzme prinos fonda RS za razvoj u razvoju, prosjek uzorka povrata 14 fondova smanjuje se za gotovo 1% na 5,19%.

Medijan

Medijan je srednja vrijednost uređenog niza brojeva. Ako niz ne sadrži ponavljajuće brojeve, tada će polovica njegovih elemenata biti manja, a polovica više od medijana. Ako uzorak sadrži ekstremne vrijednosti, bolje je koristiti medijan umjesto aritmetičke sredine za procjenu srednje vrijednosti. Da bi se izračunao medijan uzorka, najprije se mora sortirati.

Ova formula je dvosmislena. Njegov rezultat ovisi o tome je li broj paran ili neparan. n:

  • Ako uzorak sadrži neparan broj stavki, medijan je (n+1)/2-ti element.
  • Ako uzorak sadrži paran broj elemenata, medijan leži između dva srednja elementa uzorka i jednak je aritmetičkoj sredini izračunatoj za ta dva elementa.

Da bismo izračunali medijan za uzorak od 15 vrlo rizičnih investicijskih fondova, prvo moramo sortirati neobrađene podatke (slika 2). Tada će medijan biti suprotan broju srednjeg elementa uzorka; u našem primjeru broj 8. Excel ima posebnu funkciju =MEDIAN() koja radi i s neuređenim nizovima.

Riža. 2. Medijan 15 fondova

Dakle, medijan je 6,5. To znači da polovica vrlo rizičnih fondova ne prelazi 6,5, dok druga polovica to čini. Imajte na umu da je medijan od 6,5 nešto veći od medijana od 6,08.

Uklonimo li iz uzorka profitabilnost fonda RS Emerging Growth, medijan preostalih 14 fondova će se smanjiti na 6,2%, odnosno ne toliko značajno kao aritmetička sredina (slika 3).

Riža. 3. Medijan 14 fondova

Moda

Pojam je prvi uveo Pearson 1894. Moda je broj koji se najčešće pojavljuje u uzorku (najmoderniji). Moda dobro opisuje, primjerice, tipičnu reakciju vozača na semafor za zaustavljanje prometa. Klasičan primjer korištenje mode - izbor veličine proizvedene serije cipela ili boje pozadine. Ako distribucija ima više načina, onda se kaže da je multimodalna ili multimodalna (ima dva ili više "vrhova"). Multimodalnost distribucije daje važna informacija o prirodi varijable koja se proučava. Na primjer, u sociološkim istraživanjima, ako varijabla predstavlja sklonost ili stav prema nečemu, tada multimodalnost može značiti da postoji nekoliko izrazito različitih mišljenja. Multimodalnost je također pokazatelj da uzorak nije homogen i da opažanja mogu biti generirana pomoću dvije ili više "preklapanih" distribucija. Za razliku od aritmetičke sredine, odstupanja ne utječu na mod. Za kontinuirano distribuirane slučajne varijable, kao što su prosječni godišnji prinosi investicijskih fondova, način rada ponekad uopće ne postoji (ili nema smisla). Budući da ovi pokazatelji mogu poprimiti različite vrijednosti, ponavljajuće vrijednosti su iznimno rijetke.

Kvartili

Kvartili su mjere koje se najčešće koriste za procjenu distribucije podataka kada se opisuju svojstva velikih numeričkih uzoraka. Dok medijan dijeli uređeni niz na pola (50% elemenata niza je manje od medijana, a 50% veće), kvartili dijele uređeni skup podataka na četiri dijela. Vrijednosti Q 1 , medijan i Q 3 su 25., 50. odnosno 75. percentil. Prvi kvartil Q 1 je broj koji dijeli uzorak na dva dijela: 25% elemenata je manje, a 75% je više od prvog kvartil.

Treći kvartil Q 3 je broj koji također dijeli uzorak na dva dijela: 75% elemenata je manje od, a 25% više od trećeg kvartila.

Za izračunavanje kvartila u verzijama Excela prije 2007. korištena je funkcija =QUARTILE(niz, dio). Počevši od Excela 2010, primjenjuju se dvije funkcije:

  • =QUARTILE.ON(niz, dio)
  • =QUARTILE.EXC(niz, dio)

Ove dvije funkcije daju malo razna značenja(slika 4). Na primjer, pri izračunu kvartila uzorka koji sadrži podatke o prosječnom godišnjem povratu 15 vrlo rizičnih investicijskih fondova, Q 1 = 1,8 ili -0,7 za QUARTILE.INC i QUARTILE.EXC, respektivno. Usput, ranije korištena funkcija QUARTILE odgovara moderna funkcija KVARTIL NA Za izračunavanje kvartila u Excelu pomoću gornjih formula, niz podataka se može ostaviti neuređenim.

Riža. 4. Izračunajte kvartile u Excelu

Još jednom naglasimo. Excel može izračunati kvartile za univarijaciju diskretne serije , koji sadrži vrijednosti nasumična varijabla. Izračun kvartila za distribuciju temeljenu na frekvenciji dan je u odjeljku ispod.

geometrijska sredina

Za razliku od aritmetičke sredine, geometrijska sredina mjeri koliko se varijabla promijenila tijekom vremena. Geometrijska sredina je korijen n stupnja od proizvoda n vrijednosti (u Excelu se koristi funkcija = CUGEOM):

G= (X 1 * X 2 * ... * X n) 1/n

Sličan parametar je prosjek geometrijska vrijednost stopa povrata određena je formulom:

G \u003d [(1 + R 1) * (1 + R 2) * ... * (1 + R n)] 1 / n - 1,

gdje R i- stopa povrata i-to razdoblje.

Na primjer, pretpostavimo da je početno ulaganje 100 000 USD. Do kraja prve godine padne na 50 000 USD, a do kraja druge godine oporavlja se na izvornih 100 000 USD. Stopa povrata na ovo ulaganje tijekom dva- godine razdoblje je jednako 0, budući da su početni i konačni iznos sredstava međusobno jednaki. Međutim, aritmetička sredina godišnje stope dobit je = (-0,5 + 1) / 2 = 0,25 ili 25%, budući da je stopa povrata u prvoj godini R 1 = (50.000 - 100.000) / 100.000 = -0.5, au drugoj R 2 = (100.000 – 50.000) / 50.000 = 1. Istovremeno, geometrijska sredina stope povrata za dvije godine je: G = [(1–0,5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Dakle, geometrijska sredina točnije odražava promjenu (točnije, bez promjene) u obujmu ulaganja tijekom dvogodišnjeg razdoblja od aritmetičke sredine.

Zanimljivosti. Prvo, geometrijska sredina uvijek će biti manja od aritmetičke sredine istih brojeva. Osim u slučaju kada su svi uzeti brojevi međusobno jednaki. Drugo, s obzirom na svojstva pravokutni trokut, možete razumjeti zašto se sredina naziva geometrijska. Visina pravokutnog trokuta, spuštenog na hipotenuzu, prosječna je proporcionalna vrijednost između projekcija kateta na hipotenuzu, a svaka kateta je prosječna proporcionalna između hipotenuze i njezine projekcije na hipotenuzu (slika 5.). To daje geometrijski način konstruiranja geometrijske sredine dvaju (dužina) segmenata: trebate izgraditi krug na zbroju ta dva segmenta kao promjer, zatim visinu, vraćenu od točke njihove veze do sjecišta s krug, dat će željenu vrijednost:

Riža. 5. Geometrijska priroda geometrijske sredine (slika s Wikipedije)

Drugi važno vlasništvo brojčani podaci – njihovi varijacija karakterizira stupanj disperzije podataka. Dva različita uzorka mogu se razlikovati i u srednjim vrijednostima i u varijacijama. Međutim, kao što je prikazano na sl. 6 i 7, dva uzorka mogu imati istu varijaciju, ali različita sredina, ili istu srednju vrijednost i potpuno različitu varijaciju. Podaci koji odgovaraju poligonu B na Sl. 7 mijenjaju mnogo manje od podataka iz kojih je izgrađen poligon A.

Riža. 6. Dvije simetrične distribucije u obliku zvona s istim širenjem i različitim srednjim vrijednostima

Riža. 7. Dvije simetrične distribucije u obliku zvona s istim srednjim vrijednostima i različitim raspršivanjem

Postoji pet procjena varijacije podataka:

opseg

Raspon je razlika između najvećeg i najmanjeg elementa uzorka:

Prevucite prstom = XMax-XMin

Raspon uzorka koji sadrži podatke o prosječnim godišnjim prinosima 15 vrlo rizičnih investicijskih fondova može se izračunati pomoću uređenog niza (vidi sliku 4): raspon = 18,5 - (-6,1) = 24,6. To znači da je razlika između najvećeg i najnižeg prosječnog godišnjeg prinosa za vrlo rizične fondove 24,6%.

Raspon mjeri ukupnu rasprostranjenost podataka. Iako je raspon uzorka vrlo jednostavna procjena ukupnog širenja podataka, njegova je slabost u tome što ne uzima u obzir točno kako su podaci raspoređeni između minimalnih i maksimalnih elemenata. Ovaj učinak je dobro vidljiv na sl. 8 koja ilustrira uzorke koji imaju isti raspon. B skala pokazuje da ako uzorak sadrži barem jednu ekstremnu vrijednost, raspon uzorka je vrlo netočna procjena raspršenosti podataka.

Riža. 8. Usporedba triju uzoraka istog raspona; trokut simbolizira potporu ravnoteže, a njegov položaj odgovara prosječnoj vrijednosti uzorka

Interkvartilni Raspon

Interkvartil ili srednji raspon je razlika između trećeg i prvog kvartila uzorka:

Interkvartilni raspon \u003d Q 3 - Q 1

Ova vrijednost omogućuje procjenu širenja 50% elemenata i ne uzima u obzir utjecaj ekstremnih elemenata. Interkvartilni raspon za uzorak koji sadrži podatke o prosječnim godišnjim prinosima 15 vrlo rizičnih investicijskih fondova može se izračunati pomoću podataka na Sl. 4 (na primjer, za funkciju QUARTILE.EXC): Interkvartilni raspon = 9,8 - (-0,7) = 10,5. Interval između 9,8 i -0,7 često se naziva srednjom polovicom.

Treba napomenuti da vrijednosti Q 1 i Q 3, a time i interkvartilni raspon, ne ovise o prisutnosti izvanrednih vrijednosti, budući da njihov izračun ne uzima u obzir nijednu vrijednost koja bi bila manja od Q 1 ili veća od Q 3 . Ukupno kvantitativne karakteristike, kao što su medijan, prvi i treći kvartil i interkvartilni raspon, na koje ne utječu izvanredni vrijednosti, nazivaju se robusnim mjerama.

Dok raspon i interkvartilni raspon daju procjenu ukupnog i srednjeg raspršenosti uzorka, respektivno, nijedna od ovih procjena ne uzima u obzir kako su podaci točno raspoređeni. Varijanca i standardna devijacija oslobođeni ovog nedostatka. Ovi pokazatelji omogućuju procjenu stupnja fluktuacije podataka oko srednje vrijednosti. Varijanca uzorka je aproksimacija aritmetičke sredine izračunate iz kvadrata razlika između svakog elementa uzorka i srednje vrijednosti uzorka. Za uzorak od X 1 , X 2 , ... X n varijansa uzorka (označena simbolom S 2 data je sljedećom formulom:

NA opći slučaj Varijanca uzorka je zbroj kvadrata razlika između elemenata uzorka i srednje vrijednosti uzorka, podijeljen s vrijednošću jednakom veličini uzorka minus jedan:

gdje - aritmetička sredina, n- veličina uzorka, X i - i-ti element uzorka x. U Excelu prije verzije 2007 za izračun varijance uzorka korištena je funkcija =VAR(), od verzije 2010 koristi se funkcija =VAR.B().

Najpraktičnija i najprihvaćenija procjena raspršenosti podataka je standard selektivno odstupanje . Ovaj indikator je označen simbolom S i jednak je korijen iz varijance uzorka:

U Excelu prije verzije 2007, funkcija =STDEV() korištena je za izračunavanje standardne devijacije, od verzije 2010 koristi se funkcija =STDEV.B(). Za izračunavanje ovih funkcija, niz podataka može biti neuređen.

Ni varijanca uzorka ni standardna devijacija uzorka ne mogu biti negativni. Jedina situacija u kojoj indikatori S 2 i S mogu biti nula je ako su svi elementi uzorka jednaki. U ovome potpuno nevjerojatan slučaj raspon i interkvartilni raspon su također nula.

Numerički podaci su inherentno promjenjivi. Bilo koja varijabla može preuzeti skup različite vrijednosti. Na primjer, različiti investicijski fondovi imaju različite stope povrata i gubitka. Zbog varijabilnosti brojčanih podataka vrlo je važno proučavati ne samo procjene srednje vrijednosti koje su sumativne prirode, već i procjene varijance koje karakteriziraju raspršenost podataka.

Varijanca i standardna devijacija omogućuju nam procjenu širenja podataka oko srednje vrijednosti, drugim riječima, da odredimo koliko je elemenata uzorka manje od srednje vrijednosti, a koliko veće. Disperzija ima nešto vrijedno matematička svojstva. Međutim, njegova vrijednost je kvadrat mjerne jedinice - kvadratni postotak, kvadratni dolar, kvadratni inč itd. Stoga je prirodna procjena varijance standardna devijacija, koja se izražava u uobičajenim mjernim jedinicama – postocima prihoda, dolarima ili inčima.

Standardna devijacija omogućuje procjenu količine fluktuacije elemenata uzorka oko srednje vrijednosti. U gotovo svim situacijama, većina promatranih vrijednosti leži unutar plus ili minus jednog standardnog odstupanja od srednje vrijednosti. Stoga je, poznavajući aritmetičku sredinu elemenata uzorka i standardnu ​​devijaciju uzorka, moguće odrediti interval kojem pripada većina podataka.

Standardna devijacija prinosa na 15 vrlo rizičnih investicijskih fondova iznosi 6,6 (Slika 9). To znači da se profitabilnost najvećeg dijela sredstava razlikuje od prosječne vrijednosti za najviše 6,6% (tj. varira u rasponu od – S= 6,2 – 6,6 = –0,4 do +S= 12,8). Zapravo, ovaj interval sadrži petogodišnji prosječni godišnji prinos od 53,3% (8 od 15) sredstava.

Riža. 9. Standardna devijacija

Imajte na umu da u procesu zbrajanja kvadrata razlika stavke koje su dalje od srednje vrijednosti dobivaju veću težinu od stavki koje su bliže. Ovo svojstvo je glavni razlog zašto se aritmetička sredina najčešće koristi za procjenu sredine distribucije.

Koeficijent varijacije

Za razliku od prethodnih procjena raspršenosti, koeficijent varijacije je relativna procjena. Uvijek se mjeri kao postotak, a ne u izvornim jedinicama podataka. Koeficijent varijacije, označen simbolima CV, mjeri raspršivanje podataka oko srednje vrijednosti. Koeficijent varijacije jednak je standardnoj devijaciji podijeljenoj s aritmetičkom sredinom i pomnoženoj sa 100%:

gdje S- standardna devijacija uzorka, - srednja vrijednost uzorka.

Koeficijent varijacije omogućuje vam usporedbu dvaju uzoraka, čiji su elementi izraženi u različitim mjernim jedinicama. Primjerice, voditelj službe dostave pošte namjerava nadograditi vozni park kamiona. Prilikom utovara paketa potrebno je uzeti u obzir dvije vrste ograničenja: težinu (u funtama) i volumen (u kubičnim stopama) svakog paketa. Pretpostavimo da je u uzorku od 200 vrećica prosječna težina 26,0 funti, standardna devijacija težine 3,9 funti, prosječni volumen pakiranja 8,8 kubičnih stopa, a standardna devijacija volumena 2,2 kubične stope. Kako usporediti širinu težine i volumena paketa?

Budući da se mjerne jedinice za težinu i volumen razlikuju jedna od druge, upravitelj mora usporediti relativni raspon ovih vrijednosti. Koeficijent varijacije težine je CV W = 3,9 / 26,0 * 100% = 15%, a koeficijent varijacije volumena CV V = 2,2 / 8,8 * 100% = 25% . Dakle, relativni raspršivanje volumena paketa mnogo je veće od relativnog raspršenja njihovih težina.

Obrazac za distribuciju

Treće važno svojstvo uzorka je oblik njegove distribucije. Ova raspodjela može biti simetrična ili asimetrična. Za opisivanje oblika distribucije potrebno je izračunati njezinu srednju vrijednost i medijan. Ako su ove dvije mjere iste, kaže se da je varijabla simetrično raspoređena. Ako je srednja vrijednost varijable veća od medijana, njena distribucija ima pozitivnu asistenciju (slika 10.). Ako je medijan veći od srednje vrijednosti, distribucija varijable je negativno iskrivljena. Pozitivna iskrivljenost nastaje kada se srednja vrijednost poveća na neobično visoke vrijednosti. Negativna iskrivljenost nastaje kada se srednja vrijednost smanji na neobično male vrijednosti. Varijabla je simetrično raspoređena ako ne poprima nikakve ekstremne vrijednosti ni u jednom smjeru, tako da se velike i male vrijednosti varijable međusobno poništavaju.

Riža. 10. Tri vrste distribucija

Podaci prikazani na A ljestvici imaju negativnu asistenciju. Ova slika prikazuje dugi rep i lijevu kosinu uzrokovanu neobično malim vrijednostima. Ove iznimno male vrijednosti pomiču srednju vrijednost ulijevo i ona postaje manja od medijane. Podaci prikazani na skali B raspoređeni su simetrično. Lijeva i desna polovica distribucije su svoje zrcalne refleksije. Velike i male vrijednosti se međusobno balansiraju, a srednja vrijednost i medijan su jednaki. Podaci prikazani na ljestvici B imaju pozitivnu asistenciju. Ova slika prikazuje dugi rep i zakrivljenost udesno, uzrokovano prisutnošću neobično visokih vrijednosti. Ove prevelike vrijednosti pomiču srednju vrijednost udesno i ona postaje veća od medijane.

U Excelu se deskriptivna statistika može dobiti pomoću dodatka Paket analize. Prođite kroz izbornik PodaciAnaliza podataka, u prozoru koji se otvori odaberite liniju Opisne statistike i kliknite U redu. U prozoru Opisne statistike obavezno naznačite ulazni interval(slika 11). Ako želite vidjeti deskriptivnu statistiku na istom listu kao i izvorni podaci, odaberite radio gumb izlazni interval i odredite ćeliju u koju želite smjestiti lijevo gornji kut izlazne statistike (u našem primjeru $C$1). Ako želite poslati podatke na novi list ili u nova knjiga jednostavno odaberite odgovarajući radio gumb. Označite okvir pored Konačna statistika. Po želji, također možete birati Razina težine,k-ti najmanji ik-ti najveći.

Ako je na depozit Podaci na području Analiza ne vidite ikonu Analiza podataka, prvo morate instalirati dodatak Paket analize(vidi, na primjer,).

Riža. 11. Deskriptivna statistika petogodišnjih prosječnih godišnjih prinosa sredstava s vrlo visokim razinama rizika, izračunata pomoću dodatka Analiza podataka Excel programi

Excel izračunava cijela linija gore razmotrene statistike: srednja vrijednost, medijan, mod, standardna devijacija, varijanca, raspon ( interval), minimalna, maksimalna i veličina uzorka ( ček). Osim toga, Excel za nas izračunava neke nove statističke podatke: standardnu ​​pogrešku, eksces i iskrivljenost. standardna pogreška jednaka je standardnoj devijaciji podijeljenoj s kvadratnim korijenom veličine uzorka. asimetrija karakterizira odstupanje od simetrije distribucije i funkcija je koja ovisi o kocki razlika između elemenata uzorka i srednje vrijednosti. Kurtosis je mjera relativne koncentracije podataka oko srednje vrijednosti naspram repova distribucije, a ovisi o razlikama između uzorka i srednje vrijednosti podignute na četvrtu potenciju.

izračun opisne statistike za populacija

Srednja vrijednost, raspršivanje i oblik distribucije o kojoj se gore raspravljalo su karakteristike temeljene na uzorku. Međutim, ako skup podataka sadrži numerička mjerenja cijele populacije, tada se njegovi parametri mogu izračunati. Ovi parametri uključuju srednju vrijednost, varijancu i standardnu ​​devijaciju populacije.

Očekivana vrijednost jednak je zbroju svih vrijednosti opće populacije podijeljen s volumenom opće populacije:

gdje µ - očekivana vrijednost, xi- i-th varijabla promatranje x, N- volumen opće populacije. U Excelu za izračunavanje matematičko očekivanje koristi se ista funkcija kao i za aritmetičku sredinu: =AVERAGE().

Varijanca stanovništva jednak zbroju kvadrata razlika između elemenata opće populacije i mat. očekivanja podijeljena s veličinom stanovništva:

gdje σ2 je varijanca opće populacije. Excel prije verzije 2007 koristi funkciju =VAR() za izračunavanje varijance populacije, počevši od verzije 2010 =VAR.G().

standardna devijacija populacije jednak je kvadratnom korijenu varijance populacije:

Prije Excel 2007, funkcija =SDV() korištena je za izračunavanje standardne devijacije populacije, od verzije 2010 =SDV.Y(). Imajte na umu da se formule za varijance populacije i standardnu ​​devijaciju razlikuju od formula za varijance uzorka i standardnu ​​devijaciju. Prilikom izračunavanja uzorak statistike S2 i S nazivnik razlomka je n - 1, a pri izračunu parametara σ2 i σ - volumen opće populacije N.

pravilo

U većini situacija veliki je udio opažanja koncentriran oko medijane, tvoreći klaster. U skupovima podataka s pozitivnom asimetrijom, ovaj se klaster nalazi lijevo (tj. ispod) matematičkog očekivanja, a u skupovima s negativnom asimetrijom, ovaj se klaster nalazi desno (tj. iznad) od matematičkog očekivanja. Simetrični podaci imaju istu srednju vrijednost i medijan, a opažanja se grupišu oko srednje vrijednosti, tvoreći distribuciju u obliku zvona. Ako distribucija nema izraženu zakrivljenost, a podaci su koncentrirani oko određenog težišta, za procjenu varijabilnosti može se koristiti pravilo palca koje kaže: ako podaci imaju distribuciju u obliku zvona, onda otprilike 68% opažanja su manje od jedne standardne devijacije od matematičkog očekivanja, približno 95% opažanja je unutar dvije standardne devijacije očekivane vrijednosti, a 99,7% opažanja unutar tri standardne devijacije očekivane vrijednosti.

Dakle, standardna devijacija, koja je procjena prosječne fluktuacije oko matematičkog očekivanja, pomaže razumjeti kako su promatranja raspoređena i identificirati vanjske vrijednosti. Iz osnovnog pravila slijedi da se za zvonaste distribucije samo jedna vrijednost od dvadeset razlikuje od matematičkog očekivanja za više od dvije standardne devijacije. Stoga su vrijednosti izvan intervala µ ± 2σ, mogu se smatrati izvanrednim. Osim toga, samo tri od 1000 opažanja razlikuju se od matematičkog očekivanja za više od tri standardne devijacije. Dakle, vrijednosti izvan intervala µ ± 3σ su gotovo uvijek izvan granica. Za distribucije koje su jako zakrivljene ili nisu zvonaste, može se primijeniti Biename-Chebyshev pravilo.

Prije više od stotinu godina, matematičari Bienamay i Chebyshev neovisno su otkrili korisno svojstvo standardna devijacija. Otkrili su da za bilo koji skup podataka, bez obzira na oblik distribucije, postotak opažanja koji leže na udaljenosti ne većoj od k standardna odstupanja od matematičkih očekivanja, ne manja (1 – 1/ 2)*100%.

Na primjer, ako k= 2, pravilo Biename-Chebyshev kaže da najmanje (1 - (1/2) 2) x 100% = 75% promatranja mora ležati u intervalu µ ± 2σ. Ovo pravilo vrijedi za sve k prelazi jedan. Biename-Chebyshev pravilo je vrlo opći karakter i vrijedi za distribucije bilo koje vrste. To ukazuje minimalni iznos promatranja, udaljenost od koje do matematičkog očekivanja ne prelazi postavljena vrijednost. Međutim, ako je raspodjela u obliku zvona, pravilo palca točnije procjenjuje koncentraciju podataka oko srednje vrijednosti.

Izračunavanje deskriptivne statistike za distribuciju temeljenu na frekvenciji

Ako izvorni podaci nisu dostupni, distribucija frekvencija postaje jedini izvor informacija. U takvim situacijama moguće je izračunati približne vrijednosti kvantitativnih pokazatelja distribucije, kao što su aritmetička sredina, standardna devijacija, kvartili.

Ako su podaci uzorka prikazani kao distribucija frekvencije, može se izračunati približna vrijednost aritmetičke sredine, uz pretpostavku da su sve vrijednosti unutar svake klase koncentrirane na središnjoj točki klase:

gdje - srednja vrijednost uzorka, n- broj opažanja ili veličina uzorka, S- broj razreda u frekvencijskoj distribuciji, mj- srednja točka j-ti razred, fj- frekvencija koja odgovara j-ti razred.

Za izračunavanje standardne devijacije od distribucije frekvencije, također se pretpostavlja da su sve vrijednosti unutar svake klase koncentrirane na središnjoj točki klase.

Da bismo razumjeli kako se kvartili serije određuju na temelju učestalosti, razmotrimo izračun donjeg kvartila na temelju podataka za 2013. o raspodjeli ruskog stanovništva prema prosječnom novčanom dohotku po stanovniku (slika 12.).

Riža. 12. Udio stanovništva Rusije s novčanim dohotkom po glavi stanovnika u prosjeku mjesečno, rubalja

Za izračunavanje prvog kvartila intervala varijacijski niz možete koristiti formulu:

gdje je Q1 vrijednost prvog kvartila, xQ1 je donja granica intervala koji sadrži prvi kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 25%); i je vrijednost intervala; Σf je zbroj frekvencija cijelog uzorka; vjerojatno uvijek jednako 100%; SQ1–1 je kumulativna učestalost intervala koji prethodi intervalu koji sadrži donji kvartil; fQ1 je frekvencija intervala koji sadrži donji kvartil. Formula za treći kvartil razlikuje se po tome što na svim mjestima, umjesto Q1, trebate koristiti Q3 i zamijeniti ¾ umjesto ¼.

U našem primjeru (slika 12.) donji kvartil je u rasponu 7000,1 - 10 000, čija je kumulativna frekvencija 26,4%. Donja granica ovog intervala je 7000 rubalja, vrijednost intervala je 3000 rubalja, akumulirana učestalost intervala koji prethodi intervalu koji sadrži donji kvartil je 13,4%, učestalost intervala koji sadrži donji kvartil je 13,0%. Dakle: Q1 \u003d 7000 + 3000 * (¼ * 100 - 13,4) / 13 \u003d 9677 rubalja.

Zamke povezane s deskriptivnom statistikom

U ovoj smo bilješci pogledali kako opisati skup podataka koristeći različite statistike koje procjenjuju njegovu srednju vrijednost, raspršivanje i distribuciju. Sljedeći korak je analiza i interpretacija podataka. Do sada smo proučavali objektivna svojstva podataka, a sada prelazimo na njihovu subjektivnu interpretaciju. Istraživača čekaju dvije pogreške: pogrešno odabran predmet analize i netočna interpretacija rezultata.

Analiza uspješnosti 15 vrlo rizičnih investicijskih fondova prilično je nepristrana. Doveo je do potpuno objektivnih zaključaka: svi investicijski fondovi imaju različite prinose, raspon prinosa fondova kreće se od -6,1 do 18,5, a prosječni prinos je 6,08. Objektivnost analize podataka je osigurana pravi izbor ukupni kvantitativni pokazatelji distribucije. Razmotreno je nekoliko metoda za procjenu srednje vrijednosti i raspršenosti podataka te su naznačene njihove prednosti i nedostaci. Kako odabrati pravu statistiku koja pruža objektivnu i nepristranu analizu? Ako je distribucija podataka malo iskrivljena, treba li medijan odabrati umjesto aritmetičke sredine? Koji pokazatelj točnije karakterizira širenje podataka: standardna devijacija ili raspon? Treba li naznačiti pozitivnu neravninu distribucije?

S druge strane, interpretacija podataka subjektivan je proces. Razliciti ljudi dolaze do različitih zaključaka, tumačeći iste rezultate. Svatko ima svoje stajalište. Ukupne prosječne godišnje prinose 15 fondova s ​​vrlo visokom razinom rizika netko smatra dobrim i prilično je zadovoljan primljenim prihodima. Drugi mogu misliti da ta sredstva imaju preniske povrate. Dakle, subjektivnost treba nadoknaditi iskrenošću, neutralnošću i jasnoćom zaključaka.

Etički problemi

Analiza podataka neraskidivo je povezana s etičkim pitanjima. Treba biti kritičan prema informacijama koje šire novine, radio, televizija i internet. S vremenom ćete naučiti biti skeptični ne samo prema rezultatima, već i prema ciljevima, predmetu i objektivnosti istraživanja. Poznati britanski političar Benjamin Disraeli je to najbolje rekao: "Postoje tri vrste laži: laž, proklete laži i statistika."

Kako je navedeno u bilješci etički problemi nastaju pri odabiru rezultata koji bi trebali biti prikazani u izvješću. I pozitivne i negativni rezultati. Osim toga, prilikom izrade izvješća ili pisanog izvješća, rezultati moraju biti prikazani iskreno, neutralno i objektivno. Razlikujte loše i nepoštene prezentacije. Da biste to učinili, potrebno je utvrditi koje su bile namjere govornika. Ponekad govornik izostavlja važne informacije iz neznanja, a ponekad i namjerno (na primjer, ako koristi aritmetičku sredinu za procjenu sredine jasno iskrivljenih podataka kako bi dobio željeni rezultat). Također je nepošteno potiskivati ​​rezultate koji ne odgovaraju stajalištu istraživača.

Materijali iz knjige Levin i dr. Koristi se statistika za menadžere. - M.: Williams, 2004. - str. 178–209 (prikaz, stručni).

Funkcija QUARTILE se može kombinirati s više ranim verzijama excel

Pretpostavimo da trebate pronaći prosječan broj dana za izvršavanje zadataka od strane različitih zaposlenika. Ili želite izračunati vremenski interval od 10 godina Prosječna temperatura na određeni dan. Izračunavanje prosječne vrijednosti niza brojeva na nekoliko načina.

Srednja vrijednost je funkcija mjere središnje tendencije, u kojoj je središte niza brojeva u statistička distribucija. Tri većine zajednički kriteriji ističu se središnje tendencije.

    Prosječno Aritmetička sredina izračunava se zbrajanjem niza brojeva, a zatim dijeljenjem broja tih brojeva. Na primjer, prosjek od 2, 3, 3, 5, 7 i 10 ima 30 podijeljeno sa 6, 5;

    Medijan Srednji broj niza brojeva. Polovica brojeva ima vrijednosti koje su veće od medijana, a polovica brojeva ima vrijednosti koje su manje od medijana. Na primjer, medijan od 2, 3, 3, 5, 7 i 10 je 4.

    Način rada Broj koji se najčešće pojavljuje u skupini brojeva. Na primjer način rada 2, 3, 3, 5, 7 i 10 - 3.

Ove tri mjere središnje tendencije simetrične raspodjele niza brojeva su jedna te ista. U asimetričnoj raspodjeli više brojeva, oni mogu biti različiti.

Izračunajte prosječnu vrijednost ćelija koje se nalaze neprekidno u jednom retku ili jednom stupcu

Učinite sljedeće.

Izračunavanje prosjeka raspršenih stanica

Da biste izvršili ovaj zadatak, koristite funkciju PROSJEČAN. Kopirajte donju tablicu na prazan list.

Izračunavanje ponderiranog prosjeka

ZBIRNI PROIZVOD i iznosi. VOvaj primjer izračunava Prosječna cijena jedinice mjere koje se plaćaju u tri kupnje, pri čemu je svaka kupnja za različit broj mjernih jedinica po različitim cijenama po jedinici.

Kopirajte donju tablicu na prazan list.

Izračun prosječne vrijednosti brojeva, bez uzimanja u obzir nulte vrijednosti

Da biste izvršili ovaj zadatak, koristite funkcije PROSJEČAN i ako. Kopirajte donju tablicu i imajte na umu da je u ovom primjeru, radi lakšeg razumijevanja, kopirajte na prazan list.

Aritmetička sredina u excelu. Excel proračunske tablice, su najprikladniji za sve izračune. Nakon što ste proučili Excel, moći ćete rješavati probleme iz kemije, fizike, matematike, geometrije, biologije, statistike, ekonomije i mnoge druge. Ne razmišljamo ni o tome kakav je moćan alat na našim računalima, što znači da ga ne koristimo u punom potencijalu. Mnogi roditelji misle da je računalo samo skupa igračka. Ali uzalud! Naravno, da bi dijete stvarno učilo na tome, sami morate naučiti kako raditi na tome, a zatim učiti dijete. Pa, ovo je druga tema, ali danas želim razgovarati s vama o tome kako pronaći aritmetičku sredinu u Excelu.

Kako pronaći aritmetičku sredinu u Excelu

Već smo govorili o brzom u Excelu, a danas ćemo govoriti o aritmetičkoj sredini.

Odaberite ćeliju C12 i uz pomoć Čarobnjaci za funkcije upišite u njega formulu za izračunavanje aritmetičke sredine. Da biste to učinili, na standardnoj alatnoj traci kliknite na gumb - Umetanje funkcije −fx (na gornjoj slici crvena strelica je na vrhu). Otvorit će se dijaloški okvir Funkcija Master .

  • Odaberite u polju KategorijeStatistički ;
  • U polju Odaberite funkciju: PROSJEČAN ;
  • Kliknite gumb u redu .

Otvorit će se sljedeći prozor Argumenti i funkcije .

U polju Broj 1 vidjet ćete unos S2:S11- sam program odredio je raspon ćelija za koje je to potrebno pronaći aritmetičku sredinu.

Kliknite gumb u redu i u ćeliji C12 pojavit će se aritmetička sredina rezultata.

Ispada da izračunavanje aritmetičke sredine u excelu nije nimalo teško. I uvijek sam se bojao bilo kakvih formula. Eh, u to vrijeme nismo mi učili.

Ovaj procesor proračunskih tablica nositi se s gotovo svim izračunima. Idealan je za računovodstvo. Za izračune postoje posebni alati - formule. Mogu se primijeniti na raspon ili na pojedinačne ćelije. Da biste saznali minimalni ili maksimalni broj u skupini ćelija, nije ih potrebno sami tražiti. Za to je bolje koristiti ponuđene opcije. Također će biti korisno shvatiti kako izračunati prosječnu vrijednost u Excelu.

To je osobito istinito u tablicama s velikim količinama podataka. Ako stupac sadrži, na primjer, cijene proizvoda šoping centar. I trebate saznati koji je proizvod najjeftiniji. Ako ga tražite "ručno", trebat će vam puno vremena. Ali u Excelu se to može učiniti u samo nekoliko klikova. Uslužni program također izračunava aritmetičku sredinu. Uostalom, to su dvije jednostavne operacije: zbrajanje i dijeljenje.

Maksimum i minimum

Evo kako pronaći maksimalna vrijednost u excelu:

  1. Postavite kursor ćelije bilo gdje.
  2. Idite na izbornik "Formule".
  3. Kliknite Umetni funkciju.
  4. Odaberite "MAX" s popisa. Ili upišite ovu riječ u polje "Traži" i kliknite "Pronađi".
  5. U prozoru Argumenti unesite adrese raspona čiju maksimalnu vrijednost želite znati. U Excelu se nazivi ćelija sastoje od slova i broja ("B1", "F15", "W34"). A naziv raspona je prva i posljednja ćelija koje su uključene u njega.
  6. Umjesto adrese možete napisati nekoliko brojeva. Tada će sustav pokazati najveći od njih.
  7. Kliknite OK. Rezultat će se pojaviti u ćeliji gdje je bio kursor.

Sljedeći korak je određivanje raspona vrijednosti

Sada će biti lakše shvatiti kako pronaći minimalnu vrijednost u Excelu. Algoritam radnji je potpuno identičan. Jednostavno odaberite "MIN" umjesto "MAX".

Prosječno

Aritmetička sredina se izračunava na sljedeći način: zbrojite sve brojeve iz skupa i podijelite s njihovim brojem. U Excelu možete izračunati zbrojeve, saznati koliko je ćelija u nizu i tako dalje. Ali previše je komplicirano i dugo. Treba puno koristiti različite funkcije. Imajte na umu informacije. Ili čak zapišite nešto na komad papira. Ali algoritam se može pojednostaviti.

Evo kako pronaći prosjek u Excelu:

  1. Pomaknite kursor ćelije na bilo koju slobodno mjesto tablice.
  2. Idite na karticu "Formule".
  3. Kliknite na "Insert Function".
  4. Odaberite PROSJEČNO.
  5. Ako ove stavke nema na popisu, otvorite je pomoću opcije "Pronađi".
  6. U području Broj1 unesite adresu raspona. Ili upišite nekoliko brojeva u različita polja "Broj2", "Broj3".
  7. Kliknite OK. Željena vrijednost će se pojaviti u ćeliji.

Dakle, možete izvršiti izračune ne samo s pozicijama u tablici, već i s proizvoljnim skupovima. Excel, naime, igra ulogu naprednog kalkulatora.

druge metode

Maksimum, minimum i prosjek mogu se pronaći i na druge načine.

  1. Pronađite funkcijsku traku s oznakom "Fx". Nalazi se iznad glavnog radnog područja stola.
  2. Postavite kursor u bilo koju ćeliju.
  3. Unesite argument u polje "Fx". Počinje znakom jednakosti. Zatim dolazi formula i adresa raspona/ćelije.
  4. Trebali biste dobiti nešto poput "=MAX(B8:B11)" (maksimum), "=MIN(F7:V11)" (minimum), "=AVERAGE(D14:W15)" (prosjek).
  5. Kliknite na "kvačicu" pored polja funkcije. Ili jednostavno pritisnite Enter. Željena vrijednost će se pojaviti u odabranoj ćeliji.
  6. Formula se može kopirati izravno u samu ćeliju. Učinak će biti isti.

Excel-alat "Autofunkcije" pomoći će pronaći i izračunati.

  1. Postavite kursor u ćeliju.
  2. Pronađite gumb čiji naziv počinje s "Auto". To ovisi o zadanoj opciji odabranoj u Excelu (AutoSum, AutoNumber, AutoOffset, AutoIndex).
  3. Kliknite na crnu strelicu ispod nje.
  4. Odaberite MIN (minimum), MAX (maksimum) ili AVERAGE (prosjek).
  5. Formula će se pojaviti u označenoj ćeliji. Kliknite na bilo koju drugu ćeliju - bit će dodana funkciji. "Povucite" okvir oko njega da pokrijete raspon. Ili Ctrl-kliknite mrežu da odaberete jedan po jedan element.
  6. Kada završite, pritisnite Enter. Rezultat će biti prikazan u ćeliji.

U Excelu je izračunavanje prosjeka prilično jednostavno. Nije potrebno dodavati, a zatim dijeliti količinu. Za to postoji posebna funkcija. Također možete pronaći minimum i maksimum u setu. Mnogo je lakše nego brojati ručno ili tražiti brojeve u velikoj proračunskoj tablici. Stoga je Excel popularan u mnogim područjima djelatnosti gdje je potrebna točnost: poslovanje, revizija, vođenje kadrovske dokumentacije, financije, trgovina, matematika, fizika, astronomija, ekonomija, znanost.