Biografije Karakteristike Analiza

Koja je formula za izračunavanje standardne devijacije. Osim toga, razlikovati

Excel program visoko cijene i profesionalci i amateri, jer s njim može raditi korisnik bilo kojeg nivoa obuke. Na primjer, svako ko ima minimalne vještine "komunikacije" s Excelom može nacrtati jednostavan grafikon, napraviti pristojan znak itd.

Istovremeno, ovaj program vam čak omogućava i obavljanje raznih vrsta proračuna, na primjer, proračun, ali to već zahtijeva malo drugačiji nivo obuke. Međutim, ako ste tek započeli blisko upoznavanje s ovim programom i zanima vas sve što će vam pomoći da postanete napredniji korisnik, ovaj članak je za vas. Danas ću vam reći šta je formula standardne devijacije u excelu, zašto je uopće potrebna i, zapravo, kada se primjenjuje. Idi!

Šta je to

Počnimo s teorijom. Standardna devijacija se obično naziva kvadratni korijen, dobiven iz aritmetičke sredine svih kvadrata razlika između dostupnih vrijednosti, kao i njihove aritmetičke sredine. Inače, ova vrijednost se obično naziva grčkim slovom "sigma". Standardna devijacija se izračunava pomoću formule STDEV, odnosno program to radi za samog korisnika.

Suština ovog koncepta je da se identifikuje stepen varijabilnosti instrumenta, odnosno da je on na svoj način indikator iz deskriptivne statistike. Otkriva promjene u volatilnosti instrumenta u bilo kojem vremenskom periodu. Koristeći STDEV formule, možete procijeniti standardnu ​​devijaciju uzorka, dok se logičke i tekstualne vrijednosti zanemaruju.

Formula

Pomaže u izračunavanju standardne devijacije u Excel formuli, koja se automatski daje u Excelu. Da biste ga pronašli, morate pronaći odjeljak formule u Excelu i već tamo odabrati onaj koji ima naziv STDEV, tako da je vrlo jednostavno.

Nakon toga, ispred vas će se pojaviti prozor u koji ćete morati unijeti podatke za obračun. Konkretno, u posebna polja treba unijeti dva broja, nakon čega će program automatski izračunati standardnu ​​devijaciju za uzorak.

Nesumnjivo, matematičke formule i proračuni su prilično komplicirano pitanje i ne mogu se svi korisnici nositi s njim odmah. Međutim, ako zakopate malo dublje i malo detaljnije shvatite problem, ispostaviće se da nije sve tako tužno. Nadam se da ste se u to uvjerili na primjeru izračunavanja standardne devijacije.

Video za pomoć

Mudri matematičari i statističari došli su do pouzdanijeg pokazatelja, iako u nešto drugačiju svrhu - srednje linearno odstupanje. Ovaj indikator karakterizira mjeru širenja vrijednosti skupa podataka oko njihove prosječne vrijednosti.

Da biste prikazali mjeru širenja podataka, prvo morate odrediti na šta će se smatrati upravo ta širina - obično je to prosječna vrijednost. Zatim morate izračunati koliko su vrijednosti analiziranog skupa podataka daleko od prosjeka. Jasno je da svaka vrijednost odgovara određenoj količini odstupanja, ali nas zanima i opšta procjena koja pokriva cjelokupnu populaciju. Stoga se prosječno odstupanje izračunava pomoću formule uobičajene aritmetičke sredine. Ali! Ali da bi se izračunao prosjek odstupanja, oni se prvo moraju sabrati. A ako zbrojimo pozitivne i negativne brojeve, oni će se poništiti i njihov zbir će težiti nuli. Da bi se to izbjeglo, sva odstupanja se uzimaju po modulu, odnosno svi negativni brojevi postaju pozitivni. Sada će prosječno odstupanje pokazati generaliziranu mjeru širenja vrijednosti. Kao rezultat toga, prosječno linearno odstupanje će se izračunati po formuli:

a je prosječna linearna devijacija,

x- analizirani indikator, sa crticom na vrhu - prosječna vrijednost indikatora,

n je broj vrijednosti u analiziranom skupu podataka,

operator zbrajanja, nadam se, nikoga ne plaši.

Prosječna linearna devijacija izračunata korištenjem navedene formule odražava prosječno apsolutno odstupanje od prosječne vrijednosti za ovu populaciju.

Crvena linija na slici je prosječna vrijednost. Odstupanja svake opservacije od srednje vrednosti su označena malim strelicama. One se uzimaju po modulu i zbrajaju. Zatim se sve podijeli brojem vrijednosti.

Da bi se slika upotpunila, potrebno je dati još jedan primjer. Recimo da postoji kompanija koja proizvodi reznice za lopate. Svaki rez treba da bude dugačak 1,5 metara, ali, što je još važnije, svi trebaju biti isti, ili barem plus-minus 5 cm. Međutim, nesavjesni radnici će odsjeći 1,2 m, pa 1,8 m. . Direktor kompanije odlučio je da izvrši statističku analizu dužine rezanja. Odabrao sam 10 komada i izmjerio njihovu dužinu, pronašao prosjek i izračunao prosječno linearno odstupanje. Ispostavilo se da je prosjek taman - 1,5 m. Ali prosječno linearno odstupanje je 0,16 m. Dakle, ispada da je svaki rez duži ili kraći od potrebnog u prosjeku za 16 cm. Ima o čemu pričati sa radnicima. Zapravo, nisam vidio pravu upotrebu ovog indikatora, pa sam sam došao do primjera. Međutim, takav pokazatelj postoji u statistici.

Disperzija

Poput srednjeg linearnog odstupanja, varijansa također odražava obim do kojeg se podaci šire oko srednje vrijednosti.

Formula za izračunavanje varijanse izgleda ovako:

(za serije varijacija (ponderisana varijansa))

(za negrupirane podatke (jednostavna varijansa))

Gdje: σ 2 - disperzija, Xi– analiziramo sq indikator (vrijednost karakteristike), – prosječnu vrijednost indikatora, f i – broj vrijednosti u analiziranom skupu podataka.

Varijanca je srednji kvadrat odstupanja.

Prvo se izračunava srednja vrijednost, zatim se uzima razlika između svake osnovne i srednje vrijednosti, kvadrira, množi učestalošću odgovarajuće vrijednosti obilježja, dodaje, a zatim dijeli s brojem vrijednosti u populaciji.

Međutim, u svom čistom obliku, kao što je, na primjer, aritmetička sredina ili indeks, disperzija se ne koristi. To je prije pomoćni i srednji indikator koji se koristi za druge vrste statističkih analiza.

Pojednostavljen način izračunavanja varijanse

standardna devijacija

Da bismo koristili varijansu za analizu podataka, iz nje se uzima kvadratni korijen. Ispada tzv standardna devijacija.

Inače, standardna devijacija se naziva i sigma - od grčkog slova koje ga označava.

Standardna devijacija očigledno takođe karakteriše meru disperzije podataka, ali sada (za razliku od disperzije) može da se uporedi sa originalnim podacima. Po pravilu, srednji kvadratni indikatori u statistici daju tačnije rezultate od linearnih. Stoga je standardna devijacija preciznija mjera rasipanja podataka od srednje linearne devijacije.

Uputstvo

Neka postoji nekoliko brojeva koji karakterišu - ili homogene veličine. Na primjer, rezultati mjerenja, vaganja, statistička posmatranja itd. Sve prikazane količine moraju se mjeriti istim mjerenjem. Da biste pronašli standardnu ​​devijaciju, učinite sljedeće.

Odredite aritmetičku sredinu svih brojeva: saberite sve brojeve i podijelite zbir ukupnim brojem brojeva.

Odredite disperziju (raspršenost) brojeva: zbrojite kvadrate ranije pronađenih odstupanja i rezultujući zbroj podijelite s brojem brojeva.

Na odjeljenju je sedam pacijenata sa temperaturom od 34, 35, 36, 37, 38, 39 i 40 stepeni Celzijusa.

Potrebno je odrediti prosječno odstupanje od prosjeka.
Rješenje:
"na odjelu": (34+35+36+37+38+39+40)/7=37 ºS;

Odstupanja temperature od prosjeka (u ovom slučaju normalna vrijednost): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, ispada: -3, -2, -1 , 0, 1, 2, 3 (ºS);

Podijelite zbir prethodno dobijenih brojeva njihovim brojem. Za tačnost izračuna, bolje je koristiti kalkulator. Rezultat dijeljenja je aritmetička sredina sabiraka.

Obratite posebnu pažnju na sve faze proračuna, jer će greška u barem jednom od proračuna dovesti do pogrešnog konačnog indikatora. Provjerite primljene proračune u svakoj fazi. Aritmetički prosjek ima isti metar kao i zbrojevi brojeva, odnosno ako odredite prosječnu posjećenost, tada će svi indikatori biti "osoba".

Ova metoda proračuna se koristi samo u matematičkim i statističkim proračunima. Tako, na primjer, aritmetička sredina u informatici ima drugačiji algoritam proračuna. Aritmetička sredina je vrlo uslovni pokazatelj. Pokazuje vjerovatnoću događaja, pod uslovom da ima samo jedan faktor ili indikator. Za najdublju analizu potrebno je uzeti u obzir mnoge faktore. Za to se koristi proračun opštijih veličina.

Aritmetička sredina je jedna od mjera centralne tendencije, koja se široko koristi u matematici i statističkim proračunima. Pronalaženje aritmetičkog prosjeka od nekoliko vrijednosti je vrlo jednostavno, ali svaki zadatak ima svoje nijanse, koje je jednostavno potrebno znati kako bi se izvršili ispravni proračuni.

Kvantitativni rezultati takvih eksperimenata.

Kako pronaći aritmetičku sredinu

Potraga za aritmetičkom sredinom za niz brojeva treba započeti određivanjem algebarskog zbira ovih vrijednosti. Na primjer, ako niz sadrži brojeve 23, 43, 10, 74 i 34, tada će njihov algebarski zbir biti 184. Prilikom pisanja, aritmetička sredina se označava slovom μ (mu) ili x (x sa crtom) . Zatim, algebarski zbir treba podijeliti sa brojem brojeva u nizu. U ovom primjeru bilo je pet brojeva, tako da će aritmetička sredina biti 184/5 i bit će 36,8.

Značajke rada s negativnim brojevima

Ako u nizu postoje negativni brojevi, onda se aritmetička sredina nalazi pomoću sličnog algoritma. Razlika postoji samo kada se računa u programskom okruženju, ili ako postoje dodatni uslovi u zadatku. U ovim slučajevima, pronalaženje aritmetičke sredine brojeva s različitim predznacima svodi se na tri koraka:

1. Pronalaženje zajedničke aritmetičke sredine standardnom metodom;
2. Pronalaženje aritmetičke sredine negativnih brojeva.
3. Izračunavanje aritmetičke sredine pozitivnih brojeva.

Odgovori svake od radnji su napisani odvojeni zarezima.

Prirodni i decimalni razlomci

Ako je niz brojeva predstavljen decimalnim razlomcima, rješenje se javlja prema metodi izračunavanja aritmetičke sredine cijelih brojeva, ali se rezultat umanjuje prema zahtjevima zadatka za tačnost odgovora.

Kada radite s prirodnim razlomcima, treba ih svesti na zajednički nazivnik, koji se množi brojem brojeva u nizu. Brojač odgovora će biti zbir datih brojnika originalnih razlomaka.

Disperzija. Standardna devijacija

Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti svake karakteristike od ukupne sredine. Ovisno o izvornim podacima, varijansa može biti neponderirana (jednostavna) ili ponderirana.

Disperzija se izračunava pomoću sljedećih formula:

za negrupisane podatke

za grupisane podatke

Postupak za izračunavanje ponderisane varijanse:

1. odrediti aritmetički ponderisani prosjek

2. Određena su varijantna odstupanja od srednje vrijednosti

3. kvadrirajte odstupanje svake opcije od srednje vrijednosti

4. pomnožiti kvadrate odstupanja sa težinama (frekvencijama)

5. sumirati pristigle radove

6. dobijeni iznos se dijeli sa zbirom pondera

Formula za određivanje varijanse može se pretvoriti u sljedeću formulu:

- jednostavno

Procedura za izračunavanje varijanse je jednostavna:

1. odrediti aritmetičku sredinu

2. kvadrirajte aritmetičku sredinu

3. opciju kvadrata svakog reda

4. naći opciju sume kvadrata

5. zbir kvadrata opcije podijeliti njihovim brojem, tj. odrediti srednji kvadrat

6. odrediti razliku između srednjeg kvadrata karakteristike i kvadrata srednje vrednosti

Također se formula za određivanje ponderirane varijanse može pretvoriti u sljedeću formulu:

one. varijansa je jednaka razlici između srednje vrednosti kvadrata vrednosti obeležja i kvadrata aritmetičke sredine. Kada se koristi transformirana formula, isključena je dodatna procedura za izračunavanje odstupanja pojedinačnih vrijednosti značajke od x i isključena je greška u proračunu povezana s odstupanjima zaokruživanja

Disperzija ima niz svojstava, od kojih neka olakšavaju izračunavanje:

1) disperzija konstantne vrednosti je nula;

2) ako se sve varijante vrijednosti atributa smanje za isti broj, tada se varijansa neće smanjiti;

3) ako se sve varijante vrijednosti atributa smanje za isti broj puta (puta), tada će se varijansa smanjiti za faktor od

Standardna devijacija S- je kvadratni korijen varijanse:

Za negrupirane podatke:

;

Za seriju varijacija:

Opseg varijacije, srednja linearna i srednja kvadratna devijacija se nazivaju veličine. Imaju iste mjerne jedinice kao i pojedinačne karakteristične vrijednosti.

Disperzija i standardna devijacija su najčešće korištene mjere varijacije. Ovo se objašnjava činjenicom da su one uključene u većinu teorema teorije vjerovatnoće, koja služi kao temelj matematičke statistike. Osim toga, varijansa se može razložiti na sastavne elemente, što omogućava procjenu utjecaja različitih faktora koji uzrokuju varijaciju osobine.

Izračun pokazatelja varijacije za banke grupisane po dobiti prikazan je u tabeli.

Dobit, milion rubalja Broj banaka izračunati pokazatelji
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Ukupno: 121,70 17,640 23,126

Srednja linearna i srednja kvadratna devijacija pokazuju koliko se vrijednost atributa u prosjeku fluktuira za jedinice i populaciju koja se proučava. Dakle, u ovom slučaju, prosječna vrijednost fluktuacije u iznosu dobiti je: prema prosječnom linearnom odstupanju, 0,882 miliona rubalja; prema standardnoj devijaciji - 1,075 miliona rubalja. Standardna devijacija je uvijek veća od prosječne linearne devijacije. Ako je distribucija osobine bliska normalnoj, onda postoji odnos između S i d: S=1,25d, ili d=0,8S. Standardna devijacija pokazuje kako se većina jedinica stanovništva nalazi u odnosu na aritmetičku sredinu. Bez obzira na oblik distribucije, 75 vrijednosti atributa spadaju u x 2S interval, a najmanje 89 svih vrijednosti spada u x 3S interval (teorem P.L. Čebiševa).

Matematičko očekivanje i varijansa

Izmjerimo slučajnu varijablu N puta, na primjer, mjerimo brzinu vjetra deset puta i želimo pronaći prosječnu vrijednost. Kako je srednja vrijednost povezana s funkcijom distribucije?

Bacaćemo kockice veliki broj puta. Broj bodova koji će pasti na kockicu tokom svakog bacanja je slučajna varijabla i može uzeti bilo koju prirodnu vrijednost od 1 do 6. N teži vrlo specifičnom broju – matematičkom očekivanju Mx. U ovom slučaju Mx = 3,5.

Kako je nastala ova vrijednost? Pusti unutra N Testovi su jednom ispali 1 bod, jednom - 2 boda i tako dalje. Onda N→ ∞ broj ishoda u kojima je pao jedan bod, Slično, odavde

Model 4.5. Dice

Pretpostavimo sada da znamo zakon raspodjele slučajne varijable x, odnosno znamo da je slučajna varijabla x može poprimiti vrijednosti x 1 , x 2 , ..., x k sa vjerovatnoćama str 1 , str 2 , ..., p k.

Očekivana vrijednost Mx slučajna varijabla x jednako:

Odgovori. 2,8.

Matematičko očekivanje nije uvijek razumna procjena neke slučajne varijable. Dakle, za procjenu prosječne plate razumnije je koristiti koncept medijane, odnosno takve vrijednosti da je broj ljudi koji primaju manje od medijalne plate i više, isti.

medijana slučajna varijabla se zove broj x 1/2 tako da str (x < x 1/2) = 1/2.

Drugim riječima, vjerovatnoća str 1 da je slučajna varijabla x biće manje x 1/2 i vjerovatnoća str 2 da je slučajna varijabla x biće veće x 1/2 su isti i jednaki 1/2. Medijan nije jednoznačno određen za sve distribucije.

Nazad na slučajnu varijablu x, koji može uzeti vrijednosti x 1 , x 2 , ..., x k sa vjerovatnoćama str 1 , str 2 , ..., p k.

disperzija slučajna varijabla x je srednja vrijednost kvadratnog odstupanja slučajne varijable od njenog matematičkog očekivanja:

Primjer 2

Pod uslovima iz prethodnog primera, izračunajte varijansu i standardnu ​​devijaciju slučajne varijable x.

Odgovori. 0,16, 0,4.

Model 4.6. gađanje mete

Primjer 3

Pronađite distribuciju vjerovatnoće broja bodova bačenih na kockicu od prvog bacanja, medijanu, matematičko očekivanje, varijansu i standardnu ​​devijaciju.

Ispuštanje bilo kojeg lica je jednako vjerovatno, pa će distribucija izgledati ovako:

Standardna devijacija Može se vidjeti da je odstupanje vrijednosti od srednje vrijednosti veoma veliko.

Svojstva matematičkog očekivanja:

  • Matematičko očekivanje zbira nezavisnih slučajnih varijabli jednako je zbiru njihovih matematičkih očekivanja:

Primjer 4

Pronađite matematičko očekivanje zbira i proizvoda bodova bačenih na dvije kockice.

U primjeru 3 to smo pronašli za jednu kocku M (x) = 3,5. Dakle za dvije kocke

Svojstva disperzije:

  • Varijanca zbira nezavisnih slučajnih varijabli jednaka je zbroju varijansi:

D x + y = D x + Dy.

Neka za N kockice y bodova. Onda

Ovaj rezultat ne vrijedi samo za bacanje kockica. U mnogim slučajevima, on određuje tačnost empirijskog mjerenja matematičkog očekivanja. To se može vidjeti sa povećanjem broja mjerenja Nširenje vrijednosti oko srednje vrijednosti, odnosno standardna devijacija, proporcionalno se smanjuje

Varijanca slučajne varijable povezana je sa matematičkim očekivanjem kvadrata ove slučajne varijable sljedećom relacijom:

Nađimo matematička očekivanja oba dijela ove jednakosti. Po definiciji,

Matematičko očekivanje desne strane jednakosti, prema svojstvu matematičkih očekivanja, jednako je

Standardna devijacija

standardna devijacija jednak je kvadratnom korijenu varijanse:
Prilikom određivanja standardne devijacije za dovoljno veliki volumen proučavane populacije (n> 30) koriste se sljedeće formule:

Slične informacije.