Biografije Karakteristike Analiza

Koja je formula za izračunavanje standardne devijacije. Osim toga, razlikovati

Program Excel visoko cijene i profesionalci i amateri, jer s njim može raditi korisnik bilo koje razine obuke. Na primjer, svatko s minimalnim vještinama "komunikacije" s Excelom može nacrtati jednostavan grafikon, napraviti pristojan znak itd.

U isto vrijeme, ovaj program vam čak omogućuje izvođenje raznih vrsta izračuna, na primjer, izračun, ali to već zahtijeva nešto drugačiju razinu obuke. Međutim, ako ste tek započeli blisko upoznavanje s ovim programom i zanima vas sve što će vam pomoći da postanete napredniji korisnik, ovaj je članak za vas. Danas ću vam reći što je formula standardne devijacije u Excelu, zašto je uopće potrebna i, zapravo, kada se primjenjuje. Ići!

Što je

Počnimo s teorijom. Standardna devijacija obično se naziva kvadratni korijen, dobiven iz aritmetičke sredine svih kvadratnih razlika između dostupnih vrijednosti, kao i njihove aritmetičke sredine. Usput, ova se vrijednost obično naziva grčko slovo "sigma". Standardna devijacija izračunava se pomoću formule STDEV, odnosno program to radi za samog korisnika.

Bit ovog koncepta je identificirati stupanj varijabilnosti instrumenta, odnosno on je na svoj način pokazatelj iz deskriptivne statistike. Otkriva promjene u volatilnosti instrumenta u bilo kojem vremenskom razdoblju. Koristeći STDEV formule, možete procijeniti standardnu ​​devijaciju uzorka, dok se booleove i tekstualne vrijednosti zanemaruju.

Formula

Pomaže izračunati standardnu ​​devijaciju u excel formuli, koja se automatski daje u Excelu. Da biste ga pronašli, morate pronaći odjeljak formule u Excelu i već tamo odabrati onu koja ima naziv STDEV, tako da je vrlo jednostavno.

Nakon toga će se pred vama pojaviti prozor u koji ćete morati unijeti podatke za izračun. Posebno treba unijeti dva broja u posebna polja, nakon čega će program automatski izračunati standardnu ​​devijaciju za uzorak.

Bez sumnje, matematičke formule i izračuni prilično su komplicirano pitanje i ne mogu se svi korisnici nositi s njim odmah. Međutim, ako kopate malo dublje i malo detaljnije shvatite problem, ispada da nije sve tako tužno. Nadam se da ste se u to uvjerili na primjeru izračuna standardne devijacije.

Video za pomoć

Mudri matematičari i statističari došli su do pouzdanijeg pokazatelja, ali za nešto drugačiju svrhu - srednje linearno odstupanje. Ovaj pokazatelj karakterizira mjeru širenja vrijednosti skupa podataka oko njihove prosječne vrijednosti.

Kako biste pokazali mjeru širenja podataka, prvo morate odrediti u odnosu na što će se to širenje smatrati - obično je to prosječna vrijednost. Zatim morate izračunati koliko su vrijednosti analiziranog skupa podataka daleko od prosjeka. Jasno je da svaka vrijednost odgovara određenom iznosu odstupanja, ali nas zanima i opća procjena koja pokriva cijelu populaciju. Stoga se prosječno odstupanje izračunava pomoću formule uobičajene aritmetičke sredine. Ali! Ali da bi se izračunao prosjek odstupanja, prvo ih je potrebno zbrojiti. A ako zbrojimo pozitivne i negativne brojeve, oni će se međusobno poništiti i njihov će zbroj težiti nuli. Da bi se to izbjeglo, sva odstupanja se uzimaju modulo, odnosno svi negativni brojevi postaju pozitivni. Sada će prosječno odstupanje pokazati generaliziranu mjeru širenja vrijednosti. Kao rezultat toga, prosječno linearno odstupanje izračunat će se formulom:

a je prosječno linearno odstupanje,

x- analizirani pokazatelj, s crticom na vrhu - prosječna vrijednost pokazatelja,

n je broj vrijednosti u analiziranom skupu podataka,

operator zbrajanja, nadam se, nikoga ne plaši.

Prosječno linearno odstupanje izračunato pomoću navedene formule odražava prosječno apsolutno odstupanje od prosječne vrijednosti za ovu populaciju.

Crvena linija na slici je prosječna vrijednost. Odstupanja svakog opažanja od srednje vrijednosti označena su malim strelicama. Uzimaju se po modulu i zbrajaju. Zatim se sve podijeli s brojem vrijednosti.

Za potpunu sliku potrebno je navesti još jedan primjer. Recimo da postoji tvrtka koja proizvodi reznice za lopate. Svaka reznica treba biti dugačka 1,5 metar, ali što je još važnije, sve trebaju biti jednake ili barem plus-minus 5 cm, ali će nemarni radnici odrezati 1,2 m, pa 1,8 m. . Direktor tvrtke odlučio je provesti statističku analizu duljine reznica. Odabrao sam 10 komada i izmjerio njihovu duljinu, pronašao prosjek i izračunao prosječno linearno odstupanje. Prosjek se pokazao taman - 1,5 m. Ali prosječno linearno odstupanje pokazalo se 0,16 m. Dakle, ispada da je svaki rez duži ili kraći nego što je potrebno u prosjeku za 16 cm. Ima o čemu razgovarati s radnicima. Zapravo, nisam vidio stvarnu upotrebu ovog indikatora, pa sam sam smislio primjer. Međutim, postoji takav pokazatelj u statistici.

Disperzija

Kao i srednje linearno odstupanje, varijanca također odražava opseg u kojem se podaci šire oko srednje vrijednosti.

Formula za izračun varijance izgleda ovako:

(za serije varijacija (ponderirana varijanca))

(za negrupirane podatke (jednostavna varijanca))

Gdje je: σ 2 - disperzija, Xi– analiziramo sq indikator (vrijednost značajke), – prosječnu vrijednost indikatora, f i – broj vrijednosti u analiziranom skupu podataka.

Varijanca je srednji kvadrat odstupanja.

Prvo se izračuna srednja vrijednost, zatim se razlika između svake osnovne vrijednosti i srednje vrijednosti uzima, kvadrira, množi učestalošću odgovarajuće vrijednosti obilježja, dodaje i zatim dijeli s brojem vrijednosti u populaciji.

Međutim, u svom čistom obliku, kao što je, na primjer, aritmetička sredina ili indeks, disperzija se ne koristi. To je više pomoćni i posredni pokazatelj koji se koristi za druge vrste statističkih analiza.

Pojednostavljeni način izračuna varijance

standardna devijacija

Da bi se varijanca koristila za analizu podataka, iz nje se vadi kvadratni korijen. Ispada tzv standardna devijacija.

Usput, standardna devijacija se također naziva sigma - od grčkog slova koje je označava.

Standardna devijacija očito također karakterizira mjeru disperzije podataka, ali se sada (za razliku od disperzije) može usporediti s izvornim podacima. Srednjekvadratni pokazatelji u statistici u pravilu daju točnije rezultate od linearnih. Stoga je standardna devijacija točnija mjera raspršenosti podataka od srednje linearne devijacije.

Uputa

Neka postoji nekoliko brojeva koji karakteriziraju - ili homogene količine. Na primjer, rezultati mjerenja, vaganja, statistička opažanja itd. Sve predstavljene količine moraju biti izmjerene istom mjerom. Da biste pronašli standardnu ​​devijaciju, učinite sljedeće.

Odredite aritmetičku sredinu svih brojeva: zbrojite sve brojeve i zbroj podijelite s ukupnim brojem brojeva.

Odredite disperziju (raspršenost) brojeva: zbrojite kvadrate ranije pronađenih odstupanja i dobiveni zbroj podijelite s brojem brojeva.

Na odjelu je sedam pacijenata s temperaturom od 34, 35, 36, 37, 38, 39 i 40 Celzijevih stupnjeva.

Potrebno je odrediti prosječno odstupanje od prosjeka.
Riješenje:
"u odjelu": (34+35+36+37+38+39+40)/7=37 ºS;

Odstupanja temperature od prosjeka (u ovom slučaju normalne vrijednosti): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, ispada: -3, -2, -1, 0, 1, 2, 3 (ºS);

Zbroj prethodno dobivenih brojeva podijelite njihovim brojem. Za točnost izračuna bolje je koristiti kalkulator. Rezultat dijeljenja je aritmetička sredina sabiraka.

Obratite posebnu pozornost na sve faze izračuna jer će pogreška u barem jednom od izračuna dovesti do netočnog konačnog pokazatelja. Provjerite primljene izračune u svakoj fazi. Aritmetički prosjek ima isti metar kao i zbrojevi brojeva, odnosno ako odredite prosječnu posjećenost, tada će svi pokazatelji biti "osoba".

Ova metoda izračuna se koristi samo u matematičkim i statističkim proračunima. Tako, na primjer, aritmetička sredina u informatici ima drugačiji algoritam izračuna. Aritmetička sredina je vrlo uvjetan pokazatelj. Pokazuje vjerojatnost nekog događaja, pod uvjetom da ima samo jedan faktor ili pokazatelj. Za najdublju analizu potrebno je uzeti u obzir mnoge čimbenike. Za to se koristi izračun općenitijih veličina.

Aritmetička sredina jedna je od mjera središnje tendencije, široko korištena u matematici i statističkim proračunima. Pronalaženje aritmetičkog prosjeka nekoliko vrijednosti vrlo je jednostavno, ali svaki zadatak ima svoje nijanse, koje je jednostavno potrebno znati kako bi se izvršili točni izračuni.

Kvantitativni rezultati takvih pokusa.

Kako pronaći aritmetičku sredinu

Traženje aritmetičke sredine za niz brojeva treba započeti određivanjem algebarskog zbroja tih vrijednosti. Na primjer, ako niz sadrži brojeve 23, 43, 10, 74 i 34, tada će njihov algebarski zbroj biti 184. Pri pisanju se aritmetička sredina označava slovom μ (mu) ili x (x s crticom) . Zatim, algebarski zbroj treba podijeliti s brojem brojeva u nizu. U ovom primjeru bilo je pet brojeva, pa će aritmetička sredina biti 184/5 i bit će 36,8.

Značajke rada s negativnim brojevima

Ako u nizu postoje negativni brojevi, tada se aritmetička sredina pronalazi pomoću sličnog algoritma. Razlika postoji samo kod računanja u programskom okruženju ili ako postoje dodatni uvjeti u zadatku. U tim slučajevima pronalaženje aritmetičke sredine brojeva s različitim predznacima svodi se na tri koraka:

1. Određivanje zajedničke aritmetičke sredine standardnom metodom;
2. Određivanje aritmetičke sredine negativnih brojeva.
3. Izračunavanje aritmetičke sredine pozitivnih brojeva.

Odgovori svake radnje pišu se odvojeni zarezima.

Prirodni i decimalni razlomci

Ako je niz brojeva predstavljen decimalnim razlomcima, rješenje se odvija prema metodi izračuna aritmetičke sredine cijelih brojeva, ali se rezultat reducira prema zahtjevima zadatka za točnost odgovora.

Kada radite s prirodnim razlomcima, potrebno ih je svesti na zajednički nazivnik, koji se množi s brojem brojeva u nizu. Brojnik odgovora bit će zbroj zadanih brojnika izvornih razlomaka.

Disperzija. Standardna devijacija

Disperzija je aritmetička sredina kvadrata odstupanja svake vrijednosti značajke od ukupne sredine. Ovisno o izvornim podacima, varijanca može biti neponderirana (jednostavna) ili ponderirana.

Disperzija se izračunava pomoću sljedećih formula:

za negrupirane podatke

za grupirane podatke

Postupak za izračunavanje ponderirane varijance:

1. odrediti aritmetički ponderirani prosjek

2. Određena su odstupanja varijanti od srednje vrijednosti

3. kvadrirajte odstupanje svake opcije od srednje vrijednosti

4. pomnožiti kvadrate odstupanja s težinama (frekvencijama)

5. sažeti pristigle radove

6. dobiveni iznos se podijeli sa zbrojem utega

Formula za određivanje varijance može se pretvoriti u sljedeću formulu:

- jednostavno

Postupak za izračunavanje varijance je jednostavan:

1. odrediti aritmetičku sredinu

2. kvadrirati aritmetičku sredinu

3. kvadrat svaki red opcija

4. pronađite opciju zbroja kvadrata

5. zbroj kvadrata opcije podijeliti njihovim brojem, tj. odrediti srednji kvadrat

6. odrediti razliku između srednjeg kvadrata obilježja i kvadrata srednje vrijednosti

Također se formula za određivanje ponderirane varijance može pretvoriti u sljedeću formulu:

oni. varijanca je jednaka razlici između sredine kvadrata vrijednosti obilježja i kvadrata aritmetičke sredine. Pri korištenju transformirane formule isključen je dodatni postupak za izračunavanje odstupanja pojedinačnih vrijednosti značajke od x i isključena je pogreška u izračunu povezana s odstupanjima zaokruživanja

Disperzija ima niz svojstava, od kojih neka olakšavaju izračun:

1) disperzija konstantne vrijednosti je nula;

2) ako su sve varijante vrijednosti atributa smanjene za isti broj, tada se varijanca neće smanjiti;

3) ako su sve varijante vrijednosti atributa smanjene za isti broj puta (puta), tada će se varijanca smanjiti za faktor

Standardna devijacija S- je kvadratni korijen varijance:

Za negrupirane podatke:

;

Za seriju varijacija:

Raspon varijacije, srednja linearna i srednja kvadratna devijacija su imenovane veličine. Imaju iste mjerne jedinice kao i pojedinačne karakteristične vrijednosti.

Disperzija i standardna devijacija najčešće su korištene mjere varijacije. To se objašnjava činjenicom da su uključeni u većinu teorema teorije vjerojatnosti, koja služi kao temelj matematičke statistike. Osim toga, varijanca se može rastaviti na sastavne elemente, omogućujući procjenu utjecaja različitih čimbenika koji uzrokuju varijaciju svojstva.

Izračun pokazatelja varijacije za banke grupirane prema dobiti prikazan je u tablici.

Dobit, milijun rubalja Broj banaka izračunati pokazatelji
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Ukupno: 121,70 17,640 23,126

Srednja linearna i srednja kvadratna devijacija pokazuju koliko vrijednost atributa u prosjeku fluktuira za jedinice i populaciju koja se proučava. Dakle, u ovom slučaju, prosječna vrijednost fluktuacije u iznosu dobiti je: prema prosječnom linearnom odstupanju, 0,882 milijuna rubalja; prema standardnoj devijaciji - 1,075 milijuna rubalja. Standardna devijacija uvijek je veća od prosječne linearne devijacije. Ako je raspodjela svojstva bliska normalnoj, tada između S i d postoji odnos: S=1,25d, odnosno d=0,8S. Standardna devijacija pokazuje kako se većina jedinica populacije nalazi u odnosu na aritmetičku sredinu. Bez obzira na oblik distribucije, 75 vrijednosti atributa spada unutar x 2S intervala, a najmanje 89 svih vrijednosti spada u x 3S interval (teorem P.L. Chebysheva).

Matematičko očekivanje i varijanca

Izmjerimo slučajnu varijablu N puta, na primjer, deset puta mjerimo brzinu vjetra i želimo pronaći prosječnu vrijednost. Kako je srednja vrijednost povezana s funkcijom distribucije?

Kockicu ćemo baciti veliki broj puta. Broj bodova koji će pasti na kockicu tijekom svakog bacanja je slučajna varijabla i može poprimiti bilo koju prirodnu vrijednost od 1 do 6. N teži vrlo određenom broju – matematičkom očekivanju M x. U ovom slučaju M x = 3,5.

Kako je nastala ova vrijednost? Pustiti unutra N Testovi su jednom ispali 1 bod, jednom - 2 boda i tako dalje. Zatim N→ ∞ broj ishoda u kojima je pao jedan bod, Slično, odavde

Model 4.5. Kocke

Pretpostavimo sada da znamo zakon distribucije slučajne varijable x, odnosno znamo da je slučajna varijabla x može poprimiti vrijednosti x 1 , x 2 , ..., x k s vjerojatnostima str 1 , str 2 , ..., p k.

Očekivana vrijednost M x nasumična varijabla x jednako:

Odgovor. 2,8.

Matematičko očekivanje nije uvijek razumna procjena neke slučajne varijable. Dakle, za procjenu prosječne plaće razumnije je koristiti koncept medijana, odnosno takvu vrijednost da broj ljudi koji primaju manje od medijana plaće i više, bude isti.

Medijan slučajna varijabla naziva se broj x 1/2 tako da str (x < x 1/2) = 1/2.

Drugim riječima, vjerojatnost str 1 da je slučajna varijabla x bit će manje x 1/2 i vjerojatnost str 2 da je slučajna varijabla x bit će veći x 1/2 su jednaki i jednaki 1/2. Medijan nije jednoznačno određen za sve distribucije.

Povratak na slučajnu varijablu x, koji može poprimiti vrijednosti x 1 , x 2 , ..., x k s vjerojatnostima str 1 , str 2 , ..., p k.

disperzija nasumična varijabla x je srednja vrijednost kvadrata odstupanja slučajne varijable od njenog matematičkog očekivanja:

Primjer 2

Pod uvjetima iz prethodnog primjera izračunajte varijancu i standardnu ​​devijaciju slučajne varijable x.

Odgovor. 0,16, 0,4.

Model 4.6. gađanje mete

Primjer 3

Pronađite distribuciju vjerojatnosti broja bodova bačenih na kocki od prvog bacanja, medijana, matematičkog očekivanja, varijance i standardne devijacije.

Ispuštanje bilo kojeg lica jednako je vjerojatno, pa će distribucija izgledati ovako:

Standardna devijacija Vidljivo je da je odstupanje vrijednosti od srednje vrijednosti vrlo veliko.

Svojstva matematičkog očekivanja:

  • Matematičko očekivanje zbroja nezavisnih slučajnih varijabli jednako je zbroju njihovih matematičkih očekivanja:

Primjer 4

Odredite matematičko očekivanje zbroja i umnoška bodova bačenih na dvije kocke.

U primjeru 3 pronašli smo da za jednu kocku M (x) = 3,5. Dakle za dvije kocke

Disperzijska svojstva:

  • Varijanca zbroja nezavisnih slučajnih varijabli jednaka je zbroju varijanci:

D x + g = D x + Dy.

Neka za N bacanje kockica g bodova. Zatim

Ovaj rezultat ne vrijedi samo za bacanje kockica. U mnogim slučajevima empirijski određuje točnost matematičkog očekivanja. Vidljivo je da s povećanjem broja mjerenja Nširenje vrijednosti oko sredine, odnosno standardne devijacije, proporcionalno se smanjuje

Varijanca slučajne varijable povezana je s matematičkim očekivanjem kvadrata te slučajne varijable sljedećom relacijom:

Nađimo matematička očekivanja oba dijela ove jednakosti. A-priorat,

Matematičko očekivanje desne strane jednakosti, prema svojstvu matematičkih očekivanja, jednako je

Standardna devijacija

standardna devijacija jednako je kvadratnom korijenu varijance:
Pri određivanju standardne devijacije za dovoljno velik obujam ispitivane populacije (n> 30) koriste se sljedeće formule:

Slične informacije.