Biografije Karakteristike Analiza

Primjer formule za standardnu ​​devijaciju. standardna devijacija

Uputa

Neka postoji nekoliko brojeva koji karakteriziraju - ili homogene veličine. Na primjer, rezultati mjerenja, vaganja, statistička promatranja itd. Sve prikazane količine moraju se mjeriti istim mjerenjem. Da biste pronašli standardnu ​​devijaciju, učinite sljedeće.

Odredite aritmetičku sredinu svih brojeva: zbrojite sve brojeve i podijelite zbroj s ukupnim brojem brojeva.

Odredite disperziju (raspršenost) brojeva: zbrojite kvadrate prethodno pronađenih odstupanja i dobiveni zbroj podijelite s brojem brojeva.

Na odjelu je sedam pacijenata s temperaturom od 34, 35, 36, 37, 38, 39 i 40 stupnjeva Celzijevih.

Potrebno je odrediti prosječno odstupanje od prosjeka.
Odluka:
"na odjelu": (34+35+36+37+38+39+40)/7=37 ºS;

Odstupanja temperature od prosjeka (u ovom slučaju normalne vrijednosti): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, ispada: -3, -2, -1, 0, 1, 2, 3 (ºS);

Podijelite zbroj ranije dobivenih brojeva njihovim brojem. Za točnost izračuna, bolje je koristiti kalkulator. Rezultat dijeljenja je aritmetička sredina zbrojeva.

Obratite posebnu pozornost na sve faze izračuna, jer će pogreška u barem jednom od izračuna dovesti do netočnog konačnog pokazatelja. Provjerite primljene izračune u svakoj fazi. Aritmetički prosjek ima isti mjerač kao i zbrojevi brojeva, odnosno ako odredite prosječnu posjećenost, tada će svi pokazatelji biti "osoba".

Ova metoda izračuna se koristi samo u matematičkim i statističkim izračunima. Tako, na primjer, aritmetička sredina u informatici ima drugačiji algoritam izračuna. Aritmetička sredina je vrlo uvjetan pokazatelj. Pokazuje vjerojatnost događaja, pod uvjetom da ima samo jedan faktor ili pokazatelj. Za najdublju analizu potrebno je uzeti u obzir mnoge čimbenike. Za to se koristi izračun općenitijih veličina.

Aritmetička sredina je jedna od mjera središnje tendencije, koja se široko koristi u matematici i statističkim izračunima. Pronalaženje aritmetičkog prosjeka nekoliko vrijednosti je vrlo jednostavno, ali svaki zadatak ima svoje nijanse, koje je jednostavno potrebno znati kako bi se izvršili ispravni izračuni.

Kvantitativni rezultati takvih eksperimenata.

Kako pronaći aritmetičku sredinu

Potraga za aritmetičkom sredinom za niz brojeva trebala bi započeti određivanjem algebarskog zbroja tih vrijednosti. Na primjer, ako niz sadrži brojeve 23, 43, 10, 74 i 34, tada će njihov algebarski zbroj biti 184. Prilikom pisanja, aritmetička sredina se označava slovom μ (mu) ili x (x s crticom) . Zatim, algebarski zbroj treba podijeliti s brojem brojeva u nizu. U ovom primjeru bilo je pet brojeva, pa će aritmetička sredina biti 184/5 i bit će 36,8.

Značajke rada s negativnim brojevima

Ako u nizu postoje negativni brojevi, tada se aritmetička sredina nalazi pomoću sličnog algoritma. Razlika postoji samo kod računanja u programskom okruženju, odnosno ako postoje dodatni uvjeti u zadatku. U tim se slučajevima pronalaženje aritmetičke sredine brojeva s različitim predznacima svodi na tri koraka:

1. Pronalaženje zajedničke aritmetičke sredine standardnom metodom;
2. Pronalaženje aritmetičke sredine negativnih brojeva.
3. Izračun aritmetičke sredine pozitivnih brojeva.

Odgovori svake od radnji napisani su odvojeni zarezima.

Prirodni i decimalni razlomci

Ako je niz brojeva predstavljen decimalnim razlomcima, rješenje se javlja prema metodi izračunavanja aritmetičke sredine cijelih brojeva, ali se rezultat umanjuje prema zahtjevima zadatka za točnost odgovora.

Kada radite s prirodnim razlomcima, treba ih svesti na zajednički nazivnik, koji se množi s brojem brojeva u nizu. Brojnik odgovora bit će zbroj zadanih brojnika izvornih razlomaka.

Kod statističkog testiranja hipoteza, kod mjerenja linearnog odnosa između slučajnih varijabli.

standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u odnosu na njegovo matematičko očekivanje na temelju nepristrane procjene njegove varijance):

gdje je - varijanca; - Pod, zidovi oko nas i strop, i-th element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance dosljedna je.

tri sigma pravilo

tri sigma pravilo() - gotovo sve vrijednosti normalno raspoređene slučajne varijable leže u intervalu. Strogo rečeno - s ne manje od 99,7% sigurnosti, vrijednost normalno raspoređene slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda ne koristite, već pod, zidove oko nas i strop, s. Tako se pravilo tri sigme prevodi u pravilo tri kata, zidova oko nas i stropa, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, odnosno, označava da su vrijednosti u skupu grupirane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti 7 i standardne devijacije 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupirane oko srednje vrijednosti; prvi skup ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti proučavanog fenomena u usporedbi s vrijednošću predviđenom teorijom: ako se srednja vrijednost mjerenja uvelike razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobivene vrijednosti ili način njihovog dobivanja treba ponovno provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom dnevnom maksimalnom temperaturom, ali jedan se nalazi na obali, a drugi u unutrašnjosti. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u primorskom gradu biti manja nego u drugom gradu, unatoč činjenici da je prosječna vrijednost ove vrijednosti za njih ista, što u praksi znači da je vjerojatnost da će maksimalni temperatura svakog pojedinog dana u godini bit će jača razlikovati od prosječne vrijednosti, viša za grad koji se nalazi unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje su rangirane prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, šansi za pogodak itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati najbolju vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi su timovi uravnoteženi. S druge strane, momčad s velikom standardnom devijacijom teško je predvidjeti rezultat, što se pak objašnjava neravnotežom, primjerice, jakom obranom, ali slabim napadom.

Korištenje standardne devijacije parametara momčadi omogućuje da se donekle predvidi rezultat utakmice između dvije momčadi, procjenjujući snage i slabosti momčadi, a time i odabrane metode borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. STATISTIKA. Umjetnost računalne analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Petar, 2003. - 688 str. - ISBN 5-272-00078-1.

Definira se kao generalizirajuća karakteristika veličine varijacije osobine u agregatu. Jednaka je kvadratnom korijenu srednjeg kvadrata odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine, tj. korijen i može se pronaći ovako:

1. Za primarni red:

2. Za seriju varijacija:

Transformacija formule standardne devijacije dovodi je do oblika prikladnijeg za praktične izračune:

Standardna devijacija određuje koliko u prosjeku određene opcije odstupaju od svoje prosječne vrijednosti, a osim toga, apsolutna je mjera fluktuacije osobine i izražava se u istim jedinicama kao i opcije, te se stoga dobro interpretira.

Primjeri pronalaženja standardne devijacije: ,

Za alternativne značajke, formula za standardnu ​​devijaciju izgleda ovako:

gdje je p udio jedinica u populaciji koje imaju određeni atribut;

q - udio jedinica koje nemaju ovu značajku.

Koncept srednjeg linearnog odstupanja

Prosječna linearna devijacija definira se kao aritmetička sredina apsolutnih vrijednosti odstupanja pojedinih opcija od .

1. Za primarni red:

2. Za seriju varijacija:

gdje je zbroj n zbroj frekvencija niza varijacija.

Primjer pronalaženja prosječne linearne devijacije:

Prednost srednjeg apsolutnog odstupanja kao mjere disperzije u rasponu varijacije je očita, budući da se ova mjera temelji na uzimanju u obzir svih mogućih odstupanja. Ali ovaj pokazatelj ima značajne nedostatke. Samovoljno odbacivanje algebarskih znakova odstupanja može dovesti do činjenice da su matematička svojstva ovog pokazatelja daleko od elementarnih. To uvelike otežava korištenje srednjeg apsolutnog odstupanja u rješavanju problema vezanih uz probabilističke izračune.

Stoga se prosječno linearno odstupanje kao mjera varijacije obilježja rijetko koristi u statističkoj praksi, naime kada zbrajanje pokazatelja bez uzimanja u obzir predznaka ima ekonomski smisla. Uz nju se, primjerice, analizira promet vanjske trgovine, sastav zaposlenih, ritam proizvodnje itd.

korijen znači kvadrat

Primijenjen RMS, na primjer, za izračunavanje prosječne veličine stranica n kvadratnih presjeka, prosječnih promjera debla, cijevi itd. Dijeli se u dvije vrste.

Srednji kvadratni korijen je jednostavan. Ako je pri zamjeni pojedinačnih vrijednosti osobine prosječnom vrijednošću potrebno zadržati zbroj kvadrata izvornih vrijednosti nepromijenjen, tada će prosjek biti kvadratni prosjek.

To je kvadratni korijen kvocijenta zbroja kvadrata pojedinačnih vrijednosti obilježja podijeljen s njihovim brojem:

Ponderirani srednji kvadrat izračunava se po formuli:

gdje je f znak težine.

Prosječna kubika

Primijenjena prosječna kubika, na primjer, pri određivanju prosječne duljine stranice i kocke. Dijeli se u dvije vrste.
Prosječna kubična jednostavna:

Prilikom izračunavanja srednjih vrijednosti i disperzije u nizu distribucije intervala, prave vrijednosti atributa zamjenjuju se središnjim vrijednostima intervala, koje se razlikuju od aritmetičke sredine vrijednosti uključenih u interval. To dovodi do sustavne pogreške u izračunu varijance. V.F. Sheppard je to utvrdio pogreška u izračunu varijance, uzrokovan primjenom grupiranih podataka, iznosi 1/12 kvadrata veličine intervala, i prema gore i prema dolje u veličini varijance.

Sheppard amandman treba koristiti ako je distribucija bliska normalnoj, odnosi se na značajku s kontinuiranom prirodom varijacije, izgrađenu na značajnoj količini početnih podataka (n> 500). Međutim, na temelju činjenice da se u nizu slučajeva obje pogreške, djelujući u različitim smjerovima, međusobno nadoknađuju, ponekad je moguće odbiti uvođenje izmjena.

Što je manja varijanca i standardna devijacija, to je populacija homogenija i prosjek će biti tipičniji.
U praksi statistike često postaje potrebno usporediti varijacije različitih značajki. Na primjer, od velikog je interesa usporediti varijacije u dobi radnika i njihovim kvalifikacijama, radnom stažu i plaćama, troškovima i dobiti, duljini radnog staža i produktivnosti rada itd. Za takve usporedbe pokazatelji apsolutne varijabilnosti karakteristika su neprikladni: nemoguće je usporediti varijabilnost radnog iskustva, izraženu u godinama, s varijacijama plaća, izraženim u rubljama.

Za provedbu takvih usporedbi, kao i usporedbe fluktuacije istog atributa u nekoliko populacija s različitim aritmetičkim sredinama, koristi se relativni pokazatelj varijacije - koeficijent varijacije.

Strukturni prosjeci

Za karakterizaciju središnjeg trenda u statističkim distribucijama često je racionalno koristiti, zajedno s aritmetičkom sredinom, određenu vrijednost atributa X, koji zbog određenih značajki svog položaja u nizu distribucije može karakterizirati njegovu razinu.

Ovo je posebno važno kada ekstremne vrijednosti značajke u nizu distribucije imaju nejasne granice. S tim u vezi, točno određivanje aritmetičke sredine u pravilu je nemoguće ili vrlo teško. U takvim slučajevima, prosječna razina može se odrediti uzimanjem, na primjer, vrijednosti značajke koja se nalazi u sredini frekvencijskog niza ili koja se najčešće javlja u trenutnoj seriji.

Takve vrijednosti ovise samo o prirodi frekvencija, odnosno o strukturi distribucije. Tipične su u smislu položaja u frekvencijskom nizu, stoga se takve vrijednosti smatraju karakteristikama distribucijskog centra i stoga su definirane kao strukturni prosjek. Koriste se za proučavanje unutarnje strukture i strukture serije distribucije vrijednosti atributa. Ovi pokazatelji uključuju .

Jedan od glavnih alata statističke analize je izračun standardne devijacije. Ovaj pokazatelj omogućuje procjenu standardne devijacije za uzorak ili za opću populaciju. Naučimo koristiti formulu standardnog odstupanja u Excelu.

Idemo odmah definirati što je standardna devijacija i kako izgleda njena formula. Ova vrijednost je kvadratni korijen aritmetičke sredine kvadrata razlike između svih vrijednosti niza i njihove aritmetičke sredine. Za ovaj pokazatelj postoji identičan naziv - standardna devijacija. Oba imena su potpuno istovjetna.

Ali, naravno, u Excelu korisnik to ne mora izračunati, jer program radi sve za njega. Naučimo kako izračunati standardnu ​​devijaciju u Excelu.

Obračun u Excelu

Navedenu vrijednost možete izračunati u Excelu pomoću dvije posebne funkcije STDEV.V(prema uzorku) i STDEV.G(prema općoj populaciji). Princip njihovog rada je apsolutno isti, ali se mogu nazvati na tri načina, o čemu ćemo raspravljati u nastavku.

Metoda 1: Čarobnjak za funkcije


Metoda 2: kartica Formule


Metoda 3: Ručni unos formule

Postoji i način na koji uopće ne trebate pozivati ​​prozor argumenta. Da biste to učinili, ručno unesite formulu.


Kao što vidite, mehanizam za izračun standardne devijacije u Excelu je vrlo jednostavan. Korisnik samo treba unijeti brojeve iz populacije ili veze na ćelije koje ih sadrže. Sve izračune izvodi sam program. Mnogo je teže razumjeti što je izračunati pokazatelj i kako se rezultati izračuna mogu primijeniti u praksi. Ali razumijevanje ovoga već više pripada području statistike nego učenju rada sa softverom.

U ovom članku govorit ću o kako pronaći standardnu ​​devijaciju. Ovaj materijal je iznimno važan za potpuno razumijevanje matematike, pa bi učitelj matematike trebao posvetiti zasebnu lekciju ili čak nekoliko lekcija tome proučavanju. U ovom članku pronaći ćete poveznicu na detaljan i razumljiv video vodič koji objašnjava što je standardna devijacija i kako je pronaći.

standardna devijacija omogućuje procjenu širenja vrijednosti dobivenih kao rezultat mjerenja određenog parametra. Označava se simbolom (grčko slovo "sigma").

Formula za izračun je prilično jednostavna. Da biste pronašli standardnu ​​devijaciju, morate uzeti kvadratni korijen varijance. Dakle, sada se morate zapitati: "Što je varijacija?"

Što je disperzija

Definicija varijance je sljedeća. Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti od srednje vrijednosti.

Da biste pronašli odstupanje, izvršite sljedeće izračune uzastopno:

  • Odredite srednju vrijednost (jednostavnu aritmetičku sredinu niza vrijednosti).
  • Zatim od svake vrijednosti oduzmite prosjek i kvadrirajte rezultirajuću razliku (dobili smo razlika na kvadrat).
  • Sljedeći korak je izračunavanje aritmetičke sredine kvadrata dobivenih razlika (Zašto su točno kvadrati možete saznati u nastavku).

Pogledajmo primjer. Recimo da ste vi i vaši prijatelji odlučili izmjeriti visinu svojih pasa (u milimetrima). Kao rezultat mjerenja, dobili ste sljedeće mjere visine (u grebenu): 600 mm, 470 mm, 170 mm, 430 mm i 300 mm.

Izračunajmo srednju vrijednost, varijancu i standardnu ​​devijaciju.

Nađimo najprije prosjek. Kao što već znate, za to morate zbrojiti sve izmjerene vrijednosti i podijeliti s brojem mjerenja. Napredak izračuna:

Prosječna mm.

Dakle, prosjek (aritmetička sredina) je 394 mm.

Sada moramo definirati odstupanje visine svakog od pasa od prosjeka:

Konačno, za izračunavanje varijance, svaka od dobivenih razlika se kvadrira, a zatim nalazimo aritmetičku sredinu dobivenih rezultata:

Disperzija mm 2 .

Dakle, disperzija je 21704 mm 2 .

Kako pronaći standardnu ​​devijaciju

Pa kako sada izračunati standardnu ​​devijaciju, znajući varijancu? Kao što se sjećamo, uzmite kvadratni korijen. Odnosno, standardna devijacija je:

mm (zaokruženo na najbliži cijeli broj u mm).

Koristeći ovu metodu, ustanovili smo da su neki psi (npr. Rottweileri) vrlo veliki psi. Ali postoje i vrlo mali psi (na primjer, jazavčari, ali im to ne biste trebali reći).

Najzanimljivije je da standardna devijacija nosi korisne informacije. Sada možemo pokazati koji su od dobivenih rezultata mjerenja rasta unutar intervala koji dobivamo ako od prosjeka (s obje njegove strane) odvojimo standardnu ​​devijaciju.

Odnosno, koristeći standardnu ​​devijaciju, dobivamo "standardnu" metodu koja vam omogućuje da saznate koja je od vrijednosti normalna (statistički prosjek), a koja je izvanredno velika ili, obrnuto, mala.

Što je standardna devijacija

Ali... stvari će biti malo drugačije ako analiziramo uzorkovanje podaci. U našem primjeru razmotrili smo opća populacija. Odnosno, naših 5 pasa bili su jedini psi na svijetu koji su nas zanimali.

Ali ako su podaci uzorak (vrijednosti odabrane iz velike populacije), tada izračune treba napraviti drugačije.

Ako postoje vrijednosti, tada:

Svi ostali izračuni se rade na isti način, uključujući i određivanje prosjeka.

Na primjer, ako je naših pet pasa samo uzorak populacije pasa (svi psi na planeti), moramo podijeliti s 4 umjesto 5 naime:

Varijanca uzorka = mm 2 .

U ovom slučaju, standardna devijacija za uzorak je jednaka mm (zaokruženo na najbliži cijeli broj).

Možemo reći da smo napravili neku "ispravku" u slučaju kada su naše vrijednosti samo mali uzorak.

Bilješka. Zašto baš kvadrati razlika?

Ali zašto uzimamo kvadrate razlika pri izračunu varijance? Priznajmo da ste prilikom mjerenja nekog parametra dobili sljedeći skup vrijednosti: 4; 4; -4; -4. Ako samo dodamo apsolutna odstupanja od srednje vrijednosti (razlike) među sobom ... negativne vrijednosti se poništavaju pozitivnim:

.

Ispada da je ova opcija beskorisna. Onda je možda vrijedno isprobati apsolutne vrijednosti odstupanja (odnosno module ovih vrijednosti)?

Na prvi pogled ispada da nije loše (rezultirajuća vrijednost, usput rečeno, naziva se srednja apsolutna devijacija), ali ne u svim slučajevima. Pokušajmo s drugim primjerom. Neka mjerenje rezultira sljedećim skupom vrijednosti: 7; jedan; -6; -2. Tada je srednja apsolutna devijacija:

Jebote! Opet smo dobili rezultat 4, iako su razlike znatno veće.

Pogledajmo sada što će se dogoditi ako kvadriramo razlike (i zatim uzmemo kvadratni korijen njihovog zbroja).

Za prvi primjer dobivate:

.

Za drugi primjer dobivate:

Sad je sasvim druga stvar! Odstupanje srednjeg kvadrata je to veće, što je širenje razlika veće... čemu smo i težili.

Zapravo, ova metoda koristi istu ideju kao i kod izračunavanja udaljenosti između točaka, samo se primjenjuje na drugačiji način.

A s matematičke točke gledišta, korištenje kvadrata i kvadratnog korijena korisnije je nego što bismo mogli dobiti na temelju apsolutnih vrijednosti ​​odstupanja, zbog čega je standardna devijacija primjenjiva na druge matematičke probleme.

Sergej Valerievič vam je rekao kako pronaći standardnu ​​devijaciju