Biografije Specifikacije Analiza

Primjer formule za standardnu ​​devijaciju. standardna devijacija

Uputstvo

Neka postoji nekoliko brojeva koji karakterišu - ili homogene veličine. Na primjer, rezultati mjerenja, vaganja, statistička posmatranja itd. Sve prikazane količine moraju se mjeriti istim mjerenjem. Da biste pronašli standardnu ​​devijaciju, učinite sljedeće.

Odredite aritmetičku sredinu svih brojeva: saberite sve brojeve i podijelite zbir ukupnim brojem brojeva.

Odredite disperziju (raspršenost) brojeva: zbrojite kvadrate ranije pronađenih odstupanja i rezultujući zbroj podijelite s brojem brojeva.

Na odjeljenju je sedam pacijenata sa temperaturom od 34, 35, 36, 37, 38, 39 i 40 stepeni Celzijusa.

Potrebno je odrediti prosječno odstupanje od prosjeka.
Odluka:
"na odjelu": (34+35+36+37+38+39+40)/7=37 ºS;

Odstupanja temperature od prosjeka (u ovom slučaju normalna vrijednost): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, ispada: -3, -2, -1 , 0, 1, 2, 3 (ºS);

Podijelite zbir prethodno dobijenih brojeva njihovim brojem. Za tačnost izračuna, bolje je koristiti kalkulator. Rezultat dijeljenja je aritmetička sredina sabiraka.

Obratite posebnu pažnju na sve faze proračuna, jer će greška u barem jednom od proračuna dovesti do pogrešnog konačnog indikatora. Provjerite primljene proračune u svakoj fazi. Aritmetički prosjek ima isti metar kao i zbrojevi brojeva, odnosno ako odredite prosječnu posjećenost, tada će svi indikatori biti "osoba".

Ova metoda proračuna se koristi samo u matematičkim i statističkim proračunima. Tako, na primjer, aritmetička sredina u informatici ima drugačiji algoritam proračuna. Aritmetička sredina je vrlo uslovni pokazatelj. Pokazuje vjerovatnoću događaja, pod uslovom da ima samo jedan faktor ili indikator. Za najdublju analizu potrebno je uzeti u obzir mnoge faktore. Za to se koristi proračun opštijih veličina.

Aritmetička sredina je jedna od mjera centralne tendencije, koja se široko koristi u matematici i statističkim proračunima. Pronalaženje aritmetičkog prosjeka od nekoliko vrijednosti je vrlo jednostavno, ali svaki zadatak ima svoje nijanse, koje je jednostavno potrebno znati kako bi se izvršili ispravni proračuni.

Kvantitativni rezultati takvih eksperimenata.

Kako pronaći aritmetičku sredinu

Potraga za aritmetičkom sredinom za niz brojeva treba započeti određivanjem algebarskog zbira ovih vrijednosti. Na primjer, ako niz sadrži brojeve 23, 43, 10, 74 i 34, tada će njihov algebarski zbir biti 184. Prilikom pisanja, aritmetička sredina se označava slovom μ (mu) ili x (x sa crtom) . Zatim, algebarski zbir treba podijeliti sa brojem brojeva u nizu. U ovom primjeru bilo je pet brojeva, tako da će aritmetička sredina biti 184/5 i bit će 36,8.

Značajke rada s negativnim brojevima

Ako u nizu postoje negativni brojevi, onda se aritmetička sredina nalazi pomoću sličnog algoritma. Razlika postoji samo kada se računa u programskom okruženju, ili ako postoje dodatni uslovi u zadatku. U ovim slučajevima, pronalaženje aritmetičke sredine brojeva s različitim predznacima svodi se na tri koraka:

1. Pronalaženje zajedničke aritmetičke sredine standardnom metodom;
2. Pronalaženje aritmetičke sredine negativnih brojeva.
3. Izračunavanje aritmetičke sredine pozitivnih brojeva.

Odgovori svake od radnji su napisani odvojeni zarezima.

Prirodni i decimalni razlomci

Ako je niz brojeva predstavljen decimalnim razlomcima, rješenje se javlja prema metodi izračunavanja aritmetičke sredine cijelih brojeva, ali se rezultat umanjuje prema zahtjevima zadatka za tačnost odgovora.

Kada radite s prirodnim razlomcima, treba ih svesti na zajednički nazivnik, koji se množi brojem brojeva u nizu. Brojač odgovora će biti zbir datih brojnika originalnih razlomaka.

Prilikom statističkog testiranja hipoteza, kada se mjeri linearni odnos između slučajnih varijabli.

Standardna devijacija:

Standardna devijacija(procena standardne devijacije slučajne varijable Pod, zidovi oko nas i plafon, x u odnosu na njegovo matematičko očekivanje zasnovano na nepristrasnoj procjeni njegove varijanse):

gdje - varijansa; - Pod, zidovi oko nas i plafon, i-ti element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrasne. U opštem slučaju, nemoguće je konstruisati nepristrasnu procenu. Međutim, procjena zasnovana na nepristrasnoj procjeni varijanse je konzistentna.

tri sigma pravilo

tri sigma pravilo() - gotovo sve vrijednosti normalno raspoređene slučajne varijable leže u intervalu. Strogo rečeno - sa sigurnošću od ne manje od 99,7%, vrijednost normalno raspoređene slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobijena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda treba koristiti ne, već pod, zidove oko nas i plafon, s. Tako se pravilo tri sigme prevodi u pravilo tri sprata, zidova oko nas i plafona, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu sa prosječnom vrijednošću skupa; mala vrijednost, odnosno, ukazuje da su vrijednosti u skupu grupisane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti 7 i standardne devijacije 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupisane oko srednje vrijednosti; prvi set ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U opštem smislu, standardna devijacija se može smatrati mjerom neizvjesnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje greške serije uzastopnih mjerenja neke veličine. Ova vrijednost je vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u poređenju sa vrijednošću predviđenom teorijom: ako je srednja vrijednost mjerenja vrlo različita od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobijene vrijednosti ili način njihovog dobijanja treba ponovo provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućava da odredite koliko se vrijednosti u setu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada sa istom prosječnom dnevnom maksimalnom temperaturom, ali jedan se nalazi na obali, a drugi u unutrašnjosti. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u primorskom gradu biti manja nego u drugom gradu, uprkos činjenici da imaju istu prosječnu vrijednost ove vrijednosti, što u praksi znači da je vjerovatnoća da će maksimalna temperatura zraka od svaki određeni dan u godini će biti jači razlikuje se od prosječne vrijednosti, veći za grad koji se nalazi unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko fudbalskih timova koji su rangirani prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, šansi za pogodak itd. Najvjerovatnije je da će najbolji tim u ovoj grupi imati najbolje vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su izbalansirani. S druge strane, tim sa velikom standardnom devijacijom teško može predvidjeti rezultat, što se pak objašnjava neravnotežom, na primjer, jakom odbranom, ali slabim napadom.

Upotreba standardne devijacije parametara tima omogućava da se donekle predvidi rezultat utakmice između dva tima, procjenjujući snage i slabosti timova, a time i odabrane metode borbe.

Tehnička analiza

vidi takođe

Književnost

* Borovikov, V. STATISTIKA. Umetnost kompjuterske analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

Definira se kao generalizirajuća karakteristika veličine varijacije osobine u agregatu. Jednaka je kvadratnom korijenu prosječnog kvadrata odstupanja pojedinačnih vrijednosti obilježja od aritmetičke sredine, tj. korijen i može se naći ovako:

1. Za primarni red:

2. Za seriju varijacija:

Transformacija formule standardne devijacije dovodi je do oblika pogodnijeg za praktične proračune:

Standardna devijacija određuje koliko u prosjeku određene opcije odstupaju od njihove prosječne vrijednosti, a osim toga, apsolutna je mjera fluktuacije osobine i izražava se u istim jedinicama kao i opcije, te se stoga dobro tumači.

Primjeri pronalaženja standardne devijacije: ,

Za alternativne karakteristike, formula za standardnu ​​devijaciju izgleda ovako:

gdje je p udio jedinica u populaciji koje imaju određeni atribut;

q - udio jedinica koje nemaju ovu osobinu.

Koncept srednjeg linearnog odstupanja

Prosječna linearna devijacija definira se kao aritmetička sredina apsolutnih vrijednosti odstupanja pojedinačnih opcija od .

1. Za primarni red:

2. Za seriju varijacija:

gdje je zbir n zbir frekvencija serije varijacija.

Primjer pronalaženja prosječne linearne devijacije:

Prednost srednjeg apsolutnog odstupanja kao mjere disperzije u rasponu varijacije je očigledna, jer se ova mjera zasniva na uzimanju u obzir svih mogućih odstupanja. Ali ovaj pokazatelj ima značajne nedostatke. Samovoljno odbacivanje algebarskih znakova odstupanja može dovesti do činjenice da su matematička svojstva ovog indikatora daleko od elementarnih. Ovo uvelike otežava korištenje srednjeg apsolutnog odstupanja u rješavanju problema vezanih za vjerovatnost proračuna.

Stoga se prosječna linearna devijacija kao mjera varijacije neke karakteristike rijetko koristi u statističkoj praksi, odnosno kada zbrajanje indikatora bez uzimanja u obzir predznaka ima ekonomski smisla. Uz nju se, na primjer, analizira spoljnotrgovinski promet, sastav zaposlenih, ritam proizvodnje itd.

srednji kvadratni korijen

RMS primijenjen, na primjer, za izračunavanje prosječne veličine stranica n kvadratnih presjeka, prosječnih promjera debla, cijevi itd. Podijeljen je u dva tipa.

Srednji kvadratni korijen je jednostavan. Ako je prilikom zamjene pojedinačnih vrijednosti osobine prosječnom vrijednošću potrebno zadržati zbir kvadrata originalnih vrijednosti nepromijenjenim, tada će prosjek biti kvadratni prosjek.

To je kvadratni korijen količnika zbira kvadrata vrijednosti pojedinačnih karakteristika podijeljenih s njihovim brojem:

Ponderirani srednji kvadrat izračunava se po formuli:

gdje je f znak težine.

Prosječan kubik

Primijenjena prosječna kubika, na primjer, prilikom određivanja prosječne dužine stranice i kocke. Podijeljen je u dvije vrste.
Prosječna kubna jednostavna:

Prilikom izračunavanja srednjih vrijednosti i disperzije u nizu distribucije intervala, prave vrijednosti atributa zamjenjuju se središnjim vrijednostima intervala, koje se razlikuju od aritmetičke sredine vrijednosti uključenih u interval. Ovo dovodi do sistematske greške u izračunavanju varijanse. V.F. Sheppard je to odredio greška u proračunu varijanse, uzrokovano primjenom grupisanih podataka, je 1/12 kvadrata vrijednosti intervala, i naviše i naniže u veličini varijanse.

Sheppard amandman treba koristiti ako je distribucija bliska normalnoj, odnosi se na karakteristiku s kontinuiranom prirodom varijacije, izgrađenu na značajnoj količini početnih podataka (n> 500). Međutim, na osnovu činjenice da se u jednom broju slučajeva obje greške, djelujući u različitim smjerovima, međusobno kompenzuju, ponekad je moguće odbiti uvođenje amandmana.

Što je manja varijansa i standardna devijacija, to je populacija homogenija i prosjek će biti tipičniji.
U praksi statistike često postaje neophodno upoređivati ​​varijacije različitih karakteristika. Na primjer, od velikog je interesa uporediti varijacije u dobi radnika i njihovim kvalifikacijama, dužini radnog staža i plaćama, troškovima i dobiti, dužini radnog staža i produktivnosti rada itd. Za takva poređenja, pokazatelji apsolutne varijabilnosti karakteristika su neprikladni: nemoguće je uporediti varijabilnost radnog iskustva izraženu u godinama sa varijacijama plata, izraženih u rubljama.

Za izvođenje ovakvih poređenja, kao i poređenja fluktuacije istog atributa u nekoliko populacija sa različitim aritmetičkim sredinama, koristi se relativni indikator varijacije - koeficijent varijacije.

Strukturni proseci

Za karakterizaciju centralnog trenda u statističkim distribucijama često je racionalno koristiti, zajedno sa aritmetičkom sredinom, određenu vrijednost atributa X, koji zbog određenih karakteristika svoje lokacije u nizu distribucije može okarakterizirati njen nivo.

Ovo je posebno važno kada ekstremne vrijednosti karakteristike u nizu distribucije imaju nejasne granice. U tom smislu, tačno određivanje aritmetičke sredine je po pravilu nemoguće ili veoma teško. U takvim slučajevima, prosječni nivo se može odrediti uzimanjem, na primjer, vrijednosti karakteristike koja se nalazi u sredini frekventne serije ili koja se najčešće javlja u trenutnoj seriji.

Takve vrijednosti ovise samo o prirodi frekvencija, odnosno o strukturi distribucije. One su tipične u smislu lokacije u seriji frekvencija, pa se takve vrijednosti smatraju karakteristikama distributivnog centra i stoga su definirane kao strukturni prosjeci. Koriste se za proučavanje unutrašnje strukture i strukture serije distribucije vrijednosti atributa. Ovi indikatori uključuju .

Jedan od glavnih alata statističke analize je izračunavanje standardne devijacije. Ovaj indikator vam omogućava da napravite procjenu standardne devijacije za uzorak ili za opću populaciju. Naučimo kako koristiti formulu standardne devijacije u Excelu.

Hajdemo odmah da definišemo šta je standardna devijacija i kako izgleda njena formula. Ova vrijednost je kvadratni korijen aritmetičke sredine kvadrata razlike između svih vrijednosti serije i njihove aritmetičke sredine. Za ovaj indikator postoji identičan naziv - standardna devijacija. Oba imena su potpuno ekvivalentna.

Ali, naravno, u Excelu korisnik to ne mora izračunati, jer program radi sve za njega. Naučimo kako izračunati standardnu ​​devijaciju u Excelu.

Obračun u Excelu

Možete izračunati navedenu vrijednost u Excelu pomoću dvije posebne funkcije STDEV.V(prema uzorku) i STDEV.G(prema opštoj populaciji). Princip njihovog rada je apsolutno isti, ali se mogu nazvati na tri načina, o kojima ćemo govoriti u nastavku.

Metoda 1: Čarobnjak za funkcije


Metoda 2: Kartica formule


Metoda 3: Ručno unošenje formule

Postoji i način na koji uopšte ne morate da pozivate prozor argumenta. Da biste to učinili, ručno unesite formulu.


Kao što vidite, mehanizam za izračunavanje standardne devijacije u Excelu je vrlo jednostavan. Korisnik samo treba da unese brojeve iz populacije ili veze do ćelija koje ih sadrže. Sve proračune vrši sam program. Mnogo je teže razumjeti šta je izračunati indikator i kako se rezultati proračuna mogu primijeniti u praksi. Ali razumijevanje ovoga već više pripada domenu statistike nego učenju rada sa softverom.

U ovom članku ću govoriti o kako pronaći standardnu ​​devijaciju. Ovaj materijal je izuzetno važan za potpuno razumijevanje matematike, tako da bi nastavnik matematike trebao posvetiti posebnu lekciju ili čak nekoliko lekcija tome. U ovom članku ćete pronaći vezu do detaljnog i razumljivog video vodiča koji objašnjava što je standardna devijacija i kako je pronaći.

standardna devijacija omogućava procjenu širenja vrijednosti dobivenih kao rezultat mjerenja određenog parametra. Označava se simbolom (grčko slovo "sigma").

Formula za izračun je prilično jednostavna. Da biste pronašli standardnu ​​devijaciju, morate uzeti kvadratni korijen varijanse. Dakle, sada morate da se zapitate: "Šta je varijansa?"

Šta je disperzija

Definicija varijanse je sljedeća. Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti od srednje vrijednosti.

Da biste pronašli varijansu, izvršite sljedeće proračune uzastopno:

  • Odredite srednju vrijednost (jednostavnu aritmetičku sredinu niza vrijednosti).
  • Zatim od svake vrijednosti oduzmite prosjek i kvadrirajte rezultujuću razliku (dobili smo razlika na kvadrat).
  • Sljedeći korak je izračunavanje aritmetičke sredine kvadrata dobijenih razlika (zašto su kvadrati tačno navedeni u nastavku).

Pogledajmo primjer. Recimo da ste vi i vaši prijatelji odlučili izmjeriti visinu vaših pasa (u milimetrima). Kao rezultat mjerenja dobili ste sljedeće mjere visine (u grebenu): 600 mm, 470 mm, 170 mm, 430 mm i 300 mm.

Izračunajmo srednju vrijednost, varijansu i standardnu ​​devijaciju.

Hajde da prvo pronađemo prosek. Kao što već znate, za to morate sabrati sve izmjerene vrijednosti i podijeliti s brojem mjerenja. Napredak proračuna:

Prosjek mm.

Dakle, prosjek (aritmetička sredina) je 394 mm.

Sada treba da definišemo odstupanje visine svakog od pasa od prosjeka:

konačno, za izračunavanje varijanse, svaka od dobijenih razlika se kvadrira, a zatim nalazimo aritmetičku sredinu dobijenih rezultata:

Disperzija mm 2 .

Dakle, disperzija je 21704 mm 2 .

Kako pronaći standardnu ​​devijaciju

Pa kako sada izračunati standardnu ​​devijaciju, znajući varijansu? Kao što se sjećamo, uzmite kvadratni korijen. Odnosno, standardna devijacija je:

mm (zaokruženo na najbliži cijeli broj u mm).

Koristeći ovu metodu, otkrili smo da su neki psi (npr. rotvajleri) veoma veliki psi. Ali postoje i vrlo mali psi (na primjer, jazavčari, ali to im ne biste trebali reći).

Najzanimljivije je da standardna devijacija nosi korisne informacije. Sada možemo pokazati koji su od dobijenih rezultata mjerenja rasta unutar intervala koji dobijemo ako od prosjeka (s obje njegove strane) izdvojimo standardnu ​​devijaciju.

Odnosno, koristeći standardnu ​​devijaciju, dobijamo "standardnu" metodu koja vam omogućava da saznate koja je od vrijednosti normalna (statistički prosjek), a koja je izuzetno velika ili, obrnuto, mala.

Šta je standardna devijacija

Ali... stvari će biti malo drugačije ako analiziramo uzorkovanje podaci. U našem primjeru razmotrili smo opšta populacija. Naime, naših 5 pasa su bili jedini psi na svijetu koji su nas zanimali.

Ali ako su podaci uzorak (vrijednosti odabrane iz velike populacije), tada je potrebno izračunati drugačije.

Ako postoje vrijednosti, onda:

Svi ostali proračuni se rade na isti način, uključujući i određivanje prosjeka.

Na primjer, ako je naših pet pasa samo uzorak populacije pasa (svi psi na planeti), moramo podijeliti sa 4 umjesto 5 naime:

Varijanca uzorka = mm 2 .

U ovom slučaju, standardna devijacija za uzorak je jednaka mm (zaokruženo na najbliži cijeli broj).

Možemo reći da smo napravili neku "ispravku" u slučaju kada su naše vrijednosti samo mali uzorak.

Bilješka. Zašto baš kvadrati razlika?

Ali zašto uzimamo kvadrate razlika kada računamo varijansu? Priznajmo da ste prilikom mjerenja nekog parametra dobili sljedeći skup vrijednosti: 4; 4; -4; -4. Ako samo dodamo apsolutna odstupanja od srednje vrijednosti (razlike) među sobom ... negativne vrijednosti se poništavaju pozitivnim:

.

Ispostavilo se da je ova opcija beskorisna. Onda možda vrijedi isprobati apsolutne vrijednosti odstupanja (odnosno module ovih vrijednosti)?

Na prvi pogled ispada da nije loše (rezultirajuća vrijednost, inače, naziva se srednja apsolutna devijacija), ali ne u svim slučajevima. Pokušajmo sa drugim primjerom. Neka mjerenje rezultira sljedećim skupom vrijednosti: 7; jedan; -6; -2. Tada je srednja apsolutna devijacija:

Blimey! Opet smo dobili rezultat 4, iako su razlike znatno veće.

Sada da vidimo šta će se dogoditi ako kvadriramo razlike (a zatim uzmemo kvadratni korijen njihovog zbira).

Za prvi primjer dobijate:

.

Za drugi primjer dobijate:

Sada je to sasvim druga stvar! Srednje kvadratno odstupanje je veće, što je širenje razlika veće... čemu smo težili.

Zapravo, ova metoda koristi istu ideju kao kod izračunavanja udaljenosti između tačaka, samo primijenjena na drugačiji način.

A sa matematičke tačke gledišta, upotreba kvadrata i kvadratnog korijena je korisnija nego što bismo mogli dobiti na osnovu apsolutnih vrijednosti ​​odstupanja, zbog čega je standardna devijacija primjenjiva na druge matematičke probleme.

Sergej Valerievič vam je rekao kako pronaći standardnu ​​devijaciju