Biografije Karakteristike Analiza

Kako pronaći primjer standardne devijacije. Što je standardna devijacija - korištenje funkcije standardne devijacije za izračun standardne devijacije u excelu

Kod statističkog testiranja hipoteza, kod mjerenja linearnog odnosa između slučajnih varijabli.

Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je - varijanca; - Pod, zidovi oko nas i strop, ja-th element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

pravilo tri sigme

pravilo tri sigme() - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu . Strože rečeno – s ne manjom sigurnošću od 99,7%, vrijednost normalno distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda ne treba koristiti, nego pod, zidove oko nas i strop, s. Tako se pravilo tri sigme prevodi u pravilo tri poda, zidova oko nas i stropa, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, odnosno, označava da su vrijednosti u skupu grupirane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti od 7 i standardne devijacije od 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupirane oko prosjeka; prvi skup ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se srednja vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobivene vrijednosti ili način njihova dobivanja treba ponovno provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom dnevnom maksimalnom temperaturom, ali se jedan nalazi na obali, a drugi u unutrašnjosti. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u obalnom gradu biti manja nego u drugom gradu, unatoč tome što imaju istu prosječnu vrijednost te vrijednosti, što u praksi znači da je vjerojatnost da maksimalna temperatura zraka od svaki pojedini dan u godini će se jače razlikovati od prosječne vrijednosti, više za grad unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje su rangirane prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, prilikama za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati najbolje vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su uravnoteženiji. S druge strane, momčad s velikom standardnom devijacijom teško može predvidjeti rezultat, što se pak objašnjava neravnotežom, primjerice, jaka obrana, ali slab napad.

Korištenje standardne devijacije parametara momčadi omogućuje do neke mjere predviđanje rezultata utakmice između dvije momčadi, procjenjujući snage i slabosti momčadi, a time i odabrane metode borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. STATISTIKA. Umjetnost računalne analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

Lekcija broj 4

Tema: “Opisna statistika. Pokazatelji raznolikosti svojstva u agregatu "

Glavni kriteriji za raznolikost svojstva u statističkoj populaciji su: granica, amplituda, standardna devijacija, koeficijent oscilacije i koeficijent varijacije. U prethodnoj lekciji raspravljalo se o tome da prosječne vrijednosti daju samo generalizirajuću karakteristiku proučavane osobine u agregatu i ne uzimaju u obzir vrijednosti njegovih pojedinačnih varijanti: minimalne i maksimalne vrijednosti, iznad prosjeka , ispod prosjeka itd.

Primjer. Prosječne vrijednosti dva različita brojčana niza: -100; -dvadeset; 100; 20 i 0,1; -0,2; 0,1 su potpuno isti i jednakiO.Međutim, rasponi raspršenosti podataka ovih relativnih srednjih nizova vrlo su različiti.

Definiranje navedenih kriterija za raznolikost svojstva prvenstveno se provodi uzimajući u obzir njegovu vrijednost za pojedine elemente statističke populacije.

Pokazatelji mjerenja varijacije svojstva su apsolutni i relativna. U apsolutne pokazatelje varijacije spadaju: raspon varijacije, granica, standardna devijacija, varijanca. Koeficijent varijacije i koeficijent oscilacije odnose se na relativne mjere varijacije.

Limit (lim)– ovo je kriterij koji je određen ekstremnim vrijednostima varijante u nizu varijacija. Drugim riječima, ovaj kriterij ograničen je minimalnim i maksimalnim vrijednostima atributa:

Amplituda (Am) ili raspon varijacija - ovo je razlika između krajnosti. Izračun ovog kriterija provodi se oduzimanjem njegove minimalne vrijednosti od maksimalne vrijednosti atributa, što omogućuje procjenu stupnja disperzije varijante:

Nedostatak limita i amplitude kao kriterija varijabilnosti je u tome što u potpunosti ovise o ekstremnim vrijednostima svojstva u nizu varijacija. U ovom slučaju, fluktuacije u vrijednostima atributa unutar niza se ne uzimaju u obzir.

Najcjelovitiju karakterizaciju raznolikosti svojstva u statističkoj populaciji daje standardna devijacija(sigma), što je opća mjera odstupanja varijante od njezine srednje vrijednosti. Standardna devijacija se također često naziva standardna devijacija.

Osnova standardne devijacije je usporedba svake opcije s aritmetičkom sredinom ove populacije. Budući da će u agregatu uvijek biti opcija i manje i više od njega, tada će zbroj odstupanja s predznakom "" biti otplaćen zbrojem odstupanja s predznakom "", tj. zbroj svih odstupanja je nula. Da bi se izbjegao utjecaj predznaka razlika, uzimaju se odstupanja varijante od kvadrata aritmetičke sredine, tj. . Zbroj kvadrata odstupanja nije jednak nuli. Da biste dobili koeficijent koji može mjeriti varijabilnost, uzmite prosjek zbroja kvadrata - ta se vrijednost naziva disperzija:

Prema definiciji, varijanca je srednji kvadrat odstupanja pojedinačnih vrijednosti obilježja od njegove srednje vrijednosti. Disperzija kvadrat standardne devijacije .

Disperzija je dimenzionalna veličina (nazvana). Dakle, ako su varijante niza brojeva izražene u metrima, tada disperzija daje kvadratne metre; ako su varijante izražene u kilogramima, tada varijanca daje kvadrat ove mjere (kg 2), i tako dalje.

Standardna devijacija je kvadratni korijen varijance:

, tada pri izračunavanju varijance i standardne devijacije u nazivniku razlomka, umjestopotrebno je staviti.

Izračun standardne devijacije može se podijeliti u šest faza, koje se moraju provesti određenim redoslijedom:

Primjena standardne devijacije:

a) prosuditi kolebanje varijacijskih nizova i usporednu ocjenu tipičnosti (reprezentativnosti) aritmetičkih sredina. To je potrebno u diferencijalnoj dijagnozi pri određivanju stabilnosti znakova.

b) za rekonstrukciju varijacijskog niza, tj. obnavljanje njegovog frekvencijskog odziva na temelju pravila tri sigme. U intervalu (M±3σ) nalazi se 99,7% svih varijanti niza, u intervalu (M±2σ) - 95,5% iu intervalu (M±1σ) - 68,3% opcija reda(Sl. 1).

c) za prepoznavanje "skočnih" opcija

d) odrediti parametre norme i patologije pomoću sigma procjena

e) izračunati koeficijent varijacije

e) izračunati prosječnu grešku aritmetičke sredine.

Za karakterizaciju bilo koje opće populacije koja imatip normalne distribucije , dovoljno je znati dva parametra: aritmetičku sredinu i standardnu ​​devijaciju.

Slika 1. Pravilo tri sigme

Primjer.

U pedijatriji se standardna devijacija koristi za procjenu tjelesnog razvoja djece usporedbom podataka određenog djeteta s odgovarajućim standardnim pokazateljima. Kao standard uzeti su aritmetički srednji pokazatelji tjelesnog razvoja zdrave djece. Usporedba pokazatelja sa standardima provodi se prema posebnim tablicama, u kojima su navedeni standardi zajedno s pripadajućim sigma skalama. Vjeruje se da ako je pokazatelj tjelesnog razvoja djeteta unutar standarda (aritmetička sredina) ±σ, tada tjelesni razvoj djeteta (prema ovom pokazatelju) odgovara normi. Ako je pokazatelj unutar standarda ±2σ, tada postoji malo odstupanje od norme. Ako pokazatelj prelazi ove granice, tada se fizički razvoj djeteta oštro razlikuje od norme (patologija je moguća).

Osim pokazatelja varijacije izraženih u apsolutnim vrijednostima, u statističkim istraživanjima koriste se i pokazatelji varijacije izraženi u relativnim vrijednostima. Koeficijent oscilacije - ovo je omjer raspona varijacije i prosječne vrijednosti svojstva. Koeficijent varijacije - ovo je omjer standardne devijacije i prosječne vrijednosti obilježja. Obično se te vrijednosti izražavaju u postocima.

Formule za izračunavanje relativnih pokazatelja varijacije:

Iz gornjih formula se vidi da što je veći koeficijent V blizu nule, manja je varijacija vrijednosti svojstva. Više V, što je predznak promjenjiviji.

U statističkoj praksi najčešće se koristi koeficijent varijacije. Koristi se ne samo za komparativnu procjenu varijacije, već i za karakterizaciju homogenosti populacije. Skup se smatra homogenim ako koeficijent varijacije ne prelazi 33% (za distribucije bliske normalnim). Aritmetički, omjer σ i aritmetičke sredine eliminira utjecaj apsolutne vrijednosti ovih karakteristika, a postotni omjer čini koeficijent varijacije bezdimenzionalnom (neimenovanom) vrijednošću.

Dobivena vrijednost koeficijenta varijacije procjenjuje se u skladu s približnim gradacijama stupnja raznolikosti svojstva:

Slab - do 10%

Prosjek - 10 - 20%

Snažan - više od 20%

Korištenje koeficijenta varijacije preporučljivo je u slučajevima kada je potrebno usporediti značajke koje se razlikuju po veličini i dimenzijama.

Razlika između koeficijenta varijacije i drugih kriterija raspršenosti jasno je prikazana na primjer.

stol 1

Sastav zaposlenih u industrijskom poduzeću

Na temelju statističkih karakteristika navedenih u primjeru može se zaključiti da su dobni sastav i obrazovna razina zaposlenika poduzeća relativno homogeni, uz nisku profesionalnu stabilnost ispitanog kontingenta. Lako je vidjeti da bi pokušaj prosuđivanja ovih društvenih trendova standardnom devijacijom doveo do pogrešnog zaključka, a pokušaj usporedbe računovodstvenih značajki "radno iskustvo" i "dob" s računovodstvenom značajkom "obrazovanje" općenito bi bio netočna zbog heterogenosti ovih značajki.

Medijan i percentili

Za ordinalne (rang) distribucije, gdje je kriterij za sredinu niza medijan, standardna devijacija i varijanca ne mogu poslužiti kao karakteristike disperzije varijante.

Isto vrijedi i za otvorene varijacijske serije. Ova okolnost je zbog činjenice da se odstupanja, prema kojima se izračunavaju disperzija i σ, računaju od aritmetičke sredine, koja se ne izračunava u otvorenim varijacijskim serijama i u serijama distribucija kvalitativnih značajki. Stoga se za komprimirani opis distribucija koristi drugi parametar raspršenja - kvantil(sinonim - "percentil"), pogodan za opisivanje kvalitativnih i kvantitativnih karakteristika u bilo kojem obliku njihove distribucije. Ovaj se parametar također može koristiti za pretvaranje kvantitativnih značajki u kvalitativne. U ovom slučaju, takvi se rezultati dodjeljuju ovisno o tome koji redoslijed kvantila odgovara jednoj ili drugoj specifičnoj opciji.

U praksi biomedicinskih istraživanja najčešće se koriste sljedeći kvantili:

– medijan;

, su kvartili (četvrtine), gdje je donji kvartil, gornji kvartil.

Kvantili dijele područje mogućih promjena u varijacijskom nizu na određene intervale. Medijan (kvantil) je varijanta koja se nalazi u sredini varijacijskog niza i dijeli ga na pola, na dva jednaka dijela ( 0,5 i 0,5 ). Kvartil dijeli seriju u četiri dijela: prvi dio (donji kvartil) je opcija koja razdvaja opcije čije brojčane vrijednosti ne prelaze 25% maksimalno moguće u ovoj seriji, kvartil razdvaja opcije s numeričkom vrijednošću do 50 % maksimalnog mogućeg. Gornji kvartil () odvaja opcije do 75% maksimalnih mogućih vrijednosti.

U slučaju asimetrične distribucije varijabla u odnosu na aritmetičku sredinu, medijan i kvartili koriste se za njezino obilježavanje. U ovom slučaju koristi se sljedeći oblik prikaza prosječne vrijednosti - Mi (;). Na primjer, ispitivana osobina - "razdoblje u kojem je dijete počelo samostalno hodati" - u ispitivanoj skupini ima asimetričnu distribuciju. U isto vrijeme, donji kvartil () odgovara početku hodanja - 9,5 mjeseci, medijan - 11 mjeseci, gornji kvartil () - 12 mjeseci. Sukladno tome, karakteristika prosječnog trenda navedenog atributa bit će prikazana kao 11 (9,5; 12) mjeseci.

Procjena statističke značajnosti rezultata istraživanja

Pod statističkom značajnošću podataka podrazumijeva se stupanj njihove podudarnosti prikazanoj stvarnosti, tj. Statistički značajni podaci su oni koji ne iskrivljuju i ispravno odražavaju objektivnu stvarnost.

Ocijeniti statističku značajnost rezultata istraživanja znači utvrditi s kojom je vjerojatnošću moguće prenijeti rezultate dobivene na uzorku populacije na cjelokupnu populaciju. Procjena statističke značajnosti neophodna je kako bi se razumjelo koliko se dio fenomena može koristiti za prosudbu fenomena kao cjeline i njegovih obrazaca.

Procjena statističke značajnosti rezultata istraživanja sastoji se od:

1. pogreške reprezentativnosti (pogreške prosječnih i relativnih vrijednosti) - m;

2. granice pouzdanosti prosječnih ili relativnih vrijednosti;

3. pouzdanost razlike između prosječnih ili relativnih vrijednosti prema kriteriju t.

Standardna greška aritmetičke sredine ili pogreška reprezentativnosti karakterizira fluktuacije u prosjeku. Treba napomenuti da što je veći uzorak, to je manji raspon prosječnih vrijednosti. Standardna pogreška srednje vrijednosti izračunava se formulom:

U modernoj znanstvenoj literaturi aritmetička sredina se piše zajedno s pogreškom reprezentativnosti:

ili zajedno sa standardnom devijacijom:

Kao primjer, razmotrite podatke za 1500 gradskih poliklinika u zemlji (opća populacija). Prosječan broj pacijenata opsluženih u poliklinici je 18150 osoba. Slučajnim odabirom 10% objekata (150 poliklinika) prosječan broj pacijenata iznosi 20051 osoba. Pogreška uzorka, očito povezana s činjenicom da u uzorak nije uključeno svih 1500 poliklinika, jednaka je razlici između tih prosjeka - općeg prosjeka ( M gen) i srednja vrijednost uzorka ( M sb). Ako formiramo drugi uzorak iste veličine iz naše populacije, to će dati različitu količinu pogreške. Sve ove uzorkovne sredine, s dovoljno velikim uzorcima, normalno se raspoređuju oko opće sredine s dovoljno velikim brojem ponavljanja uzorka od istog broja objekata iz opće populacije. Standardna pogreška srednje vrijednosti m je neizbježno širenje uzoraka srednjih vrijednosti oko opće sredine.

U slučaju kada su rezultati studije predstavljeni relativnim vrijednostima (na primjer, postocima), podijeli standardnu ​​pogrešku:

gdje je P indikator u %, n je broj opažanja.

Rezultat se prikazuje kao (P ± m)%. Na primjer, postotak oporavka među pacijentima bio je (95,2±2,5)%.

Ako broj elemenata u populaciji, tada pri izračunavanju standardnih pogrešaka sredine i udjela u nazivniku razlomka, umjestopotrebno je staviti.

Za normalnu distribuciju (distribucija srednjih vrijednosti uzorka je normalna), poznato je koliko populacije spada unutar bilo kojeg intervala oko srednje vrijednosti. Posebno:

U praksi, problem je u tome što su nam karakteristike opće populacije nepoznate, a uzorak se radi upravo u svrhu njihove procjene. To znači da ako uzmemo uzorke iste veličine n iz opće populacije, tada će u 68,3% slučajeva interval sadržavati vrijednost M(bit će na intervalu u 95,5% slučajeva i na intervalu u 99,7% slučajeva).

Budući da je zapravo napravljen samo jedan uzorak, ova tvrdnja je formulirana u terminima vjerojatnosti: s vjerojatnošću od 68,3%, prosječna vrijednost atributa u općoj populaciji sadržana je u intervalu, s vjerojatnošću od 95,5% - u intervalu itd.

U praksi se takav interval gradi oko vrijednosti uzorka, koja bi sa zadanom (dovoljno visokom) vjerojatnošću - vjerojatnost povjerenja - bi “pokrila” pravu vrijednost ovog parametra u općoj populaciji. Taj se interval naziva interval pouzdanosti.

Vjerojatnost povjerenjaP je stupanj pouzdanosti da će interval pouzdanosti doista sadržavati pravu (nepoznatu) vrijednost parametra u populaciji.

Na primjer, ako je razina povjerenja R jednako 90%, to znači da će 90 uzoraka od 100 dati točnu procjenu parametra u općoj populaciji. Prema tome, vjerojatnost pogreške, tj. netočna procjena općeg prosjeka za uzorak, jednaka je u postocima: . Za ovaj primjer to znači da će 10 uzoraka od 100 dati netočnu procjenu.

Očito, stupanj pouzdanosti (vjerojatnost povjerenja) ovisi o veličini intervala: što je interval širi, veća je pouzdanost da će nepoznata vrijednost za opću populaciju pasti u njega. U praksi se uzima najmanje dvostruko veća pogreška uzorkovanja da bi se konstruirao interval pouzdanosti kako bi se osiguralo najmanje 95,5% pouzdanosti.

Određivanje granica pouzdanosti prosječnih i relativnih vrijednosti omogućuje nam da pronađemo njihove dvije ekstremne vrijednosti - najmanju moguću i najveću moguću, unutar kojih se pokazatelj koji se proučava može pojaviti u cijeloj općoj populaciji. Na temelju toga, granice pouzdanosti (ili interval pouzdanosti)- to su granice prosječnih ili relativnih vrijednosti, odlazak preko kojih zbog slučajnih fluktuacija ima beznačajnu vjerojatnost.

Interval pouzdanosti može se prepisati kao: , gdje t je kriterij povjerenja.

Granice pouzdanosti aritmetičke sredine u općoj populaciji određene su formulom:

M gen = M Odaberi + t m M

za relativnu vrijednost:

R gen = P Odaberi + t m R

gdje M gen i R gen- vrijednosti prosječnih i relativnih vrijednosti za opću populaciju; M Odaberi i R Odaberi- vrijednosti prosječnih i relativnih vrijednosti dobivenih na uzorku populacije; m M i m P- pogreške prosječnih i relativnih vrijednosti; t- kriterij povjerenja (kriterij točnosti koji se postavlja pri planiranju studije i može biti jednak 2 ili 3); t m- ovo je interval pouzdanosti ili Δ - granična pogreška pokazatelja dobivenog u istraživanju uzorka.

Treba napomenuti da je vrijednost kriterija t u određenoj je mjeri povezana s vjerojatnošću prognoze bez pogreške (p), izraženom u%. Odabire ga sam istraživač, vodeći se potrebom da dobije rezultat s potrebnim stupnjem točnosti. Dakle, za vjerojatnost prognoze bez pogreške od 95,5%, vrijednost kriterija t je 2, za 99,7% - 3.

Navedene procjene intervala pouzdanosti prihvatljive su samo za statističke populacije s više od 30 opažanja, a kod manje populacije (mali uzorci) koriste se posebne tablice za određivanje kriterija t. U tim se tablicama željena vrijednost nalazi na sjecištu crte koja odgovara veličini populacije (n-1), i stupac koji odgovara razini vjerojatnosti prognoze bez pogreške (95,5%; 99,7%) koju je odabrao istraživač. U medicinskim istraživanjima, pri utvrđivanju granica pouzdanosti za bilo koji pokazatelj, vjerojatnost prognoze bez pogreške je 95,5% ili više. To znači da se vrijednost pokazatelja dobivena na uzorku populacije mora naći u općoj populaciji u najmanje 95,5% slučajeva.

    Pitanja o temi lekcije:

    Relevantnost pokazatelja raznolikosti svojstva u statističkoj populaciji.

    Opće karakteristike apsolutnih pokazatelja varijacije.

    Standardna devijacija, proračun, primjena.

    Relativni pokazatelji varijacije.

    Medijan, rezultat kvartila.

    Procjena statističke značajnosti rezultata istraživanja.

    Standardna pogreška aritmetičke sredine, formula za izračun, primjer uporabe.

    Izračun udjela i njegove standardne pogreške.

    Pojam vjerojatnosti povjerenja, primjer uporabe.

10. Pojam intervala povjerenja, njegova primjena.

    Testni zadaci na temu s oglednim odgovorima:

1. APSOLUTNI POKAZATELJI VARIJACIJE SU

1) koeficijent varijacije

2) koeficijent oscilacije

4) medijan

2. RELATIVNI POKAZATELJI VARIJACIJE SU

1) disperzija

4) koeficijent varijacije

3. KRITERIJ ODREĐEN EKSTREMNIM VRIJEDNOSTIMA VARIJANTE U NIZU VARIJACIJA

2) amplituda

3) disperzija

4) koeficijent varijacije

4. RAZLIKA EKSTREMNE OPCIJE JE

2) amplituda

3) standardna devijacija

4) koeficijent varijacije

5. SREDNJI KVADRAT ODSTUPANJA POJEDINIH ZNAČAJNIH VRIJEDNOSTI OD NJEGOVE PROSJEČNE VRIJEDNOSTI JE

1) koeficijent oscilacije

2) medijan

3) disperzija

6. OMJER RASPONA VARIJACIJE I PROSJEČNE VRIJEDNOSTI ZNAČAJKE JE

1) koeficijent varijacije

2) standardna devijacija

4) koeficijent oscilacije

7. OMJER SREDNJE KVADRATNE DEVIJACIJE I PROSJEČNE VRIJEDNOSTI OBILJEŽJA JE

1) disperzija

2) koeficijent varijacije

3) koeficijent oscilacije

4) amplituda

8. VARIJANTA KOJA JE U SREDINI NIZA VARIJACIJA I DIJELI GA NA DVA JEDNAKA DIJELA JE

1) medijan

3) amplituda

9. U MEDICINSKIM ISTRAŽIVANJIMA, KOD UTVRĐIVANJA GRANICA POVJERENJA BILO KOG POKAZATELJA, PRIHVAĆA SE VJEROJATNOST PREDVIĐANJA BEZ POGREŠAKA

10. AKO 90 UZORAKA OD 100 DAJE ISPRAVNU PROCJENU PARAMETRA U OPĆOJ POPULACIJI, ONDA TO ZNAČI DA JE VJEROJATNOST POVJERENJA P JEDNAK

11. U SLUČAJU AKO 10 OD 100 UZORAKA DA NETOČNU PROCJENU, VJEROJATNOST POGREŠKE JE

12. GRANICE PROSJEČNIH ILI RELATIVNIH VRIJEDNOSTI, POSTOJI MALA VJEROJATNOST DA SE IZLAZI IZNAD GRANICA ZBOG NASUOMIČNIH OSCILACIJA - OVO

1) interval pouzdanosti

2) amplituda

4) koeficijent varijacije

13. MALIM UZORKOM SMATRA SE POPULACIJA U KOJOJ

1) n je manji ili jednak 100

2) n je manji ili jednak 30

3) n je manji ili jednak 40

4) n je blizu 0

14. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 95% KRITERIJSKA VRIJEDNOST t KOMPONIRA

15. ZA VJEROJATNOST PROGNOZE BEZ POGREŠKE 99% KRITERIJSKA VRIJEDNOST t KOMPONIRA

16. ZA DISTRIBUCIJU BLIZU NORMALNE, POPULACIJA SE SMATRA HOMOGENOM AKO KOEFICIJENT VARIJACIJE NE PRELAZI

17. OPCIJA RAZDJELJIVANJA VARIJANTI ČIJE BROJČANE VRIJEDNOSTI NE PRELAZE 25% OD MAKSIMALNO MOGUĆIH U OVOM RETU JE

2) donji kvartil

3) gornji kvartil

4) kvartil

18. PODACI KOJI NE ISKRIVLJAJU I ISPRAVNO ODRAŽAVAJU OBJEKTIVNU STVARNOST ZV.

1) nemoguće

2) jednako moguće

3) pouzdan

4) slučajni

19. PREMA PRAVILU TRI ZNAKA, UZ NORMALNU DISTRIBUCIJU ZNAKA UNUTAR
ĆE SE NALAZITI

1) 68,3% opcija

Za izračunavanje jednostavne geometrijske sredine koristi se formula:

geometrijski ponderirani

Za određivanje geometrijskog ponderiranog prosjeka koristi se formula:

Prosječni promjeri kotača, cijevi, prosječne stranice kvadrata određuju se koristeći korijen srednje vrijednosti kvadrata.

RMS vrijednosti se koriste za izračun nekih pokazatelja, kao što je koeficijent varijacije, koji karakterizira ritam proizvodnje. Ovdje se standardna devijacija od planiranog outputa za određeno razdoblje određuje sljedećom formulom:

Ove vrijednosti točno karakteriziraju promjenu ekonomskih pokazatelja u usporedbi s njihovom osnovnom vrijednošću, uzetom u svojoj prosječnoj vrijednosti.

Kvadratno jednostavno

Prosječni srednji kvadrat izračunava se formulom:

Kvadratno ponderirano

Ponderirana sredina kvadrata je:

22. Apsolutne mjere varijacije uključuju:

raspon varijacije

srednje linearno odstupanje

disperzija

standardna devijacija

Raspon varijacije (r)

Varijacija raspona je razlika između maksimalne i minimalne vrijednosti atributa

Prikazuje granice u kojima se mijenja vrijednost atributa u proučavanoj populaciji.

Radno iskustvo pet kandidata na prethodnom radnom mjestu je: 2,3,4,7 i 9 godina. Rješenje: raspon varijacije = 9 - 2 = 7 godina.

Za generaliziranu karakteristiku razlika u vrijednostima atributa, prosječni pokazatelji varijacije izračunavaju se na temelju dopuštenja za odstupanja od aritmetičke sredine. Razlika se uzima kao odstupanje od srednje vrijednosti.

U isto vrijeme, kako bi se izbjeglo pretvaranje u nulu zbroja odstupanja opcija osobina od sredine (nulto svojstvo sredine), potrebno je ili zanemariti predznake odstupanja, odnosno uzeti ovu sumu modulo , ili kvadrirajte vrijednosti odstupanja

Srednja linearna i kvadratna devijacija

Prosječno linearno odstupanje je aritmetička sredina apsolutnih odstupanja pojedinačnih vrijednosti atributa od sredine.

Prosječno linearno odstupanje je jednostavno:

Radno iskustvo pet kandidata na prethodnom radnom mjestu je: 2,3,4,7 i 9 godina.

U našem primjeru: godine;

Odgovor: 2,4 godine.

Prosječno linearno odstupanje ponderirano odnosi se na grupirane podatke:

Prosječno linearno odstupanje, zbog svoje konvencionalnosti, relativno se rijetko koristi u praksi (osobito za karakterizaciju ispunjenja ugovornih obveza u smislu ravnomjernosti isporuke; u analizi kvalitete proizvoda, uzimajući u obzir tehnološke značajke proizvodnje). ).

Standardna devijacija

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu srednje kvadratne vrijednosti odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se za grupirane podatke:

Između srednje kvadratne i srednje linearne devijacije u uvjetima normalne distribucije postoji odnos: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju vrijednosti ordinata krivulje normalne distribucije, u proračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanje točnosti karakteristika uzorka, kao iu procjena granica varijacije svojstva u homogenoj populaciji.

Mudri matematičari i statističari došli su do pouzdanijeg pokazatelja, ali za nešto drugačiju svrhu - srednje linearno odstupanje. Ovaj pokazatelj karakterizira mjeru širenja vrijednosti skupa podataka oko njihove prosječne vrijednosti.

Kako biste pokazali mjeru širenja podataka, prvo morate odrediti u odnosu na što će se to širenje smatrati - obično je to prosječna vrijednost. Zatim morate izračunati koliko su vrijednosti analiziranog skupa podataka daleko od prosjeka. Jasno je da svaka vrijednost odgovara određenom iznosu odstupanja, ali nas zanima i opća procjena koja pokriva cijelu populaciju. Stoga se prosječno odstupanje izračunava pomoću formule uobičajene aritmetičke sredine. Ali! Ali da bi se izračunao prosjek odstupanja, prvo ih je potrebno zbrojiti. A ako zbrojimo pozitivne i negativne brojeve, oni će se međusobno poništiti i njihov će zbroj težiti nuli. Da bi se to izbjeglo, sva odstupanja se uzimaju modulo, odnosno svi negativni brojevi postaju pozitivni. Sada će prosječno odstupanje pokazati generaliziranu mjeru širenja vrijednosti. Kao rezultat toga, prosječno linearno odstupanje izračunat će se formulom:

a je prosječno linearno odstupanje,

x- analizirani pokazatelj, s crticom na vrhu - prosječna vrijednost pokazatelja,

n je broj vrijednosti u analiziranom skupu podataka,

operator zbrajanja, nadam se, nikoga ne plaši.

Prosječno linearno odstupanje izračunato pomoću navedene formule odražava prosječno apsolutno odstupanje od prosječne vrijednosti za ovu populaciju.

Crvena linija na slici je prosječna vrijednost. Odstupanja svakog opažanja od srednje vrijednosti označena su malim strelicama. Uzimaju se po modulu i zbrajaju. Zatim se sve podijeli s brojem vrijednosti.

Za potpunu sliku potrebno je navesti još jedan primjer. Recimo da postoji tvrtka koja proizvodi reznice za lopate. Svaka reznica treba biti dugačka 1,5 metar, ali što je još važnije, sve trebaju biti jednake ili barem plus-minus 5 cm, ali će nemarni radnici odrezati 1,2 m, pa 1,8 m. . Direktor tvrtke odlučio je provesti statističku analizu duljine reznica. Odabrao sam 10 komada i izmjerio njihovu duljinu, pronašao prosjek i izračunao prosječno linearno odstupanje. Prosjek se pokazao taman - 1,5 m. Ali prosječno linearno odstupanje pokazalo se 0,16 m. Dakle, ispada da je svaki rez duži ili kraći nego što je potrebno u prosjeku za 16 cm. Ima o čemu razgovarati s radnicima. Zapravo, nisam vidio stvarnu upotrebu ovog indikatora, pa sam sam smislio primjer. Međutim, postoji takav pokazatelj u statistici.

Disperzija

Kao i srednje linearno odstupanje, varijanca također odražava opseg u kojem se podaci šire oko srednje vrijednosti.

Formula za izračun varijance izgleda ovako:

(za serije varijacija (ponderirana varijanca))

(za negrupirane podatke (jednostavna varijanca))

Gdje je: σ 2 - disperzija, Xi– analiziramo sq indikator (vrijednost značajke), – prosječnu vrijednost indikatora, f i – broj vrijednosti u analiziranom skupu podataka.

Varijanca je srednji kvadrat odstupanja.

Prvo se izračuna srednja vrijednost, zatim se razlika između svake osnovne vrijednosti i srednje vrijednosti uzima, kvadrira, množi učestalošću odgovarajuće vrijednosti obilježja, dodaje, a zatim dijeli s brojem vrijednosti u populaciji.

Međutim, u svom čistom obliku, kao što je, na primjer, aritmetička sredina ili indeks, disperzija se ne koristi. To je više pomoćni i posredni pokazatelj koji se koristi za druge vrste statističkih analiza.

Pojednostavljeni način izračuna varijance

standardna devijacija

Da bi se varijanca koristila za analizu podataka, iz nje se vadi kvadratni korijen. Ispada tzv standardna devijacija.

Usput, standardna devijacija se također naziva sigma - od grčkog slova koje je označava.

Standardna devijacija očito također karakterizira mjeru disperzije podataka, ali se sada (za razliku od disperzije) može usporediti s izvornim podacima. U pravilu, srednjokvadratni pokazatelji u statistici daju točnije rezultate od linearnih. Stoga je standardna devijacija točnija mjera raspršenosti podataka od srednje linearne devijacije.

Standardna devijacija je klasičan pokazatelj varijabilnosti iz deskriptivne statistike.

Standardna devijacija, standardna devijacija, RMS, standardna devijacija uzorka (engleski standard deviation, STD, STDev) vrlo je česta mjera disperzije u deskriptivnoj statistici. Ali zbog tehnička analiza je slična statistici, ovaj se pokazatelj može (i treba) koristiti u tehničkoj analizi za otkrivanje stupnja disperzije cijene analiziranog instrumenta tijekom vremena. Označava se grčkim simbolom sigma "σ".

Hvala Karlu Gaussu i Pearsonu što imamo priliku koristiti standardnu ​​devijaciju.

Korištenje standardna devijacija u tehničkoj analizi, okrećemo ovo "indeks raspršenosti"u "indikator volatilnosti“Zadržavajući značenje, ali mijenjajući uvjete.

Što je standardna devijacija

No, pored posrednih pomoćnih izračuna, standardna devijacija je sasvim prihvatljiva za samoizračun i primjene u tehničkoj analizi. Kao što je primijetio aktivni čitatelj našeg časopisa čičak, " Još uvijek ne razumijem zašto RMS nije uključen u skup standardnih pokazatelja domaćih prodajnih centara«.

Stvarno, standardna devijacija može na klasičan i "čist" način mjeriti varijabilnost instrumenta. No, nažalost, ovaj pokazatelj nije tako čest u analizi vrijednosnih papira.

Primjena standardne devijacije

Ručno izračunavanje standardne devijacije nije baš zanimljivo. ali korisno za iskustvo. Standardna devijacija se može izraziti formula STD=√[(∑(x-x) 2)/n], koja zvuči kao korijen zbroja kvadrata razlika između stavki uzorka i srednje vrijednosti, podijeljen s brojem stavki u uzorku.

Ako je broj elemenata u uzorku veći od 30, tada nazivnik razlomka pod korijenom poprima vrijednost n-1. Inače se koristi n.

korak po korak izračun standardne devijacije:

  1. izračunati aritmetičku sredinu uzorka podataka
  2. oduzmite ovaj prosjek od svakog elementa uzorka
  3. sve dobivene razlike su na kvadrat
  4. zbroji sve dobivene kvadrate
  5. podijelite dobiveni zbroj s brojem elemenata u uzorku (ili s n-1 ako je n>30)
  6. izračunajte kvadratni korijen dobivenog kvocijenta (tzv disperzija)