Biografije Karakteristike Analiza

Formula standardne devijacije. Kako izračunati standardnu ​​devijaciju? Disperzija

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu srednjeg kvadrata odstupanja vrijednosti pojedinačnih karakteristika od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija se primjenjuje za grupisane podatke:

Između srednjeg kvadrata i srednjeg linearnog odstupanja u uslovima normalne distribucije postoji sljedeća veza: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se za određivanje vrijednosti ordinata krive normalne distribucije, u proračunima koji se odnose na organizaciju posmatranja uzorka i utvrđivanje tačnosti karakteristika uzorka, kao i kod procjenu granica varijacije osobine u homogenoj populaciji.

Disperzija, njene vrste, standardna devijacija.

Varijanca slučajne varijable- mjera širenja date slučajne varijable, odnosno njenog odstupanja od matematičkog očekivanja. U statistici se često koristi oznaka ili. Kvadratni korijen varijanse naziva se standardna devijacija, standardna devijacija ili standardni raspon.

Ukupna varijansa (σ2) mjeri varijaciju osobine u cjelokupnoj populaciji pod utjecajem svih faktora koji su uzrokovali ovu varijaciju. Istovremeno, zahvaljujući metodi grupisanja, moguće je izolovati i izmeriti varijaciju zbog obeležja grupisanja, kao i varijaciju koja se javlja pod uticajem neuračunatih faktora.

Međugrupna varijansa (σ 2 m.gr) karakteriše sistematsku varijaciju, tj. razlike u veličini osobine koja se proučava, nastalu pod uticajem osobine - faktora koji leži u osnovi grupisanja.

standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, standardna devijacija; slični pojmovi: standardna devijacija, standardni raspon) - u teoriji vjerojatnosti i statistici, najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njeno matematičko očekivanje. Sa ograničenim nizovima uzoraka vrijednosti, umjesto matematičkog očekivanja, koristi se aritmetička sredina skupa uzoraka.

Standardna devijacija se mjeri u jedinicama same slučajne varijable i koristi se za izračunavanje standardne greške aritmetičke sredine, za konstruiranje intervala povjerenja, za statističko testiranje hipoteza i za mjerenje linearnog odnosa između slučajnih varijabli. Definira se kao kvadratni korijen varijanse slučajne varijable.


Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na njegovo matematičko očekivanje zasnovano na nepristrasnoj procjeni njegove varijanse):

gdje je disperzija; — i-ti element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrasne. U opštem slučaju, nemoguće je konstruisati nepristrasnu procenu. Međutim, procjena zasnovana na nepristrasnoj procjeni varijanse je konzistentna.

Suština, obim i postupak za određivanje modusa i medijana.

Pored prosjeka po stepenu u statistici, za relativnu karakteristiku veličine promjenjivog atributa i unutrašnje strukture distribucijskih serija koriste se strukturni prosjeci, koji su uglavnom predstavljeni kao mod i medijan.

Moda- Ovo je najčešća varijanta serije. Moda se koristi, na primjer, pri određivanju veličine odjeće, obuće, za kojima je najveća potražnja među kupcima. Režim za diskretnu seriju je varijanta sa najvećom frekvencijom. Prilikom izračunavanja načina za niz intervalnih varijacija, prvo morate odrediti modalni interval (po maksimalnoj frekvenciji), a zatim vrijednost modalne vrijednosti atributa prema formuli:

- - modna vrijednost

- - donja granica modalnog intervala

- - vrijednost intervala

- - frekvencija modalnog intervala

- - frekvencija intervala koji prethodi modalnom

- - učestalost intervala nakon modalnog

medijan - ovo je vrijednost karakteristike koja leži u osnovi rangirane serije i dijeli ovu seriju na dva dijela jednaka po broju.

Da biste odredili medijanu u diskretnoj seriji u prisustvu frekvencija, prvo izračunajte poluzbir frekvencija, a zatim odredite koja vrijednost varijante pada na njega. (Ako sortirani red sadrži neparan broj karakteristika, tada se srednji broj izračunava po formuli:

M e \u003d (n (broj karakteristika u zbiru) + 1) / 2,

u slučaju parnog broja karakteristika, medijana će biti jednaka proseku dve karakteristike u sredini reda).

Prilikom izračunavanja medijane za niz intervalnih varijacija, prvo odredite srednji interval unutar kojeg se nalazi medijana, a zatim vrijednost medijane prema formuli:

- je željeni medijan

- je donja granica intervala koji sadrži medijanu

- - vrijednost intervala

- - zbir frekvencija ili broj članova serije

Zbir akumuliranih frekvencija intervala koji prethode medijani

- je frekvencija srednjeg intervala

Primjer. Pronađite mod i medijan.

Odluka:
U ovom primjeru, modalni interval je unutar starosne grupe od 25-30 godina, jer ovaj interval predstavlja najveću učestalost (1054).

Izračunajmo vrijednost moda:

To znači da je modalna starost studenata 27 godina.

Izračunajte medijan. Medijanski interval je u starosnoj grupi 25-30 godina, jer u okviru ovog intervala postoji varijanta koja populaciju dijeli na dva jednaka dijela (Σf i /2 = 3462/2 = 1731). Zatim u formulu zamjenjujemo potrebne numeričke podatke i dobivamo vrijednost medijane:

To znači da je polovina učenika mlađa od 27,4 godine, a druga polovina starija od 27,4 godine.

Osim moda i medijane, mogu se koristiti indikatori kao što su kvartili, dijeleći rangiranu seriju na 4 jednaka dijela, decila- 10 dijelova i percentila - na 100 dijelova.

Pojam selektivnog posmatranja i njegov obim.

Selektivno posmatranje primjenjuje se kada se primjenjuje kontinuirano posmatranje fizički nemoguće zbog velike količine podataka ili ekonomski nepraktično. Fizička nemogućnost se javlja, na primjer, kada se proučavaju putnički tokovi, tržišne cijene, porodični budžeti. Ekonomska nesvrsishodnost javlja se pri ocjenjivanju kvalitete robe povezane s njihovim uništenjem, na primjer, degustacija, ispitivanje čvrstoće cigle itd.

Statističke jedinice odabrane za posmatranje čine uzorak ili uzorak, a cijeli njihov niz - opštu populaciju (GS). U ovom slučaju, broj jedinica u uzorku označava n, a u cijelom HS - N. Stav n/n naziva se relativna veličina ili proporcija uzorka.

Kvaliteta rezultata uzorkovanja ovisi o reprezentativnosti uzorka, odnosno koliko je reprezentativan u HS. Da bi se osigurala reprezentativnost uzorka, potrebno je promatrati princip slučajnog odabira jedinica, koji pretpostavlja da na uključivanje HS jedinice u uzorak ne može utjecati nijedan drugi faktor osim slučajnosti.

Postoji 4 načina nasumične selekcije uzorkovati:

  1. Zapravo nasumično selekcija ili „metoda loto“, kada se serijski brojevi dodeljuju statističkim vrednostima, unose se na određene objekte (na primer, bure), koji se zatim mešaju u nekom kontejneru (npr. u vrećici) i biraju nasumično. U praksi se ova metoda provodi pomoću generatora slučajnih brojeva ili matematičkih tablica slučajnih brojeva.
  2. Mehanički izbor, prema kojem svaki ( N/n)-ta vrijednost opće populacije. Na primjer, ako sadrži 100.000 vrijednosti, a želite da odaberete 1.000, tada će svakih 100.000 / 1000 = 100. vrijednost pasti u uzorak. Štaviše, ako nisu rangirani, onda se prvi bira nasumično od prvih sto, a brojevi ostalih će biti još stotinu više. Na primjer, ako je jedinica broj 19 bila prva, onda bi broj 119 trebao biti sljedeći, zatim broj 219, zatim broj 319, i tako dalje. Ako su jedinice stanovništva rangirane, tada se prvo bira #50, zatim #150, zatim #250 i tako dalje.
  3. Izvodi se odabir vrijednosti iz heterogenog niza podataka slojevito(stratificirana) metoda, kada je opća populacija prethodno podijeljena u homogene grupe, na koje se primjenjuje slučajni ili mehanički odabir.
  4. Posebna metoda uzorkovanja je serijski selekcija, u kojoj se slučajno ili mehanički ne biraju pojedinačne veličine, već njihove serije (sekvence od nekog broja do nekog uzastopnog), u okviru kojih se vrši kontinuirano posmatranje.

Kvalitet opservacija uzorka također ovisi o tip uzorkovanja: ponovljeno ili neponavljajuća.

At ponovna selekcija statističke vrijednosti ili njihove serije koje su pale u uzorak se nakon upotrebe vraćaju u opću populaciju, imajući priliku da uđu u novi uzorak. Istovremeno, sve vrijednosti opće populacije imaju istu vjerovatnoću da budu uključene u uzorak.

Odabir koji se ne ponavlja znači da se statističke vrijednosti ili njihove serije uključene u uzorak ne vraćaju općoj populaciji nakon upotrebe, te se stoga povećava vjerovatnoća ulaska u sljedeći uzorak za preostale vrijednosti potonjeg.

Uzorkovanje koje se ne ponavlja daje preciznije rezultate, pa se češće koristi. Ali postoje situacije kada se to ne može primijeniti (proučavanje putničkih tokova, potražnje potrošača itd.) i tada se vrši ponovni odabir.

Marginalna greška uzorka posmatranja, prosečna greška uzorka, redosled kojim su izračunate.

Razmotrimo detaljno gore navedene metode formiranja populacije uzorka i greške koje se javljaju u ovom slučaju. reprezentativnost .
Zapravo-slučajno uzorak se zasniva na nasumičnom odabiru jedinica iz opće populacije bez ikakvih elemenata konzistentnosti. Tehnički, ispravan slučajni odabir se vrši izvlačenjem (na primjer, lutrija) ili tablicom slučajnih brojeva.

Zapravo-slučajna selekcija "u svom čistom obliku" u praksi selektivnog posmatranja se retko koristi, ali je inicijalna među ostalim vrstama selekcije, implementira osnovne principe selektivnog posmatranja. Razmotrimo neka pitanja teorije metode uzorkovanja i formule greške za jednostavan slučajni uzorak.

Greška uzorkovanja- ovo je razlika između vrijednosti parametra u opštoj populaciji i njegove vrijednosti izračunate iz rezultata posmatranja uzorka. Za prosječnu kvantitativnu karakteristiku, greška uzorkovanja je određena pomoću

Indikator se naziva marginalna greška uzorkovanja.
Srednja vrijednost uzorka je slučajna varijabla koja može poprimiti različite vrijednosti u zavisnosti od toga koje su jedinice u uzorku. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga odredite prosjek mogućih grešaka - srednja greška uzorkovanja, što zavisi od:

Veličina uzorka: što je veći broj, to je manja prosječna greška;

Stepen promjene proučavane osobine: što je manja varijacija osobine, a samim tim i varijansa, manja je prosječna greška uzorkovanja.

At nasumični ponovni odabir izračunava se prosječna greška:
.
U praksi, opšta varijansa nije tačno poznata, ali in teorija vjerovatnoće dokazao to
.
Budući da je vrijednost za dovoljno veliko n blizu 1, možemo pretpostaviti da je . Tada se može izračunati srednja greška uzorkovanja:
.
Ali u slučajevima malog uzorka (za n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

At nasumično uzorkovanje date formule su ispravljene vrijednošću . Tada je prosječna greška neuzorkovanja:
i .
Jer je uvijek manji od , tada je faktor () uvijek manji od 1. To znači da je prosječna greška u nerepetitivnoj selekciji uvijek manja nego u ponovljenoj selekciji.
Mehaničko uzorkovanje koristi se kada je opća populacija na neki način uređena (na primjer, birački spiskovi po abecednom redu, brojevi telefona, kućni brojevi, stanovi). Odabir jedinica se vrši u određenom intervalu, koji je jednak recipročnom postotku uzorka. Dakle, sa uzorkom od 2% bira se svakih 50 jedinica = 1 / 0,02, sa 5%, svakih 1 / 0,05 = 20 jedinica opšte populacije.

Porijeklo se bira na različite načine: nasumično, od sredine intervala, uz promjenu ishodišta. Glavna stvar je izbjeći sistematske greške. Na primjer, kod uzorka od 5%, ako je 13. odabran kao prva jedinica, onda sljedećih 33, 53, 73, itd.

U smislu tačnosti, mehanički odabir je blizak pravilnom slučajnom uzorkovanju. Stoga se za određivanje prosječne greške mehaničkog uzorkovanja koriste formule pravilnog slučajnog odabira.

At tipičan izbor ispitana populacija je preliminarno podijeljena u homogene, jednotipne grupe. Na primjer, kada se anketiraju preduzeća, to mogu biti industrije, podsektori, dok se proučava stanovništvo – područja, društvene ili starosne grupe. Zatim se iz svake grupe vrši nezavisna selekcija na mehanički ili odgovarajući slučajni način.

Tipično uzorkovanje daje preciznije rezultate od drugih metoda. Tipizacija opće populacije osigurava zastupljenost svake tipološke grupe u uzorku, što omogućava da se isključi uticaj međugrupne varijanse na prosječnu grešku uzorka. Stoga je pri pronalaženju greške tipičnog uzorka prema pravilu sabiranja varijansi () potrebno uzeti u obzir samo prosjek grupnih varijansi. Tada je srednja greška uzorkovanja:
u ponovnoj selekciji
,
sa izborom koji se ne ponavlja
,
gdje je srednja vrijednost varijansi unutar grupe u uzorku.

Serijski (ili ugniježđeni) odabir koristi se kada je populacija podijeljena u serije ili grupe prije početka istraživanja uzorka. Ove serije mogu biti paketi gotovih proizvoda, studentske grupe, timovi. Serije za ispitivanje biraju se mehanički ili nasumično, au okviru serije se vrši kompletan pregled jedinica. Dakle, prosječna greška uzorkovanja ovisi samo o varijansi međugrupa (međuserija), koja se izračunava po formuli:

gdje je r broj odabranih serija;
- prosjek i-te serije.

Prosječna serijska greška uzorkovanja se izračunava:

kada se ponovo izabere:
,
sa stalnim odabirom:
,
gdje je R ukupan broj serija.

Kombinovano izbor je kombinacija razmatranih metoda selekcije.

Prosječna greška uzorkovanja za bilo koju metodu odabira zavisi uglavnom od apsolutne veličine uzorka i, u manjoj mjeri, od procenta uzorka. Pretpostavimo da je u prvom slučaju napravljeno 225 opservacija od populacije od 4.500 jedinica, au drugom slučaju od 225.000 jedinica. Varijance u oba slučaja su jednake 25. Tada će, u prvom slučaju, sa selekcijom od 5%, greška uzorkovanja biti:

U drugom slučaju, sa odabirom od 0,1%, bit će jednako:


Dakle, uz smanjenje procenta uzorka za 50 puta, greška uzorka se neznatno povećala, jer se veličina uzorka nije mijenjala.
Pretpostavimo da je veličina uzorka povećana na 625 opservacija. U ovom slučaju, greška uzorkovanja je:

Povećanje uzorka za 2,8 puta uz istu veličinu opće populacije smanjuje veličinu greške uzorka za više od 1,6 puta.

Metode i načini formiranja uzorka populacije.

U statistici se koriste različite metode formiranja skupova uzoraka, što je određeno ciljevima istraživanja i zavisi od specifičnosti predmeta proučavanja.

Osnovni uslov za sprovođenje uzorka je da se spreči pojava sistematskih grešaka koje proizilaze iz kršenja principa jednakih mogućnosti svake jedinice opšte populacije da uđe u uzorak. Prevencija sistematskih grešaka postiže se upotrebom naučno utemeljenih metoda za formiranje uzorka populacije.

Postoje sljedeći načini odabira jedinica iz opće populacije:

1) individualna selekcija - pojedinačne jedinice se biraju u uzorku;

2) grupni odabir - u uzorak spadaju kvalitativno homogene grupe ili serije jedinica koje se proučavaju;

3) kombinovana selekcija je kombinacija individualne i grupne selekcije.
Metode selekcije određene su pravilima za formiranje populacije uzorka.

Uzorak može biti:

  • pravilno nasumično sastoji se u tome što se uzorak formira kao rezultat slučajnog (nenamjernog) odabira pojedinačnih jedinica iz opće populacije. U ovom slučaju, broj jedinica odabranih u skupu uzoraka obično se određuje na osnovu prihvaćenog udjela uzorka. Udio uzorka je omjer broja jedinica u populaciji uzorka n prema broju jedinica u općoj populaciji N, tj.
  • mehanički sastoji se u tome da se odabir jedinica u uzorku vrši iz opće populacije, podijeljene u jednake intervale (grupe). U ovom slučaju, veličina intervala u opštoj populaciji jednaka je recipročnoj proporciji uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Dakle, u skladu sa prihvaćenom proporcijom selekcije, opšta populacija je takoreći mehanički podeljena na jednake grupe. Iz svake grupe u uzorku se bira samo jedna jedinica.
  • tipično - u kojoj se opća populacija prvo dijeli na homogene tipične grupe. Zatim se iz svake tipične grupe pravi individualni odabir jedinica u uzorak odgovarajućim slučajnim ili mehaničkim uzorkom. Važna karakteristika tipičnog uzorka je da daje tačnije rezultate u poređenju sa drugim metodama odabira jedinica u uzorku;
  • serijski- u kojem je opća populacija podijeljena u grupe iste veličine - serije. Serije su odabrane u skupu uzoraka. U okviru serije vrši se kontinuirano posmatranje jedinica koje su ušle u seriju;
  • kombinovano- uzorkovanje može biti dvostepeno. U ovom slučaju, opća populacija se prvo dijeli na grupe. Zatim se biraju grupe, au okviru ovih se biraju pojedinačne jedinice.

U statistici se razlikuju sljedeće metode odabira jedinica u uzorku::

  • single stage uzorak - svaka odabrana jedinica se odmah podvrgava proučavanju na datoj osnovi (zapravo slučajni i serijski uzorci);
  • višestepeni uzorkovanje – selekcija se vrši iz opšte populacije pojedinih grupa, a pojedinačne jedinice se biraju iz grupa (tipičan uzorak sa mehaničkom metodom odabira jedinica u populaciji uzorka).

Osim toga, tu su:

  • ponovni izbor- prema šemi vraćene lopte. U ovom slučaju, svaka jedinica ili serija koja je ušla u uzorak vraća se u opštu populaciju i stoga ima šansu da ponovo bude uključena u uzorak;
  • selekcija koja se ne ponavlja- prema šemi nevraćene lopte. Ima preciznije rezultate za istu veličinu uzorka.

Određivanje potrebne veličine uzorka (pomoću Studentove tabele).

Jedan od naučnih principa u teoriji uzorkovanja je osigurati da se odabere dovoljan broj jedinica. Teoretski, potreba poštivanja ovog principa prikazana je u dokazima graničnih teorema teorije vjerovatnoće, koji vam omogućavaju da ustanovite koliko jedinica treba izabrati iz opće populacije tako da bude dovoljno i osigura reprezentativnost uzorka.

Smanjenje standardne greške uzorka, a samim tim i povećanje tačnosti procjene uvijek je povezano s povećanjem veličine uzorka, stoga je već u fazi organiziranja promatranja uzorka potrebno odlučiti kolika bi trebala biti veličina uzorka da bi se osigurala potrebna tačnost rezultata posmatranja. Proračun potrebne veličine uzorka se gradi korištenjem formula izvedenih iz formula za granične greške uzorkovanja (A), koje odgovaraju jednom ili drugom tipu i načinu odabira. Dakle, za slučajni ponovljeni uzorak (n), imamo:

Suština ove formule je da je slučajnim ponovnim odabirom potrebnog broja veličina uzorka direktno proporcionalna kvadratu koeficijenta pouzdanosti (t2) i varijansu karakteristike varijacije (?2) i obrnuto je proporcionalna kvadratu marginalne greške uzorkovanja (?2). Konkretno, udvostručavanjem marginalne greške, potrebna veličina uzorka može se smanjiti za faktor četiri. Od tri parametra, dva (t i?) postavlja istraživač.

Istovremeno, istraživač Za potrebe uzorka istraživanja treba se odlučiti za pitanje: u koju kvantitativnu kombinaciju je bolje uključiti ove parametre kako bi se dobila optimalna varijanta? U jednom slučaju može biti više zadovoljan pouzdanošću dobijenih rezultata (t) nego mjerom tačnosti (?), u drugom - obrnuto. Teže je riješiti pitanje vrijednosti granične greške uzorkovanja, budući da istraživač nema ovaj indikator u fazi dizajniranja opservacije uzorka, stoga je u praksi uobičajeno postaviti graničnu grešku uzorkovanja, kao npr. pravilo, unutar 10% od očekivanog prosječnog nivoa osobine. Uspostavljanju pretpostavljenog prosječnog nivoa može se pristupiti na različite načine: korištenjem podataka iz sličnih ranijih istraživanja ili korištenjem podataka iz okvira uzorkovanja i uzimanja malog pilot uzorka.

Najteže je utvrditi prilikom dizajniranja opservacije uzorka treći parametar u formuli (5.2) – varijansa populacije uzorka. U ovom slučaju potrebno je koristiti sve informacije dostupne istraživaču, dobijene iz prethodnih sličnih i pilot istraživanja.

Pitanje definicije Potrebna veličina uzorka postaje komplikovanija ako istraživanje uzorka uključuje proučavanje nekoliko karakteristika jedinica uzorka. U ovom slučaju, prosječni nivoi svake od karakteristika i njihova varijacija su, po pravilu, različiti, pa je stoga moguće odlučiti kojoj disperziji koje karakteristike dati prednost samo uzimajući u obzir svrhu i ciljeve anketa.

Prilikom dizajniranja opservacije uzorka, pretpostavlja se unaprijed određena vrijednost dozvoljene greške uzorkovanja u skladu sa ciljevima određene studije i vjerovatnoćom zaključaka na osnovu rezultata posmatranja.

Općenito, formula za graničnu grešku srednje vrijednosti uzorka omogućava vam da odredite:

Veličina mogućih odstupanja indikatora opšte populacije od pokazatelja populacije uzorka;

Potrebna veličina uzorka, koja obezbeđuje potrebnu tačnost, u kojoj granice moguće greške neće prelaziti određenu određenu vrednost;

Vjerovatnoća da će greška u uzorku imati zadanu granicu.

Distribucija učenika u teoriji vjerovatnoće, to je jednoparametarska porodica apsolutno kontinuiranih distribucija.

Niz dinamike (interval, moment), zatvaranje niza dinamike.

Serija dinamike- to su vrijednosti statističkih pokazatelja koji se prikazuju određenim hronološkim slijedom.

Svaka vremenska serija sadrži dvije komponente:

1) indikatori vremenskih perioda (godine, kvartali, meseci, dani ili datumi);

2) indikatori koji karakterišu objekat koji se proučava za vremenske periode ili na odgovarajuće datume, koji se nazivaju nivoi serije.

Nivoi serije su izraženi i apsolutne i prosječne ili relativne vrijednosti. U zavisnosti od prirode indikatora, grade se dinamičke serije apsolutnih, relativnih i prosječnih vrijednosti. Dinamičke serije relativnih i prosječnih vrijednosti grade se na osnovu izvedenih serija apsolutnih vrijednosti. Postoje intervalne i momentne serije dinamike.

Dinamičke intervalne serije sadrži vrijednosti indikatora za određene vremenske periode. U intervalnim serijama nivoi se mogu sumirati, čime se dobija obim fenomena za duži period, ili takozvani akumulirani totali.

Serija dinamičkih trenutaka odražava vrijednosti indikatora u određenom trenutku (datum u vremenu). U serijama trenutaka, istraživača može zanimati samo razlika fenomena, koja odražava promjenu nivoa serije između određenih datuma, budući da ovdje zbir nivoa nema pravi sadržaj. Ovdje se ne izračunavaju kumulativni zbroji.

Najvažniji uslov za ispravnu konstrukciju dinamičkih serija je uporedivost nivoa serija koje se odnose na različite periode. Nivoi treba da budu predstavljeni u homogenim količinama, treba da postoji ista potpunost obuhvata različitih delova fenomena.

Da bi kako bi se izbjeglo narušavanje realne dinamike, u statističkoj studiji (zatvaranje serije dinamike) provode se preliminarni proračuni koji prethode statističkoj analizi dinamičke serije. Zatvaranje vremenskih serija podrazumeva spajanje dve ili više serija u jednu seriju čiji se nivoi izračunavaju po različitoj metodologiji ili ne odgovaraju teritorijalnim granicama itd. Zatvaranje niza dinamike može implicirati i svođenje apsolutnih nivoa niza dinamike na zajedničku osnovu, čime se eliminiše nekompatibilnost nivoa serije dinamike.

Koncept uporedivosti vremenskih serija, koeficijenata, stopa rasta i rasta.

Serija dinamike- to su nizovi statističkih pokazatelja koji karakterišu razvoj prirodnih i društvenih pojava u vremenu. Statističke zbirke koje izdaje Državni komitet za statistiku Rusije sadrže veliki broj vremenskih serija u obliku tabele. Serija dinamike omogućava otkrivanje obrazaca razvoja proučavanih pojava.

Vremenske serije sadrže dvije vrste indikatora. Indikatori vremena(godine, kvartali, mjeseci, itd.) ili tačke u vremenu (na početku godine, na početku svakog mjeseca, itd.). Indikatori nivoa reda. Pokazatelji nivoa vremenskih serija mogu se izraziti u apsolutnim vrijednostima (proizvodnja u tonama ili rubljama), relativnim vrijednostima (udio gradskog stanovništva u%) i prosječnim vrijednostima (prosječne plate radnika industrije po godinama, itd.). U tabelarnom obliku, vremenska serija sadrži dvije kolone ili dva reda.

Ispravna konstrukcija vremenskih serija podrazumijeva ispunjenje niza zahtjeva:

  1. svi pokazatelji niza dinamike moraju biti naučno potkrijepljeni, pouzdani;
  2. indikatori niza dinamike treba da budu vremenski uporedivi, tj. moraju biti izračunati za iste vremenske periode ili na iste datume;
  3. indikatori većeg broja dinamike trebaju biti uporedivi na cijeloj teritoriji;
  4. indikatori niza dinamike trebaju biti sadržajno uporedivi, tj. obračunava se prema jedinstvenoj metodologiji, na isti način;
  5. indikatori niza dinamike trebali bi biti uporedivi u čitavom nizu razmatranih farmi. Sve pokazatelje serije dinamike treba dati u istim mjernim jedinicama.

Statistički pokazatelji može karakterizirati ili rezultate procesa koji se proučava u određenom vremenskom periodu, ili stanje proučavanog fenomena u određenom trenutku, tj. indikatori mogu biti intervalni (periodični) i trenutni. Shodno tome, u početku serija dinamike može biti intervalna ili momentalna. Trenutni niz dinamike, pak, može biti sa jednakim i nejednakim vremenskim intervalima.

Početna serija dinamike može se pretvoriti u niz prosječnih vrijednosti i niz relativnih vrijednosti (lanac i baza). Takve vremenske serije se nazivaju izvedene vremenske serije.

Metoda izračunavanja prosječnog nivoa u nizu dinamike je različita, zbog vrste serije dinamike. Koristeći primjere, razmotrite vrste vremenskih serija i formule za izračunavanje prosječnog nivoa.

Apsolutni dobici (Δy) pokazuje koliko se jedinica promijenio sljedeći nivo serije u odnosu na prethodni (kolona 3. - lanac apsolutnih priraštaja) ili u odnosu na početni nivo (kolona 4. - osnovni apsolutni priraštaji). Formule proračuna se mogu napisati na sljedeći način:

Sa smanjenjem apsolutnih vrijednosti serije, doći će do "smanjenje", "smanjenje", respektivno.

Pokazatelji apsolutnog rasta govore da je, na primjer, u 1998. godini proizvodnja proizvoda "A" povećana za 4.000 tona u odnosu na 1997. godinu, odnosno za 34.000 tona u odnosu na 1994. godinu; za ostale godine vidi tabelu. 11,5 gr. 3 i 4.

Faktor rasta pokazuje koliko se puta nivo serije promenio u odnosu na prethodni (kolona 5 - lančani koeficijenti rasta ili pada) ili u odnosu na početni nivo (kolona 6 - osnovni koeficijenti rasta ili pada). Formule proračuna se mogu napisati na sljedeći način:

Stope rasta pokazuju koliko je procenata sledeći nivo serije u poređenju sa prethodnim (kolona 7 - lančane stope rasta) ili u poređenju sa početnim nivoom (kolona 8 - osnovne stope rasta). Formule proračuna se mogu napisati na sljedeći način:

Tako je, na primjer, 1997. godine obim proizvodnje proizvoda "A" u odnosu na 1996. godinu bio 105,5% (

Stopa rasta pokazuju za koliko procenata je povećan nivo izvještajnog perioda u odnosu na prethodni (kolona 9 - lančane stope rasta) ili u odnosu na početni nivo (kolona 10 - osnovne stope rasta). Formule proračuna se mogu napisati na sljedeći način:

T pr \u003d T p - 100% ili T pr \u003d apsolutno povećanje / nivo prethodnog perioda * 100%

Tako je, na primjer, 1996. godine, u odnosu na 1995. godinu, proizvod "A" proizveden više za 3,8% (103,8% - 100%) ili (8:210) x 100%, au odnosu na 1994. godinu - za 9% ( 109% - 100%).

Ako se apsolutni nivoi u seriji smanje, tada će stopa biti manja od 100% i, shodno tome, doći će do stope pada (stopa rasta sa predznakom minus).

Apsolutna vrijednost od 1% povećanja(kolona 11) pokazuje koliko jedinica se mora proizvesti u datom periodu da bi se nivo prethodnog perioda povećao za 1%. U našem primjeru, 1995. godine bilo je potrebno proizvesti 2,0 hiljade tona, a 1998. godine - 2,3 hiljade tona, tj. mnogo veći.

Postoje dva načina da se odredi veličina apsolutne vrijednosti rasta od 1%:

Podijelite nivo prethodnog perioda sa 100;

Podijelite apsolutne stope rasta lanca sa odgovarajućim stopama rasta lanca.

Apsolutna vrijednost povećanja od 1% =

U dinamici, posebno u dužem periodu, važno je zajednički analizirati stopu rasta sa sadržajem svakog procenta povećanja ili smanjenja.

Imajte na umu da je razmatrana metoda za analizu vremenskih serija primjenjiva kako za vremenske serije čiji su nivoi izraženi u apsolutnim vrijednostima (t, hiljada rubalja, broj zaposlenih, itd.), tako i za vremenske serije, nivoe koji se izražavaju u relativnim pokazateljima (% otpada, % pepela u uglju i sl.) ili prosječnim vrijednostima (prosječan prinos u c/ha, prosječne plate itd.).

Uz razmatrane analitičke pokazatelje izračunate za svaku godinu u poređenju sa prethodnim ili početnim nivoom, prilikom analize vremenske serije potrebno je izračunati i prosječne analitičke pokazatelje za period: prosječni nivo serije, prosječni godišnji apsolutni porast (smanjenje) i prosječnu godišnju stopu rasta i stopu rasta.

Metode za izračunavanje prosječnog nivoa serije dinamike su razmatrane gore. U intervalnoj seriji dinamike koju razmatramo, prosječni nivo serije izračunava se po formuli jednostavne aritmetičke sredine:

Prosječna godišnja proizvodnja proizvoda za 1994-1998. iznosio je 218,4 hiljade tona.

Prosječni godišnji apsolutni porast također se izračunava formulom proste aritmetičke sredine:

Godišnji apsolutni prirast varirao je tokom godina od 4 do 12 hiljada tona (vidi kolonu 3), a prosječni godišnji porast proizvodnje za period 1995-1998. iznosio je 8,5 hiljada tona.

Metode za izračunavanje prosječne stope rasta i prosječne stope rasta zahtijevaju detaljnije razmatranje. Razmotrimo ih na primjeru godišnjih indikatora nivoa serije datih u tabeli.

Srednji nivo raspona dinamike.

Niz dinamike (ili vremenske serije)- to su numeričke vrijednosti određenog statističkog pokazatelja u uzastopnim trenucima ili vremenskim periodima (tj. poredane hronološkim redom).

Zovu se numeričke vrijednosti određenog statističkog pokazatelja koji čini niz dinamike nivoi broja i obično se označava slovom y. Prvi član serije y 1 zove se početni ili osnovna linija, i posljednji y n - final. Trenuci ili vremenski periodi na koje se nivoi odnose su označeni sa t.

Dinamičke serije se u pravilu prikazuju u obliku tabele ili grafikona, a duž x-ose se gradi vremenska skala. t, a duž ordinate - skala nivoa serije y.

Prosječni pokazatelji niza dinamike

Svaka serija dinamike može se smatrati određenim skupom n vremenski promjenjivi indikatori koji se mogu sažeti kao prosjeci. Ovakvi generalizirani (prosječni) pokazatelji su posebno potrebni kada se porede promjene jednog ili drugog indikatora u različitim periodima, u različitim zemljama itd.

Generalizirana karakteristika niza dinamike može biti, prije svega, prosječni nivo reda. Metoda izračunavanja prosječnog nivoa ovisi o tome da li se radi o momentnoj ili intervalnoj (periodnoj) seriji.

Kada interval serije, njen prosječni nivo je određen formulom proste aritmetičke sredine nivoa serije, tj.

=
Ako je dostupno momenat red koji sadrži n nivoi ( y1, y2, …, yn) sa jednakim intervalima između datuma (vremenskih tačaka), onda se takav niz može lako pretvoriti u niz prosječnih vrijednosti. Istovremeno, indikator (nivo) na početku svakog perioda je istovremeno i indikator na kraju prethodnog perioda. Tada se prosječna vrijednost indikatora za svaki period (interval između datuma) može izračunati kao polovični zbroj vrijednosti at na početku i na kraju perioda, tj. kao . Broj takvih prosjeka će biti . Kao što je ranije spomenuto, za serije prosjeka, prosječni nivo se izračunava iz aritmetičkog prosjeka.

Stoga možemo napisati:
.
Nakon pretvaranja brojila, dobijamo:
,

gdje Y1 i Yn- prvi i posljednji nivo serije; Yi- srednji nivoi.

Ovaj prosjek je u statistici poznat kao prosečan hronološki za trenutne serije. Ovo ime dobila je od riječi "cronos" (vrijeme, lat.), jer se računa na osnovu pokazatelja koji se mijenjaju tokom vremena.

U slučaju nejednake intervalima između datuma, hronološki prosjek za trenutne serije može se izračunati kao aritmetički prosjek prosječnih vrijednosti nivoa za svaki par trenutaka, ponderiranih udaljenostima (vremenskim intervalima) između datuma, tj.
.
U ovom slučaju pretpostavlja se da su u intervalima između datuma nivoi poprimali različite vrijednosti, a mi smo iz dva poznata ( yi i yi+1) utvrđujemo prosjeke, iz kojih se onda izračunava ukupni prosjek za cijeli analizirani period.
Ako se pretpostavi da svaka vrijednost yi ostaje nepromijenjena do sljedećeg (i+ 1)- th momenta, tj. poznat je tačan datum promjene nivoa, tada se izračun može izvršiti pomoću formule ponderirane aritmetičke sredine:
,

gdje je vrijeme tokom kojeg je nivo ostao nepromijenjen.

Pored prosječnog nivoa u seriji dinamike, izračunavaju se i drugi prosječni pokazatelji - prosječna promjena nivoa serije (osnovnim i lančanim metodama), prosječna stopa promjene.

Osnovna vrijednost znači apsolutnu promjenu je količnik posljednje osnovne apsolutne promjene podijeljen sa brojem promjena. tj

Lanac znači apsolutnu promjenu nivoi niza je količnik dijeljenja zbira svih apsolutnih promjena lanca brojem promjena, tj.

Po predznaku prosječnih apsolutnih promjena prosječno se sudi i priroda promjene fenomena: rast, pad ili stabilnost.

Iz pravila za kontrolu osnovnih i lančanih apsolutnih promjena proizilazi da osnovne i lančane prosječne promjene moraju biti jednake.

Uz prosječnu apsolutnu promjenu, pomoću osnovne i lančane metode izračunava se i prosječna relativna.

Osnovna prosječna relativna promjena određuje se formulom:

Lanac znači relativnu promjenu određuje se formulom:

Naravno, osnovne i lančane prosječne relativne promjene treba da budu iste, a upoređujući ih sa vrijednošću kriterija 1, dolazi se do zaključka o prirodi promjene pojave u prosjeku: rast, pad ili stabilnost.
Oduzimanjem 1 od prosječne relativne promjene baze ili lanca, dobiva se odgovarajuća prosječna stopa promjene, po čijem se znaku može suditi i o prirodi promjene u proučavanoj pojavi koju reflektuje ovaj niz dinamike.

Sezonske fluktuacije i sezonski indeksi.

Sezonske fluktuacije su stabilne unutargodišnje fluktuacije.

Osnovni princip upravljanja postizanjem maksimalnog efekta je maksimizacija prihoda i minimizacija troškova. Proučavanjem sezonskih fluktuacija rješava se problem jednačine maksimuma u svakom nivou godine.

Prilikom proučavanja sezonskih fluktuacija rješavaju se dva međusobno povezana zadatka:

1. Identifikacija specifičnosti razvoja fenomena u unutargodišnjoj dinamici;

2. Mjerenje sezonskih fluktuacija sa izgradnjom modela sezonskog talasa;

Sezonske ćurke obično se broje da bi se izmjerila sezonalnost. Uopšteno govoreći, oni su određeni odnosom originalnih jednačina serije dinamike prema teorijskim jednačinama koje služe kao osnova za poređenje.

Budući da su nasumična odstupanja superponirana na sezonske fluktuacije, indeksi sezonskosti se prosječuju kako bi se eliminisale.

U ovom slučaju, za svaki period godišnjeg ciklusa, generalizirani pokazatelji se određuju u obliku prosječnih sezonskih indeksa:

Prosječni indeksi sezonskih kolebanja oslobođeni su utjecaja slučajnih odstupanja glavnog trenda razvoja.

Ovisno o prirodi trenda, formula za prosječni indeks sezonskosti može imati sljedeće oblike:

1.Za serije unutargodišnje dinamike sa izraženim glavnim trendom razvoja:

2. Za niz unutargodišnje dinamike u kojoj nema uzlaznog ili silaznog trenda ili je beznačajan:

Gdje je opći prosjek;

Metode za analizu glavnog trenda.

Na razvoj pojava tokom vremena utiču faktori različite prirode i jačine uticaja. Neki od njih su slučajne prirode, drugi imaju gotovo konstantan učinak i formiraju određeni trend razvoja u nizu dinamike.

Važan zadatak statistike je da identifikuje trend u nizu dinamike, oslobođen od dejstva različitih slučajnih faktora. U tu svrhu, vremenske serije se obrađuju metodama intervalnog uvećanja, pokretnog prosjeka i analitičkog poravnanja itd.

Intervalna metoda grubosti zasniva se na ukrupnjavanju vremenskih perioda, koji uključuju nivoe niza dinamike, tj. je zamjena podataka vezanih za male periode sa podacima iz većih perioda. Posebno je efikasan kada su početni nivoi serije za kratke vremenske periode. Na primjer, serije indikatora koji se odnose na dnevne događaje zamjenjuju se serijama koje se odnose na nedjeljne, mjesečne itd. To će se jasnije pokazati "Osovina razvoja fenomena". Prosjek, izračunat na osnovu uvećanih intervala, omogućava identifikaciju smjera i karaktera (ubrzanje ili usporavanje rasta) glavnog trenda razvoja.

metoda pokretnog prosjeka slično prethodnom, ali se u ovom slučaju stvarni nivoi zamjenjuju prosječnim nivoima izračunatim za sukcesivno pomicanje (klizanje) uvećanih intervala koji pokrivaju m nivoi redova.

na primjer ako se prihvati m=3, zatim se prvo izračunava prosjek prva tri nivoa serije, zatim - od istog broja nivoa, ali počevši od drugog u nizu, zatim - počevši od trećeg, itd. Tako prosjek, takoreći, "klizi" nizom dinamike, krećući se za jedan period. Izračunato od mčlanovi pokretnih proseka odnose se na sredinu (centar) svakog intervala.

Ova metoda eliminira samo slučajne fluktuacije. Ako serija ima sezonski val, on će ostati nakon izravnavanja metodom pokretnog prosjeka.

Analitičko usklađivanje. Da bi se eliminisale nasumične fluktuacije i identifikovao trend, nivoi serije se usklađuju prema analitičkim formulama (ili analitičkom poravnanju). Njegova suština je da se empirijski (stvarni) nivoi zamene teorijskim, koji se računaju prema određenoj jednačini, koja se uzima kao matematički model trenda, pri čemu se teorijski nivoi posmatraju kao funkcija vremena: . U ovom slučaju, svaki stvarni nivo se smatra zbirom dvije komponente: , gdje je sistematska komponenta i izražena određenom jednačinom, te je slučajna varijabla koja uzrokuje fluktuacije oko trenda.

Zadatak analitičkog usklađivanja je sljedeći:

1. Utvrđivanje na osnovu stvarnih podataka tipa hipotetičke funkcije koja može najadekvatnije odraziti trend razvoja indikatora koji se proučava.

2. Pronalaženje parametara navedene funkcije (jednadžbe) iz empirijskih podataka

3. Proračun prema pronađenoj jednačini teorijskih (niveliranih) nivoa.

Izbor određene funkcije se po pravilu vrši na osnovu grafičkog prikaza empirijskih podataka.

Modeli su jednadžbe regresije, čiji su parametri izračunati metodom najmanjih kvadrata

Ispod su najčešće korištene regresione jednadžbe za izravnavanje vremenskih serija, koje ukazuju na to koje razvojne trendove su najpogodnije za odraz.

Za pronalaženje parametara gornjih jednačina postoje posebni algoritmi i kompjuterski programi. Konkretno, za pronalaženje parametara jednačine prave linije može se koristiti sljedeći algoritam:

Ako se periodi ili trenuci vremena numerišu tako da se dobije St = 0, tada će se gornji algoritmi značajno pojednostaviti i pretvoriti u

Poravnani nivoi na grafikonu će se nalaziti na jednoj pravoj liniji koja prolazi na najbližoj udaljenosti od stvarnih nivoa ove dinamičke serije. Zbir kvadrata odstupanja je odraz uticaja slučajnih faktora.

Uz njegovu pomoć izračunavamo prosječnu (standardnu) grešku jednačine:

Ovdje je n broj zapažanja, a m broj parametara u jednačini (imamo ih dva - b 1 i b 0).

Glavni trend (trend) pokazuje kako sistematski faktori utiču na nivoe niza dinamike, a fluktuacija nivoa oko trenda () služi kao mjera uticaja rezidualnih faktora.

Za procjenu kvaliteta korištenog modela vremenske serije, također se koristi Fišerov F test. To je omjer dvije varijanse, odnosno omjer varijanse uzrokovane regresijom, tj. proučavanog faktora, na disperziju uzrokovanu slučajnim uzrocima, tj. rezidualna varijansa:

U proširenom obliku, formula za ovaj kriterij se može predstaviti na sljedeći način:

gdje je n broj opservacija, tj. broj nivoa redova,

m je broj parametara u jednadžbi, y je stvarni nivo serije,

Poravnani nivo reda, - prosječni nivo reda.

Uspješniji od drugih, model ne mora uvijek biti dovoljno zadovoljavajući. Ona se kao takva može prepoznati samo ako kriterij F za nju prelazi određenu kritičnu granicu. Ova granica je postavljena korištenjem F tablica raspodjele.

Suština i klasifikacija indeksa.

Indeks se u statistici shvata kao relativni indikator koji karakteriše promenu veličine neke pojave u vremenu, prostoru ili u poređenju sa bilo kojim standardom.

Glavni element indeksne relacije je indeksirana vrijednost. Indeksirana vrijednost se podrazumijeva kao vrijednost znaka statističke populacije čija je promjena predmet proučavanja.

Indeksi služe tri glavne svrhe:

1) procena promena u složenoj pojavi;

2) utvrđivanje uticaja pojedinih faktora na promenu složene pojave;

3) poređenje veličine neke pojave sa veličinom proteklog perioda, veličinom druge teritorije, kao i sa standardima, planovima, prognozama.

Indeksi su klasifikovani prema 3 kriterijuma:

2) po stepenu obuhvata elemenata stanovništva;

3) metodama izračunavanja opštih indeksa.

Po sadržaju indeksiranih vrijednosti, indeksi se dijele na indekse kvantitativnih (volumetrijskih) indikatora i indekse kvalitativnih indikatora. Indeksi kvantitativnih indikatora - indeksi fizičkog obima industrijske proizvodnje, fizičkog obima prodaje, broja itd. Indeksi kvalitativnih indikatora - indeksi cijena, troškova, produktivnosti rada, prosječne plate i dr.

Prema stepenu obuhvata jedinica stanovništva, indeksi se dijele u dvije klase: pojedinačne i opšte. Da bismo ih okarakterizirali, uvodimo sljedeće konvencije usvojene u praksi primjene indeksne metode:

q- količina (volumen) bilo kojeg proizvoda u naturi ; R- jedinična cijena proizvodnje; z- jedinični trošak proizvodnje; t- vrijeme utrošeno na proizvodnju jedinice proizvoda (intenzitet rada) ; w- proizvodni učinak u vrijednosnom smislu po jedinici vremena; v- učinak u fizičkom smislu po jedinici vremena; T- ukupno utrošeno vrijeme ili broj zaposlenih.

Kako bi se razlikovalo kojoj točki ili objektu pripadaju indeksirane vrijednosti, uobičajeno je da se ispod odgovarajućeg simbola stavljaju indeksi u donjem desnom uglu. Tako se, na primjer, u indeksima dinamike, po pravilu, za upoređivane (tekuće, izvještajne) periode koristi indeks 1, a za periode sa kojima se vrši poređenje,

Individualni indeksi služe za karakterizaciju promjene pojedinih elemenata složene pojave (na primjer, promjena obima proizvodnje jedne vrste proizvoda). Predstavljaju relativne vrijednosti dinamike, ispunjenja obaveza, poređenje indeksiranih vrijednosti.

Određuje se pojedinačni indeks fizičkog obima proizvodnje

Sa analitičke tačke gledišta, dati pojedinačni indeksi dinamike su slični koeficijentima (stopama) rasta i karakterišu promjenu indeksirane vrijednosti u tekućem periodu u odnosu na bazni, odnosno pokazuju koliko je puta povećana (smanjena). ) ili koliko posto je to rast (smanjenje). Vrijednosti indeksa su izražene u koeficijentima ili procentima.

Opšti (kompozitni) indeks odražava promjenu u svim elementima kompleksne pojave.

Zbirni indeks je osnovni oblik indeksa. Zove se agregat jer su njegov brojilac i nazivnik skup "agregata"

Prosječni indeksi, njihova definicija.

Pored agregatnih indeksa, u statistici se koristi još jedan njihov oblik - indeksi ponderisanog prosjeka. Njihovom izračunavanju se pribjegava kada dostupne informacije ne dozvoljavaju izračunavanje opšteg agregatnog indeksa. Dakle, ako ne postoje podaci o cijenama, ali postoje podaci o cijeni proizvoda u tekućem periodu i poznati su pojedinačni indeksi cijena za svaki proizvod, onda se opći indeks cijena ne može odrediti kao zbirni, ali je moguće da ga izračunamo kao prosek pojedinačnih. Na isti način, ako nisu poznate količine pojedinačnih proizvedenih proizvoda, ali su poznati pojedinačni indeksi i troškovi proizvodnje baznog perioda, onda se ukupni indeks fizičkog obima proizvodnje može odrediti kao ponderisani prosjek.

Prosječni indeks - Ovo indeks izračunat kao prosjek pojedinačnih indeksa. Zbirni indeks je osnovni oblik opšteg indeksa, tako da prosječni indeks mora biti identičan agregatnom indeksu. Prilikom izračunavanja prosječnih indeksa koriste se dva oblika prosjeka: aritmetički i harmonijski.

Indeks aritmetičke sredine je identičan zbirnom indeksu ako su ponderi pojedinačnih indeksa pojmovi nazivnika zbirnog indeksa. Samo u ovom slučaju vrijednost indeksa izračunata formulom aritmetičke sredine bit će jednaka zbirnom indeksu.

Definira se kao generalizirajuća karakteristika veličine varijacije osobine u agregatu. Jednaka je kvadratnom korijenu prosječnog kvadrata odstupanja pojedinačnih vrijednosti obilježja od aritmetičke sredine, tj. korijen i može se naći ovako:

1. Za primarni red:

2. Za seriju varijacija:

Transformacija formule standardne devijacije dovodi je do oblika pogodnijeg za praktične proračune:

Standardna devijacija određuje koliko, u prosjeku, određene opcije odstupaju od njihove prosječne vrijednosti, a osim toga, apsolutna je mjera fluktuacije osobine i izražava se u istim jedinicama kao i opcije, te se stoga dobro tumači.

Primjeri pronalaženja standardne devijacije: ,

Za alternativne karakteristike, formula za standardnu ​​devijaciju izgleda ovako:

gdje je p udio jedinica u populaciji koje imaju određeni atribut;

q - udio jedinica koje nemaju ovu osobinu.

Koncept srednjeg linearnog odstupanja

Prosječna linearna devijacija definira se kao aritmetička sredina apsolutnih vrijednosti odstupanja pojedinačnih opcija od .

1. Za primarni red:

2. Za seriju varijacija:

gdje je zbir n zbir frekvencija serije varijacija.

Primjer pronalaženja prosječne linearne devijacije:

Prednost srednjeg apsolutnog odstupanja kao mjere disperzije u rasponu varijacije je očigledna, jer se ova mjera zasniva na uzimanju u obzir svih mogućih odstupanja. Ali ovaj pokazatelj ima značajne nedostatke. Samovoljno odbacivanje algebarskih znakova odstupanja može dovesti do činjenice da su matematička svojstva ovog indikatora daleko od elementarnih. Ovo uvelike otežava korištenje srednjeg apsolutnog odstupanja u rješavanju problema vezanih za vjerovatnost proračuna.

Stoga se prosječna linearna devijacija kao mjera varijacije neke karakteristike rijetko koristi u statističkoj praksi, odnosno kada zbrajanje indikatora bez uzimanja u obzir predznaka ima ekonomski smisla. Uz nju se, na primjer, analizira spoljnotrgovinski promet, sastav zaposlenih, ritam proizvodnje itd.

srednji kvadratni korijen

RMS primijenjen, na primjer, za izračunavanje prosječne veličine stranica n kvadratnih presjeka, prosječnih prečnika debla, cijevi itd. Podijeljen je u dva tipa.

Srednji kvadratni korijen je jednostavan. Ako je, prilikom zamjene pojedinačnih vrijednosti osobine prosječnom vrijednošću, potrebno zadržati zbir kvadrata originalnih vrijednosti nepromijenjenim, tada će prosjek biti kvadratni prosjek.

To je kvadratni korijen količnika zbira kvadrata vrijednosti pojedinačnih karakteristika podijeljenih s njihovim brojem:

Ponderirani srednji kvadrat izračunava se po formuli:

gdje je f znak težine.

Prosječan kubik

Primijenjena prosječna kubika, na primjer, prilikom određivanja prosječne dužine stranice i kocke. Podijeljen je u dvije vrste.
Prosječna kubična jednostavna:

Prilikom izračunavanja srednjih vrijednosti i disperzije u nizu distribucije intervala, prave vrijednosti atributa zamjenjuju se središnjim vrijednostima intervala, koje se razlikuju od aritmetičke sredine vrijednosti uključenih u interval. Ovo dovodi do sistematske greške u izračunavanju varijanse. V.F. Sheppard je to odredio greška u proračunu varijanse, uzrokovano primjenom grupisanih podataka, je 1/12 kvadrata vrijednosti intervala, i naviše i naniže u veličini varijanse.

Sheppard amandman treba koristiti ako je distribucija bliska normalnoj, odnosi se na karakteristiku s kontinuiranom prirodom varijacije, izgrađenu na značajnoj količini početnih podataka (n> 500). Međutim, na osnovu činjenice da se u jednom broju slučajeva obje greške, djelujući u različitim smjerovima, međusobno kompenzuju, ponekad je moguće odbiti uvođenje amandmana.

Što je manja varijansa i standardna devijacija, to je populacija homogenija i prosjek će biti tipičniji.
U praksi statistike često postaje neophodno upoređivati ​​varijacije različitih karakteristika. Na primjer, od velikog je interesa uporediti varijacije u dobi radnika i njihovim kvalifikacijama, dužini radnog staža i plaćama, troškovima i dobiti, dužini radnog staža i produktivnosti rada itd. Za takva poređenja, pokazatelji apsolutne varijabilnosti karakteristika su neprikladni: nemoguće je uporediti varijabilnost radnog iskustva izraženu u godinama sa varijacijama plata, izraženih u rubljama.

Za obavljanje ovakvih poređenja, kao i poređenja fluktuacije istog atributa u nekoliko populacija sa različitim aritmetičkim sredinama, koristi se relativni indikator varijacije – koeficijent varijacije.

Strukturni prosjeci

Za karakterizaciju centralnog trenda u statističkim distribucijama, često je racionalno koristiti, zajedno sa aritmetičkom sredinom, određenu vrijednost atributa X, koji zbog određenih karakteristika svoje lokacije u nizu distribucije može okarakterizirati njen nivo.

Ovo je posebno važno kada ekstremne vrijednosti karakteristike u nizu distribucije imaju nejasne granice. S tim u vezi, tačno određivanje aritmetičke sredine je po pravilu nemoguće ili veoma teško. U takvim slučajevima, prosječni nivo se može odrediti uzimanjem, na primjer, vrijednosti karakteristike koja se nalazi u sredini frekventne serije ili koja se najčešće javlja u trenutnoj seriji.

Takve vrijednosti ovise samo o prirodi frekvencija, odnosno o strukturi distribucije. One su tipične u smislu lokacije u seriji frekvencija, stoga se takve vrijednosti smatraju karakteristikama distributivnog centra i stoga su definirane kao strukturni prosjeci. Koriste se za proučavanje unutrašnje strukture i strukture serije distribucije vrijednosti atributa. Ovi indikatori uključuju .

Standardna devijacija je klasičan pokazatelj varijabilnosti od deskriptivne statistike.

Standardna devijacija, standardna devijacija, RMS, uzorak standardne devijacije (engleski standard deviation, STD, STDev) je vrlo česta mjera disperzije u deskriptivnoj statistici. Ali, jer tehnička analiza je srodna statistici, ovaj indikator se može (i treba) koristiti u tehničkoj analizi za otkrivanje stepena disperzije cijene analiziranog instrumenta tokom vremena. Označeno grčkim simbolom Sigma "σ".

Hvala Karlu Gausu i Pearsonu na činjenici da imamo priliku koristiti standardnu ​​devijaciju.

Koristeći standardna devijacija u tehničkoj analizi, okrećemo ovo "indeks raspršenja"u "indikator volatilnosti“Zadržavanje značenja, ali mijenjanje pojmova.

Šta je standardna devijacija

Ali pored srednjih pomoćnih proračuna, standardna devijacija je sasvim prihvatljiva za samoproračun i primjene u tehničkoj analizi. Kako je primijetio aktivni čitatelj našeg časopisa čičak, “ Još uvijek ne razumijem zašto RMS nije uključen u set standardnih indikatora domaćih dilerskih centara«.

stvarno, standardna devijacija može, na klasičan i "čist" način, mjeriti varijabilnost instrumenta. Ali, nažalost, ovaj pokazatelj nije toliko čest u analizi vrijednosnih papira.

Primjena standardne devijacije

Ručno izračunavanje standardne devijacije nije baš zanimljivo. ali korisno za iskustvo. Standardna devijacija se može izraziti formula STD=√[(∑(x-x ) 2)/n] , koja zvuči kao korijen zbir kvadrata razlika između uzoraka stavki i srednje vrijednosti, podijeljen sa brojem stavki u uzorku.

Ako broj elemenata u uzorku prelazi 30, nazivnik razlomka ispod korijena poprima vrijednost n-1. Inače se koristi n.

korak po korak proračun standardne devijacije:

  1. izračunati aritmetičku sredinu uzorka podataka
  2. oduzmite ovaj prosjek od svakog elementa uzorka
  3. sve rezultirajuće razlike su na kvadrat
  4. zbrojite sve rezultirajuće kvadrate
  5. rezultujuću sumu podijelite sa brojem elemenata u uzorku (ili sa n-1 ako je n>30)
  6. izračunajte kvadratni korijen rezultirajućeg količnika (zv disperzija)

Za jednostavno izračunavanje geometrijske sredine koristi se formula:

geometrijski ponderisani

Da bi se odredio geometrijski ponderisani prosjek, koristi se formula:

Prosječni prečnici kotača, cijevi, prosječne stranice kvadrata određuju se korištenjem srednjeg kvadrata.

RMS vrijednosti se koriste za izračunavanje nekih pokazatelja, kao što je koeficijent varijacije, koji karakterizira ritam proizvodnje. Ovdje se standardna devijacija od planirane proizvodnje za određeni period određuje sljedećom formulom:

Ove vrijednosti tačno karakteriziraju promjenu ekonomskih pokazatelja u odnosu na njihovu baznu vrijednost, uzetu u njegovoj prosječnoj vrijednosti.

Kvadratno jednostavno

Prosti srednji kvadrat izračunava se po formuli:

Kvadratno ponderisano

Ponderisani srednji kvadrat je:

22. Apsolutne mjere varijacije uključuju:

raspon varijacija

srednje linearno odstupanje

disperzija

standardna devijacija

Raspon varijacije (r)

Varijacija raspona je razlika između maksimalne i minimalne vrijednosti atributa

Prikazuje granice u kojima se mijenja vrijednost atributa u proučavanoj populaciji.

Radno iskustvo pet kandidata na prethodnom radnom mestu je: 2,3,4,7 i 9 godina. Rješenje: raspon varijacije = 9 - 2 = 7 godina.

Za generaliziranu karakteristiku razlika u vrijednostima atributa, prosječni pokazatelji varijacije se izračunavaju na osnovu dopuštenja za odstupanja od aritmetičke sredine. Razlika se uzima kao odstupanje od srednje vrijednosti.

Istovremeno, da bi se izbjeglo pretvaranje u nulu sume odstupanja opcija osobina od srednje vrijednosti (nulto svojstvo srednje vrijednosti), treba ili zanemariti znakove odstupanja, odnosno uzeti ovaj zbir po modulu , ili kvadrat vrijednosti odstupanja

Srednja linearna i kvadratna devijacija

Prosječna linearna devijacija je aritmetička sredina apsolutnih odstupanja pojedinačnih vrijednosti atributa od srednje vrijednosti.

Prosječna linearna devijacija je jednostavna:

Radno iskustvo pet kandidata na prethodnom radnom mestu je: 2,3,4,7 i 9 godina.

U našem primjeru: godine;

Odgovor: 2,4 godine.

Ponderisana prosječna linearna devijacija odnosi se na grupisane podatke:

Prosečno linearno odstupanje se, zbog svoje uslovljenosti, relativno retko koristi u praksi (posebno za karakterizaciju ispunjenja ugovornih obaveza u smislu ujednačenosti isporuke; u analizi kvaliteta proizvoda, uzimajući u obzir tehnološke karakteristike proizvodnje ).

Standardna devijacija

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu srednjeg kvadrata odstupanja pojedinačnih vrijednosti atributa od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija se primjenjuje za grupisane podatke:

Između srednjeg kvadrata i srednjeg linearnog odstupanja u uslovima normalne distribucije postoji sljedeća veza: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se za određivanje vrijednosti ordinata krive normalne distribucije, u proračunima koji se odnose na organizaciju posmatranja uzorka i utvrđivanje tačnosti karakteristika uzorka, kao i kod procjenu granica varijacije osobine u homogenoj populaciji.

Prilikom statističkog testiranja hipoteza, kada se mjeri linearni odnos između slučajnih varijabli.

Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u odnosu na njegovo matematičko očekivanje zasnovano na nepristrasnoj procjeni njegove varijanse):

gdje - varijansa; - Pod, zidovi oko nas i plafon, i-ti element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrasne. U opštem slučaju, nemoguće je konstruisati nepristrasnu procenu. Međutim, procjena zasnovana na nepristrasnoj procjeni varijanse je konzistentna.

tri sigma pravilo

tri sigma pravilo() - gotovo sve vrijednosti normalno raspoređene slučajne varijable leže u intervalu. Strogo rečeno - sa sigurnošću od ne manje od 99,7%, vrijednost normalno raspoređene slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobijena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda treba koristiti ne, već pod, zidove oko nas i plafon, s. Tako se pravilo tri sigme prevodi u pravilo tri sprata, zidova oko nas i plafona, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu sa prosječnom vrijednošću skupa; mala vrijednost, odnosno, označava da su vrijednosti u skupu grupisane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti 7 i standardne devijacije 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupisane oko srednje vrijednosti; prvi set ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U opštem smislu, standardna devijacija se može smatrati mjerom neizvjesnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje greške serije uzastopnih mjerenja neke veličine. Ova vrijednost je vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u poređenju sa vrijednošću predviđenom teorijom: ako se srednja vrijednost mjerenja uvelike razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobijene vrijednosti ili način njihovog dobijanja treba ponovo provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućava da odredite koliko se vrijednosti u setu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada sa istom prosječnom dnevnom maksimalnom temperaturom, ali jedan se nalazi na obali, a drugi u unutrašnjosti. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u primorskom gradu biti manja nego u drugom gradu, uprkos činjenici da je prosječna vrijednost ove vrijednosti za njih ista, što u praksi znači da je vjerovatnoća da će maksimalni Temperatura svakog pojedinog dana u godini će biti jača razlikovati od prosječne vrijednosti, viša za grad koji se nalazi unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko fudbalskih timova koji su rangirani prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, šansi za gol, itd. Najvjerovatnije je da će najbolji tim u ovoj grupi imati najbolji vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su izbalansirani. S druge strane, timu sa velikom standardnom devijacijom teško je predvidjeti rezultat, što se pak objašnjava neravnotežom, na primjer, jakom odbranom, ali slabim napadom.

Upotreba standardne devijacije parametara tima omogućava da se donekle predvidi rezultat utakmice između dva tima, procjenjujući snage i slabosti timova, a time i odabrane metode borbe.

Tehnička analiza

vidi takođe

Književnost

* Borovikov, V. STATISTIKA. Umetnost kompjuterske analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.