Biografije Karakteristike Analiza

Kvadrat standardne devijacije. Disperzija

Mudri matematičari i statističari došli su do pouzdanijeg pokazatelja, iako u nešto drugačiju svrhu - srednje linearno odstupanje. Ovaj indikator karakterizira mjeru širenja vrijednosti skupa podataka oko njihove prosječne vrijednosti.

Da biste prikazali mjeru širenja podataka, prvo morate odrediti na šta će se smatrati upravo ta širina - obično je to prosječna vrijednost. Zatim morate izračunati koliko su vrijednosti analiziranog skupa podataka daleko od prosjeka. Jasno je da svaka vrijednost odgovara određenoj količini odstupanja, ali nas zanima i opšta procjena koja pokriva cjelokupnu populaciju. Stoga se prosječno odstupanje izračunava pomoću formule uobičajene aritmetičke sredine. Ali! Ali da bi se izračunao prosjek odstupanja, oni se prvo moraju sabrati. A ako zbrojimo pozitivne i negativne brojeve, oni će se poništiti i njihov zbir će težiti nuli. Da bi se to izbjeglo, sva odstupanja se uzimaju po modulu, odnosno svi negativni brojevi postaju pozitivni. Sada će prosječno odstupanje pokazati generaliziranu mjeru širenja vrijednosti. Kao rezultat toga, prosječno linearno odstupanje će se izračunati po formuli:

a je prosječna linearna devijacija,

x- analizirani indikator, sa crticom na vrhu - prosječna vrijednost indikatora,

n je broj vrijednosti u analiziranom skupu podataka,

operator zbrajanja, nadam se, nikoga ne plaši.

Prosječna linearna devijacija izračunata korištenjem navedene formule odražava prosječno apsolutno odstupanje od prosječne vrijednosti za ovu populaciju.

Crvena linija na slici je prosječna vrijednost. Odstupanja svake opservacije od srednje vrednosti su označena malim strelicama. One se uzimaju po modulu i zbrajaju. Zatim se sve podijeli brojem vrijednosti.

Da bi se slika upotpunila, potrebno je dati još jedan primjer. Recimo da postoji kompanija koja proizvodi reznice za lopate. Svaki rez treba da bude dugačak 1,5 metara, ali, što je još važnije, svi trebaju biti isti, ili barem plus-minus 5 cm. Međutim, nesavjesni radnici će odsjeći 1,2 m, pa 1,8 m. . Direktor kompanije odlučio je da izvrši statističku analizu dužine rezanja. Odabrao sam 10 komada i izmjerio njihovu dužinu, pronašao prosjek i izračunao prosječno linearno odstupanje. Ispostavilo se da je prosjek taman - 1,5 m. Ali prosječno linearno odstupanje je 0,16 m. Dakle, ispada da je svaki rez duži ili kraći od potrebnog u prosjeku za 16 cm. Ima o čemu pričati sa radnicima. Zapravo, nisam vidio pravu upotrebu ovog indikatora, pa sam sam došao do primjera. Međutim, takav pokazatelj postoji u statistici.

Disperzija

Poput srednjeg linearnog odstupanja, varijansa također odražava obim do kojeg se podaci šire oko srednje vrijednosti.

Formula za izračunavanje varijanse izgleda ovako:

(za serije varijacija (ponderisana varijansa))

(za negrupirane podatke (jednostavna varijansa))

Gdje: σ 2 - disperzija, Xi– analiziramo sq indikator (vrijednost karakteristike), – prosječnu vrijednost indikatora, f i – broj vrijednosti u analiziranom skupu podataka.

Varijanca je srednji kvadrat odstupanja.

Prvo se izračunava srednja vrijednost, zatim se uzima razlika između svake osnovne i srednje vrijednosti, kvadrira, množi učestalošću odgovarajuće vrijednosti obilježja, dodaje, a zatim dijeli s brojem vrijednosti u populaciji.

Međutim, u svom čistom obliku, kao što je, na primjer, aritmetička sredina ili indeks, disperzija se ne koristi. To je prije pomoćni i srednji indikator koji se koristi za druge vrste statističkih analiza.

Pojednostavljen način izračunavanja varijanse

standardna devijacija

Da bismo koristili varijansu za analizu podataka, iz nje se uzima kvadratni korijen. Ispada tzv standardna devijacija.

Inače, standardna devijacija se naziva i sigma - od grčkog slova koje ga označava.

Standardna devijacija očigledno takođe karakteriše meru disperzije podataka, ali sada (za razliku od disperzije) može da se uporedi sa originalnim podacima. Po pravilu, srednji kvadratni indikatori u statistici daju tačnije rezultate od linearnih. Stoga je standardna devijacija preciznija mjera rasipanja podataka od srednje linearne devijacije.

Prilikom statističkog testiranja hipoteza, kada se mjeri linearni odnos između slučajnih varijabli.

Standardna devijacija:

Standardna devijacija(procena standardne devijacije slučajne varijable Pod, zidovi oko nas i plafon, x u odnosu na njegovo matematičko očekivanje zasnovano na nepristrasnoj procjeni njegove varijanse):

gdje - varijansa; - Pod, zidovi oko nas i plafon, i-ti element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrasne. U opštem slučaju, nemoguće je konstruisati nepristrasnu procenu. Međutim, procjena zasnovana na nepristrasnoj procjeni varijanse je konzistentna.

tri sigma pravilo

tri sigma pravilo() - gotovo sve vrijednosti normalno raspoređene slučajne varijable leže u intervalu. Strogo rečeno - sa sigurnošću od ne manje od 99,7%, vrijednost normalno raspoređene slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobijena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda treba koristiti ne, već pod, zidove oko nas i plafon, s. Tako se pravilo tri sigme prevodi u pravilo tri sprata, zidova oko nas i plafona, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu sa prosječnom vrijednošću skupa; mala vrijednost, odnosno, ukazuje da su vrijednosti u skupu grupisane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti 7 i standardne devijacije 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupisane oko srednje vrijednosti; prvi set ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U opštem smislu, standardna devijacija se može smatrati mjerom neizvjesnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje greške serije uzastopnih mjerenja neke veličine. Ova vrijednost je vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u poređenju sa vrijednošću predviđenom teorijom: ako je srednja vrijednost mjerenja vrlo različita od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobijene vrijednosti ili način njihovog dobijanja treba ponovo provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućava da odredite koliko se vrijednosti u setu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada sa istom prosječnom dnevnom maksimalnom temperaturom, ali jedan se nalazi na obali, a drugi u unutrašnjosti. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u primorskom gradu biti manja nego u drugom gradu, uprkos činjenici da imaju istu prosječnu vrijednost ove vrijednosti, što u praksi znači da je vjerovatnoća da će maksimalna temperatura zraka od svaki određeni dan u godini će biti jači razlikuje se od prosječne vrijednosti, veći za grad koji se nalazi unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko fudbalskih timova koji su rangirani prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, šansi za pogodak itd. Najvjerovatnije je da će najbolji tim u ovoj grupi imati najbolje vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su izbalansirani. S druge strane, tim sa velikom standardnom devijacijom teško može predvidjeti rezultat, što se pak objašnjava neravnotežom, na primjer, jakom odbranom, ali slabim napadom.

Upotreba standardne devijacije parametara tima omogućava da se donekle predvidi rezultat utakmice između dva tima, procjenjujući snage i slabosti timova, a time i odabrane metode borbe.

Tehnička analiza

vidi takođe

Književnost

* Borovikov, V. STATISTIKA. Umetnost kompjuterske analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

U ovom članku ću govoriti o kako pronaći standardnu ​​devijaciju. Ovaj materijal je izuzetno važan za potpuno razumijevanje matematike, tako da bi nastavnik matematike trebao posvetiti posebnu lekciju ili čak nekoliko lekcija tome. U ovom članku ćete pronaći vezu do detaljnog i razumljivog video vodiča koji objašnjava što je standardna devijacija i kako je pronaći.

standardna devijacija omogućava procjenu širenja vrijednosti dobivenih kao rezultat mjerenja određenog parametra. Označava se simbolom (grčko slovo "sigma").

Formula za izračun je prilično jednostavna. Da biste pronašli standardnu ​​devijaciju, morate uzeti kvadratni korijen varijanse. Dakle, sada morate da se zapitate: "Šta je varijansa?"

Šta je disperzija

Definicija varijanse je sljedeća. Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti od srednje vrijednosti.

Da biste pronašli varijansu, izvršite sljedeće proračune uzastopno:

  • Odredite srednju vrijednost (jednostavnu aritmetičku sredinu niza vrijednosti).
  • Zatim od svake vrijednosti oduzmite prosjek i kvadrirajte rezultujuću razliku (dobili smo razlika na kvadrat).
  • Sljedeći korak je izračunavanje aritmetičke sredine kvadrata dobijenih razlika (zašto su kvadrati tačno navedeni u nastavku).

Pogledajmo primjer. Recimo da ste vi i vaši prijatelji odlučili izmjeriti visinu vaših pasa (u milimetrima). Kao rezultat mjerenja dobili ste sljedeće mjere visine (u grebenu): 600 mm, 470 mm, 170 mm, 430 mm i 300 mm.

Izračunajmo srednju vrijednost, varijansu i standardnu ​​devijaciju.

Hajde da prvo pronađemo prosek. Kao što već znate, za to morate sabrati sve izmjerene vrijednosti i podijeliti s brojem mjerenja. Napredak proračuna:

Prosjek mm.

Dakle, prosjek (aritmetička sredina) je 394 mm.

Sada treba da definišemo odstupanje visine svakog od pasa od prosjeka:

konačno, za izračunavanje varijanse, svaka od dobijenih razlika se kvadrira, a zatim nalazimo aritmetičku sredinu dobijenih rezultata:

Disperzija mm 2 .

Dakle, disperzija je 21704 mm 2 .

Kako pronaći standardnu ​​devijaciju

Pa kako sada izračunati standardnu ​​devijaciju, znajući varijansu? Kao što se sjećamo, uzmite kvadratni korijen. Odnosno, standardna devijacija je:

mm (zaokruženo na najbliži cijeli broj u mm).

Koristeći ovu metodu, otkrili smo da su neki psi (npr. rotvajleri) veoma veliki psi. Ali postoje i vrlo mali psi (na primjer, jazavčari, ali to im ne biste trebali reći).

Najzanimljivije je da standardna devijacija nosi korisne informacije. Sada možemo pokazati koji su od dobijenih rezultata mjerenja rasta unutar intervala koji dobijemo ako od prosjeka (s obje njegove strane) izdvojimo standardnu ​​devijaciju.

Odnosno, koristeći standardnu ​​devijaciju, dobijamo "standardnu" metodu koja vam omogućava da saznate koja je od vrijednosti normalna (statistički prosjek), a koja je izuzetno velika ili, obrnuto, mala.

Šta je standardna devijacija

Ali... stvari će biti malo drugačije ako analiziramo uzorkovanje podaci. U našem primjeru razmotrili smo opšta populacija. Naime, naših 5 pasa su bili jedini psi na svijetu koji su nas zanimali.

Ali ako su podaci uzorak (vrijednosti odabrane iz velike populacije), tada je potrebno izračunati drugačije.

Ako postoje vrijednosti, onda:

Svi ostali proračuni se rade na isti način, uključujući i određivanje prosjeka.

Na primjer, ako je naših pet pasa samo uzorak populacije pasa (svi psi na planeti), moramo podijeliti sa 4 umjesto 5 naime:

Varijanca uzorka = mm 2 .

U ovom slučaju, standardna devijacija za uzorak je jednaka mm (zaokruženo na najbliži cijeli broj).

Možemo reći da smo napravili neku "ispravku" u slučaju kada su naše vrijednosti samo mali uzorak.

Bilješka. Zašto baš kvadrati razlika?

Ali zašto uzimamo kvadrate razlika kada računamo varijansu? Priznajmo da ste prilikom mjerenja nekog parametra dobili sljedeći skup vrijednosti: 4; četiri; -četiri; -četiri. Ako samo dodamo apsolutna odstupanja od srednje vrijednosti (razlike) među sobom ... negativne vrijednosti se poništavaju pozitivnim:

.

Ispostavilo se da je ova opcija beskorisna. Onda možda vrijedi isprobati apsolutne vrijednosti odstupanja (odnosno module ovih vrijednosti)?

Na prvi pogled ispada da nije loše (rezultirajuća vrijednost, inače, naziva se srednja apsolutna devijacija), ali ne u svim slučajevima. Pokušajmo sa drugim primjerom. Neka mjerenje rezultira sljedećim skupom vrijednosti: 7; jedan; -6; -2. Tada je srednja apsolutna devijacija:

Blimey! Opet smo dobili rezultat 4, iako su razlike znatno veće.

Sada da vidimo šta će se dogoditi ako kvadriramo razlike (a zatim uzmemo kvadratni korijen njihovog zbira).

Za prvi primjer dobijate:

.

Za drugi primjer dobijate:

Sada je to sasvim druga stvar! Srednje kvadratno odstupanje je veće, što je širenje razlika veće... čemu smo težili.

Zapravo, ova metoda koristi istu ideju kao kod izračunavanja udaljenosti između tačaka, samo primijenjena na drugačiji način.

A sa matematičke tačke gledišta, upotreba kvadrata i kvadratnog korijena je korisnija nego što bismo mogli dobiti na osnovu apsolutnih vrijednosti ​​odstupanja, zbog čega je standardna devijacija primjenjiva na druge matematičke probleme.

Sergej Valerievič vam je rekao kako pronaći standardnu ​​devijaciju

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu srednjeg kvadrata odstupanja vrijednosti pojedinačnih karakteristika od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija se primjenjuje za grupisane podatke:

Između srednjeg kvadrata i srednjeg linearnog odstupanja u uslovima normalne distribucije postoji sljedeća veza: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se za određivanje vrijednosti ordinata krivulje normalne distribucije, u proračunima koji se odnose na organizaciju posmatranja uzorka i utvrđivanje tačnosti karakteristika uzorka, kao i kod procjenu granica varijacije osobine u homogenoj populaciji.

Disperzija, njene vrste, standardna devijacija.

Varijanca slučajne varijable- mjera širenja date slučajne varijable, odnosno njenog odstupanja od matematičkog očekivanja. U statistici se često koristi oznaka ili. Kvadratni korijen varijanse naziva se standardna devijacija, standardna devijacija ili standardni raspon.

Ukupna varijansa (σ2) mjeri varijaciju osobine u cjelokupnoj populaciji pod utjecajem svih faktora koji su uzrokovali ovu varijaciju. Istovremeno, zahvaljujući metodi grupisanja, moguće je izolovati i izmeriti varijaciju zbog obeležja grupisanja, kao i varijaciju koja nastaje pod uticajem neuračunatih faktora.

Međugrupna varijansa (σ 2 m.gr) karakteriše sistematsko variranje, tj. razlike u veličini proučavane osobine koje nastaju pod uticajem osobine - faktora koji leži u osnovi grupisanja.

standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, standardna devijacija; slični pojmovi: standardna devijacija, standardni raspon) - u teoriji vjerojatnosti i statistici, najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njeno matematičko očekivanje. Sa ograničenim nizovima uzoraka vrijednosti, umjesto matematičkog očekivanja, koristi se aritmetička sredina skupa uzoraka.

Standardna devijacija se mjeri u jedinicama same slučajne varijable i koristi se za izračunavanje standardne greške aritmetičke sredine, za konstruiranje intervala povjerenja, za statističko testiranje hipoteza i za mjerenje linearnog odnosa između slučajnih varijabli. Definira se kao kvadratni korijen varijanse slučajne varijable.


Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na njegovo matematičko očekivanje zasnovano na nepristrasnoj procjeni njegove varijanse):

gdje je disperzija; — i-ti element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrasne. U opštem slučaju, nemoguće je konstruisati nepristrasnu procenu. Međutim, procjena zasnovana na nepristrasnoj procjeni varijanse je konzistentna.

Suština, obim i postupak za određivanje modusa i medijana.

Pored prosjeka po stepenu u statistici, za relativnu karakteristiku veličine promjenjivog svojstva i unutrašnje strukture distribucijskih serija koriste se strukturni prosjeci, koji se uglavnom predstavljaju kao mod i medijan.

Moda- Ovo je najčešća varijanta serije. Moda se koristi, na primjer, pri određivanju veličine odjeće, obuće, za kojima je najveća potražnja među kupcima. Režim za diskretnu seriju je varijanta sa najvećom frekvencijom. Prilikom izračunavanja načina za niz intervalnih varijacija, prvo morate odrediti modalni interval (po maksimalnoj frekvenciji), a zatim vrijednost modalne vrijednosti atributa prema formuli:

- - modna vrijednost

- - donja granica modalnog intervala

- - vrijednost intervala

- - frekvencija modalnog intervala

- - frekvencija intervala koji prethodi modalnom

- - učestalost intervala nakon modalnog

medijan - ovo je vrijednost karakteristike koja leži u osnovi rangirane serije i dijeli ovu seriju na dva dijela jednaka po broju.

Da biste odredili medijanu u diskretnoj seriji u prisustvu frekvencija, prvo izračunajte poluzbir frekvencija, a zatim odredite koja vrijednost varijante pada na njega. (Ako sortirani red sadrži neparan broj karakteristika, tada se srednji broj izračunava po formuli:

M e \u003d (n (broj karakteristika u zbiru) + 1) / 2,

u slučaju parnog broja karakteristika, medijana će biti jednaka proseku dve karakteristike u sredini reda).

Prilikom izračunavanja medijane za niz intervalnih varijacija, prvo odredite srednji interval unutar kojeg se nalazi medijana, a zatim vrijednost medijane prema formuli:

- je željeni medijan

- je donja granica intervala koji sadrži medijanu

- - vrijednost intervala

- - zbir frekvencija ili broj članova serije

Zbir akumuliranih frekvencija intervala koji prethode medijani

- je frekvencija srednjeg intervala

Primjer. Pronađite mod i medijan.

Rješenje:
U ovom primjeru, modalni interval je unutar starosne grupe od 25-30 godina, jer ovaj interval predstavlja najveću učestalost (1054).

Izračunajmo vrijednost moda:

To znači da je modalna starost studenata 27 godina.

Izračunajte medijan. Medijanski interval je u starosnoj grupi 25-30 godina, jer u okviru ovog intervala postoji varijanta koja populaciju dijeli na dva jednaka dijela (Σf i /2 = 3462/2 = 1731). Zatim u formulu zamjenjujemo potrebne numeričke podatke i dobivamo vrijednost medijane:

To znači da je polovina učenika mlađa od 27,4 godine, a druga polovina starija od 27,4 godine.

Pored načina i medijane, mogu se koristiti indikatori kao što su kvartili, dijeleći rangiranu seriju na 4 jednaka dijela, decila- 10 dijelova i percentila - na 100 dijelova.

Pojam selektivnog posmatranja i njegov domet.

Selektivno posmatranje primjenjuje se kada se primjenjuje kontinuirano posmatranje fizički nemoguće zbog velike količine podataka ili ekonomski nepraktično. Fizička nemogućnost se javlja, na primjer, kada se proučavaju putnički tokovi, tržišne cijene, porodični budžeti. Ekonomska nesvrsishodnost javlja se pri ocjenjivanju kvalitete robe povezane s njihovim uništenjem, na primjer, degustacija, ispitivanje čvrstoće cigle itd.

Statističke jedinice odabrane za posmatranje čine uzorak ili uzorak, a cijeli njihov niz - opštu populaciju (GS). U ovom slučaju, broj jedinica u uzorku označava n, a u cijelom HS-u - N. Stav n/N naziva se relativna veličina ili proporcija uzorka.

Kvaliteta rezultata uzorkovanja ovisi o reprezentativnosti uzorka, odnosno koliko je reprezentativan u HS. Da bi se osigurala reprezentativnost uzorka, potrebno je promatrati princip slučajnog odabira jedinica, koji pretpostavlja da na uključivanje HS jedinice u uzorak ne može utjecati nijedan drugi faktor osim slučajnosti.

Postoji 4 načina nasumične selekcije uzorkovati:

  1. Zapravo nasumično selekcija ili „metoda loto“, kada se serijski brojevi dodeljuju statističkim vrednostima, unose se na određene objekte (na primer, bure), koji se zatim mešaju u nekom kontejneru (na primer, u vrećici) i biraju nasumično. U praksi se ova metoda provodi pomoću generatora slučajnih brojeva ili matematičkih tablica slučajnih brojeva.
  2. Mehanički izbor, prema kojem svaki ( N/n)-ta vrijednost opće populacije. Na primjer, ako sadrži 100.000 vrijednosti, a želite da odaberete 1.000, tada će svaka 100.000 / 1000 = 100. vrijednost pasti u uzorak. Štaviše, ako nisu rangirani, onda se prvi bira nasumično od prvih sto, a brojevi ostalih će biti sto više. Na primjer, ako je jedinica broj 19 bila prva, onda bi broj 119 trebao biti sljedeći, zatim broj 219, zatim broj 319, i tako dalje. Ako su jedinice stanovništva rangirane, tada se prvo bira #50, zatim #150, zatim #250 i tako dalje.
  3. Vrši se odabir vrijednosti iz heterogenog niza podataka slojevito(stratificirana) metoda, kada je opća populacija prethodno podijeljena u homogene grupe, na koje se primjenjuje slučajni ili mehanički odabir.
  4. Posebna metoda uzorkovanja je serial selekcija, u kojoj se slučajno ili mehanički ne biraju pojedinačne veličine, već njihove serije (sekvence od nekog broja do nekog u nizu), u okviru kojih se vrši kontinuirano posmatranje.

Kvalitet opservacija uzorka također zavisi od tip uzorkovanja: ponovljeno ili ne-repetitivne.

At ponovna selekcija statističke vrijednosti ili njihove serije koje su ušle u uzorak vraćaju se općoj populaciji nakon upotrebe, imajući priliku da uđu u novi uzorak. Istovremeno, sve vrijednosti opće populacije imaju istu vjerovatnoću da budu uključene u uzorak.

Odabir koji se ne ponavlja znači da se statističke vrijednosti ili njihove serije uključene u uzorak ne vraćaju općoj populaciji nakon upotrebe, te se stoga povećava vjerovatnoća ulaska u sljedeći uzorak za preostale vrijednosti potonjeg.

Uzorkovanje koje se ne ponavlja daje preciznije rezultate, pa se češće koristi. Ali postoje situacije kada se to ne može primijeniti (proučavanje putničkih tokova, potražnje potrošača itd.) i tada se vrši ponovni odabir.

Marginalna greška uzorka posmatranja, prosečna greška uzorka, redosled kojim su izračunate.

Razmotrimo detaljno gore navedene metode formiranja populacije uzorka i greške koje nastaju u ovom slučaju. reprezentativnost .
Zapravo-slučajno uzorak se zasniva na nasumičnom odabiru jedinica iz opće populacije bez ikakvih elemenata konzistentnosti. Tehnički, ispravan slučajni odabir se vrši izvlačenjem (na primjer, lutrija) ili tablicom slučajnih brojeva.

Zapravo-slučajna selekcija "u svom čistom obliku" u praksi selektivnog posmatranja se retko koristi, ali je inicijalna među ostalim vrstama selekcije, implementira osnovne principe selektivnog posmatranja. Razmotrimo neka pitanja teorije metode uzorkovanja i formule greške za jednostavan slučajni uzorak.

Greška uzorkovanja- ovo je razlika između vrijednosti parametra u opštoj populaciji i njegove vrijednosti izračunate iz rezultata posmatranja uzorka. Za prosječnu kvantitativnu karakteristiku, greška uzorkovanja je određena pomoću

Indikator se naziva marginalna greška uzorkovanja.
Srednja vrijednost uzorka je slučajna varijabla koja može poprimiti različite vrijednosti ovisno o tome koje su jedinice u uzorku. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga odredite prosjek mogućih grešaka - srednja greška uzorkovanja, što zavisi od:

Veličina uzorka: što je veći broj, to je manja prosječna greška;

Stepen promjene proučavane osobine: što je manja varijacija osobine, a samim tim i varijansa, manja je prosječna greška uzorkovanja.

At nasumični ponovni izbor izračunava se prosječna greška:
.
U praksi, opšta varijansa nije tačno poznata, ali in teorija vjerovatnoće dokazao to
.
Budući da je vrijednost za dovoljno veliko n blizu 1, možemo pretpostaviti da je . Tada se može izračunati srednja greška uzorkovanja:
.
Ali u slučajevima malog uzorka (za n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

At nasumično uzorkovanje date formule su ispravljene vrijednošću . Tada je prosječna greška neuzorkovanja:
i .
Jer je uvijek manji od , tada je faktor () uvijek manji od 1. To znači da je prosječna greška u nerepetitivnoj selekciji uvijek manja nego u ponovljenoj selekciji.
Mehaničko uzorkovanje koristi se kada je opća populacija na neki način uređena (na primjer, birački spiskovi po abecednom redu, brojevi telefona, kućni brojevi, stanovi). Odabir jedinica se vrši u određenom intervalu, koji je jednak recipročnom postotku uzorka. Dakle, sa uzorkom od 2% bira se svakih 50 jedinica = 1 / 0,02, a sa 5% svakih 1 / 0,05 = 20 jedinica opšte populacije.

Porijeklo se bira na različite načine: nasumično, od sredine intervala, uz promjenu ishodišta. Glavna stvar je izbjeći sistematske greške. Na primjer, kod uzorka od 5%, ako je 13. odabran kao prva jedinica, onda sljedećih 33, 53, 73, itd.

U smislu tačnosti, mehanički odabir je blizak pravilnom slučajnom uzorkovanju. Stoga se za određivanje prosječne greške mehaničkog uzorkovanja koriste formule pravilnog slučajnog odabira.

At tipičan izbor ispitana populacija je preliminarno podijeljena u homogene, jednotipne grupe. Na primjer, kada se anketiraju preduzeća, to mogu biti industrije, podsektori, dok se proučava stanovništvo – područja, društvene ili starosne grupe. Zatim se iz svake grupe vrši nezavisna selekcija na mehanički ili odgovarajući slučajni način.

Tipično uzorkovanje daje preciznije rezultate od drugih metoda. Tipizacija opće populacije osigurava zastupljenost svake tipološke grupe u uzorku, što omogućava da se isključi utjecaj međugrupne varijanse na prosječnu grešku uzorka. Stoga je pri pronalaženju greške tipičnog uzorka prema pravilu sabiranja varijansi () potrebno uzeti u obzir samo prosjek grupnih varijansi. Tada je srednja greška uzorkovanja:
u ponovnoj selekciji
,
sa izborom koji se ne ponavlja
,
gdje je srednja vrijednost varijansi unutar grupe u uzorku.

Serijski (ili ugniježđeni) odabir koristi se kada je populacija podijeljena u serije ili grupe prije početka istraživanja uzorka. Ove serije mogu biti paketi gotovih proizvoda, studentske grupe, timovi. Serije za ispitivanje biraju se mehanički ili nasumično, au okviru serije se vrši kompletan pregled jedinica. Dakle, prosječna greška uzorkovanja ovisi samo o varijansi međugrupa (međuserija), koja se izračunava po formuli:

gdje je r broj odabranih serija;
- prosjek i-te serije.

Prosječna serijska greška uzorkovanja se izračunava:

kada se ponovo izabere:
,
sa stalnim odabirom:
,
gdje je R ukupan broj serija.

Kombinovano izbor je kombinacija razmatranih metoda selekcije.

Prosječna greška uzorkovanja za bilo koju metodu odabira zavisi uglavnom od apsolutne veličine uzorka i, u manjoj mjeri, od procenta uzorka. Pretpostavimo da je u prvom slučaju napravljeno 225 opservacija od populacije od 4.500 jedinica, au drugom slučaju od 225.000 jedinica. Varijance u oba slučaja su jednake 25. Tada će, u prvom slučaju, sa selekcijom od 5%, greška uzorkovanja biti:

U drugom slučaju, sa odabirom od 0,1%, to će biti jednako:


Na ovaj način, uz smanjenje procenta uzorka za 50 puta, greška uzorka se neznatno povećala, jer se veličina uzorka nije mijenjala.
Pretpostavimo da je veličina uzorka povećana na 625 opservacija. U ovom slučaju greška uzorkovanja je:

Povećanje uzorka za 2,8 puta uz istu veličinu opće populacije smanjuje veličinu greške uzorka za više od 1,6 puta.

Metode i načini formiranja uzorka populacije.

U statistici se koriste različite metode formiranja skupova uzoraka, što je određeno ciljevima istraživanja i zavisi od specifičnosti predmeta proučavanja.

Osnovni uslov za sprovođenje uzorka je da se spreči pojava sistematskih grešaka koje proizilaze iz kršenja principa jednakih mogućnosti svake jedinice opšte populacije da uđe u uzorak. Prevencija sistematskih grešaka postiže se upotrebom naučno zasnovanih metoda za formiranje uzorka populacije.

Postoje sljedeći načini za odabir jedinica iz opće populacije:

1) individualna selekcija - pojedinačne jedinice se biraju u uzorku;

2) grupni odabir - u uzorak spadaju kvalitativno homogene grupe ili serije jedinica koje se proučavaju;

3) kombinovana selekcija je kombinacija individualne i grupne selekcije.
Metode odabira određuju se pravilima za formiranje populacije uzorka.

Uzorak može biti:

  • pravi slučajan sastoji se u tome što se uzorak formira kao rezultat slučajnog (nenamjernog) odabira pojedinačnih jedinica iz opće populacije. U ovom slučaju, broj jedinica odabranih u skupu uzoraka se obično određuje na osnovu prihvaćenog udjela uzorka. Udio uzorka je omjer broja jedinica u populaciji uzorka n prema broju jedinica u općoj populaciji N, tj.
  • mehanički sastoji se u tome da se odabir jedinica u uzorku vrši iz opće populacije, podijeljene u jednake intervale (grupe). U ovom slučaju, veličina intervala u opštoj populaciji jednaka je recipročnoj proporciji uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0.02), kod uzorka od 5% svaka 20. jedinica (1:0.05) itd. Dakle, u skladu sa prihvaćenom proporcijom selekcije, opšta populacija je takoreći mehanički podeljena na jednake grupe. Iz svake grupe u uzorku se bira samo jedna jedinica.
  • tipično - u kojoj se opća populacija najprije dijeli na homogene tipične grupe. Zatim se iz svake tipične grupe vrši pojedinačni odabir jedinica u uzorak slučajnim ili mehaničkim uzorkom. Važna karakteristika tipičnog uzorka je da daje preciznije rezultate u poređenju sa drugim metodama odabira jedinica u uzorku;
  • serial- u kojem je opća populacija podijeljena u grupe iste veličine - serije. Serije se biraju u skupu uzoraka. U okviru serije vrši se kontinuirano posmatranje jedinica koje su ušle u seriju;
  • kombinovano- uzorkovanje može biti dvostepeno. U ovom slučaju, opća populacija se prvo dijeli na grupe. Zatim se biraju grupe, au okviru ovih se biraju pojedinačne jedinice.

U statistici se razlikuju sljedeće metode odabira jedinica u uzorku::

  • single stage uzorak - svaka odabrana jedinica se odmah podvrgava proučavanju na datoj osnovi (zapravo slučajni i serijski uzorci);
  • višestepeni uzorkovanje – selekcija se vrši iz opšte populacije pojedinačnih grupa, a pojedinačne jedinice se biraju iz grupa (tipičan uzorak sa mehaničkom metodom odabira jedinica u populaciji uzorka).

Osim toga, tu su:

  • ponovni izbor- prema šemi vraćene lopte. U ovom slučaju, svaka jedinica ili serija koja je ušla u uzorak vraća se u opštu populaciju i stoga ima šansu da ponovo bude uključena u uzorak;
  • selekcija koja se ne ponavlja- prema šemi nevraćene lopte. Ima preciznije rezultate za istu veličinu uzorka.

Određivanje potrebne veličine uzorka (pomoću Studentove tabele).

Jedan od naučnih principa u teoriji uzorkovanja je osigurati da se odabere dovoljan broj jedinica. Teoretski, potreba za poštivanjem ovog principa prikazana je u dokazima graničnih teorema teorije vjerovatnoće, koji vam omogućavaju da ustanovite koliko jedinica treba izabrati iz opće populacije tako da bude dovoljno i osigura reprezentativnost uzorka.

Smanjenje standardne greške uzorka, a samim tim i povećanje tačnosti procjene uvijek je povezano s povećanjem veličine uzorka, stoga je već u fazi organiziranja promatranja uzorka potrebno odlučiti kolika bi trebala biti veličina uzorka da bi se osigurala potrebna tačnost rezultata posmatranja. Proračun potrebne veličine uzorka se gradi korištenjem formula izvedenih iz formula za granične greške uzorkovanja (A), koje odgovaraju jednom ili drugom tipu i načinu odabira. Dakle, za slučajni ponovljeni uzorak (n), imamo:

Suština ove formule je da je slučajnim ponovnim odabirom potrebnog broja veličina uzorka direktno proporcionalna kvadratu koeficijenta pouzdanosti (t2) i varijansu karakteristike varijacije (?2) i obrnuto je proporcionalna kvadratu granične greške uzorkovanja (?2). Konkretno, udvostručavanjem marginalne greške, potrebna veličina uzorka može se smanjiti za faktor četiri. Od tri parametra, dva (t i?) postavlja istraživač.

Istovremeno, istraživač Za potrebe uzorka istraživanja treba se odlučiti za pitanje: u koju kvantitativnu kombinaciju je bolje uključiti ove parametre kako bi se dobila optimalna varijanta? U jednom slučaju može biti više zadovoljan pouzdanošću dobijenih rezultata (t) nego mjerom tačnosti (?), u drugom - obrnuto. Teže je riješiti pitanje u vezi s vrijednošću granične greške uzorkovanja, budući da istraživač nema ovaj indikator u fazi dizajniranja opservacije uzorka, stoga je u praksi uobičajeno postaviti graničnu grešku uzorkovanja, kao npr. pravilo, unutar 10% od očekivanog prosječnog nivoa osobine. Uspostavljanju pretpostavljenog prosječnog nivoa može se pristupiti na različite načine: korištenjem podataka iz sličnih prethodnih istraživanja ili korištenjem podataka iz okvira uzorkovanja i uzimanja malog pilot uzorka.

Najteže je utvrditi prilikom dizajniranja opservacije uzorka treći parametar u formuli (5.2) – varijansa populacije uzorka. U tom slučaju potrebno je koristiti sve informacije dostupne istraživaču, dobijene iz prethodnih sličnih i pilot istraživanja.

Pitanje definicije Potrebna veličina uzorka postaje komplikovanija ako istraživanje uzorka uključuje proučavanje nekoliko karakteristika jedinica uzorka. U ovom slučaju, prosječni nivoi svake od karakteristika i njihova varijacija su, po pravilu, različiti, pa je stoga moguće odlučiti kojoj disperziji koje karakteristike dati prednost samo uzimajući u obzir svrhu i ciljeve anketa.

Prilikom dizajniranja posmatranja uzorka, pretpostavlja se unaprijed određena vrijednost dozvoljene greške uzorkovanja u skladu sa ciljevima određene studije i vjerovatnoćom zaključaka na osnovu rezultata posmatranja.

Općenito, formula za graničnu grešku srednje vrijednosti uzorka omogućava vam da odredite:

Veličina mogućih odstupanja indikatora opšte populacije od pokazatelja populacije uzorka;

Potrebna veličina uzorka, koja obezbeđuje potrebnu tačnost, u kojoj granice moguće greške neće prelaziti određenu određenu vrednost;

Vjerovatnoća da će greška u uzorku imati zadanu granicu.

Distribucija učenika u teoriji vjerovatnoće, to je jednoparametarska porodica apsolutno kontinuiranih distribucija.

Niz dinamike (interval, moment), zatvaranje niza dinamike.

Serija dinamike- to su vrijednosti statističkih pokazatelja koji se prikazuju određenim hronološkim redoslijedom.

Svaka vremenska serija sadrži dvije komponente:

1) indikatori vremenskih perioda (godine, kvartali, meseci, dani ili datumi);

2) indikatori koji karakterišu objekat koji se proučava za vremenske periode ili na odgovarajuće datume, koji se nazivaju nivoi serije.

Nivoi serije su izraženi i apsolutne i prosječne ili relativne vrijednosti. U zavisnosti od prirode indikatora, grade se dinamičke serije apsolutnih, relativnih i prosječnih vrijednosti. Dinamičke serije relativnih i prosječnih vrijednosti grade se na osnovu izvedenih serija apsolutnih vrijednosti. Postoje intervalne i momentne serije dinamike.

Dinamičke intervalne serije sadrži vrijednosti indikatora za određene vremenske periode. U intervalnim serijama nivoi se mogu sumirati, dobijajući obim fenomena za duži period, ili takozvani akumulirani totali.

Serija dinamičkih trenutaka odražava vrijednosti indikatora u određenom trenutku (datum u vremenu). U serijama trenutaka, istraživača može zanimati samo razlika pojava, koja odražava promjenu nivoa serije između određenih datuma, budući da ovdje zbir nivoa nema pravi sadržaj. Ovdje se ne izračunavaju kumulativni zbroji.

Najvažniji uslov za ispravnu konstrukciju dinamičkih serija je uporedivost nivoa serija koji se odnose na različite periode. Nivoi treba da budu predstavljeni u homogenim količinama, treba da postoji ista potpunost obuhvata različitih delova fenomena.

To Kako bi se izbjeglo narušavanje realne dinamike, u statističkoj studiji (zatvaranje vremenske serije) provode se preliminarni proračuni koji prethode statističkoj analizi vremenske serije. Zatvaranje vremenskih serija podrazumeva spajanje dve ili više serija u jednu seriju čiji se nivoi izračunavaju po različitoj metodologiji ili ne odgovaraju teritorijalnim granicama itd. Zatvaranje niza dinamike može implicirati i svođenje apsolutnih nivoa niza dinamike na zajedničku osnovu, čime se eliminiše nekompatibilnost nivoa niza dinamike.

Koncept uporedivosti vremenskih serija, koeficijenata, stopa rasta i rasta.

Serija dinamike- ovo su nizovi statističkih pokazatelja koji karakterišu razvoj prirodnih i društvenih pojava u vremenu. Statističke zbirke koje izdaje Državni komitet za statistiku Rusije sadrže veliki broj vremenskih serija u obliku tabele. Serija dinamike omogućava otkrivanje obrazaca razvoja proučavanih pojava.

Vremenske serije sadrže dvije vrste indikatora. Indikatori vremena(godine, kvartali, mjeseci, itd.) ili tačke u vremenu (na početku godine, na početku svakog mjeseca, itd.). Indikatori nivoa reda. Pokazatelji nivoa vremenskih serija mogu se izraziti u apsolutnim vrijednostima (proizvodnja proizvoda u tonama ili rubljama), relativnim vrijednostima (udio gradskog stanovništva u %) i prosječnim vrijednostima (prosječne plate radnika u industriji po godinama itd.). U tabelarnom obliku, vremenska serija sadrži dvije kolone ili dva reda.

Ispravna konstrukcija vremenskih serija podrazumijeva ispunjenje niza zahtjeva:

  1. svi pokazatelji niza dinamike moraju biti naučno potkrijepljeni, pouzdani;
  2. indikatori niza dinamike treba da budu vremenski uporedivi, tj. moraju biti izračunati za iste vremenske periode ili na iste datume;
  3. indikatori niza dinamike treba da budu uporedivi na cijeloj teritoriji;
  4. indikatori niza dinamike treba da budu sadržajno uporedivi, tj. obračunava se prema jedinstvenoj metodologiji, na isti način;
  5. indikatori niza dinamike trebali bi biti uporedivi u čitavom nizu razmatranih farmi. Sve indikatore serije dinamike treba dati u istim mjernim jedinicama.

Statistički indikatori može karakterizirati ili rezultate procesa koji se proučava u određenom vremenskom periodu, ili stanje proučavanog fenomena u određenom trenutku, tj. indikatori mogu biti intervalni (periodični) i trenutni. Shodno tome, u početku serija dinamike može biti intervalna ili momentalna. Trenutni nizovi dinamike, pak, mogu biti sa jednakim i nejednakim vremenskim intervalima.

Početna serija dinamike može se pretvoriti u niz prosječnih vrijednosti i niz relativnih vrijednosti (lanac i baza). Takve vremenske serije se nazivaju izvedene vremenske serije.

Metoda izračunavanja prosječnog nivoa u nizu dinamike je različita, zbog vrste serije dinamike. Koristeći primjere, razmotrite vrste vremenskih serija i formule za izračunavanje prosječnog nivoa.

Apsolutni dobici (Δy) pokazuje koliko se jedinica promijenio sljedeći nivo serije u odnosu na prethodni (kolona 3. - lanac apsolutnih priraštaja) ili u odnosu na početni nivo (kolona 4. - osnovni apsolutni priraštaji). Formule proračuna se mogu napisati na sljedeći način:

Sa smanjenjem apsolutnih vrijednosti serije, doći će do "smanjenje", "smanjenje", respektivno.

Pokazatelji apsolutnog rasta govore da je, na primjer, u 1998. godini proizvodnja proizvoda "A" povećana za 4.000 tona u odnosu na 1997. godinu, odnosno za 34.000 tona u odnosu na 1994. godinu; za ostale godine vidi tabelu. 11,5 gr. 3 i 4.

Faktor rasta pokazuje koliko se puta nivo serije promenio u odnosu na prethodni (kolona 5 - lančani faktori rasta ili opadanja) ili u poređenju sa početnim nivoom (kolona 6 - osnovni faktori rasta ili opadanja). Formule proračuna se mogu napisati na sljedeći način:

Stope rasta pokazuju koliko je procenata sledeći nivo serije u poređenju sa prethodnim (kolona 7 - lančane stope rasta) ili u poređenju sa početnim nivoom (kolona 8 - osnovne stope rasta). Formule proračuna se mogu napisati na sljedeći način:

Tako je, na primjer, 1997. godine obim proizvodnje proizvoda "A" u odnosu na 1996. godinu bio 105,5% (

Stope rasta pokazuju za koliko procenata je povećan nivo izvještajnog perioda u odnosu na prethodni (kolona 9 - lančane stope rasta) ili u odnosu na početni nivo (kolona 10 - osnovne stope rasta). Formule proračuna se mogu napisati na sljedeći način:

T pr \u003d T p - 100% ili T pr \u003d apsolutno povećanje / nivo prethodnog perioda * 100%

Tako je, na primjer, 1996. godine, u odnosu na 1995. godinu, proizvod "A" proizveden više za 3,8% (103,8% - 100%) ili (8:210) x 100%, au odnosu na 1994. godinu - za 9% ( 109% - 100%).

Ako se apsolutni nivoi u seriji smanje, tada će stopa biti manja od 100% i, shodno tome, doći će do stope pada (stopa rasta sa predznakom minus).

Apsolutna vrijednost povećanja od 1%.(kolona 11) pokazuje koliko jedinica mora biti proizvedeno u datom periodu da bi se nivo prethodnog perioda povećao za 1%. U našem primjeru, 1995. godine bilo je potrebno proizvesti 2,0 hiljade tona, a 1998. godine - 2,3 hiljade tona, tj. mnogo veći.

Postoje dva načina da se odredi veličina apsolutne vrijednosti rasta od 1%:

Podijelite nivo prethodnog perioda sa 100;

Podijelite apsolutne stope rasta lanca sa odgovarajućim stopama rasta lanca.

Apsolutna vrijednost povećanja od 1% =

U dinamici, posebno u dužem periodu, važno je zajednički analizirati stopu rasta sa sadržajem svakog procenta povećanja ili smanjenja.

Imajte na umu da je razmatrana metodologija za analizu vremenskih serija primjenjiva kako za vremenske serije čiji su nivoi izraženi u apsolutnim vrijednostima (t, hiljada rubalja, broj zaposlenih, itd.), tako i za vremenske serije, nivoe koji se izražavaju u relativnim pokazateljima (% otpada, % pepela u uglju i sl.) ili prosječnim vrijednostima (prosječni prinos u c/ha, prosječne plate itd.).

Uz razmatrane analitičke pokazatelje izračunate za svaku godinu u poređenju sa prethodnim ili početnim nivoom, prilikom analize vremenske serije potrebno je izračunati i prosječne analitičke pokazatelje za period: prosječni nivo serije, prosječni godišnji apsolutni porast (smanjenje) i prosječna godišnja stopa rasta i stopa rasta.

Metode za izračunavanje prosječnog nivoa serije dinamike su razmatrane gore. U intervalnoj seriji dinamike koju razmatramo, prosječni nivo serije izračunava se po formuli jednostavne aritmetičke sredine:

Prosječna godišnja proizvodnja proizvoda za 1994-1998. iznosio je 218,4 hiljade tona.

Prosječni godišnji apsolutni porast također se izračunava formulom proste aritmetičke sredine:

Godišnji apsolutni prirast varirao je tokom godina od 4 do 12 hiljada tona (vidi gr. 3), a prosječni godišnji porast proizvodnje za period 1995 - 1998. iznosio je 8,5 hiljada tona.

Metode za izračunavanje prosječne stope rasta i prosječne stope rasta zahtijevaju detaljnije razmatranje. Razmotrimo ih na primjeru godišnjih pokazatelja nivoa serije datih u tabeli.

Srednji nivo raspona dinamike.

Niz dinamike (ili vremenske serije)- to su numeričke vrijednosti određenog statističkog pokazatelja u uzastopnim trenucima ili vremenskim periodima (tj. poredane hronološkim redom).

Zovu se numeričke vrijednosti određenog statističkog pokazatelja koji čini niz dinamike nivoi broja i obično se označava slovom y. Prvi član serije y 1 zove se početni ili osnovna linija, i posljednji y n - final. Trenuci ili vremenski periodi na koje se nivoi odnose su označeni sa t.

Dinamičke serije se u pravilu prikazuju u obliku tabele ili grafikona, a duž x-ose se gradi vremenska skala t, a duž ordinate - skala nivoa serije y.

Prosječni pokazatelji niza dinamike

Svaka serija dinamike može se smatrati određenim skupom n vremenski promjenjivi indikatori koji se mogu sažeti kao prosjeci. Ovakvi generalizirani (prosječni) pokazatelji su posebno potrebni kada se porede promjene jednog ili drugog indikatora u različitim periodima, u različitim zemljama itd.

Generalizirana karakteristika niza dinamike može biti, prije svega, prosječni nivo reda. Metoda izračunavanja prosječnog nivoa ovisi o tome da li se radi o momentnoj ili intervalnoj (periodnoj) seriji.

Kada interval serije, njen prosječni nivo je određen formulom proste aritmetičke sredine nivoa serije, tj.

=
Ako je dostupno momenat red koji sadrži n nivoi ( y1, y2, …, yn) sa jednakim intervalima između datuma (vremenskih tačaka), onda se takav niz može lako pretvoriti u niz prosječnih vrijednosti. Istovremeno, indikator (nivo) na početku svakog perioda je istovremeno i indikator na kraju prethodnog perioda. Tada se prosječna vrijednost indikatora za svaki period (interval između datuma) može izračunati kao polovični zbroj vrijednosti at na početku i na kraju perioda, tj. kako . Broj takvih prosjeka će biti . Kao što je ranije spomenuto, za serije prosjeka, prosječni nivo se izračunava iz aritmetičkog prosjeka.

Stoga možemo napisati:
.
Nakon pretvaranja brojila, dobijamo:
,

gdje Y1 i Yn- prvi i posljednji nivo serije; Yi- srednji nivoi.

Ovaj prosjek je u statistici poznat kao prosečan hronološki za trenutne serije. Ovo ime dobila je od riječi "cronos" (vrijeme, lat.), jer se računa na osnovu pokazatelja koji se mijenjaju tokom vremena.

U slučaju nejednake intervalima između datuma, hronološki prosjek za trenutne serije može se izračunati kao aritmetički prosjek prosječnih vrijednosti nivoa za svaki par trenutaka, ponderiranih udaljenostima (vremenskim intervalima) između datuma, tj.
.
U ovom slučaju pretpostavlja se da su u intervalima između datuma nivoi poprimali različite vrijednosti, a mi smo iz dva poznata ( yi i yi+1) određujemo prosjeke, iz kojih se zatim izračunava ukupni prosjek za cijeli analizirani period.
Ako se pretpostavi da svaka vrijednost yi ostaje nepromijenjen do sljedećeg (i+ 1)- th momenta, tj. poznat je tačan datum promjene nivoa, tada se izračun može izvršiti pomoću formule ponderirane aritmetičke sredine:
,

gdje je vrijeme tokom kojeg je nivo ostao nepromijenjen.

Pored prosječnog nivoa u seriji dinamike, izračunavaju se i drugi prosječni pokazatelji - prosječna promjena nivoa serije (osnovne i lančane metode), prosječna stopa promjene.

Osnovna vrijednost znači apsolutnu promjenu je količnik posljednje osnovne apsolutne promjene podijeljen sa brojem promjena. To je

Lanac znači apsolutnu promjenu nivoi niza je količnik dijeljenja zbira svih apsolutnih promjena lanca brojem promjena, tj.

Po predznaku prosječnih apsolutnih promjena prosječno se prosuđuje i priroda promjene fenomena: rast, pad ili stabilnost.

Iz pravila za kontrolu osnovnih i lančanih apsolutnih promjena proizilazi da osnovne i lančane prosječne promjene moraju biti jednake.

Uz prosječnu apsolutnu promjenu, pomoću osnovne i lančane metode izračunava se i prosječna relativna.

Osnovna prosječna relativna promjena određuje se formulom:

Lanac znači relativnu promjenu određuje se formulom:

Naravno, osnovne i lančane prosječne relativne promjene treba da budu iste, a upoređujući ih sa vrijednošću kriterija 1, dolazi se do zaključka o prirodi promjene pojave u prosjeku: rast, pad ili stabilnost.
Oduzimanjem 1 od prosječne relativne promjene baze ili lanca, dobiva se odgovarajuća prosječna stopa promjene, po čijem se znaku može suditi i o prirodi promjene u proučavanoj pojavi, koja se ogleda u ovom nizu dinamike.

Sezonske fluktuacije i sezonski indeksi.

Sezonske fluktuacije su stabilne unutargodišnje fluktuacije.

Osnovni princip upravljanja postizanjem maksimalnog efekta je maksimizacija prihoda i minimizacija troškova. Proučavanjem sezonskih fluktuacija rješava se problem jednačine maksimuma u svakom nivou godine.

Prilikom proučavanja sezonskih fluktuacija rješavaju se dva međusobno povezana zadatka:

1. Identifikacija specifičnosti razvoja fenomena u unutargodišnjoj dinamici;

2. Mjerenje sezonskih fluktuacija sa izgradnjom modela sezonskog talasa;

Sezonske ćurke se obično broje da bi se izmjerila sezonalnost. Uopšteno govoreći, one su određene omjerom izvornih jednačina niza dinamike i teorijskih jednačina koje služe kao osnova za poređenje.

Budući da su nasumična odstupanja superponirana na sezonske fluktuacije, indeksi sezonskosti se prosječuju kako bi se eliminisale.

U ovom slučaju, za svaki period godišnjeg ciklusa, generalizirani pokazatelji se određuju u obliku prosječnih sezonskih indeksa:

Prosječni indeksi sezonskih kolebanja oslobođeni su utjecaja slučajnih odstupanja glavnog trenda razvoja.

Ovisno o prirodi trenda, formula za prosječni indeks sezonskosti može imati sljedeće oblike:

1.Za serije unutargodišnje dinamike sa izraženim glavnim trendom razvoja:

2. Za niz unutargodišnje dinamike u kojoj nema uzlaznog ili silaznog trenda ili je beznačajan:

Gdje je opći prosjek;

Metode za analizu glavnog trenda.

Na razvoj pojava tokom vremena utiču faktori različite prirode i jačine uticaja. Neki od njih su slučajne prirode, drugi imaju gotovo konstantan učinak i formiraju određeni trend razvoja u nizu dinamike.

Važan zadatak statistike je da identifikuje trend u nizu dinamike, oslobođen od dejstva različitih slučajnih faktora. U tu svrhu, vremenske serije se obrađuju metodama intervalnog uvećanja, pokretnog prosjeka i analitičkog poravnanja itd.

Metoda intervalnog grubljanja zasniva se na ukrupnjavanju vremenskih perioda, koji uključuju nivoe niza dinamike, tj. je zamjena podataka vezanih za male periode sa podacima iz većih perioda. Posebno je efikasan kada su početni nivoi serije za kratke vremenske periode. Na primjer, serije indikatora koji se odnose na dnevne događaje zamjenjuju se serijama koje se odnose na nedjeljne, mjesečne itd. To će se jasnije pokazati "Osovina razvoja fenomena". Prosjek, izračunat na osnovu uvećanih intervala, omogućava identifikaciju smjera i karaktera (ubrzanje ili usporavanje rasta) glavnog trenda razvoja.

metoda pokretnog prosjeka slično prethodnom, ali se u ovom slučaju stvarni nivoi zamjenjuju prosječnim nivoima izračunatim za sukcesivno pomicanje (klizanje) uvećanih intervala koji pokrivaju m nivoi redova.

Na primjer ako se prihvati m=3, zatim se prvo izračunava prosjek prva tri nivoa serije, zatim - od istog broja nivoa, ali počevši od drugog u nizu, zatim - počevši od trećeg, itd. Tako prosjek, takoreći, "klizi" nizom dinamike, krećući se za jedan period. Izračunato od mčlanovi pokretnih proseka odnose se na sredinu (centar) svakog intervala.

Ova metoda eliminira samo slučajne fluktuacije. Ako serija ima sezonski val, on će ostati nakon izravnavanja metodom pokretnog prosjeka.

Analitičko usklađivanje. Da bi se eliminisale nasumične fluktuacije i identifikovao trend, nivoi serije se usklađuju prema analitičkim formulama (ili analitičkom poravnanju). Njegova suština je da se empirijski (stvarni) nivoi zameni teorijskim, koji se računaju prema određenoj jednačini, koja se uzima kao matematički model trenda, pri čemu se teorijski nivoi posmatraju kao funkcija vremena: . U ovom slučaju, svaki stvarni nivo se smatra zbirom dvije komponente: , gdje je sistematska komponenta i izražena određenom jednačinom, te je slučajna varijabla koja uzrokuje fluktuacije oko trenda.

Zadatak analitičkog usklađivanja je sljedeći:

1. Utvrđivanje na osnovu stvarnih podataka tipa hipotetičke funkcije koja na najprikladniji način odražava trend razvoja indikatora koji se proučava.

2. Pronalaženje parametara navedene funkcije (jednadžbe) iz empirijskih podataka

3. Proračun prema pronađenoj jednačini teorijskih (niveliranih) nivoa.

Izbor određene funkcije se po pravilu vrši na osnovu grafičkog prikaza empirijskih podataka.

Modeli su regresijske jednadžbe, čiji se parametri izračunavaju metodom najmanjih kvadrata

Ispod su najčešće korištene regresione jednadžbe za izravnavanje vremenskih serija, koje ukazuju na to koje razvojne trendove su najpogodnije za odraz.

Za pronalaženje parametara gornjih jednačina postoje posebni algoritmi i kompjuterski programi. Konkretno, za pronalaženje parametara jednačine prave linije može se koristiti sljedeći algoritam:

Ako se periodi ili trenuci vremena numerišu tako da se dobije St = 0, tada će se gornji algoritmi značajno pojednostaviti i pretvoriti u

Poravnani nivoi na grafikonu će se nalaziti na jednoj pravoj liniji koja prolazi na najbližoj udaljenosti od stvarnih nivoa ove dinamičke serije. Zbir kvadrata odstupanja je odraz uticaja slučajnih faktora.

Uz njegovu pomoć izračunavamo prosječnu (standardnu) grešku jednačine:

Ovdje je n broj zapažanja, a m broj parametara u jednačini (imamo ih dva - b 1 i b 0).

Glavni trend (trend) pokazuje kako sistematski faktori utiču na nivoe niza dinamike, a fluktuacija nivoa oko trenda () služi kao mjera uticaja rezidualnih faktora.

Za procjenu kvaliteta korištenog modela vremenske serije, također se koristi Fišerov F test. To je omjer dvije varijanse, odnosno omjer varijanse uzrokovane regresijom, tj. proučavanog faktora, na disperziju uzrokovanu slučajnim uzrocima, tj. rezidualna varijansa:

U proširenom obliku, formula za ovaj kriterij se može predstaviti na sljedeći način:

gdje je n broj opservacija, tj. broj nivoa redova,

m je broj parametara u jednadžbi, y je stvarni nivo serije,

Poravnani nivo reda, - prosječni nivo reda.

Uspješniji od drugih, model ne mora uvijek biti dovoljno zadovoljavajući. Ona se kao takva može prepoznati samo ako kriterij F za nju prelazi određenu kritičnu granicu. Ova granica je postavljena korištenjem F tablica raspodjele.

Suština i klasifikacija indeksa.

Indeks se u statistici shvata kao relativni indikator koji karakteriše promenu veličine neke pojave u vremenu, prostoru ili u poređenju sa bilo kojim standardom.

Glavni element indeksne relacije je indeksirana vrijednost. Indeksirana vrijednost se podrazumijeva kao vrijednost znaka statističke populacije, čija je promjena predmet proučavanja.

Indeksi služe tri glavne svrhe:

1) procena promena u složenoj pojavi;

2) utvrđivanje uticaja pojedinih faktora na promenu složene pojave;

3) poređenje veličine neke pojave sa veličinom proteklog perioda, veličinom druge teritorije, kao i sa standardima, planovima, prognozama.

Indeksi su klasifikovani prema 3 kriterijuma:

2) po stepenu obuhvata elemenata stanovništva;

3) metodama izračunavanja opštih indeksa.

Po sadržaju indeksiranih vrijednosti, indeksi se dijele na indekse kvantitativnih (volumetrijskih) indikatora i indekse kvalitativnih indikatora. Indeksi kvantitativnih indikatora - indeksi fizičkog obima industrijske proizvodnje, fizičkog obima prodaje, broja itd. Indeksi kvalitativnih indikatora - indeksi cijena, troškova, produktivnosti rada, prosječne plate i dr.

Prema stepenu obuhvata jedinica stanovništva, indeksi se dijele u dvije klase: pojedinačne i opšte. Da bismo ih okarakterizirali, uvodimo sljedeće konvencije usvojene u praksi primjene indeksne metode:

q- količina (volumen) bilo kojeg proizvoda u naturi ; R- jedinična cijena proizvodnje; z- jedinični trošak proizvodnje; t- vrijeme utrošeno na proizvodnju jedinice proizvoda (intenzitet rada) ; w- proizvodni učinak u vrijednosnom smislu po jedinici vremena; v- učinak u fizičkom smislu po jedinici vremena; T- ukupno utrošeno vrijeme ili broj zaposlenih.

Kako bi se razlikovalo kojem periodu ili objektu pripadaju indeksirane vrijednosti, uobičajeno je da se ispod odgovarajućeg simbola stavljaju indeksi u donjem desnom uglu. Tako se, na primjer, u indeksima dinamike, po pravilu, za upoređene (tekuće, izvještajne) periode koristi indeks 1, a za periode sa kojima se vrši poređenje,

Individualni indeksi služe za karakterizaciju promjene pojedinih elemenata složene pojave (na primjer, promjena obima proizvodnje jedne vrste proizvoda). Predstavljaju relativne vrijednosti dinamike, ispunjenja obaveza, poređenje indeksiranih vrijednosti.

Određuje se pojedinačni indeks fizičkog obima proizvodnje

Sa analitičke tačke gledišta, dati pojedinačni indeksi dinamike su slični koeficijentima (stopama) rasta i karakterišu promjenu indeksirane vrijednosti u tekućem periodu u odnosu na bazni, odnosno pokazuju koliko je puta povećana (smanjena). ) ili koliko posto je to rast (smanjenje). Vrijednosti indeksa su izražene u koeficijentima ili procentima.

Opšti (kompozitni) indeks odražava promjenu u svim elementima kompleksne pojave.

Agregatni indeks je osnovni oblik indeksa. Zove se agregat jer su njegov brojilac i nazivnik skup "agregata"

Prosječni indeksi, njihova definicija.

Pored agregatnih indeksa, u statistici se koristi još jedan njihov oblik - indeksi ponderisanog prosjeka. Njihovom izračunavanju se pribjegava kada dostupne informacije ne dozvoljavaju izračunavanje opšteg agregatnog indeksa. Dakle, ako ne postoje podaci o cijenama, ali postoje podaci o cijeni proizvoda u tekućem periodu i poznati su pojedinačni indeksi cijena za svaki proizvod, onda se opći indeks cijena ne može odrediti kao zbirni, ali je moguće da ga izračunamo kao prosek pojedinačnih. Na isti način, ako nisu poznate količine pojedinačnih proizvedenih proizvoda, ali su poznati pojedinačni indeksi i troškovi proizvodnje baznog perioda, onda se ukupni indeks fizičkog obima proizvodnje može odrediti kao ponderisani prosjek.

Prosječni indeks - ovo je indeks izračunat kao prosjek pojedinačnih indeksa. Zbirni indeks je osnovni oblik opšteg indeksa, tako da prosječni indeks mora biti identičan agregatnom indeksu. Prilikom izračunavanja prosječnih indeksa koriste se dva oblika prosjeka: aritmetički i harmonijski.

Indeks aritmetičke sredine je identičan zbirnom indeksu ako su ponderi pojedinačnih indeksa izrazi nazivnika zbirnog indeksa. Samo u ovom slučaju vrijednost indeksa izračunata formulom aritmetičke sredine bit će jednaka zbirnom indeksu.

Iz Wikipedije, slobodne enciklopedije

standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, standardna devijacija; povezani pojmovi: standardna devijacija, standardni namaz) - u teoriji vjerojatnosti i statistici, najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njeno matematičko očekivanje. Uz ograničene nizove uzoraka vrijednosti, umjesto matematičkog očekivanja, koristi se aritmetička sredina populacije uzoraka.

Osnovne informacije

Standardna devijacija se mjeri u jedinicama same slučajne varijable i koristi se pri izračunavanju standardne greške aritmetičke sredine, pri konstruiranju intervala povjerenja, pri statističkom testiranju hipoteza, pri mjerenju linearne veze između slučajnih varijabli. Definira se kao kvadratni korijen varijanse slučajne varijable.

Standardna devijacija:

\sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\left(x_i-\bar(x)\desno)^2).

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na njegovo matematičko očekivanje zasnovano na nepristrasnoj procjeni njegove varijanse) s:

s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\left(x_i-\bar (x)\desno)^2);

tri sigma pravilo

tri sigma pravilo (3\sigma) - gotovo sve vrijednosti normalno raspoređene slučajne varijable leže u intervalu \levo(\bar(x)-3\sigma;\bar(x)+3\sigma\desno). Strožije - otprilike sa vjerovatnoćom od 0,9973 vrijednost normalno raspoređene slučajne varijable leži u navedenom intervalu (pod uvjetom da vrijednost \bar(x) istina, a ne dobijena kao rezultat obrade uzorka).

Ako je prava vrijednost \bar(x) nepoznato, onda biste trebali koristiti \sigma, a s. Tako se pravilo tri sigma pretvara u pravilo tri s .

Tumačenje vrijednosti standardne devijacije

Veća vrijednost standardne devijacije ukazuje na veće širenje vrijednosti u prikazanom skupu sa srednjom vrijednosti skupa; manja vrijednost, odnosno, označava da su vrijednosti u skupu grupisane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti 7 i standardne devijacije 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupisane oko srednje vrijednosti; prvi set ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U opštem smislu, standardna devijacija se može smatrati mjerom neizvjesnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje greške serije uzastopnih mjerenja neke veličine. Ova vrijednost je vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u poređenju sa vrijednošću predviđenom teorijom: ako je srednja vrijednost mjerenja vrlo različita od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobijene vrijednosti ili način njihovog dobijanja treba ponovo provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućava da procijenite koliko se vrijednosti iz skupa mogu razlikovati od prosječne vrijednosti.

Ekonomija i finansije

Standardna devijacija prinosa portfelja \sigma =\sqrt(D[X]) identifikuje se sa rizikom portfelja.

Klima

Pretpostavimo da postoje dva grada sa istom prosječnom maksimalnom dnevnom temperaturom, ali jedan se nalazi na obali, a drugi u ravnici. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u primorskom gradu biti manja nego u drugom gradu, uprkos činjenici da imaju istu prosječnu vrijednost ove vrijednosti, što u praksi znači da je vjerovatnoća da će maksimalna temperatura zraka od svaki određeni dan u godini će biti jači razlikuje se od prosječne vrijednosti, veći za grad koji se nalazi unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko fudbalskih timova koji su rangirani prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, šansi za pogodak itd. Najvjerovatnije je da će najbolji tim u ovoj grupi imati najbolje vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su izbalansirani. S druge strane, tim sa velikom standardnom devijacijom teško može predvidjeti rezultat, što se pak objašnjava neravnotežom, na primjer, jakom odbranom, ali slabim napadom.

Upotreba standardne devijacije parametara tima omogućava da se donekle predvidi rezultat utakmice između dva tima, procjenjujući snage i slabosti timova, a time i odabrane metode borbe.

vidi takođe

Napišite recenziju na članak "Standardna devijacija"

Književnost

  • Borovikov V. STATISTIKA. Umetnost kompjuterske analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1..

Izvod koji karakteriše standardnu ​​devijaciju

I, brzo otvorivši vrata, odlučnim koracima izađe na balkon. Razgovor je iznenada prestao, kape i kape su skinute, a sve su oči uprte u grofa koji je izašao.
- Zdravo momci! reče grof brzo i glasno. - Hvala vam što ste došli. Izaći ću vam sada, ali prije svega moramo se obračunati sa zlikovcem. Moramo kazniti zlikovca koji je ubio Moskvu. Čekaj me! - I grof se isto tako brzo vratio u odaje, snažno zalupivši vratima.
Gomilom je prostrujao žamor odobravanja. „On će, dakle, kontrolisati upotrebu zlikovaca! A ti kažeš Francuz ... on će ti odvezati cijelu distancu! govorili su ljudi, kao da su jedni drugima predbacivali nedostatak vjere.
Nekoliko minuta kasnije jedan oficir je požurio kroz ulazna vrata, naredio nešto, a draguni su se ispružili. Gomila je pohlepno prešla sa balkona na trijem. Izašavši na trem ljutitim brzim koracima, Rostopčin se žurno osvrne oko sebe, kao da nekoga traži.
- Gdje je on? - rekao je grof i u istom trenutku dok je to rekao ugledao je iza ugla kuće kako između dva dragona izlazi mladić dugog, tankog vrata, poluobrijane i obrijane glave. Ovaj mladić je bio odjeven u nekadašnji elegantan, plavo odjeven, otrcani kaput od lisičje kože i u prljave, iz prve ruke zatvoreničke pantalone, nabijene u neočišćene, iznošene tanke čizme. Okovi su visili na tankim, slabim nogama, što je otežavalo mladićev neodlučni hod.
- ALI! - reče Rostopčin, žurno skrećući pogled sa mladića u lisičjem kaputu i pokazujući na donju stepenicu trema. - Stavi to ovde! Mladić je, zveckajući okovima, teško zakoračio na naznačenu stepenicu, držeći prstom pritisnutu kragnu ovčjeg kaputa, dvaput okrenuo dugi vrat i, uzdahnuvši, sklopio svoje tanke, neradne ruke ispred stomaka sa pokorni gest.
Nekoliko sekundi zavladala je tišina dok se mladić smjestio na stepenicu. Samo u zadnjim redovima ljudi koji su se stisnuli na jedno mjesto, čulo se stenjanje, stenjanje, trzaji i zveket preuređenih nogu.
Rostopčin je, čekajući da se zaustavi na naznačenom mestu, namrgođeno protrljao lice rukom.
- Momci! - rekao je Rostopčin metalnim glasom, - ovaj čovek, Vereščagin, je isti nitkov od kojeg je umrla Moskva.
Mladić u kaputu od lisice stajao je u pokornoj pozi, sklopljenih ruku ispred stomaka i blago pognutih. Mršavo, beznadežnog izraza lica, unakaženo obrijanom glavom, njegovo mlado lice bilo je spušteno. Na prve grofove riječi, polako je podigao glavu i spustio pogled na grofa, kao da mu želi nešto reći ili barem susresti njegov pogled. Ali Rostopčin ga nije pogledao. Na dugom, tankom vratu mladića, poput užeta, vena iza uha se napela i pomodrila, a lice mu je odjednom pocrvenelo.
Sve oči bile su uprte u njega. Pogledao je gomilu i, kao umiren izrazom koji je čitao na licima ljudi, tužno se i bojažljivo nasmiješio, i ponovo spustivši glavu, ispravio noge na stepeništu.
„Izdao je svog cara i otadžbinu, predao se Bonaparti, on je jedini od svih Rusa obeščastio ime Rusa, a Moskva umire od njega“, rekao je Rastopčin ujednačenim, oštrim glasom; ali odjednom je brzo spustio pogled na Vereščagina, koji je i dalje stajao u istoj pokornoj pozi. Kao da ga je ovaj pogled razneo, on je, podižući ruku, umalo viknuo, okrenuvši se ka narodu: - Pozabavite se njim svojim sudom! Dajem ti ga!
Narod je ćutao i samo je sve jače pritiskao jedni druge. Držati jedno drugo, udisati ovu zaraženu blizinu, nemati snage da se pomerimo i čekati nešto nepoznato, neshvatljivo i strašno postalo je nepodnošljivo. Ljudi koji su stajali u prvim redovima, koji su vidjeli i čuli sve što se događa ispred njih, svi uplašenih širom otvorenih očiju i razjapljenih usta, naprežući se svom snagom, držali su pritisak zadnjih na leđima.
- Prebijte ga!.. Neka izdajnik umre i ne sramotite ime Rusa! viknuo je Rastopčin. - Ruby! naručujem! - Čuvši ne riječi, već ljutite zvuke Rostopčinovog glasa, gomila je zastenjala i krenula naprijed, ali opet zastala.
- Grofe!.. - reče Vereščaginov plašljiv i istovremeno teatralni glas usred kratkotrajne tišine. "Grofe, jedan bog je iznad nas...", rekao je Vereščagin, podigavši ​​glavu, i opet se gusta vena na njegovom tankom vratu napunila krvlju, a boja je brzo izašla i pobjegla s lica. Nije završio ono što je hteo da kaže.
- Presjeci ga! Naređujem!.. - viknu Rostopčin, iznenada probledeći kao Vereščagin.
- Sablje napolje! viknuo je oficir dragunima i sam izvukao sablju.
Još jedan još jači val nadvio se kroz ljude, i, došavši do prvih redova, ovaj talas pomakne prednje, teturajući, dovede ih do samih stepenica trema. Visok momak, skamenjenog izraza lica i sa zaustavljenom podignutom rukom, stajao je pored Vereščagina.
- Ruby! umalo šapnu jedan oficir dragunima, a jedan od vojnika iznenada, iskrivljenog lica gneva, udari Vereščagina po glavi tupim mačem.
"ALI!" - kratko i iznenađeno poviče Vereščagin, uplašeno se osvrćući oko sebe i kao da ne shvata zašto mu je to učinjeno. Isti jecaj iznenađenja i užasa prošao je kroz gomilu.
"O moj boze!" - začu se nečiji tužan uzvik.
Ali nakon uzvika iznenađenja koji je pobjegao od Vereščagina, on je žalosno povikao od bola, i ovaj ga je krik upropastio. Ta barijera ljudskog osećanja, do najvećeg stepena rastegnuta, koja je još uvek držala gomilu, probila se istog trenutka. Zločin je započet, trebalo ga je dovršiti. Žalosni jecaj prijekora bio je ugušen strašnim i ljutitim urlanjem gomile. Poput poslednjeg sedmog talasa koji lomi brodove, i ovaj poslednji nezaustavljivi talas se uzdigao iz zadnjih redova, stigao do prednjih, oborio ih i progutao sve. Zmaj koji je udario htio je ponoviti svoj udarac. Vereščagin je uz krik užasa, štiteći se rukama, pojurio prema ljudima. Visoki momak, na kojeg je nabasao, uhvatio je rukama Vereščaginov mršav vrat i uz divlji krik, zajedno s njim, pao pod noge urlajućeg naroda koji se nagomilao.
Neki su tukli i kidali Vereščagina, drugi su bili visoki momci. A povici shrvanih ljudi i onih koji su pokušali da spasu visokog čoveka samo su izazvali bijes gomile. Dugo vremena zmajevi nisu mogli osloboditi krvavog, na smrt pretučenog radnika fabrike. I dugo vremena, i pored sve grozničave žurbe kojom je gomila pokušavala da dovrši posao jednom započet, oni ljudi koji su tukli, davili i kidali Vereščagina nisu mogli da ga ubiju; ali gomila ih je zgnječila sa svih strana, sa njima u sredini, kao jedna masa, ljuljala se s jedne strane na drugu i nije im dala priliku da ga dokrajče ili ostave.