Biografije Karakteristike Analiza

Kvadrat standardne devijacije. Disperzija

Mudri matematičari i statističari došli su do pouzdanijeg pokazatelja, ali za nešto drugačiju svrhu - srednje linearno odstupanje. Ovaj pokazatelj karakterizira mjeru širenja vrijednosti skupa podataka oko njihove prosječne vrijednosti.

Kako biste pokazali mjeru širenja podataka, prvo morate odrediti u odnosu na što će se to širenje smatrati - obično je to prosječna vrijednost. Zatim morate izračunati koliko su vrijednosti analiziranog skupa podataka daleko od prosjeka. Jasno je da svaka vrijednost odgovara određenom iznosu odstupanja, ali nas zanima i opća procjena koja pokriva cijelu populaciju. Stoga se prosječno odstupanje izračunava pomoću formule uobičajene aritmetičke sredine. Ali! Ali da bi se izračunao prosjek odstupanja, prvo ih je potrebno zbrojiti. A ako zbrojimo pozitivne i negativne brojeve, oni će se međusobno poništiti i njihov će zbroj težiti nuli. Da bi se to izbjeglo, sva odstupanja se uzimaju modulo, odnosno svi negativni brojevi postaju pozitivni. Sada će prosječno odstupanje pokazati generaliziranu mjeru širenja vrijednosti. Kao rezultat toga, prosječno linearno odstupanje izračunat će se formulom:

a je prosječno linearno odstupanje,

x- analizirani pokazatelj, s crticom na vrhu - prosječna vrijednost pokazatelja,

n je broj vrijednosti u analiziranom skupu podataka,

operator zbrajanja, nadam se, nikoga ne plaši.

Prosječno linearno odstupanje izračunato pomoću navedene formule odražava prosječno apsolutno odstupanje od prosječne vrijednosti za ovu populaciju.

Crvena linija na slici je prosječna vrijednost. Odstupanja svakog opažanja od srednje vrijednosti označena su malim strelicama. Uzimaju se po modulu i zbrajaju. Zatim se sve podijeli s brojem vrijednosti.

Za potpunu sliku potrebno je navesti još jedan primjer. Recimo da postoji tvrtka koja proizvodi reznice za lopate. Svaka reznica treba biti dugačka 1,5 metar, ali što je još važnije, sve trebaju biti jednake ili barem plus-minus 5 cm, ali će nemarni radnici odrezati 1,2 m, pa 1,8 m. . Direktor tvrtke odlučio je provesti statističku analizu duljine reznica. Odabrao sam 10 komada i izmjerio njihovu duljinu, pronašao prosjek i izračunao prosječno linearno odstupanje. Prosjek se pokazao taman - 1,5 m. Ali prosječno linearno odstupanje pokazalo se 0,16 m. Dakle, ispada da je svaki rez duži ili kraći nego što je potrebno u prosjeku za 16 cm. Ima o čemu razgovarati s radnicima. Zapravo, nisam vidio stvarnu upotrebu ovog indikatora, pa sam sam smislio primjer. Međutim, postoji takav pokazatelj u statistici.

Disperzija

Kao i srednje linearno odstupanje, varijanca također odražava opseg u kojem se podaci šire oko srednje vrijednosti.

Formula za izračun varijance izgleda ovako:

(za serije varijacija (ponderirana varijanca))

(za negrupirane podatke (jednostavna varijanca))

Gdje je: σ 2 - disperzija, Xi– analiziramo sq indikator (vrijednost značajke), – prosječnu vrijednost indikatora, f i – broj vrijednosti u analiziranom skupu podataka.

Varijanca je srednji kvadrat odstupanja.

Prvo se izračuna srednja vrijednost, zatim se razlika između svake osnovne vrijednosti i srednje vrijednosti uzima, kvadrira, množi učestalošću odgovarajuće vrijednosti obilježja, dodaje i zatim dijeli s brojem vrijednosti u populaciji.

Međutim, u svom čistom obliku, kao što je, na primjer, aritmetička sredina ili indeks, disperzija se ne koristi. To je više pomoćni i posredni pokazatelj koji se koristi za druge vrste statističkih analiza.

Pojednostavljeni način izračuna varijance

standardna devijacija

Da bi se varijanca koristila za analizu podataka, iz nje se vadi kvadratni korijen. Ispada tzv standardna devijacija.

Usput, standardna devijacija se također naziva sigma - od grčkog slova koje je označava.

Standardna devijacija očito također karakterizira mjeru disperzije podataka, ali se sada (za razliku od disperzije) može usporediti s izvornim podacima. Srednjekvadratni pokazatelji u statistici u pravilu daju točnije rezultate od linearnih. Stoga je standardna devijacija točnija mjera raspršenosti podataka od srednje linearne devijacije.

Kod statističkog testiranja hipoteza, kod mjerenja linearnog odnosa između slučajnih varijabli.

Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable Pod, zidovi oko nas i strop, x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je - varijanca; - Pod, zidovi oko nas i strop, ja-th element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

pravilo tri sigme

pravilo tri sigme() - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu . Strože rečeno – s ne manjom sigurnošću od 99,7%, vrijednost normalno distribuirane slučajne varijable leži u navedenom intervalu (pod uvjetom da je vrijednost istinita, a ne dobivena kao rezultat obrade uzorka).

Ako je prava vrijednost nepoznata, onda ne treba koristiti, nego pod, zidove oko nas i strop, s. Tako se pravilo tri sigme prevodi u pravilo tri poda, zidova oko nas i stropa, s .

Tumačenje vrijednosti standardne devijacije

Velika vrijednost standardne devijacije pokazuje veliki raspon vrijednosti u prikazanom skupu s prosječnom vrijednošću skupa; mala vrijednost, odnosno, označava da su vrijednosti u skupu grupirane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti od 7 i standardne devijacije od 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupirane oko prosjeka; prvi skup ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se srednja vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobivene vrijednosti ili način njihova dobivanja treba ponovno provjeriti.

Praktična upotreba

U praksi, standardna devijacija vam omogućuje da odredite koliko se vrijednosti u skupu mogu razlikovati od prosječne vrijednosti.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom dnevnom maksimalnom temperaturom, ali se jedan nalazi na obali, a drugi u unutrašnjosti. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u obalnom gradu biti manja nego u drugom gradu, unatoč tome što imaju istu prosječnu vrijednost te vrijednosti, što u praksi znači da je vjerojatnost da maksimalna temperatura zraka od svaki pojedini dan u godini će se jače razlikovati od prosječne vrijednosti, više za grad unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje su rangirane prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, prilikama za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati najbolje vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su uravnoteženiji. S druge strane, momčad s velikom standardnom devijacijom teško može predvidjeti rezultat, što se pak objašnjava neravnotežom, primjerice, jaka obrana, ali slab napad.

Korištenje standardne devijacije parametara momčadi omogućuje do neke mjere predviđanje rezultata utakmice između dvije momčadi, procjenjujući snage i slabosti momčadi, a time i odabrane metode borbe.

Tehnička analiza

vidi također

Književnost

* Borovikov, V. STATISTIKA. Umjetnost računalne analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1.

U ovom ću članku govoriti o kako pronaći standardnu ​​devijaciju. Ovaj materijal je izuzetno važan za potpuno razumijevanje matematike, tako da nastavnik matematike treba posvetiti zasebnu lekciju ili čak nekoliko za njegovo proučavanje. U ovom ćete članku pronaći poveznicu na detaljan i razumljiv video vodič koji objašnjava što je standardna devijacija i kako je pronaći.

standardna devijacija omogućuje procjenu raspona vrijednosti dobivenih kao rezultat mjerenja određenog parametra. Označava se simbolom (grčko slovo "sigma").

Formula za izračun je prilično jednostavna. Da biste pronašli standardnu ​​devijaciju, trebate izvaditi kvadratni korijen varijance. Dakle, sada morate pitati: "Što je varijanca?"

Što je disperzija

Definicija varijance je sljedeća. Disperzija je aritmetička sredina kvadrata odstupanja vrijednosti od sredine.

Da biste pronašli varijancu, izvršite sljedeće izračune uzastopno:

  • Odredite srednju vrijednost (jednostavnu aritmetičku sredinu niza vrijednosti).
  • Zatim od svake vrijednosti oduzmite prosjek i kvadrirajte dobivenu razliku (dobili smo razlika na kvadrat).
  • Sljedeći korak je izračunavanje aritmetičke sredine kvadrata dobivenih razlika (zašto su točno kvadrati možete saznati u nastavku).

Pogledajmo primjer. Recimo da vi i vaši prijatelji odlučite izmjeriti visinu svojih pasa (u milimetrima). Kao rezultat mjerenja dobili ste sljedeće mjere visine (u grebenu): 600 mm, 470 mm, 170 mm, 430 mm i 300 mm.

Izračunajmo srednju vrijednost, varijancu i standardnu ​​devijaciju.

Prvo pronađimo prosjek. Kao što već znate, za ovo morate zbrojiti sve izmjerene vrijednosti i podijeliti s brojem mjerenja. Napredak izračuna:

Prosječni mm.

Dakle, prosjek (aritmetička sredina) je 394 mm.

Sada moramo definirati odstupanje visine svakog od pasa od prosjeka:

Konačno, za izračunavanje varijance, svaku od dobivenih razlika kvadriramo, a zatim nalazimo aritmetičku sredinu dobivenih rezultata:

Raspršenost mm 2 .

Dakle, disperzija je 21704 mm 2 .

Kako pronaći standardnu ​​devijaciju

Pa kako sada izračunati standardnu ​​devijaciju, znajući varijancu? Kao što se sjećamo, izvucite kvadratni korijen. Odnosno, standardna devijacija je:

mm (zaokruženo na najbliži cijeli broj u mm).

Koristeći ovu metodu, otkrili smo da su neki psi (npr. rotvajleri) vrlo veliki psi. Ali postoje i vrlo mali psi (na primjer, jazavčari, ali im to ne biste trebali reći).

Najzanimljivije je to što standardna devijacija nosi korisnu informaciju. Sada možemo pokazati koji su od dobivenih rezultata mjerenja rasta unutar intervala koji dobijemo ako od prosjeka (s obje njegove strane) izdvojimo standardnu ​​devijaciju.

Odnosno, koristeći standardnu ​​devijaciju, dobivamo "standardnu" metodu koja vam omogućuje da saznate koja je od vrijednosti normalna (statistički prosjek), a koja je izuzetno velika ili, obrnuto, mala.

Što je standardna devijacija

Ali ... stvari će biti malo drugačije ako analiziramo uzorkovanje podaci. U našem smo primjeru razmotrili općoj populaciji. Odnosno, naših 5 pasa bili su jedini psi na svijetu koji su nas zanimali.

Ali ako su podaci uzorak (vrijednosti odabrane iz velike populacije), tada se izračuni moraju napraviti drugačije.

Ako postoje vrijednosti, tada:

Svi ostali izračuni rade se na isti način, uključujući i određivanje prosjeka.

Na primjer, ako je naših pet pasa samo uzorak populacije pasa (svi psi na planetu), moramo podijeliti s 4 umjesto 5 naime:

Varijanca uzorka = mm 2 .

U ovom slučaju, standardna devijacija za uzorak jednaka je mm (zaokruženo na najbliži cijeli broj).

Možemo reći da smo napravili neke "ispravke" u slučaju kada su naše vrijednosti samo mali uzorak.

Bilješka. Zašto baš kvadrati razlika?

Ali zašto uzimamo kvadrate razlika kada računamo varijancu? Priznajmo da ste pri mjerenju nekog parametra dobili sljedeći skup vrijednosti: 4; četiri; - četiri; - četiri. Ako samo zbrojimo apsolutna odstupanja od srednje (razlike) među sobom ... negativne vrijednosti se poništavaju s pozitivnima:

.

Ispostavilo se da je ova opcija beskorisna. Onda možda vrijedi isprobati apsolutne vrijednosti odstupanja (odnosno module tih vrijednosti)?

Na prvi pogled, ispada da nije loše (rezultirajuća vrijednost, usput, naziva se srednja apsolutna devijacija), ali ne u svim slučajevima. Pokušajmo s drugim primjerom. Neka rezultat mjerenja bude sljedeći skup vrijednosti: 7; jedan; -6; -2. Tada je srednja apsolutna devijacija:

kvragu! Ponovno smo dobili rezultat 4, iako su razlike znatno veće.

Pogledajmo sada što se događa ako kvadriramo razlike (a zatim izvadimo kvadratni korijen njihovog zbroja).

Za prvi primjer dobivate:

.

Za drugi primjer dobivate:

Sada je to sasvim druga stvar! Srednjekvadratno odstupanje je to veće što su razlike veće... čemu smo težili.

Zapravo, ova metoda koristi istu ideju kao kod izračuna udaljenosti između točaka, samo primijenjenu na drugačiji način.

A s matematičkog gledišta, korištenje kvadrata i kvadratnog korijena korisnije je nego što bismo mogli dobiti na temelju apsolutnih vrijednosti odstupanja, zbog čega je standardna devijacija primjenjiva na druge matematičke probleme.

Sergey Valerievich vam je rekao kako pronaći standardnu ​​devijaciju

Najsavršenija karakteristika varijacije je standardna devijacija, koja se naziva standard (ili standardna devijacija). Standardna devijacija() jednak je kvadratnom korijenu srednje kvadratne vrijednosti odstupanja pojedinih vrijednosti obilježja od aritmetičke sredine:

Standardna devijacija je jednostavna:

Ponderirana standardna devijacija primjenjuje se za grupirane podatke:

Između srednje kvadratne i srednje linearne devijacije u uvjetima normalne distribucije postoji odnos: ~ 1,25.

Standardna devijacija, kao glavna apsolutna mjera varijacije, koristi se u određivanju vrijednosti ordinata krivulje normalne distribucije, u proračunima koji se odnose na organizaciju promatranja uzorka i utvrđivanje točnosti karakteristika uzorka, kao iu procjena granica varijacije svojstva u homogenoj populaciji.

Disperzija, njezine vrste, standardna devijacija.

Varijanca slučajne varijable- mjera širenja dane slučajne varijable, tj. njezino odstupanje od matematičkog očekivanja. U statistici se često koristi oznaka ili. Kvadratni korijen varijance naziva se standardna devijacija, standardna devijacija ili standardna širina.

Ukupna varijanca (σ2) mjeri varijaciju svojstva u cijeloj populaciji pod utjecajem svih čimbenika koji su uzrokovali tu varijaciju. Istovremeno, zahvaljujući metodi grupiranja, moguće je izolirati i izmjeriti varijaciju zbog značajke grupiranja, te varijaciju koja nastaje pod utjecajem neuračunatih čimbenika.

Međugrupna varijanca (σ 2 m.gr) karakterizira sustavnu varijaciju, tj. razlike u veličini proučavanog svojstva koje nastaju pod utjecajem svojstva - faktora koji je u osnovi grupiranja.

standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, standardna devijacija; slični pojmovi: standardna devijacija, standardno širenje) - u teoriji vjerojatnosti i statistici najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njezino matematičko očekivanje. Kod ograničenih nizova uzoraka vrijednosti umjesto matematičkog očekivanja koristi se aritmetička sredina skupa uzoraka.

Standardna devijacija se mjeri u jedinicama same slučajne varijable i koristi se u izračunavanju standardne pogreške aritmetičke sredine, u konstruiranju intervala pouzdanosti, u statističkom testiranju hipoteza i u mjerenju linearnog odnosa između slučajnih varijabli. Definira se kao kvadratni korijen varijance slučajne varijable.


Standardna devijacija:

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance):

gdje je disperzija; — ja-th element uzorka; - veličina uzorka; - aritmetička sredina uzorka:

Treba napomenuti da su obje procjene pristrane. U općem slučaju nemoguće je konstruirati nepristranu procjenu. Međutim, procjena temeljena na nepristranoj procjeni varijance je dosljedna.

Bit, opseg i postupak određivanja modusa i medijana.

Osim potencijskih prosjeka u statistici, za relativnu karakteristiku veličine varirajućeg svojstva i unutarnje strukture serija distribucije koriste se strukturni prosjeci, koji su uglavnom predstavljeni način i medijan.

Moda- Ovo je najčešća varijanta serije. Moda se koristi, primjerice, u određivanju veličine odjeće, obuće, za kojima su kupci najtraženiji. Način rada za diskretnu seriju je varijanta s najvećom frekvencijom. Prilikom izračunavanja moda za seriju varijacija intervala, prvo morate odrediti modalni interval (po maksimalnoj frekvenciji), a zatim vrijednost modalne vrijednosti atributa prema formuli:

- - modna vrijednost

- - donja granica modalnog intervala

- - vrijednost intervala

- - frekvencija modalnog intervala

- - frekvencija intervala koji prethodi modalnom

- - frekvencija intervala koji slijedi nakon modala

Medijan - ovo je vrijednost značajke koja je u osnovi rangirane serije i dijeli ovu seriju na dva jednaka dijela.

Da biste odredili medijan u diskretnom nizu u prisutnosti frekvencija, prvo izračunajte poluzbroj frekvencija, a zatim odredite koja vrijednost varijante pada na njega. (Ako sortirani redak sadrži neparan broj značajki, tada se srednji broj izračunava formulom:

M e \u003d (n (broj značajki u agregatu) + 1) / 2,

u slučaju parnog broja obilježja, medijan će biti jednak prosjeku dvaju obilježja u sredini reda).

Pri proračunu medijani za niz intervalnih varijacija najprije odredite interval medijana unutar kojeg se medijan nalazi, a zatim vrijednost medijana prema formuli:

- je željeni medijan

- je donja granica intervala koji sadrži medijan

- - vrijednost intervala

- - zbroj učestalosti ili broj članova niza

Zbroj akumuliranih frekvencija intervala koji prethode medijanu

- je frekvencija srednjeg intervala

Primjer. Pronađite modus i medijan.

Riješenje:
U ovom primjeru modalni interval je unutar dobne skupine od 25-30 godina, budući da ovaj interval ima najveću učestalost (1054).

Izračunajmo vrijednost moda:

To znači da je modalna dob učenika 27 godina.

Izračunajte medijan. Interval medijana je u dobnoj skupini od 25-30 godina, jer unutar ovog intervala postoji varijanta koja populaciju dijeli na dva jednaka dijela (Σf i /2 = 3462/2 = 1731). Zatim zamijenimo potrebne numeričke podatke u formulu i dobijemo vrijednost medijana:

To znači da je polovica studenata mlađa od 27,4 godine, a druga polovica starija od 27,4 godine.

Osim modusa i medijana, mogu se koristiti indikatori kao što su kvartili, koji dijele rangirani niz na 4 jednaka dijela, decili- 10 dijelova i percentila - na 100 dijelova.

Pojam selektivnog promatranja i njegov opseg.

Selektivno promatranje primjenjuje se pri primjeni kontinuiranog promatranja fizički nemoguće zbog velike količine podataka ili ekonomski nepraktično. Fizička nemogućnost javlja se, primjerice, pri proučavanju protoka putnika, tržišnih cijena, obiteljskih proračuna. Ekonomska nesvrsishodnost javlja se pri procjeni kvalitete robe povezane s njihovim uništenjem, na primjer, kušanjem, ispitivanjem opeke na čvrstoću itd.

Statističke jedinice odabrane za promatranje čine uzorak ili uzorak, a cijeli njihov niz - opću populaciju (GS). U ovom slučaju, broj jedinica u uzorku označava n, au cijelom HS - N. Stav n/N naziva se relativna veličina ili udio uzorka.

Kvaliteta rezultata uzorkovanja ovisi o reprezentativnosti uzorka, odnosno koliko je reprezentativan u HS-u. Da bi se osigurala reprezentativnost uzorka, potrebno je promatrati princip slučajnog odabira jedinica, što pretpostavlja da na uključivanje HS jedinice u uzorak ne može utjecati niti jedan drugi čimbenik osim slučajnosti.

postoji 4 načina slučajnog odabira uzorkovati:

  1. Zapravo nasumično selekcija ili "metoda lutrije", kada se statističkim vrijednostima, upisanim na određene objekte (primjerice, bačve), dodjeljuju serijski brojevi, koji se zatim miješaju u nekoj posudi (primjerice u vrećici) i nasumično biraju. U praksi se ova metoda provodi pomoću generatora slučajnih brojeva ili matematičkih tablica slučajnih brojeva.
  2. Mehanički izbor, prema kojem svaki ( N/n)-tu vrijednost opće populacije. Na primjer, ako sadrži 100 000 vrijednosti, a vi želite odabrati 1000, tada će svaka 100 000 / 1000 = 100. vrijednost pasti u uzorak. Štoviše, ako nisu rangirani, tada se prvi odabire nasumično od prvih sto, a brojevi ostalih bit će sto veći. Na primjer, ako je jedinica broj 19 bila prva, onda bi broj 119 trebao biti sljedeći, zatim broj 219, zatim broj 319, i tako dalje. Ako su jedinice populacije rangirane, prvo se odabire #50, zatim #150, zatim #250 i tako dalje.
  3. Izvodi se odabir vrijednosti iz heterogenog niza podataka stratificiran(stratificirana) metoda, kada se opća populacija prethodno podijeli u homogene skupine, na koje se primjenjuje slučajna ili mehanička selekcija.
  4. Posebna metoda uzorkovanja je serijski selekcija, pri kojoj se ne biraju slučajno ili mehanički pojedinačne veličine, već njihove serije (nizovi od nekog broja do nekih u nizu), unutar kojih se provodi kontinuirano promatranje.

Kvaliteta promatranja uzorka također ovisi o vrsta uzorkovanja: ponovljeno ili neponavljajuće.

Na ponovni odabir statističke vrijednosti ili njihove serije koje su ušle u uzorak vraćaju se općoj populaciji nakon upotrebe, imajući priliku ući u novi uzorak. Istodobno, sve vrijednosti opće populacije imaju jednaku vjerojatnost da budu uključene u uzorak.

Odabir koji se ne ponavlja znači da se statističke vrijednosti ili njihove serije uključene u uzorak ne vraćaju općoj populaciji nakon upotrebe, pa se stoga povećava vjerojatnost ulaska u sljedeći uzorak za preostale vrijednosti potonjeg.

Uzorkovanje koje se ne ponavlja daje točnije rezultate, pa se češće koristi. Ali postoje situacije kada se ne može primijeniti (proučavanje tokova putnika, potražnje potrošača itd.) i tada se provodi ponovni odabir.

Granična pogreška uzorka promatranja, prosječna pogreška uzorka, redoslijed kojim su izračunate.

Razmotrimo detaljno gore navedene metode formiranja uzorka populacije i pogreške koje se pojavljuju u ovom slučaju. reprezentativnost .
Zapravo-nasumično uzorak se temelji na slučajnom odabiru jedinica iz opće populacije bez ikakvih elemenata dosljednosti. Tehnički, pravilan slučajni odabir provodi se izvlačenjem ždrijeba (na primjer, lutrija) ili pomoću tablice slučajnih brojeva.

Stvarno-slučajni odabir "u svom čistom obliku" u praksi selektivnog promatranja rijetko se koristi, ali je početni među ostalim vrstama odabira, njime se implementiraju temeljna načela selektivnog promatranja. Razmotrimo neka pitanja teorije metode uzorkovanja i formule pogreške za jednostavan slučajni uzorak.

Pogreška uzorkovanja- to je razlika između vrijednosti parametra u općoj populaciji i njegove vrijednosti izračunate iz rezultata promatranja uzorka. Za prosječno kvantitativno obilježje, pogreška uzorkovanja određena je

Pokazatelj se naziva granična pogreška uzorkovanja.
Prosječna vrijednost uzorka je slučajna varijabla koja može poprimiti različite vrijednosti ovisno o tome koje su jedinice u uzorku. Stoga su greške uzorkovanja također slučajne varijable i mogu poprimiti različite vrijednosti. Stoga odredite prosjek mogućih pogrešaka - srednja pogreška uzorkovanja, što ovisi o:

Veličina uzorka: što je veći broj, to je manja prosječna pogreška;

Stupanj promjene proučavanog svojstva: što je manja varijacija svojstva, a time i varijanca, to je manja prosječna pogreška uzorkovanja.

Na slučajni ponovni odabir izračunava se prosječna greška:
.
U praksi, opća varijanca nije točno poznata, ali u teorija vjerojatnosti dokazao da
.
Budući da je vrijednost za dovoljno veliki n blizu 1, možemo pretpostaviti da je . Tada se može izračunati srednja pogreška uzorkovanja:
.
Ali u slučajevima malog uzorka (za br<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Na slučajno uzorkovanje zadane formule ispravljaju se za vrijednost . Tada je prosječna pogreška neuzorkovanja:
i .
Jer je uvijek manji od , tada je faktor () uvijek manji od 1. To znači da je prosječna pogreška u neponavljajućem odabiru uvijek manja nego u ponovljenom odabiru.
Mehaničko uzorkovanje koristi se kada je opća populacija na neki način poredana (primjerice, popisi birača po abecedi, telefonski brojevi, kućni brojevi, stanovi). Odabir jedinica provodi se u određenom intervalu, koji je jednak recipročnoj vrijednosti postotka uzorka. Dakle, s uzorkom od 2% odabire se svakih 50 jedinica = 1 / 0,02, s 5% svakih 1 / 0,05 = 20 jedinica opće populacije.

Ishodište se bira na različite načine: nasumično, iz sredine intervala, s promjenom ishodišta. Glavna stvar je izbjeći sustavnu pogrešku. Na primjer, s uzorkom od 5%, ako je 13. izabran kao prva jedinica, onda sljedećih 33, 53, 73 itd.

U smislu točnosti, mehanički odabir je blizak ispravnom slučajnom uzorkovanju. Stoga se za određivanje prosječne pogreške mehaničkog uzorkovanja koriste formule pravilnog slučajnog odabira.

Na tipičan izbor ispitana populacija je preliminarno podijeljena u homogene grupe jednog tipa. Na primjer, kada se anketiraju poduzeća, to mogu biti industrije, podsektori, dok se proučava stanovništvo - područja, društvene ili dobne skupine. Zatim se vrši neovisni odabir iz svake skupine na mehanički ili odgovarajući slučajni način.

Tipično uzorkovanje daje točnije rezultate od drugih metoda. Tipizacijom opće populacije osigurava se zastupljenost svake tipološke skupine u uzorku, čime je moguće isključiti utjecaj međugrupne varijance na prosječnu pogrešku uzorka. Stoga, pri pronalaženju pogreške tipičnog uzorka prema pravilu zbrajanja varijanci (), potrebno je uzeti u obzir samo prosjek varijanci grupe. Tada je srednja vrijednost greške uzorkovanja:
u ponovnom odabiru
,
s odabirom koji se ne ponavlja
,
gdje je srednja vrijednost varijanci unutar grupe u uzorku.

Serijski (ili ugniježđeni) odabir koristi se kada je populacija podijeljena u serije ili skupine prije početka istraživanja uzorka. Ove serije mogu biti paketi gotovih proizvoda, studentskih grupa, timova. Serije za ispitivanje odabiru se mehanički ili slučajno, a unutar serije provodi se kompletan pregled jedinica. Stoga prosječna pogreška uzorkovanja ovisi samo o međugrupnoj (međuserijskoj) varijanci koja se izračunava po formuli:

gdje je r broj odabranih serija;
- prosjek i-te serije.

Prosječna pogreška serijskog uzorkovanja izračunava se:

pri ponovnom odabiru:
,
s odabirom koji se ne ponavlja:
,
gdje je R ukupan broj serija.

Kombinirano izbor je kombinacija razmatranih metoda selekcije.

Prosječna pogreška uzorkovanja za bilo koju metodu odabira ovisi uglavnom o apsolutnoj veličini uzorka i, u manjoj mjeri, o postotku uzorka. Pretpostavimo da je u prvom slučaju napravljeno 225 promatranja iz populacije od 4500 jedinica, au drugom slučaju od 225000 jedinica. Varijance u oba slučaja jednake su 25. Tada će u prvom slučaju, s izborom od 5%, pogreška uzorkovanja biti:

U drugom slučaju, s izborom od 0,1%, to će biti jednako:


Na ovaj način, sa smanjenjem postotka uzorka za 50 puta, pogreška uzorka se malo povećala, budući da se veličina uzorka nije promijenila.
Pretpostavimo da je veličina uzorka povećana na 625 opažanja. U ovom slučaju, greška uzorkovanja je:

Povećanje uzorka za 2,8 puta uz istu veličinu opće populacije smanjuje veličinu greške uzorkovanja za više od 1,6 puta.

Metode i sredstva formiranja uzorka populacije.

U statistici se koriste različite metode formiranja skupova uzoraka, što je određeno ciljevima istraživanja i ovisi o specifičnostima predmeta proučavanja.

Glavni uvjet za provođenje istraživanja uzorka je spriječiti pojavu sustavnih pogrešaka koje proizlaze iz kršenja načela jednakih mogućnosti svake jedinice opće populacije da uđe u uzorak. Sprječavanje sustavnih pogrešaka postiže se korištenjem znanstveno utemeljenih metoda za formiranje uzorka populacije.

Postoje sljedeći načini odabira jedinica iz opće populacije:

1) individualni odabir - u uzorak se biraju pojedine jedinice;

2) grupni odabir - u uzorak ulaze kvalitativno homogene skupine ili nizovi jedinica koje se proučavaju;

3) kombinirana selekcija je kombinacija individualne i grupne selekcije.
Metode odabira određene su pravilima za formiranje populacije za uzorkovanje.

Uzorak može biti:

  • pravilan slučajan sastoji se u tome što uzorak nastaje kao rezultat slučajnog (nenamjernog) odabira pojedinih jedinica iz opće populacije. U tom slučaju, broj odabranih jedinica u skupu uzoraka obično se određuje na temelju prihvaćenog udjela uzorka. Udio uzorka je omjer broja jedinica u uzorkovanoj populaciji n prema broju jedinica u općoj populaciji N, tj.
  • mehanički sastoji se u tome što se odabir jedinica u uzorak vrši iz opće populacije, podijeljene u jednake intervale (skupine). U tom je slučaju veličina intervala u općoj populaciji jednaka recipročnoj vrijednosti udjela uzorka. Dakle, kod uzorka od 2% bira se svaka 50. jedinica (1:0,02), kod uzorka od 5% svaka 20. jedinica (1:0,05) itd. Dakle, u skladu s prihvaćenim omjerom selekcije, opća populacija je takoreći mehanički podijeljena u jednake skupine. Iz svake skupine u uzorku bira se samo jedna jedinica.
  • tipično - u kojoj se opća populacija prvo dijeli na homogene tipične skupine. Zatim se iz svake tipične skupine slučajnim ili mehaničkim uzorkom vrši pojedinačni odabir jedinica u uzorak. Važna značajka tipičnog uzorka je da daje preciznije rezultate u usporedbi s drugim metodama odabira jedinica u uzorku;
  • serijski- u kojoj je opća populacija podijeljena u skupine iste veličine - serije. Serije su odabrane u skupu uzoraka. Unutar niza provodi se kontinuirano promatranje jedinica koje su ušle u niz;
  • kombinirani- uzorkovanje može biti dvostupanjsko. U tom se slučaju opća populacija prvo dijeli na skupine. Zatim se odabiru skupine, a unutar njih pojedine jedinice.

U statistici se razlikuju sljedeće metode odabira jedinica u uzorku::

  • jednostupanjska uzorak - svaka odabrana jedinica odmah se podvrgava proučavanju na zadanoj osnovi (zapravo slučajni i serijski uzorci);
  • višestupanjski uzorkovanje - odabir se vrši iz opće populacije pojedinih skupina, a iz skupina se biraju pojedine jedinice (tipičan uzorak s mehaničkim načinom odabira jedinica u uzorku populacije).

Osim toga, postoje:

  • ponovni odabir- prema shemi vraćene lopte. U tom slučaju, svaka jedinica ili serija koja je ušla u uzorak vraća se u opću populaciju i stoga ima priliku ponovno biti uključena u uzorak;
  • odabir koji se ne ponavlja- prema shemi nevraćene lopte. Ima preciznije rezultate za istu veličinu uzorka.

Određivanje potrebne veličine uzorka (koristeći Studentovu tablicu).

Jedno od znanstvenih načela u teoriji uzorkovanja je osigurati odabir dovoljnog broja jedinica. Teoretski, potreba za poštivanjem ovog načela prikazana je u dokazima graničnih teorema teorije vjerojatnosti, koji vam omogućuju da utvrdite koliko jedinica treba odabrati iz opće populacije tako da bude dovoljno i osigura reprezentativnost uzorka.

Smanjenje standardne pogreške uzorka i, posljedično, povećanje točnosti procjene uvijek je povezano s povećanjem veličine uzorka, stoga je već u fazi organiziranja promatranja uzorka potrebno odlučiti kolika treba biti veličina uzorka kako bi se osigurala potrebna točnost rezultata promatranja. Izračun potrebne veličine uzorka izgrađen je pomoću formula izvedenih iz formula za granične pogreške uzorkovanja (A), koje odgovaraju jednoj ili drugoj vrsti i metodi odabira. Dakle, za nasumično ponovljenu veličinu uzorka (n), imamo:

Bit ove formule je da je slučajnim ponovnim odabirom traženog broja veličina uzorka izravno proporcionalna kvadratu koeficijenta pouzdanosti (t2) i varijance značajke varijacije (?2) i obrnuto je proporcionalna kvadratu granične pogreške uzorkovanja (?2). Konkretno, udvostručenjem granične pogreške potrebna veličina uzorka može se smanjiti za faktor četiri. Od tri parametra, dva (t i?) postavlja istraživač.

Istodobno, istraživač Za potrebe uzorkovanja potrebno je postaviti pitanje u kojoj kvantitativnoj kombinaciji je bolje uključiti te parametre kako bi se dobila optimalna varijanta? U jednom slučaju može biti zadovoljniji pouzdanošću dobivenih rezultata (t) nego mjerom točnosti (?), u drugom - obrnuto. Teže je riješiti pitanje vrijednosti granične pogreške uzorkovanja, budući da istraživač nema ovaj pokazatelj u fazi osmišljavanja promatranja uzorka, stoga je u praksi uobičajeno postaviti graničnu pogrešku uzorkovanja, kao u pravilu unutar 10% očekivane prosječne razine svojstva. Utvrđivanju pretpostavljene prosječne razine može se pristupiti na različite načine: korištenjem podataka iz sličnih prethodnih istraživanja ili korištenjem podataka iz okvira uzorkovanja i uzimanjem malog pilot uzorka.

Najteže je utvrditi pri izradi promatranja uzorka treći parametar u formuli (5.2) - varijancu uzorka populacije. U tom slučaju potrebno je koristiti sve podatke dostupne istraživaču, dobivene iz prethodnih sličnih i pilot istraživanja.

Pitanje definicije Potrebna veličina uzorka postaje kompliciranija ako ispitivanje uzorka uključuje proučavanje nekoliko značajki jedinica uzorkovanja. U ovom slučaju, prosječne razine svake karakteristike i njihova varijacija, u pravilu, su različite, pa je moguće odlučiti kojoj disperziji koje karakteristike dati prednost samo uzimajući u obzir svrhu i ciljeve povrsina.

Prilikom izrade uzorka promatranja pretpostavlja se unaprijed određena vrijednost dopuštene pogreške uzorkovanja u skladu s ciljevima pojedinog istraživanja i vjerojatnosti zaključaka na temelju rezultata promatranja.

Općenito, formula za graničnu pogrešku srednje vrijednosti uzorka omogućuje određivanje:

Veličina mogućih odstupanja pokazatelja opće populacije od pokazatelja uzorka populacije;

Potrebna veličina uzorka, koja osigurava traženu točnost, u kojoj granice moguće pogreške neće premašiti određenu specificiranu vrijednost;

Vjerojatnost da će greška u uzorku imati zadanu granicu.

Raspodjela studenata u teoriji vjerojatnosti, to je jednoparametarska obitelj apsolutno kontinuiranih distribucija.

Niz dinamike (interval, moment), zatvaranje niza dinamike.

Serija dinamike- to su vrijednosti statističkih pokazatelja koji su prikazani u određenom kronološkom slijedu.

Svaka vremenska serija sadrži dvije komponente:

1) pokazatelji vremenskih razdoblja (godine, kvartali, mjeseci, dani ili datumi);

2) pokazatelji koji karakteriziraju predmet koji se proučava za vremenska razdoblja ili na odgovarajuće datume, koji se nazivaju razinama serije.

Izražene su razine serije i apsolutne i prosječne ili relativne vrijednosti. Ovisno o prirodi pokazatelja, grade se dinamički nizovi apsolutnih, relativnih i prosječnih vrijednosti. Dinamički nizovi relativnih i prosječnih vrijednosti izgrađeni su na temelju izvedenih nizova apsolutnih vrijednosti. Postoje intervalni i momentni nizovi dinamike.

Dinamičke intervalne serije sadrži vrijednosti pokazatelja za određena vremenska razdoblja. U intervalnom nizu razine se mogu zbrajati čime se dobiva obujam pojave za dulje razdoblje ili tzv. akumulirani zbrojevi.

Niz dinamičkih trenutaka odražava vrijednosti pokazatelja u određenom trenutku (datum vremena). U trenutnim nizovima, istraživača može zanimati samo razlika pojava, koja odražava promjenu razine niza između određenih datuma, budući da zbroj razina ovdje nema pravi sadržaj. Ovdje se ne računaju kumulativni zbrojevi.

Najvažniji uvjet za ispravnu konstrukciju dinamičkih serija je usporedivost razina serija koje se odnose na različita razdoblja. Razine trebaju biti prikazane u homogenim količinama, treba postojati ista cjelovitost obuhvata različitih dijelova fenomena.

Do Kako bi se izbjeglo iskrivljavanje stvarne dinamike, u statističkoj studiji (zatvaranje vremenske serije) provode se preliminarni izračuni koji prethode statističkoj analizi vremenske serije. Zatvaranje vremenske serije podrazumijeva se spajanje dvije ili više serija u jednu seriju, čije su razine izračunate prema različitoj metodologiji ili ne odgovaraju teritorijalnim granicama itd. Zatvaranje dinamičkog niza može podrazumijevati i redukciju apsolutnih razina dinamičkog niza na zajedničku osnovu, čime se otklanja nekompatibilnost razina dinamičkog niza.

Pojam usporedivosti vremenskih serija, koeficijenata, rasta i stopa rasta.

Serija dinamike- to su nizovi statističkih pokazatelja koji karakteriziraju razvoj prirodnih i društvenih pojava u vremenu. Statističke zbirke koje objavljuje Državni odbor za statistiku Rusije sadrže veliki broj vremenskih serija u tabelarnom obliku. Nizovi dinamike omogućuju otkrivanje obrazaca razvoja proučavanih fenomena.

Vremenske serije sadrže dvije vrste indikatora. Indikatori vremena(godine, kvartali, mjeseci itd.) ili točke u vremenu (na početku godine, na početku svakog mjeseca itd.). Indikatori razine retka. Pokazatelji razina vremenskih serija mogu se izraziti u apsolutnim vrijednostima (proizvodnja proizvoda u tonama ili rubljima), relativnim vrijednostima (udio gradskog stanovništva u%) i prosječnim vrijednostima (prosječne plaće radnika u industriji po godinama itd.). U tabelarnom obliku vremenska serija sadrži dva stupca ili dva retka.

Ispravna konstrukcija vremenske serije uključuje ispunjenje niza zahtjeva:

  1. svi pokazatelji niza dinamike moraju biti znanstveno potkrijepljeni, pouzdani;
  2. indikatori niza dinamike trebaju biti vremenski usporedivi, tj. moraju se izračunati za ista vremenska razdoblja ili na iste datume;
  3. indikatori niza dinamika trebaju biti usporedivi na cijelom teritoriju;
  4. pokazatelji niza dinamike trebaju biti sadržajno usporedivi, tj. izračunati prema jedinstvenoj metodologiji, na isti način;
  5. pokazatelji niza dinamika trebali bi biti usporedivi u nizu razmatranih farmi. Sve pokazatelje niza dinamike treba dati u istim mjernim jedinicama.

Statistički pokazatelji može karakterizirati ili rezultate procesa koji se proučava tijekom određenog vremenskog razdoblja ili stanje fenomena koji se proučava u određenom trenutku u vremenu, tj. indikatori mogu biti intervalni (periodični) i trenutni. Prema tome, inicijalni niz dinamike može biti ili interval ili trenutak. Trenutni nizovi dinamike pak mogu biti s jednakim i nejednakim vremenskim intervalima.

Početni niz dinamike može se pretvoriti u niz prosječnih vrijednosti i niz relativnih vrijednosti (lanac i baza). Takve vremenske serije nazivaju se izvedene vremenske serije.

Metoda izračuna prosječne razine u nizu dinamike je različita, ovisno o vrsti niza dinamike. Na primjerima razmotrite vrste vremenskih serija i formule za izračun prosječne razine.

Apsolutni dobici (Δy) pokazuju koliko se jedinica promijenila sljedeća razina niza u odnosu na prethodnu (stupac 3. - lančani apsolutni prirast) ili u odnosu na početnu razinu (stupac 4. - osnovni apsolutni prirast). Formule za izračun mogu se napisati na sljedeći način:

Sa smanjenjem apsolutnih vrijednosti niza, doći će do "smanjenja", odnosno "smanjenja".

Pokazatelji apsolutnog rasta govore da je, primjerice, u 1998. godini proizvodnja proizvoda "A" porasla za 4.000 tona u odnosu na 1997. godinu, odnosno za 34.000 tona u odnosu na 1994. godinu; za ostale godine vidi tablicu. 11,5 gr. 3 i 4.

Faktor rasta pokazuje koliko se puta razina serije promijenila u odnosu na prethodnu (stupac 5 - lančani faktori rasta ili pada) ili u odnosu na početnu razinu (stupac 6 - osnovni faktori rasta ili pada). Formule za izračun mogu se napisati na sljedeći način:

Stope rasta pokazati koliko je posto sljedeća razina serije u odnosu na prethodnu (stupac 7 - lančane stope rasta) ili u odnosu na početnu razinu (stupac 8 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

Tako je, na primjer, u 1997. godini obujam proizvodnje proizvoda "A" u odnosu na 1996. godinu iznosio 105,5% (

Brzina rasta pokazati za koliko posto se povećala razina izvještajnog razdoblja u odnosu na prethodno (stupac 9 - lančane stope rasta) ili u odnosu na početnu razinu (stupac 10 - osnovne stope rasta). Formule za izračun mogu se napisati na sljedeći način:

T pr \u003d T p - 100% ili T pr \u003d apsolutno povećanje / razina prethodnog razdoblja * 100%

Tako je npr. 1996. godine u odnosu na 1995. godinu proizvedeno više proizvoda "A" za 3,8% (103,8% - 100%) ili (8:210) x 100%, au odnosu na 1994. godinu - za 9% ( 109% - 100%).

Ako se apsolutne razine u nizu smanje, tada će stopa biti manja od 100% i, sukladno tome, doći će do stope pada (stopa rasta s predznakom minus).

Apsolutna vrijednost povećanja od 1%.(stupac 11) pokazuje koliko je jedinica potrebno proizvesti u određenom razdoblju da bi se razina prethodnog razdoblja povećala za 1%. U našem primjeru 1995. godine bilo je potrebno proizvesti 2,0 tisuće tona, a 1998. godine 2,3 tisuće tona, tj. puno veći.

Postoje dva načina za određivanje veličine apsolutne vrijednosti rasta od 1%:

Razinu prethodnog razdoblja podijelite sa 100;

Podijelite apsolutne stope rasta lanca s odgovarajućim stopama rasta lanca.

Apsolutna vrijednost povećanja od 1% =

U dinamici, posebno u dužem razdoblju, važno je zajednički analizirati stopu rasta sa sadržajem svakog postotka povećanja ili smanjenja.

Imajte na umu da je razmatrana metodologija za analizu vremenskih serija primjenjiva i za vremenske serije, čije su razine izražene u apsolutnim vrijednostima (t, tisuća rubalja, broj zaposlenika itd.), I za vremenske serije, razine koji se izražavaju u relativnim pokazateljima (% škarta, % udjela pepela u ugljenu itd.) ili prosječnim vrijednostima (prosječni prinos u c/ha, prosječne plaće itd.).

Uz razmatrane analitičke pokazatelje izračunate za svaku godinu u usporedbi s prethodnom ili početnom razinom, pri analizi vremenske serije potrebno je izračunati prosječne analitičke pokazatelje za razdoblje: prosječnu razinu serije, prosječni godišnji apsolutni porast (smanjenje) te prosječna godišnja stopa rasta i stopa rasta.

Metode za izračunavanje prosječne razine niza dinamike raspravljene su gore. U intervalnom nizu dinamike koji razmatramo, prosječna razina niza izračunava se formulom jednostavne aritmetičke sredine:

Prosječna godišnja proizvodnja proizvoda za 1994.-1998. iznosio 218,4 tisuća tona.

Prosječni godišnji apsolutni porast također se izračunava po formuli jednostavne aritmetičke sredine:

Godišnji apsolutni prirast varirao je kroz godine od 4 do 12 tisuća tona (vidi gr. 3), a prosječni godišnji porast proizvodnje za razdoblje 1995.-1998. iznosio 8,5 tisuća tona.

Metode za izračunavanje prosječne stope rasta i prosječne stope rasta zahtijevaju detaljnije razmatranje. Razmotrimo ih na primjeru godišnjih pokazatelja razine serije danih u tablici.

Srednja razina raspona dinamike.

Serije dinamike (ili vremenske serije)- to su numeričke vrijednosti određenog statističkog pokazatelja u uzastopnim trenucima ili vremenskim razdobljima (tj. poredane kronološkim redom).

Brojčane vrijednosti određenog statističkog pokazatelja koji čini niz dinamike nazivaju se razine broja a obično se označava slovom g. Prvi član serije y 1 naziva se početnim ili Osnovna linija, i posljednji y n - konačni. Trenuci ili razdoblja na koje se razine odnose označeni su sa t.

Dinamičke serije, u pravilu, prikazane su u obliku tablice ili grafikona, a vremenska ljestvica izgrađena je duž x-osi. t, a duž ordinate - ljestvica razina niza g.

Prosječni pokazatelji niza dinamike

Svaki niz dinamike može se smatrati određenim skupom n vremenski promjenjivi pokazatelji koji se mogu sažeti kao prosjeci. Takvi generalizirani (prosječni) pokazatelji posebno su potrebni kada se uspoređuju promjene jednog ili drugog pokazatelja u različitim razdobljima, u različitim zemljama itd.

Generalizirana karakteristika niza dinamike može biti, prije svega, prosječna razina reda. Način izračuna prosječne razine ovisi o tome radi li se o momentnom nizu ili intervalnom (periodnom) nizu.

Kada interval niza, njegova prosječna razina određena je formulom jednostavne aritmetičke sredine razina niza, tj.

=
Ako je dostupno trenutak red koji sadrži n razine ( y1, y2, …, yn) s jednakim intervalima između datuma (točaka vremena), tada se takav niz može lako pretvoriti u niz prosječnih vrijednosti. Pritom je pokazatelj (razina) na početku svakog razdoblja ujedno i pokazatelj na kraju prethodnog razdoblja. Tada se prosječna vrijednost indikatora za svako razdoblje (interval između datuma) može izračunati kao poluzbroj vrijednosti na na početku i na kraju razdoblja, tj. kako . Broj takvih prosjeka bit će . Kao što je ranije spomenuto, za niz prosjeka, prosječna razina izračunava se iz aritmetičkog prosjeka.

Stoga možemo napisati:
.
Nakon pretvorbe brojnika dobivamo:
,

gdje Y1 i Yn- prva i zadnja razina serije; Yi- srednje razine.

Taj je prosjek u statistici poznat kao prosječno kronološki za seriju trenutaka. Ime je dobila od riječi "cronos" (vrijeme, lat.), jer se izračunava iz pokazatelja koji se mijenjaju tijekom vremena.

U slučaju nejednakih intervalima između datuma, kronološki prosjek za seriju trenutaka može se izračunati kao aritmetički prosjek prosječnih vrijednosti razina za svaki par trenutaka, ponderiranih udaljenostima (vremenskim intervalima) između datuma, tj.
.
U ovom slučaju pretpostavlja se da su u intervalima između datuma razine poprimile različite vrijednosti, a mi smo od dvije poznate ( yi i yi+1) utvrđujemo prosjeke iz kojih zatim izračunavamo ukupni prosjek za cijelo analizirano razdoblje.
Ako se pretpostavi da svaka vrijednost yi ostaje nepromijenjen do sljedećeg (i+ 1)- trenutak, tj. ako je poznat točan datum promjene razina, tada se izračun može izvesti pomoću formule ponderirane aritmetičke sredine:
,

gdje je vrijeme tijekom kojeg je razina ostala nepromijenjena.

Osim prosječne razine u seriji dinamike, izračunavaju se i drugi prosječni pokazatelji - prosječna promjena razina serije (osnovna i lančana metoda), prosječna stopa promjene.

Osnovna vrijednost apsolutne promjene je kvocijent posljednje osnovne apsolutne promjene podijeljen s brojem promjena. To je

Lanac znači apsolutnu promjenu razine niza je kvocijent dijeljenja zbroja svih lančanih apsolutnih promjena s brojem promjena, tj.

Prema predznaku prosječnih apsolutnih promjena prosječno se prosuđuje i priroda promjene pojave: rast, opadanje ili stabilnost.

Iz pravila kontrole osnovne i lančane apsolutne promjene proizlazi da osnovna i lančana prosječna promjena moraju biti jednake.

Uz prosječnu apsolutnu promjenu izračunava se i prosječna relativna osnovnom i lančanom metodom.

Osnovna prosječna relativna promjena određuje se formulom:

Lančana srednja relativna promjena određuje se formulom:

Naravno, osnovne i lančane prosječne relativne promjene trebaju biti iste, a usporedbom s kriterijskom vrijednošću 1 zaključuje se o prirodi promjene pojave u prosjeku: rast, pad ili stabilnost.
Oduzimanjem 1 od osnovne ili lančane prosječne relativne promjene, odgovarajući prosječna stopa promjene, prema čijem se znaku također može prosuditi priroda promjene u fenomenu koji se proučava, što se odražava u ovom nizu dinamike.

Sezonska kolebanja i indeksi sezonalnosti.

Sezonske fluktuacije su stabilne unutargodišnje fluktuacije.

Osnovno načelo upravljanja za postizanje maksimalnog učinka je maksimiziranje prihoda i minimiziranje troškova. Proučavanjem sezonskih kolebanja rješava se problem jednadžbe maksimuma u svakoj razini godine.

Pri proučavanju sezonskih fluktuacija rješavaju se dva međusobno povezana zadatka:

1. Identifikacija specifičnosti razvoja fenomena u unutargodišnjoj dinamici;

2. Mjerenje sezonskih kolebanja s konstrukcijom modela sezonskih valova;

Sezonski purani obično se broje kako bi se izmjerila sezonalnost. Općenito, određuju se omjerom izvornih jednadžbi niza dinamike prema teorijskim jednadžbama koje služe kao osnova za usporedbu.

Budući da su slučajna odstupanja superponirana sezonskim fluktuacijama, indeksi sezonalnosti su prosječni kako bi ih se eliminiralo.

U ovom slučaju, za svako razdoblje godišnjeg ciklusa utvrđuju se generalizirani pokazatelji u obliku prosječnih sezonskih indeksa:

Prosječni indeksi sezonskih kolebanja oslobođeni su utjecaja slučajnih odstupanja glavnog trenda razvoja.

Ovisno o prirodi trenda, formula za prosječni indeks sezonalnosti može imati sljedeće oblike:

1.Za serije međugodišnje dinamike s izraženim glavnim trendom razvoja:

2. Za niz međugodišnjih dinamika u kojima nema uzlaznog ili silaznog trenda ili je beznačajan:

Gdje je opći prosjek;

Metode za analizu glavnog trenda.

Na razvoj pojava tijekom vremena utječu čimbenici različiti po prirodi i snazi ​​utjecaja. Neki od njih su slučajne prirode, drugi imaju gotovo konstantan učinak i tvore određeni trend razvoja u nizu dinamike.

Važan zadatak statistike je identificirati trend u nizu dinamike, oslobođen djelovanja različitih slučajnih čimbenika. U tu svrhu vremenske serije se obrađuju metodama intervalnog povećanja, pomičnog prosjeka i analitičkog poravnanja itd.

Metoda ogrubljivanja intervala temelji se na proširenju vremenskih razdoblja, koja uključuju razine niza dinamike, tj. je zamjena podataka koji se odnose na mala vremenska razdoblja podacima iz većih razdoblja. Posebno je učinkovit kada su početne razine niza kratke vremenske periode. Na primjer, nizovi indikatora koji se odnose na dnevne događaje zamjenjuju se nizovima koji se odnose na tjedne, mjesečne itd. To će se jasnije pokazati "Os razvoja fenomena". Prosjek, izračunat na temelju povećanih intervala, omogućuje prepoznavanje smjera i karaktera (ubrzanje ili usporavanje rasta) glavnog trenda razvoja.

metoda pokretnog prosjeka sličan prethodnom, ali se u ovom slučaju stvarne razine zamjenjuju prosječnim razinama izračunatim za uzastopno pomicanje (klizenje) povećanih intervala koji pokrivaju m razine redova.

Na primjer ako se prihvati m=3, zatim se prvo izračuna prosjek prve tri razine serije, zatim - od istog broja razina, ali počevši od druge po redu, zatim - počevši od treće, itd. Dakle, prosjek, takoreći, "klizi" nizom dinamike, krećući se za jedno razdoblje. Izračunato iz mčlanovi pomičnih prosjeka odnose se na sredinu (središte) svakog intervala.

Ova metoda eliminira samo slučajne fluktuacije. Ako niz ima sezonski val, on će ostati nakon izglađivanja metodom pomičnog prosjeka.

Analitičko usklađivanje. Kako bi se eliminirale slučajne fluktuacije i identificirao trend, razine serije su usklađene prema analitičkim formulama (ili analitičkom poravnanju). Njegova bit je zamjena empirijskih (stvarnih) razina teorijskim, koje se izračunavaju prema određenoj jednadžbi, uzetoj kao matematički model trenda, pri čemu se teorijske razine promatraju u funkciji vremena: . U ovom slučaju, svaka stvarna razina smatra se zbrojem dviju komponenti: , gdje je sustavna komponenta i izražena određenom jednadžbom, a slučajna varijabla koja uzrokuje fluktuacije oko trenda.

Zadatak analitičkog usklađivanja je sljedeći:

1. Određivanje na temelju stvarnih podataka vrste hipotetske funkcije koja može najadekvatnije odražavati trend razvoja pokazatelja koji se proučava.

2. Određivanje parametara navedene funkcije (jednadžbe) iz empirijskih podataka

3. Izračun prema pronađenoj jednadžbi teorijskih (niveliranih) razina.

Izbor pojedine funkcije provodi se, u pravilu, na temelju grafičkog prikaza empirijskih podataka.

Modeli su regresijske jednadžbe čiji su parametri izračunati metodom najmanjih kvadrata

Ispod su najčešće korištene regresijske jednadžbe za izravnavanje vremenskih nizova, pokazujući koje razvojne trendove su najprikladnije za odražavanje.

Za pronalaženje parametara gornjih jednadžbi postoje posebni algoritmi i računalni programi. Konkretno, za pronalaženje parametara jednadžbe ravne linije može se koristiti sljedeći algoritam:

Ako se periode ili trenutke vremena numerira tako da se dobije St = 0, tada će se gornji algoritmi značajno pojednostaviti i pretvoriti u

Usklađene razine na grafikonu nalazit će se na jednoj ravnoj liniji koja prolazi na najbližoj udaljenosti od stvarnih razina ove dinamičke serije. Zbroj kvadrata odstupanja odraz je utjecaja slučajnih faktora.

Uz njegovu pomoć izračunavamo prosječnu (standardnu) pogrešku jednadžbe:

Ovdje je n broj opažanja, a m je broj parametara u jednadžbi (imamo dva od njih - b 1 i b 0).

Glavni trend (trend) pokazuje kako sustavni čimbenici utječu na razine niza dinamike, a fluktuacija razina oko trenda () služi kao mjera utjecaja rezidualnih čimbenika.

Za procjenu kvalitete korištenog modela vremenske serije također se koristi Fisherov F test. To je omjer dviju varijanci, odnosno omjer varijance uzrokovane regresijom, tj. proučavani faktor, na disperziju uzrokovanu slučajnim uzrocima, tj. rezidualna varijanca:

U proširenom obliku, formula za ovaj kriterij može se prikazati na sljedeći način:

gdje je n broj opažanja, tj. broj razina redova,

m je broj parametara u jednadžbi, y je stvarna razina niza,

Usklađena razina reda, - prosječna razina reda.

Uspješniji od drugih, model ne mora uvijek biti dovoljno zadovoljavajući. Može se prepoznati kao takav samo ako kriterij F za njega prijeđe određenu kritičnu granicu. Ova granica je postavljena pomoću F distribucijskih tablica.

Bit i klasifikacija indeksa.

Indeks se u statistici shvaća kao relativni pokazatelj koji karakterizira promjenu veličine neke pojave u vremenu, prostoru ili u usporedbi s bilo kojim standardom.

Glavni element indeksne relacije je indeksirana vrijednost. Indeksirana vrijednost shvaća se kao vrijednost znaka statističke populacije čija je promjena predmet proučavanja.

Indeksi služe u tri glavne svrhe:

1) procjena promjena u složenoj pojavi;

2) utvrđivanje utjecaja pojedinih čimbenika na promjenu složene pojave;

3) usporedba veličine neke pojave s veličinom prošlog razdoblja, veličinom drugog teritorija, kao i sa standardima, planovima, prognozama.

Indeksi su klasificirani prema 3 kriterija:

2) po stupnju obuhvata elemenata stanovništva;

3) metodama izračunavanja općih indeksa.

Po sadržaju indeksiranih vrijednosti, indeksi se dijele na indekse kvantitativnih (volumetrijskih) pokazatelja i indekse kvalitativnih pokazatelja. Indeksi kvantitativnih pokazatelja - indeksi fizičkog obujma industrijske proizvodnje, fizičkog obujma prodaje, broja i dr. Indeksi kvalitativnih pokazatelja - indeksi cijena, troškova, proizvodnosti rada, prosječnih plaća i dr.

Prema stupnju obuhvata jedinica populacije indeksi se dijele u dvije klase: pojedinačne i opće. Kako bismo ih okarakterizirali, uvodimo sljedeće konvencije usvojene u praksi primjene metode indeksa:

q- količina (volumen) bilo kojeg proizvoda u naravi ; R- jedinična cijena proizvodnje; z- jedinični trošak proizvodnje; t- vrijeme utrošeno na proizvodnju jedinice outputa (intenzitet rada) ; w- proizvodni učinak u vrijednosnom izrazu po jedinici vremena; v- učinak u fizičkom smislu po jedinici vremena; T- ukupno utrošeno vrijeme ili broj zaposlenih.

Kako bi se razlikovalo kojem razdoblju ili objektu pripadaju indeksirane vrijednosti, uobičajeno je da se nakon odgovarajućeg simbola u donjem desnom kutu stavljaju indeksi. Tako se, primjerice, u indeksima dinamike u pravilu za uspoređivana (tekuća, izvještajna) razdoblja koristi indeks 1, a za razdoblja s kojima se uspoređuje,

Individualni indeksi služe za karakterizaciju promjene pojedinih elemenata složene pojave (na primjer, promjena obujma proizvodnje jedne vrste proizvoda). Predstavljaju relativne vrijednosti dinamike, ispunjenje obveza, usporedbu indeksiranih vrijednosti.

Utvrđuje se pojedinačni indeks fizičkog obujma proizvodnje

S analitičkog gledišta, navedeni pojedinačni indeksi dinamike slični su koeficijentima (stopama) rasta i karakteriziraju promjenu indeksirane vrijednosti u tekućem razdoblju u odnosu na bazno, tj. pokazuju koliko je puta porasla (smanjila) ) odnosno koliko posto je to rast (smanjenje). Vrijednosti indeksa izražavaju se u koeficijentima ili postocima.

Opći (kompozitni) indeks odražava promjenu svih elemenata složene pojave.

Zbirni indeks je osnovni oblik indeksa. Naziva se agregat jer su njegov brojnik i nazivnik skup "agregata"

Prosječni indeksi, njihova definicija.

Osim agregatnih indeksa, u statistici se koristi još jedan njihov oblik - ponderirani prosječni indeksi. Njihovom se izračunu pribjegava kada raspoložive informacije ne dopuštaju izračun općeg agregatnog indeksa. Dakle, ako nema podataka o cijenama, ali postoji podatak o troškovima proizvoda u tekućem razdoblju i poznati su pojedinačni indeksi cijena za svaki proizvod, tada se opći indeks cijena ne može odrediti kao agregatni, ali je moguće izračunati ga kao prosjek pojedinačnih. Na isti način, ako nisu poznate količine pojedinačnih proizvedenih proizvoda, ali su poznati pojedinačni indeksi i troškovi proizvodnje baznog razdoblja, tada se ukupni indeks fizičkog obujma proizvodnje može odrediti kao ponderirani prosjek.

Prosječni indeks - ovo je indeks izračunat kao prosjek pojedinačnih indeksa. Zbirni indeks je osnovni oblik općeg indeksa, pa prosječni indeks mora biti identičan zbirnom indeksu. Pri izračunavanju prosječnih indeksa koriste se dva oblika prosjeka: aritmetički i harmonijski.

Indeks aritmetičke sredine identičan je agregatnom indeksu ako su ponderi pojedinačnih indeksa članovi nazivnika agregatnog indeksa. Samo u tom slučaju vrijednost indeksa izračunata formulom aritmetičke sredine bit će jednaka zbirnom indeksu.

Iz Wikipedije, slobodne enciklopedije

standardna devijacija(sinonimi: standardna devijacija, standardna devijacija, standardna devijacija; povezani pojmovi: standardna devijacija, standardni namaz) - u teoriji vjerojatnosti i statistici, najčešći pokazatelj disperzije vrijednosti slučajne varijable u odnosu na njezino matematičko očekivanje. Kod ograničenih nizova uzoraka vrijednosti umjesto matematičkog očekivanja koristi se aritmetička sredina populacije uzoraka.

Osnovne informacije

Standardna devijacija se mjeri u jedinicama same slučajne varijable i koristi se pri izračunu standardne pogreške aritmetičke sredine, pri konstruiranju intervala pouzdanosti, pri statističkom testiranju hipoteza, pri mjerenju linearnog odnosa između slučajnih varijabli. Definira se kao kvadratni korijen varijance slučajne varijable.

Standardna devijacija:

\sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\lijevo(x_i-\bar(x)\desno)^2).

Standardna devijacija(procjena standardne devijacije slučajne varijable x u odnosu na svoje matematičko očekivanje temeljeno na nepristranoj procjeni njegove varijance) s:

s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\lijevo(x_i-\bar (x)\desno)^2);

pravilo tri sigme

pravilo tri sigme (3\sigma) - gotovo sve vrijednosti normalno distribuirane slučajne varijable leže u intervalu \lijevo(\bar(x)-3\sigma;\bar(x)+3\sigma\desno). Strože - približno s vjerojatnošću od 0,9973 vrijednost normalno raspodijeljene slučajne varijable leži u navedenom intervalu (pod uvjetom da vrijednost \bar(x) istinito, a ne dobiveno kao rezultat obrade uzorka).

Ako je prava vrijednost \bar(x) nepoznato, onda biste trebali koristiti \sigma, a s. Tako se pravilo tri sigme pretvara u pravilo tri s .

Tumačenje vrijednosti standardne devijacije

Veća vrijednost standardne devijacije ukazuje na veće širenje vrijednosti u prikazanom skupu sa srednjom vrijednosti skupa; manja vrijednost, odnosno, označava da su vrijednosti u skupu grupirane oko prosječne vrijednosti.

Na primjer, imamo tri skupa brojeva: (0, 0, 14, 14), (0, 6, 8, 14) i (6, 6, 8, 8). Sva tri skupa imaju srednje vrijednosti od 7 i standardne devijacije od 7, 5 i 1. Posljednji skup ima malu standardnu ​​devijaciju jer su vrijednosti u skupu grupirane oko prosjeka; prvi skup ima najveću vrijednost standardne devijacije - vrijednosti unutar skupa jako odstupaju od prosječne vrijednosti.

U općem smislu, standardna devijacija se može smatrati mjerom nesigurnosti. Na primjer, u fizici se standardna devijacija koristi za određivanje pogreške niza uzastopnih mjerenja neke veličine. Ova je vrijednost vrlo važna za određivanje vjerodostojnosti fenomena koji se proučava u usporedbi s vrijednošću koju predviđa teorija: ako se srednja vrijednost mjerenja jako razlikuje od vrijednosti predviđenih teorijom (velika standardna devijacija), tada dobivene vrijednosti ili način njihova dobivanja treba ponovno provjeriti.

Praktična upotreba

U praksi, standardna devijacija omogućuje procjenu koliko se vrijednosti iz skupa mogu razlikovati od prosječne vrijednosti.

Ekonomija i financije

Standardna devijacija povrata portfelja \sigma =\sqrt(D[X]) poistovjećuje se s rizikom portfelja.

Klima

Pretpostavimo da postoje dva grada s istom prosječnom maksimalnom dnevnom temperaturom, ali se jedan nalazi na obali, a drugi u ravnici. Poznato je da obalni gradovi imaju mnogo različitih dnevnih maksimalnih temperatura nižih od gradova u unutrašnjosti. Stoga će standardna devijacija maksimalnih dnevnih temperatura u obalnom gradu biti manja nego u drugom gradu, unatoč tome što imaju istu prosječnu vrijednost te vrijednosti, što u praksi znači da je vjerojatnost da maksimalna temperatura zraka od svaki pojedini dan u godini će se jače razlikovati od prosječne vrijednosti, više za grad unutar kontinenta.

Sport

Pretpostavimo da postoji nekoliko nogometnih momčadi koje su rangirane prema nekom skupu parametara, na primjer, broju postignutih i primljenih golova, prilikama za postizanje pogotka itd. Najvjerojatnije je da će najbolja momčad u ovoj skupini imati najbolje vrijednosti u više parametara. Što je manja standardna devijacija tima za svaki od prikazanih parametara, to je rezultat tima predvidljiviji, takvi timovi su uravnoteženiji. S druge strane, momčad s velikom standardnom devijacijom teško može predvidjeti rezultat, što se pak objašnjava neravnotežom, primjerice, jaka obrana, ali slab napad.

Korištenje standardne devijacije parametara momčadi omogućuje do neke mjere predviđanje rezultata utakmice između dvije momčadi, procjenjujući snage i slabosti momčadi, a time i odabrane metode borbe.

vidi također

Napišite recenziju na članak "Standardna devijacija"

Književnost

  • Borovikov V. STATISTIKA. Umjetnost računalne analize podataka: Za profesionalce / V. Borovikov. - St. Petersburg. : Peter, 2003. - 688 str. - ISBN 5-272-00078-1..

Izvadak koji karakterizira standardnu ​​devijaciju

I, brzo otvorivši vrata, odlučnim je koracima izašao na balkon. Razgovor je odjednom prestao, šeširi i kape su skinuti, a svi su se pogledi uprli u grofa koji je izašao.
- Bok dečki! rekao je grof brzo i glasno. - Hvala na dolasku. Sada ću vam izaći, ali prije svega moramo se pozabaviti zlikovcem. Moramo kazniti zlikovca koji je ubio Moskvu. Čekaj me! - I grof se isto tako brzo vrati u odaje, snažno zalupivši vratima.
Žamor odobravanja prostrujao je kroz gomilu. “On će, dakle, kontrolirati upotrebu zlikovaca! A ti kažeš Francuz ... on će ti odvezati cijelu daljinu! govorili su ljudi, kao da jedni drugima predbacuju nedostatak vjere.
Nekoliko minuta kasnije jedan je časnik žurno izašao s ulaznih vrata, nešto naredio i draguni su se ispružili. Gomila se pohlepno kretala s balkona na trijem. Izašavši na trijem ljutitim brzim koracima, Rostopchin se žurno osvrne oko sebe, kao da nekoga traži.
- Gdje je on? - reče grof i u isti čas dok je to govorio, ugleda iza ugla kuće kako između dva dragana izlazi mladić duga, tanka vrata, poluobrijane i obrasle glave. Taj je mladić bio odjeven u nekadašnji dotjerani, plavi, otrcani bundu od lisičje kože iu prljavim zatvoreničkim hlačama iz prve ruke, uguranim u neočišćene, iznošene tanke čizme. Okovi su teško visjeli na tankim, slabim nogama, otežavajući mladićev kolebljivi hod.
- ALI! - reče Rostopčin, žurno skrećući pogled s mladića u lisičjem kaputu i pokazujući na donju stepenicu trijema. - Stavi to ovdje! Mladić je, zveckajući okovima, teško zakoračio na naznačenu stepenicu, držeći prstom pritisnuti ovratnik bunde, okrenuo dvaput dugi vrat i, uzdahnuvši, sklopio svoje mršave, neradne ruke ispred trbuha s pokorna gesta.
Zavladala je tišina nekoliko sekundi kad se mladić smjestio na stepenicu. Samo u zadnjim redovima ljudi koji su se stisnuli na jednom mjestu čulo se zapomaganje, stenjanje, trzaji i zveket presloženih nogu.
Rostopčin, čekajući da se zaustavi na naznačenom mjestu, namršteno protrlja lice rukom.
- Dečki! - rekao je Rostopčin metalnim glasom - ovaj čovjek, Vereščagin, isti je nitkov od kojeg je Moskva umrla.
Mladić u lisičjem kaputu stajao je u pokornoj pozi, ruku sklopljenih ispred trbuha i lagano pognut. Mršavo, beznadnog izraza, unakaženo obrijanom glavom, mlado lice bilo mu je spušteno. Na prve grofove riječi polako je podigao glavu i spustio pogled na grofa, kao da mu želi nešto reći ili barem susresti njegov pogled. Ali Rostopchin ga nije pogledao. Na dugom, tankom vratu mladog čovjeka, poput užeta, napela se i pomodrila žila iza uha, a lice mu odjednom pocrveni.
Sve su oči bile uprte u njega. Pogledao je gomilu i, kao da ga je umirio izraz što ga je čitao na licima ljudi, nasmiješio se tužno i bojažljivo, pa opet spustio glavu i ispravio noge na stepenici.
"Izdao je svog cara i domovinu, predao se Bonaparteu, on je jedini od svih Rusa obeščastio ime Rusa, i Moskva umire od njega", rekao je Rastopčin ravnomjernim, oštrim glasom; no odjednom je brzo spustio pogled na Vereščagina koji je nastavio stajati u istoj pokornoj pozi. Kao da ga je ovaj pogled raznio, on, podigavši ​​ruku, gotovo viknu, okrenuvši se prema narodu: - Obradite ga svojim sudom! dajem ti ga!
Narod je šutio i samo se sve jače pritiskao jedni na druge. Držanje jedno drugoga, udisanje te zaražene bliskosti, nemanje snage da se pomakne i čekanje nečeg nepoznatog, neshvatljivog i strašnog postalo je nepodnošljivo. Ljudi koji su stajali u prvim redovima, koji su vidjeli i čuli sve što se događa ispred njih, svi uplašeno razrogačenih očiju i razjapljenih usta, naprežući se iz sve snage, držali su pritisak zadnjih na svojim leđima.
- Tuci ga!.. Neka umre izdajica i ne sramoti ime Rusa! — vikne Rastopčin. - Ruby! Naručujem! - Čuvši ne riječi, već ljutite zvukove Rostopchinova glasa, gomila je zastenjala i krenula naprijed, ali se opet zaustavila.
- Računajte!.. - rekao je Vereščaginov bojažljivi i istodobno teatralni glas usred trenutne tišine. "Grofe, jedan je bog iznad nas...", rekao je Vereščagin, podigao glavu, a debela vena na njegovom tankom vratu opet se napunila krvlju, a boja je brzo izbila i nestala s njegovog lica. Nije dovršio što je htio reći.
- Reži ga! Naređujem!.. - vikne Rostopčin, odjednom problijedivši kao Vereščagin.
- Sablje van! — vikne časnik draganima i sam izvuče sablju.
Još jedan još jači val prostrujao je kroz ljude i, stigavši ​​do prvih redova, ovaj je val pokrenuo prednje, teturajući, doveo ih do samih stepenica trijema. Uz Vereščagina je stajao visok momak, skamenjena izraza lica i zaustavljene podignute ruke.
- Ruby! — gotovo je šapnuo jedan časnik dragonima, a jedan je od vojnika iznenada, s izobličenim licem od ljutnje, udario Vereščagina tupim širokim mačem po glavi.
"ALI!" - kratko i iznenađeno poviče Vereščagin, prestrašeno se osvrćući oko sebe i kao da ne shvaća zašto mu je to učinjeno. Isti jecaj iznenađenja i užasa prostrujao je kroz gomilu.
"O moj Bože!" - začuo se nečiji tužni usklik.
Ali nakon uzvika iznenađenja koji se oteo iz Vereščagina, on je žalosno uzviknuo od bola i taj ga je plač upropastio. Ona barijera ljudskog osjećaja, rastegnuta do najvišeg stupnja, koja je još držala gomilu, probila se istog trenutka. Zločin je započet, trebalo ga je dovršiti. Žalosno jecanje prijekora zaglušilo je strašno i bijesno urlanje gomile. Poput posljednjeg sedmog vala koji lomi brodove, ovaj posljednji nezaustavljivi val vinuo se iz zadnjih redova, stigao do prednjih, srušio ih i progutao sve. Dragun koji je udario htio je ponoviti svoj udarac. Vereščagin je uz krik užasa, štiteći se rukama, pojurio k ljudima. Visoki momak, na kojega je naletio, zgrabi rukama Vereščaginov mršavi vrat i uz divlji krik, zajedno s njim, pade pod noge ljudi koji su urlali na gomilu.
Neki su tukli i kidali Vereščagina, drugi su bili visoki momci. A jauci shrvanih ljudi i onih koji su pokušavali spasiti visokog momka samo su izazivali bijes gomile. Draguni dugo nisu mogli osloboditi krvavog, na smrt pretučenog tvorničkog radnika. I dugo vremena, unatoč svoj grozničavoj žurbi kojom je gomila pokušavala dovršiti započeto djelo, oni ljudi koji su tukli, davili i trgali Vereshchagina nisu ga mogli ubiti; ali ih je gomila gnječila sa svih strana, a oni su se u sredini, kao jedna masa, ljuljali s jedne strane na drugu i nisu im dali priliku ni da ga dokrajče, ni da ga ostave.