Biografije Karakteristike Analiza

Kriteriji za outliere u slučaju normalne distribucije. Metode obrade informacija i predviđanja za studente specijalnosti: “Organizacijski menadžment”

Irwinova metoda koristi se za identifikaciju abnormalnih vrijednosti razina vremenskih serija. Anomalna razina shvaća se kao zasebna vrijednost razina vremenske serije, koja ne odgovara potencijalnim mogućnostima ekonomskog sustava koji se proučava i koja, iako ostaje kao razina serije, ima značajan utjecaj na vrijednost glavnih karakteristika vremenske serije.

Uzroci nenormalnih pojava mogu biti tehničke pogreške ili pogreške prvog tipa, moraju se identificirati i otkloniti.

Osim toga, anomalne razine u vremenskoj seriji mogu nastati zbog utjecaja čimbenika koji su objektivne prirode, ali se pojavljuju epizodično. Klasificiraju se kao pogreške drugog tipa, koje se ne mogu otkloniti.

Irwinova metoda može se koristiti za prepoznavanje anomalnih opažanja. U ovom slučaju, koeficijent λ t izračunava se jednako:

,
,
.

Izračunate vrijednosti λ 2, λ 3,... uspoređuju se s tabličnim vrijednostima Irwinovog kriterija λ α. Ako se pokaže da je izračunata vrijednost λ t veća od tablice prikazane λ α, tada se odgovarajuća vrijednost y t razine serije smatra anomalnom.

Nakon utvrđivanja abnormalnih vrijednosti razina serije, potrebno je utvrditi razloge njihove pojave. Ako se točno utvrdi da su uzrokovane pogreškama prvog tipa, tada se obično otklanjaju zamjenom aritmetičke sredine dviju susjednih razina niza ili zamjenom vrijednosti odgovarajuće krivulje trenda.

Prilikom provjere prisutnosti anomalnih oscilacija metodom Irvine dobivene su sljedeće izračunate vrijednosti koeficijenta λ t:

Tablica br. 13

Uspoređujući pronađene vrijednosti koeficijenta λ t s tabličnom vrijednošću λ α jednakom 1,3 za razinu značajnosti α = 0,05 i za n = 20 (broj razina vremenske serije), dobivamo da pojedinačne vrijednosti razine serije prelaze vrijednost λ α , stoga zaključujemo da u ovom modelu postoje anomalne fluktuacije uzrokovane pogreškama drugog tipa, koje se ne mogu eliminirati.

Poglavlje 8. Određivanje optimalne vrste linije trenda. Prognoza pokazatelja

Trend se shvaća kao promjena koja određuje opći smjer razvoja, glavnu tendenciju vremenske serije.

Za odabir linije trenda, najbolji način odražavajući opći smjer razvoja procesa stope refinanciranja središnje banke, stope nezaposlenosti i inflacije, potrebno je konstruirati nekoliko linija trenda i odabrati onu koja bolje odražava dinamiku razvoja pojedinog procesa.

Za izradu linija trenda morate koristiti mogućnosti TP Excel-a pomoću naredbe "Dijagram" - "Dodaj liniju trenda". U dijaloškom okviru "Linija trenda", na kartici "Tip", morate odabrati željenu vrstu linije trenda i odrediti stupanj polinoma. Na kartici "Parametri" potrebno je postaviti prekidač "Prikaži jednadžbu na dijagramu", "Postavi vrijednost pouzdanosti aproksimacije na dijagram".

Nakon konstruiranja linija trenda, trebali biste odabrati onu koja najbolje odražava dinamiku promjena u određenom procesu tijekom vremena.

Zatim biste trebali napraviti prognozu vrijednosti 3 razdoblja unaprijed koristeći odabrani trend. Trend za koji je potrebno napraviti prognozu odabire se na temelju pouzdanosti aproksimacije.

Za izradu prognoze potrebno je koristiti i mogućnosti TR Excela. U u ovom slučaju Potrebno je u dijaloškom okviru "Linija trenda" na kartici "Parametri" označiti za koliko razdoblja unaprijed želite napraviti prognozu.

Ovo predviđanje omogućuje vam da odredite kako će se nakon određenog vremenskog razdoblja proučavani pokazatelj promijeniti dok ostali pokazatelji ostaju nepromijenjeni.

Nakon konstruiranja linije trenda za pokazatelj stope refinanciranja Centralne banke, linija trenda 2 odabrana je kao optimalna linija trenda, što odgovara jednadžbi:

Y = -0,0089x 3 +0yu3152x 2 -3,5642x+37,014; R2 = 0,8048

Za pokazatelj stope nezaposlenosti kao optimalna linija trenda odabrana je linija trenda 1 koja odgovara jednadžbi:

Y = -6E-06x 4 +0,0003x 3 -0,0038x 2 +0,0187x+0,0291; R2 = 0,8771

Za pokazatelj stope inflacije kao optimalna linija trenda odabrana je linija trenda 2 koja odgovara jednadžbi:

Y = -0,0064x 3 +0,2186x 2 -2,3701x+14,603; R2 = 0,7703

Prognoze izrađene pomoću odabranih linija trenda daju najtočniji opis ponašanja indikatora u budućnosti.

z 1 prognoza

z 2 prognoza

y prognoza

t prognoza

Zamjenom dobivenih predviđenih vrijednosti u prethodno izračunatu regresijsku jednadžbu,

dobivamo y = 13.12990776.

Koristi se za procjenu upitnih vrijednosti uzorka za velike pogreške. Redoslijed njegove primjene je sljedeći.

Odredite izračunatu vrijednost kriterija λ calc = (|x k - x k prethodni |)/σ,

Gdje x k– sumnjivo značenje, x do prije– prethodna vrijednost u nizu varijacija, ako x k procijenjeno iz maksimalnih vrijednosti varijacijske serije, ili sljedeće if x k procjenjuje se iz minimalnih vrijednosti niza varijacija (Irwin korišten u opći slučaj izraz "prvo značenje"); σ – opća havarija standardna devijacija(RMS) kontinuirana normalna raspodjela nasumična varijabla.

Ako λ izračun > λ tab, x kgreška. Ovdje λ tablica– tablična vrijednost (postotni bod) Irwinovog kriterija.

Pitanja koja se postavljaju opisana su na stranici. Konkretno, u izvornom članku, tablične vrijednosti kriterija izračunate su za normalno raspodijeljenu slučajnu varijablu s poznatom općom standardnom devijacijom (RMSD) σ . Jer σ najčešće nepoznat, Irvine je predložio korištenje u izračunima umjesto toga σ standardna devijacija uzorka s, određena formulom

Gdje n- veličina uzorka, x i– elementi uzorka, x oženiti se– srednja vrijednost uzorka.

Ovaj pristup se obično koristi u praksi. Međutim, nije potvrđena prihvatljivost korištenja uzorka MSE, a ujedno i postotnih bodova za opći MSE.

Ovaj članak predstavlja tablične vrijednosti (postotne bodove) Irvineovog kriterija, izračunate statističkim računalnim modeliranjem korištenjem standardne devijacije uzorka za maksimalnu vrijednost niza varijacija sa standardnom normalnom distribucijom slučajne varijable (s drugim parametrima normalna distribucija, kao i za minimalnu vrijednost niza varijacija, dobivaju se isti rezultati). Za svaku veličinu uzorka n Simulirano je 10 6 uzoraka. Kao što su preliminarni izračuni pokazali, sa paralelne definicije razlike u postotnim vrijednostima mogu biti i do 0,003. Budući da su vrijednosti zaokružene na najbližih 0,01, u sumnjivim slučajevima provedena su 2 do 4 paralelna određivanja.

Osim toga, na temelju podataka izračunali smo tablične vrijednosti Irvineovog kriterija za poznatu opću standardnu ​​devijaciju i usporedili ih s onima danima u .

Od kad praktična aplikacija Irwinov kriterij često uzrokuje određene poteškoće zbog nedostatka literarni izvori Tablične vrijednosti kriterija za pojedine veličine uzorka izračunate su istom metodom statističkog računalnog modeliranja, a neke od vrijednosti nedostaju u tablicama.

Jasno je da s veličinom uzorka od 2, primjena kriterija koji koristi standardnu ​​devijaciju uzorka nema smisla. To potvrđuje i činjenica da se pojednostavljenjem izraza za izračunatu vrijednost kriterija sa standardnom devijacijom uzorka dobiva Korijen od dva, što jasno pokazuje besmislenost korištenja kriterija s veličinom uzorka 2 i standardnom devijacijom uzorka.

Dobiveni rezultati prikazani su u tablici. 1.

Tablica 1 - Tablične vrijednosti Irwinovog kriterija za ekstremni elementi varijacijske serije.

Veličina uzorkaPrema općoj standardnoj devijacijiPrema standardnoj devijaciji uzorka
Razina značajnosti
0,1 0,05 0,01 0,1 0,05 0,01
2 2,33* 2,77* 3,64* - - -
3 1,79* 2,17* 2,90* 1,62 1,68 1,72
4 1,58 1,92 2,60 1,55 1,70 1,88
5 1,45 1,77 2,43 1,45 1,64 1,93/
6 1,37 1,67 2,30 1,38 1,60 1,94
7 1,31 1,60 2,22 1,32 1,55 1,93
8 1,26 1,55 2,14 1,27 1,51 1,92
9 1,22 1,50 2,09 1,23 1,47 1,90
10 1,18* 1,46* 2,04* 1,20 1,44 1,88
11 1,15 1,43 2,00 1,17 1,42 1,87
12 1,13 1,40 1,97 1,15 1,39 1,85
13 1,11 1,38 1,94 1,13 1,37 1,83
14 1,09 1,36 1,91 1,11 1,35 1,82
15 1,08 1,34 1,89 1,09 1,33 1,80
20 1,03* 1,27* 1,80* 1,03 1,27 1,75
25 0,99 1,23 1,74 0,99 1,22 1,70
30 0,96* 1,20* 1,70* 0,96 1,19 1,66
35 0,93 1,17 1,66 0,94 1,16 1,63
40 0,91* 1,15* 1,63* 0,92 1,14 1,61
45 0,89 1,13 1,61 0,90 1,12 1,59
50 0,88* 1,11* 1,59* 0,89 1,10 1,57
60 0,86* 1,08* 1,56* 0,87 1,08 1,54
70 0,84* 1,06* 1,53* 0,85 1,06 1,52
80 0,83* 1,04* 1,51* 0,83 1,04 1,50
90 0,82* 1,03* 1,49* 0,82 1,03 1,48
100 0,81* 1,02* 1,47* 0,81 1,02 1,46
200 0,75* 0,95* 1,38* 0,75 0,95 1,38
300 0,72* 0,91* 1,33* 0,72 0,91 1,33
500 0,69* 0,88* 1,28* 0,69 0,88 1,28
1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
Napomena: vrijednosti označene zvjezdicom izračunate su iz podataka i po potrebi prilagođene statistički računalno modeliranje. Preostale vrijednosti izračunate su pomoću statističkog računalnog modeliranja.

Usporedimo li postotne bodove za dobro poznatu opću standardnu ​​devijaciju danu u tablici. 1, s odgovarajućim postotnim bodovima danim u , tada se razlikuju u nekoliko slučajeva za 0,01, au jednom slučaju za 0,02. Očigledno su postotni bodovi navedeni u ovom članku točniji, budući da su u sumnjivim slučajevima potvrđeni statističkim računalnim modeliranjem.

Iz tablice 1. može se vidjeti da se postotni bodovi Irvineovog kriterija pri korištenju standardne devijacije uzorka s relativno malim veličinama uzorka značajno razlikuju od postotnih bodova pri korištenju opće standardne devijacije. Tek sa značajnom veličinom uzorka, približno 40, postotni bodovi postaju bliski. Stoga, kada koristite Irvineov kriterij, trebali biste koristiti postotke navedene u tablici. 1, uzimajući u obzir je li izračunata vrijednost kriterija dobivena općom ili standardnom devijacijom uzorka.

KNJIŽEVNOST

1. Irvin J.O. O kriteriju za odbacivanje vanjskog promatranja //Biometrika.1925. V. 17. Str. 238 – 250.

2. Kobzar A.I. Primijenjena matematička statistika. – M.: FIZMATLIT, 2006. – 816 str. © V.V. Zalyazhnykh
Prilikom korištenja materijala navedite vezu.

Problem 19.1 Pukotina se nalazi u polju maksimalnih vlačnih naprezanja uzrokovanih eksplozijom jednog cilindričnog naboja Odredite udaljenost od naboja do pukotine na kojoj je moguć njezin rast.

Početni podaci: duljina pukotine 2 l=0,1m; stijena – kvarciti s lomnom žilavošću DO I =2,6∙10 6 N/m 3/2; maksimalni tlak punjenja u bušotini P 0 =1,2∙10 10 Pa.

Riješenje. Raspodjela maksimalnih kvazistatičkih naprezanja približno je opisana ovisnostima:

gdje su i radijalna i obodna naprezanja;

R 0 – maksimalni tlak pri eksploziji punjenja u bušotini;

r 0 – radijus naboja, m;

r– udaljenost do predmetne točke, m;

n– eksponent koji uzima vrijednosti n=2 in elastični medij; u stvarnom okruženju, uzimajući u obzir stvaranje mnogih pukotina u zonama mljevenja i drobljenja, eksponent je veći od dva; eksperimentalna vrijednost je unutar n=2,1...2,3. U izračunu koristimo Prosječna vrijednost n=2,2.

U skladu s Irwinovim kriterijem, do rasta pukotine dolazi kada faktor intenziteta naprezanja dosegne vrijednost lomne žilavosti:

K 1 = DO c , (19.3)

Gdje DO I je faktor intenziteta naprezanja, čija se vrijednost u ovom slučaju, uzimajući u obzir znak vlačnih naprezanja, izračunava formulom

. (19.4)

Zamjenom (19.4) uzimajući u obzir (19.1) i (19.2) u (19.3) nakon transformacija dobivamo:

(19.5)

Slika 19.1 prikazuje rezultat izračuna. U danim uvjetima udaljenost od naboja do pukotine na kojoj je moguć njegov rast je 3,8 m. Na temelju računske ovisnosti (19.5) može se konstatirati da što je veći radijus naboja, tlak i polovice duljine pukotine, veći je radijus zone drobljenja.

Mogućnosti l I KI su tehnološki nekontrolirani i karakteriziraju svojstva stijenske mase. Kontrolirani parametri su radijus naboja r 0 i maksimalnu vrijednost tlaka P0. Tako, na primjer, udvostručenje polumjera naboja dovodi do linearnog povećanja polumjera r Zona drobljenja je također udvostručena. Ako je maksimalni tlak P0 u bunaru udvostručen, zatim polumjer r Zona drobljenja se povećava približno 1,4 puta. Ovaj praktični zaključak proizlazi iz mehanike loma koja koristi Irwinov kriterij.

Problem 19.2 Na konturi horizontalnog podzemnog rudnika koji radi u pješčenjaku postoje horizontalna naprezanja σ z usmjerena duž osi radnih i obodna naprezanja σ θ. U površinskom sloju rudnika nalaze se kaotično raspoređene pukotine dužine 2 l. Odrediti kritične veličine pukotina pri kojima dolazi do njihovog rasta.

Početni podaci: σ z =10 MPa, σ θ =20 MPa. Lomna žilavost pješčenjaka za pukotinu u polju smičnih naprezanja (pukotina druge klase) je K II=0,96∙10 6 N/m 3/2.

Riješenje. Na konturu iskopa djeluju sljedeća glavna naprezanja: σ 1 =20 MPa; σ 2 =10 MPa; σ 3 =0. Maksimalni tangencijalni naponi koji djeluju u ravnini pod kutom od 45° u odnosu na površinu iskopa su:

. (19.5)

Ako se pukotina nalazi u ravnini djelovanja maksimalnih tangencijalnih naprezanja, tada se njezina maksimalna stabilna veličina može odrediti Irvineovim kriterijem.

3

1 Tehnički institut(ogranak) FSAOU VPO "Sjeveroistočni" federalno sveučilište nazvan po M.K. Ammosova"

2 Institut za tektoniku i geofiziku nazvan po. Yu.A. Kosygina FEB RAS

3 Akademija znanosti Republike Saha (Jakutija)

Prikazani su rezultati numeričkog modeliranja identifikacije anomalnih (vršnih) razina pozitivno definirane vremenske serije korištenjem Irvine metode. Za simulaciju je korišten niz numeričkih podataka u obliku pojedinačnih vršnih vrijednosti, kompliciranih slučajnim šumom i sinusoidnim signalom. U okviru aditivnog modela inicijalne serije uspješno se rješava problem razdvajanja normalnih i anomalnih razina Irwinovom metodom u slučajevima pojedinačnih impulsa. Međutim, čak iu ovom slučaju, član serije s pozadinskom razinom koja slijedi nakon vršne vrijednosti tumači se kao anomalan. U zadacima automatizirane obrade podataka, nizovi vrhova su komplicirani proporcionalnim brojem vrijednosti pozadinskih komponenti. Za slučajeve kada broj vrhova prelazi 50% od ukupni broj vrijednosti niza, a još više za uzastopne vrhove, formirani niz pozadinskih podataka kompliciran je vršnom komponentom zbog povećanja disperzije. Kao rezultat numeričkog modeliranja razvijena je tehnika u obliku modificirana metoda Irwin za adekvatnu identifikaciju anomalnih razina serije. Ovaj zadatak relevantni za elektromagnetske sustave praćenja pražnjenja groma i traženje različitih izvora elektromagnetska radijacija tektonske prirode.

elektromagnetska radijacija

odvajanje na razini retka

modifikacija Irwinove metode

Irwinova metoda

abnormalne razine serije

vremenske serije

1. Kalinina V.N., Pankin V.F. Matematička statistika. – M.: postdiplomske studije, 2001. – 336 str.

2. Trofimenko S.V. Metode i primjeri statističke procjene vremenske serije // Međunarodni časopis eksperimentalno obrazovanje", br. 9, 2013.-str. 41-42.

3. Trofimenko S.V. Manifestacija potresa na pozadini stacionarnog seizmičkog procesa u zoni Olekmo-Stanovoy (OSZ) Rudarski informativno-analitički bilten (znanstveni i tehnički časopis). 2007. T. 17. br. 1. str. 208-213.

4. Trofimenko S.V. Geofizička polja i seizmičnost južne Jakutije // Rudarski informativno-analitički bilten (znanstveni i tehnički časopis). 2007. T. 17. br. 1. str. 188-196.

5. Trofimenko S.V. Detaljna geološka i geofizička istraživanja aktivnih rasjednih zona i seizmičke opasnosti regije Južni Jakut / A.N. Ovsyuchenko, Trofimenko S.V., Marakhanov A.V., P.S., Karasev, E.A. Rogozhin, V.S. Imaev, V.M. Nikitin, N.N. Grib // Pacific Geology, 2009. – svezak 28. – br. – Str. 55-74.

6. Trofimenko S.V. Žarišne zone jaki potresi Južna Jakutija / Ovsyuchenko A.N., Trofimenko S.V., Marakhanov A.V., P.S., Karasev, E.A. Rogozhin, V.S. //Fizika Zemlje. 2009. br. 2. str 15-33.

7. Trofimenko S.V. Seizmotektonika prijelaznog područja od Bajkala zona rascjepa orogenom uzdizanju planine Stanovoy / A.N. Ovsyuchenko, Trofimenko S.V., Marakhanov A.V., P.S., Karasev, E.A. Rogozhin, V.S. // Geotektonika, 2010, br. 1, str. 29-51 (prikaz, ostalo).

8. Trofimenko S.V. Tektonska interpretacija statistički model distribucije azimuta anomalija gravimagnetskih polja Aldanskog štita. – Pacifička geologija. – 2010. – Svezak 29. – 3. br. – Str. 64-77.

9. Trofimenko S.V. Aktivni nektonski poremećaji dionice Aldan-Nagorny sustava naftovoda Istočni Sibirtihi ocean/Karasev P.S., Ovsyuchenko A.N., Marakhanov A.V., Trofimenko S.V. // Industrija nafte. – 2008. – Broj 9. –S. 80-84 (prikaz, ostalo).

Geofizičko praćenje atmosferskih izvora elektromagnetskog zračenja, razvijeno za bilježenje i kontrolu kretanja pražnjenja munje, može se koristiti za daljinsko praćenje geodinamičkih procesa u zemljinoj kori povezanih s novim izvorima potresa i aktivnim rasjedima Zemljina kora. Važno pitanje pri tumačenju anomalija elektromagnetskog zračenja (EMZ) potrebno je razdvojiti anomalije prema vrsti izvora zračenja, što je u radu detaljno obrađeno.

Ukupni EMR signal može se predstaviti kao:

gdje su i anomalni puls (vrhovi) i pozadinske komponente signala slučajne komponente. Štoviše, a priori, funkcija izvora signala nije poznata, tj. vrsta modela određena (1) nije poznata za njega.

U linearna teorija Elektromagnetski valovi Usvojen je aditivni model početne serije EMR opažanja temeljen na principu superpozicije. Ako je vremenska serija prikazana kao zbroj odgovarajućih komponenti, tada se rezultirajući model naziva aditivnim i ima oblik (bez uzimanja u obzir trenda i sezonska komponenta):

, (2)

gdje su razine vremenske serije.

Ovaj rad predstavlja rezultate simulacijsko modeliranje odvajanje EMR polja na temelju Statistička analiza vremenski niz opažanja koji odražava stvarno stanje geofizičke okoline.

Na sl. Na slikama 1 i 2 prikazani su rezultati promatranja EMR signala tijekom razdoblja slabo poremećenog (Slika 1) i poremećenog (Slika 2) stanja geofizičke okoline. Kvalitativno identificiranje pozadinske komponente na poremećeni dan vrlo je problematično.

Kako bi se testirala tehnologija za odvajanje EMR polja na pozadinske i pulsne komponente u modelu (2), stvorena je simulacijska datoteka u okruženju proračunske tablice Excel. Ukupni niz početnih podataka (2) sastavljen je od zbroja nizova vršnih vrijednosti, čiji se broj impulsa može proizvoljno postaviti, i pozadinske komponente niza u obliku zbroja periodičnih sinusoidalnih i slučajna komponenta red (slika 3). Ukupna serija je podvrgnuta algoritmu za identifikaciju impulsa Irvine metodom (peak metoda), koja se koristi u praksi statističke analize vremenskih serija radi identifikacije anomalnih razina serije.

Riža. 1. Početna serija vrijednosti amplitude EMR signala na dan slabog poremećaja 01.04.2013.

Riža. Slika 2. Početni niz vrijednosti amplitude EMR signala na jako poremećeni dan, 13. siječnja 2013.

Riža. 3. Komponente niza modela za simulaciju EMR signala

Neka postoji vremenska serija. Irwinova metoda uključuje korištenje relacije

Gdje - standardna devijacija, - prosječna vrijednost amplituda, za procjenu nepravilnog povećanja amplitude sljedećeg člana niza pod pretpostavkom da se prethodni član niza odnosi na pozadinsku komponentu signala. Izračunate vrijednosti uspoređuju se s tabličnim vrijednostima Irwinovog kriterija; ako se bilo koja od njih pokaže većom od vrijednosti tablice, tada se odgovarajuća vrijednost razine reda smatra anomalnom. Vrijednosti Irwinovog kriterija za razinu značajnosti dane su u tablici 1.

stol 1

Kritične vrijednosti za razinu značajnosti

Za praktične proračune sa poznata duljina implementacije, možete koristiti analitički izraz za određivanje kritičnih vrijednosti za koje je pogreška aproksimacije manja od 1%:

, (4)

Numerički eksperimenti su pokazali sljedeće: prvo, za jedan vrh (anomalna razina) u odnosu na pozadinsku razinu, sljedeći član niza također se tumači kao anomalan, iako je amplituda njegovog pulsa usporediva s pozadinskom vrijednošću. Drugo, ista će pogreška biti prisutna ako postoji nekoliko anomalnih razina , , … u izvornoj seriji. U ovom slučaju, prva nepravilna razina i pozadinska razina nakon niza anomalija bit će uzete kao nepravilna razina. Sve srednje anomalije, ..., bit će pripisane pozadinskoj komponenti serije. To će dovesti do iskrivljenja (precjenjivanja) ovojnice pozadinske komponente (slika 4).

Interaktivnom metodom odvajanja razina niza, operater odbija fiktivne anomalne razine. U zadacima automatizirane obrade podataka, nizovi vrhova su komplicirani proporcionalnim brojem vrijednosti pozadinskih komponenti.

Za one slučajeve kada broj vrhova prelazi 50% ukupnog broja vrijednosti u nizu, a još više za uzastopne vrhove, generirani niz pozadinskih podataka je kompliciran komponentom vrha (slika 5). Očito ove pogreške još nisu omogućile Irwinovoj metodi da pronađe široku primjenu u praksi. statistička istraživanja vremenske serije.

Riža. 4. Prikaz komplikacije pozadinske komponente niza anomalnim razinama pri korištenju Irvineove metode

Riža. 5. Komplikacija pozadinske komponente simulacijske serije pri 50% omjeru vršne i pozadinske komponente

Kao rezultat numeričkog modeliranja različitih omjera signal/šum, razvijena je tehnika u obliku modificirane Irvine metode za adekvatno razdvajanje anomalnih (vršnih) i pozadinskih razina serije. Ova zadaća, kao što je gore navedeno, relevantna je za sustave za elektromagnetsko praćenje pražnjenja groma i traženje različitih izvora elektromagnetskog zračenja tektonske prirode.

Kako bi se eliminirale navedene pogreške Irvineove metode, razvijene su tri proračunske mogućnosti za odvajanje rad razina, čija je uporaba opravdana složenošću omjera signala i šuma u stvarnim eksperimentalnim podacima, na primjer, kao što je prikazano na Sl. 12.

U najjednostavnijem slučaju, da bi se izolirali pojedinačni vrhovi pozitivno određenog niza, uvjet nenegativnosti razlike dodaje se Irwinovom uvjetu (3), tj. . Sve anomalne razine u pozadinskoj komponenti niza zamjenjuju se vrijednostima pomoću parabolične interpolacijske formule:

, (5)

gdje su članovi serije pozadinskih komponenti koji prethode anomalnoj razini. Budući da prvi član niza može imati anomalnu amplitudu, dodatna tri člana niza s minimalnom amplitudom postavljaju se na početak niza. Rezultati numeričke simulacije prema ovaj algoritam prikazano na sl. 6.

Riža. 6. Izolacija pozadinske komponente simulacijske serije u prisutnosti pojedinačnih vršnih komponenti uz dodatni uvjet da razlika između uspoređenih amplituda uzastopnih članova serije nije negativna.

Usporedba s rezultatima izračuna pomoću jednostavan algoritam Irwin (slika 4) jasno pokazuje potrebu uvođenja u algoritam dodatnog uvjeta da razlika nije negativna.

Kada se broj anomalnih razina poveća na 50%, zamjena vršnih vrijednosti prema formuli (5) dovodi do komplikacije pozadinske komponente s prosječnim vrijednostima amplitude anomalnih razina (slika 5). U ovom slučaju koristi se algoritam sekvencijalna eliminacija abnormalne razine.

Amplitude signala anomalnih razina u pozadinskoj komponenti zamjenjuju se prema formuli (5) s povratkom na početak ciklusa izračuna. U ovom slučaju, vrijednost standardne devijacije izračunava se za početnu seriju i uzima se kao konstanta tijekom ponovljenih izračuna.

Ovaj algoritam omogućuje odgovarajuće odvajanje pozadinske i pulsne komponente, ali zahtijeva više vremena za izračune, budući da se dnevno u nizu podataka nakuplja do 80 000 ili više impulsa, što će dovesti do kašnjenja u prikazu rezultata u stvarnom vremenu u automatizirani sustavi nadzora.

Za slučajeve poremećenog stanja geofizičke okoline (vidi sliku 2) razvijen je algoritam s konstrukcijom niza varijacija s rastućim amplitudama signala. Za = (20-40)% ukupnog broja članova niza varijacija izračunava se standardna devijacija i primjenjuje se Irwinova metoda dok se ne pojavi prva anomalna razina. Maksimalna vrijednost iz prvih (k-1) razina varijacijskog niza uzima se kao granična vrijednost pozadinske komponente, prema kojoj se odvajaju komponente izvornog niza.

Numeričko modeliranje korištenjem podataka iz eksperimenta u punoj veličini pokazalo je da ako postoje samo dvije komponente u izvornoj seriji, tada je pozadinska komponenta odvojena od izvorne serije bez izobličenja. U prisutnosti nekoliko izvora EMR-a, metoda je osjetljiva na izbor broja članova niza varijacija za izračun. To može dovesti do izostavljanja anomalnih izvora signala ili do identifikacije imaginarnih izvora (pogreške prvog i drugog tipa). Kako bi se uklonile ove pogreške u sustavu automatskog praćenja, predlaže se izvođenje izračuna korištenjem različitih postotnih uzoraka iz serije varijacija za izračun i primjenu Irvineove metode. Adekvatnost modela u svim slučajevima provjerava statističke karakteristike rezidualne serije. Izračuni provedeni za dva dana s različitim stanjima poremećaja u geofizičkom okruženju (sl. 1, 2) pokazali su konvergenciju modela pozadinskih komponenti identificiranih pomoću metoda eliminacije vrhova i konstruiranja varijacijskog niza na = (35 - 45) %.

Recenzenti:

Omelyanenko A.V., doktor tehničkih znanosti, profesor, glavni istraživač Laboratorija za inženjersku geokriologiju Instituta za permafrost znanosti nazvan. P.I.Melnikov SB RAS, Yakutsk;

Imaev V.S., doktor geologije i mineralogije, profesor, Ch. Istraživač u Institutu za Zemljinu koru SB RAS, Irkutsk.

Bibliografska poveznica

Trofimenko S.V., Trofimenko S.V., Marshalov A.Ya., Grib N.N., Kolodeznikov I.I. MODIFIKACIJA IRWINOVE METODE ZA OTKRIVANJE ANOMALNIH RAZINA VREMENSKIH NIZOVA: METODA I NUMERIČKI EKSPERIMENTI // Suvremena pitanja znanosti i obrazovanja. – 2014. – br. 5.;
URL: http://science-education.ru/ru/article/view?id=15130 (datum pristupa: 18.03.2019.). Predstavljamo vam časopise izdavačke kuće "Akademija prirodnih znanosti"

Osim toga, anomalne razine u vremenskoj seriji mogu nastati zbog utjecaja faktora koji su objektivne prirode, ali se pojavljuju epizodično ili vrlo rijetko - greške drugog tipa , ne mogu se eliminirati.

Za identifikaciju anomalnih razina vremenskih serija koriste se metode izračunate za statističke populacije.

Irwinova metoda.

Irwinova metoda uključuje korištenje sljedeće formule:

gdje se standardna devijacija izračunava pomoću formula:

. (2)

Izračunate vrijednosti uspoređuju se s tabličnim vrijednostima Irvineovog kriterija, a ako su veće od tabličnih, tada se odgovarajuća vrijednost razine serije smatra anomalnom. Vrijednost Irwinovog kriterija za razinu značajnosti, tj. s pogreškom od 5% prikazani su u tablici 4.

Tablica 4.

2,8 2,3 1,5 1,3 1,2 1,1 1,0

Nakon utvrđivanja abnormalnih razina niza, potrebno je utvrditi razloge njihovog nastanka!

Ako se točno utvrdi da je anomalija uzrokovana pogreškama prve vrste, tada se odgovarajuće razine niza "ispravljaju" bilo zamjenom jednostavne aritmetičke sredine susjednih razina niza, bilo dobivenim vrijednostima iz krivulje koja aproksimira dani vremenski niz u cjelini.

Metoda za ispitivanje razlika srednjih razina.

Provedba ove metode sastoji se od četiri faze.

1. Izvorna vremenska serija podijeljena je u dva dijela s približno jednakim brojem razina: u prvom dijelu prve razine izvorne serije, u drugom - preostale razine .

2. za svaki od ovih dijelova izračunavaju se srednja vrijednost i varijanca:

3. provjera jednakosti (homogenosti) varijanci obaju dijelova niza pomoću Fisherova F-testa koji se temelji na usporedbi izračunate vrijednosti ovog kriterija:

s tabelarnom (kritičnom) vrijednošću Fisherovog kriterija sa zadanom razinom značajnosti (razinom pogreške). Vrijednosti koje se najčešće uzimaju su 0,1 (10% pogreške), 0,05 (5% pogreške), 0,01 (1% pogreške). Količina se zove povjerenje vjerojatnost. Ako je izračunata (empirijska) vrijednost F manja od tablične, tada se hipoteza o jednakosti varijanci prihvaća i prelazi se na četvrtu fazu. U protivnom hipoteza o jednakosti varijanci se odbacuje i zaključuje se da ovu metodu ne daje odgovor za utvrđivanje prisutnosti trenda.

4. Hipoteza o nepostojanju trenda testira se pomoću Studentovog t-testa. Da biste to učinili, izračunata vrijednost Studentovog kriterija određuje se pomoću formule:

(3)

gdje je standardna devijacija razlike između srednjih vrijednosti:

.

Ako je izračunata vrijednost manja od tablične vrijednosti Studentove statistike sa zadanom razinom značajnosti, hipoteza se prihvaća, odnosno nema trenda, u protivnom postoji trend. Imajte na umu da je u ovom slučaju tablična vrijednost uzeta za broj stupnjeva slobode jednak , a ova metoda je primjenjiva samo za serije s monotonom tendencijom.

Foster-Stewartova metoda.

Ova metoda ima velike mogućnosti i daje pouzdanije rezultate u odnosu na prethodne. Osim trenda same serije (trend u prosjeku), omogućuje vam da utvrdite prisutnost trenda u disperziji vremenske serije: ako nema disperzijskog trenda, tada je raspršenost razina serija konstantna; ako se disperzija povećava, tada se niz "ljulja" itd.

Provedba metode također se sastoji od četiri faze.

1. svaka razina se uspoređuje sa svim prethodnima, a određuju se dvije nizovi brojeva:

2. izračunate su vrijednosti:

Lako je vidjeti da vrijednost koja karakterizira promjenu u vremenskoj seriji ima vrijednosti od 0 (sve razine serije su međusobno jednake) do (serija je monotona). Vrijednost karakterizira promjenu u disperziji razina vremenske serije i varira od (serija monotono opada) do (serija monotono raste).

1. odstupanje vrijednosti od vrijednosti matematičkog očekivanja vrijednosti za niz u kojem su razine slučajno smještene;

2. odstupanje vrijednosti od nule.

Ova provjera se provodi pomoću izračunatih (empirijskih) vrijednosti Studentovog testa za srednju vrijednost i za varijancu:

Gdje očekivana vrijednost vrijednost određena za niz u kojem se razine nalaze nasumično;