Биографии Характеристики Анализ

Критерии за отклонения в случай на нормално разпределение. Методи за обработка на информация и прогнозиране за студенти от специалност: "Управление на организации"

Методът на Irwin се използва за идентифициране на необичайни стойности на нивата на времеви редове. Под аномално ниво се разбира отделна стойност на нивата на динамичен ред, която не съответства на потенциалните възможности на изследваната икономическа система и която, оставайки като ниво на серията, оказва значително влияние върху стойността на основните характеристики на динамичния ред.

Причините за аномалните явления могат да бъдат технически грешки или грешки от първи тип, те трябва да бъдат идентифицирани и отстранени.

В допълнение, аномални нива във времеви редове могат да възникнат поради влиянието на фактори, които са обективни по природа, но се появяват епизодично. Те се класифицират като грешки от втори тип, които не могат да бъдат отстранени.

Методът на Irwin може да се използва за идентифициране на аномални наблюдения. В този случай коефициентът λ t се изчислява равен на:

,
,
.

Изчислените стойности λ 2, λ 3,... се сравняват с табличните стойности на критерия Irwin λ α. Ако се окаже, че изчислената стойност λ t е по-голяма от табличната λ α, тогава съответната стойност y t на серийното ниво се счита за аномална.

След идентифициране на необичайни стойности на серийните нива е необходимо да се определят причините за тяхното възникване. Ако е точно установено, че те са причинени от грешки от първия тип, тогава те обикновено се елиминират чрез замяна на средното аритметично на две съседни нива на серията или чрез замяна на стойността на съответната крива на тренда.

При проверка за наличие на аномални колебания по метода на Irvine бяха получени следните изчислени стойности на коефициента λ t:

Таблица № 13

Сравнявайки намерените стойности на коефициента λ t с табличната стойност λ α, равна на 1,3 за нивото на значимост α = 0,05 и за n = 20 (броя на нивата на времевия ред), получаваме, че индивидуални ценностинивата на серията надвишават стойността λ α , поради което заключаваме, че в този модел има аномални флуктуации, причинени от грешки от втори тип, които не могат да бъдат елиминирани.

Глава 8. Определяне на оптималния тип тренд линия. Прогноза на индикатора

Тенденцията се разбира като промяна, която определя общата посока на развитие, основната тенденция на динамичния ред.

За да изберете тренд линия, по най-добрия начинотразявайки общата посока на развитието на процеса на рефинансиране на централната банка, нивото на безработица и инфлацията, е необходимо да се изградят няколко линии на тенденция и да се избере тази, която по-добре отразява динамиката на развитието на конкретен процес.

За да изградите трендови линии, трябва да използвате възможностите на TP Excel чрез командата "Диаграма" - "Добавяне на трендова линия". В диалоговия прозорец "Линия на тренд", в раздела "Тип", трябва да изберете желания тип линия на тренд и да посочите степента на полинома. В раздела „Параметри“ трябва да зададете превключвателя „Показване на уравнението на диаграмата“, „Поставяне на стойността на достоверността на приближението върху диаграмата“.

След като построите линиите на тренда, трябва да изберете тази, която най-добре отразява динамиката на промените в даден процес във времето.

След това трябва да направите прогноза за стойностите 3 периода напред, като използвате избрания тренд. Тенденцията, за която е необходимо да се направи прогноза, се избира въз основа на надеждността на приближението.

За да направите прогноза, трябва да използвате и възможностите на TR Excel. IN в такъв случайНеобходимо е в диалоговия прозорец "Линия на тренда" в раздела "Параметри" да посочите за колко периода напред искате да направите прогноза.

Тази прогноза ви позволява да определите как след определен период от време ще се промени изследваният индикатор, докато други индикатори остават непроменени.

След построяването на тренд линия за индикатора за процент на рефинансиране на централната банка, тренд линия 2 беше избрана като оптимална тренд линия, която съответства на уравнението:

Y = -0,0089x 3 +0yu3152x 2 -3,5642x+37,014; R2 = 0,8048

За индикатора за нивото на безработица линия на тенденция 1 беше избрана като оптимална линия на тенденция, която съответства на уравнението:

Y = -6E-06x 4 +0,0003x 3 -0,0038x 2 +0,0187x+0,0291; R2 = 0,8771

За индикатора за темп на инфлация линия на тренд 2 беше избрана като оптимална линия на тренд, която съответства на уравнението:

Y = -0,0064x 3 +0,2186x 2 -2,3701x+14,603; R2 = 0,7703

Прогнозите, направени с помощта на избрани трендови линии, предоставят най-точното описание на поведението на индикаторите в бъдеще.

z 1 прогноза

z 2 прогноза

y прогноза

t прогноза

Замествайки получените прогнозирани стойности в предварително изчисленото регресионно уравнение,

получаваме y = 13.12990776.

Използва се за оценка на съмнителни пробни стойности за груби грешки. Редът на прилагането му е следният.

Намерете изчислената стойност на критерия λ calc = (|x k - x k предишен |)/σ,

Където x k– съмнително значение, x до pre– предишната стойност в серията вариации, ако x kоценени от максималните стойности вариационна серия, или следното ако x kсе оценява от минималните стойности на вариационната серия (Ъруин, използван в общ случайтерминът "първо значение"); σ – обща авария стандартно отклонение(RMS) непрекъснато нормално разпределено случайна величина.

Ако λ изчислено > λ табл, x kгаф. Тук λ таблица– таблична стойност (процентен пункт) на критерия на Irwin.

Въпросите, които възникват, са описани на страницата. По-специално, в оригиналната статия табличните стойности на критерия се изчисляват за нормално разпределена случайна променлива с известно общо стандартно отклонение (RMSD) σ . Тъй като σ най-често неизвестен, Ъруин предложи вместо това да се използва в изчисленията σ извадково стандартно отклонение s, определено по формулата

Където н– размер на извадката, x i– примерни елементи, х ср– извадкова средна стойност.

Този подход обикновено се използва на практика. Въпреки това приемливостта на използване на примерна MSE и в същото време процентни точки за общата MSE не е потвърдена.

Тази статия представя таблични стойности (процентни точки) на критерия Irvine, изчислени чрез статистическо компютърно моделиране, като се използва извадково стандартно отклонение за максималната стойност на вариационна серия със стандартно нормално разпределение на случайна променлива (с други параметри нормална дистрибуция, както и за минималната стойност на вариационната серия се получават същите резултати). За всеки размер на пробата нБяха симулирани 106 проби. Както показаха предварителните изчисления, с паралелни определенияразликите в стойностите на процентните пунктове могат да достигнат до 0,003. Тъй като стойностите бяха закръглени до най-близкото 0,01, в съмнителни случаи бяха извършени 2 до 4 паралелни определяния.

Освен това, въз основа на данните, ние изчислихме табличните стойности на критерия Irvine за известното общо стандартно отклонение и ги сравнихме с тези, дадени в.

Откога практическо приложениеКритерият на Ъруин често създава определени трудности поради липсата на литературни източнициСтойностите на таблицата на критерия за определени размери на извадката бяха изчислени по същия метод на статистическо компютърно моделиране, като някои от стойностите липсваха в таблиците.

Ясно е, че при размер на извадката 2 прилагането на критерий, използващ стандартно отклонение на извадката, няма смисъл. Това се потвърждава от факта, че опростяването на израза за изчислената стойност на критерия с извадково стандартно отклонение дава Корен квадратенот две, което ясно показва безсмислието на използването на критерия с размер на извадката 2 и извадково стандартно отклонение.

Получените резултати са показани в табл. 1.

Таблица 1 - Таблични стойности на критерия на Irwin за екстремни елементивариационна серия.

Размер на извадкатаСпоред общото стандартно отклонениеСпоред стандартното отклонение на пробата
Ниво на значимост
0,1 0,05 0,01 0,1 0,05 0,01
2 2,33* 2,77* 3,64* - - -
3 1,79* 2,17* 2,90* 1,62 1,68 1,72
4 1,58 1,92 2,60 1,55 1,70 1,88
5 1,45 1,77 2,43 1,45 1,64 1,93/
6 1,37 1,67 2,30 1,38 1,60 1,94
7 1,31 1,60 2,22 1,32 1,55 1,93
8 1,26 1,55 2,14 1,27 1,51 1,92
9 1,22 1,50 2,09 1,23 1,47 1,90
10 1,18* 1,46* 2,04* 1,20 1,44 1,88
11 1,15 1,43 2,00 1,17 1,42 1,87
12 1,13 1,40 1,97 1,15 1,39 1,85
13 1,11 1,38 1,94 1,13 1,37 1,83
14 1,09 1,36 1,91 1,11 1,35 1,82
15 1,08 1,34 1,89 1,09 1,33 1,80
20 1,03* 1,27* 1,80* 1,03 1,27 1,75
25 0,99 1,23 1,74 0,99 1,22 1,70
30 0,96* 1,20* 1,70* 0,96 1,19 1,66
35 0,93 1,17 1,66 0,94 1,16 1,63
40 0,91* 1,15* 1,63* 0,92 1,14 1,61
45 0,89 1,13 1,61 0,90 1,12 1,59
50 0,88* 1,11* 1,59* 0,89 1,10 1,57
60 0,86* 1,08* 1,56* 0,87 1,08 1,54
70 0,84* 1,06* 1,53* 0,85 1,06 1,52
80 0,83* 1,04* 1,51* 0,83 1,04 1,50
90 0,82* 1,03* 1,49* 0,82 1,03 1,48
100 0,81* 1,02* 1,47* 0,81 1,02 1,46
200 0,75* 0,95* 1,38* 0,75 0,95 1,38
300 0,72* 0,91* 1,33* 0,72 0,91 1,33
500 0,69* 0,88* 1,28* 0,69 0,88 1,28
1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
Забележка: стойностите, отбелязани със звездичка, се изчисляват от данните и, ако е необходимо, се коригират статистически компютърно моделиране. Останалите стойности са изчислени с помощта на статистическо компютърно моделиране.

Ако сравним процентните пунктове за добре известното общо стандартно отклонение, дадено в табл. 1, като съответните процентни точки са дадени в , то те се различават в няколко случая с 0,01, а в един случай с 0,02. Очевидно процентните точки, дадени в тази статия, са по-точни, тъй като в съмнителни случаи те са проверени чрез статистическо компютърно моделиране.

От таблица 1 може да се види, че процентните точки на критерия Irvine при използване на стандартно отклонение на извадката с относително малки размери на извадката се различават значително от процентните точки при използване на общо стандартно отклонение. Само при значителни размери на извадката, приблизително 40, процентните точки стават близки. Следователно, когато използвате критерия Irvine, трябва да използвате процентните точки, дадени в таблицата. 1, като се има предвид дали изчислената стойност на критерия е получена чрез общо или извадково стандартно отклонение.

ЛИТЕРАТУРА

1. Ървин Дж.О. Относно критерия за отхвърляне на извънредно наблюдение //Biometrika.1925. Т. 17. С. 238 – 250.

2. Кобзар А.И. Приложна математическа статистика. – М.: ФИЗМАТЛИТ, 2006. – 816 с. © В.В. Заляжних
Когато използвате материали, моля, посочете връзка.

Задача 19.1Пукнатината се намира в областта на максималните напрежения на опън, причинени от експлозията на единичен цилиндричен заряд. Определете разстоянието от заряда до пукнатината, при което е възможно нейното нарастване.

Изходни данни: дължина на пукнатината 2 л=0,1m; скално – кварцити с якост на счупване ДА СЕ I =2,6∙10 6 N/m 3/2; максимално налягане на зареждане в кладенеца П 0 =1,2∙10 10 Pa.

Решение.Разпределението на максималните квазистатични напрежения се описва приблизително от зависимостите:

където и са радиални и периферни напрежения;

Р 0 – максимално налягане при експлозия на заряд в кладенец;

r 0 – радиус на заряда, m;

r– разстояние до въпросната точка, m;

н– експонента, приемаща стойности н=2 инча еластична среда; в реална среда, като се вземе предвид образуването на много пукнатини в зоните на смилане и раздробяване, показателят е по-голям от две; експерименталната стойност е в рамките на н=2,1...2,3. В изчислението, което използваме средна стойност н=2,2.

В съответствие с критерия Irwin, нарастването на пукнатината възниква, когато коефициентът на интензитет на напрежението достигне стойността на якост на счупване:

К 1 = ДА СЕ c , (19.3)

Където ДА СЕ I е коефициентът на интензивност на напрежението, чиято стойност в разглеждания случай, като се вземе предвид знакът на напреженията на опън, се изчислява по формулата

. (19.4)

Замествайки (19.4), като вземем предвид (19.1) и (19.2) в (19.3), след трансформации получаваме:

(19.5)

Фигура 19.1 показва резултата от изчислението. При дадени условия разстоянието от заряда до пукнатината, при което е възможно неговото нарастване, е 3,8 m. Въз основа на изчислителната зависимост (19.5) може да се каже, че колкото по-голям е радиусът на заряда, толкова налягането и половината дължина на пукнатината, толкова по-голям е радиусът на зоната на смачкване.

Настроики лИ К Иса технологично неконтролируеми и характеризират свойствата на скалния масив. Контролираните параметри са радиусът на заряда r 0и максимална стойност на налягането P0. Така например удвояването на радиуса на заряда води до линейно увеличение на радиуса rзоните на смачкване също се удвояват. Ако максималното налягане P0в кладенеца се удвои, след това радиусът rЗоната на смачкване се увеличава приблизително 1,4 пъти. Това практическо заключение следва от механиката на счупване, използваща критерия Irwin.

Задача 19.2На контура на хоризонтална подземна мина, работеща в пясъчник, има хоризонтални напрежения σ z, насочени по оста на работните и периферни напрежения σ θ. В повърхностния пласт на рудника има хаотично разположени пукнатини с дължина 2 л. Определете критичните размери на пукнатините, при които възниква тяхното нарастване.

Изходни данни: σ z =10 MPa, σ θ =20 MPa. Устойчивостта на счупване на пясъчника за пукнатина в поле на напрежение на срязване (пукнатина от втора класа) е K II=0,96∙10 6 N/m 3/2.

Решение.Върху контура на изкопа действат следните основни напрежения: σ 1 =20 MPa; σ 2 =10 MPa; σ 3 =0. Максималните тангенциални напрежения, действащи в равнина под ъгъл 45° спрямо повърхността на изкопа, са:

. (19.5)

Ако пукнатината е разположена в равнината на действие на максималните тангенциални напрежения, тогава нейният максимален стабилен размер може да се определи с помощта на критерия на Irvine.

3

1 Технически институт(клон) ФСАОУ ВПО „Сев федерален университетна името на М.К. Амосова"

2 Институт по тектоника и геофизика на името на. Ю.А. Косигина FEB RAS

3 Академия на науките на Република Саха (Якутия)

Представени са резултатите от численото моделиране на идентифициране на аномални (върхови) нива на положително определен времеви ред с помощта на метода на Irvine. За симулацията е използвана поредица от числени данни под формата на отделни пикови стойности, усложнени от случаен шум и синусоидален сигнал. В рамките на адитивния модел на първоначалната серия проблемът за разделяне на нормалните и аномалните нива по метода на Irwin е успешно решен в случаите на индивидуални импулси. Но дори и в този случай членът на серията с фоново ниво след пиковата стойност се тълкува като аномален. При задачите за автоматизирана обработка на данни поредицата от пикове се усложнява от пропорционален брой стойности на фоновите компоненти. За случаите, когато броят на пиковете надвишава 50% от общ бройстойности на серията и още повече за последователни пикове, формираната серия от фонови данни се усложнява от пиковия компонент поради увеличаване на дисперсията. В резултат на числено моделиране е разработена техника във формата модифициран метод Irwin за адекватно идентифициране на аномални нива на серията. Тази задачаот значение за електромагнитни системи за мониторинг на мълниеразряди и търсене на различни източници електромагнитно излъчванетектонски характер.

електромагнитно излъчване

разделяне на ниво ред

модификация на метода на Irwin

Методът на Ъруин

необичайни серийни нива

времеви редове

1. Калинина В.Н., Панкин В.Ф. Математическа статистика. – М.: висше училище, 2001. – 336 с.

2. Трофименко С.В. Методи и примери статистически оценкивремеви редове // Международно списаниеекспериментално образование”, бр.9, 2013.-С.41-42.

3. Трофименко С.В. Проява на земетресения на фона на стационарен сеизмичен процес в Олекмо-Становата зона (ОСЗ) Минен информационен и аналитичен бюлетин (научно-техническо списание). 2007. Т. 17. № 1. стр. 208-213.

4. Трофименко С.В. Геофизични полета и сеизмичност на Южна Якутия // Минно-информационен и аналитичен бюлетин (научно-техническо списание). 2007. Т. 17. № 1. стр. 188-196.

5. Трофименко С.В. Подробни геоложки и геофизични изследвания на активните разломни зони и сеизмичната опасност на района на Южен Якут / A.N. Овсюченко, Трофименко С.В., Мараханов А.В., П.С., Карасев, Е.А. Рогожин, В.С. Имаев, В. М. Никитин, Н. Н. Гриб // Тихоокеанска геология, 2009. – том 28. – № 4. – С. 55-74.

6. Трофименко С.В. Фокални зони силни земетресенияЮжна Якутия / Овсюченко А.Н., Трофименко С.В., Мараханов А.В., П.С., Карасев, Е.А. Рогожин, В.С. // Физика на Земята. 2009. № 2. стр. 15-33.

7. Трофименко С.В. Сеизмотектоника на преходния регион от Байкал рифтова зонакъм орогенното издигане на Становия хребет / A.N. Ovsyuchenko, Trofimenko S.V., Marakhanov A.V., P.S., Karasev, E.A. Рогожин, В.С. // Геотектоника, 2010, № 1, с. 29-51.

8. Трофименко С.В. Тектонска интерпретация статистически моделразпределение на азимутите на аномалиите на гравимагнитните полета на Алданския щит. – Тихоокеанска геология. – 2010. – Том 29. – No3. – С. 64-77.

9. Трофименко С.В. Активни нектонни смущения на Алдан-Нагорния участък от нефтопроводната система Източен СибирТихи океан/Карасев П.С., Овсюченко А.Н., Мараханов А.В., Трофименко С.В. // Петролна индустрия. – 2008. – № 9. –С. 80-84.

Геофизичният мониторинг на атмосферни източници на електромагнитно излъчване, разработен за записване и контрол на движението на мълниеносни разряди, може да се използва за дистанционно наблюдение на геодинамични процеси в земната кора, свързани с възникващи източници на земетресения и активни разломи земната кора. Важен въпроспри тълкуване на аномалии на електромагнитно излъчване (EMR) е необходимо да се разделят аномалиите по вид източник на радиация, който е разгледан подробно в работата.

Общият EMR сигнал може да бъде представен като:

където както аномалния импулс (върхове), така и фоновите компоненти на сигнала са случаен компонент. Освен това, априори, функцията на източника на сигнал не е известна, т.е. типът модел, определен от (1), не е известен за него.

IN линейна теория електромагнитни вълниПриет е адитивен модел на първоначалната серия от EMR наблюдения, базиран на принципа на суперпозицията. Ако времевият ред е представен като сума от съответните компоненти, тогава полученият модел се нарича адитивен и има формата (без да се отчита тенденцията и сезонен компонент):

, (2)

къде са нивата на времевия ред.

Тази статия представя резултатите симулационно моделиранеразделяне на EMR полета въз основа на Статистически анализвремеви редове от наблюдения, отразяващи реалното състояние на геофизичната среда.

На фиг. Фигури 1 и 2 показват резултатите от наблюдения на ЕМР сигнали в периоди на слабо нарушено (фиг. 1) и нарушено (фиг. 2) състояние на геофизичната среда. Качественото идентифициране на фоновия компонент в разстроен ден е много проблематично.

За да се тества технологията за разделяне на EMR полета на фонови и импулсни компоненти в модел (2), в средата беше създаден симулационен файл електронни таблици Excel. Общата поредица от първоначални данни (2) беше съставена от сумата от поредици от пикови стойности, чийто брой импулси може да бъде зададен произволно, и фоновия компонент на поредицата под формата на сума от периодични синусоидални и случаен компонентред (фиг. 3). Общата серия беше подложена на алгоритъм за идентифициране на импулси, използвайки метода Irvine (пиков метод), който се използва в практиката на статистически анализ на времеви редове, за да се идентифицират аномални нива на серията.

Ориз. 1. Първоначална серия от стойности на амплитудата на EMR сигнала в слабо нарушен ден 01.04.2013 г.

Ориз. Фиг. 2. Първоначална поредица от стойности на амплитудата на EMR сигнала в силно смутен ден, 13 януари 2013 г.

Ориз. 3. Компоненти от моделната гама за симулиране на EMR сигнали

Нека има времеви редове. Методът на Ъруин включва използването на релацията

Където - стандартно отклонение, - средната стойност на амплитудите, за да се оцени аномалното нарастване на амплитудата на следващия член на серията при допускането, че предишният член на серията се отнася до фоновия компонент на сигнала. Изчислени стойности се сравняват с табличните стойности на критерия Irwin; ако някоя от тях се окаже по-голяма от стойността на таблицата, тогава съответната стойност на нивото на реда се счита за аномална. Стойностите на критерия на Irwin за нивото на значимост са дадени в таблица 1.

маса 1

Критични стойности за ниво на значимост

За практически изчисления с известна дължинареализации, можете да използвате аналитичен израз, за ​​да определите критичните стойности, за които грешката на приближаване е по-малка от 1%:

, (4)

Числените експерименти показват следното: първо, за един пик (аномално ниво) спрямо фоновото ниво, следващият член на серията също се интерпретира като аномален, въпреки че амплитудата на неговия импулс е сравнима с фоновата стойност. Второ, същата грешка ще бъде налице, ако има няколко аномални нива , , … в оригиналната серия. В този случай първото аномално ниво и фоновото ниво, следващо серията от аномалии, ще бъдат взети като аномално ниво. Всички междинни аномалии, ..., ще бъдат приписани на фоновия компонент на серията. Това ще доведе до изкривяване (надценяване) на обвивката на фоновия компонент (фиг. 4).

С интерактивния метод за разделяне на нивата на серия, фиктивните аномални нива се отхвърлят от оператора. При задачите за автоматизирана обработка на данни поредицата от пикове се усложнява от пропорционален брой стойности на фоновите компоненти.

За тези случаи, когато броят на пиковете надвишава 50% от общия брой стойности в серията, и още повече за последователни пикове, генерираната серия от фонови данни се усложнява от пиковия компонент (фиг. 5). Очевидно тези грешки все още не са позволили на метода на Ъруин да намери широко приложение на практика. статистически изследваниявремеви редове.

Ориз. 4. Илюстрация на усложнението на фоновия компонент на серията чрез аномални нива при използване на метода на Irvine

Ориз. 5. Усложняване на фоновия компонент на симулационната серия при 50% съотношение на пикови и фонови компоненти

В резултат на числено моделиране на различни съотношения сигнал/шум е разработена техника под формата на модифициран метод на Irvine за адекватно разделяне на аномални (пикови) и фонови нива на серията. Тази задача, както беше посочено по-горе, е от значение за системите за електромагнитен мониторинг на мълниеносни разряди и търсене на различни източници на електромагнитно излъчване от тектоничен характер.

За да се елиминират посочените грешки на метода Irvine, бяха разработени три опции за изчисление за разделяне на нивата на rad, използването на които е оправдано от сложността на съотношенията сигнал / шум в реални експериментални данни, например, както е показано на фиг. 12.

В най-простия случай, за да се изолират единични пикове на положително определена серия, условието за неотрицателност на разликата се добавя към условието на Ъруин (3), т.е. . Всички аномални нива във фоновия компонент на серията се заменят със стойности, използвайки формулата за параболична интерполация:

, (5)

където са членовете на серията фонови компоненти, предхождащи аномалното ниво. Тъй като първият член на серията може да има аномална амплитуда, три допълнителни члена на серията с минимална амплитуда се поставят в началото на серията. Резултати от числена симулация съгл този алгоритъмпоказано на фиг. 6.

Ориз. 6. Изолиране на фоновия компонент на симулационната серия при наличие на единични пикови компоненти с допълнителното условие, че разликата между сравнените амплитуди на последователни членове на серията не е отрицателна

Сравнение с резултатите от изчисленията с помощта на прост алгоритъм Irwin (фиг. 4) ясно показва необходимостта от въвеждане в алгоритъма на допълнително условие разликата да не е отрицателна.

Когато броят на аномалните нива се увеличи до 50%, заместването на пиковите стойности съгласно формула (5) води до усложняване на фоновия компонент със средни амплитудни стойности на аномалните нива (фиг. 5). В този случай се използва алгоритъмът последователно елиминиранененормални нива.

Амплитудите на сигнала на аномални нива във фоновия компонент се заменят съгласно формула (5) с връщане към началото на изчислителния цикъл. В този случай стойността на стандартното отклонение се изчислява за първоначалната серия и се приема като константа при повторни изчисления.

Този алгоритъм дава възможност за адекватно разделяне на компонентите на фона и импулса, но изисква повече време за изчисления, тъй като до 80 000 импулса или повече се натрупват в масива от данни на ден, което ще доведе до забавяне на показването на резултатите в реално време в автоматизирани системи за наблюдение.

За случаи на нарушено състояние на геофизичната среда (виж фиг. 2) е разработен алгоритъм с изграждане на вариационна серия с нарастващи амплитуди на сигнала. За = (20-40)% от общия брой на членовете на вариационната серия се изчислява стандартното отклонение и се прилага методът Irwin, докато се появи първото аномално ниво. Максимална стойностот първите (k-1) нива на вариационната серия се приема като гранична стойност на фоновия компонент, според който се разделят компонентите на оригиналната серия.

Численото моделиране с помощта на данни от пълномащабен експеримент показа, че ако има само два компонента в оригиналната серия, тогава фоновият компонент се отделя от оригиналната серия без изкривяване. При наличието на няколко източника на ЕМР, методът е чувствителен към избора на броя на членовете на вариационната серия за изчисляване. Това може да доведе до пропускане на аномални източници на сигнал или до идентифициране на въображаеми източници (грешки от първи и втори тип). За да се елиминират тези грешки в автоматичната система за мониторинг, се предлага да се извършат изчисления, като се използват различни процентни проби от серията вариации, за да се изчисли и приложи методът на Irvine. Адекватността на модела във всички случаи се проверява от статистически характеристикиостатъчни серии. Изчисленията, извършени за два дни с различни състояния на смущение в геофизичната среда (фиг. 1, 2), показаха сближаването на моделите на фоновите компоненти, идентифицирани с помощта на методите за елиминиране на пикове и конструиране на вариационна серия при = (35 - 45) %.

Рецензенти:

Омеляненко А.В., доктор на техническите науки, професор, главен научен сътрудник на лабораторията по инженерна геокриология на Института за вечно замръзнали науки на името на. P.I.Melnikov SB RAS, Якутск;

Имаев V.S., доктор по геология и минералогия, професор, гл. Научен сътрудник в Института по земната кора СО РАН, Иркутск.

Библиографска връзка

Трофименко С.В., Трофименко С.В., Маршалов А.Я., Гриб Н.Н., Колодезников И.И. МОДИФИКАЦИЯ НА МЕТОДА НА IRWIN ЗА ОТКРИВАНЕ НА АНОМАЛНИ НИВА НА ВРЕМЕВИ ПОРЕДИЦИ: МЕТОД И ЧИСЛЕНИ ЕКСПЕРИМЕНТИ // Съвременни въпросинаука и образование. – 2014. – № 5.;
URL: http://science-education.ru/ru/article/view?id=15130 (дата на достъп: 18.03.2019 г.). Предлагаме на вашето внимание списания, издадени от издателство "Академия за естествени науки"

В допълнение, аномални нива във времеви редове могат да възникнат поради влиянието на фактори, които са обективни по природа, но се появяват епизодично или много рядко - грешки тип II , те не могат да бъдат елиминирани.

За идентифициране на аномални нива на времеви редове се използват методи, изчислени за статистически популации.

Методът на Ъруин.

Методът на Irwin включва използването на следната формула:

където стандартното отклонение се изчислява на свой ред по формулите:

. (2)

Изчислените стойности се сравняват с табличните стойности на критерия Irvine и ако те са по-големи от табличните, тогава съответната стойност на серийното ниво се счита за аномална. Стойността на критерия на Ъруин за нивото на значимост, т.е. с 5% грешка са показани в таблица 4.

Таблица 4.

2,8 2,3 1,5 1,3 1,2 1,1 1,0

След установяване на ненормални нива на серия, е необходимо да се определят причините за тяхното възникване!

Ако е точно установено, че аномалията е причинена от грешки от първия тип, тогава съответните нива на серията се „коригират“ или чрез заместване на простото средно аритметично на съседни нива на серията, или чрез получени стойности от крива, която апроксимира дадения времеви ред като цяло.

Метод за тестване на разликите в средните нива.

Прилагането на този метод се състои от четири етапа.

1. Оригиналният динамичен ред е разделен на две части с приблизително равен брой нива: в първата част, първите нива на оригиналния ред, във втората - останалите нива .

2. за всяка от тези части се изчисляват средната стойност и дисперсията:

3. проверка на равенството (хомогенността) на дисперсиите на двете части на серията с помощта на F-теста на Фишер, който се основава на сравняване на изчислената стойност на този критерий:

с таблична (критична) стойност на критерия на Фишер със зададено ниво на значимост (ниво на грешка). Най-често взетите стойности са 0.1 (10% грешка), 0.05 (5% грешка), 0.01 (1% грешка). Количеството се нарича вероятност за доверие. Ако изчислената (емпирична) стойност на F е по-малка от табличната, тогава се приема хипотезата за равенство на дисперсиите и се преминава към четвъртия етап. В противен случай хипотезата за равенство на дисперсиите се отхвърля и се заключава, че този методне дава отговор за определяне наличието на тенденция.

4. Хипотезата за липса на тренд се тества с помощта на t-теста на Стюдънт. За да направите това, изчислената стойност на критерия на Студент се определя по формулата:

(3)

където е стандартното отклонение на разликата между средните стойности:

.

Ако изчислената стойност е по-малка от табличната стойност на статистиката на Student с дадено ниво на значимост, хипотезата се приема, т.е. няма тенденция, в противен случай има тенденция. Имайте предвид, че в този случай табличната стойност се приема за броя на степените на свобода, равен на , и този метод е приложим само за серии с монотонна тенденция.

Метод на Фостър-Стюарт.

Този метод има големи възможностии дава по-надеждни резултати в сравнение с предишните. В допълнение към тенденцията на самата серия (средна тенденция), тя ви позволява да установите наличието на тенденция в дисперсията на времевата серия: ако няма тенденция на дисперсия, тогава разсейването на серийните нива е постоянно; ако дисперсията се увеличи, тогава серията се "люлее" и т.н.

Реализацията на метода също се състои от четири етапа.

1. всяко ниво се сравнява с всички предходни и се определят две числови последователности:

2. стойностите се изчисляват:

Лесно е да се види, че стойността, характеризираща промяната във времевата серия, приема стойности от 0 (всички нива на серията са равни помежду си) до (серията е монотонна). Стойността характеризира промяната в дисперсията на нивата на динамичния ред и варира от (серията монотонно намалява) до (серията монотонно нараства).

1. отклонение на стойност от стойността на математическото очакване на стойност за серия, в която нивата са разположени произволно;

2. отклонение на стойност от нула.

Тази проверка се извършва с помощта на изчислените (емпирични) стойности на теста на Студент за средната стойност и за дисперсията:

Където очаквана стойностстойност, определена за серия, в която нивата са разположени произволно;