Біографії Характеристики Аналіз

Критерії викидів у разі нормального розподілу. Методи обробки інформації та прогнозування для студентів спеціальності: «Менеджмент організацій»

Метод Ірвіна використовується виявлення аномальних значень рівнів часового ряду. Під аномальним рівнем розуміється окреме значення рівнів часового ряду, яке відповідає потенційним можливостям досліджуваної економічної системи і яке, залишаючись як рівень ряду, істотно впливає значення основних характеристик часового ряду.

Причинами аномальних явищ можуть бути помилки технічного порядку, або помилки першого роду, вони підлягають виявлення та усунення.

Крім того, аномальні рівні в часових рядах можуть виникати через вплив факторів, що мають об'єктивний характер, але виявляються епізодично. Їх відносять до помилок другого роду, які не підлягають усуненню.

Для виявлення аномальних спостережень можна використовувати метод Ірвіна. У цьому випадку обчислюється коефіцієнт t , рівний:

,
,
.

Розрахункові значення λ2, λ3,... порівнюються з табличними значеннями критерію Ірвіна λα. Якщо виявляється, що розрахункове значення t більше табличного λ , то відповідне значення y t рівня ряду вважається аномальним.

Після виявлення аномальних значень рівнів обов'язкове визначення причин їх виникнення. Якщо точно встановлено, що вони викликані помилками першого роду, вони усуваються зазвичай заміною середньої арифметичної двох сусідніх рівнів ряду, або заміною значенням відповідної трендової кривої.

При перевірці наявності аномальних коливань з використанням методу Ірвіна отримали наступні розрахункові значення коефіцієнта t:

Таблиця №13

Порівнюючи знайдені значення коефіцієнта λ t з табличним значенням ? ? окремі значеннярівнів ряду перевершують значення λ α, отже робимо висновок про те, що в даній моделі присутні аномальні коливання, викликані помилками другого роду, які усунення не підлягають.

Розділ 8. Визначення оптимального виду лінії тренду. Прогноз показників

Під трендом розуміється зміна, що визначає загальний напрямок розвитку, основну тенденцію часового ряду.

Для вибору лінії тренду, найкращим чиномЩо відображає загальний напрямок процесу розвитку ставки рефінансування Центрального Банку, рівня безробіття та інфляції, необхідно побудувати кілька ліній тренду і вибрати ту з них, яка краще відображає динаміку розвитку того чи іншого процесу.

Для побудови ліній тренду необхідно використовувати можливості ТР Excel, застосувавши команду "Діаграма" - "Додати лінію тренду". У діалоговому вікні "Лінія тренду" на вкладці "Тип" необхідно вибрати потрібний тип лінії тренду та вказати ступінь полінома. На вкладці "Параметри" необхідно встановити перемикач "Показувати рівняння на діаграмі", "Помістити на діаграму величину достовірності апроксимації".

Після побудови ліній тренду, слід вибрати ту, яка найкраще відображає динаміку зміни того чи іншого процесу у часі.

Потім слід зробити прогноз значень на 3 періоди наперед, використовуючи обраний тренд. Тренд, яким необхідно зробити прогноз вибирається виходячи з величини достовірності апроксимації.

Для того, щоб зробити прогноз, також необхідно скористатися можливостями ТР Excel. У даному випадкунеобхідно в діалоговому вікні "Лінія тренду" на вкладці "Параметри" вказати, на скільки періодів уперед необхідно зробити прогноз.

Даний прогноз дозволяє визначити, як через певний проміжок часу зміниться показник, що вивчається при незмінності інших показників.

Після побудови лінії тренду для показника ставки рефінансування Центрального Банку, як оптимальну лінію тренда була обрана лінія тренду 2, якій відповідає рівняння:

Y = -0.0089х 3 +0ю3152х 2 -3.5642х +37.014; R2 = 0.8048

Для показника рівня безробіття як оптимальну лінію тренда була обрана лінія тренду 1, якій відповідає рівняння:

Y = -6E-06x4+0.0003x3-0.0038x2+0.0187x+0.0291; R2 = 0.8771

Для показника рівня інфляції як оптимальну лінію тренда була обрана лінія тренду 2, якій відповідає рівняння:

Y = -0.0064x3+0.2186x2-2.3701x+14.603; R 2 = 0.7703

Прогнози, зроблені за вибраними лініями тренду, дають найбільш точну характеристику наказу показників у майбутньому.

z 1 прогнозне

z 2 прогнозне

y прогнозне

t прогнозне

Підставляючи отримані прогнозні значення раніше розраховане рівняння регресії,

отримуємо у = 13,12990776.

Використовується для оцінки сумнівних значень вибірки грубі помилки. Порядок його застосування є наступним.

Знаходять розрахункове значення критерію λ розрах = (|х до - х до перед |)/σ,

де х до- сумнівне значення, х до перед- Попереднє значення в варіаційному ряду, якщо х дооцінюється від максимальних значень варіаційного ряду, або наступне, якщо х дооцінюється від мінімальних значень варіаційного ряду (Ірвін використав загальному випадкутермін "перше значення"); σ – генеральне середнє квадратичне відхилення(СКО) безперервної нормально розподіленої випадкової величини.

Якщо λ розрах. > λ табл, х догруба помилка. Тут λ табл- Табличне значення (процентна точка) критерію Ірвіна.

Питання, що виникають при цьому, описані на сторінці. Зокрема, у статті-першоджерелі табличні значення критерію розраховані для нормально розподіленої випадкової величини за відомого генерального середньоквадратичного відхилення (СКО) σ . Оскільки σ найчастіше невідомо, Ірвіном запропоновано використовувати в розрахунках замість σ вибіркове СКО s, що визначається за формулою

де n- Обсяг вибірки, х i- Елементи вибірки, х ср- Середнє значення вибірки.

Такий підхід зазвичай і використовується практично. Проте прийнятність використання вибіркового СКО, і навіть процентних точок для генерального СКО, не подтверждена.

У цій статті наведено табличні значення (процентні точки) критерію Ірвіна, розраховані методом статистичного комп'ютерного моделювання при використанні вибіркового СКО для максимального значення варіаційного ряду за стандартного нормального розподілу випадкової величини (за інших параметрів нормального розподілу, а також для мінімального значення варіаційного ряду виходять такі самі результати). Для кожного обсягу вибірки nмоделювали 10 6 вибірок. Як показали попередні розрахунки, при паралельних визначенняхвідмінності у значеннях процентної точки можуть сягати 0,003. Оскільки значення округляли до 0,01, у сумнівних випадках проводили від 2 до 4 паралельних визначень.

Крім того, за даними розрахували табличні значення критерію Ірвіна для відомого генерального СКО і зіставили їх із наведеними в .

Оскільки при практичному застосуваннікритерію Ірвіна нерідко виникають певні труднощі через відсутність у літературних джерелахтабличних значень критерію при деяких обсягах вибірок, були розраховані тим же методом статистичного комп'ютерного моделювання деякі з відсутніх табличних значень.

Зрозуміло, що з обсягу вибірки 2 застосування критерію з допомогою вибіркового СКО немає сенсу. Це підтверджується тим, що спрощення виразу для розрахункового значення критерію при вибірковому СКО дає квадратний коріньз двох, що наочно показує безглуздість застосування критерію при об'ємі вибірки 2 та вибірковому СКО.

Отримані результати наведено у табл. 1.

Таблиця 1 - Табличні значення критерію Ірвіна для крайніх елементівваріаційного ряду.

Обсяг вибіркиЗа генеральним СКОПо вибірковому СКО
Рівень значущості
0,1 0,05 0,01 0,1 0,05 0,01
2 2,33* 2,77* 3,64* - - -
3 1,79* 2,17* 2,90* 1,62 1,68 1,72
4 1,58 1,92 2,60 1,55 1,70 1,88
5 1,45 1,77 2,43 1,45 1,64 1,93/
6 1,37 1,67 2,30 1,38 1,60 1,94
7 1,31 1,60 2,22 1,32 1,55 1,93
8 1,26 1,55 2,14 1,27 1,51 1,92
9 1,22 1,50 2,09 1,23 1,47 1,90
10 1,18* 1,46* 2,04* 1,20 1,44 1,88
11 1,15 1,43 2,00 1,17 1,42 1,87
12 1,13 1,40 1,97 1,15 1,39 1,85
13 1,11 1,38 1,94 1,13 1,37 1,83
14 1,09 1,36 1,91 1,11 1,35 1,82
15 1,08 1,34 1,89 1,09 1,33 1,80
20 1,03* 1,27* 1,80* 1,03 1,27 1,75
25 0,99 1,23 1,74 0,99 1,22 1,70
30 0,96* 1,20* 1,70* 0,96 1,19 1,66
35 0,93 1,17 1,66 0,94 1,16 1,63
40 0,91* 1,15* 1,63* 0,92 1,14 1,61
45 0,89 1,13 1,61 0,90 1,12 1,59
50 0,88* 1,11* 1,59* 0,89 1,10 1,57
60 0,86* 1,08* 1,56* 0,87 1,08 1,54
70 0,84* 1,06* 1,53* 0,85 1,06 1,52
80 0,83* 1,04* 1,51* 0,83 1,04 1,50
90 0,82* 1,03* 1,49* 0,82 1,03 1,48
100 0,81* 1,02* 1,47* 0,81 1,02 1,46
200 0,75* 0,95* 1,38* 0,75 0,95 1,38
300 0,72* 0,91* 1,33* 0,72 0,91 1,33
500 0,69* 0,88* 1,28* 0,69 0,88 1,28
1000 0,65* 0,83* 1,22* 0,65 0,83 1,22
Примітка: значення, позначені зірочкою, розраховані за даними та у разі потреби уточнені при статистичному комп'ютерне моделювання. Інші значення розраховані за статистичного комп'ютерного моделювання.

Якщо порівняти відсоткові точки відомого генерального СКО, наведені у табл. 1, з відповідними відсотковими точками, наведеними в , всі вони в декількох випадках розрізняються на 0,01, і в одному випадку на 0,02. Очевидно, наведені у цій статті процентні точки точніші, оскільки у сумнівних випадках вони перевірялися статистичним комп'ютерним моделюванням.

З табл.1 видно, що відсоткові точки критерію Ірвіна при використанні вибіркового СКО за порівняно невеликих обсягах вибірки помітно відрізняються від процентних точок при використанні генерального СКО. Тільки за значних обсягів вибірки, приблизно близько 40, відсоткові точки стають близькими. Таким чином, при використанні критерію Ірвіна слід користуватися відсотковими точками, наведеними в таблиці. 1, з урахуванням того, отримано розрахункове значення критерію по генеральному або вибірковому СКО.

ЛІТЕРАТУРА

1. Irvin J.O. На критерії для звільнення від observation //Biometrika.1925. V. 17. P. 238 - 250.

2. Кобзар А.І. Прикладна математична статистика. - М.: ФІЗМАТЛІТ, 2006. - 816с. © В.В. Заляжних
Під час використання матеріалів ставте посилання.

Завдання 19.1Тріщина розташована в полі дії максимальних розтягуючих напруг, викликаних вибухом одиночного циліндричного заряду. Визначити відстань від заряду до тріщини, при якому можливе її зростання.

Вихідні дані: довжина тріщини 2 l=0,1м; порода - кварцити з в'язкістю руйнування До I =2,6∙10 6 Н/м 3/2; максимальний тиск заряду в свердловині P 0 = 1,2 ∙ 10 10 Па.

Рішення.Розподіл максимальної квазістатичної напруги наближено описується залежностями:

де і - радіальні та окружні напруги;

Р 0 – максимальний тиск під час вибуху заряду в свердловині;

r 0 – радіус заряду, м;

r- Відстань до розглянутої точки, м;

n- Показник ступеня, що приймає значення n=2 в пружному середовищі; у реальному середовищі з урахуванням формування множини тріщин у зонах подрібнення та дроблення показник ступеня більше двох; експериментальне значення знаходиться в межах n=2.1...2,3. У розрахунку використовуємо середню величину n=2,2.

Відповідно до критерію Ірвіна зростання тріщини відбувається у разі, коли коефіцієнт інтенсивності напруг досягає значення в'язкості руйнування:

До 1 = До c, (19.3)

де До I – коефіцієнт інтенсивності напруг, величина якого в даному випадку, з урахуванням знака напруг, що розтягують, обчислюється за формулою

. (19.4)

Підставляючи (19.4) з урахуванням (19.1) та (19.2) у (19.3) після перетворень отримаємо:

(19.5)

На малюнку 19.1 подано результат розрахунку. За заданих умов відстань від заряду до тріщини, за якої можливе її зростання, становить 3,8 м. На очуванні розрахункової залежності (19.5) можна стверджувати, що чим більший радіус заряду, тиск і напівдовжина тріщини, тим більше радіус зони дроблення.

Параметри lі K Iє технологічно некерованими та характеризують властивості породного масиву. Керованими параметрами є радіус заряду r 0та величина максимального тиску P 0. Так, наприклад, збільшення радіусу заряду вдвічі призводить до лінійного збільшення радіусу rзони дроблення також удвічі. Якщо ж максимальний тиск P 0у свердловині збільшити вдвічі, то радіус rзони дроблення збільшується приблизно 1,4 разу. Такий практичний висновок випливає із механіки руйнування з використанням критерію Ірвіна.

Завдання 19.2На контурі горизонтального підземного гірничого вироблення, пройденого в піщанику, діють горизонтальні напруги σ z , спрямовані вздовж осі виробітку і окружні напруги σ θ . У поверхневому шарі виробітку є хаотично розташовані тріщини довжиною 2 l. Встановити критичні розміри тріщин, у яких відбувається їх зростання.

Вихідні дані: σ z = 10 МПа, σ θ = 20 МПа. В'язкість руйнування піщанику для тріщини в полі зсувної напруги (тріщина другого роду) становить K II=0,96∙10 6 Н/м 3/2.

Рішення.На контурі вироблення діють такі основні напруги: 1 =20 МПа; σ 2 =10 МПа; σ 3 =0. Максимальні дотичні напруги, що діють у площині під кутом 45 до поверхні виробки, становлять:

. (19.5)

Якщо тріщина розташована в площині дії максимальної дотичної напруги, то її граничний стійкий розмір можна визначити, використовуючи критерій Ірвіна.

3

1 Технічний інститут(філія) ФДАОУ ВПО "Північно-Східний федеральний університетімені М.К. Аммосова"

2 Інститут тектоніки та геофізики ім. Ю.А. Косигіна ДВО РАН

3 Академія наук Республіки Саха (Якутія)

Наведено результати чисельного моделювання виявлення аномальних (пікових) рівнів позитивно визначеного часового ряду методом Ірвіна. Для моделювання використано ряд числових даних у вигляді окремих пікових значень, ускладнених випадковою перешкодою та синусоїдальним сигналом. У рамках адитивної моделі вихідного ряду завдання поділу нормального та аномального рівнів методом Ірвіна успішно вирішується у випадках окремих імпульсів. Однак, навіть у цьому випадку, наступний за піковим значенням член ряду з фоновим рівнем інтерпретується як аномальний. У задачах автоматизованої обробки даних ряди піків ускладнюються пропорційною кількістю значень фонових компонентів. Для тих випадків, коли кількість піків перевищує 50% від загальної кількостізначень ряду і тим більше для піків, що поспіль стоять сформований ряд фонових даних ускладнюється пікової компонентою за рахунок збільшення дисперсії. В результаті чисельного моделювання було розроблено методику у вигляді модифікованого методуІрвіна для адекватного виділення аномальних рівнів низки. Це завданняактуальна для систем електромагнітного моніторингу грозових розрядів та пошуку різних джерел електромагнітного випромінюваннятектонічної природи.

електромагнітне випромінювання

поділ рівнів ряду

модифікація методу Ірвіна

метод Ірвіна

аномальні рівні ряду

тимчасові ряди

1. Калініна В. Н., Панкін В. Ф. Математична статистика. - М.: вища школа, 2001. - 336 с.

2. Трофименко С.В. Методи та приклади статистичних оціноктимчасових рядів // Міжнародний журналекспериментальної освіти", №9, 2013.-С.41-42.

3. Трофименко С.В. Прояв землетрусів на фоні стаціонарного сейсмічного процесу Олекмо-Станової зони (ОСЗ) Гірський інформаційно-аналітичний бюлетень (науково-технічний журнал). 2007. Т. 17. №1. З. 208-213.

4. Трофименко С.В. Геофізичні поля та сейсмічність Південної Якутії //Гірський інформаційно-аналітичний бюлетень (науково-технічний журнал). 2007. Т. 17. №1. З. 188-196.

5. Трофименко С.В. Детальні геолого-геофізичні дослідження зон активних розломів та сейсмічна небезпека Південно-Якутського регіону /О.М. Овсюченко, Трофименко С.В., Мараханов А.В., П.С., Карасьов, Є.А. Рогожин, В.С. Імаєв, В. М. Нікітін, Н. Н. Гриб // Тихоокеанська геологія, 2009. - Том 28. - №4. - С. 55-74.

6. Трофименко С.В. Вогнищеві зони сильних землетрусівПівденної Якутії / Овсюченко О.М., Трофименко С.В., Мараханов А.В., П.С., Карасьов, Є.А. Рогожин, В.С. //Фізика Землі. 2009. №2. З. 15-33.

7. Трофименко С.В. Сейсмотектоніка перехідної області від Байкальської рифтової зонидо орогенного підняття Станового хребта / О.Н.Овсюченко, Трофименко С.В., Мараханов А.В., П.С., Карасьов, Є.А. Рогожин, В.С. //Геотектоніка, 2010 № 1, с. 29-51.

8. Трофименко С.В. Тектонічна інтерпретація статистичної моделірозподілів азимутів аномалій гравімагнітних полів Алданського щита - Тихоокеанська геологія. – 2010. – Том 29. – №3. - С. 64-77.

9. Трофименко С.В. Активні нектонічні порушення ділянки Алдан-Нагорний нафтопровідної системи Східна СибірТихий океан/ Карасев П.С., Овсюченко О.М., Мараханов А.В., Трофименко С.В. / / Нафтове господарство. - 2008. - № 9. -С. 80-84.

Геофізичний моніторинг атмосферних джерел електромагнітного випромінювання, розроблений для реєстрації та контролю руху грозових розрядів, може бути використаний для дистанційного відстеження геодинамічних процесів у земній корі, пов'язаних з осередками землетрусів, що формуються, і активними розломами. земної кори. Важливим питаннямпри інтерпретації аномалій електромагнітного випромінювання (ЕМІ) є поділ аномалій на кшталт джерела випромінювання, що детально досліджено у роботі .

Сумарний сигнал ЕМІ, можна подати у вигляді:

де імпульсна аномальна (піки) і фонові складові сигналу, - випадковий компонент. Причому, апріорі, функція джерела сигналу відома, тобто. для неї не відомий тип моделі, що визначається за (1).

У лінійної теорії електромагнітних хвильприйнято адитивну модель вихідного ряду спостережень ЕМІ на основі принципу суперпозиції. Якщо тимчасовий ряд представляється у вигляді суми відповідних компонентів, то отримана модель носить назву адитивної та має вигляд (без урахування тренду та сезонної компоненти):

, (2)

де – рівні часового ряду.

У цій роботі представлені результати імітаційного моделюванняподілу полів ЕМІ на основі статистичного аналізутимчасового ряду спостережень, що відбивають реальний стан геофізичного середовища.

На рис. 1,2 показані результати спостережень сигналів ЕМІ у періоди слабко обуреного (рис. 1) та обуреного (рис. 2) стану геофізичного середовища. Якісно виділити фонову складову в обурений день дуже проблематично.

Для відпрацювання технології поділу полів ЕМІ на фонову та імпульсну складові в моделі (2) було створено імітаційний файл у середовищі електронних таблиць Excel. Сукупний ряд вихідних даних (2) був складений із суми рядів пікових значень , кількість імпульсів яких можна задавати довільно і фонової компоненти ряду у вигляді суми періодичної синусоїдальної та випадковий компонентряду (Рис.3). Сумарний ряд піддавався алгоритму виділення імпульсів за методом Ірвіна (метод піків), який використовується на практиці статистичного аналізу часових рядів з метою виділення аномальних рівнів ряду.

Мал. 1. Початковий ряд значень амплітуд сигналів ЕМІ у слабко обурений день 04.01.2013.

Мал. 2. Вихідна низка значень амплітуд сигналів ЕМІ у сильно обурений день 13.01.2013.

Мал. 3. Компоненти модельного ряду для імітації сигналів ЕМІ

Нехай є тимчасовий ряд. Метод Ірвіна передбачає використання співвідношення

де - стандартне відхилення, - середнє значення амплітуд, для оцінки аномального збільшення амплітуди наступного члена ряду у припущенні, що попередній член ряду відноситься до фонової складової сигналу . Розрахункові значення порівнюються з табличними значеннями критерію Ірвіна; якщо якесь із них виявляється більше табличного , то відповідне значення рівня низки вважається аномальним. Значення критерію Ірвіна рівня значимості наведені у таблиці 1.

Таблиця 1

Значення критичних значень рівня значимості

Для практичних розрахунків при відомої довжиниреалізації можна використовувати аналітичний вираз для визначення критичних значень, для якої похибка апроксимації менше 1%:

, (4)

Численні експерименти показали наступне: по-перше, для одиночного піку (аномального рівня) щодо фонового рівня наступний член ряду також інтерпретується як аномальний, хоча амплітуда його імпульсу можна порівняти з фоновим значенням. По-друге, ця ж похибка буде присутня за наявності у вихідному ряді декількох аномальних рівнів , , …. В даному випадку, за аномальний рівень рада буде прийнято перший аномальний і наступний за серією аномалій фоновий рівень. Усі проміжні аномалії, …, будуть віднесені до фонової складової ряду. Це призведе до спотворення (завищення) фонової компоненти, що обгинає (рис. 4).

При інтерактивному способі розподілу рівнів ряду фіктивні аномальні рівні відбраковуються оператором. У задачах автоматизованої обробки даних ряди піків ускладнюються пропорційною кількістю значень фонових компонентів.

Для тих випадків, коли кількість піків перевищує 50% від загальної кількості значень ряду і тим більше для піків, що підряд стоять, сформований ряд фонових даних ускладнюється піковою компонентою (рис.5). Мабуть, ці похибки досі не дозволили методу Ірвіна знайти досить широке застосування в практиці. статистичних дослідженьтимчасових рядів.

Мал. 4. Ілюстрація ускладнення фонової компоненти ряду аномальними рівнями під час використання методу Ірвіна

Мал. 5. Ускладнення фонової складової імітаційного ряду при 50% співвідношенні пікових та фонових компонент

В результаті чисельного моделювання різних співвідношень "сигнал - перешкода" була розроблена методика у вигляді модифікованого методу Ірвіна для адекватного поділу аномальних (пікових) та фонових рівнів ряду. Це завдання, як було зазначено вище, актуальне для систем електромагнітного моніторингу грозових розрядів та пошуку різних джерел електромагнітного випромінювання тектонічної природи.

Для виключення зазначених похибок методу Ірвіна було розроблено три варіанти розрахунків для поділу рівнів рада, застосування яких обґрунтоване складністю співвідношень сигнал-перешкода в реальних експериментальних даних, наприклад, як це показано на рис. 1, 2.

У найпростішому випадку, виділення одиночних піків позитивно певного ряду до умови Ирвина (3) додається умова не негативності різниці , тобто. . Усі аномальні рівні у фоновому компоненті ряду замінюються значеннями за формулою параболічного інтерполювання:

, (5)

де члени ряду фонової компоненти, що передують аномальному рівню. Так як перший член ряду може бути з аномальною амплітудою, то на початку ряду проставляються три додаткові члени ряду з мінімальною амплітудою. Результати чисельного моделювання з даному алгоритмупоказано на рис. 6.

Мал. 6. Виділення фонової складової імітаційного ряду за наявності одиночних пікових компонентів з додатковою умовою невід'ємності різниці порівнюваних амплітуд послідовних членів ряду

Порівняння з результатами розрахунків із застосуванням простого алгоритмуІрвіна (рис. 4) наочно показує необхідність введення в алгоритм додаткової умови невід'ємності різниці.

При збільшенні кількості аномальних рівнів до 50% заміна пікових значень формулою (5) призводить до ускладнення фонової компоненти усередненими значеннями амплітуд аномальних рівнів (рис. 5). У цьому випадку застосовується алгоритм послідовного виключенняаномальних рівнів.

Амплітуди сигналу аномальних рівнів у фоновій компоненті замінюються за формулою (5) із поверненням на початок циклу розрахунків. При цьому значення стандартного відхилення розраховується для початкового ряду і повторних розрахунках приймається за константу.

Даний алгоритм дозволяє адекватно розділяти фонову та імпульсну компоненти, проте вимагає більшого часу для розрахунків, так як у масиві даних за добу накопичується до 80000 імпульсів і більше, що призведе до затримки відображення результатів у реальному часі у системах автоматизованого моніторингу.

Для випадків обуреного стану геофізичного середовища (див. рис. 2) розроблено алгоритм із побудовою варіаційного ряду із зростаючими амплітудами сигналу. Для = (20-40)% від загальної кількості членів варіаційного ряду розраховується стандартне відхилення та застосовується метод Ірвіна до появи першого аномального рівня. Максимальне значенняз перших (k-1) рівнів варіаційного ряду приймається за граничне значення фонової компоненти, яким виробляється поділ компонент вихідного ряду.

Чисельне моделювання з використанням даних натурного експерименту показало, що, якщо у вихідному ряді є лише дві компоненти, то фонова компонента виділяється з вихідного ряду без спотворень. За наявності кількох джерел ЕМІ метод чутливий до вибору кількості членів варіаційного ряду для розрахунку. Це може призвести до пропуску аномальних джерел сигналу або виділення уявних джерел (помилки першого і другого пологів). Для виключення даних похибок у системі автоматичного моніторингу передбачається проводити розрахунки з використанням різних відсоткових вибірок із варіаційного ряду для розрахунку та застосування методу Ірвіна. Адекватність моделі у всіх випадках перевіряється за статистичним характеристикамзалишкового ряду. Проведені розрахунки для двох днів з різним станом обурення геофізичного середовища (рис.1, 2) показали збіжність моделей фонових компонентів, виділених за методами виключення піків та побудови варіаційного ряду при = (35 - 45)%.

Рецензенти:

Омельяненко О.В., д.т.н., професор, головний науковий співробітник лабораторії інженерної геокріології Інституту мерзлотознавства ім. П.І.Мельникова ЗІ РАН, м. Якутськ;

Імаєв В.С., д.г.-м.н., професор, гол. науковий співробітник Інституту земної кори СО РАН, м. Іркутськ.

Бібліографічне посилання

Трофименко С.В., Трофименко С.В., Маршалов А.Я., Гриб М.М., Колодєзніков І.І. МОДИФІКАЦІЯ МЕТОДУ ІРВІНА ДЛЯ ВИЯВЛЕННЯ АНОМАЛЬНИХ РІВНІВ ТИМЧАСОВИХ РЯДІВ: МЕТОДИКА ТА ЧИСЛІВІ ЕКСПЕРИМЕНТИ // Сучасні проблеминауки та освіти. - 2014. - № 5.;
URL: http://science-education.ru/ru/article/view?id=15130 (дата звернення: 18.03.2019). Пропонуємо до вашої уваги журнали, що видаються у видавництві «Академія Природознавства»

Крім того, аномальні рівні в часових рядах можуть виникати через вплив факторів, що мають об'єктивний характер, але виявляються епізодично або дуже рідко. помилки другого роду , вони усунення не підлягають.

Для виявлення аномальних рівнів часових рядів використовують методи, розраховані для статистичних сукупностей.

Метод Ірвіна.

Метод Ірвіна передбачає використання наступної формули:

де середнє квадратичне відхилення розраховується у свою чергу з використанням формул:

. (2)

Розрахункові значення порівнюються з табличними значеннями критерію Ірвіна, і якщо виявляються більше табличних, то відповідне значення рівня низки вважається аномальним. Значення критерію Ірвіна до рівня значимості , тобто . з 5% помилкою, наведені в таблиці 4.

Таблиця 4.

2,8 2,3 1,5 1,3 1,2 1,1 1,0

Після виявлення аномальних рівнів ряду обов'язковим є визначення причин їх виникнення!

Якщо точно встановлено, що аномалія викликана помилками першого роду, то відповідні рівні ряду «поправляються» або заміною простий середньої арифметичної сусідніх рівнів ряду, або значеннями, отриманими по кривій, що апроксимує даний тимчасовий ряд в цілому.

Метод перевірки різниць середніх рівнів.

Реалізація цього методу складається із чотирьох етапів.

1. Вихідний часовий ряд розбивається на дві приблизно рівні за кількістю рівнів частини: у першій частині перших рівнів вихідного ряду, у другій – інших рівнів .

2. для кожної з цих частин обчислюються середнє значення та дисперсії:

3. перевірка рівності (однорідності) дисперсій обох частин ряду за допомогою F-критерію Фішера, яка ґрунтується на порівнянні розрахункового значення цього критерію:

з табличним (критичним) значенням критерію Фішера із заданим рівнем значущості (рівнем помилки). Як найчастіше беруть значення 0,1 (10% помилка), 0,05 (5% помилка), 0,01 (1% помилка). Величина називається довірчою ймовірністю. Якщо розрахункове (емпіричне) значення F менше табличного, то гіпотеза про рівність дисперсій приймається та переходять до четвертого етапу. В іншому випадку гіпотеза про рівність дисперсій відкидається і робиться висновок, що даний методвизначення наявності тренду відповіді не дає.

4. перевіряється гіпотеза про відсутність тренда з використанням критерію Стьюдента. Для цього визначається розрахункове значення критерію Стьюдента за формулою:

(3)

де середнє квадратичне відхилення різниці середніх:

.

Якщо розрахункове значення менше табличного значення статистики Стьюдента із заданим рівнем значущості, гіпотеза приймається, тобто тренда немає, інакше тренд є. Зауважимо, що в даному випадку табличне значення береться для числа ступенів свободи, рівного , при цьому даний метод можна застосувати тільки для рядів з монотонною тенденцією.

Метод Фостера-Стьюарта.

Цей метод має великими можливостямиі дає більш надійні результати, порівняно з попередніми. Крім тренду самого ряду (тренду в середньому), він дозволяє встановити наявність тренду дисперсії часового ряду: якщо тренду дисперсії немає, то розкид рівнів ряду постійний; якщо дисперсія збільшується, то ряд "розгойдується" і т.д.

Реалізація методу складається з чотирьох етапів.

1. проводиться порівняння кожного рівня з усіма попередніми, при цьому визначаються дві числові послідовності:

2. обчислюються величини:

Неважко бачити, що величина, що характеризує зміну часового ряду, набуває значення від 0 (усі рівні ряду рівні між собою) до (ряд монотонний). Величина характеризує зміну дисперсії рівнів часового ряду і змінюється від (ряд монотонно зменшується) до (ряд монотонно зростає).

1. відхилення величини від величини математичного очікування величини для низки, у якому рівні розташовані випадковим чином;

2. відхилення величини від нуля.

Ця перевірка проводиться з використанням розрахункових (емпіричних) значень критерію Стьюдента для середньої та дисперсії:

де математичне очікуваннявеличини , визначеної для ряду, в якому рівні розташовані випадковим чином;