Біографії Характеристики Аналіз

Метод експонентного згладжування. Прогнозування методом експоненційного згладжування (ES, exponential smoothing)

Експонентне згладжування - спосіб згладжування часових рядів, обчислювальна процедура якого включає обробку всіх попередніх спостережень, при цьому враховується старіння інформації з віддалення від прогнозного періоду. Інакше кажучи, що "старше" спостереження, то менше воно має впливати на величину прогнозної оцінки. Ідея експоненційного згладжуванняполягає в тому, що в міру "старіння" відповідним спостереженням надаються спадні ваги.

Даний метод прогнозування вважається дуже ефективним та відмінковим. Основні переваги методу полягають у можливості обліку ваг вихідної інформації, у простоті обчислювальних операцій, у гнучкості опису різних динаміків процесів. Метод експоненційного згладжування дає можливість отримати оцінку параметрів тренду, що характеризують не середній рівеньпроцесу, а тенденцію, що склалася на момент останнього спостереження. Найбільше застосування метод знайшов реалізації середньострокових прогнозів. Для методу експоненційного згладжування основним моментом є вибір параметра згладжування (константи, що згладжує) і початкових умов.

Просте експоненційне згладжування часових рядів, що містять тренд, призводить до систематичній помилці, пов'язаної з відставанням згладжених значень фактичних рівнів часового ряду. Для обліку тренду в нестаціонарних рядах застосовується спеціальне двопараметричне лінійне експонентне згладжування. На відміну від простого експоненційного згладжування з однією константою, що згладжує (параметром) дана процедура згладжує одночасно випадкові обурення і тренд з використанням двох різних констант (параметрів). Двохпараметричний метод згладжування (метод Хольта) включає два рівняння. Перше призначене для згладжування спостережених значень, а друге для згладжування тренду:

де I - 2, 3, 4 – періоди згладжування; 5 - згладжена величина на період £; У, - фактичне значення рівня на період 1 5, 1 - згладжене значення на період Ь-Ьг- згладжене значення тренду на період 1 - згладжене значення на період I- 1; А і В - константи, що згладжують (числа між 0 і 1).

Константи, що згладжують А і В характеризують фактор зважування спостережень. Зазвичай Л, У< 0,3. Оскільки (1 - а)< 1, (1 - в)< 1, то вони зменшуються за експоненційним законом у міру видалення спостереження від поточного періоду I. Звідси ця процедура отримала назву експоненційного згладжування.

Рівняння додається до загальної процедури для згладжування тренду. Кожна нова оцінка тренда виходить як зважена сума різниці між останніми двома згладженими значеннями (поточна оцінка тренда) та попередньої згладженої оцінки. Це рівняннядозволяє істотно скоротити вплив випадкових збурень на тренд із часом.

Прогнозування з використанням експоненційного згладжування подібне до процедури "наївного" прогнозування, коли прогнозна оцінка на завтра належить рівної сьогоднішньому значенню. У даному випадкуяк прогноз на один період вперед розглядається згладжена величина на поточний період плюс поточне згладжене значення тренду:

Цю процедуру можна використовувати для прогнозування на будь-яку кількість періодів, наприклад на т періодів:

Процедура прогнозування починається з те, що згладжена величина 51 належить рівної першому спостереженню У, тобто. 5, = У,.

Виникає проблема визначення початкового значення тренду 6]. Існують два способи оцінки Ьх.

Спосіб 1. Покладемо Ьх = 0. Такий підхід добре працює у разі довгого вихідного часового ряду. Тоді згладжений тренд за не велике числоперіодів наблизиться до фактичного значення тренду.

Спосіб 2. Можна отримати більше точну оцінку 6, використовуючи перші п'ять (або більше) спостережень часового ряду. На їх основі гю методу найменших квадратіввирішується рівняння У(= а + Ь х м. Величина Ь береться як початкове значення тренда.

Наскільки Forecast NOW! краще моделі Експонентне згладжування (ES)ви можете побачити на графіці нижче. По осі X – номер товару, по осі Y – відсоткове поліпшення якості прогнозу. Опис моделі, детальне дослідження, результати експериментів читайте нижче.

Опис моделі

Прогнозування методом експоненційного згладжування є одним із самих простих способівпрогнозування. Прогноз може бути отриманий лише на період вперед. Якщо прогнозування ведеться у межах днів, то тільки на один день вперед, якщо тижнів, то на один тиждень.

Для порівняння, прогнозування проводилося на тиждень вперед протягом 8 тижнів.

Що таке експоненційне згладжування?

Нехай ряд Зпредставляє вихідний ряд продажів для прогнозування

З 1)-продажі в перший тиждень, З(2) у другій тощо.

Рисунок 1. Продаж по тижнях, ряд З

Аналогічно, ряд Sє експоненційно згладженим рядом продажів. Коефіцієнт знаходиться від нуля до одиниці. Виходить він так, тут t - момент часу (день, тиждень)

S(t+1) = S(t) + α *(С(t) - S(t))

Великі значення константи згладжування α прискорюють відгук прогнозу на стрибок процесу, що спостерігається, але можуть призвести до непередбачуваних викидів, тому що згладжування буде майже відсутній.

Перший раз після початку спостережень, маючи лише один результат спостережень С (1) , коли прогнозу S (1) немає і формулою (1) скористатися ще неможливо, як прогноз S (2) слід взяти С (1) .

Формула легко може бути переписана в іншому вигляді:

S (t+1) = (1 -α )* S (t) +α * З (t).

Таким чином, зі збільшенням константи згладжування частка останніх продажів збільшується, а частка згладжених попередніх зменшується.

Константа вибирається дослідним шляхом. Зазвичай будується кілька прогнозів щодо різних констант і вибирається найбільш оптимальна константа з погляду обраного критерію.

Критерієм може бути точність прогнозування на попередні періоди.

У своєму дослідженні ми розглянули моделі експоненційного згладжування, в яких приймає значення (0.2, 0.4, 0.6, 0.8). Для порівняння з алгоритмом прогнозування Forecast NOW! для кожного товару будувалися прогнози при кожному α, вибирався найточніший прогноз. Насправді ж ситуація була б набагато складніша, користувачу не знаючи наперед точності прогнозу потрібно визначитися з коефіцієнтом α, від якого дуже сильно залежить якість прогнозу. Ось таке замкнене коло.

Наочно

Рисунок 2. α =0.2 , ступінь експоненційного згладжування висока, реальні продажі враховуються слабо

Рисунок 3. α =0.4 , ступінь експоненційного згладжування середня, реальні продажі враховуються в середньому

Можна бачити як зі збільшенням константи α згладжений ряд все сильніше відповідає реальним продажам, і якщо там є викиди або аномалії, ми отримаємо вкрай неточний прогноз.

Рисунок 4. α =0.6 , ступінь експоненційного згладжування низька, реальні продажі враховуються значно

Можемо бачити, що при α=0.8 ряд майже точно повторює вихідний, а значить прогноз прагне до правила «буде продано стільки ж, скільки і вчора»

Тут зовсім не можна орієнтуватися на помилку наближення до вихідних даних. Можна досягти ідеальної відповідності, але отримати неприйнятний прогноз.

Рисунок 5. α =0.8 , ступінь експоненційного згладжування вкрай низька, реальні продажі враховуються сильно

Приклади прогнозів

Тепер давайте подивимося на прогнози, які виходять із використанням різних значеньα. Як можна бачити з малюнка 6 і 7, що більший коефіцієнт згладжування, то точніше повторює реальні продажі із запізненням на один крок, прогноз. Таке запізнення насправді може виявитися критичним, тому не можна просто вибирати максимальне значенняα. Інакше вийде ситуація, коли ми говоримо, що буде продано рівно стільки, скільки було продано минулого періоду.

Малюнок 6. Прогноз методу експонентного згладжування при α=0.2

Малюнок 7. Прогноз методу експонентного згладжування при α=0.6

Давайте подивимося, що виходить за α = 1.0. Нагадаємо, S - прогнозовані (згладжені) продажі, C - реальні продажі.

S (t+1) = (1 -α )* S (t) +α * З (t).

S (t+1) =З (t).

Продаж у t+1 день згідно з прогнозом дорівнює продажам у попередній день. Тому до вибору константи треба підходити з розумом.

Порівняння з Forecast NOW!

Тепер розглянемо даний методпрогнозування порівняно з Forecast NOW! Порівняння велося на 256 товарах, які мають різні продажі, з сезонністю короткострокової та довгострокової, з «поганими» продажами та дефіцитом, акціями та іншими викидами. Для кожного товару був побудований прогноз моделі експоненційного згладжування, для різних α, вибирався кращий і порівнювався з прогнозом моделі Forecast NOW!

У таблиці нижче ви бачите значення помилки прогнозу кожного товару. Помилка тут вважалася як RMSE. Це корінь з середньоквадратичного відхиленняпрогноз від реальності. Грубо кажучи, показує, скільки одиниць товару ми відхилилися в прогнозі. Поліпшення показує, на скільки відсотків прогноз Forecast NOW! краще, якщо цифра позитивна і гірше, якщо негативна. На малюнку 8 по осі X відкладено товари, по осі Y зазначено, наскільки прогноз Forecast NOW! краще, ніж прогнозування шляхом експоненційного згладжування. Як можна бачити із цього графіка, точність прогнозування Forecast NOW! майже завжди вдвічі вищий і майже ніколи не гірший. Насправді це означає, що використання Forecast NOW! дозволить вдвічі скоротити запаси чи знизити дефіцит.

9 5. Метод експоненційного згладжування. Вибір постійного згладжування

При використанні методу найменших квадратів для визначення прогнозної тенденції (тренду) заздалегідь припускають, що всі ретроспективні дані (спостереження) мають однакову інформативність. Очевидно, логічніше було б зважити на процес дисконтування вихідної інформації, тобто нерівноцінність цих даних для розробки прогнозу. Це досягається у методі експоненційного згладжування шляхом надання останнім спостереження. динамічного ряду(тобто значенням, безпосередньо попереднім періоду попередження прогнозу) найбільш значних «ваг» проти початковими спостереженнями. До переваг методу експоненційного згладжування слід також віднести простоту обчислювальних операцій та гнучкість опису різних динаміків процесу. Найбільше застосування метод знайшов реалізації середньострокових прогнозів .

5.1. Сутність методу експоненційного згладжування

Сутність методу полягає в тому, що динамічний ряд згладжується за допомогою виваженої «ковзної середньої», в якій ваги підпорядковуються експоненційному закону. Іншими словами, чим далі від кінця часового ряду відстає точка, для якої обчислюється зважена середня ковзна, тим менше «участі вона бере» у розробці прогнозу.

Нехай вихідний динамічний ряд складається з рівнів (складових ряду) yt, t = 1, 2, ..., n. Для кожних послідовних рівнів цього ряду

(m

динамічному ряду з кроком, що дорівнює одиниці. Якщо m – непарне число, а переважно брати непарне число рівнів, оскільки в цьому випадку розрахункове значення рівня опиниться в центрі інтервалу згладжування і їм легко замінити фактичне значення, то для визначення ковзної середньої можна записати таку формулу:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t− ξ

i= t− ξ

2ξ + 1

де y t - значення ковзної середньої для моменту t (t = 1, 2, ..., n); y i - фактичне значення рівня в момент i;

i – порядковий номер рівня інтервалу згладжування.

Величина ξ визначається із тривалості інтервалу згладжування.

Оскільки

m =2 ξ +1

при непарному m , то

ξ = m 2 − 1 .

Розрахунок ковзної середньої при великій кількості рівнів можна спростити, визначаючи послідовні значення ковзної середньої рекурсивно:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Але виходячи з того, що останнім спостереженням необхідно надати більшу «вагу», ковзне середнє потребує іншого тлумачення. Воно у тому, що отримана з допомогою усереднення величина замінює не центральний член інтервалу усереднення, яке останній член. Відповідно до цього останній вираз можна переписати у вигляді

Mi = Mi + 1

y i− y i− m

Тут ковзна середня, що відноситься до кінця інтервалу, позначена новим символом M i . По суті, Mi рівноy t , зсунутому на кроків вправо, тобто Mi = y t + ξ , де i = t + ξ .

Враховуючи, що M i − 1 є оцінкою величини y i − m , вираз (5.1)

можна переписати у вигляді

y i+ 1

M i − 1 ,

M i , що визначається виразом (5.1).

де M i є оцінкою

Якщо обчислення (5.2) повторювати у міру надходження нової інформації

і переписати в іншому вигляді, то отримаємо згладжену функцію спостережень:

Q i = α y i+ (1 − α ) Q i− 1 ,

або в еквівалентній формі

Q t= α y t+ (1 − α ) Q t− 1

Обчислення, що проводяться за виразом (5.3) з кожним новим спостереженням, називають експоненційним згладжуванням. В останньому виразі для відмінності експоненційного згладжування від ковзного середнього введено позначення Q замість M. Величинаα

аналогом m 1 називається постійною згладжування. Значенняα лежать у

інтервалі [0, 1]. Якщо α уявити у вигляді ряду

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

то неважко помітити, що «ваги» зменшуються за експоненційним законом у часі. Наприклад, для α = 0 , 2 отримаємо

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Сума ряду прагне одиниці, а члени суми зменшуються з часом.

Величина Q t у виразі (5.3) являє собою експоненційну середню першого порядку, тобто середню, отриману безпосередньо при

згладжування даних спостереження (первинне згладжування). Іноді розробки статистичних моделей корисно вдатися до розрахунку експоненційних середніх вищих порядків, тобто середніх, одержуваних шляхом багаторазового експоненційного згладжування.

Загальний запис у рекурентній формі експоненційної середньої порядку k має вигляд

Q t (k) = α Q t (k - 1) + (1 - α) Q t (- k1).

Величина k змінюється в межах 1, 2, …, p, p +1, де – порядок прогнозного полінома (лінійного, квадратичного і так далі).

На основі цієї формули для експоненційної середньої першого, другого та третього порядків отримані вирази

Q t (1) = α y t + (1 - α) Q t (- 1 1);

Q t (2) = α Q t (1) + (1 − α) Q t (− 2 1); Q t (3) = α Q t (2) + (1 - α) Q t (-3 1).

5.2. Визначення параметрів прогнозної моделі методом експоненційного згладжування

Вочевидь, що з розробки прогнозних значень з урахуванням динамічного низки методом експоненційного згладжування необхідно обчислити коефіцієнти рівняння тренду через експоненційні середні. Оцінки коефіцієнтів визначаються за фундаментальною теоремою Брауна Меєра, яка зв'язує коефіцієнти прогнозуючого полінома з експоненційними середніми відповідних порядків:

(− 1 )

aˆ p

α (1 − α )∞

−α )

j (p − 1 + j)!

∑ j

p= 0

p! (k− 1) !j = 0

де a p p - оцінки коефіцієнтів полінома ступеняр .

Коефіцієнти знаходяться рішенням системи (p + 1) рівнянь сp + 1

невідомими.

Так, для лінійної моделі

aˆ 0 = 2 Q t (1) - Q t (2); aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

для квадратичної моделі

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 )];

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Прогноз реалізується за обраним багаточленом відповідно для лінійної моделі

ˆyt + τ = aˆ0 + aˆ1 τ;

для квадратичної моделі

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

де - крок прогнозування.

Необхідно відзначити, що експоненційні середні Q t (k) можна обчислити тільки за відомого (вибраного) параметра, знаючи початкові умови Q 0 (k).

Оцінки початкових умов, зокрема, для лінійної моделі

Q (1) = a

1 − α

Q(2 ) = a− 2 (1 − α ) a

для квадратичної моделі

Q (1) = a

1 − α

+ (1 − α )(2 − α ) a

2(1− α )

(1−α)(3−2α)

Q 0(2 ) = a 0−

2α 2

Q (3) = a

3(1− α )

(1 − α )(4 − 3 α ) a

де коефіцієнти a 0 і 1 обчислюються методом найменших квадратів.

Розмір параметра згладжування α приблизно обчислюється за формулою

α ≈ m 2 + 1 ,

де m - Число спостережень (значень) в інтервалі згладжування. Послідовність обчислення прогнозних значень представлена ​​на

Розрахунок коефіцієнтів низки методом найменших квадратів

Визначення інтервалу згладжування

Обчислення постійного згладжування

Обчислення початкових умов

Обчислення експоненційних середніх

Обчислення оцінок a 0 , a 1 і т.д.

Розрахунок прогнозних значень ряду

Рис. 5.1. Послідовність обчислення прогнозних значень

Як приклад розглянемо процедуру отримання прогнозного значення безвідмовної роботи виробу, що виражається напрацюванням на відмову.

Вихідні дані зведені у табл. 5.1.

Вибираємо лінійну модель прогнозування у вигляді y t = a 0 + a 1 τ

Рішення здійснимо з такими значеннями початкових величин:

a 0 0 = 64 2; a 1, 0 = 31, 5; α = 0,305.

Таблиця 5.1. Початкові дані

Номер спостереження, t

Довжина кроку, прогнозування, τ

Напрацювання на відмову, y (година)

При цих значеннях обчислені «згладжені» коефіцієнти

величини y 2 дорівнюватимуть

= α Q (1) - Q (2) = 97, 9;

[ Q (1 )− Q (2 )

31, 9 ,

1− α

за початкових умов

1 − α

A 0 , 0 −

a 1, 0

= −7 , 6

1 − α

= −79 , 4

та експоненційних середніх

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q (2 )

= α Q (1 )

+ (1 −α) Q(2) = −47,5.

"Згладжена" величина y 2 при цьому обчислюється за формулою

Q i (1 )

Q i (2 )

a 0 ,i

a 1 ,i

ˆyt

Таким чином (табл. 5.2), лінійна прогнозна модель має вигляд

ˆy t + τ = 224, 5+ 32τ.

Обчислимо прогнозні значення для періодів попередження в 2 роки (? = 1), 4 роки (? = 2) і так далі напрацювання на відмову виробу (табл. 5.3).

Таблиця 5.3. Прогнозні значенняˆy t

Рівняння

t + 2

t + 4

t + 6

t + 8

t + 20

регресії

(τ = 1)

(τ = 2)

(τ = 3)

(τ = 5)

τ =

ˆy t = 224, 5+ 32τ

Слід зазначити, що сумарну «вагу» останніх m значень тимчасового ряду можна обчислити за формулою

c = 1−(m(−1)m). m+ 1

Так, для двох останніх спостережень ряду (m = 2) величина c = 1 - (2 2 - + 1 1) 2 = 0,667.

5.3. Вибір початкових умов та визначення постійного згладжування

Як випливає з виразу

Q t= α y t+ (1 − α ) Q t− 1 ,

при проведенні експоненційного згладжування необхідно знати початкове (попереднє) значення функції, що згладжується. У деяких випадках за початкове значенняможна взяти перше спостереження, частіше початкові умови визначаються згідно з виразами (5.4) та (5.5). У цьому величини a 0 , 0 ,a 1 , 0

і a 2 0 визначаються методом найменших квадратів.

Якщо ми не дуже довіряємо вибраному початковому значенню, то, взявши велике значення постійного згладжування через к спостережень, ми доведемо

«вага» початкового значення до величини (1 − α ) k<< α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Таким чином, вибір постійного згладжування (або числа спостережень у середній, що рухається) передбачає прийняття компромісного рішення. Зазвичай, як показує практика, величина постійного згладжування лежить у межах від 0,01 до 0,3.

Відомо кілька переходів, що дозволяють знайти наближену оцінку α. Перший випливає з умови рівності ковзної та експоненційної середньої

α = m 2 + 1 ,

де m - Число спостережень в інтервалі згладжування. Інші підходи пов'язуються з точністю прогнозу.

Так, можливе визначення α виходячи із співвідношення Мейєра:

α ≈ S y ,

де S y - Середньоквадратична помилка моделі;

S 1 - Середньоквадратична помилка вихідного ряду.

Однак використання останнього співвідношення утруднено тим, що достовірно визначити S y і S 1 вихідної інформації дуже складно.

Часто параметр згладжування, а заразом і коефіцієнти a 0 0 і 0 1

підбирають оптимальними залежно від критерію

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j = 0

шляхом розв'язання алгебраїчної системи рівнянь, яку одержують, прирівнюючи до нуля похідні

∂ S2

∂ S2

∂ S2

∂ a 0, 0

∂ a 1, 0

∂ a 2, 0

Так, для лінійної моделі прогнозування вихідний критерій дорівнює

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j = 0

Рішення цієї системи за допомогою ЕОМ не становить жодних складнощів.

Для обґрунтованого вибору α також можна використовувати процедуру узагальненого згладжування, яка дозволяє отримати наступні співвідношення, що пов'язують дисперсію прогнозу та параметр згладжування для лінійної моделі:

S п 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

для квадратичної моделі

S п 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

де β = 1 α ;Sy- СКО апроксимації вихідного динамічного ряду.

Очевидно, що в методі зваженого ковзного середнього існує безліч способів задавати значення ваги так, щоб їх сума була рівною 1. Один з таких способів називається експоненційним згладжуванням. У цій схемі методу зваженого середнього для будь-якого t > 1 прогнозоване значення в момент часу t+1 є зваженою сумою фактичного обсягу продажів , за період часу t і прогнозованого обсягу продажів , за період часу t Іншими словами,

Експонентне згладжування має обчислювальні переваги перед ковзним середнім. Тут, щоб обчислити , необхідно знати тільки значення і , (разом зі значенням α). Наприклад, якщо компанії потрібно спрогнозувати попит для 5000 найменувань виробів у кожний період часу, то в цьому випадку необхідно зберігати 10001 значень даних (5000 значень 5000 значень і значення α), у той час як для виконання прогнозу на основі ковзного середнього по 8 вузлам потрібно 40000 значень даних. Залежно від поведінки даних, можливо, потрібно зберігати різні значення α для кожного виробу, але навіть у цьому випадку кількість інформації, що зберігається значно менше, ніж при використанні ковзного середнього. Позитивна особливість експоненційного згладжування полягає в тому, що, зберігаючи і останній прогноз, всі попередні прогнози також неявно зберігаються.

Розглянемо деякі властивості моделі експонентного згладжування. Спочатку зауважимо, що t > 2, то формулі (1) t можна замінити на t–1, тобто. Підставивши цей вираз у початкову формулу (1), отримаємо

Виконуючи послідовно аналогічні підстановки, отримаємо наступний вираздля

Оскільки з нерівності 0< α < 1 следует, что 0 < 1 – α < 1, то Другими словами, наблюдение , имеет больший вес, чем наблюдение , которое, в свою очередь, имеет больший вес, чем . Это иллюстрирует основное свойство модели экспоненциального сглаживания - коэффициенты при убывают при уменьшении номера k. Также можно показать, что сумма всех коэффициентов (включая коэффициент при ), равна 1.

З формули (2) видно, що значенням є виважена сума всіх попередніх спостережень (включаючи останнє спостереження). Остання складова суми (2) є не статистичним спостереженням, А «припущенням» (можна припустити, наприклад, що). Очевидно, що зі зростанням t вплив на прогноз зменшується, і в певний момент їм можна буде знехтувати. Навіть якщо значення α досить мале (таке, що (1 – α) приблизно дорівнює 1), значення швидко зменшуватиметься.

Значення параметра α сильно впливає на функціонування моделі прогнозування, оскільки α є вагою останнього спостереження . Це означає, що слід призначати більше значенняα у тому випадку, коли у моделі найбільш прогностичним є саме останнє спостереження. Якщо ж близько 0, це означає практично повну довіру до минулого прогнозу та ігнорування останнього спостереження.

Перед Віктором постала проблема: як найкращим чиномВибрати значення α. Знову, у цьому допоможе засіб пошуку рішення. Щоб знайти оптимальне значення α (тобто таке, при якому прогнозна крива найменше відхилятиметься від кривої значень часового ряду), виконайте такі дії.

  1. Виберіть команду Сервіс -> Пошук рішення.
  2. У діалоговому вікні Пошук рішення встановіть цільовий осередок G16 (див. лист «Експо») і вкажіть, що його значення має бути мінімальним.
  3. Вкажіть, що змінним осередком є ​​осередок В1.
  4. Введіть обмеження B1 > 0 та B1< 1
  5. Натиснувши кнопку Виконати, отримайте результат, показаний на рис. 8.

Знову, як і методі виваженого ковзного середнього, найкращий прогноз буде отримано, якщо призначити всю вагу останньому спостереженню. Отже, оптимальне значення дорівнює 1, при цьому середнє абсолютних відхилень дорівнює 6,82 (осередок G16). Віктор здобув прогноз, який уже бачив раніше.

Метод експоненційного згладжування добре працює в ситуаціях, коли цікава для нас змінна поводиться стаціонарно, а її відхилення від постійного значення викликані випадковими факторами і не носять регулярного характеру. Але: незалежно від значення параметра α методом експоненційного згладжування не вдасться спрогнозувати монотонно зростаючі або монотонно спадні дані (прогнозовані значення будуть завжди менше або більше спостерігаються відповідно). Також можна показати, що моделі з сезонними змінами отримати задовільні прогнози цим методом не вдасться.

Якщо статистичні дані монотонно змінюються або схильні до сезонних змін, необхідні спеціальні методипрогнозування, які будуть розглянуті нижче.

Метод Хольта (експоненційне згладжування з урахуванням тренду)

,

Метод Хольта дозволяє прогнозувати k періодів часу вперед. Метод, як видно, використовує два параметри і β. Значення цих параметрів знаходяться в межах від 0 до 1. Змінна L вказує на довгостроковий рівень значень або базове значення даних часового ряду. Змінна Т вказує на можливе зростання чи спадання значень за період.

Розглянемо роботу цього на новому прикладі. Світлана працює аналітиком у великій брокерській фірмі. На основі наявних у неї квартальних звітів компанії Startup Airlines вона хоче спрогнозувати дохід цієї компанії у наступному кварталі. Наявні дані та діаграма, побудована на їх основі, знаходяться у робочій книзі Startup.xls (рис. 9). Видно, дані мають явний тренд (майже монотонно зростають). Світлана хоче застосувати метод Хольта, щоб спрогнозувати значення прибутку на одну акцію на тринадцятий квартал. Для цього необхідно задати початкові значення для L і Т. Є кілька варіантів вибору: 1) L дорівнює значенню прибутку на одну акцію за перший квартал і T = 0; 2) L дорівнює середньому значенню прибутку на одну акцію за 12 кварталів і T дорівнює середній зміні за всі 12 кварталів. Існують інші варіанти початкових значень для L і Т, але Світлана обрала перший варіант.

Вона вирішила скористатися засобом Пошук рішення, щоб знайти оптимальне значення параметрів α і β, за яких значення середнього абсолютних помилоку відсотках було б мінімально. Для цього необхідно виконати такі дії.

Вибрати команду Сервіс -> Пошук рішення.

У діалоговому вікні Пошук рішення задати комірку F18 цільової і вказати, що її значення слід мінімізувати.

У полі Змінюючи осередки ввести діапазон осередків В1: В2. Додати обмеження В1:В2 > 0 та В1:В2< 1.

Клацніть на кнопці Виконати.

Отриманий прогноз показано на рис. 10.

Як видно, оптимальними виявилися значення α = 0,59 і β = 0,42, при цьому середня абсолютна помилка у відсотках дорівнює 38%.

Облік сезонних змін

При прогнозуванні на основі даних часового ряду слід враховувати сезонні зміни. Сезонні зміни - це коливання вгору та вниз із постійним періодом у значеннях змінної.

Наприклад, якщо подивитися на обсяги продажу морозива по місяцях, то можна побачити теплі місяці(з червня по серпень у північній півкулі) більше високий рівеньпродажів, ніж узимку, і так щороку. Тут сезонні коливання мають період 12 місяців. Якщо використовуються дані, зібрані на тижні, то структура сезонних коливаньповторюватиметься через кожні 52 тижні Інший приклад аналізуються щотижневі звіти про кількість постояльців, які залишалися на ніч в готелі, розташованому в бізнес-центрі міста Імовірно можна сказати, що велика кількість клієнтів очікується в ночі на вівторок, середу та четвер, найменше клієнтів у ночі на суботу та неділю, і середня кількість постояльців очікується у ночі на п'ятницю та понеділок. Така структура даних, що відображає кількість клієнтів у різні днітижня, повторюватиметься через кожні сім днів.

Процедура, яка дозволяє зробити прогноз з урахуванням сезонних змін, складається з чотирьох етапів.

1) На основі вихідних даних визначається структура сезонних коливань та період цих коливань.

3) На основі даних, з яких виключено сезонну складову, робиться найкращий можливий прогноз.

4) До отриманого прогнозу додається сезонна складова.

Проілюструємо цей підхід на даних про обсяги збуту вугілля (вимірюваного в тисячах тонн) у США протягом дев'яти років Френк працює менеджером у компанії Gillette Coal Mine, йому необхідно спрогнозувати попит на вугілля на найближчі два квартали. Він ввів дані по всій вугільній галузі до робочої книги Уголь.xls і побудував за цими даними графік (рис. 11). На графіку видно, що обсяги продажів вищі за середній рівень у першому та четвертому кварталах ( зимовий часроку) та нижче середнього у другому та третьому кварталах (весняно-літні місяці).

Виняток сезонної складової

Спочатку необхідно обчислити середнє значення всіх відхилень за період сезонних змін. Щоб виключити сезонну складову в межах одного року, використовуються дані за чотири періоди (кварталу). А щоб виключити сезонну складову з усього часового ряду, обчислюється послідовність ковзних середніх по T вузлах, де T - тривалість сезонних коливань Для виконання необхідних обчислень Френк використовував стовпці З і D, як показано на рис. нижче. Стовпець містить значення ковзного середнього по 4 вузлам на основі даних, які знаходяться в стовпці В.

Тепер треба призначити отримані значення ковзного середнього середнім точкам послідовності даних, на основі яких ці значення були обчислені. Ця операція називається центруваннямзначень. Якщо T непарне, то перше значення ковзного середнього (середнє значень від першої до T-ї точки) треба присвоїти (T + 1)/2 точці (наприклад, якщо T = 7, то перше ковзне середнє буде призначено четвертій точці). Аналогічно середнє значень від другої до (T + 1) точки центрується в (T + 3) / 2 точці і т. д. Центр n-го інтервалу знаходиться в точці (T + (2n-1)) / 2.

Якщо T парне, як у даному випадку, то завдання дещо ускладнюється, оскільки тут центральні (середні) точки розташовані між точками, за якими обчислювалося значення ковзного середнього. Тому центроване значення для третьої точки обчислюється як середнє першого та другого значень ковзного середнього. Наприклад, перше число в стовпці D центрованих середніх на рис. 12, зліва дорівнює (1613 + 1594) / 2 = 1603. На рис. 13 показані графіки вихідних даних та відцентрованих середніх.

Далі знаходимо відношення значень точок даних до відповідних значень центрованих середніх. Оскільки точок на початку та наприкінці послідовності даних немає відповідних відцентрованих середніх (див. перші та останні значенняу стовпці D), така дія на ці точки не поширюється. Ці відносини показують ступінь відхилення значень даних щодо типового рівня, що визначається відцентрованими середніми. Зауважимо, що значення відносин для третіх кварталів менше 1, а для четвертих – більше 1.

Ці відносини є основою створення сезонних індексів. Для їхнього обчислення групуються обчислені відносини по кварталах, як показано на рис. 15 у стовпцях G-О.

Потім перебувають середні значення відносин за кожним кварталом (стовпець Е на рис. 15). Наприклад, середнє всіх відносин для першого кварталу дорівнює 1,108. Це значення є сезонним індексом першого кварталу, основі якого можна дійти невтішного висновку, що обсяг збуту вугілля перший квартал становить середньому близько 110,8% відносного середнього річного обсягу збуту.

Сезонний індекс- це середнє ставлення даних, які стосуються одного сезону (у разі сезоном є квартал), всім даних. Якщо сезонний індекс більше 1, значить, показники цього сезону вищі за середні показники за рік, аналогічно, якщо сезонний індекс нижчий за 1, то показники сезону нижчі від середніх показників за рік.

Зрештою, щоб виключити з вихідних даних сезонну складову, слід поділити значення вихідних даних на відповідний сезонний індекс. Результати цієї операції наведені у стовпцях F та G (рис. 16). Графік даних, які не містять сезонної складової, представлений на рис. 17.

Прогнозування

На основі даних, з яких виключено сезонну складову, будується прогноз. Для цього використовується відповідний метод, який враховує характер поведінки даних (наприклад дані мають тренд або відносно постійні). У цьому прикладі прогноз будується за допомогою простого експонентного згладжування. Оптимальне значення параметра α знаходиться за допомогою інструмента Пошук рішення. Графік прогнозу та реальних даних з виключеною сезонною складовою наведено на рис. 18.

Облік сезонної структури

Тепер потрібно врахувати в отриманому прогнозі (1726,5) сезонну складову. Для цього слід помножити 1726 на сезонний індекс першого кварталу 1,108, в результаті чого отримаємо значення 1912 р. Аналогічна операція (множення 1726 на сезонний індекс 0,784) дасть прогноз на другий квартал, рівний 1353. Результат додавання сезонної структури до отриманого прогнозу показаний на рис. 19.

Варіанти завдань:

Завдання 1

Даний тимчасовий ряд

t
x

1. Побудуйте графік залежності x = x(t).

  1. Використовуючи просте ковзне середнє по 4 вузлах, спрогнозуйте попит в 11 момент часу.
  2. Чи підходить такий метод прогнозування цих даних чи ні? Чому?
  3. Підберіть лінійну функціюнаближення даних шляхом найменших квадратів.

Завдання 2

Використовуючи модель прогнозів доходів компанії Startup Airlines (Startup.xls) виконайте:

Завдання 3

Для тимчасового ряду

t
x

виконайте:

  1. Використовуючи зважене ковзне середнє по 4 вузлах, і призначивши ваги 4/10, 3/10, 2/10, 1/10, спрогнозуйте попит у 11 момент часу. Більшу вагу слід призначати пізнішим спостереженням.
  2. Чи є це наближення більш кращим по відношенню до простого ковзного середнього по 4 вузлах? Чому?
  3. Знайдіть середнє абсолютних відхилень.
  4. За допомогою засобу Пошук рішення знайдіть оптимальні ваги вузлів. Наскільки поменшала помилка наближення?
  5. Скористайтеся для прогнозу методом експонентного згладжування. Який їх використаний метод дає кращий результат?

Завдання 4

Проаналізуйте тимчасовий ряд

Час
Попит
  1. Скористайтеся методом виваженого ковзного середнього по 4 вузлам, призначивши ваги 4/10, 3/10, 2/10, 1/10, щоб отримати прогноз у моменти часу 5-13. Більшу вагу слід призначати пізнішим спостереженням.
  2. Знайдіть середнє абсолютних відхилень.
  3. Чи вважаєте ви, що це наближення краще в порівнянні з моделлю простого ковзного середнього по 4 вузлах? Чому?
  4. За допомогою засобу Пошук рішення знайдіть оптимальні ваги вузлів. Наскільки вдалося зменшити значення помилки?
  5. Скористайтеся для прогнозу методом експонентного згладжування. Який їх використаних методів дає найкращий результат?

Завдання 5

Даний тимчасовий ряд

Завдання 7

Менеджер з маркетингу невеликої компанії, що розвиває мережу продовольчих магазинів, має інформацію про обсяги продажів за весь час існування найприбутковішого магазину (див. табл.).

Використовуючи просте ковзне середнє по 3 вузлах, спрогнозуйте значення у вузлах з 4 до 11.

Використовуючи зважене середнє ковзне по 3 вузлах, спрогнозуйте значення у вузлах з 4 до 11. Для визначення оптимальних ваг скористайтеся засобом Пошук рішення.

Методом експонентного згладжування спрогнозуйте значення у вузлах 2-11. Визначте оптимальне значення параметра α за допомогою інструмента Пошук рішення.

Який із отриманих прогнозів найточніший і чому?

Завдання 8

Даний тимчасовий ряд

  1. Побудуйте графік цього часового ряду. З'єднайте точки відрізками прямих.
  2. Використовуючи просте ковзне середнє по 4 вузлах, спрогнозуйте попит для вузлів 5-13.
  3. Знайдіть середнє абсолютних відхилень.
  4. Чи доцільно використовувати цей метод прогнозування для представлених даних?
  5. Чи є це наближення більш кращим по відношенню до простого ковзного середнього по 3 вузлах? Чому?
  6. Побудуйте за даними лінійний та квадратичний тренд.
  7. Скористайтеся для прогнозу методом експонентного згладжування. Який їх використаний метод дає кращий результат?

Завдання 10

У робочій книзі Business_Week.xls наведено дані з журналу Business Week щодо щомісячних обсягів продажу автомобілів за 43 місяці.

  1. Виключіть із цих даних сезонну складову.
  2. Визначте найкращий методпрогнозування для даних.
  3. Чому дорівнює прогноз для 44-го періоду?

Завдання 11

  1. Проста схемапрогнозування, коли значення минулого тижня приймається за прогноз наступного тижня.
  2. Метод ковзного середнього (з кількістю вузлів на ваш розсуд). Спробуйте використати декілька різних значень вузлів.

Завдання 12

У робочій книзі Банк.xls наведено показники роботи банку. Розгляньте наступні методипрогнозування значень цього часового ряду.

Як прогноз використовується середнє значення показника за всі попередні тижні.

Метод зваженого ковзного середнього (з числом вузлів на ваш розсуд). Спробуйте використати декілька різних значень вузлів. Для визначення оптимальних ваг скористайтеся засобом пошуку рішення.

Метод експонентного згладжування. Виберіть оптимальне значення параметра α за допомогою інструмента Пошук рішення.

Який із запропонованих вище методів прогнозування ви порекомендували б для прогнозу значень даного часового ряду?

Література


Подібна інформація.


02.04.2011 – Прагнення людини підняти завісу майбутнього і передбачити перебіг подій має таку ж довгу історію, як і її спроби зрозуміти навколишній світ. Очевидно, що в основі інтересу до прогнозу лежать досить сильні життєві мотиви (теоретичні та практичні). Прогноз виступає як найважливішого методуперевірки наукових теорій та гіпотез. Здатність передбачати майбутнє є невід'ємною стороною свідомості, без якої було б неможливе саме людське життя.

Поняття “прогнозування” (від грецьк. prognosis – передбачення, передбачення) означає процес розробки імовірнісного судження про стан будь-якого явища чи процесу у майбутньому, це пізнання того, чого ще немає, але може наступити найближчим чи віддалений час.

Прогноз за змістом складніший, ніж прогноз. Він, з одного боку, відбиває найімовірніший стан об'єкта, з другого – визначає шляхи і засоби досягнення бажаного результату. На основі отриманої прогнозним шляхом інформації щодо досягнення бажаної мети приймаються певні рішення.

Необхідно відзначити, що динаміка економічних процесів у сучасних умовахвідрізняється нестабільністю та невизначеністю, що ускладнює застосування традиційних методів прогнозування.

Моделі експоненційного згладжування та прогнозуваннявідносяться до класу адаптивних методів прогнозування, основною характеристикою яких є здатність безперервно враховувати еволюцію динамічних характеристик процесів, що вивчаються, підлаштовуватися під цю динаміку, надаючи, зокрема, тим більшу вагу і тим більш високу інформаційну цінність наявним спостереженням, чим ближче вони розташовані до поточному моментучасу. Сенс терміна у тому, що адаптивне прогнозування дозволяє оновлювати прогнози з мінімальною затримкою і з допомогою щодо нескладних математичних процедур.

Метод експоненційного згладжування був незалежно відкритий Брауном(Brown R.G. Statistical forecasting for inventory control, 1959) і Хольтом(Holt C.C. Forecasting Seasonal and Trends by Exponentially Weighted Moving Averages, 1957). Експонентне згладжування, як і метод ковзних середніх, для прогнозу використовує минулі значення часового ряду.

Сутність методу експоненційного згладжування полягає в тому, що тимчасовий ряд згладжується за допомогою зваженої ковзної середньої, в якій ваги підпорядковуються експоненційному закону. Зважена ковзна середня з експоненційно розподіленими вагами характеризує значення процесу на кінці інтервалу згладжування, тобто є середньою характеристикою останніх рівнівряду. Саме ця властивість і використовується для прогнозування.

Звичайне експоненційне згладжування застосовується у разі відсутності даних тренда або сезонності. У цьому випадку прогноз є виваженим середнім всіх доступних попередніх значень ряду; ваги при цьому згодом геометрично спадають у міру просування у минуле (назад). Тому (на відміну методу ковзного середнього) тут немає точки, де ваги обриваються, тобто зануляются. Прагматично ясна модель простого експоненційного згладжування може бути записана наступним (за наведеним посиланням можна завантажити всі формули статті):

Покажемо експоненційний характер зменшення ваги значень тимчасового ряду - від поточного до попереднього, від попереднього до попереднього і так далі:

Якщо формула застосовується рекурсивно, то кожне нове згладжене значення (яке є також прогнозом) обчислюється як зважене середнє поточного спостереження та згладженого ряду. Очевидно, що результат згладжування залежить від параметра адаптації альфа. Його можна інтерпретувати як коефіцієнт дисконтування, що характеризує міру девальвації даних за одиницю часу. Причому вплив даних на прогноз експоненційно зменшується з “віком” даних. Залежність впливу даних на прогноз при різних коефіцієнтах альфанаведено малюнку 1.

Рисунок 1. Залежність впливу даних на прогноз за різних коефіцієнтів адаптації

Слід зазначити, що значення параметра, що згладжує, не може дорівнювати 0 або 1, так як в цьому випадку сама ідея експоненційного згладжування відкидається. Так, якщо альфадорівнює 1, то прогнозне значення F t+1збігається з поточним значенням ряду ХtПри цьому експоненційна модель прагне найпростішої “наївної” моделі, тобто в цьому випадку прогнозування є абсолютно тривіальним процесом. Якщо альфадорівнює 0, то початкове прогнозне значення F 0 (initial value) одночасно буде прогнозом для всіх наступних моментів ряду, тобто прогноз у цьому випадку виглядатиме у вигляді звичайної горизонтальної лінії.

Тим не менш, розглянемо варіанти параметра, що згладжує, близькі до 1 або 0. Так, якщо альфаблизько до 1, то попередні спостереження часового ряду майже повністю ігноруються. У разі якщо альфаблизько 0, то ігноруються вже поточні спостереження. Значення альфаміж 0 та 1 дають проміж точні результати. На думку ряду авторів, оптимальне значення альфазнаходиться в межах від 0,05 до 0,30. Однак іноді альфа, Більше 0,30, дає найкращий прогноз.

Загалом краще оцінювати оптимальне альфаза вихідними даними (за допомогою пошуку по сітці), а не використовувати штучні поради. Тим не менш, якщо значення альфа, що перевищує 0,3, мінімізує ряд спеціальних критеріїв, це вказує на те, що інша техніка прогнозування (із застосуванням тренду або сезонності) здатна забезпечити ще більш точні результати. Для знаходження оптимального значення альфа(тобто мінімізації спеціальних критеріїв) використовується квазиньютонівський алгоритм максимізації правдоподібності(ймовірності), що ефективніше звичайного перебору на сітці.

Перепишемо рівняння (1) у вигляді альтернативного варіанта, що дозволяє оцінити, як модель експоненційного згладжування “навчається” на своїх попередніх помилках:

З рівняння (3) яскраво видно, що прогноз на період t+1підлягає зміні у бік збільшення у разі перевищення фактичного значення тимчасового ряду в період tнад прогнозним значенням, і, навпаки, прогноз на період t+1повинен бути зменшений, якщо Х tменше ніж F t.

Зауважимо, що при використанні методів експоненційного згладжування важливим питаннямзавжди є визначення початкових умов (початкового прогнозного значення F 0). Процес вибору початкового значення згладженого ряду називається ініціалізацією ( initializing), або, інакше, "розігрівом" (“ warming up”) моделі. Справа в тому, що початкове значення згладженого процесу може суттєво вплинути на прогноз для подальших спостережень. З іншого боку, вплив вибору зменшується з довжиною ряду і стає некритичним при великій кількості спостережень. Браун вперше запропонував використовувати як стартове значення середнє динамічного ряду. Інші автори пропонують використовувати як початковий прогноз перше фактичне значення часового ряду.

У середині минулого століття Хольт запропонував розширити модель простого експоненційного згладжування за рахунок включення до неї фактора зростання ( growth factor), або інакше тренда ( trend factor). В результаті модель Хольта може бути записана таким чином:

Даний метод дозволяє врахувати присутність даних лінійного тренда. Пізніше було запропоновано інші види трендів: експоненційний, демпфований та інших.

Вінтерсзапропонував удосконалити модель Хольта з погляду можливості опису впливу сезонних факторів. (Winters P.R. Forecasting Sales by Exponentially Weighted Moving Averages, 1960).

Зокрема, він далі розширив модель Хольта за рахунок включення до неї додаткового рівняння, що описує поведінку сезонної компоненти(Складовою). Система рівнянь моделі Вінтерса виглядає так:

Дріб у першому рівнянні служить для виключення сезонності з вихідного ряду. Після виключення сезонності (за методом сезонної декомпозиції CensusI) алгоритм працює з "чистими" даними, в яких немає сезонних коливань. З'являються вони вже у фінальному прогнозі (15), коли “чистий” прогноз, порахований майже методом Хольта, множиться на сезонну компоненту (індекс сезонності).