Биографии Характеристики Анализ

Метод экспоненциального сглаживания. Прогнозирование методом экспоненциального сглаживания (ES, exponential smoothing)

Экспоненциальное сглаживание - способ сглаживания временных рядов, вычислительная процедура которого включает обработку всех предыдущих наблюдений, при этом учитывается устаревание информации по мере удаления от прогнозного периода. Иначе говоря, чем "старше" наблюдение, тем меньше оно должно влиять на величину прогнозной оценки. Идея экспоненциального сглаживания состоит в том, что по мере "старения" соответствующим наблюдениям придаются убывающие веса.

Данный метод прогнозирования считается весьма эффективным и падежным. Основные достоинства метода состоят в возможности учета весов исходной информации, в простоте вычислительных операций, в гибкости описания различных динамик процессов. Метод экспоненциального сглаживания дает возможность получить оценку параметров тренда, характеризующих не средний уровень процесса, а тенденцию, сложившуюся к моменту последнего наблюдения. Наибольшее применение метод нашел для реализации среднесрочных прогнозов. Для метода экспоненциального сглаживания основным моментом является выбор параметра сглаживания (сглаживающей константы) и начальных условий.

Простое экспоненциальное сглаживание временных рядов, содержащих тренд, приводит к систематической ошибке, связанной с отставанием сглаженных значений от фактических уровней временного ряда. Для учета тренда в нестационарных рядах применяется специальное двухпараметрическое линейное экспоненциальное сглаживание. В отличие от простого экспоненциального сглаживания с одной сглаживающей константой (параметром) данная процедура сглаживает одновременно случайные возмущения и тренд с использованием двух различных констант (параметров). Двухпараметрический метод сглаживания (метод Хольта) включает два уравнения. Первое предназначено для сглаживания наблюденных значений, а второе -для сглаживания тренда:

где I - 2, 3, 4 - периоды сглаживания; 5, - сглаженная величина на период £; У, - фактическое значение уровня на период 1 5, 1 - сглаженное значение на период Ь-Ьг- сглаженное значение тренда на период 1 - сглаженное значение на период I- 1; А и В - сглаживающие константы (числа между 0 и 1).

Сглаживающие константы А и В характеризуют фактор взвешивания наблюдений. Обычно Л, В < 0,3. Так как (1 - А) < 1, (1 - В) < 1, то они убывают по экспоненциальному закону по мере удаления наблюдения от текущего периода I. Отсюда данная процедура получила название экспоненциально сглаживания.

Уравнение добавляется в общую процедуру для сглаживания тренда. Каждая новая оценка тренда получается как взвешенная сумма разности между последними двумя сглаженными значениями (текущая оценка тренда) и предыдущей сглаженной оценки. Данное уравнение позволяет существенно сократить влияние случайных возмущений на тренд с течением времени.

Прогнозирование с использованием экспоненциального сглаживания подобно процедуре "наивного" прогнозирования, когда прогнозная оценка на завтра полагается равной сегодняшнему значению. В данном случае в качестве прогноза на один период вперед рассматривается сглаженная величина на текущий период плюс текущее сглаженное значение тренда:

Данную процедуру можно использовать для прогнозирования на любое число периодов, на пример на т периодов:

Процедура прогнозирования начинается с того, что сглаженная величина 51 полагается равной первому наблюдению У, т.е. 5, = У,.

Возникает проблема определения начального значения тренда 6]. Существуют два способа оценки Ьх.

Способ 1. Положим Ьх = 0. Такой подход хорошо работает в случае длинного исходного временного ряда. Тогда сглаженный тренд за небольшое число периодов приблизится к фактическому значению тренда.

Способ 2. Можно получить более точную оценку 6, используя первые пять (или более) наблюдений временного ряда. На их основе гю методу наименьших квадратов решается уравнение У(= а + Ь х г. Величина Ь берется в качестве начального значения тренда.

Насколько Forecast NOW! лучше модели Экспоненциального сглаживания (ES) вы можете увидеть на графике ниже. По оси X - номер товара, по оси Y - процентное улучшение качества прогноза. Описание модели, детальное исследование, результаты экспериментов читайте ниже.

Описание модели

Прогнозирование методом экспоненциального сглаживания является одним из самых простых способов прогнозирования. Прогноз может быть получен только на один период вперед. Если прогнозирование ведется в разрезе дней, то только на один день вперед, если недель, то на одну неделю.

Для сравнения прогнозирование проводилось на неделю вперед в течение 8 недель.

Что такое экспоненциально сглаживание?

Пусть ряд С представляет исходный ряд продаж для прогнозирования

С(1)- продажи в первую неделю, С (2) во второй и так далее.

Рисунок 1. Продажи по неделям, ряд С

Аналогично, ряд S представляет собой экспоненциально сглаженный ряд продаж. Коэффициент α находится от нуля до единицы. Получается он следующим образом, здесь t - момент времени (день, неделя)

S (t+1) = S(t) + α *(С(t) - S(t))

Большие значения константы сглаживания α ускоряют отклик прогноза на скачок наблюдаемого процесса, но могут привести к непредсказуемым выбросам, потому что сглаживание будет почти отсутствовать.

Первый раз после начала наблюдений, располагая лишь одним результатом наблюдений С (1) , когда прогноза S(1) нет и формулой (1) воспользоваться еще невозможно, в качестве прогноза S(2) следует взять С (1) .

Формула легко может быть переписана в ином виде:

S(t+1) = (1 - α)* S(t) + α * С(t) .

Таким образом, с увеличением константы сглаживания доля последних продаж увеличивается, а доля сглаженных предыдущих уменьшается.

Константа α выбирается опытным путем. Обычно строится несколько прогнозов для разных констант и выбирается наиболее оптимальная константа с точки зрения выбранного критерия.

Критерием может выступать точность прогнозирования на предыдущие периоды.

В своем исследовании мы рассмотрели модели экспоненциального сглаживания, в которых α принимает значения {0.2, 0.4, 0.6, 0.8}. Для сравнения с алгоритмом прогнозирования Forecast NOW! для каждого товара строились прогнозы при каждом α, выбирался наиболее точный прогноз. В действительности же, ситуация обстояла бы гораздо более сложная, пользователю не зная наперед точности прогноза нужно определиться с коэффициентом α, от которого очень сильно зависит качество прогноза. Вот такой замкнутый круг.

Наглядно

Рисунок 2. α =0.2 , степень экспоненциального сглаживания высокая, реальные продажи учитываются слабо

Рисунок 3. α =0.4 , степень экспоненциального сглаживания средняя, реальные продажи учитываются в средней степени

Можно видеть как с увеличением константы α сглаженный ряд все сильнее соответствует реальным продажам, и если там присутствуют выбросы или аномалии, мы получим крайне неточный прогноз.

Рисунок 4. α =0.6 , степень экспоненциального сглаживания низкая, реальные продажи учитываются значительно

Можем видеть, что при α=0.8 ряд почти в точности повторяет исходный, а значит прогноз стремится к правилу «будет продано столько же, сколько и вчера»

Стоит отметить, что здесь совершенно нельзя ориентироваться на ошибку приближения к исходным данным. Можно добиться идеального соответствия, но получить неприемлемый прогноз.

Рисунок 5. α =0.8 , степень экспоненциального сглаживания крайне низкая, реальные продажи учитываются сильно

Примеры прогнозов

Теперь давайте посмотрим на прогнозы, которые получаются с использованием различных значений α. Как можно видеть из рисунка 6 и 7, чем больше коэффициент сглаживания, тем точнее повторяет реальные продажи с опозданием на один шаг, прогноз. Такое опоздание на деле может оказаться критичным, поэтому нельзя просто выбирать максимальное значение α. Иначе получится ситуация, когда мы говорим, что будет продано ровно столько, сколько было продано в прошлый период.

Рисунок 6. Прогноз метода экспоненциального сглаживания при α=0.2

Рисунок 7. Прогноз метода экспоненциального сглаживания при α=0.6

Давайте посмотрим, что получается при α = 1.0. Напомним, S - прогнозируемые (сглаженные) продажи, C - реальные продажи.

S(t+1) = (1 - α)* S(t) + α * С(t) .

S(t+1) = С(t) .

Продажи в t+1 день согласно прогнозу равны продажам в предыдущий день. Поэтому к выбору константы надо подходить с умом.

Сравнение с Forecast NOW!

Теперь рассмотрим данный метод прогнозирования в сравнении с Forecast NOW!. Сравнение велось на 256 товарах, которые имеют различные продажи, с сезонностью краткосрочной и долгосрочной, с «плохими» продажами и дефицитом, акциями и прочими выбросами. Для каждого товара был построен прогноз по модели экспоненциального сглаживания, для различных α, выбирался лучший и сравнивался с прогнозом по модели Forecast NOW!

В таблице ниже вы видите значение ошибки прогноза для каждого товара. Ошибка здесь считалась как RMSE. Это корень из среднеквадратичного отклонения прогноза от реальности. Грубо говоря, показывает, на сколько единиц товара мы отклонились в прогнозе. Улучшение показывает, на сколько процентов прогноз Forecast NOW! лучше, если цифра положительная, и хуже, если отрицательная. На рисунке 8 по оси X отложены товары, по оси Y указано насколько прогноз Forecast NOW! лучше, чем прогнозирование методом экспоненциального сглаживания. Как можно видеть из этого графика, точность прогнозирования Forecast NOW! почти всегда в два раза выше и почти никогда не хуже. На деле это означает, что использование Forecast NOW! позволит в два раза сократить запасы или снизить дефицит.

9 5. Метод экспоненциального сглаживания. Выбор постоянной сглаживания

При использовании метода наименьших квадратов для определения прогнозной тенденции (тренда) заранее предполагают, что все ретроспективные данные (наблюдения) обладают одинаковой информативностью. Очевидно, логичнее было бы учесть процесс дисконтирования исходной информации, то есть неравноценность этих данных для разработки прогноза. Это достигается в методе экспоненциального сглаживания путем придания последним наблюдения динамического ряда (то есть значениям, непосредственно предшествующим периоду упреждения прогноза) более значимых «весов» по сравнению с начальными наблюдениями. К достоинствам метода экспоненциального сглаживания следует также отнести простоту вычислительных операций и гибкость описания различных динамик процесса. Наибольшее применения метод нашел для реализации среднесрочных прогнозов .

5.1. Сущность метода экспоненциального сглаживания

Сущность метода состоит в том, что динамический ряд сглаживается с помощью взвешенной «скользящей средней», в которой веса подчиняются экспоненциальному закону. Другими словами, чем дальше от конца временного ряда отстоит точка, для которой вычисляется взвешенная скользящая средняя, тем меньше «участия она принимает» в разработке прогноза.

Пусть исходный динамический ряд состоит из уровней (составляющих ряда) y t , t = 1 , 2 ,...,n . Для каждыхm последовательных уровней этого ряда

(m

динамическому ряду с шагом, равным единице. Если m – нечетное число, а предпочтительно брать нечетное число уровней, поскольку в этом случае расчетное значение уровня окажется в центре интервала сглаживания и им легко заменить фактическое значение, то для определения скользящей средней можно записать следующую формулу:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t− ξ

i= t− ξ

2ξ + 1

где y t – значение скользящей средней для моментаt (t = 1 , 2 ,...,n );y i – фактическое значение уровня в моментi ;

i – порядковый номер уровня в интервале сглаживания.

Величина ξ определяется из продолжительности интервала сглаживания.

Поскольку

m =2 ξ +1

при нечетном m , то

ξ = m 2 − 1 .

Расчет скользящей средней при большом числе уровней можно упростить, определяя последовательные значения скользящей средней рекурсивно:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Но исходя из того, что последним наблюдениям необходимо придать больший «вес», скользящее среднее нуждается в ином толковании. Оно заключается в том, что полученная с помощью усреднения величина заменяет не центральный член интервала усреднения, а его последний член. Соответственно этому последнее выражение можно переписать в виде

M i = Mi + 1

y i− y i− m

Здесь скользящая средняя, относимая к концу интервала, обозначена новым символом M i . По существу,M i равноy t , сдвинутому наξ шагов вправо, то естьM i = y t + ξ , гдеi = t + ξ .

Учитывая, что M i − 1 является оценкой величиныy i − m , выражение (5.1)

можно переписать в виде

y i+ 1

M i − 1 ,

M i , определяемой выражением (5.1).

где M i является оценкой

Если вычисления (5.2) повторять по мере поступления новой информации

и переписать в ином виде, то получим сглаженную функцию наблюдений:

Q i= α y i+ (1 − α ) Q i− 1 ,

или в эквивалентной форме

Q t= α y t+ (1 − α ) Q t− 1

Вычисления, проводимые по выражению (5.3) с каждым новым наблюдением, называются экспоненциальным сглаживанием. В последнем выражении для отличия экспоненциального сглаживания от скользящего среднего введено обозначение Q вместоM . Величинаα , являющаяся

аналогом m 1 , называется постоянной сглаживания. Значенияα лежат в

интервале [ 0 , 1 ] . Еслиα представить в виде ряда

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

то нетрудно заметить, что «веса» убывают по экспоненциальному закону во времени. Например, для α = 0 , 2 получим

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Сумма ряда стремится к единице, а члены суммы убывают со временем.

Величина Q t в выражении (5.3) представляет собой экспоненциальную среднюю первого порядка, то есть среднюю, полученную непосредственно при

сглаживании данных наблюдения (первичное сглаживание). Иногда при разработке статистических моделей полезно прибегнуть к расчету экспоненциальных средних более высоких порядков, то есть средних, получаемых путем многократного экспоненциального сглаживания.

Общая запись в рекуррентной форме экспоненциальной средней порядка k имеет вид

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Величина k изменяется в пределах1, 2, …, p ,p+1 , гдеp – порядок прогнозного полинома (линейного, квадратичного и так далее).

На основе этой формулы для экспоненциальной средней первого, второго и третьего порядков получены выражения

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Определение параметров прогнозной модели методом экспоненциального сглаживания

Очевидно, что для разработки прогнозных значений на основе динамического ряда методом экспоненциального сглаживания необходимо вычислить коэффициенты уравнения тренда через экспоненциальные средние. Оценки коэффициентов определяются по фундаментальной теореме БраунаМейера, связывающей коэффициенты прогнозирующего полинома с экспоненциальными средними соответствующих порядков:

(− 1 )

aˆ p

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑ j

p= 0

p! (k− 1 ) !j = 0

где aˆ p – оценки коэффициентов полинома степенир .

Коэффициенты находятся решением системы (p + 1 ) уравнений сp + 1

неизвестными.

Так, для линейной модели

aˆ 0 = 2 Q t (1 ) − Q t (2 ) ; aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

для квадратичной модели

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Прогноз реализуется по выбранному многочлену соответственно для линейной модели

ˆyt + τ = aˆ0 + aˆ1 τ ;

для квадратичной модели

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

где τ – шаг прогнозирования.

Необходимо отметить, что экспоненциальные средние Q t (k ) можно вычислить только при известном (выбранном) параметре, зная начальные условияQ 0 (k ) .

Оценки начальных условий, в частности, для линейной модели

Q (1 )= a

1 − α

Q(2 ) = a− 2 (1 − α ) a

для квадратичной модели

Q (1 )= a

1 − α

+ (1 − α )(2 − α ) a

2(1− α )

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q (3 )= a

3(1− α )

(1 − α )(4 − 3 α ) a

где коэффициенты a 0 иa 1 вычисляются методом наименьших квадратов.

Величина параметра сглаживания α приближенно вычисляется по формуле

α ≈ m 2 + 1 ,

где m – число наблюдений (значений) в интервале сглаживания. Последовательность вычисления прогнозных значений представлена на

Расчет коэффициентов ряда методом наименьших квадратов

Определение интервала сглаживания

Вычисление постоянной сглаживания

Вычисление начальных условий

Вычисление экспоненциальных средних

Вычисление оценок a 0 , a 1 и т.д.

Расчет прогнозных значений ряда

Рис. 5.1. Последовательность вычисления прогнозных значений

В качестве примера рассмотрим процедуру получения прогнозного значения безотказной работы изделия, выражаемой наработкой на отказ.

Исходные данные сведены в табл. 5.1.

Выбираем линейную модель прогнозирования в виде y t = a 0 + a 1 τ

Решение осуществим со следующими значениями начальных величин:

a 0 , 0 = 64, 2; a 1 , 0 = 31, 5; α = 0, 305.

Таблица 5.1. Исходные данные

Номер наблюдения, t

Длина шага, прогнозирования, τ

Наработка на отказ, y (час)

При этих значениях вычисленные «сглаженные» коэффициенты для

величины y 2 будут равны

= α Q (1 )− Q (2 )= 97 , 9 ;

[ Q (1 )− Q (2 )

31, 9 ,

1− α

при начальных условиях

1 − α

A 0 , 0 −

a 1, 0

= −7 , 6

1 − α

= −79 , 4

и экспоненциальных средних

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q (2 )

= α Q (1 )

+ (1 −α ) Q (2 ) = −47 , 5 .

«Сглаженная» величина y 2 при этом вычисляется по формуле

Q i (1 )

Q i (2 )

a 0 ,i

a 1 ,i

ˆyt

Таким образом (табл. 5.2), линейная прогнозная модель имеет вид

ˆy t + τ = 224, 5+ 32τ .

Вычислим прогнозные значения для периодов упреждения в 2 года (τ = 1 ), 4 года (τ = 2 ) и так далее наработки на отказ изделия (табл. 5.3).

Таблица 5.3. Прогнозные значенияˆy t

Уравнение

t + 2

t + 4

t + 6

t + 8

t + 20

регрессии

(τ = 1 )

(τ = 2 )

(τ = 3 )

(τ = 5 )

τ =

ˆy t = 224, 5+ 32τ

Следует отметить, что суммарный «вес» последних m значений временного ряда можно вычислить по формуле

c = 1 − (m (− 1 ) m ) . m+ 1

Так, для двух последних наблюдений ряда (m = 2 ) величинаc = 1 − (2 2 − + 1 1 ) 2 = 0 , 667 .

5.3. Выбор начальных условий и определение постоянной сглаживания

Как следует из выражения

Q t= α y t+ (1 − α ) Q t− 1 ,

при проведении экспоненциального сглаживания необходимо знать начальное (предыдущее) значение сглаживаемой функции. В некоторых случаях за начальное значение можно взять первое наблюдение, чаще начальные условия определяются согласно выражениям (5.4) и (5.5). При этом величины a 0 , 0 ,a 1 , 0

и a 2 , 0 определяются методом наименьших квадратов.

Если мы не очень доверяем выбранному начальному значению, то, взяв большое значение постоянной сглаживания α черезk наблюдений, мы доведем

«вес» начального значения до величины (1 − α ) k << α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Таким образом, выбор постоянной сглаживания (или числа наблюдений в движущейся средней) предполагает принятие компромиссного решения. Обычно, как показывает практика, величина постоянной сглаживания лежит в пределах от 0,01 до 0,3.

Известно несколько переходов, позволяющих найти приближенную оценку α . Первый вытекает из условия равенства скользящей и экспоненциальной средней

α = m 2 + 1 ,

где m – число наблюдений в интервале сглаживания. Остальные подходы связываются с точностью прогноза.

Так, возможно определение α исходя из соотношения Мейера:

α ≈ S y ,

где S y – среднеквадратическая ошибка модели;

S 1 – среднеквадратическая ошибка исходного ряда.

Однако использование последнего соотношения затруднено тем, что достоверно определить S y иS 1 из исходной информации весьма сложно.

Часто параметр сглаживания, а заодно и коэффициенты a 0 , 0 иa 0 , 1

подбирают оптимальными в зависимости от критерия

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j= 0

путем решения алгебраической системы уравнений, которую получают, приравнивая к нулю производные

∂ S2

∂ S2

∂ S2

∂ a 0, 0

∂ a 1, 0

∂ a 2, 0

Так, для линейной модели прогнозирования исходный критерий равен

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j= 0

Решение этой системы с помощью ЭВМ не представляет никаких сложностей.

Для обоснованного выбора α также можно использовать процедуру обобщенного сглаживания, которая позволяет получить следующие соотношения, связывающие дисперсию прогноза и параметр сглаживания для линейной модели:

S п 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

для квадратичной модели

S п 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

где β = 1 α ;S y – СКО аппроксимации исходного динамического ряда.

Очевидно, что в методе взвешенного скользящего среднего существует множество способов задавать значения весов так, чтобы их сумма была равной 1. Один из таких способов называется экспоненциальным сглаживанием. В этой схеме метода взвешенного среднего для любого t > 1 прогнозируемое значение в момент времени t+1 представляет собой взвешенную сумму фактического объема продаж , за период времени t и прогнозируемого объема продаж , за период времени t Другими словами,

Экспоненциальное сглаживание имеет вычислительные преимущества перед скользящим средним. Здесь, чтобы вычислить , необходимо знать только значения , и , (вместе со значением α). Например, если компании нужно спрогнозировать спрос для 5000 наименований изделий в каждый период времени, то в этом случае необходимо хранить 10001 значений данных (5000 значений , 5000 значений , и значение α), в то время как для выполнения прогноза на основе скользящего среднего по 8 узлам требовалось 40000 значений данных. В зависимости от поведения данных, возможно, потребуется хранить различные значения α для каждого изделия, но даже в этом случае количество хранимой информации значительно меньше, чем при использовании скользящего среднего. Положительная особенность экспоненциального сглаживания состоит в том, что, сохраняя α и последний прогноз, все предыдущие прогнозы также неявно сохраняются.

Рассмотрим некоторые свойства модели экспоненциального сглаживания. Для начала заметим, что если t > 2, то в формуле (1) t можно заменить на t–1, т.е. Подставив это выражение в первоначальную формулу (1), получим

Выполняя последовательно аналогичные подстановки, получим следующее выражение для

Поскольку из неравенства 0 < α < 1 следует, что 0 < 1 – α < 1, то Другими словами, наблюдение , имеет больший вес, чем наблюдение , которое, в свою очередь, имеет больший вес, чем . Это иллюстрирует основное свойство модели экспоненциального сглаживания - коэффициенты при убывают при уменьшении номера k. Также можно показать, что сумма всех коэффициентов (включая коэффициент при ), равна 1.

Из формулы (2) видно, что значением является взвешенная сумма всех предыдущих наблюдений (включая последнее наблюдение ). Последнее слагаемое суммы (2) является не статистическим наблюдением, а «предположением» (можно предположить, например, что ). Очевидно, что с ростом t влияние , на прогноз уменьшается, и в определенный момент им можно будет пренебречь. Даже если значение α достаточно малое (такое, что (1 – α) приблизительно равно 1), значение будет быстро убывать.

Значение параметра α сильно влияет на функционирование модели прогнозирования, поскольку α представляет собой вес самого последнего наблюдения . Это значит, что следует назначать большее значение α в том случае, когда в модели наиболее прогностическим является именно последнее наблюдение. Если же α близко к 0, это означает практически полное доверие к прошлому прогнозу и игнорирование последнего наблюдения.

Перед Виктором возникла проблема: как наилучшим образом подобрать значение α. Вновь, в этом поможет средство Поиск решения. Чтобы найти оптимальное значение α (т.е. такое, при котором прогнозная кривая будет менее всего отклоняться от кривой значений временного ряда), выполните следующие действия.

  1. Выберите команду Сервис -> Поиск решения.
  2. В открывшемся диалоговом окне Поиск решения установите целевую ячейку G16 (см. лист «Экспо») и укажите, что ее значение должно быть минимальным.
  3. Укажите, что изменяемой ячейкой является ячейка В1.
  4. Введите ограничения В1 > 0 и B1 < 1
  5. Щелкнув на кнопке Выполнить, получите результат, показанный на рис. 8.

Опять, как и в методе взвешенного скользящего среднего, наилучший прогноз будет получен, если назначить весь вес последнему наблюдению. Следовательно, оптимальное значение α равно 1, при этом среднее абсолютных отклонений равно 6,82 (ячейка G16). Виктор получил прогноз, который уже видел ранее.

Метод экспоненциального сглаживания хорошо работает в ситуациях, когда интересующая нас переменная ведет себя стационарно, а ее отклонения от постоянного значения вызваны случайными факторами и не носят регулярного характера. Но: вне зависимости от значения параметра α методом экспоненциального сглаживания не удастся спрогнозировать монотонно возрастающие или монотонно убывающие данные (прогнозируемы значения будут всегда меньше или больше наблюдаемых, соответственно). Также можно показать, что в модели с сезонными изменениями получить удовлетворительные прогнозы этим методом не удастся.

Если статистические данные монотонно изменяются или подвержены сезонным изменениям, необходимы специальные методы прогнозирования, которые будут рассмотрены ниже.

Метод Хольта (экспоненциальное сглаживание с учетом тренда)

,

Метод Хольта позволяет прогнозировать на k периодов времени вперед. Метод, как видно, использует два параметра α и β. Значения этих параметров находятся в пределах от 0 до 1. Переменная L, указывает на долгосрочный уровень значений или базовое значение данных временного ряда. Переменная Т указывает на возможное возрастание или убывание значений за один период.

Рассмотрим работу этого метода на новом примере. Светлана работает аналитиком в большой брокерской фирме. На основе имеющихся у нее квартальных отчетов компании Startup Airlines она хочет спрогнозировать доход этой компании в следующем квартале. Имеющиеся данные и диаграмма, построенная на их основе, находятся в рабочей книге Startup.xls (рис. 9). Видно, что данные имеют явный тренд (почти монотонно возрастают). Светлана хочет применить метод Хольта, чтобы спрогнозировать значение прибыли на одну акцию на тринадцатый квартал. Для этого необходимо задать начальные значения для L и Т Есть несколько вариантов выбора: 1) L равно значению прибыли на одну акцию за первый квартал и T = 0; 2) L равно среднему значению прибыли на одну акцию за 12 кварталов и T равно среднему изменению за все 12 кварталов. Существуют и другие варианты начальных значений для L и Т, но Светлана выбрала первый вариант.

Она решила воспользоваться средством Поиск решения, чтобы найти оптимальное значение параметров α и β, при которых значение среднего абсолютных ошибок в процентах было бы минимально. Для этого нужно выполнить такие действия.

Выбрать команду Сервис -> Поиск решения.

В открывшемся диалоговом окне Поиск решения задать ячейку F18 целевой и указать, что ее значение следует минимизировать.

В поле Изменяя ячейки ввести диапазон ячеек В1:В2. Добавить ограничения В1:В2 > 0 и В1:В2 < 1.

Кликнуть на кнопке Выполнить.

Полученный прогноз показан на рис. 10.

Как видно, оптимальными оказались значения α = 0,59 и β = 0,42, при этом среднее абсолютных ошибок в процентах равно 38%.

Учет сезонных изменений

При прогнозировании на основе данных временного ряда следует учитывать сезонные изменения Сезонные изменения - это колебания вверх и вниз с постоянным периодом в значениях переменной.

Например, если посмотреть на объемы продаж мороженого по месяцам, то можно увидеть в теплые месяцы (с июня по август в северном полушарии) более высокий уровень продаж, чем зимой, и так каждый год. Здесь сезонные колебания имеют период в 12 месяцев. Если используются данные, собранные по неделям, то структура сезонных колебаний будет повторяться через каждые 52 недели Другой пример анализируются еженедельные отчеты о количестве постояльцев, которые оставались на ночь в отеле, расположенном в бизнес-центре города Предположительно можно сказать, что большое число клиентов ожидается в ночи на вторник, среду и четверг, меньше всего клиентов будет в ночи на субботу и воскресенье, и среднее число постояльцев ожидается в ночи на пятницу и понедельник. Такая структура данных, отображающая количество клиентов в разные дни недели, будет повторяться через каждые семь дней.

Процедура, которая позволяет сделать прогноз с учетом сезонных изменений, состоит из таких четырех этапов

1) На основе исходных данных определяется структура сезонных колебаний и период этих колебаний.

3) На основе данных, из которых исключена сезонная составляющая, делается наилучший возможный прогноз.

4) К полученному прогнозу добавляется сезонная составляющая.

Проиллюстрируем этот подход на данных об объемах сбыта угля (измеряемого в тысячах тонн) в США на протяжении девяти лет Фрэнк работает менеджером в компании Gillette Coal Mine, ему необходимо спрогнозировать спрос на уголь на ближайшие два квартала. Он ввел данные по всей угольной отрасли в рабочую книгу Уголь.xls и построил по этим данным график (рис. 11). На графике видно, что объемы продаж выше среднего уровня в первом и четвертом кварталах (зимнее время года) и ниже среднего во втором и третьем кварталах (весенне-летние месяцы).

Исключение сезонной составляющей

Сначала необходимо вычислить среднее значение всех отклонений за один период сезонных изменений. Чтобы исключить сезонную составляющую в пределах одного года, используются данные за четыре периода (квартала). А чтобы исключить сезонную составляющую из всего временного ряда, вычисляется последовательность скользящих средних по T узлам, где T - продолжительность сезонных колебаний Для выполнения необходимых вычислений Фрэнк использовал столбцы С и D, как показано на рис. ниже. Столбец С содержит значения скользящего среднего по 4 узлам на основе данных, которые находятся в столбце В.

Теперь надо назначить полученные значения скользящего среднего средним точкам последовательности данных, на основе которых эти значения были вычислены. Эта операция называется центрированием значений. Если T нечетное, то первое значение скользящего среднего (среднее значений от первой до T-й точки) надо присвоить (T + 1)/2 точке (например, если T = 7, то первое скользящее среднее будет назначено четвертой точке). Аналогично среднее значений от второй до (T + 1)-й точки центрируется в (T + 3)/2 точке и т. д. Центр n-го интервала находится в точке (T+(2n-1))/2.

Если T четное, как в рассматриваемом случае, то задача несколько усложняется, поскольку здесь центральные (средние) точки расположены между точками, по которым вычислялось значение скользящего среднего. Поэтому центрированное значение для третьей точки вычисляется как среднее первого и второго значений скользящего среднего. Например, первое число в столбце D отцентрированных средних на рис. 12, слева равняется (1613 + 1594)/2 = 1603. На рис. 13 показаны графики исходных данных и отцентрированных средних.

Далее находим отношения значений точек данных к соответствующим значениям отцентрированных средних. Поскольку точкам в начале и конце последовательности данных нет соответствующих отцентрированных средних (см. первые и последние значения в столбце D), такое действие на эти точки не распространяется. Эти отношения показывают степень отклонения значений данных относительно типового уровня, определяемого отцентрированными средними. Заметим, что значения отношений для третьих кварталов меньше 1, а для четвертых - больше 1.

Эти отношения являются основой для создания сезонных индексов. Для их вычисления группируются вычисленные отношения по кварталам, как показано на рис. 15 в столбцах G-О.

Затем находятся средние значения отношений по каждому кварталу (столбец Е на рис. 15). Например, среднее всех отношений для первого квартала равно 1,108. Это значение является сезонным индексом первого квартала, на основе которого можно сделать вывод, что объем сбыта угля за первый квартал составляет в среднем около 110,8% относительного среднего годового объема сбыта.

Сезонный индекс - это среднее отношение данных, относящихся к одному сезону (в данном случае сезоном является квартал), ко всем данным. Если сезонный индекс больше 1, значит, показатели этого сезона выше средних показателей за год, аналогично, если сезонный индекс ниже 1, то показатели сезона ниже средних показателей за год.

Наконец, чтобы исключить из исходных данных сезонную составляющую, следует поделить значения исходных данных на соответствующий сезонный индекс. Результаты этой операции приведены в столбцах F и G (рис. 16). График данных, которые уже не содержат сезонной составляющей, представлен на рис. 17.

Прогнозирование

На основе данных, из которых исключена сезонная составляющая, строится прогноз. Для этого используется соответствующий метод, который учитывает характер поведения данных (например, данные имеют тренд или относительно постоянны). В этом примере прогноз строится с помощью простого экспоненциального сглаживания. Оптимальное значение параметра α находится с помощью средства Поиск решения. График прогноза и реальных данных с исключенной сезонной составляющей приведены на рис. 18.

Учет сезонной структуры

Теперь нужно учесть в полученном прогнозе (1726,5) сезонную составляющую. Для этого следует умножить 1726 на сезонный индекс первого квартала 1,108, в результате чего получим значение 1912 Аналогичная операция (умножение 1726 на сезонный индекс 0,784) даст прогноз на второй квартал, равный 1353. Результат добавления сезонной структуры к полученному прогнозу показан на рис. 19.

Варианты заданий:

Задача 1

Дан временной ряд

t
x

1. Постройте график зависимости x = x(t).

  1. Используя простое скользящее среднее по 4 узлам, спрогнозируйте спрос в 11-й момент времени.
  2. Подходит ли такой метод прогнозирования для этих данных или нет? Почему?
  3. Подберите линейную функцию приближения данных методом наименьших квадратов.

Задача 2

Пользуясь моделью прогнозов доходов компании Startup Airlines (Startup.xls) выполните:

Задача 3

Для временного ряда

t
x

выполните:

  1. Используя взвешенное скользящее среднее по 4 узлам, и назначив веса 4/10, 3/10, 2/10, 1/10, спрогнозируйте спрос в 11-й момент времени. Больший вес следует назначать более поздним наблюдениям.
  2. Является ли данное приближение более предпочтительным по отношению к простому скользящему среднему по 4 узлам? Почему?
  3. Найдите среднее абсолютных отклонений.
  4. С помощью средства Поиск решения найдите оптимальные веса узлов. Насколько уменьшилась ошибка приближения?
  5. Воспользуйтесь для прогноза методом экспоненциального сглаживания. Какой их использованных методов дает лучший рещультат?

Задача 4

Проанализируйте временной ряд

Время
Спрос
  1. Воспользуйтесь методом взвешенного скользящего среднего по 4 узлам, назначив веса 4/10, 3/10, 2/10, 1/10, чтобы получить прогноз в моменты времени 5-13. Больший вес следует назначать более поздним наблюдениям.
  2. Найдите среднее абсолютных отклонений.
  3. Считаете ли вы, что данное приближение более предпочтительно по сравнению с моделью простого скользящего среднего по 4 узлам? Почему?
  4. С помощью средства Поиск решения найдите оптимальные веса узлов. На сколько удалось уменьшить значение ошибки?
  5. Воспользуйтесь для прогноза методом экспоненциального сглаживания. Какой их использованных методов дает лучший результат?

Задача 5

Дан временной ряд

Задача 7

Менеджер по маркетингу небольшой развивающейся компании, содержащей сеть продовольственных магазинов, обладает информацией об объемах продаж за все время существования самого прибыльного магазина (см. табл.).

Используя простое скользящее среднее по 3 узлам, спрогнозируйте значения в узлах с 4 до 11.

Используя взвешенное скользящее среднее по 3 узлам, спрогнозируйте значения в узлах с 4 до 11. Для определения оптимальных весов воспользуйтесь средством Поиск решения.

Методом экспоненциального сглаживания спрогнозируйте значения в узлах 2-11. Определите оптимальное значение параметра α с помощью средства Поиск решения.

Какой из полученных прогнозов наиболее точный и почему?

Задача 8

Дан временной ряд

  1. Постройте график этого временного ряда. Соедините точки отрезками прямых.
  2. Используя простое скользящее среднее по 4 узлам, спрогнозируйте спрос для узлов 5–13.
  3. Найдите среднее абсолютных отклонений.
  4. Целесообразно ли использовать данный метод прогнозирования для представленных данных?
  5. Является ли данное приближение более предпочтительным по отношению к простому скользящему среднему по 3 узлам? Почему?
  6. Постройте по данным линейный и квадратичный тренд.
  7. Воспользуйтесь для прогноза методом экспоненциального сглаживания. Какой их использованных методов дает лучший рещультат?

Задача 10

В рабочей книге Business_Week.xls приведены данные из журнала Business Week по ежемесячным объемам продаж автомобилей за 43 месяца.

  1. Исключите из этих данных сезонную составляющую.
  2. Определите наилучший метод прогнозирования для имеющихся данных.
  3. Чему равен прогноз для 44-го периода?

Задача 11

  1. Простая схема прогнозирования, когда значение за прошлую неделю принимается за прогноз на следующую неделю.
  2. Метод скользящего среднего (с числом узлов на ваше усмотрение). Попробуйте использовать несколько различных значений узлов.

Задача 12

В рабочей книге Банк.xls приведены показатели работы банка. Рассмотрите следующие методы прогнозирования значений этого временного ряда.

В качестве прогноза используется среднее значение показателя за все предыдущие недели.

Метод взвешенного скользящего среднего (с числом узлов на ваше усмотрение). Попробуйте использовать несколько различных значений узлов. Для определения оптимальных весов воспользуйтесь средством Поиск решения.

Метод экспоненциального сглаживания. Подберите оптимальное значение параметра α с помощью средства Поиск решения.

Какой из предложенных выше методов прогнозирования вы бы порекомендовали для прогноза значений данного временного ряда?

Литература


Похожая информация.


02.04.2011 – Стремление человека приподнять завесу грядущего и предвидеть ход событий имеет такую же длинную историю, как и его попытки, понять окружающий мир. Очевидно, что в основе интереса к прогнозу лежат достаточно сильные жизненные мотивы (теоретические и практические). Прогноз выступает в качестве важнейшего метода проверки научных теорий и гипотез. Способность предвидеть будущее является неотъемлемой стороной сознания, без которой была бы невозможна сама человеческая жизнь.

Понятие “прогнозирование” (от греч. prognosis – предвидение, предсказание) означает процесс разработки вероятностного суждения о состоянии какого-либо явления или процесса в будущем, это познание того, чего еще нет, но что может наступить в ближайшее или отдаленное время.

Прогноз по своему содержанию более сложен, чем предсказание. Он, с одной стороны, отражает наиболее вероятное состояние объекта, а с другой – определяет пути и средства достижения желаемого результата. На основе полученной прогнозным путем информации по достижению желаемой цели, принимаются определенные решения.

Необходимо отметить, что динамика экономических процессов в современных условиях отличается нестабильностью и неопределенностью, что затрудняет применение традиционных методов прогнозирования.

Модели экспоненциального сглаживания и прогнозирования относятся к классу адаптивных методов прогнозирования, основной характеристикой которых является способность непрерывно учитывать эволюцию динамических характеристик изучаемых процессов, подстраиваться под эту динамику, придавая, в частности, тем больший вес и тем более высокую информационную ценность имеющимся наблюдениям, чем ближе они расположены к текущему моменту времени. Смысл термина состоит в том, что адаптивное прогнозирование позволяет обновлять прогнозы с минимальной задержкой и с помощью относительно несложных математических процедур.

Метод экспоненциального сглаживания был независимо открыт Брауном (Brown R.G. Statistical forecasting for inventory control, 1959) и Хольтом (Holt C.C. Forecasting Seasonal and Trends by Exponentially Weighted Moving Averages, 1957). Экспоненциальное сглаживание, как и метод скользящих средних, для прогноза использует прошлые значения временного ряда.

Сущность метода экспоненциального сглаживания заключается в том, что временной ряд сглаживается с помощью взвешенной скользящей средней, в которой веса подчиняются экспоненциальному закону. Взвешенная скользящая средняя с экспоненциально распределенными весами характеризует значение процесса на конце интервала сглаживания, то есть является средней характеристикой последних уровней ряда. Именно это свойство и используется для прогнозирования.

Обычное экспоненциальное сглаживание применяется в случае отсутствия в данных тренда или сезонности. В этом случае прогноз является взвешенной средней всех доступных предыдущих значений ряда; веса при этом со временем геометрически убывают по мере продвижения в прошлое (назад). Поэтому (в отличие от метода скользящего среднего) здесь нет точки, на которой веса обрываются, то есть зануляются. Прагматически ясная модель простого экспоненциального сглаживания может быть записана следующим (по представленной ссылке можно скачать все формулы статьи):

Покажем экспоненциальный характер убывания весов значений временного ряда – от текущего к предыдущему, от предыдущего к пред–предыдущему и так далее:

Если формула применяется рекурсивно, то каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, что результат сглаживания зависит от параметра адаптации альфа . Его можно интерпретировать как коэффициент дисконтирования, характеризующий меру девальвации данных за единицу времени. Причем влияние данных на прогноз экспоненциально убывает с “возрастом” данных. Зависимость влияния данных на прогноз при разных коэффициентах альфа приведена на рисунке 1.

Рисунок 1. Зависимость влияния данных на прогноз при разных коэффициентах адаптации

Следует заметить, что значение сглаживающего параметра не может равняться 0 или 1, так как в этом случае сама идея экспоненциального сглаживания отвергается. Так, если альфа равняется 1, то прогнозное значение F t+1 совпадает с текущим значением ряда Хt , при этом экспоненциальная модель стремится к самой простой “наивной” модели, то есть в этом случае прогнозирование является абсолютно тривиальным процессом. Если альфа равняется 0, то начальное прогнозное значение F 0 (initial value ) одновременно будет являться прогнозом для всех последующих моментов ряда, то есть прогноз в этом случае будет выглядеть в виде обычной горизонтальной линии.

Тем не менее, рассмотрим варианты сглаживающего параметра, близкие к 1 или 0. Так, если альфа близко к 1, то предыдущие наблюдения временного ряда практически полностью игнорируются. В случае если альфа близко к 0, то игнорируются уже текущие наблюдения. Значения альфа между 0 и 1 дают промежуточные результаты. По мнению ряда авторов, оптимальное значение альфа находится в пределах от 0,05 до 0,30. Однако иногда альфа , большее 0,30, дает лучший прогноз.

В целом лучше оценивать оптимальное альфа по исходным данным (при помощи поиска по сетке), а не использовать искусственные рекомендации. Тем не менее, в случае если значение альфа , превышающее 0,3, минимизирует ряд специальных критериев, то это указывает на то, что другая техника прогнозирования (с применением тренда или сезонности) способна обеспечить еще более точные результаты. Для нахождения оптимального значения альфа (то есть минимизации специальных критериев) используется квазиньютоновский алгоритм максимизации правдоподобия (вероятности), который эффективнее обычного перебора на сетке.

Перепишем уравнение (1) в виде альтернативного варианта, позволяющего оценить, как модель экспоненциального сглаживания “обучается” на своих прошлых ошибках:

Из уравнения (3) ярко видно, что прогноз на период t+1 подлежит изменению в сторону увеличения, в случае превышения фактического значения временного ряда в период t над прогнозным значением, и, наоборот, прогноз на период t+1 должен быть уменьшен, если Х t меньше, чем F t .

Отметим, что при использовании методов экспоненциального сглаживания важным вопросом всегда является определение начальных условий (начального прогнозного значения F 0 ). Процесс выбора начального значения сглаженного ряда называется инициализацией (initializing ), или, иначе, “разогревом” (“warming up ”) модели. Дело в том, что начальное значение сглаженного процесса может существенным образом повлиять на прогноз для последующих наблюдений. С другой стороны, влияние выбора уменьшается с длиной ряда и становится некритичным при очень большом числе наблюдений. Браун впервые предложил использовать в качестве стартового значения среднее динамического ряда. Другие авторы предлагают использовать в качестве начального прогноза первое фактическое значение временного ряда.

В середине прошлого века Хольт предложил расширить модель простого экспоненциального сглаживания за счет включения в нее фактора роста (growth factor ), или иначе тренда (trend factor ). В результате модель Хольта может быть записана следующим образом:

Данный метод позволяет учесть присутствие в данных линейного тренда. Позднее были предложены другие виды трендов: экспоненциальный, демпфированный и др.

Винтерс предложил усовершенствовать модель Хольта с точки зрения возможности описания влияния сезонных факторов (Winters P.R. Forecasting Sales by Exponentially Weighted Moving Averages, 1960).

В частности, он далее расширил модель Хольта за счет включения в нее дополнительного уравнения, описывающего поведение сезонной компоненты (составляющей). Система уравнений модели Винтерса выглядит следующим образом:

Дробь в первом уравнении служит для исключения сезонности из исходного ряда. После исключения сезонности (по методу сезонной декомпозиции Census I ) алгоритм работает с “чистыми” данными, в которых нет сезонных колебаний. Появляются они уже в самом финальном прогнозе (15), когда “чистый” прогноз, посчитанный почти по методу Хольта, умножается на сезонную компоненту (индекс сезонности ).