59
Модели адаптивного прогнозирования Экспоненциальное сглаживание

Модели адаптивного прогнозирования

Embed Size (px)

DESCRIPTION

Модели адаптивного прогнозирования. Экспоненциальное сглаживание. Экспоненциальное сглаживание очень популярный метод прогнозирования очень многих временных рядов. Простое экспоненциальное сглаживание. Простая и прагматически ясная модель временного ряда имеет следующий вид: x t = b + ε t - PowerPoint PPT Presentation

Citation preview

Page 1: Модели адаптивного прогнозирования

Модели адаптивного прогнозирования

Экспоненциальное сглаживание

Page 2: Модели адаптивного прогнозирования

• Экспоненциальное сглаживание очень популярный метод прогнозирования очень многих временных рядов.

Page 3: Модели адаптивного прогнозирования

Простое экспоненциальное сглаживание

• Простая и прагматически ясная модель временного ряда имеет следующий вид:

xt=b+εt

где b – константа, εt – случайная ошибка.

Page 4: Модели адаптивного прогнозирования

• Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения b состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблюдениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред-предпоследним и т.д.

Page 5: Модели адаптивного прогнозирования

• Простое экспоненциальное сглаживание именно так и устроено.

• Здесь более старым наблюдениям приписываются экспоненциально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не те, что попали в определенное окно.

Page 6: Модели адаптивного прогнозирования

• Точная формула простого экспоненциального сглаживания имеет вид:

Page 7: Модели адаптивного прогнозирования

• Когда эта формула применяется рекурсивно, то каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра α.

Page 8: Модели адаптивного прогнозирования

• Если α = 1, то предыдущие наблюдения полностью игнорируются.

• Если α = 0, то игнорируются текущие наблюдения.

• Значения α между 0, 1 дают промежуточные результаты.

• Эмпирические исследования показали, что весьма часто простое экспоненциальное сглаживание дает достаточно точный прогноз.

Page 9: Модели адаптивного прогнозирования

• Обсудим различные теоретические и эмпирические аргументы в пользу выбора определенного параметра сглаживания. Очевидно, из формулы, приведенной выше, следует, что α должно попадать в интервал между 0 (нулем) и 1.

Page 10: Модели адаптивного прогнозирования

• На практике обычно рекомендуется брать α меньше 0,3.

• Однако α больше 0,3 часто дает лучший прогноз.

• Вывод: лучше оценивать оптимально α по данным, чем просто гадать или использовать искусственные рекомендации.

Page 11: Модели адаптивного прогнозирования

• На практике параметр сглаживания часто ищется с поиском на сетке.

• Возможные значения параметра разбиваются сеткой с определенным шагом.

• Например, рассматривается сетка значений от α = 0,1 до α = 0,9, с шагом 0,1.

Page 12: Модели адаптивного прогнозирования

• Затем выбирается α, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Page 13: Модели адаптивного прогнозирования

• Выявление и анализ тенденции временного ряда часто производится с помощью его выравнивания или сглаживания. Экспоненциальное сглаживание — один из простейших и распространенных приемов выравнивания ряда.

• Экспоненциальное сглаживание можно представить как фильтр, на вход которого последовательно поступают члены исходного ряда, а на выходе формируются текущие значения экспоненциальной средней

Page 14: Модели адаптивного прогнозирования

• Пусть X={x1, x2,…,xT } - временной ряд. • Экспоненциальное сглаживание ряда

осуществляется по рекуррентной формуле: St=αxt+(1 – α)St-1

• Чем меньше α, тем в большей степени фильтруются, подавляются колебания исходного ряда и шума.

Page 15: Модели адаптивного прогнозирования

• Если последовательно использовать это рекуррентное соотношение, то экспоненциальную среднюю St можно выразить через значения временного ряда X.

Page 16: Модели адаптивного прогнозирования

• Если к моменту начала сглаживания существуют более ранние данные, то в качестве начального значения S0 можно использовать арифметическую среднюю всех имеющихся данных или какой-то их части.

• После появления работ Р. Брауна экспоненциальное сглаживание часто используется для решения задачи краткосрочного прогнозирования временных рядов.

Page 17: Модели адаптивного прогнозирования

• Пусть задан временной ряд: y1, y2,…,yt

Необходимо решить задачу прогнозирования временного ряда, т.е. найти

где D- горизонт прогнозирования.

Page 18: Модели адаптивного прогнозирования

• Такую, чтобы выполнялось соотношение

• Для того, чтобы учитывать устаревание данных, введем невозрастающую последовательность весов

w0, w1,…,wT, wi≥0

Page 19: Модели адаптивного прогнозирования

• Временной ряд — это множество наблюдений, получаемых последовательно во времени. Если время изменяется дискретно, временной ряд называется дискретным. Мы будем рассматривать только дискретные временные ряды, в которых наблюдения делаются через фиксированный интервал времени, принимаемый за единицу счета.

• Переход от момента одного наблюдения к моменту следующего наблюдения будем называть шагом.

Page 20: Модели адаптивного прогнозирования

• Обозначим член временного ряда, наблюденный в момент t, через xt.

Page 21: Модели адаптивного прогнозирования

Компоненты временного ряда ξt и εt ненаблюдаемы. Они являются теоретическими величинами. Их выделение и составляет предмет анализа временного ряда в задаче прогнозирования. Оценку будущих членов ряда обычно делают по прогнозной модели. Прогнозная модель —- это модель, аппроксимирующая тренд. Прогнозы — это оцен-ки будущих уровней ряда, а последовательность прогнозов для различных периодов упреждения τ = 1, 2, .... k составляет оценку тренда.

Page 22: Модели адаптивного прогнозирования

При построении прогнозной модели выдвигается гипотеза о динамике величины ξt, т.е. о характере тренда. Однако в связи с тем, что уверенность в гипотезе всегда относительна, рассматриваемые нами модели наделяются адаптивными свойствами, способностью к корректировке исходной гипотезы или даже к замене ее другой, более адекватно (с точки зрения точности прогнозов) отражающей поведение, реального ряда. Простейшая адаптивная модель основывается на вычислении так называемой экспоненциальной средней.

Page 23: Модели адаптивного прогнозирования

После появления работ Р. Брауна экспоненциальная средняя часто используется для краткосрочного прогнозирования. В этом случае предполагается, что ряд генерируется моделью

xt = a1,t + εt

где a1,t — варьирующий во времени средний уровень ряда; εt — случайные отклонения.

Page 24: Модели адаптивного прогнозирования

• Прогнозная модель имеет вид

где хτ(t) — прогноз, сделанный в момент t на τ единиц времени (шагов) вперед; a1,t — оценка прогнозируемой величины.Средством оценки единственного параметра модели служит экспоненциальная средняя

Таким образом, все свойства экспоненциальной средней распространяются на прогнозную модель.

Page 25: Модели адаптивного прогнозирования

В частности, если St-1 рассматривать как прогноз на 1 шаг вперед, то в выражении

величина (xt — St-1 ) есть погрешность этого прогноза, а новый прогноз St получается в результате корректировки предыдущего прогноза с учетом его ошибки. В этом и состоит существо адаптации.

Page 26: Модели адаптивного прогнозирования

• При краткосрочном прогнозировании желательно как можно быстрее отразить изменения a1,t и в то же время как можно лучше “очистить” ряд от случайных колебаний.

Page 27: Модели адаптивного прогнозирования

Таким образом, с одной стороны, следует увеличивать вес более

свежих наблюдений, что может быть достигнуто повышением α, с

другой стороны, для сглаживания случайных отклонений величину α

нужно уменьшить. Как видим, эти два требования находятся в

противоречии. Поиск компромиссного значения α составляет задачу

оптимизации модели.

Для уяснения процедуры расчета экспоненциальной средней и ее

свойств рассмотрим числовой пример сглаживания ряда курса

акций фирмы (см. табл. 1.1).

Page 28: Модели адаптивного прогнозирования
Page 29: Модели адаптивного прогнозирования

Определим S0 как

Дальнейшие вычисления при α = 0,1 выглядят следующим

образом:

Результаты вычислений при α=0,1, α=0,5, α=0,9 приведены в таблице.

=

Page 30: Модели адаптивного прогнозирования

На рисунке приведен график динамики временного ряда и экспоненциальных средних при α=0,1, α=0,5. На графике наглядно показано влияние параметра α на подвижность экспоненциальной средней.

Page 31: Модели адаптивного прогнозирования
Page 32: Модели адаптивного прогнозирования

• Экспоненциальное сглаживание является простейшим вариантом самообучающейся модели. Вычисления просты и выполняются итеративно. Они требуют даже меньше арифметических операций, чем скользящая средняя, а мас сив прошлой информации уменьшен до одного значения St-1. Такую модель будем называть адаптивной экспо ненциального типа, а величину α — параметром адапта ции.

Page 33: Модели адаптивного прогнозирования

НАЧАЛЬНЫЕ УСЛОВИЯ ЭКСПОНЕНЦИАЛЬНОГО

СГЛАЖИВАНИЯ• Экспоненциальное выравнивание всегда

требует предыдущего значения экспоненциальной средней. Когда процесс только начинается, должна быть некоторая вели чина S0, которая может быть использована в качестве зна чения, предшествующего S1.

Page 34: Модели адаптивного прогнозирования

• Если есть прошлые данные к моменту начала выравнивания, то в качестве начального значения S0 можно использовать арифметическую среднюю всех имеющихся точек или какой-то их части. Когда для такого оценивания S0 нет данных, требуется предсказание начального уровня ряда.

Page 35: Модели адаптивного прогнозирования

Предсказание может быть сделано исходя из априорных знаний о процессе или на основе его аналогии с другими про цессами. После k шагов вес, придаваемый начальному зна чению, равен

(1 — α)k. Если есть уверенность в справедли вости начального значения S0, то можно коэффициент α взять малым.

Page 36: Модели адаптивного прогнозирования

• Если такой уверенности нет, то параметру α следует дать большое значение, с таким расчетом, чтобы влияние начального значения быстро уменьшилось.

• Однако большое значение α, может явиться причиной большой дисперсии колебаний St.

• Если требуется подавление этих колебаний, то после достаточного удале ния от начального момента времени величину α можно уба вить.

Page 37: Модели адаптивного прогнозирования

• Рассмотрим роль параметра α в начальный период сгла живания в случае, когда нет уверенности в справедливости выбора начальной величины S0.

Page 38: Модели адаптивного прогнозирования

• Как видно из таблицы, приведенной на следующем слайде, составленной для значения α = 0,1 начальная величина S0 в течение длительного времени имеет чрезмерный вес, Даже после 20 итераций вес S0 равен 0,122, что означает, что ему дается все еще боль ший вес, чем любому другому члену ряда. Таким образом, в этом случае получение прогнозов по экспоненциальной средней, построенной на малом отрезке ряда (выборке), чревато большими ошибками. Для того чтобы элиминировать приданный начальной величине.

Page 39: Модели адаптивного прогнозирования
Page 40: Модели адаптивного прогнозирования

Р. Вейд предложил следующую модификацию метода экспоненциального сглаживанияДля исходного момента времени запишем:

где S0 – начальная оценка уровня ряда.

Так как теперь α + α(1 – α)≠1,

то следует использовать данное выражение в качестве множителя.

Page 41: Модели адаптивного прогнозирования

• Таким образом для момента времени t=1 получаем

Или для произвольного момента времени t

Page 42: Модели адаптивного прогнозирования

• Из анализа таблицы, приведенной на следующем слайде, можно сделать вывод о том, что сущность рассматриваемой модификации Вейда заключается в том, чтобы убрать избыточный вес начального значения S0 и распределить его пропорционально по всем членам ряда.

• В этом случае получаемые прогнозы основываются в большей степени на фактических данных, а не на предварительной оценке S0.

Page 43: Модели адаптивного прогнозирования
Page 44: Модели адаптивного прогнозирования

В целях сокращения трудоемкости вычислений на определенном шаге необходимо будет вернуться к обычной процедуре экспоненциального сглаживания. Это возможно в том случае, когда величина

приблизится к 1.На основе эмпирического анализа Вейд рекомендовал осуществлять такой переход при сумме коэффициентов равной 0,995.

Page 45: Модели адаптивного прогнозирования

• При заданном значении α можно заранее определить на каком шаге возможна подобная трансформация.

Page 46: Модели адаптивного прогнозирования

Выбор постоянной сглаживания

Опыт показывает, что наибольшая точность прогнозирования может быть достигнута при любых допус тимых значениях α. Однако, как правило, если в резуль тате испытаний обнаружено, что наилучшее значение кон станты α близко к 1, следует проверить законность выбора модели данного типа.

Page 47: Модели адаптивного прогнозирования

• Часто к большим значениям α приво дит наличие в исследуемом ряде ярко выраженных тенден ций или сезонных колебаний.

• В этом случае для получения эффективных прогнозов требуется другая модель.

Page 48: Модели адаптивного прогнозирования

• Наилучшее значение α в общем случае должно зависеть от срока прогнозирования х. Для конъюнктурных прогнозов в большей мере должна учитываться свежая ин формация. При увеличении периода упреждения х более поздняя информация, отражающая последнюю конъюнкту ру, должна, по-видимому, иметь несколько меньший вес, чем в случае малых х. Для того чтобы сгладить конъюнктур ные колебания, следует в большей мере учитывать информа цию за прошлые периоды времени.

Page 49: Модели адаптивного прогнозирования

• Для проведения подоб ного анализа вводят понятие среднего возраста данных. Возраст текущего наблюдения равен 0, возраст предыдуще го наблюдения равен 1 и т. д. Средний возраст — это сумма взвешенных возрастов данных, использованных для под счета сглаженной величины. Причем возраст имеют те же веса, что и соответствующая информация.

Page 50: Модели адаптивного прогнозирования

• При экспонен циальном выравнивании вес, даваемый точке с возрастом k равен αβk, где β=1 — α и средний возраст информации равен:

• Таким образом, чем меньше α, тем больше средний воз раст информации. Для конъюнктурных прогнозов значение α надо брать большим, а для более долгосрочных – малым.

Page 51: Модели адаптивного прогнозирования

Теоретический анализ проблемы выбора постоянной сглаживания при применении простейшей модели экспоненциального сглаживания для прогнозирования стационарного процесса при прогнозировании на 1 шаг вперед, показал, что оптимальное значение параметра сглаживания в этом случае будет определяться соотношением

Page 52: Модели адаптивного прогнозирования

где ρ1 – коэффициент авторкорреляции при лаге 1.

Page 53: Модели адаптивного прогнозирования

Модель ХольтаЭмпирический анализ модели простого экспоненциального сглаживания позволяет сделать вывод о том, что с ее помощью нельзя осуществлять прогноз для данных, имеющих ярко выраженную тенденцию, то есть тренд. Модель Хольта предполагает модификацию алгоритма для случая линейного тренда.

Page 54: Модели адаптивного прогнозирования

В этом случае предполагается, что прогноз может быть получен в виде выражения

где - текущие оценки коэффициентов адаптивных полиномов первой степени.

Page 55: Модели адаптивного прогнозирования

Согласно модели Хольта коэффициенты полинома первой степени определяются выражениями вида

где α1, α2 – параметры экспоненциального сглаживания (α1 > 0; α2 <1)

Page 56: Модели адаптивного прогнозирования

Для того чтобы получить прогноз по модели Хольта, нужно провести некоторую подготовительную работу, а именно – рассчитать значения начальные значения коэффициентов адаптивных полиномов первой степени a1,0 и a2,0 при t=0 по имеющемуся ряду данных. После этого по какому-либо критерию подбираются постоянные сглаживания α1, α2 в результате чего исследователь получает линейную модель, на каждом шаге адаптирующуюся к фактическим данным.

Page 57: Модели адаптивного прогнозирования

• Недостатком модели Хольта является невозможность учета сезонности.

• Модель Хольта-Уинтерса является развитием модели Хольта, в ней появляется сезонная составляющая, в результате чего получается система уравнений с тремя постоянными сглаживания

Page 58: Модели адаптивного прогнозирования

• Модель с линейным трендом и учетом сезонности может быть записана в виде

lt

tt

tttt

tt

lt

tt

lttt

a

xf

aaaa

aaf

xa

faatx

,12

1,231,21,13,2

1,21,111,1

,2,1

ˆˆ

ˆ1ˆˆˆ

,ˆˆ1ˆ

ˆ

,ˆˆˆˆ

Page 59: Модели адаптивного прогнозирования

где 0< α1, α2, α3 <1

• Оптимальные параметры α1, α2, α3 Уинтерс предлагает находить экспериментальным путем. Критерием сравнения он берет стандартное отклонение ошибки. При этом предпо лагается, что прогноз не смещен. Поиск, осуществлялся с помощью сетки значений α1, α2, α3.