Прогнозирование - Лекция 5. Методология Бокса-Дженкинса (модели ARIMA)

Курс «Компьютерная Курс «Компьютерная поддержка поддержка

прогнозирования»прогнозирования»

Заходякин Глеб Викторович,

кафедра Информационных систем и технологий в логистикеe-mail: [email protected]

mailto:[email protected]

2

Метод Бокса-Дженкинса Метод Бокса-Дженкинса (ARIMA)(ARIMA)

o Общие принципы моделированияo Модели авторегрессии и скользящего среднегоo Выборочная АКФ и ЧАКФ, статистики связанные

с нимиo Приведение ряда к стационарностиo Реализация стратегии разработки моделиo Сезонные модели ARIMA

3

Общая характеристика методаОбщая характеристика методаo Модели ARIMA (Auto-Regressive

Integrated Moving Average) – класс универсальных линейных моделей для описания стационарных и нестационарных временных рядов

o Разработчики – G.P. Box, G.M. Jenkins (197x-199x)

o Для моделирования используютсятолько данные временного ряда

o Разработаны расширения моделей – ARIMAX, учитывающие факторы, выбросыи структурные изменения различных видов

o Особенностью метода является итеративный подход к определению лучшей модели среди всех возможных

o Для идентификации моделей используются диаграммы последовательности ряда и коррелограммы с АКФ и ЧАКФ

o Для оценки адекватности применяется анализ остатков:– остатки должны быть малыми– не должно быть закономерных компонент и корреляций

4

Схема применения методаСхема применения метода1. Приведение ряда к стационарности

2. Определение общего класса модели (AR, MA, ARMA, ARIMA) и порядка модели

3. Оценка параметров модели

4. Статистический анализ модели:

o значимость модели

o значимость коэффициентов

o остаточные корреляции

5. Если модель неадекватна – Goto 2

6. Выбор лучшей модели

7. Прогнозирование

пример: АКФ и ЧАКФ для процесса AR(1)

5

Исследование автокорреляцийИсследование автокорреляций

12

1

n

t t kt kk n

tt

Y Y Y Yr

Y Y

krtY t kY

Y

- наблюдение в момент t - наблюдение с лагом (запаздыванием) в k периодов- наблюдение в момент t

- среднее значение временного ряда - коэффициент автокорреляции для лага k

6

Оценка значимости Оценка значимости rrkk

o Стандартная ошибка для rk:

o Доверительный интервал для rk: +/- t * SE(rk)

o Использование t-статистики:

o Критическое значение – t-распределение, df=n-1,

12

1

1 21

k

ii

k

rSE r

nn

k

k

rtSE r

7

Статистика Бокса-ПирсаСтатистика Бокса-Пирсаo Q-Статистика Бокса-Пирса

(Льюнг, Бокс) - Ljung-Box Q

o Для проверки используется распределение Хи2 с m степенями свободы (m-k) или p-значение (p-вероятность того, что Q будет иметь наблюдаемую величину по случайным причинам)

o Малое p-значение – АКФ значимо отличается от нуля!

2

1

2m

k

k

rQ n n

n k

8

Модели авторегрессии Модели авторегрессии ARARo Авторегрессионная модель порядка p имеет вид:

оцениваемые коэффициенты в модели – .

o Коэффициент 0 (константа) связан со средним ряда:

если значения ряда изменяются относительно нуля, или были центрированы относительно среднего: Zt = Yt – Yср, то константа не нужна

o Порядок модели можно определить с помощью графика ЧАКФ: количество rkk > 0 равно порядку модели, АКФ быстро затухает

0 1 1 2 2t t t p t p tY Y Y Y

0 1 21 p

9

Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса AR(1)AR(1)

10

Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса AR(AR(22))

АКФ ЧАКФ

11

o В таблице показаны последние данные ряда

o Для описания используется модель AR(2)

o Параметры:

o Прогноз:

Y(76) = 115.2 – 0.535*(72) + 0.055*(99) = 77.2

Как применять модельКак применять модельПериод Время Факт

t-5 71 90

t-4 72 78

t-3 73 87

t-2 74 99

t-1 75 72

t 76 ?

0 1 1 2 2t t t tY Y Y

0 1 2115.2, 0.535, 0.0055

12

Модель скользящего среднего Модель скользящего среднего MAMAo Модель скользящего среднего порядка q задается уравнением:

– постоянное среднее процесса, оцениваемые параметры – o Значение прогноза определяется значением ошибок прогноза в

предыдущих периодах, а не значением самой величины

o Название «скользящее среднее» относится к отклонению Yt от среднего значения, представляющее собой линейную комбинацию q ошибок (подобно скользящему окну в методе скользящего среднего):

1 1 2 2t t t t q t qY

Период Время Факт Прогноз Остаток

t-5 71 90 76.1 13.9

t-4 72 78 69.1 8.9

t-3 73 87 75.3 11.7

t-2 74 99 72 27

t-1 75 72 64.3 7.7

t 76 ?

1 1 2 2

(2) :

75.4 0.5667 7.7

0.3560 27 80.6

t t t t

MA

Y

1 1 2 2t t t t q t qY

13

Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса MA(1)MA(1)

14

Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса MA(MA(22))

ЧАКФАКФ

15

Смешанные модели - Смешанные модели - ARMAARMAo Комбинированная модель авторегрессии-скользящего среднего

ARMA(p,q) включает оба вида слагаемых: p авторегрессионных и q скользящего среднего:

o Характерный вид коррелограмм для процесса ARMA(1,1):

0 1 1 1 1t t p t p t t q t qY Y Y

АКФ ЧАКФАКФ ЧАКФ

16

Вид коррелограмм Вид коррелограмм для различных процессов для различных процессов

Модель АКФ ЧАКФ

AR(p) Затухает Обрывается на шаге p

MA(q) Обрывается на шаге q Затухает

ARMA(p,q) Затухает Затухает

17

Приведение ряда к стационарностиПриведение ряда к стационарности

o Наличие тенденции затрудняет идентификацию модели временного ряда

o Характерный признак: АКФ затухает медленно

18

Стационарность рядаСтационарность рядаo Стационарность означает постоянство параметров случайного процесса:

– среднего– дисперсии– вида распределения

o «Сильная» стационарность – нормальность распределенияo Способы устранения нестационарности:

– изменение среднего - дифференцирование и сезонное дифференцирование, удаление тренда

– изменение дисперсии - логарифмирование или степенное преобразование

19

Эффект дифференцированияЭффект дифференцированияo Пример дифференцирования для случайного процесса:

o Порядок разности – d в спецификации модели ARIMA(p,d,q)

1t t tY Y 1 1 1t t t t t t tY Y Y Y Y

20

Эффект логарифмированияЭффект логарифмированияo Если дисперсия ряда увеличивается с ростом уровня ряда, можно

применить логарифмическое преобразование или извлечение корня

21

Критерии выбора моделиКритерии выбора моделиo Информационный критерий Акаике (Akaike Information Criterion, AIC):

o Байесовский информационный критерий Шварца (Bayesian Information Criterion, BIC)

o Число параметров в модели, включая константу – r

o Оба критерия содержат слагаемое штрафа за увеличение числа параметров

2lnAIC MSE r

n

lnln

nBIC MSE r

n

Business

Прогнозирование - Лекция 5. Методология Бокса-Дженкинса (модели ARIMA)