Upload
gleb-zakhodiakin
View
17.046
Download
1
Embed Size (px)
DESCRIPTION
Курс "Компьютерная поддержка прогнозирования"Лекция 5. Методология Бокса-Дженкинса (модели ARIMA)
Citation preview
Курс «Компьютерная Курс «Компьютерная поддержка поддержка
прогнозирования»прогнозирования»
Заходякин Глеб Викторович,
кафедра Информационных систем и технологий в логистикеe-mail: [email protected]
2
Метод Бокса-Дженкинса Метод Бокса-Дженкинса (ARIMA)(ARIMA)
o Общие принципы моделированияo Модели авторегрессии и скользящего среднегоo Выборочная АКФ и ЧАКФ, статистики связанные
с нимиo Приведение ряда к стационарностиo Реализация стратегии разработки моделиo Сезонные модели ARIMA
3
Общая характеристика методаОбщая характеристика методаo Модели ARIMA (Auto-Regressive
Integrated Moving Average) – класс универсальных линейных моделей для описания стационарных и нестационарных временных рядов
o Разработчики – G.P. Box, G.M. Jenkins (197x-199x)
o Для моделирования используютсятолько данные временного ряда
o Разработаны расширения моделей – ARIMAX, учитывающие факторы, выбросыи структурные изменения различных видов
o Особенностью метода является итеративный подход к определению лучшей модели среди всех возможных
o Для идентификации моделей используются диаграммы последовательности ряда и коррелограммы с АКФ и ЧАКФ
o Для оценки адекватности применяется анализ остатков:– остатки должны быть малыми– не должно быть закономерных компонент и корреляций
4
Схема применения методаСхема применения метода1. Приведение ряда к стационарности
2. Определение общего класса модели (AR, MA, ARMA, ARIMA) и порядка модели
3. Оценка параметров модели
4. Статистический анализ модели:
o значимость модели
o значимость коэффициентов
o остаточные корреляции
5. Если модель неадекватна – Goto 2
6. Выбор лучшей модели
7. Прогнозирование
пример: АКФ и ЧАКФ для процесса AR(1)
5
Исследование автокорреляцийИсследование автокорреляций
12
1
n
t t kt kk n
tt
Y Y Y Yr
Y Y
krtY t kY
Y
- наблюдение в момент t - наблюдение с лагом (запаздыванием) в k периодов- наблюдение в момент t
- среднее значение временного ряда - коэффициент автокорреляции для лага k
6
Оценка значимости Оценка значимости rrkk
o Стандартная ошибка для rk:
o Доверительный интервал для rk: +/- t * SE(rk)
o Использование t-статистики:
o Критическое значение – t-распределение, df=n-1,
12
1
1 21
k
ii
k
rSE r
nn
k
k
rtSE r
7
Статистика Бокса-ПирсаСтатистика Бокса-Пирсаo Q-Статистика Бокса-Пирса
(Льюнг, Бокс) - Ljung-Box Q
o Для проверки используется распределение Хи2 с m степенями свободы (m-k) или p-значение (p-вероятность того, что Q будет иметь наблюдаемую величину по случайным причинам)
o Малое p-значение – АКФ значимо отличается от нуля!
2
1
2m
k
k
rQ n n
n k
8
Модели авторегрессии Модели авторегрессии ARARo Авторегрессионная модель порядка p имеет вид:
оцениваемые коэффициенты в модели – .
o Коэффициент 0 (константа) связан со средним ряда:
если значения ряда изменяются относительно нуля, или были центрированы относительно среднего: Zt = Yt – Yср, то константа не нужна
o Порядок модели можно определить с помощью графика ЧАКФ: количество rkk > 0 равно порядку модели, АКФ быстро затухает
0 1 1 2 2t t t p t p tY Y Y Y
0 1 21 p
9
Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса AR(1)AR(1)
10
Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса AR(AR(22))
АКФ ЧАКФ
11
o В таблице показаны последние данные ряда
o Для описания используется модель AR(2)
o Параметры:
o Прогноз:
Y(76) = 115.2 – 0.535*(72) + 0.055*(99) = 77.2
Как применять модельКак применять модельПериод Время Факт
t-5 71 90
t-4 72 78
t-3 73 87
t-2 74 99
t-1 75 72
t 76 ?
0 1 1 2 2t t t tY Y Y
0 1 2115.2, 0.535, 0.0055
12
Модель скользящего среднего Модель скользящего среднего MAMAo Модель скользящего среднего порядка q задается уравнением:
– постоянное среднее процесса, оцениваемые параметры – o Значение прогноза определяется значением ошибок прогноза в
предыдущих периодах, а не значением самой величины
o Название «скользящее среднее» относится к отклонению Yt от среднего значения, представляющее собой линейную комбинацию q ошибок (подобно скользящему окну в методе скользящего среднего):
1 1 2 2t t t t q t qY
Период Время Факт Прогноз Остаток
t-5 71 90 76.1 13.9
t-4 72 78 69.1 8.9
t-3 73 87 75.3 11.7
t-2 74 99 72 27
t-1 75 72 64.3 7.7
t 76 ?
1 1 2 2
(2) :
75.4 0.5667 7.7
0.3560 27 80.6
t t t t
MA
Y
1 1 2 2t t t t q t qY
13
Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса MA(1)MA(1)
14
Характерный вид коррелограмм для Характерный вид коррелограмм для процесса процесса MA(MA(22))
ЧАКФАКФ
15
Смешанные модели - Смешанные модели - ARMAARMAo Комбинированная модель авторегрессии-скользящего среднего
ARMA(p,q) включает оба вида слагаемых: p авторегрессионных и q скользящего среднего:
o Характерный вид коррелограмм для процесса ARMA(1,1):
0 1 1 1 1t t p t p t t q t qY Y Y
АКФ ЧАКФАКФ ЧАКФ
16
Вид коррелограмм Вид коррелограмм для различных процессов для различных процессов
Модель АКФ ЧАКФ
AR(p) Затухает Обрывается на шаге p
MA(q) Обрывается на шаге q Затухает
ARMA(p,q) Затухает Затухает
17
Приведение ряда к стационарностиПриведение ряда к стационарности
o Наличие тенденции затрудняет идентификацию модели временного ряда
o Характерный признак: АКФ затухает медленно
18
Стационарность рядаСтационарность рядаo Стационарность означает постоянство параметров случайного процесса:
– среднего– дисперсии– вида распределения
o «Сильная» стационарность – нормальность распределенияo Способы устранения нестационарности:
– изменение среднего - дифференцирование и сезонное дифференцирование, удаление тренда
– изменение дисперсии - логарифмирование или степенное преобразование
19
Эффект дифференцированияЭффект дифференцированияo Пример дифференцирования для случайного процесса:
o Порядок разности – d в спецификации модели ARIMA(p,d,q)
1t t tY Y 1 1 1t t t t t t tY Y Y Y Y
20
Эффект логарифмированияЭффект логарифмированияo Если дисперсия ряда увеличивается с ростом уровня ряда, можно
применить логарифмическое преобразование или извлечение корня
21
Критерии выбора моделиКритерии выбора моделиo Информационный критерий Акаике (Akaike Information Criterion, AIC):
o Байесовский информационный критерий Шварца (Bayesian Information Criterion, BIC)
o Число параметров в модели, включая константу – r
o Оба критерия содержат слагаемое штрафа за увеличение числа параметров
2lnAIC MSE r
n
lnln
nBIC MSE r
n