Time-Series Forecasting
Б.Батзориг НЭМС
Хугацааны цуваа
2
Агуулга
Цаг хугацааны цуваа түүний ангилал
Цаг хугацааны цувааны үндсэн тодорхойлогч үзүүлэлтүүд
Хугацааны цувааг бүрдүүлэгч хэсэг
Үржвэр бүтэцтэй хугацааны загвар
Шаталсан дундаж ба экспопенцинал жигдрүүлэлт
Жигдрүүлэлтийн аргаар хэтийн төлөв тооцох
Хандлагад суурьлан хэтийн төлөв тооцох
Шугаман ба муруй шугаман хандлагын загвар
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
3
Агуулга
Авторегрессив загвар ба түүнийг ашиглан хэтийн
төлөв буюу прогноз хийх
Үлдэгдэлийн шинжилгээ
Интерполяци ба Прогноз хийх
Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС
Энгийн хэтийн төлвийг тооцох
арга
Түүхчилсэн өгөгдлийг
ашиглах боломжгүй үед
Өндөр субьектив
шүүмжлэлтэй өгөгдлийг
ашиглахад
Энгийн хэтийн
төлвийг тооцох арга
Шалтгааны
Хэтийн төлвийг тооцох
тоон аргууд
Хэтийн төлвийг тооцох
чанарын аргууд
Хугацааны цуваа
Өнгөрсөн үеийн өгөгдлийг
ашиглан ирээдүйн утгыг
тооцох
Хугацааны цувааны өгөгдөл
Хугацааны интервал дах тоон өгөгдөл
Жилээр, улирлаар, сараар, 7 хоногоор,
өдрөөр, цагаар гэх мэт...
Жишээлбэл:
Жил: 2006 2007 2008 2009 2010
Нас баралт: 75.3 74.2 78.5 79.7 80.2
Хугацааны цувааны зураглал
Босоо тэнхлэг дээр
судлаж байгаа
хувьсагч
Хөндлөн тэнхлэгт
хугацааг байрлуулна
Хугацааны цувааны зураглал хоѐр
хэмжээст графикаар дүрслэнэ
0.00
2.00
4.00
6.00
8.00
10.00
12.00
14.00
16.00
1983
1985
1987
1989
1991
1993
1995
1997
1999
2001
2003
2005
2007
2009
Нас баралтын түвшин, Зүрх судасны өвчин
Бүрэлдэхүүн хэсгүүд
(Components)
Хугацааны цуваа
Цикл Тогтворгүй
(шокын)
Тренд Улирлын
Урт хугацаанд
тасралтгүй
өсөх, буурах
хандлагатай
Улирлаар эсвэл
сараар бүртгэж
авсан өгөгдөл
Тодорхой
хугацааны
дараа эргэн
давтагддаг
Гадны хүчин
зүйлээс
шалтгаалж огцом
өөрчлөгддөг
Хандлагын компонент
Урт хугацаанд тасралтгүй өсөх, буурах
хандлагатай тоон өгөгдөл
Хугацаа
Үзэгдэл
Буурах шугаман хандлага
Хандлагын компонент
Хандлага өснө эсвэл буурна
Хандлага нь шугаман эсвэл шугаман биш
Эхийн эндэгдэл
Хугацаа
Өсөх шугаман биш хандлага
(үргэлжлэл)
Эхийн эндэгдэл
Хугацаа
Улирлын компонент
Богино хугацаанд эргэн давтагддаг шинжтэй
Жилд 1 ажиглагддаг
Ихэвчлэн сараар эсвэл улирлаар
Өвчлөл
Хугацаа (улирлаар)
Өвөл
Хавар
Зун
Намар
Өвөл
Хавар
Зун
Намар
Цикл компонент
Урт хугацааны дараа эргэн давтагддаг
Ө.х урт хугацааны дараа өмнөх түвшинтэй
ойролцоо түвшинд хүрдэг
Эхийн эндэгдэл1 цикл
Жил
Тогтворгүй компонент
Олон тооны янз бүрийн үзэгдлүүдийн
нөлөөллөөр гарч ирдэг тогтвортой бус нэг
элемент байдаг.
Хугацааны түвшингүүдийн огцом өөрчлөлт
Жишээлбэл : байгалын гамшиг, шинэ төрлийн
өвчлөл
Тренд компонентийг хэрхэн
таних вэ?
Хугацааны цувааны график дүрслэл
Жигдрүүлэлт хэрэглэх
Түгээмэл хэрэглэгддэг аргууд : дундажаар
жигдрүүлэх, экспоненциал жигдрүүлэлт
Жигдрүүлэх аргууд
Дундажаар жигдрүүлэх (Moving Averages)
L урттай дундажуудыг тооцох
Экспоненциал жигдрүүлэх (Exponential
Smoothing)
Жинлэгдсэн дундажуудыг тооцох
Chap 16-15
Дундажаар жигдрүүлэх
Moving Averages
Жигдрүүлэхэд хэрэглэдэг
Хугацаан дах арифметик дундажуудын цувааг байгуулах
Тооцогдсон дундажаараа цуваа үүсгэх
Жишээлбэл: 5 жилээр дундажлах, L = 5
7 жилээр дундажлах, L = 7
гэх мэт.
Chap 16-15
Дундажаар жигдрүүлэх
Moving Averages
Жишээлбэл: 5 жилээр дундажлах
Эхний дундаж:
Хоѐрдох дундаж:
гэх мэт.
(үргэлжлэл)
5
YYYYYMA(5) 54321
5
YYYYYMA(5) 65432
Жишээлбэл: Өгөгдөл(жилээр)
Жил Эндэгдэл
1
2
3
4
5
6
7
8
9
10
11
гм ...
23
40
25
27
32
48
33
37
37
50
40
гм…
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11
Эн
дэ
гдэ
л
Жилээр
Calculating Moving Averages
Блок бүр нь 5 жилийн дундажууд
Жил Эндэгдэл
1 23
2 40
3 25
4 27
5 32
6 48
7 33
8 37
9 37
10 50
11 40
Дундаж
жил
5-жилийн
дундажаар
жигдрүүлэх
3 29.4
4 34.4
5 33.0
6 35.4
7 37.4
8 41.0
9 39.4
… …
5
543213
5
322725402329.4
etc…
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11
Эн
дэгд
эл
Жил
Annual 5-Year Moving Average
Жил ба жигдрүүлэл
5 жилээр
жигдрүүлэлт
хийхэд эхний 2
оны өгөгдөл
тооцогдохгүй
Экспоненциал жигдрүүлэлт
Used for smoothing and short term
forecasting (one period into the future)
Жинлэгдсэн дундаар жигдрүүлэх
Weights decline exponentially
Most recent observation is given the highest
weight
Экспоненциал жигдрүүлэлт
W нь жин (жигдрүүлэх коэффициент)
Субьектив сонголт
[0,1] хооронд утгаа авдаг
Жин нь:
Цикл, тогтворгүй элемент ихтэй бол 0 рүү
ойрхон
Бага бол 1тэй ойрхон авна
(үргэлжлэл)
Экспоненциал
жигдрүүлэлтийн загвар
Загвар :
11 YE
1iii E)W1(WYE
Энд :
Ei = i хугацаанд дах экспоненциал жигдрүүлсэн утга
Ei-1 = i-1 хугацаанд дах экспоненциал жигдрүүлсэн утга
Yi = i хугацаанд дах бодит утга
W = жин (жигдрүүлэх коэффициент), 0 < W < 1
i = 2, 3, 4, …
Жишээ
W = 0.2 гэж үзвэл
Хугацаа (i)Эндэгдэл
(Yi)(Ei-1) утга
(Ei) хугацаан дах
экспоненциал
жигдрүүлсэн утга
1
2
3
4
5
6
7
8
9
10
гэх мэт
23
40
25
27
32
48
33
37
37
50
гэх мэт
--
23.000
26.400
26.120
26.296
27.437
31.549
31.840
32.872
33.697
гэх мэт
23
(.2)(40)+(.8)(23)=26.4
(.2)(25)+(.8)(26.4)=26.12
(.2)(27)+(.8)(26.12)=26.296
(.2)(32)+(.8)(26.296)=27.437
(.2)(48)+(.8)(27.437)=31.549
(.2)(48)+(.8)(31.549)=31.840
(.2)(33)+(.8)(31.840)=32.872
(.2)(37)+(.8)(32.872)=33.697
(.2)(50)+(.8)(33.697)=36.958
гэх мэт
1ii
i
E)W1(WY
E
E1 = Y1
Эндэгдэл ба жигдрүүлсэн
эндэгдэл
Тогтворгүй
элемент багатай
учраас W=0.2
байхаар сонгосон
i + 1 хугацаан дах хэтийн
төлөв
(i + 1) хугацаан дах хэтийн төлвийн
утга нь (i) хугацаан дах жигдрүүлсэн
утгатай тэнцүү :
i1i EY
Chap 16-26
Excel ашиглах
data analysis / exponential smoothing
“damping factor” нь (1 - W)
0
20
40
60
1 2 3 4 5 6 7 8 9 10
Утга
Хугацаа
Экспоненциал жигдрүүлэлт
Actual
Forecast
Хугацаа Эндэгдэл Жигдрүүлсэн
1 23
2 40 23
3 25 26.4
4 27 26.12
5 32 26.296
6 48 27.4368
7 33 31.54944
8 37 31.83955
9 37 32.87164
10 50 33.69731
Chap 16-26
Түгээмэл хэрэглэдэг хандлагын
загварууд
Шугаман загвараар хэтийн төлөв тооцох
Шугаман бус загвараар хэтийн төлөв тооцох
Экспоненциал загвараар хэтийн төлөв
тооцох
Шугаман загвар
Регрессийн тэгшитгэлээр шугаман загвар үнэлэх
Жил
Хугацаа (X) Эндэгдэл
(Y)
2004
2005
2006
2007
2008
2009
0
1
2
3
4
5
20
40
30
50
70
65
XbbY 10
Хугацаа (X) нь үл
хамаарах хувьсагч:
X хувьсагчийг 0-ээс эхлэн нэг жилээр
ихсэх дарааллаар дахин байгуулдаг
Chap 16-29
Шугаман загвар
Хэтийн төлөв тооцох тэгшитгэл:
0
10
20
30
40
50
60
70
80
0 1 2 3 4 5 6
Эн
дэгд
эл
Жил
Хандлага
ii X 9.571421.905Y
(үргэлжлэл)
Chap 16-29
Жил
Хугацаа (X) Эндэгдэл
(Y)
2004
2005
2006
2007
2008
2009
0
1
2
3
4
5
20
40
30
50
70
65
Chap 16-30
Шугаман загвар
Прогнозын утга 6 (2010):
Жил
Хугацаа (X) Эндэгдэл
(Y)
2004
2005
2006
2007
2008
2009
2010
0
1
2
3
4
5
6
20
40
30
50
70
65
??
(үргэлжлэл)
0
10
20
30
40
50
60
70
80
0 1 2 3 4 5 6
Эн
дэгд
эл
Жил
Хандлага
79.33
(6) 9.571421.905Y
Chap 16-30
Шугаман бус загвар
График нь шугаман бус хандлагатай
тохиолдолд шугаман бус загварыг ашиглана.
Квадратлаг хэлбэр нь шугаман бус загварын
нэг хэлбэр
Шугаман ба квадрат загварын засварласан r2
болон стандарт алдаануудыг харьцуулах
Шугаман бус загварын өөр хэлбэртэй
харьцуулах
i
2
i2i10i XXY
Экспоненциал загвар
Шугаман бус загвар:
Шугаман хэлбэрт хувиргавал:
i
X
10i εββY i
)εlog()log(βX)βlog()log(Y i1i0i
Экспоненциал загвар
Хэтийн төлөв тооцох тэгшитгэл:
i10i XbbYlog( )ˆ
Энд b0 = log(β0) – ийн үнэлгээ
b1 = log(β1) – ийн үнэлгээ
(үргэлжлэл)
Тайлан:
%100)1β( 1 нь жилд хэдэн хувиар өсөхийг
харуулдаг
Ялгааг ашиглан загвар сонгох
Анхдагч ялгаварыг ашиглах, шугаман
загварыг ашиглана
Хоѐрдогч ялгаварыг ашиглах, квадрат
загварыг ашиглах
)YY()YY()Y(Y 1-nn2312
)]YY()Y[(Y
)]YY()Y[(Y)]YY()Y[(Y
2-n1-n1-nn
23341223
Хувийн ялгааг харгалзах, экспоненциал
загварыг ашиглах
(үргэлжлэл)
Ялгааг ашиглан загвар сонгох
%100Y
)Y(Y%100
Y
)Y(Y%100
Y
)Y(Y
1-n
1-nn
2
23
1
12
ip-ip2-i21-i10i YAYAYAAY δ
Авторегрессийн загвар
Хэтийн төлөв тооцох
Автокорреляцийн давуу тал
1-р эрэмбийн – дараах, өмнөх хугацааны өгөгдлийн
корреляци
2-р эрэмбийн – 2 хугацааны өгөгдлийн корреляци
p эрэмбийн авторегрессийн загвар:
Алдаа
Авторегрессийн загвар: Жишээ
жил нэгж
02 4
03 3
04 2
05 3
06 2
07 2
08 4
09 6
Сүлийн 8 жилийн туршид тохиолдсон машины ослын
тухай тоон мэдээлэл бүртгэгджээ.
2-р эрэмбийн авторегрессийн загварыг байгуулбал.
Авторегрессийн загвар: Жишээ
Жил Yi Yi-1 Yi-2
02 4 -- --
03 3 4 --
04 2 3 4
05 3 2 3
06 2 3 2
07 2 2 3
08 4 2 2
09 6 4 2
Coefficients
In te rce p t 3.5
X V a ria b le 1 0.8125
X V a ria b le 2 -0 .9375
хүснэгтээр үзүүлсэн
регрессийн загвар
тооцвол
2i1ii 0.9375Y0.8125Y3.5Y
Авторегрессийн загвар
Жишээ: Прогноз
2010 оны осолд өртсөн хүний тоог
таамаглах:
625.4
)0.9375(4)0.8125(63.5
)0.9375(Y)0.8125(Y3.5Y
0.9375Y0.8125Y3.5Y
200820092010
2i1ii
Авторегрессийн загварын
алхмууд
1. p олох (df = n – 2p – 1 чөлөөний зэрэг)
2.“хоцрогдолтой предиктор” хувьсагчийн утгууд
Yi-1 , Yi-2 , … ,Yi-p
3.Бүх р –дээр байгуулсан загварыг
статистикийн програм ашиглан тооцсон гэж
үзвэл
4.Ap тестийн статистик ач холбогдол
Тэг таамаглалыг няцаавал, энэ загварыг
ашиглана
Тэг таамаглалыг хүлээж авбал р-г 1-р бууруулж
дахин тооцно
Хэтийн төлөв тооцох
загварыг сонгох
Алдааны шинжилгээний хийх
Цувааг тэгшитгэх, жигдрүүлэх
Квадрат ялгааг ашиглан алдааны
далайцыг хэмжих ба алдаа нь хамгийн
бага байх загварыг сонгох
Абсолют ялгааг ашиглан алдааны
далайцыг хэмжих ба алдаа нь хамгийн
бага байх загварыг сонгох
Алдааны шинжилгээ
Санамсаргүй алдаа
Трендгүй цуваа
Цикл нөлөөлөлгүй цуваа
Улирлын биш цуваа
T T
T T
e e
e e
0 0
0 0
Алдааг хэмжих
Хамгийн бага алдаатай загварыг сонгох
Дундаж абсолют
хазайлт (MAD)
Хэт өндөр, бага утгуудыг
бага мэдрэг
Алдааны
квадратуудын
нийлбэр (SSE)
Алсын утгуудад мэдрэг
n
1i
2
ii )Y(YSSEn
YY
MAD
n
1i
ii
outlier extreme
Гол санаа
Өгөгдлийн хамгийн сайн тайлбарлах
загварыг сонгох, загваруудыг
харьцуулан
Хамгийн энгийн загваруудыг сонгох Шугаман загвар
Квадрат загвар
1-р эрэмбийн авторегрессийн загвар
Илүү нарийн аргууд:
2,3-р эрэмбийн авторегрессийн загвар
Экспоненциал загвар
Хугацааны цуваа нь ихэвчлэн жилээр, сараар өгөгддөг
Эдгээр цуваа нь ихэвчлэн тренд, улирал, тогтворгүй компонентүүдийг агуулж байдаг.
Улирлаар өгөгдсөн цувааны хувьд
Шинэ 3 дамми хувьсагчид задлана
Q1 = 1 /1-р улирал, бусад 0/
Q2 = 1 /2-р улирал, бусад 0/
Q3 = 1 /3-р улирал, бусад 0/
(Q1 = Q2 = Q3 = 0 4-р улирал )
Улирлын компонентийн хэтийн
төлвийг тооцох
Улирлын өгөгдлийн экспоненциал загвар
Шугаман хэлбэрт хувиргавал:
i
Q
4
Q
3
Q
2
X
10i εβββββY 321i
)εlog()log(βQ)log(βQ
)log(βQ)log(βX)βlog()log(Y
i4332
211i0i
(β1–1)x100% хэдэн хувиар өсөх, буурахыг илэрхийлдэг
Βi i-р улирлыг 4-р улиралтай харьцуулахад (i = 2, 3, 4)
Улирлын загварыг үнэлэх
Экспоненциал тэгшитгэл:
342312i10i QbQbQbXbb)Ylog(
Энд b0 = log(β0)-ийн үнэлгээ,
b1 = log(β1) -ийн үнэлгээ,
гэх мэт…
0
bβ10 0
1
b β10 1
Тайлбар
Chap 16-48
= улиралд хэдэн хувиар өсөх, буурахыг харуулдаг
= 1-р улирлыг бусад улиралтай харьцуулаха хэдэн %-аар
өсөх буурах
= 2-р улирлыг бусад улиралтай харьцуулаха хэдэн %-аар
өсөх буурах
= 3-р улирлыг бусад улиралтай харьцуулаха хэдэн %-аар
өсөх буурах
%100)1β( 1
2β
3β
4β
Жишээ
Тэгшитгэл нь:
321ii .022Q.073QQ082..017X3.43)Ylog(
b0 = 3.43, so
b1 = .017, so
b2 = -.082, so
b3 = -.073, so
b4 = .022, so
53.2691β10 0
b0
040.1β10 1
b1
827.0β10 2
b2
845.0β10 3
b3
052.1β10 4
b4
Жишээ
Тайлбар:
53.2691β0
040.1β1
827.0β2
845.0β3
052.1β4
Эхний жилийн эхний улиралын засварлагдаагүй
тренд утга
4.0% = улирал тутамд хувиар өснө.
1-р улиралд 4-р улиралтай харьцуулахад 82.7%-аар
өссөн
2-р улиралд 4-р улиралтай харьцуулахад 84.5% -аар
өссөн
2-р улиралд 4-р улиралтай харьцуулахад 105.2 % -
аар өссөн
Утга:
(үргэлжлэл)
АСУУЛТ
Chap 16-51
АНХААРАЛ ТАВЬСАНД БАЯРЛАЛАА
Chap 16-52