52
Time-Series Forecasting Б.Батзориг НЭМС Хугацааны цуваа

Time series analysis

Embed Size (px)

Citation preview

Page 1: Time series analysis

Time-Series Forecasting

Б.Батзориг НЭМС

Хугацааны цуваа

Page 2: Time series analysis

2

Агуулга

Цаг хугацааны цуваа түүний ангилал

Цаг хугацааны цувааны үндсэн тодорхойлогч үзүүлэлтүүд

Хугацааны цувааг бүрдүүлэгч хэсэг

Үржвэр бүтэцтэй хугацааны загвар

Шаталсан дундаж ба экспопенцинал жигдрүүлэлт

Жигдрүүлэлтийн аргаар хэтийн төлөв тооцох

Хандлагад суурьлан хэтийн төлөв тооцох

Шугаман ба муруй шугаман хандлагын загвар

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС

Page 3: Time series analysis

3

Агуулга

Авторегрессив загвар ба түүнийг ашиглан хэтийн

төлөв буюу прогноз хийх

Үлдэгдэлийн шинжилгээ

Интерполяци ба Прогноз хийх

Эпидемиологи Биостатистикийн Тэнхим, НЭМС, ЭМШУИС

Page 4: Time series analysis

Энгийн хэтийн төлвийг тооцох

арга

Түүхчилсэн өгөгдлийг

ашиглах боломжгүй үед

Өндөр субьектив

шүүмжлэлтэй өгөгдлийг

ашиглахад

Энгийн хэтийн

төлвийг тооцох арга

Шалтгааны

Хэтийн төлвийг тооцох

тоон аргууд

Хэтийн төлвийг тооцох

чанарын аргууд

Хугацааны цуваа

Өнгөрсөн үеийн өгөгдлийг

ашиглан ирээдүйн утгыг

тооцох

Page 5: Time series analysis

Хугацааны цувааны өгөгдөл

Хугацааны интервал дах тоон өгөгдөл

Жилээр, улирлаар, сараар, 7 хоногоор,

өдрөөр, цагаар гэх мэт...

Жишээлбэл:

Жил: 2006 2007 2008 2009 2010

Нас баралт: 75.3 74.2 78.5 79.7 80.2

Page 6: Time series analysis

Хугацааны цувааны зураглал

Босоо тэнхлэг дээр

судлаж байгаа

хувьсагч

Хөндлөн тэнхлэгт

хугацааг байрлуулна

Хугацааны цувааны зураглал хоѐр

хэмжээст графикаар дүрслэнэ

0.00

2.00

4.00

6.00

8.00

10.00

12.00

14.00

16.00

1983

1985

1987

1989

1991

1993

1995

1997

1999

2001

2003

2005

2007

2009

Нас баралтын түвшин, Зүрх судасны өвчин

Page 7: Time series analysis

Бүрэлдэхүүн хэсгүүд

(Components)

Хугацааны цуваа

Цикл Тогтворгүй

(шокын)

Тренд Улирлын

Урт хугацаанд

тасралтгүй

өсөх, буурах

хандлагатай

Улирлаар эсвэл

сараар бүртгэж

авсан өгөгдөл

Тодорхой

хугацааны

дараа эргэн

давтагддаг

Гадны хүчин

зүйлээс

шалтгаалж огцом

өөрчлөгддөг

Page 8: Time series analysis

Хандлагын компонент

Урт хугацаанд тасралтгүй өсөх, буурах

хандлагатай тоон өгөгдөл

Хугацаа

Үзэгдэл

Page 9: Time series analysis

Буурах шугаман хандлага

Хандлагын компонент

Хандлага өснө эсвэл буурна

Хандлага нь шугаман эсвэл шугаман биш

Эхийн эндэгдэл

Хугацаа

Өсөх шугаман биш хандлага

(үргэлжлэл)

Эхийн эндэгдэл

Хугацаа

Page 10: Time series analysis

Улирлын компонент

Богино хугацаанд эргэн давтагддаг шинжтэй

Жилд 1 ажиглагддаг

Ихэвчлэн сараар эсвэл улирлаар

Өвчлөл

Хугацаа (улирлаар)

Өвөл

Хавар

Зун

Намар

Өвөл

Хавар

Зун

Намар

Page 11: Time series analysis

Цикл компонент

Урт хугацааны дараа эргэн давтагддаг

Ө.х урт хугацааны дараа өмнөх түвшинтэй

ойролцоо түвшинд хүрдэг

Эхийн эндэгдэл1 цикл

Жил

Page 12: Time series analysis

Тогтворгүй компонент

Олон тооны янз бүрийн үзэгдлүүдийн

нөлөөллөөр гарч ирдэг тогтвортой бус нэг

элемент байдаг.

Хугацааны түвшингүүдийн огцом өөрчлөлт

Жишээлбэл : байгалын гамшиг, шинэ төрлийн

өвчлөл

Page 13: Time series analysis

Тренд компонентийг хэрхэн

таних вэ?

Хугацааны цувааны график дүрслэл

Жигдрүүлэлт хэрэглэх

Түгээмэл хэрэглэгддэг аргууд : дундажаар

жигдрүүлэх, экспоненциал жигдрүүлэлт

Page 14: Time series analysis

Жигдрүүлэх аргууд

Дундажаар жигдрүүлэх (Moving Averages)

L урттай дундажуудыг тооцох

Экспоненциал жигдрүүлэх (Exponential

Smoothing)

Жинлэгдсэн дундажуудыг тооцох

Page 15: Time series analysis

Chap 16-15

Дундажаар жигдрүүлэх

Moving Averages

Жигдрүүлэхэд хэрэглэдэг

Хугацаан дах арифметик дундажуудын цувааг байгуулах

Тооцогдсон дундажаараа цуваа үүсгэх

Жишээлбэл: 5 жилээр дундажлах, L = 5

7 жилээр дундажлах, L = 7

гэх мэт.

Chap 16-15

Page 16: Time series analysis

Дундажаар жигдрүүлэх

Moving Averages

Жишээлбэл: 5 жилээр дундажлах

Эхний дундаж:

Хоѐрдох дундаж:

гэх мэт.

(үргэлжлэл)

5

YYYYYMA(5) 54321

5

YYYYYMA(5) 65432

Page 17: Time series analysis

Жишээлбэл: Өгөгдөл(жилээр)

Жил Эндэгдэл

1

2

3

4

5

6

7

8

9

10

11

гм ...

23

40

25

27

32

48

33

37

37

50

40

гм…

0

10

20

30

40

50

60

1 2 3 4 5 6 7 8 9 10 11

Эн

дэ

гдэ

л

Жилээр

Page 18: Time series analysis

Calculating Moving Averages

Блок бүр нь 5 жилийн дундажууд

Жил Эндэгдэл

1 23

2 40

3 25

4 27

5 32

6 48

7 33

8 37

9 37

10 50

11 40

Дундаж

жил

5-жилийн

дундажаар

жигдрүүлэх

3 29.4

4 34.4

5 33.0

6 35.4

7 37.4

8 41.0

9 39.4

… …

5

543213

5

322725402329.4

etc…

Page 19: Time series analysis

0

10

20

30

40

50

60

1 2 3 4 5 6 7 8 9 10 11

Эн

дэгд

эл

Жил

Annual 5-Year Moving Average

Жил ба жигдрүүлэл

5 жилээр

жигдрүүлэлт

хийхэд эхний 2

оны өгөгдөл

тооцогдохгүй

Page 20: Time series analysis

Экспоненциал жигдрүүлэлт

Used for smoothing and short term

forecasting (one period into the future)

Жинлэгдсэн дундаар жигдрүүлэх

Weights decline exponentially

Most recent observation is given the highest

weight

Page 21: Time series analysis

Экспоненциал жигдрүүлэлт

W нь жин (жигдрүүлэх коэффициент)

Субьектив сонголт

[0,1] хооронд утгаа авдаг

Жин нь:

Цикл, тогтворгүй элемент ихтэй бол 0 рүү

ойрхон

Бага бол 1тэй ойрхон авна

(үргэлжлэл)

Page 22: Time series analysis

Экспоненциал

жигдрүүлэлтийн загвар

Загвар :

11 YE

1iii E)W1(WYE

Энд :

Ei = i хугацаанд дах экспоненциал жигдрүүлсэн утга

Ei-1 = i-1 хугацаанд дах экспоненциал жигдрүүлсэн утга

Yi = i хугацаанд дах бодит утга

W = жин (жигдрүүлэх коэффициент), 0 < W < 1

i = 2, 3, 4, …

Page 23: Time series analysis

Жишээ

W = 0.2 гэж үзвэл

Хугацаа (i)Эндэгдэл

(Yi)(Ei-1) утга

(Ei) хугацаан дах

экспоненциал

жигдрүүлсэн утга

1

2

3

4

5

6

7

8

9

10

гэх мэт

23

40

25

27

32

48

33

37

37

50

гэх мэт

--

23.000

26.400

26.120

26.296

27.437

31.549

31.840

32.872

33.697

гэх мэт

23

(.2)(40)+(.8)(23)=26.4

(.2)(25)+(.8)(26.4)=26.12

(.2)(27)+(.8)(26.12)=26.296

(.2)(32)+(.8)(26.296)=27.437

(.2)(48)+(.8)(27.437)=31.549

(.2)(48)+(.8)(31.549)=31.840

(.2)(33)+(.8)(31.840)=32.872

(.2)(37)+(.8)(32.872)=33.697

(.2)(50)+(.8)(33.697)=36.958

гэх мэт

1ii

i

E)W1(WY

E

E1 = Y1

Page 24: Time series analysis

Эндэгдэл ба жигдрүүлсэн

эндэгдэл

Тогтворгүй

элемент багатай

учраас W=0.2

байхаар сонгосон

Page 25: Time series analysis

i + 1 хугацаан дах хэтийн

төлөв

(i + 1) хугацаан дах хэтийн төлвийн

утга нь (i) хугацаан дах жигдрүүлсэн

утгатай тэнцүү :

i1i EY

Page 26: Time series analysis

Chap 16-26

Excel ашиглах

data analysis / exponential smoothing

“damping factor” нь (1 - W)

0

20

40

60

1 2 3 4 5 6 7 8 9 10

Утга

Хугацаа

Экспоненциал жигдрүүлэлт

Actual

Forecast

Хугацаа Эндэгдэл Жигдрүүлсэн

1 23

2 40 23

3 25 26.4

4 27 26.12

5 32 26.296

6 48 27.4368

7 33 31.54944

8 37 31.83955

9 37 32.87164

10 50 33.69731

Chap 16-26

Page 27: Time series analysis

Түгээмэл хэрэглэдэг хандлагын

загварууд

Шугаман загвараар хэтийн төлөв тооцох

Шугаман бус загвараар хэтийн төлөв тооцох

Экспоненциал загвараар хэтийн төлөв

тооцох

Page 28: Time series analysis

Шугаман загвар

Регрессийн тэгшитгэлээр шугаман загвар үнэлэх

Жил

Хугацаа (X) Эндэгдэл

(Y)

2004

2005

2006

2007

2008

2009

0

1

2

3

4

5

20

40

30

50

70

65

XbbY 10

Хугацаа (X) нь үл

хамаарах хувьсагч:

X хувьсагчийг 0-ээс эхлэн нэг жилээр

ихсэх дарааллаар дахин байгуулдаг

Page 29: Time series analysis

Chap 16-29

Шугаман загвар

Хэтийн төлөв тооцох тэгшитгэл:

0

10

20

30

40

50

60

70

80

0 1 2 3 4 5 6

Эн

дэгд

эл

Жил

Хандлага

ii X 9.571421.905Y

(үргэлжлэл)

Chap 16-29

Жил

Хугацаа (X) Эндэгдэл

(Y)

2004

2005

2006

2007

2008

2009

0

1

2

3

4

5

20

40

30

50

70

65

Page 30: Time series analysis

Chap 16-30

Шугаман загвар

Прогнозын утга 6 (2010):

Жил

Хугацаа (X) Эндэгдэл

(Y)

2004

2005

2006

2007

2008

2009

2010

0

1

2

3

4

5

6

20

40

30

50

70

65

??

(үргэлжлэл)

0

10

20

30

40

50

60

70

80

0 1 2 3 4 5 6

Эн

дэгд

эл

Жил

Хандлага

79.33

(6) 9.571421.905Y

Chap 16-30

Page 31: Time series analysis

Шугаман бус загвар

График нь шугаман бус хандлагатай

тохиолдолд шугаман бус загварыг ашиглана.

Квадратлаг хэлбэр нь шугаман бус загварын

нэг хэлбэр

Шугаман ба квадрат загварын засварласан r2

болон стандарт алдаануудыг харьцуулах

Шугаман бус загварын өөр хэлбэртэй

харьцуулах

i

2

i2i10i XXY

Page 32: Time series analysis

Экспоненциал загвар

Шугаман бус загвар:

Шугаман хэлбэрт хувиргавал:

i

X

10i εββY i

)εlog()log(βX)βlog()log(Y i1i0i

Page 33: Time series analysis

Экспоненциал загвар

Хэтийн төлөв тооцох тэгшитгэл:

i10i XbbYlog( )ˆ

Энд b0 = log(β0) – ийн үнэлгээ

b1 = log(β1) – ийн үнэлгээ

(үргэлжлэл)

Тайлан:

%100)1β( 1 нь жилд хэдэн хувиар өсөхийг

харуулдаг

Page 34: Time series analysis

Ялгааг ашиглан загвар сонгох

Анхдагч ялгаварыг ашиглах, шугаман

загварыг ашиглана

Хоѐрдогч ялгаварыг ашиглах, квадрат

загварыг ашиглах

)YY()YY()Y(Y 1-nn2312

)]YY()Y[(Y

)]YY()Y[(Y)]YY()Y[(Y

2-n1-n1-nn

23341223

Page 35: Time series analysis

Хувийн ялгааг харгалзах, экспоненциал

загварыг ашиглах

(үргэлжлэл)

Ялгааг ашиглан загвар сонгох

%100Y

)Y(Y%100

Y

)Y(Y%100

Y

)Y(Y

1-n

1-nn

2

23

1

12

Page 36: Time series analysis

ip-ip2-i21-i10i YAYAYAAY δ

Авторегрессийн загвар

Хэтийн төлөв тооцох

Автокорреляцийн давуу тал

1-р эрэмбийн – дараах, өмнөх хугацааны өгөгдлийн

корреляци

2-р эрэмбийн – 2 хугацааны өгөгдлийн корреляци

p эрэмбийн авторегрессийн загвар:

Алдаа

Page 37: Time series analysis

Авторегрессийн загвар: Жишээ

жил нэгж

02 4

03 3

04 2

05 3

06 2

07 2

08 4

09 6

Сүлийн 8 жилийн туршид тохиолдсон машины ослын

тухай тоон мэдээлэл бүртгэгджээ.

2-р эрэмбийн авторегрессийн загварыг байгуулбал.

Page 38: Time series analysis

Авторегрессийн загвар: Жишээ

Жил Yi Yi-1 Yi-2

02 4 -- --

03 3 4 --

04 2 3 4

05 3 2 3

06 2 3 2

07 2 2 3

08 4 2 2

09 6 4 2

Coefficients

In te rce p t 3.5

X V a ria b le 1 0.8125

X V a ria b le 2 -0 .9375

хүснэгтээр үзүүлсэн

регрессийн загвар

тооцвол

2i1ii 0.9375Y0.8125Y3.5Y

Page 39: Time series analysis

Авторегрессийн загвар

Жишээ: Прогноз

2010 оны осолд өртсөн хүний тоог

таамаглах:

625.4

)0.9375(4)0.8125(63.5

)0.9375(Y)0.8125(Y3.5Y

0.9375Y0.8125Y3.5Y

200820092010

2i1ii

Page 40: Time series analysis

Авторегрессийн загварын

алхмууд

1. p олох (df = n – 2p – 1 чөлөөний зэрэг)

2.“хоцрогдолтой предиктор” хувьсагчийн утгууд

Yi-1 , Yi-2 , … ,Yi-p

3.Бүх р –дээр байгуулсан загварыг

статистикийн програм ашиглан тооцсон гэж

үзвэл

4.Ap тестийн статистик ач холбогдол

Тэг таамаглалыг няцаавал, энэ загварыг

ашиглана

Тэг таамаглалыг хүлээж авбал р-г 1-р бууруулж

дахин тооцно

Page 41: Time series analysis

Хэтийн төлөв тооцох

загварыг сонгох

Алдааны шинжилгээний хийх

Цувааг тэгшитгэх, жигдрүүлэх

Квадрат ялгааг ашиглан алдааны

далайцыг хэмжих ба алдаа нь хамгийн

бага байх загварыг сонгох

Абсолют ялгааг ашиглан алдааны

далайцыг хэмжих ба алдаа нь хамгийн

бага байх загварыг сонгох

Page 42: Time series analysis

Алдааны шинжилгээ

Санамсаргүй алдаа

Трендгүй цуваа

Цикл нөлөөлөлгүй цуваа

Улирлын биш цуваа

T T

T T

e e

e e

0 0

0 0

Page 43: Time series analysis

Алдааг хэмжих

Хамгийн бага алдаатай загварыг сонгох

Дундаж абсолют

хазайлт (MAD)

Хэт өндөр, бага утгуудыг

бага мэдрэг

Алдааны

квадратуудын

нийлбэр (SSE)

Алсын утгуудад мэдрэг

n

1i

2

ii )Y(YSSEn

YY

MAD

n

1i

ii

outlier extreme

Page 44: Time series analysis

Гол санаа

Өгөгдлийн хамгийн сайн тайлбарлах

загварыг сонгох, загваруудыг

харьцуулан

Хамгийн энгийн загваруудыг сонгох Шугаман загвар

Квадрат загвар

1-р эрэмбийн авторегрессийн загвар

Илүү нарийн аргууд:

2,3-р эрэмбийн авторегрессийн загвар

Экспоненциал загвар

Page 45: Time series analysis

Хугацааны цуваа нь ихэвчлэн жилээр, сараар өгөгддөг

Эдгээр цуваа нь ихэвчлэн тренд, улирал, тогтворгүй компонентүүдийг агуулж байдаг.

Улирлаар өгөгдсөн цувааны хувьд

Шинэ 3 дамми хувьсагчид задлана

Q1 = 1 /1-р улирал, бусад 0/

Q2 = 1 /2-р улирал, бусад 0/

Q3 = 1 /3-р улирал, бусад 0/

(Q1 = Q2 = Q3 = 0 4-р улирал )

Улирлын компонентийн хэтийн

төлвийг тооцох

Page 46: Time series analysis

Улирлын өгөгдлийн экспоненциал загвар

Шугаман хэлбэрт хувиргавал:

i

Q

4

Q

3

Q

2

X

10i εβββββY 321i

)εlog()log(βQ)log(βQ

)log(βQ)log(βX)βlog()log(Y

i4332

211i0i

(β1–1)x100% хэдэн хувиар өсөх, буурахыг илэрхийлдэг

Βi i-р улирлыг 4-р улиралтай харьцуулахад (i = 2, 3, 4)

Page 47: Time series analysis

Улирлын загварыг үнэлэх

Экспоненциал тэгшитгэл:

342312i10i QbQbQbXbb)Ylog(

Энд b0 = log(β0)-ийн үнэлгээ,

b1 = log(β1) -ийн үнэлгээ,

гэх мэт…

0

bβ10 0

1

b β10 1

Page 48: Time series analysis

Тайлбар

Chap 16-48

= улиралд хэдэн хувиар өсөх, буурахыг харуулдаг

= 1-р улирлыг бусад улиралтай харьцуулаха хэдэн %-аар

өсөх буурах

= 2-р улирлыг бусад улиралтай харьцуулаха хэдэн %-аар

өсөх буурах

= 3-р улирлыг бусад улиралтай харьцуулаха хэдэн %-аар

өсөх буурах

%100)1β( 1

Page 49: Time series analysis

Жишээ

Тэгшитгэл нь:

321ii .022Q.073QQ082..017X3.43)Ylog(

b0 = 3.43, so

b1 = .017, so

b2 = -.082, so

b3 = -.073, so

b4 = .022, so

53.2691β10 0

b0

040.1β10 1

b1

827.0β10 2

b2

845.0β10 3

b3

052.1β10 4

b4

Page 50: Time series analysis

Жишээ

Тайлбар:

53.2691β0

040.1β1

827.0β2

845.0β3

052.1β4

Эхний жилийн эхний улиралын засварлагдаагүй

тренд утга

4.0% = улирал тутамд хувиар өснө.

1-р улиралд 4-р улиралтай харьцуулахад 82.7%-аар

өссөн

2-р улиралд 4-р улиралтай харьцуулахад 84.5% -аар

өссөн

2-р улиралд 4-р улиралтай харьцуулахад 105.2 % -

аар өссөн

Утга:

(үргэлжлэл)

Page 51: Time series analysis

АСУУЛТ

Chap 16-51

Page 52: Time series analysis

АНХААРАЛ ТАВЬСАНД БАЯРЛАЛАА

Chap 16-52