54
제5장 시계열분석 제5장 시계열분석

제5장 시계열분석elearning.kocw.net/contents4/document/lec/2013/Konku… ·  · 2014-01-24시계열분석의개요(the nature of time series analysis) §시계열분석(time

Embed Size (px)

Citation preview

5장

시계열분

5장

시계열분

시계열분 의 개요(the nature of time series analysis)§ 시계열자료(time series data)

• 연도별(annual), 분 별(quarterly), 월별(monthly), 일별(daily) 는 시간별(hourly) 등 시간의 경과(흐름)에 라

로(ordered in time) 는 자료를 시계열자료(time series data)라 함.

• : 국내 생산(GDP), 가지 , 매량, 종합주가지(KOSPI), 강우량, 태양 흑 , 실험 자료 등

• 시계열들 생 는 특 에 라 연속 로 생 는 연속시계열(continuous time series)과 이산 시 에 생

는 이산시계열(discrete time series)로 구분할 있음.

• 그러나 실 로는 많 시계열들이 연속 로 생 고 있지만 일 한 시차를 두고 므로 이산시계열의 태를지니는 경우가 많음.

5장 시계열분

시계열분 의 개요(the nature of time series analysis)§ 시계열자료(time series data)

• 시계열자료(time series data)들 시간의 경과에 라자료이므로 시간에 향을 음.

• 라 시계열자료를 분 할 때 시 들 간의 시차(time lag)가 요한 역할을 함.

• 를 들어 늘의 주가가 한달 , 일주일 의 주가보다는 어 의 주가에 더 많 향을 는 것과 마찬가지로 가까운 시 일 록 자료들 간에 상계가 커짐.

• 시계열 일 로 시간 t를 하첨자로 하여 다음과 같이표 .

{Zt: t=1, 2, 3, ×××} 는 Z1, Z2, Z3, ×××

5장 시계열분

시계열분 의 개요(the nature of time series analysis)§ 시계열분 (time series analysis)의 목

• 과거 시계열자료의 (pattern)이 미래에도 지속 로지 다는 가 하에 재까지 집 자료들을 분 하

여 미래에 한 (forecast)을 하는 것임.

• 를 들어 과거부 집 어 어떤 상품의 매출액자료를 분 하면 미래의 매출액을 할 있음.

• 시계열자료가 생 시스템 는 확률과 을 모 화하여시스템 는 확률과 을 이해하고 어(control)할 있도록 하는 것임.

• 를 들어 원료가 입 어 품이 생산 는 시스템을모 화할 있 면 품의 목표값(target value)을 달

하 해 원료를 어떻게 입 시키는 것이 가장 최인지를 알아낼 있음.

5장 시계열분

시계열의 태(the components of time series)§ 시계열분 시 우 행 어야 할 일 시계열그림(time series

plot)을 그 보는 것임.

• 시계열그림 시간의 경과에 라 시계열자료의 값이 변하는 것을 나타낸 그림 로 시간 t를 가로축, 시계열의 값Zt를 로축에 나타냄.

• 이 그림을 도출하는 이 는 시계열의 특징을 쉽게 악할있어 해당 자료에 합한 분 법의 택에 도움이때 임.

• 일 로 시계열에 나타나는 변동 로는 우연 로생하는 불규칙변동(irregular variation)과 체계 변동

(systematic variation)을 들 있음.

5장 시계열분

시계열의 태(the components of time series)• 불규칙변동(irregular variation 는 확률 변동 : random

variation) 시계열자료에 시간에 른 규칙 인 움직임과는 달리 어떤 규칙 이 없이 이 불가능하게 우연로 생하는 변동을 말함.

• : 쟁, 홍 , 화재, 지진, 업 등

• 체계 변동에는 장 간에 걸쳐 어떤 추 로 나타나는 추변동(trend variation), 추 을 라 주 로 르고 내림을 복하는 환변동(cyclical variation), 그리고 계요인이 작용하여 1년 주 로 나타나는 계 변동(seasonal variation)이 있음.

5장 시계열분

시계열의 태(the components of time series)§ 불규칙변동(irregular variation or random variation)

5장 시계열분

시계열의 태(the components of time series)§ 추 변동(trend variation)

• 추 변동이란 시계열자료가 갖는 장 인 변화추 임.

• 추 란 장 간에 걸쳐 지속 로 증가 는 감소하거나는 일 한 상태(stationary)를 지하 는 향을 의미함.

• 그러므로 시계열자료에 짧 간 동안에는 추 변동을찾 어 움.

• 라 추 변동 짧 간 동안 격하게 변동하는 것이아니라 장 인 추 경향이 나타나는 것 로 직 이나 부드러운 곡 의 연장 로 표시함. 이러한 추 는 직 뿐만아니라 곡 , S자 태의 추 를 가질 도 있음.

• : 국내 생산(GDP), 인구증가 , 변화 등

5장 시계열분

시계열의 태(the components of time series)§ 추 변동(trend variation)

5장 시계열분

시계열의 태(the components of time series)§ 환변동(cyclical variation)

• 추 변동 장 로(일 로 1년 과) 나타나는 추경향이지만, 환변동 체로 2~3년 도의 일 한

간을 주 로 환 로 나타남.

• 즉, 1년 이내의 주 로 곡 을 그리며 추 변동에 라 변동하는 것을 말함.

• 시간의 경과(흐름)에 라 상하로 복 는 변동 로 추을 라 변화하는 것이 환변동임.

• 경 변동곡 (business cycle curve) 불황과 경 회복, 황과 경 후퇴로 인하여 년을 주 로 나타나고 있는데환변동을 나타내는 좋 임.

• : 경 변동 등

5장 시계열분

시계열의 태(the components of time series)§ 환변동(cyclical variation)

5장 시계열분

시계열의 태(the components of time series)§ 계 변동(seasonal variation)

• 시계열자료에 보통 계 향과 사회 습에 라 1년 주 로 생하는 변동요인을 계 변동이라 하고, 보통계 에 라 환하며 변동하는 특 을 지님.

• : , 추 등 명 요인 등

• 그런데 계 변동이 환변동과 다른 환주 가 짧다는 임.

Ø그러나 부분의 경 시계열들 추 계 요인을동시에 포함함.

• 이는 경 장에 라 화 의 매액, 해외여행자 , 청량음료, 소비량 등과 같이 계 상품 매량 자료들이 시간의 변화에 라 증가하 때 임.

5장 시계열분

시계열의 태(the components of time series)§ 계 변동(seasonal variation)

5장 시계열분

시계열의 태(the components of time series)§ 추 계 변동요인을 갖는 시계열

5장 시계열분

시계열의 태(the components of time series)§ 시간의 변화에 라 변동폭이 커지는 시계열

5장 시계열분

시계열의 태(the components of time series)§ 두 개의 추 을 갖는 시계열

5장 시계열분

시계열의 태(the components of time series)§ 시계열자료가 앞의 변동요인 로 구 다면 이들 간의 계는가법모 (additive model)이나 승법모 (multiplicative model)

로 나타낼 있음.

• 가법모 심변 의 값인 Zt가 앞의 가지 시계열변동요인의 합 로 명 있다는 가 하에 만들어진 모

을 말함.

Zt=Tt+Ct+St+Rt

여 Tt는 추 변동, Ct는 환변동, St는 계 변동, Rt는불규칙변동임.

• 이 같 가법모 변동요인들 간에 로 독립이라고 가하며, 각 변동요인들의 값들 원래 단 (unit)로 표 함.

5장 시계열분

시계열의 태(the components of time series)• 승법모 심변 의 값인 Zt가 앞의 가지 시계열변동요인의 곱 로 명 있다는 가 하에 만들어진 모

을 말함.

Zt=Tt×Ct×St×Rt

여 Tt는 추 변동, Ct는 환변동, St는 계 변동, Rt는불규칙변동임.

• 이 같 승법모 추 변동의 값만 원래 단 (unit)로표 하고, 나 지 변동요인들 분 (%) 는 비 로 표

함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 단 이동평균법(simple moving average method)

• 비교 간단한 시계열분 법 의 하나로 최근 몇개 값의 단 평균값을 다음 간의 값 로 추

하는 법임.

• 이는 시계열자료에 계 변동(St)과 불규칙변동(Rt)을거하여 추 변동(Tt)과 환변동(Ct)만 가진 시계열

자료로 변환하는 평활법(smoothing method)임.

Mt=

• 최근 n개의 값 Zt, Zt-1, ×××, Zt-n+1을 이용하여 계산한이동평균임(® 값에 동일한 가 치를 부여함).

• Mt는 다음 시 (t+1)의 값(Ft+1) 로 이용 .

5장 시계열분

Zt+Zt-1+ ××× +Zt-n+1

n

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 단 이동평균법(simple moving average method)

• 단 이동평균법 값을 계산하 해 사용하는과거 값의 개 로 그 종류가 구분 .

• 를 들어 n=3이면 3 간 단 이동평균(M3), n=5이면5 간 단 이동평균(M5), n=10이면 10 간 단 이동평균(M10)임.

• 이동평균법을 이용할 때 해결해야 하는 가장 요한는 이동평균을 계산하 해 사용하는 과거자료의

개 , 즉 n의 개 를 결 하는 것임.

• 일 로 시계열자료에 뚜 한 추 가 나타나 있거나 불규칙변동이 심하지 않 경우에는 작 n의 개를 사용하고, 그 지 않 경우에는 n의 개 를 크게 함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 함 마법사를 활용하여 함 인 ‘AVERAGE’를 택함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• C5 의 식을 작 열십자(+)가 나타나게 한 후 드래그함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• D10 의 식을 작 열십자(+)가 나타나게 한 후드래그함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• B4:D14 역을 지 한 후 삽입-차트의 꺾 을 클릭함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 이번에는 Excel의 분 도구를 이용하여 보다 쉽게 할있음.

• 단 이동평균법을 분 하 하여 Excel의 데이 -데이분 을 택함.

• 그리고 통계 데이 분 의 업창에 ‘이동 평균법’을택하고 확인을 클릭함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 입 범 에는 값을 지 하고, 를 들어 3 간 이동평균이면 구간에 ‘3’을 입 한 후 출 범 를 지 함(차트를출 하고자 할 경우 차트 출 을 클릭함).

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 단 이동평균법(simple moving average method)

• 한편, 차를 비교하여 가장 확한 값을 공하도록 n의 개 를 결 하 도 함.

• 이때 차를 비교하는 로 평균 편차(mean absolute deviation : MAD) 평균 곱 차(mean squared error : MSE)가 사용 .

• 평균 편차(MAD)는 t 의 값과 t 의 값에한 값간 차이(=et) 값의 평균을 말함.

MAD= =

여 et는 차로 (t 값-t 값)임.

5장 시계열분

St=1®T |t 값-t 값|

T

St=1®T |et|

T

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 단 이동평균법(simple moving average method)

• 평균 곱 차(MSE)는 t 의 값과 t 의값간 차이 곱값의 평균을 말함.

MSE= =

여 T는 (비교) 간 임.

• 이상의 차인 평균 편차(MAD) 평균 곱차(MSE)를 비교하여 차가 작 경우의 n의 개로 택하는 것이 람직함.

5장 시계열분

St=1®T (t 값-t 값)2

T

St=1®T (et)2

T

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 다음 각각의 차를 구함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 각각의 차를 구하면 다음과 같음.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 각각의 차를 로 MAD MSE는 다음과 같음.

5장 시계열분

6주부 10주까지 3주 이동평균에 의한차의 MAD MSE가 5주 이동평균에

의한 MAD MSE보다 작음. 라 11주차의 매출액의 값 1,650만원을 사용하는 것이 타당함(여 T=5임).

165

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 단 이동평균법(simple moving average method)

• 단 이동평균법의 단 로는 다음과 같음.

• 첫째, 이동평균법 n개의 최근 자료로 다음 간의 자료를 하는 계산 법상의 특 때 에 처음의 일부 간에 한 값을 구할 없 며,

한 구간에 포함 지 않 이 의 자료는 시 .

• 둘째, 이동평균의 간 n이 짝 인 경우 이동평균법 로 계산하면 이동평균에 응하는 시 에

가 생함.

• 를 들어 4 간 이동평균을 계산하면 첫 번째이동평균뿐만 아니라 다른 이동평균도 실 시계열 간(연, 월, 일 등)의 간에 치하게 .

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 단 이동평균법(simple moving average method)

• 라 이동평균의 간이 짝 인 경우 인 한두 이동평균의 평균을 계산하여 이동평균을심화하는 심이동평균(centered moving average)을 구함.

Mt*=

5장 시계열분

Zt-0.5*+Zt+0.5*

2

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• n=짝 인 경우 심이동평균(centered moving average)

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• n=짝 인 경우 심이동평균(centered moving average)

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 단 이동평균법(simple moving average method)

• 셋째, 이동평균의 계산에 사용 는 값들에해 동일한 가 치를 용하여 최근 자료 래자료의 요 을 동일시하고 있다는 임. 즉, 불규칙변동요인이 나타나는 경우 확하게 추출하어 움.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 이동평균법(moving average method)

• 가 이동평균법(weighted moving average method)

• 값에 라 가 치를 다르게 한 이동평균법임.

• 가 평균이동법의 다른 요소는 단 이동평균법과 동일하지만 값마다 다른 가 치를 용한다는 것이 차이임.

Mt=w1Zt +w2Zt-1+ ××× +wnZt-n+1

여 wi는 해당 간 가 치(0<wi<1), Si=1®n wi=1임.

• 최근 n개의 값 Zt, Zt-1, ×××, Zt-n+1에 각각 다른 가 치를 용하여 계산한 이동평균임.

• Mt는 다음 시 (t+1)의 값(Ft+1) 로 이용 .

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 과거의 모든 자료를 사용하여 평균을 구하면 최근의 자료에 더 높 가 치를 부여하는 법임.

• 단 간에 생하는 동이나 충격을 완화하는 평활법(smoothing method)임.

Ft=αZt-1+(1-α)Ft-1

여 Ft는 t 간의 값, Ft-1는 t-1 간의 값, Zt-1는t-1 간의 실 값, α는 지 평활계 (0<α<1)임.

• 지 평활법에 의 지 평활계 α는 가 치 역할을 하는것 로 불규칙변동이 큰 자료에 는 작 값의 α를 용하고, 불규칙변동이 작 자료에 는 큰 값의 α를 용함.

• 일 로 α는 0.05 0.3 사이의 값을 사용함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 지 평활법 이동평균법과 마찬가지로 차를 비교하여 차가 작 α값을 택하는 것이 람직함.

• 지 평활법에 가 치는 과거로 갈 록 지 로 감소하게 .

• 그러므로 지 평활법에 는 최근 과거값( 재시 의값)에 가장 큰 가 치를 부여하므로 일종의 가 이동평균법이라 할 있음.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 우 , 지 평활법을 분 하 하여 여 는 α=0.1과α=0.9인 경우의 값을 구해보 로 함.

• 지 평활법을 분 하 하여 Excel의 데이 -데이 분을 택함.

• 그리고 통계 데이 분 의 업창에 ‘지 평활법’을택하고 확인을 클릭함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 입 범 에는 값을 지 하고, 감쇠 인 에는 ‘1-α’값을입 한 후 출 범 를 지 함.

5장 시계열분

Excel에 (1-α)를 ‘감쇠 인 ’라고 부르며, 그 값을 입 해야 함.여 주의해야 할 α=0.1을 사용하고자 하는 경우에는 감쇠 인 를 0.9를 입 해야 하고, α=0.9를 사용하고자 하는 경우에는감쇠 인 를 0.1을 입 해야 함.

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 입 범 에는 값을 지 하고, 감쇠인 에는 ‘1-α’값을입 한 후 출 범 를 지 함.

5장 시계열분

Excel에 (1-α)를 ‘감쇠 인 ’라고 부르며, 그 값을 입 해야 함.여 주의해야 할 α=0.1을 사용하고자 하는 경우에는 감쇠 인 를 0.9를 입 해야 하고, α=0.9를 사용하고자 하는 경우에는감쇠 인 를 0.1을 입 해야 함.

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• B4:D14 역을 지 한 후 삽입-차트의 꺾 을 클릭함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 다음 각각의 차를 구함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 각각의 차를 구하면 다음과 같음.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 각각의 차를 로 MAD MSE는 다음과 같음.

5장 시계열분

169

6주부 10주까지 α=0.9인 경우 지 평활법에의한 차의 MAD MSE가 α=0.1인 경우지 평활법에 의한 MAD MSE보다 작음. 라 11주차의 매출액의 값 1,690만원을사용하는 것이 타당함(여 T=5임).

시계열분 의 법(methods of time series analysis)§ 지 평활법(exponential smoothing method)

• 지 평활법 이동평균법과 마찬가지로 불규칙변동의향을 약화시키는 효과가 있지만, 단 로는 장 추 나 계

변동이 포함 시계열의 에는 합하지 않음.

• 앞에 의 분 결과를 보면 장 증가추 를 별도로 고하지 않 때 에 부분의 값들이 매출액에 못

미치는 것을 알 있음.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 계 변동을 포함한 시계열의

• 추 의 자료의 변동을 하나의 직 로 간단히 나타내 때 에 장 추 의 에는 장 을 가지지만, 계변동이나 환변동을 포함하는 시계열자료에는 하지않음.

• 계 지 는 100을 로 특 계 과 다른 계 의 변동을 비교하여 차이를 단하는 척도임.

• 를 들어 1/4분 의 계 지 가 120이라면 1/4분 매출액이 분 별 평균 매출액의 120%가 을 의미함.

• 계 지 는 평균 계 지 가 1이 도록 조 하여 얻어짐.

• 즉, 각 분 평균의 합이 4가 도록 조 어야 하 때에 계 지 는 평균에 조 요인을 곱하여 계산함.

5장 시계열분

시계열분 의 법(methods of time series analysis)§ 계 변동을 포함한 시계열의

• 다음과 같이 분 치를 심이동평균값 로 나 어 계치(St)를 구함.

계 치(St)=

• 계 지 를 이용한 시계열 다음과 같 과 을 거쳐행함.

• 이동평균을 이용하여 계 지 를 생 함.

• 계 을 거한 자료를 이용하여 추 을 추 함.

• 미래에 한 추 값을 구함.

• 추 값에 계 지 를 곱하여 최종 값을 구함.

5장 시계열분

4

S1+S2+S3+S4