Upload
ora
View
55
Download
2
Embed Size (px)
DESCRIPTION
ANALÝZA ČASOVÝCH RADOV. Hydrológia. Financie a ekonómia. Geodézia. Množinu náhodných premenných {X( , t), , t T } kde je výberový priestor a T R + je indexová množina nazývame stochastický proces. Mnohorozmerný stochastický proces je množina náhodných vektorov - PowerPoint PPT Presentation
Citation preview
ANALÝZA ČASOVÝCH RADOV
HydrológiaHydrológia
Financie a ekonómiaFinancie a ekonómiaNezamestnanosť Slovensko
0
5
10
15
20
25
I.93 I.95 I.97 I.99 I.01 I.03 I.05 I.07
mesiac
%
Inflácia Slovensko
0
5
10
15
20
25
30
I.93 I.95 I.97 I.99 I.01 I.03 I.05 I.07
mesiac
%
GeodéziaGeodézia
Množinu náhodných premenných
{X(, t), , t T }
kde je výberový priestor a T R+ je indexová množina nazývame stochastický processtochastický proces.
Mnohorozmerný stochastický proces je množina náhodných vektorov
{XX(, t), , t T }.
-1
4
9
14
19
24
29
34
39
44
49
Rok
Mie
ra i
nfl
áci
e
Česko Maďarsko Poľsko Slovensko
2
4
6
8
10
12
14
16
18
20
Rok
Mie
ra
neza
mest
na
no
sti
Česko Maďarsko Poľsko Slovensko
0
10000
20000
30000
40000
50000
60000
70000
80000
90000
rok
HD
P v
miló
no
ch
Eu
ro
Česko Maďarsko Poľsko Slovensko
Pre každé t T je X(., t) náhodná premenná definovaná na výberovom priestore . Pre každé je X(, .) jedna realizácia stochastického procesu definovaná na indexovej množine T, t. j. usporiadaná postupnosť čísiel, z ktorých každé odpovedá jednej hodnote indexovej množiny.
V prípade, že T obsahuje len konečne, resp. spočitateľne veľa hodnôt, hovoríme o stochastickom procese s diskrétnym časomstochastickom procese s diskrétnym časom.
Diskrétny časový rad tvorí množina pozorovaní {x1,x2,…,xn}, získaných v rovnakých časových intervaloch. Je to jedna realizácia stochastického procesu {X1, X2, …, Xt, ...}. Počet pozorovaní sa nazýva dĺžka časového radu n.
Hlavnou úlohou analýzy časových radov je nájsť model dostatočne
priliehavo aproximujúci pozorované údaje a potom (podľa možnosti)
predpovedať budúce hodnoty.
Charakteristiky stochastického procesu {Xt, t 0}
Stredná hodnota:
Rozptyl (druhý centrálny moment):
Šikmosť (tretí centrálny moment):
Špicatosť (štvrtý centrálny moment):
Kovariančná funkcia (r, s):
Korelačná funkcia (r, s):
sr
srsr
ssrrsr
4tt
)4(t
3tt
)3(t
2ttt
2t
tt
XDXD
)X,Xcov(X,Xcorr
XXE)X,Xcov(
XE
XE
XEXD
XE
Stochastický proces je striktne stacionárny, ak sa jeho štatistické vlastnosti v čase nemenia (t. j. rozdelenia pravde-podobnosti sú invariantné v čase).
n
ttX 1
STACIONÁRNE STOCHASTICKÉ PROCESYSTACIONÁRNE STOCHASTICKÉ PROCESY
Stochastický proces je slabo (kovariančne) stacionárny,
ak:
1.t = E(Xt) = , 2t = D(Xt) =E(Xt - t )2 = 2
pre t = 1, ..., n
2. (s, r) = cov(Xs, Xr) = E[(Xs - s)(Xr - r)] je len funkciou (s – r), t. j. ako sú od seba Xs, Xr v čase vzdialené a nie od toho, na akom úseku časovej osi sa nachádzajú.
Rozdiel s – r nazývame posunutie a budeme ho označovať k
n
ttX 1
Stochastický proces je striktne stacionárny, ak pre každú podmnožinu (t1, t2, ..., tn) indexovej množiny T a každé reálne číslo h R také, že tj + h T, j = 1, 2, ..., n sú združené distribučné funkcie vektorov
rovnaké.
n
ttX 1
hththtttt n21n21X,,X,XX,,X,X a
Stacionárny proces s = 0 nazývame centrovaný.
Výberové charakteristiky stacionárneho Výberové charakteristiky stacionárneho stochastického procesu stochastického procesu {X{Xt, t, t t 0} 0}
Výberový priemer (odhad strednej hodnoty):
Výberový rozptyl (odhad disperzie 2):
Výberová šikmosť (odhad šikmosti (3)):
Výberová špicatosť (odhad špicatosti (4)):
n
1ttx
n
1x
n
1t
3t
s
xx
n
1
n
1t
4t
s
xx
n
1
Príkazy na výpočet vPríkazy na výpočet výberovýberovýchých charakterist charakteristíík k
v systv systéémeme MathematicaMathematica
Výberový priemer (odhad strednej hodnoty): MeanMean[rad][rad]
Výberový rozptyl (odhad disperzie 2): Variance[rad]Variance[rad]
Štandardná odchýlka (odhad ): StandardDeviationStandardDeviation[[radrad]]
Výberová šikmosť (odhad šikmosti (3)): Skewness[rad]Skewness[rad]
Výberová špicatosť (odhad špicatosti (4)): Kurtosis[rad]Kurtosis[rad]
Ako prvé nahráme súbory na analýzu časových radov:
<<timeseri\\datasmoo.m <<timeseri\\datasmoo.m
<<timeseri\\timeseri.m <<timeseri\\timeseri.m
<<timeseri\\userfunc.m<<timeseri\\userfunc.m
V systéme Mathematica počítame autokorelačnú funkciu až do k-teho stupňa príkazom: CorrelationFunction[rad, k]CorrelationFunction[rad, k]Výberová autokorelačná funkcia rk =
n
1t
2t
kn
1tktt
xx
xxxx
0
k
Graf autokorelačnej funkcie pre k ≥ 0 sa nazýva korelogram.
Vlastnosti (k) a rk
1. r0 = 1
2. | (k) | (0); | rk | 1
3. (k) = (-k); rk = r-k k Z
V systéme Mathematica počítame autokovariančnú funkciu až do k-teho stupňa príkazom: CovarianceFunctionCovarianceFunction [rad, k][rad, k]
Výberová autokovariančná funkcia (k)
kn
1tktt xxxx
Tvar autokorelačnej funkcie je veľmi dôležitý, pretože identifikuje príslušný lineárny model. Významná je predovšetkým hodnota k0, po ktorej už môžeme autokorelačnú funkciu považovať za nulovú. Ak existuje také k0, že pre všetky k > k0 je (k) = 0, potom je rozptyl výberovej autokorelačnej funkcie rk pre k > k0 daný Bartlettovou aproximáciou (za predpokladu normality uvažovaného procesu):
D(rk) =
n
r2r21 2k
21 0
Rozptyly autokorelácií r1, r2, ..., rk, ...
n
rr 21rD,,
n
r21rD ,
n
1rD
21k
21
k
21
21
Parciálna autokorelačná funkciaParciálna autokorelačná funkcia
Koreláciu premenných Xt a Xt-k očistenú o vplyv premenných medzi nimi Xt-1, …, Xt-k+1 nazývame parciálna autokorelačná funkcia. Počítame ju ako podmienenú strednú hodnotu :
k, k = E[ (Xt - ) (Xt-k - ) | Xt-1, …, Xt-k+1 ]
Výberová parciálna autokorelačná funkcia rk,k s posunutím k vyjadruje parciálny regresný koeficient k, k v autoregresii k-teho rádu:
Xt = k, 1 Xt-1 + … + k, k Xt-k + et
kde et je premenná nekorelovaná s náhodnými premennými Xt-j, j 1.
V systéme Mathematica počítame parciálnu autokorelačnú funkciu až do k-teho stupňa príkazom:
PartialCorrelationFunction[rad, k]PartialCorrelationFunction[rad, k]
Náhodný proces {Zt, t Z} tvorený nekorelovanými náhodnými premennými rovnakého pravdepodobnostného rozdelenia s konštantnou strednou hodnotou E(Zt) = (obyčajne = 0) a konštantným rozptylom D(Zt) = 2 sa nazýva proces bieleho
šumu.
Proces bieleho šumu (White Noise)Proces bieleho šumu (White Noise)
Z definície vyplýva, že proces bieleho šumu je stacionárny s autokorelačnou funkciou
a parciálnou autokorelačnou funkciou
0k0
0k1k
0k0
0k1k,k
PoznámkaPoznámka: Často budeme používať pojem postupnosť nezávislých postupnosť nezávislých
rovnako rozdelených náhodných premennýchrovnako rozdelených náhodných premenných (i. i. di. i. d), čo nie je
ekvivalentné procesu bieleho šumu.
Proces bieleho šumu sa nazýva Gaussovský, ak je jeho združené
rozdelenie pravdepodobnosti normálne rozdelenie. Pokiaľ nepovieme
ináč, budeme vždy uvažovať gaussovský biely šum.
Ak chceme rozhodnúť, či je (k) = 0, k 0, porovnáme hodnotu |rk| s
číslom . Využíva sa pritom asymptotická normalita odhadu rk a
pravidlo, že normálna náhodná premenná s nulovou strednou
hodnotou prekročí v absolútnej hodnote dvojnásobok svojej
smerodajnej odchýlky s približne 5%-nou pravdepodobnosťou. .
n
2
Nech Zt je proces bieleho šumu s nulovou strednou hodnotou, t. j.
(k) = 0, k 0. Potom sú rozptyly výberovej autokorelácie
aproximované hodnotami . n
1
DEKOMPOZÍCIA ČASOVÉHO DEKOMPOZÍCIA ČASOVÉHO RADURADU
Trend TTrend Ttt
Sezónna zložka SSezónna zložka Stt
Cyklická zložka CCyklická zložka Ctt
Reziduálna zložka eReziduálna zložka ett
Trend zachycuje dlhodobé zmeny v priemernom správaní sa časového radu (napr. dlhodobý rast alebo dlhodobý pokles). Vzniká ako dôsledok síl, ktoré systematicky pôsobia v rovnakom smere.
TrendTrendTrendTrend
a)a) Izolovanie trendu - vyrovnávanie (smoothing) časového radu Izolovanie trendu - vyrovnávanie (smoothing) časového radu
1) Subjektívne metódy: pre dlhé časové rady môžeme tvar trendu určiť z grafického zná- zornenia časového radu. Tieto metódy sú nedostačujúce, pretože nedávajú postačujúci základ pre konštrukciu predpovedí. Mali by sa však použiť pri predbežnej analýze časového radu, kedy je nutné rozhodnúť o výbere nejakej inej, objektívnejšej metódy
2) opis trendu matematickými funkciami (analytický popis trendu) : Pri takto odhadnutom trende môžeme ľahko vypočítať jeho budúce hodnoty (t. j. konštruovať predpovede budúcich hodnôt trendovej zložky, ak sa jej charakter v čase nezmení). Výber vhodnej funkcie závisí predovšetkým od grafického priebehu pôvodných empirických hodnôt časového radu a od výsledkov rozboru prvých, druhých, resp. ďalších diferencií v časovom rade.
TrendTrend- pokra- pokračovaniečovanieTrendTrend- pokra- pokračovaniečovanie
b) Mechanické vyrovnávanie časových radov:b) Mechanické vyrovnávanie časových radov:
Používame adaptívny prístup k trendovej zložke. Vo všeobecnosti ho používame pri takých trendoch, ktoré menia v čase globálne svoj charakter, takže pre ich opis nemôžeme použiť žiadnu matematickú funkciu s nemennými parametrami. Na druhej strane sa však predpokladá, že v krátkych časových úsekoch časového radu je vyrovnanie pomocou matematických kriviek možné, aj keď tieto krivky majú obyčajne v rôznych časových úsekoch odlišné parametre.
Výhodou adaptívnych metód je, že proces eliminácie trendovej zložky sa adaptuje na okamžitý lokálny priebeh radu, konštrukcia predpovede pružne reaguje na časové zmeny v charaktere radu a v neposlednom rade je výhodou adaptívnych metód aj výpočtová jednoduchosť.
5 prvkov12 prvkov
Využívajú sa pri nej kĺzavé priemery, čo sú priemery počítané vždy z obdobia určitej dĺžky (z určitého počtu hodnôt), pričom toto obdobie sa posunuje (“kĺže”). Pri vhodnej voľbe dĺžky kĺzavého obdobia sa dá ich aplikáciou odstrániť sezónnosť. Použitím kĺzavých priemerov strácame časť hodnôt na začiatku a na konci časového radu, pretože pre krajné pozorovania nemáme z čoho počítať priemery. Pri voľbe dĺžky kĺzavého obdobia treba brať do úvahy periódu sezónnych alebo cyklických fluktuácií, ktoré chceme z radu vyhladiť. Teda pri mesačných pozorovaniach sa odporúča dĺžka kĺzavého obdobia 12, pri kvartálnych 4 a pod.
3 prvky
1) Metóda kĺzavých priemerov
TrendTrend- pokra- pokračovaniečovanieTrendTrend- pokra- pokračovaniečovanie
Postup pre výpočet exponenciálneho vyrovnania je nasledovný:Zvolíme váhu w (0, 1). Táto voľba je veľmi dôležitá. Obyčajne sa volí w 0.7, 1). Pri menšom w metóda rýchlo reaguje na zmeny v charaktere časového radu, pri väčšom w sa zosilní vyrovnávacia schopnosť metódy.Exponenciálne vyrovnaný časový rad Ft vypočítame z pôvodného časového Yt nasledovne:
F1 = Y1; F2 = (1 - w) * Y2 + w * F1;
.
.
.Ft = (1 - w) * Yt + w * Ft-1.
2) Exponenciálne vyrovnávanie
TrendTrend- pokra- pokračovaniečovanieTrendTrend- pokra- pokračovaniečovanie
Dĺžka kĺzavých priemerov podstatne ovplyvňuje trendovú zložku, určuje sa však väčšinou subjektívne. Metóda exponenciálneho vyrovnávania tento problém odstraňuje - výpočet každej vyrovnanej hodnoty je založený na všetkých dostupných minulých pozorovaniach časového radu. Každá staršia hodnota sa pritom berie s menšou váhou, pričom hodnoty váh smerom do minulosti exponenciálne klesajú.
W = 0,2
W = 0,8
TrendTrend- pokra- pokračovaniečovanieTrendTrend- pokra- pokračovaniečovanie
Budeme používa analytickýanalytický popis trendu (t. j. matematickými funkciami).
Pri tomto prístupe sa obyčajne predpokladá, že analyzovaný časový má tvar
Xt = Tt + et
alebo bol na tento tvar upravený (predovšetkým sezónnym očistením). Tento predpoklad nám umožní použiť na odhad parametrov trendovej krivky lineárnu, resp. nelineárnu regresiu.
V ďalšom nech n je dĺžka časového radu.
a) Konštantný trend:
Trend - pokraTrend - pokračovaniečovanieTrend - pokraTrend - pokračovaniečovanie
Pre tento trend typuTt = 0, t = 1, …, n
dostávame jednoduchý odhad b0 parametra 0 pomocou vzťahu:
n
1t
t0 n
xxb
.
Konštantný trend používame, ak xt+1 - xt 0.
b) Lineárny trend:
Tt = 0 + 1 t, t = 1, …, n
kde odhady koeficientov 0, 1 dostaneme použitím lineárnej regresie. Lineárny trend používame, ak sú prvé diferencie xt+1 - xt približne konštantné.
.
Trend - pokraTrend - pokračovaniečovanieTrend - pokraTrend - pokračovaniečovanie
100 200 300 400 500 600 700time Day
15
10
5
5
10
15
mm
suradnica sever juh n
c) Kvadratický trend:
Tt = 0 + 1 t + 2 t2 , t = 1, …, n
Odhady koeficientov 0, 1, 2 dostaneme opäť použitím lineárnej
regresie. Kvadratický trend používame, ak sú druhé diferencie, t. j.
xt+2 - 2 xt+1 + xt
približne konštantné. .
Trend - pokraTrend - pokračovaniečovanieTrend - pokraTrend - pokračovaniečovanie
5 10 15 20 25
0 .0 2
0 .0 4
0 .0 6
0 .0 8
0 .1 0
= 0.1, = 0.8
d) Exponenciálny trend:
Ak je 0, potom pre 1 dochádza k rastu, zatiaľ čo pre 0 1
nastáva pokles. Parametre a odhadneme pomocou nelineárnej
regresie. Exponenciálny trend používame, ak sú podiely po sebe
idúcich členov časového radu xt+1 / xt približne konštantné.
.
Trend - pokraTrend - pokračovaniečovanieTrend - pokraTrend - pokračovaniečovanie
Tento typ trendu sa používa na opísanie modelu rastu nových produktov, spoločností alebo priemyslu. Model trendu je rozdelený do troch častí: začiatok, rast, stav nasýtenia. Čas je reprezentovaný od dní cez mesiace až do rokov, v závislosti od stavu trhu. Je zrejmé, že tento model nemôžeme opísať ani lineárnym ani kvadratickým trendom. Vtedy používame exponenciálny trend, ktorý je opísaný funkciou:
.0 n, , 1, t ,T tt
5 10 15 20 25
0 .2
0 .4
0 .6
0 .8
1 .0
= 0.1, = 1.1
e) Logistický trend:
.
Trend - pokraTrend - pokračovaniečovanieTrend - pokraTrend - pokračovaniečovanie
Tento trojparametrový trend je opísaný funkciou:
0β n, , 1, t ,βα1
Ttt
Kritérium pre jeho použitie je, aby podiely
(1/xt+2 - 1/xt+1) / (1/xt+1 - 1/xt)
boli približne konštantné.
Schematicky je znázornený (pre = 1, = 30, = 0.95) Logistický trend má inflexný bod (t. j. zmenu konvexného priebehu na konkávny) v bode
t = - log / log a je asymptoticky ohraničený hodnotou .
1983 1984 1985 1986 1987 1988time Year200
400
600
800
1000
počet 1000
Sezónna zložkaSezónna zložkaSezónna zložkaSezónna zložka
KORELOGRAM
Sezónna zložka opisuje periodické zmeny v časovom rade, ktorých perióda sa rovná určitej štandardnej jednotke času alebo jej konštantnému násobku (zachycuje zmeny, ktoré sa pravidelne opakujú). Dĺžka periódy sa určuje z korelogramu.
Rozbor eliminovanej sezónnej zložky môže podstatne rozšíriť naše vedomosti o zákonitostiach správania sa určitého javu a prispieť ku konštrukcii dokonalejších predpovedí u uvažovaného časového radu. Ďalším dôležitým cieľom je tiež získanie sezónne očisteného časového radu, z ktorého bola sezónna zložka odstránená alebo aspoň potlačená na maximálne možnú mieru. Sezónne očistený časový rad zbavený sezónnych a náhodných fluktuácií umožňuje efektívnejšie štúdium dlhodobých tendencií, ktorým je priebeh časového radu podriadený.
Sezónna zložka - pokračovanieSezónna zložka - pokračovanieSezónna zložka - pokračovanieSezónna zložka - pokračovanie
Na určenie sezónnej zložky budeme používať regresné metódy založené na teórii lineárneho regresného modelu.
1. Metóda kvalitatívnych premenných. Ak na každý rok pripadne L pozorovaní (sezón) príslušného časového radu (napr. pri mesačných časových radoch L = 12, pri kvartálnych L = 4), potom pri tejto metóde vyjadrujeme sezónnu zložku v tvare:
St = 2 Y2t + 3 Y3t + … + L YL t
kde Y2t, Y3t, …, YL t sú kvalitatívne premenné, ktoré sú definované
nasledujúcim spôsobom:
pre i = 2, 3, …, L.
roku v období inom v0
roku v obdobiu vému- 1)-(i odpovedá t časak 1Yt
Sezónna zložka - pokračovanieSezónna zložka - pokračovanieSezónna zložka - pokračovanieSezónna zložka - pokračovanie
V systéme Mathematica realizujeme model sezónnej zložky s periódou L (a počtom opakovaní M) metódou kvalitatívnych premenných nasledujúcou postupnosťou príkazov:
f[i_, k_, t_] := If [(i – 1 + k*L) t < (i + k*L), 1, 0]
x[i_, t_] := Sum[f[i, k, t], {k, 0, M - 1}]
funkcie = Table[ x[i, t], {i, 2, L}];
regkp = Regress[dáta, funkcie, t]
Sezónna zložka - pokračovanieSezónna zložka - pokračovanieSezónna zložka - pokračovanieSezónna zložka - pokračovanie
2. Pomocou vhodne zvolenej matematickej funkcie. Najčastejšie sa používajú goniometrické funkcie s dĺžkou periódy L : sin(2 t/L), cos(2 t/L). Sezónna zložka môže byť napr. vyjadrená v tvare:
St = 0 + 1 sin(2 t/L) + 2 cos(2 t/L).
1985 1990 1995 2000 2005time Month
5
10
15
f low m3sKvalitatívne premenné
1985 1990 1995 2000 2005time Month
5
10
15
f low m3sGoniometrické funkcie
Cyklická zložka je periodická zložka, ktorej perióda nezodpovedá kalendárnym jednotkám. Je to nepravidelná fluktuácia okolo trendu, v ktorej sa strieda fáza rastu s fázou poklesu. Odhaduje sa metódami spektrálnej analýzy. .
Cyklická zložkaCyklická zložkaCyklická zložkaCyklická zložka
PERIODOGRAM
6
2
3
2000
4000
6000
8000
10 000
f
Časové rady spravidla obsahujú reziduálnu zložku. Okrem nej môžu (ale nemusia) obsahovať aj jednu, dve alebo všetky tri systematické zložky.
Aditívna dekompozícia:Aditívna dekompozícia:
Xt = Tt + St + Ct + et
Multiplikatívna dekompozícia:Multiplikatívna dekompozícia:
Xt = Tt . St . Ct . et
Reziduálna zložka ostane v časovom rade po odstránení systematických zložiek. Je tvorená fluktuáciami v priebehu časového radu, ktoré nemajú rozpoznateľný systematický charakter.
Postup pri analýze časových radovPostup pri analýze časových radov
V prípade, že časový rad obsahuje trend, určíme ho regresnou analýzou.
Spektrálnou analýzou určíme významné frekvencie pre cyklickú zložku, ktorú potom vypočítame regresnou analýzou ako súčet sínusov a cosínusov.
Z reziduí vypočítame autokorelačnú funkciu a z nej odčítame periódu sezónnej zložky (ak existuje). Sezónnu zložku potom určíme regresnou analýzou.
Vykreslíme dáta, tvoriace časový rad. Takto získame základ-nú predstavu o charaktere časového radu. V prípade nejas-ných časových radov testami náhodnosti určíme, či časový rad obsahuje trend, resp. periodické zložky.
Testovaním nulovosti autokorelačnej funkcie rk overíme, či môžeme reziduálnu zložku považovať za proces bieleho šumu.
Ak reziduálnu zložku tvoria navzájom korelované náhodné premenné, použijeme na jej modelovanie Box – Jenkinsovu metodológiu (lineárne modely ARMA v stacionárnom prípade), integrované modely ARIMA, resp. modely s dlhou pamäťou ARFIMA (v nestacionárnom prípade) alebo moderné nelineárne modely (modely s premenlivými režimami a pod.).
Výsledný model môžeme použiť na popisné účely, resp. na predpovedanie budúcich hodnôt časového radu - prognózo-vanie.
Postup pri analýze časových radovPostup pri analýze časových radov
LITERATÚRA
HIPEL, K. W. - McLEOD A. I. (1992) Time Series Modelling of Water Resources and Enviromental Systems. In: Handbook of Hydrology (D. R. Maidment, editor), Elsevier
SALAS, J. D. - DELLEUR, J. W. - YEVJEVICH, V. - W. L. LANE (1980) Applied modelling of hydrological time series. Water Resources Publications, Littleton, Colorado
CIPRA, T. (1986) Analýza časových řad s aplikacemi v ekonomii. SNTL, ALFA Praha
ARTL, J. (1999) Moderní metody modelování ekonomických časových řad. GRADA Publ.
ARTL, J. – ARTLOVÁ, M. (2003) Finanční časové řady – Vlastnosti, metody modelování, příklady a aplikace, GRADA Publ.
FRANSES, P. H. (1998) Time series models for business and economic forecasting. Cambridge University Press.
FRANSES, P. H. – VAN DIJK, D. (2000) Non – linear time series models in empirical finance. Cambridge Univ. Press