Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Statsionaarsed aegread
Teemad
• Viitajad ja aegridade diferentsimine
• Juhuslikud protsessid ja nende karakteristikud
• Range ja nõrk statsionaarsus
• Autokorrelatsioon ja selle testimine
• ARIMA mudelid
• Box-Jenkinsi metoodika
• Prognoosimine ja prognooside hindamine
Aegridade analüüs.
• Ei ole seletavaid tunnuseid, st ei uurita muutuste põhjuseid.
– Analüüs põhineb majandusprotsesside inertsusel.
• Ühemõõtmeline modelleerimine (univariate modelling): meil
on ainult ühe tunnuse muutus ajas.
– VAR mudelite korral ka mitmemõõtmeline modelleerimine
• Eesmärgid:
– Lühiajaline prognoosimine (ARIMA mudelid, veaparandusmudelid
ECM)
– Statsionaarsuse määramine, trendi kindlakstegemine (ühikjuure
testid)
– Pikaajaliste seoste leidmine (kointegratsioon)
Põhilised teisendused
• Viitaegade leidmine
• Diferentsimine
– 1. ja kõrgemat järku diferentsid
– sesoonsed diferentsid
• Logaritmimine (naturaallogaritm)
• Diferentsid logaritmidest
• Eesmärgiks on trendi ja sesoonsuse
eemaldamine
Viitaeg ja diferentsid
• Aegrea yt esimest järku viitajaks (lag) nimetatakse aegrida yt-1
• k-ndat järku viitaeg on aegrida yt-k
• Aegrea esimest järku diferents on aegrea järjestikuste liikmete vahe
1 ttt yyy
211
2 2 tttttt yyyyyy
• Aegrea teist järku diferents on aegrea järjestikuste esimest järku diferentside vahe
1 1
1.k k k
t t ty y y
• k-ndat järku diferents on järjestikuste k-1 järku diferentside vahe
• Sesoonseks diferentsiks nimetatakse aegrea aastast muutu.
44 ttt yyyKvartaalsete andmete korral
1212 ttt yyyKuiste andmete korral
Näide: keskmine brutopalk EestisAasta,
kvartal
Brutopalk,
kr 1. järku diferents
Sesoonne diferents
1. järku diferentsidest
2004: 1 6748
2004: 2 7417 669=7417-6748
2004: 3 7021 -396=7021-7417
2004: 4 7704 683
2005:1 7427 -277
2005: 2 8291 864 195=864-669
2005: 3 7786 -505 -1369
… …. … …
Trend on,
sesoonsus on
Trendi ei ole,
sesoonsus säilis
Jäi vaid juhuslik
komponent
Näide: USA SKP 1800-2009
Aasta
SKP,
mld $ Logaritm
Logaritmi
1. järku diferents
2000 11226 ln 11226= 9,326
2001 11347 ln 11347= 9,337 9,337 - 9,326 = 0,011
2002 11553 ln 11553= 9,355 9,355 - 9,337 = 0,018
… …. … …
Jäi vaid juhuslik
komponent
Eksponentsiaalne
trend
Lineaarne
trend
logaritmime
diferentsime
JUHUSLIKUD PROTSESSID JA
STATSIONAARSUS
Stohhastiline ehk juhuslik protsess
Stohhastiline - juhuslik, tõenäone
Kreeka k. stokhos sihtmärk, stokhastikos õigesti oletatav
Juhuslik suurus Y võib erinevatel ajamomentidel
omada erineva tõenäosusega erinevaid väärtusi.
● Võimalikud olekud
(väärtused) konkreetsel
ajamomendil. Punkti
suurus näitab oleku
tõenäosust.
juhuslik
u s
uuru
se v
äärt
used
aeg
1 2 3 4 5
Võimalike olekute järjestus
annab trajektoori ehk
juhusliku protsessi mingi
kindla realisatsiooni
Juhusliku protsessi erinevad realisatsioonid
Aeg t
Uurida saame vaid juhusliku protsessi üht konkreetset
realisatsiooni. Selle põhjal peame tegema järeldusi
genereeriva protsessi kohta.
Läbilõikeandmed Aegread
Kogum Genereeriv protsess
Valim Realisatsioon
Näide: USA SKP 1970-1991
milj
ard
it U
SD
1975. a I kv väärtus võib olla suvaline arv, mis sõltub paljudest
valitsevatest majanduslikest ja poliitilistest tingimustest.
3154,1 mld USD on nende kõikvõimalike väärtuste üks konkreetne
realisatsioon.
Olulisemad juhuslikud protsessid
Valge müra (white noise) tu
, ) 0t t iCov u u (
Igal ajahetkel “starditakse” ühest
ja samast kohast. “Ei mäleta”,
kuhu jõudis eelmisel ajahetkel.
Mäluta protsess.
Juhuslik ekslemine (random walk)
1t t ty y u Igal järgmisel ajahetkel “starditakse”
sealt, kuhu jõuti eelmisel ajahetkel.
“Mäletatakse” eelmist positsiooni.
Mäluga protsess.
Näide: valge müra aktsiaturgudel
-8
-6
-4
-2
0
2
4
6
20.0
6.2
013
27.0
6.2
013
4.0
7.2
01
3
11.0
7.2
013
18.0
7.2
013
25.0
7.2
013
1.0
8.2
01
3
8.0
8.2
01
3
15.0
8.2
013
Arco Vara aktsia keskmine tulumäär päevas (%) 20.06.2013-21.08.2013 ja juhusliku protsessi poolt genereeritud aegrida.
Arco Vara aktsia Genereeritud
Aritmeetiline keskmine -0,07%, standardhälve 1,96%
100
110
120
130
140
150
160
170
180
3.0
1.2
000
3.0
3.2
000
3.0
5.2
000
3.0
7.2
000
3.0
9.2
000
3.1
1.2
000
3.0
1.2
001
3.0
3.2
001
3.0
5.2
001
3.0
7.2
001
3.0
9.2
001
3.1
1.2
001
TALSE 1.01.2000 - 31.12.2001 ja vastava juhusliku ekslemise realisatsioonid
TALSE väärtus
Realisatsioon 1
Realisatsioon 2
Realisatsioon 3
Näide: juhuslik ekslemine aktsiaturgudel
Juhusliku protsessi karakteristikud
2 2) ( ) ( )
, ) ( )( ) ( , )
t t
t t t
t t i t t i t t i
E y
Var y E y y
Cov y y E y y y y
keskväärtus
dispersioon (
autokovariatsioon (
Keskväärtus iseloomustab keskmist taset.
Dispersioon iseloomustab hajumist.
Kovariatsioon iseloomustab juhusliku suuruse erinevate
väärtuste vahelist statistilist seost.
, ) 0t t iCov y y (Kui siis yt ja yt-i sõltumatud.
Autokovariatsioon:
aegrea korral on erinevateks väärtusteks erinevatele
ajaperioodidele (või momentidele) vastavad väärtused yt ja yt-i
Demo: karakteristikud
Karakteristikud üldiselt muutuvad ajas
Keskväärtus on konstantne,
dispersioon muutub
Keskväärtus muutub
1 2 3 4 5 6 7 aeg t
Mittestatsionaarne protsess
1
1
[ ( )]
[ ( )]
E Y t
Var Y t
Üldiselt on igal ajamomendil erinev tõenäosusjaotus
2
2
[ ( )]
[ ( )]
E Y t
Var Y t
3
3
[ ( )]
[ ( )]
E Y t
Var Y t
4
4
[ ( )]
[ ( )]
E Y t
Var Y t
Juhusliku suuruse Y
tõenäosusjaotus
ajahetkel t
Ansambli ja aegrea keskväärtus
1 1 2 2 1
1 2
1 2 1
Realisatsioon 1 ( ), ( ), , ( )
Realisatsioon ( ), ( ), , ( )
Realisatsioon ( ), ( ), , ( )
m m m
M M M
x t x t x T
m x t x t x T
M x t x t x t
1
1[ ( )] ( )
M
i m i
m
E X t x tM
Ansambli
keskväärtus on
üle erinevate
realisatsioonide.
Ei ole vaadeldav
1 1 2 2 1
1 2
1 2 1
Realisatsioon 1 ( ), ( ), , ( )
Realisatsioon ( ), ( ), , ( )
Realisatsioon ( ), ( ), , ( )
m m m
M M M
x t x t x T
m x t x t x T
M x t x t x t1
1( )
T
m
t
x x tT
Aegrea keskväärtus
on vaadeldav
Range statsionaarsus.
• Modelleerimiseks ja prognoosimiseks on vajalik
statsionaarsus.
• Ranget statsionaarsust on praktikas võimatu kontrollida
Juhuslik protsess on rangelt statsionaarne (strongly
stationary), kui vastava juhusliku suuruse tõenäosusjaotus
ajas ei muutu.
Statsionaarsus kitsamas mõttes.
Nõrk statsionaarsus
Juhuslik protsess on nõrgalt statsionaarne (weakly stationary),
kui tema tõenäosuslikud omadused ei muutu ajas (on ajas
invariantsed):
2 2 2
( ) ( ) ,
( ) ( ) ,
( , ) ( , )
t t m
t t m
t t j t m t m j j
E y E y
y y
y y y y
konstantne keskväärtus
konstantne dispersioon
konstantne autokovariatsioon
Ka
• statsionaarsus laiemas mõttes (stationarity in wide sense)
• kovariantne statsionaarsus (covariance stationarity)
Edaspidi mõeldakse statsionaarsuse all nõrka statsionaarsust
Kovariatsioon sõltub vaid ajamomentide vahest j
Valge müra
Valge müra korral igale ajahetkele t vastavad juhuslikud
suurused ut on
1. üksteisest sõltumatud: Cov(ut,ut-j)=0 iga t ja j≠0 korral
2. konstantse keskväärtusega E(ut) = μ;
3. konstantse dispersiooniga: Var(ut) =σ2
aeg t
ut
Valge müra on statsionaarne protsess.
Aga statsionaarseid protsesse on teisigi.
Valge müra tähtsaim omadus:
autokovariatsiooni puudumine
ehk sõltumatus.
See eristab seda teistest
protsessidest.
AUTOKORRELATSIOON JA
SELLE TESTIMINE
Autokorrelatsioon
Üheks oluliseks aegrea
omaduseks on perioodil t
esineva aegrea väärtuse
sõltuvus varasemate
perioodide väärtustest.
Seda sõltuvust
nimetatakse
autokorrelatsiooniks.
AegAeg
Aeg
Autokorrelatsioon puudubAeg
Aeg
Kuidas hinnata
autokorrelatsiooni
tugevust või selle
puudumist?
Vaja kvantitatiivset
näitajat!
Autokorrelatsioonikordaja
Autokorrelatsiooni mõõdab autokorrelatsioonikordaja (AC)
1
1 n
t
t
y yn
kus keskväärtus
1 1
Kui meil on antud aegrida yt , t=1,2,...,n, siis
saame moodustada n-1 arvupaari (y1, y2), (y2, y3),
..., (yt-1, yt).
Autokorrelatsioonikordaja näitajate yt ja yt-1 vahel:
y1 y2
y2 y3
... ....
yt-1 yt
1
21
2
1
n
t t
t
n
t
t
y y y y
y y
Märkus: See on
ligikaudne valem,
kehtib pikkade
aegridade korral
(n>50)
Millal on autokorrelatsioon positiivne
Aeg
0,992
Aeg
0,990
Autokorrelatsioonikordaja on positiivne, kui
• kasvamisele järgneb kasvamine
• kahanemisele järgneb kahanemine
Aeg
0,763
y t-1
yt
y t-1
yt
Korrelatsioonidiagrammid,
yt-1 ja yt
Millal on autokorrelatsioon negatiivne
Korrelatsioonidiagramm,
yt-1 ja yt
Autokorrelatsioonikordaja on negatiivne, kui
• kasvamisele järgneb kahanemine
• kahanemisele järgneb kasvamine
Aeg
-0,878y t-1
yt
Millal autokorrelatsioon puudub
Korrelatsioonidiagramm,
yt-1 ja yt
Autokorrelatsioon puudub kui
• kasvamisele järgneb
• mõnikord kahanemine
• mõnikord kasvamine
• kahanemisele järgneb
• mõnikord kahanemine
• mõnikord kasvamine
Aeg0,169
y t-1
yt
Kui väike peaks olema
autokorrelatsioonikordaja
absoluutväärtus, et võiksime
öelda:
“autokorrelatsioon puudub”?
Vaja kriteeriumi!Demo: autokorrelatsioon
Autokorrelatsioon ja kõrgemat järku viitajad
Ajamomendile t vastav aegrea väärtus yt võib sõltuda mitte
ainult eelmisele ajamomendile t-1 vastavast väärtusest yt-1,
vaid ka varasematest väärtustest yt-2, yt-3, ...., yt-k,
y
tt-1t-2t-3
Vastavalt
1. järku autokorrelatsioon
2. järku autokorrelatsioon
3. järku autokorrelatsioon
...........
k-ndat järku
autokorrelatsioon
Autokorrelatsioonifuktsioon ACF
1
21
2
1
,
n
t t
t
n
t
t
y y y y
y y
1. järku
autokorrelatsioonikordaja
mõõdab vahetult
järgnevate vaatluste
vahelist korrelatsiooni
1
2
1
n
t t
t k
k
k n
t
t
y y y y
y y
k-ndat järku
autokorrelatsioonikordaja
mõõdab vaatluste yt-k ja yt
vahelist korrelatsiooni
Autokorrelatsioonifunktsioon (ACF) on autokorrelatsiooni-
kordaja sõltuvus viitajast k.
ρ1, ρ2, ρ3 ,…, ρk → ρ(k)
Näide: keskmise palga autokorrelatsiooni
funktsioonAasta,
kvartal yt
yt-1
yt-2
yt-3
yt-4
2004, 1 6748
2004, 2 7417 6748
2004, 3 7021 7417 6748
2004, 4 7704 7021 7417 6748
2005, 1 7427 7704 7021 7417 6748
2005, 2 8291 7427 7704 7021 7417
2005, 3 7786 8291 7427 7704 7021
2005, 4 8690 7786 8291 7427 7704
2006, 1 8591 8690 7786 8291 7427
2006, 2 9531 8591 8690 7786 8291
2006, 3 9068 9531 8591 8690 7786
2006, 4 10212 9068 9531 8591 8690
1. järku 0,524
2. järku 0,566
3. järku 0,144
4. järku 0,144
Autokorrelatsiooni-
kordajad
Autokorrelatsiooni statistilise olulisuse
testimine
• Nullhüpotees: kõik autokorrelatsioonikordajad kuni viitajani k on nullid, – st autokorrelatsioon puudub;
– st genereerivaks protsessiks on valge müra.
• Sisukas hüpotees: esineb autokorrelatsioon
• Testimiseks kasutatavad statistikud– Q statistik (ka Portmanteau statistik, Box-Pierce statistik)
– Box-Ljungi statistik. Sobivam väikeste valimite korral.
• Mõlemad alluvad suurte valimite korral χ2 jaotusele. Vabadusastmete arv = viitaegade arv.
• Kui statistiku väärtus on suurem, kui χ2 kriitiline väärtus (olulisuse tõenäosus on väiksem kui valitud olulisuse nivoo), võtta vastu sisukas hüpotees, autokorrelatsioon esineb.
Box-Ljungi statistik
n – aegrea pikkus, st aegrea väärtuste arv
k – mitmenda viitajani autokorrelatsiooni uuritakse
ρj – j -järku autokorrelatsioonikordaja
2
2
1
( 2) ( )k
j
BL
j
Q n n kn j
Box-Ljungi statistik
Autorid Box ja Ljung (1978)
• Mitmenda viitajani ehk kui suur võtta k väärtus?
• Ühest kriteeriumi ei ole.
• Leitakse statistiku väärtused erinevate viitaegade arvu k
korral. Vaadatakse näiteks, millal autokorrelatsioon
muutub statistiliselt mitteoluliseks.
jaanuar
veebruar
märts
aprill
?
Osaline autokorrelatsioon PACF
• Uurime näiteks, kuidas jaanuarikuu väärtus mõjutab aprillikuu väärtust. St viitaeg on 3.
Osaline autokorrelatsioon mõõdab autokorrelatsiooni yt-k
ja yt vahel, kusjuures vahepealsete väärtuste mõju on elimineeritud.
ρ3
• Selleks leiame vastava autokorrelatsioonikordaja ρ3 .
• Aga: jaanuarikuu väärtus mõjutab ka veebruarikuu väärtust, see omakorda märtsikuu oma, mis omakorda aprilli väärtust.
• ρ3 väärtust mõjutavad ka vahepealsed mõjud, need tuleks elimineerida
• Statistikas on olemas mõiste “osakorrelatsioonikordaja”, mis
mõõdab suuruste x ja y vahelise seose tugevust tingimusel, et
näitajate z1, z2, ..., zm mõju on eemaldatud.
partial autocorrelation
H0, autokorrelatsioon puudub.
Aegrida on genereeritud valge
müra poolt.
tY
olulisuse
tõenäosus
Näide: valge müra
autokorrelatsioonifunktsioon ja Box-Ljungi statistik
Autokorrelatsiooni-
funktsioon
Osalise auto-
korrelatsiooni-
funktsioon
Variable->Correlogram
2
1
( 2)k
j
BL
j
Q n nn j
Näide: juhusliku ekslemise
autokorrelatsioonifunktsioon ja Box-Ljungi statistik
H1: esineb autokorrelatsioon
olulisuse
tõenäosus
Korrelogrammid
Valge müra:
ACF väärtused
on vea piirides
nullid
• Korrelogrammil esitatakse autokorrelatsioonifunktsioon visuaalselt.
• Võimaldab esile tuua tunnuse ajalise käitumise iseloomu, mida on raske
kindlaks teha aegrea enda vaatlemisel.
Viitaeg
AC
F
Juhuslik
ekslemine
ACF nullist erinev,
väheneb aeglaselt
viitaegade
kasvamisel
AC
F
Viitaeg
ARIMA MUDELID
ARMA modelleerimise eesmärk
Aegrea autokorrelatsiooni struktuur püütakse esitada
ARIMA mudeli abil.
See, mis ARIMA mudelist üle jääb, on valge müra.
Põhiliseks kasutusvaldkonnaks on lühiajaline
prognoosimine:• makroökonoomika aegread
• finantsaegread
• ettevõtluses nõudlus
Võetud üle elektriinseneride poolt kasutatud signaalide filtreerimisest, mis töötati
välja 1930-ndatel.
Laiemalt võeti kasutusele pärast G.E.P. Box ja G. Jenkins'i raamatu „Time Series
Analysis: Forecasting and Control“ ilmumist 1971. a.
Libiseva keskmise mudelid MA
Valge müra üldistus: juhuslike liikmete ehk šokkide ut
kaalutud libisev keskmine (moving average, MA)
1 1t t ty u u MA(1), 1. järku libisev keskmine
1 1 2 2t t t ty u u u MA(2), 2. järku libisev keskmine
1 1 ...t t t q t qy u u u
MA(q)
1
q
t t i t i
i
y u u
t iu on valge müra
"Mäletab" eelmisi šokke ut-i
MA liikmete interpretatsioon I
MA kordajad iseloomustavad juhuslike šokkide
mõju järgnevatele aegrea liikmetele.
10,1t t ty u u 10,8t t ty u u
Eelmise šoki ut-1 mõju on väiksem Eelmise šoki ut-1 mõju on suurem
šokid ut
10,1 tu tu
tu10,8 tu
MA liikmete interpretatsioon, II
1 20,8 0,5t t t ty u u u
Mõju avaldavad nii eelmine šokk ut-1 kui ka üle-eelmine šokk ut-2
tu1
0,8
tu
2
0,5
tu
Näide: libiseva keskmise mudelid MA
11 0,6t t ty u u
MA(1) MA(2)
1 21 0,6 0,3t t t ty u u u
MA(q) protsessi karakteristikud
1
q
t t i t i
i
y u u
Keskväärtus ( )tE y
Dispersioon2 2 2
1
( ) ( ) 1q
t t i
i
y u
Konstantne
σ2(ut) konstantne,
järelikult
σ2(yt) konstantne
Kovariatsioon
2
1
1 ,cov( , )
0,
q
i i k
i kt t k
k qy y
k q
Konstantne
MA(q) protsess on statsionaarne
Autoregressiivsed mudelid AR
1 1 2 2t t t ty c y y u
2. järku autoregressiivne mudel AR(2)
1 1 2 2 ...t t t p t p ty c y y y u
Autoregressiivne mudel: aegrea liikmed sõltuvad
eelnevatest liikmetest (viitaegadest)
1 1t t ty c y u 1. järku autoregressiivne mudel AR(1)
1
p
t i t t
i
ic yy u
AR(p)
tu on valge müra
"Mäletab" eelmisi väärtusi yt-i
AR liikmete interpretatsioon
• Autoregressiivsus tähendab, et esineb nö "taastav jõud",
mis sunnib aegrida pöörduma tagasi keskväärtuse poole
(mean reversion).
• Keskväärtusele lähenemise kiiruse määrab AR kordajate
summa. Kui kordajate summa on
– väike, toimub tagasipöördumine kiiresti;
– suur, toimub tagasipöördumine aeglasemalt.
10,19t t ty y u
10,91t t ty y u
keskväärtus
kiiresti
aeglaselt
Näited: autoregressiivsed mudelid
11 0,6t t ty y u
AR(1)
1 21 0,6 0,3t t t ty y y u
AR(2)
AR(p) protsessi keskväärtus
Keskväärtus
1
( )
1
t p
i
i
cE y
1
1 0p
i
i
Kui nimetaja , siis keskväärtus pole defineeritud
Sellisel juhul ühikjuure protsess, mittestatsionaarne
1 1 2 2 ...t t t p t p ty c y y y u
Millal on AR protsess statsionaarne?
AR(p) protsessi statsionaarsuse tingimus
1 1 2 2 ...t t t p t p ty c y y y u
Karakteristlik võrrand 2
1 21 ... 0p
p
Karakteristliku võrrandi juured (lahendid) 1 2, ,..., p (üldiselt kompleksed)
AR(p) protsess on statsionaarne, kui kõik karakteristlikud juured asuvad
väljaspool ühikringi.
Vt õpik Brooks lk 217 näide 5.3
Im
Re
1
Ühikring komplekstasandil
AR(1) protsessi statsionaarsuse tingimus
1 1t t ty c y u AR(1)
11 0 Karakteristlik
võrrand1
1
Lahend
AR(1) protsess on statsionaarne, kui |ϕ1|<1
1
11 1
Tingimus Väljaspool ühikringi
Näited: statsionaarsed ja
mittestatsionaarsed AR(1) protsessid
10,5t t ty y u
10,5t ty y
10,5t t ty y u
10,5t ty y
11,05t t ty y u
11,05t ty y 11,05t t ty y
11,05t ty y
Mittestatsionaarsed
Statsionaarsed
Demo: AR statsionaarsus
Autoregressiivsed libiseva keskmise mudelid
ARMA(p,q)
1 1 1 1t t t ty c y u u
1 1t t ty c u u 1 1t t ty c y u
MA(1)AR(1)
ARMA(1,1)
Esimest järku autoregressiivne libiseva keskmise mudel
1 1
1 1
...
...
t t p t p
t t q t q
y c y y
u u u
(p,q) järku autoregressiivne libiseva keskmise mudel
ARMA(p,q)
p järku autoregressiivne
komponent
q järku libiseva keskmise
komponent
Demo: ARMA(1,1)
Olulisemad ARMA (p,q) mudelid
Mudel Tähistus Valem
Valge müra ARMA(0,0)
1. järku
autoregressiivne AR(1)
ARMA(1,0)
2. järku
autoregressiivne AR(2)
ARMA(2,0)
1. järku libisev
keskmine MA(1)
ARMA(0,1)
2. järku libisev
keskmine MA(2)
ARMA(0,2)
1. järku
autoregressiivne
libisev keskmine
ARMA(1,1)1 1 1 1t t t ty c y u u
1 1 2 2t t t ty c u u u
1 1t t ty c u u
1 1 2 2t t t ty c y y u
1 1t t ty c y u
t ty c u
Integreeritud protsess
• Protsess on 1-st järku integreeritud, kui protsess on
mittestatsionaarne, aga selle 1. järku diferentside
aegrida on statsionaarne.
– Tähistus I(1)
• Protsess on k-ndat järku integreeritud (integrated of
order k), kui protsessi k-ndat järku diferents on
statsionaarne protsess.
– st statsionaarsuse saavutamiseks tuleb k korda diferentsida
– tähistus I(k)
• Kui protsess on statsionaarne, st statsionaarsuse
saavutamiseks pole vaja diferentsida, on I(0) protsess
Integreeritud AR mudelid
1 1 1 2(1 )t t t ty c y y u ARI(1,1)
Kui aegrea 1. järku diferentsid on kirjeldatavad AR(1)
mudeli abil
Kui aegrea statsionaarsuse saavutamiseks tuleb seda
diferentsida 2 korda, esitab aegrida mudel ARI(1,2)
Üldiselt ARI (p,d)
siis aegrida ise on genereeritud autoregressiivse
protsessi ARI (1,1) poolt ja on esitatav järgmiselt
1 1t t ty c y u
Integreeritud MA mudelid
Kui aegrea 1. järku diferentsid on kirjeldatavad MA(1)
mudeli abil
siis aegrida ise on genereeritud autoregressiivse
protsessi IMA (1,1) poolt ja on esitatav järgmiselt
1 1t t ty c u u
1 1 1t t t ty c y u u
Kui aegrea statsionaarsuse saavutamiseks tuleb seda
diferentsida 2 korda, esitab aegrida mudel IMA(2,1)
Üldiselt IMA(d,q)
IMA(1,1)
ARIMA: Integreeritud ARMA mudelidAutoregressiivsed integreeritud libiseva keskmise mudelid
ARIMA(p,d,q)
p autoregressiivse osa järk
d diferentside järk
q libiseva keskmise järk
• Kui aegrida vajab diferentsimist, siis diferentsitakse seda
(tavaliselt 1 või 2 korda) ja diferentsidele rakendatakse
sobivat ARMA(p,q) mudelit.
• d järku diferentside ARMA(p,q) mudel on ekvivalentne
ARIMA(p,d,q) mudeliga
Näited
ARIMA(1,1,0) 1. järku diferentside aegrida on AR(1) tüüpi
ARIMA(0,2,2) 2. järku diferentside aegrida on MA(2) tüüpi
BOX - JENKINSI METOODIKA
Box - Jenkinsi metoodika
Box ja Jenkins (1970) pakkusid välja ARMA mudelite jaoks süstemaatilise lähenemise:
1. Mudeli identifitseerimine, st ARMA järkude (p,q) kindlaks määramine• korrelogrammide abil
• informatsioonikriteeriumi abil
2. Mudeli parameetrite hindamine
3. Mudeli adekvaatsuse hindamine (diagnostika)– kas parameetrid on statistiliselt olulised
– kas jäägid moodustavad valge müra (jääkide autokorrelatsiooni testimine)
Aegrida
Mudeli identifitseerimine ja
parameetrite hindamine
Kas on
statsionaarne?
Mudeli
adekvaatsuse
kontroll
Jah
Jah
Prognoosimine
Ei
Ei
Diferentside
leidmine
Box-Jenkinsi
metoodika
Mudeli identifitseerimine
• Otsustatakse– Kas on vaja aegrida diferentsida ja kui, siis mitu korda
– Mitmendat järku autoregressiivset (AR) ja libiseva keskmise (MA) operaatorit kasutada.
• Tavaliselt üks valik 5-st võimalusest: AR(1), AR(2), MA(1), MA(2), ARMA(1,1)
• AR ja MA valikul võib tugineda– Aegrea autokorrelatsiooni (ACF) ning osalise
autokorrelatsiooni funktsioonile (PACF) ja vastavate korrelogrammide visuaalsele uurimisele
– Informatsioonikriteeriumitele: valitakse mudel, mille korral vastav näitaja on väikseim
Demo: korrelogrammid
AR(1) ja AR(2) korrelogrammidAR(1)
ACF: Koefitsiendid
vähenevad
aeglaselt 0-ni
PACF: Viitajaga 1
koefitsient suur,
teised ca 0.
ACF: Koefitsiendid
vähenevad
aeglaselt 0-ni
PACF: Viitaegadega
1 ja 2 koefitsiendid
suured, teised ca 0.
AR(2)
MA(1) ja MA(2) korrelogrammidMA(1)
ACF: Viitajaga 1
koefitsient suur,
teised ca 0
PACF: Koefitsiendid
vähenevad aeglaselt
0-ni
ACF: Viitajaga 1 ja
2 koefitsiendid
suured, teised ca 0
PACF: Koefitsiendid
vähenevad aeglaselt
0-ni
MA(2)
ARMA mudeli valik korrelogrammide põhjal
Mudel ACF PACF
AR(1), β1>0 Eksponentsiaalne
vähenemine 0-ni
Viitajaga 1 koefitsient suur,
teised ca 0
AR(1), β1<0 Ostsilleeruv vähenemine 0-ni Viitajaga 1 koefitsient suur
AR(p) Eksponentsiaalne või
ostsilleeruv vähenemine 0-ni
Viitajani p koefitsiendid
nullist erinevad.
MA(1), θ1>0 Viitajaga 1 koefitsient suur,
teised ca 0
Ostsilleeruv vähenemine 0-ni
MA(1), θ1<0 Viitajaga 1 koefitsient suur Eksponentsiaalne
vähenemine 0-ni
MA(2) Viitajaga 1 ja 2 koefitsiendid
suured, teised ca 0
Eksponentsiaalne või
ostsilleeruv vähenemine 0-ni
ARMA(1,1) Eksponentsiaalne või
ostsilleeruv vähenemine 0-ni
Eksponentsiaalne või
ostsilleeruv vähenemine 0-ni
Kokkuvõte: AR ja MA järkude määramine
ACF ja PACF järgi
Autoregressiivne protsess AR
• eksponentsiaalselt või ostsilleeruvalt kahanev ACF
• oluliselt nullist erinevad PACF väärtused annavad AR järgud
Libiseva keskmise protsess MA
• eksponentsiaalselt või ostsilleeruvalt kahanev PACF
• oluliselt nullist erinevad ACF väärtused annavad MA järgud
PROBLEEM: tihti pole ACF ja PACF graafikute järgi
võimalik mudelit üheselt identifitseerida. Siis abiks
informatsioonikriteeriumid.
InformatsioonikriteeriumidAkaike Information Criteria
Paremaks loetakse mudelit, mille korral AIC on väiksem.
2 2ˆln
k
T AIC
ln(σ2) vähenemist kompenseerib k/T suurenemine. Kui 2. liidetava 2k/T
suurenemine ületab ln (σ2) vähenemisest saadava efekti, siis AIC
summaarselt suureneb. Siis ei ole mudelisse uue liikme lisamine õigustatud.
k - hinnatavate parameetrite arv, ARMA(p,q) mudeli korral k=p+q+1,
T valimi maht (aegrea pikkus)
2ˆSSE
T kus SSE jääkliikmete ruutude summa Jääkliikmete dispersioon
Akaike
informatsioonikriteerium
2ˆ( ) ln lnk
k TT
BIC
Schwarzi kriteerium SIC (ka BIC ehk Bayesi informatsioonikriteerium)
Uute liikmete lisamise suhtes
“kriitilisem”, kui AIC, sest teine liidetav
suureneb kiiremini
Näide valik AIC ja BIC põhjal
p/q 0 1 2 3 4
0 610,7 607 585,3 585,5 586,2
1 601,7 588,5 583,6 579,6 581,5
2 581,4 583,3 585 581,5 583,5
3 583,2 585 586,8 580,1 580,6
4 584,9 587 580,6 579,9 580,9
AIC
p/q 0 1 2 3 4
0 614 616,8 598,5 601,9 605,7
1 611,6 601,6 600 599,3 604,5
2 594,5 600 604,6 604,5 609,7
3 600 604,7 609,8 606,3 610,1
4 604,6 609,9 606,8 609,4 580,9
BIC
ARIMA(4,3)
ARIMA(4,4)
ARMA mudeli parameetrite hindamine
• Pärast mudeli identifitseerimist viiakse läbi mudeli
parameetrite hindamine
• Mudeli diagnostika
– Kas parameetrite hinnangud on statistiliselt olulised?
– Kas mudeli jääkliikmed (residuals) moodustavad valge müra?
• leitakse jääkliikmete ACF ja PACF ning uuritakse vastavaid
korrelogramme
• valge müra test Box-Jungi statistiku Q põhjal
– Kas jääkliikmed alluvad normaaljaotusele?
• Eesmärgiks on ARMA mudelisse koondada aegrea
autokorrelatsiooni struktuur, et järele jääks ainult valge
müra
Näide: majade hinnad UK-s
40
60
80
100
120
140
160
180
200
92 94 96 98 00 02 04 06
HP
Jaanuar 1991 – mai 2007
tuh G
BP
Allikas: Brooks, Introductory
Econometrics for Finance
Hind HP, tuh GBP
Mittestatsionaarne aegrida
T=197
ukhp.gdt
Mittestatsionaarse aegrea korrelogramm: ACF väheneb väga aeglaselt
Näide: majade hinnad UK-s,
muutus protsentides
-3
-2
-1
0
1
2
3
4
92 94 96 98 00 02 04 06
DHP
Hinna muutus protsentides
Statsionaarne aegrida
T=196
ukhp.gdt
1
100tt
t
HPDHP
HP
Näide: majade hinnad UK-s,
DHP korrelogrammid
ACF väheneb
ostsilleerudes,
järelikult AR
tüüpi
PACF-l kaks
tippu, järelikult
AR(2)
ukhp.gdt
Näide: majade hinnad UK-s,
AR(2) mudeli aruanneKesk-
väärtus μ
Kordajate
Φ1 ja Φ2
hinnangud
ukhp.gdt
Karakteristliku
võrrandi juuredJuurte absoluutväärtused (moodulid) >1,
järelikult statsionaarne
Näide: majade hinnad UK-s,
AR(2) mudeli aruanneAegrea
(realisatsiooni)
keskväärtus Kordaja
Standard-
viga z-statistik
Olulisuse
tõenäosus p
Jääkliikmete ehk
šokkide u keskväärtus
kordaja
standardvigaz
Schwarzi
informatsioonikriteerium
Jääkliikmete u
standardhälve
Akaike
informatsioonikriteerium
ukhp.gdt
Näide: majade hinnad UK-s,
AR(2) mudeli kirjutamine
NB! See on
keskväärtus μ
1 1 2 2t t t ty c y y u AR(2) mudeli üldkuju
1 20,319 0,168 0,330t t t ty y y u
1
1
1
1
p
ipi
i
i
cc
AR(p)
keskväärtuse
valemist
0,635701 1 0,168334 0,329653 0,319c Arvuta-
me c
ukhp.gdt
Näide: majade hinnad UK-s,
jääkliikmete autokorrelatsiooni testimine
Valge müra kuni
viitajani 26
PROGNOOSIMINE
Prognoosimine ja tinglik keskväärtus
Tähistame kogu informatsiooni, mis on teada ajahetkeks tt
Seda informatsiooni kasutades saame leida aegrea tingliku
keskväärtuse ajahetkel t+1
1 |t tE y
Ajahetkel t tehtud prognoos (forecast) F on tinglik keskväärtus,
sõltub ajahetkeks t teadaolevast informatsioonist.
,1 1 |t t tF E y 1 samm edasi
, |t h t h tF E y h sammu edasi
Eeldame, et genereeriv protsess on hinnatud, st
1. korrelatsiooni struktuur on teada;
2. parameetrid on hinnatud.
Aegrida 1 2{ , ,..., }t TY y y y
Prognoosimine MA mudeli korralMA(3) mudel
1 1 2 2 3 3t t t t ty u u u u Erineva pikkusega prognoosid ajahetkel t.
,1 1 1 2 1 3 2
,2 2 2 3 1
,3 3 3
,4 4
,5 5
|
|
|
|
|
....
t t t t t t
t t t t t
t t t t
t t t
t t t
F E y u u u
F E y u u
F E y u
F E y
F E y
, | ,t h t h tF E y h q
Kui prognoosime kaugemale, kui MA protsessi järk q, on prognoosiks
protsessi keskväärtus:
MA protsessi mälu pikkus on q perioodi. See määrab ära prognoosi horisondi.
Prognoosimine AR mudeli korral
1 1 2 2t t t tc uy y y Näiteks AR(2) mudel
,2 ,3 1, 3 1 2| t tt t tE c F FF y
Prognoosimisel
kasutatakse eelmisi
prognoose
Erineva pikkusega prognoosid ajahetkel t.
,1 1 1 2 1|t tt t tF E cy y y
,1,2 2 1 2|t t tt tFE cF y y
Staatiline ja dünaamiline prognoosimine
• Dünaamiline prognoosimine
– Aluseks olemasolevad tegelikud väärtused + eelnevalt
prognoositud väärtused
– Prognoositakse väärtusi, mis pole teada (praktiline
vajadus)
• Staatiline prognoosimine
– Ühesammuline prognoosimine
– Järgmise väärtuse prognoosimiseks võetakse aluseks
eelmised aktuaalsed väärtused.
– Võimalik ainult valimi sees (in sample)
– Kasutatakse mudeli prognoosimisvõime hindamiseks
Näide: staatiline ja dünaamiline
prognoosimineMajade hinnad UK-s, hinna muutus protsentides. Aegrida kuni 05.2007.
Prognoos kuni 10.2007
tegelik aegrida
prognoos
staatiline
prognoosimine
dünaamiline
prognoosimine
06 100501
2007
Prognoosi punkthinnang ja vahemikhinnang
, |t h tt hEF y punkthinnangVahemikhinnang: antakse
prognoosi usalduspiirid
95%-lise usaldatavusega.
Prognoosi
standardviga
Prognooside hindamine prognoosivea järgi
1
1 T
t
t
ME uT
2
1
1 T
t
t
MSE uT
2
1
1 T
t
t
RMSE uT
1
1| |
T
t
t
MAE uT
Mean Error, keskmine viga
Mean Square Error, keskmine ruutviga
Mean Absolute Error, keskmine absoluutviga
Root Mean Square Error, juuritud keskmine
ruutviga
1
1100
Tt
t t
uMPE
T y
1
| |1100
Tt
t t
uMAPE
T y
Mean Percentage Error, keskmine suhteline
viga, protsentides
Mean Absolute Percentage Error, keskmine
suhteline absoluutviga, protsentides
Iseloomustab prognoosi nihet: üles või alla
Näide: Eesti THI 1998-2012
Modelleeriti 1. järku diferentse.
AR(1) AR(2)
Akaike ik 347,86
1. Mõlema mudeli korral jääkliikmetel autokorrelatsioon puudub 12. viitajani
2. Jääkliikmed ei allu normaaljaotusele.
Schwarzi ik 357,42 *
345,53 *
358,28
Prognoos
mõnevõrra parem
Theil'i U (programmis Gretl)
21
1
21
1
1
1
1
1
1
Tt
t t
Tt
t
t
t
t y
T yU
y
T y
F
y
Naiivne prognoos: 1t ty y
Kui palju on mudeli abil tehtud prognoos parem naiivsest prognoosist?
Mingi mudeli abil saadud prognoos Ft
Theil, H. (1966) Applied Economic Forecasting, Amsterdam: North-Holland
U > 1 mudeli abil tehtud prognoos on halvem, kui naiivne prognoos
U =1 mudeli abil tehtud prognoos on sama, mis naiivne
U < 1 mudeli abil tehtud prognoos on parem, kui naiivne prognoos
mudeli abil tehtud prognoosi põhjal
naiivse prognoosi põhjal
NÄIDE: USA tööstustoodangu indeksUSA tööstustoodangu indeks kvartalite kaupa.
Modelleerimiseks kasutatud ajavahemik 1961:1 – 1998:3
Modelleeritud indeksi logaritmi sesoonseid diferentse
ip.gdt
Mudel ARMA(2,0)
Mudel ARMA(2,5)
Prognoos parem kui naiivne
Prognoos halvem kui naiivne