Statsionaarsed aegread · 2018. 4. 27. · Osaline autokorrelatsioon PACF • Uurime näiteks, kuidas jaanuarikuu väärtus mõjutab aprillikuu väärtust. St viitaeg on 3. Osaline

Statsionaarsed aegread

Teemad

• Viitajad ja aegridade diferentsimine

• Juhuslikud protsessid ja nende karakteristikud

• Range ja nõrk statsionaarsus

• Autokorrelatsioon ja selle testimine

• ARIMA mudelid

• Box-Jenkinsi metoodika

• Prognoosimine ja prognooside hindamine

Aegridade analüüs.

• Ei ole seletavaid tunnuseid, st ei uurita muutuste põhjuseid.

– Analüüs põhineb majandusprotsesside inertsusel.

• Ühemõõtmeline modelleerimine (univariate modelling): meil

on ainult ühe tunnuse muutus ajas.

– VAR mudelite korral ka mitmemõõtmeline modelleerimine

• Eesmärgid:

– Lühiajaline prognoosimine (ARIMA mudelid, veaparandusmudelid

ECM)

– Statsionaarsuse määramine, trendi kindlakstegemine (ühikjuure

testid)

– Pikaajaliste seoste leidmine (kointegratsioon)

Põhilised teisendused

• Viitaegade leidmine

• Diferentsimine

– 1. ja kõrgemat järku diferentsid

– sesoonsed diferentsid

• Logaritmimine (naturaallogaritm)

• Diferentsid logaritmidest

• Eesmärgiks on trendi ja sesoonsuse

eemaldamine

Viitaeg ja diferentsid

• Aegrea yt esimest järku viitajaks (lag) nimetatakse aegrida yt-1

• k-ndat järku viitaeg on aegrida yt-k

• Aegrea esimest järku diferents on aegrea järjestikuste liikmete vahe

1 ttt yyy

211

2 2 tttttt yyyyyy

• Aegrea teist järku diferents on aegrea järjestikuste esimest järku diferentside vahe

1 1

1.k k k

t t ty y y

• k-ndat järku diferents on järjestikuste k-1 järku diferentside vahe

• Sesoonseks diferentsiks nimetatakse aegrea aastast muutu.

44 ttt yyyKvartaalsete andmete korral

1212 ttt yyyKuiste andmete korral

Näide: keskmine brutopalk EestisAasta,

kvartal

Brutopalk,

kr 1. järku diferents

Sesoonne diferents

1. järku diferentsidest

2004: 1 6748

2004: 2 7417 669=7417-6748

2004: 3 7021 -396=7021-7417

2004: 4 7704 683

2005:1 7427 -277

2005: 2 8291 864 195=864-669

2005: 3 7786 -505 -1369

… …. … …

Trend on,

sesoonsus on

Trendi ei ole,

sesoonsus säilis

Jäi vaid juhuslik

komponent

Näide: USA SKP 1800-2009

Aasta

SKP,

mld $ Logaritm

Logaritmi

1. järku diferents

2000 11226 ln 11226= 9,326

2001 11347 ln 11347= 9,337 9,337 - 9,326 = 0,011

2002 11553 ln 11553= 9,355 9,355 - 9,337 = 0,018

… …. … …

Jäi vaid juhuslik

komponent

Eksponentsiaalne

trend

Lineaarne

trend

logaritmime

diferentsime

JUHUSLIKUD PROTSESSID JA

STATSIONAARSUS

Stohhastiline ehk juhuslik protsess

Stohhastiline - juhuslik, tõenäone

Kreeka k. stokhos sihtmärk, stokhastikos õigesti oletatav

Juhuslik suurus Y võib erinevatel ajamomentidel

omada erineva tõenäosusega erinevaid väärtusi.

● Võimalikud olekud

(väärtused) konkreetsel

ajamomendil. Punkti

suurus näitab oleku

tõenäosust.

juhuslik

u s

uuru

se v

äärt

used

aeg

1 2 3 4 5

Võimalike olekute järjestus

annab trajektoori ehk

juhusliku protsessi mingi

kindla realisatsiooni

Juhusliku protsessi erinevad realisatsioonid

Aeg t

Uurida saame vaid juhusliku protsessi üht konkreetset

realisatsiooni. Selle põhjal peame tegema järeldusi

genereeriva protsessi kohta.

Läbilõikeandmed Aegread

Kogum Genereeriv protsess

Valim Realisatsioon

Näide: USA SKP 1970-1991

milj

ard

it U

SD

1975. a I kv väärtus võib olla suvaline arv, mis sõltub paljudest

valitsevatest majanduslikest ja poliitilistest tingimustest.

3154,1 mld USD on nende kõikvõimalike väärtuste üks konkreetne

realisatsioon.

Olulisemad juhuslikud protsessid

Valge müra (white noise) tu

, ) 0t t iCov u u (

Igal ajahetkel “starditakse” ühest

ja samast kohast. “Ei mäleta”,

kuhu jõudis eelmisel ajahetkel.

Mäluta protsess.

Juhuslik ekslemine (random walk)

1t t ty y u Igal järgmisel ajahetkel “starditakse”

sealt, kuhu jõuti eelmisel ajahetkel.

“Mäletatakse” eelmist positsiooni.

Mäluga protsess.

Näide: valge müra aktsiaturgudel

-8

-6

-4

-2

0

2

4

6

20.0

6.2

013

27.0

6.2

013

4.0

7.2

01

3

11.0

7.2

013

18.0

7.2

013

25.0

7.2

013

1.0

8.2

01

3

8.0

8.2

01

3

15.0

8.2

013

Arco Vara aktsia keskmine tulumäär päevas (%) 20.06.2013-21.08.2013 ja juhusliku protsessi poolt genereeritud aegrida.

Arco Vara aktsia Genereeritud

Aritmeetiline keskmine -0,07%, standardhälve 1,96%

100

110

120

130

140

150

160

170

180

3.0

1.2

000

3.0

3.2

000

3.0

5.2

000

3.0

7.2

000

3.0

9.2

000

3.1

1.2

000

3.0

1.2

001

3.0

3.2

001

3.0

5.2

001

3.0

7.2

001

3.0

9.2

001

3.1

1.2

001

TALSE 1.01.2000 - 31.12.2001 ja vastava juhusliku ekslemise realisatsioonid

TALSE väärtus

Realisatsioon 1

Realisatsioon 2

Realisatsioon 3

Näide: juhuslik ekslemine aktsiaturgudel

Juhusliku protsessi karakteristikud

2 2) ( ) ( )

, ) ( )( ) ( , )

t t

t t t

t t i t t i t t i

E y

Var y E y y

Cov y y E y y y y

keskväärtus

dispersioon (

autokovariatsioon (

Keskväärtus iseloomustab keskmist taset.

Dispersioon iseloomustab hajumist.

Kovariatsioon iseloomustab juhusliku suuruse erinevate

väärtuste vahelist statistilist seost.

, ) 0t t iCov y y (Kui siis yt ja yt-i sõltumatud.

Autokovariatsioon:

aegrea korral on erinevateks väärtusteks erinevatele

ajaperioodidele (või momentidele) vastavad väärtused yt ja yt-i

Demo: karakteristikud

cdf/ProtsessiKarakteristikud.cdf

Karakteristikud üldiselt muutuvad ajas

Keskväärtus on konstantne,

dispersioon muutub

Keskväärtus muutub

1 2 3 4 5 6 7 aeg t

Mittestatsionaarne protsess

1

1

[ ( )]

[ ( )]

E Y t

Var Y t

Üldiselt on igal ajamomendil erinev tõenäosusjaotus

2

2

[ ( )]

[ ( )]

E Y t

Var Y t

3

3

[ ( )]

[ ( )]

E Y t

Var Y t

4

4

[ ( )]

[ ( )]

E Y t

Var Y t

Juhusliku suuruse Y

tõenäosusjaotus

ajahetkel t

Ansambli ja aegrea keskväärtus

1 1 2 2 1

1 2

1 2 1

Realisatsioon 1 ( ), ( ), , ( )

Realisatsioon ( ), ( ), , ( )


m m m

M M M

x t x t x T

m x t x t x T

M x t x t x t

1

1[ ( )] ( )

M

i m i

m

E X t x tM

Ansambli

keskväärtus on

üle erinevate

realisatsioonide.

Ei ole vaadeldav

1 1 2 2 1

1 2

1 2 1

Realisatsioon 1 ( ), ( ), , ( )



m m m

M M M

x t x t x T

m x t x t x T

M x t x t x t1

1( )

T

m

t

x x tT

Aegrea keskväärtus

on vaadeldav

Range statsionaarsus.

• Modelleerimiseks ja prognoosimiseks on vajalik

statsionaarsus.

• Ranget statsionaarsust on praktikas võimatu kontrollida

Juhuslik protsess on rangelt statsionaarne (strongly

stationary), kui vastava juhusliku suuruse tõenäosusjaotus

ajas ei muutu.

Statsionaarsus kitsamas mõttes.

Nõrk statsionaarsus

Juhuslik protsess on nõrgalt statsionaarne (weakly stationary),

kui tema tõenäosuslikud omadused ei muutu ajas (on ajas

invariantsed):

2 2 2

( ) ( ) ,

( ) ( ) ,

( , ) ( , )

t t m

t t m

t t j t m t m j j

E y E y

y y

y y y y

konstantne keskväärtus

konstantne dispersioon

konstantne autokovariatsioon

Ka

• statsionaarsus laiemas mõttes (stationarity in wide sense)

• kovariantne statsionaarsus (covariance stationarity)

Edaspidi mõeldakse statsionaarsuse all nõrka statsionaarsust

Kovariatsioon sõltub vaid ajamomentide vahest j

Valge müra

Valge müra korral igale ajahetkele t vastavad juhuslikud

suurused ut on

1. üksteisest sõltumatud: Cov(ut,ut-j)=0 iga t ja j≠0 korral

2. konstantse keskväärtusega E(ut) = μ;

3. konstantse dispersiooniga: Var(ut) =σ2

aeg t

ut

Valge müra on statsionaarne protsess.

Aga statsionaarseid protsesse on teisigi.

Valge müra tähtsaim omadus:

autokovariatsiooni puudumine

ehk sõltumatus.

See eristab seda teistest

protsessidest.

AUTOKORRELATSIOON JA

SELLE TESTIMINE

Autokorrelatsioon

Üheks oluliseks aegrea

omaduseks on perioodil t

esineva aegrea väärtuse

sõltuvus varasemate

perioodide väärtustest.

Seda sõltuvust

nimetatakse

autokorrelatsiooniks.

AegAeg

Aeg

Autokorrelatsioon puudubAeg

Aeg

Kuidas hinnata

autokorrelatsiooni

tugevust või selle

puudumist?

Vaja kvantitatiivset

näitajat!

Autokorrelatsioonikordaja

Autokorrelatsiooni mõõdab autokorrelatsioonikordaja (AC)

1

1 n

t

t

y yn

kus keskväärtus

1 1

Kui meil on antud aegrida yt , t=1,2,...,n, siis

saame moodustada n-1 arvupaari (y1, y2), (y2, y3),

..., (yt-1, yt).

Autokorrelatsioonikordaja näitajate yt ja yt-1 vahel:

y1 y2

y2 y3

... ....

yt-1 yt

1

21

2

1

n

t t

t

n

t

t

y y y y

y y

Märkus: See on

ligikaudne valem,

kehtib pikkade

aegridade korral

(n>50)

Millal on autokorrelatsioon positiivne

Aeg

0,992

Aeg

0,990

Autokorrelatsioonikordaja on positiivne, kui

• kasvamisele järgneb kasvamine

• kahanemisele järgneb kahanemine

Aeg

0,763

y t-1

yt

y t-1

yt

Korrelatsioonidiagrammid,

yt-1 ja yt

Millal on autokorrelatsioon negatiivne

Korrelatsioonidiagramm,

yt-1 ja yt

Autokorrelatsioonikordaja on negatiivne, kui

• kasvamisele järgneb kahanemine

• kahanemisele järgneb kasvamine

Aeg

-0,878y t-1

yt

Millal autokorrelatsioon puudub

Korrelatsioonidiagramm,

yt-1 ja yt

Autokorrelatsioon puudub kui

• kasvamisele järgneb

• mõnikord kahanemine

• mõnikord kasvamine

• kahanemisele järgneb

• mõnikord kahanemine

• mõnikord kasvamine

Aeg0,169

y t-1

yt

Kui väike peaks olema

autokorrelatsioonikordaja

absoluutväärtus, et võiksime

öelda:

“autokorrelatsioon puudub”?

Vaja kriteeriumi!Demo: autokorrelatsioon

cdf/Autokorrelatsioon.cdf

Autokorrelatsioon ja kõrgemat järku viitajad

Ajamomendile t vastav aegrea väärtus yt võib sõltuda mitte

ainult eelmisele ajamomendile t-1 vastavast väärtusest yt-1,

vaid ka varasematest väärtustest yt-2, yt-3, ...., yt-k,

y

tt-1t-2t-3

Vastavalt

1. järku autokorrelatsioon



...........

k-ndat järku

autokorrelatsioon

Autokorrelatsioonifuktsioon ACF

1

21

2

1

,

n

t t

t

n

t

t

y y y y

y y

1. järku


mõõdab vahetult

järgnevate vaatluste

vahelist korrelatsiooni

1

2

1

n

t t

t k

k

k n

t

t

y y y y

y y

k-ndat järku


mõõdab vaatluste yt-k ja yt

vahelist korrelatsiooni

Autokorrelatsioonifunktsioon (ACF) on autokorrelatsiooni-

kordaja sõltuvus viitajast k.

ρ1, ρ2, ρ3 ,…, ρk → ρ(k)

Näide: keskmise palga autokorrelatsiooni

funktsioonAasta,

kvartal yt

yt-1

yt-2

yt-3

yt-4

2004, 1 6748

2004, 2 7417 6748

2004, 3 7021 7417 6748

2004, 4 7704 7021 7417 6748

2005, 1 7427 7704 7021 7417 6748

2005, 2 8291 7427 7704 7021 7417

2005, 3 7786 8291 7427 7704 7021

2005, 4 8690 7786 8291 7427 7704

2006, 1 8591 8690 7786 8291 7427

2006, 2 9531 8591 8690 7786 8291

2006, 3 9068 9531 8591 8690 7786

2006, 4 10212 9068 9531 8591 8690

1. järku 0,524

2. järku 0,566

3. järku 0,144

4. järku 0,144

Autokorrelatsiooni-

kordajad

Autokorrelatsiooni statistilise olulisuse

testimine

• Nullhüpotees: kõik autokorrelatsioonikordajad kuni viitajani k on nullid, – st autokorrelatsioon puudub;

– st genereerivaks protsessiks on valge müra.

• Sisukas hüpotees: esineb autokorrelatsioon

• Testimiseks kasutatavad statistikud– Q statistik (ka Portmanteau statistik, Box-Pierce statistik)

– Box-Ljungi statistik. Sobivam väikeste valimite korral.

• Mõlemad alluvad suurte valimite korral χ2 jaotusele. Vabadusastmete arv = viitaegade arv.

• Kui statistiku väärtus on suurem, kui χ2 kriitiline väärtus (olulisuse tõenäosus on väiksem kui valitud olulisuse nivoo), võtta vastu sisukas hüpotees, autokorrelatsioon esineb.

Box-Ljungi statistik

n – aegrea pikkus, st aegrea väärtuste arv

k – mitmenda viitajani autokorrelatsiooni uuritakse

ρj – j -järku autokorrelatsioonikordaja

2

2

1

( 2) ( )k

j

BL

j

Q n n kn j

Box-Ljungi statistik

Autorid Box ja Ljung (1978)

• Mitmenda viitajani ehk kui suur võtta k väärtus?

• Ühest kriteeriumi ei ole.

• Leitakse statistiku väärtused erinevate viitaegade arvu k

korral. Vaadatakse näiteks, millal autokorrelatsioon

muutub statistiliselt mitteoluliseks.

jaanuar

veebruar

märts

aprill

?

Osaline autokorrelatsioon PACF

• Uurime näiteks, kuidas jaanuarikuu väärtus mõjutab aprillikuu väärtust. St viitaeg on 3.

Osaline autokorrelatsioon mõõdab autokorrelatsiooni yt-k

ja yt vahel, kusjuures vahepealsete väärtuste mõju on elimineeritud.

ρ3

• Selleks leiame vastava autokorrelatsioonikordaja ρ3 .

• Aga: jaanuarikuu väärtus mõjutab ka veebruarikuu väärtust, see omakorda märtsikuu oma, mis omakorda aprilli väärtust.

• ρ3 väärtust mõjutavad ka vahepealsed mõjud, need tuleks elimineerida

• Statistikas on olemas mõiste “osakorrelatsioonikordaja”, mis

mõõdab suuruste x ja y vahelise seose tugevust tingimusel, et

näitajate z1, z2, ..., zm mõju on eemaldatud.

partial autocorrelation

H0, autokorrelatsioon puudub.

Aegrida on genereeritud valge

müra poolt.

tY

olulisuse

tõenäosus

Näide: valge müra

autokorrelatsioonifunktsioon ja Box-Ljungi statistik

Autokorrelatsiooni-

funktsioon

Osalise auto-

korrelatsiooni-

funktsioon

Variable->Correlogram

2

1

( 2)k

j

BL

j

Q n nn j

Näide: juhusliku ekslemise

autokorrelatsioonifunktsioon ja Box-Ljungi statistik

H1: esineb autokorrelatsioon

olulisuse

tõenäosus

Korrelogrammid

Valge müra:

ACF väärtused

on vea piirides

nullid

• Korrelogrammil esitatakse autokorrelatsioonifunktsioon visuaalselt.

• Võimaldab esile tuua tunnuse ajalise käitumise iseloomu, mida on raske

kindlaks teha aegrea enda vaatlemisel.

Viitaeg

AC

F

Juhuslik

ekslemine

ACF nullist erinev,

väheneb aeglaselt

viitaegade

kasvamisel

AC

F

Viitaeg

ARIMA MUDELID

ARMA modelleerimise eesmärk

Aegrea autokorrelatsiooni struktuur püütakse esitada

ARIMA mudeli abil.

See, mis ARIMA mudelist üle jääb, on valge müra.

Põhiliseks kasutusvaldkonnaks on lühiajaline

prognoosimine:• makroökonoomika aegread

• finantsaegread

• ettevõtluses nõudlus

Võetud üle elektriinseneride poolt kasutatud signaalide filtreerimisest, mis töötati

välja 1930-ndatel.

Laiemalt võeti kasutusele pärast G.E.P. Box ja G. Jenkins'i raamatu „Time Series

Analysis: Forecasting and Control“ ilmumist 1971. a.

Libiseva keskmise mudelid MA

Valge müra üldistus: juhuslike liikmete ehk šokkide ut

kaalutud libisev keskmine (moving average, MA)

1 1t t ty u u MA(1), 1. järku libisev keskmine

1 1 2 2t t t ty u u u MA(2), 2. järku libisev keskmine

1 1 ...t t t q t qy u u u

MA(q)

1

q

t t i t i

i

y u u

t iu on valge müra

"Mäletab" eelmisi šokke ut-i

MA liikmete interpretatsioon I

MA kordajad iseloomustavad juhuslike šokkide

mõju järgnevatele aegrea liikmetele.

10,1t t ty u u 10,8t t ty u u

Eelmise šoki ut-1 mõju on väiksem Eelmise šoki ut-1 mõju on suurem

šokid ut

10,1 tu tu

tu10,8 tu

MA liikmete interpretatsioon, II

1 20,8 0,5t t t ty u u u

Mõju avaldavad nii eelmine šokk ut-1 kui ka üle-eelmine šokk ut-2

tu1

0,8

tu

2

0,5

tu

Näide: libiseva keskmise mudelid MA

11 0,6t t ty u u

MA(1) MA(2)

1 21 0,6 0,3t t t ty u u u

MA(q) protsessi karakteristikud

1

q

t t i t i

i

y u u

Keskväärtus ( )tE y

Dispersioon2 2 2

1

( ) ( ) 1q

t t i

i

y u

Konstantne

σ2(ut) konstantne,

järelikult

σ2(yt) konstantne

Kovariatsioon

2

1

1 ,cov( , )

0,

q

i i k

i kt t k

k qy y

k q

Konstantne

MA(q) protsess on statsionaarne

Autoregressiivsed mudelid AR

1 1 2 2t t t ty c y y u

2. järku autoregressiivne mudel AR(2)

1 1 2 2 ...t t t p t p ty c y y y u

Autoregressiivne mudel: aegrea liikmed sõltuvad

eelnevatest liikmetest (viitaegadest)

1 1t t ty c y u 1. järku autoregressiivne mudel AR(1)

1

p

t i t t

i

ic yy u

AR(p)

tu on valge müra

"Mäletab" eelmisi väärtusi yt-i

AR liikmete interpretatsioon

• Autoregressiivsus tähendab, et esineb nö "taastav jõud",

mis sunnib aegrida pöörduma tagasi keskväärtuse poole

(mean reversion).

• Keskväärtusele lähenemise kiiruse määrab AR kordajate

summa. Kui kordajate summa on

– väike, toimub tagasipöördumine kiiresti;

– suur, toimub tagasipöördumine aeglasemalt.

10,19t t ty y u

10,91t t ty y u

keskväärtus

kiiresti

aeglaselt

Näited: autoregressiivsed mudelid

11 0,6t t ty y u

AR(1)

1 21 0,6 0,3t t t ty y y u

AR(2)

AR(p) protsessi keskväärtus

Keskväärtus

1

( )

1

t p

i

i

cE y

1

1 0p

i

i

Kui nimetaja , siis keskväärtus pole defineeritud

Sellisel juhul ühikjuure protsess, mittestatsionaarne

1 1 2 2 ...t t t p t p ty c y y y u

Millal on AR protsess statsionaarne?

AR(p) protsessi statsionaarsuse tingimus

1 1 2 2 ...t t t p t p ty c y y y u

Karakteristlik võrrand 2

1 21 ... 0p

p

Karakteristliku võrrandi juured (lahendid) 1 2, ,..., p (üldiselt kompleksed)

AR(p) protsess on statsionaarne, kui kõik karakteristlikud juured asuvad

väljaspool ühikringi.

Vt õpik Brooks lk 217 näide 5.3

Im

Re

1

Ühikring komplekstasandil

AR(1) protsessi statsionaarsuse tingimus

1 1t t ty c y u AR(1)

11 0 Karakteristlik

võrrand1

1

Lahend

AR(1) protsess on statsionaarne, kui |ϕ1|<1

1

11 1

Tingimus Väljaspool ühikringi

Näited: statsionaarsed ja

mittestatsionaarsed AR(1) protsessid

10,5t t ty y u

10,5t ty y

10,5t t ty y u

10,5t ty y

11,05t t ty y u

11,05t ty y 11,05t t ty y

11,05t ty y

Mittestatsionaarsed

Statsionaarsed

Demo: AR statsionaarsus

cdf/ARstatsionaarsus.cdf

Autoregressiivsed libiseva keskmise mudelid

ARMA(p,q)

1 1 1 1t t t ty c y u u

1 1t t ty c u u 1 1t t ty c y u

MA(1)AR(1)

ARMA(1,1)

Esimest järku autoregressiivne libiseva keskmise mudel

1 1

1 1

...

...

t t p t p

t t q t q

y c y y

u u u

(p,q) järku autoregressiivne libiseva keskmise mudel

ARMA(p,q)

p järku autoregressiivne

komponent

q järku libiseva keskmise

komponent

Demo: ARMA(1,1)

cdf/arma11.cdf

Olulisemad ARMA (p,q) mudelid

Mudel Tähistus Valem

Valge müra ARMA(0,0)

1. järku

autoregressiivne AR(1)

ARMA(1,0)

2. järku

autoregressiivne AR(2)

ARMA(2,0)

1. järku libisev

keskmine MA(1)

ARMA(0,1)

2. järku libisev

keskmine MA(2)

ARMA(0,2)

1. järku

autoregressiivne

libisev keskmine

ARMA(1,1)1 1 1 1t t t ty c y u u

1 1 2 2t t t ty c u u u

1 1t t ty c u u

1 1 2 2t t t ty c y y u

1 1t t ty c y u

t ty c u

Integreeritud protsess

• Protsess on 1-st järku integreeritud, kui protsess on

mittestatsionaarne, aga selle 1. järku diferentside

aegrida on statsionaarne.

– Tähistus I(1)

• Protsess on k-ndat järku integreeritud (integrated of

order k), kui protsessi k-ndat järku diferents on

statsionaarne protsess.

– st statsionaarsuse saavutamiseks tuleb k korda diferentsida

– tähistus I(k)

• Kui protsess on statsionaarne, st statsionaarsuse

saavutamiseks pole vaja diferentsida, on I(0) protsess

Integreeritud AR mudelid

1 1 1 2(1 )t t t ty c y y u ARI(1,1)

Kui aegrea 1. järku diferentsid on kirjeldatavad AR(1)

mudeli abil

Kui aegrea statsionaarsuse saavutamiseks tuleb seda

diferentsida 2 korda, esitab aegrida mudel ARI(1,2)

Üldiselt ARI (p,d)

siis aegrida ise on genereeritud autoregressiivse

protsessi ARI (1,1) poolt ja on esitatav järgmiselt

1 1t t ty c y u

Integreeritud MA mudelid

Kui aegrea 1. järku diferentsid on kirjeldatavad MA(1)

mudeli abil

siis aegrida ise on genereeritud autoregressiivse

protsessi IMA (1,1) poolt ja on esitatav järgmiselt

1 1t t ty c u u

1 1 1t t t ty c y u u

Kui aegrea statsionaarsuse saavutamiseks tuleb seda

diferentsida 2 korda, esitab aegrida mudel IMA(2,1)

Üldiselt IMA(d,q)

IMA(1,1)

ARIMA: Integreeritud ARMA mudelidAutoregressiivsed integreeritud libiseva keskmise mudelid

ARIMA(p,d,q)

p autoregressiivse osa järk

d diferentside järk

q libiseva keskmise järk

• Kui aegrida vajab diferentsimist, siis diferentsitakse seda

(tavaliselt 1 või 2 korda) ja diferentsidele rakendatakse

sobivat ARMA(p,q) mudelit.

• d järku diferentside ARMA(p,q) mudel on ekvivalentne

ARIMA(p,d,q) mudeliga

Näited

ARIMA(1,1,0) 1. järku diferentside aegrida on AR(1) tüüpi

ARIMA(0,2,2) 2. järku diferentside aegrida on MA(2) tüüpi

BOX - JENKINSI METOODIKA

Box - Jenkinsi metoodika

Box ja Jenkins (1970) pakkusid välja ARMA mudelite jaoks süstemaatilise lähenemise:

1. Mudeli identifitseerimine, st ARMA järkude (p,q) kindlaks määramine• korrelogrammide abil

• informatsioonikriteeriumi abil

2. Mudeli parameetrite hindamine

3. Mudeli adekvaatsuse hindamine (diagnostika)– kas parameetrid on statistiliselt olulised

– kas jäägid moodustavad valge müra (jääkide autokorrelatsiooni testimine)

Aegrida

Mudeli identifitseerimine ja

parameetrite hindamine

Kas on

statsionaarne?

Mudeli

adekvaatsuse

kontroll

Jah

Jah

Prognoosimine

Ei

Ei

Diferentside

leidmine

Box-Jenkinsi

metoodika

Mudeli identifitseerimine

• Otsustatakse– Kas on vaja aegrida diferentsida ja kui, siis mitu korda

– Mitmendat järku autoregressiivset (AR) ja libiseva keskmise (MA) operaatorit kasutada.

• Tavaliselt üks valik 5-st võimalusest: AR(1), AR(2), MA(1), MA(2), ARMA(1,1)

• AR ja MA valikul võib tugineda– Aegrea autokorrelatsiooni (ACF) ning osalise

autokorrelatsiooni funktsioonile (PACF) ja vastavate korrelogrammide visuaalsele uurimisele

– Informatsioonikriteeriumitele: valitakse mudel, mille korral vastav näitaja on väikseim

Demo: korrelogrammid

cdf/Korrelogrammid.cdf

AR(1) ja AR(2) korrelogrammidAR(1)

ACF: Koefitsiendid

vähenevad

aeglaselt 0-ni

PACF: Viitajaga 1

koefitsient suur,

teised ca 0.

ACF: Koefitsiendid

vähenevad

aeglaselt 0-ni

PACF: Viitaegadega

1 ja 2 koefitsiendid

suured, teised ca 0.

AR(2)

MA(1) ja MA(2) korrelogrammidMA(1)

ACF: Viitajaga 1

koefitsient suur,

teised ca 0

PACF: Koefitsiendid

vähenevad aeglaselt

0-ni

ACF: Viitajaga 1 ja

2 koefitsiendid

suured, teised ca 0

PACF: Koefitsiendid

vähenevad aeglaselt

0-ni

MA(2)

ARMA mudeli valik korrelogrammide põhjal

Mudel ACF PACF

AR(1), β1>0 Eksponentsiaalne

vähenemine 0-ni

Viitajaga 1 koefitsient suur,

teised ca 0

AR(1), β1<0 Ostsilleeruv vähenemine 0-ni Viitajaga 1 koefitsient suur

AR(p) Eksponentsiaalne või

ostsilleeruv vähenemine 0-ni

Viitajani p koefitsiendid

nullist erinevad.

MA(1), θ1>0 Viitajaga 1 koefitsient suur,

teised ca 0

Ostsilleeruv vähenemine 0-ni

MA(1), θ1<0 Viitajaga 1 koefitsient suur Eksponentsiaalne

vähenemine 0-ni

MA(2) Viitajaga 1 ja 2 koefitsiendid

suured, teised ca 0

Eksponentsiaalne või


ARMA(1,1) Eksponentsiaalne või


Eksponentsiaalne või


Kokkuvõte: AR ja MA järkude määramine

ACF ja PACF järgi

Autoregressiivne protsess AR

• eksponentsiaalselt või ostsilleeruvalt kahanev ACF

• oluliselt nullist erinevad PACF väärtused annavad AR järgud

Libiseva keskmise protsess MA

• eksponentsiaalselt või ostsilleeruvalt kahanev PACF

• oluliselt nullist erinevad ACF väärtused annavad MA järgud

PROBLEEM: tihti pole ACF ja PACF graafikute järgi

võimalik mudelit üheselt identifitseerida. Siis abiks

informatsioonikriteeriumid.

InformatsioonikriteeriumidAkaike Information Criteria

Paremaks loetakse mudelit, mille korral AIC on väiksem.

2 2ˆln

k

T AIC

ln(σ2) vähenemist kompenseerib k/T suurenemine. Kui 2. liidetava 2k/T

suurenemine ületab ln (σ2) vähenemisest saadava efekti, siis AIC

summaarselt suureneb. Siis ei ole mudelisse uue liikme lisamine õigustatud.

k - hinnatavate parameetrite arv, ARMA(p,q) mudeli korral k=p+q+1,

T valimi maht (aegrea pikkus)

2ˆSSE

T kus SSE jääkliikmete ruutude summa Jääkliikmete dispersioon

Akaike

informatsioonikriteerium

2ˆ( ) ln lnk

k TT

BIC

Schwarzi kriteerium SIC (ka BIC ehk Bayesi informatsioonikriteerium)

Uute liikmete lisamise suhtes

“kriitilisem”, kui AIC, sest teine liidetav

suureneb kiiremini

Näide valik AIC ja BIC põhjal

p/q 0 1 2 3 4

0 610,7 607 585,3 585,5 586,2

1 601,7 588,5 583,6 579,6 581,5

2 581,4 583,3 585 581,5 583,5

3 583,2 585 586,8 580,1 580,6

4 584,9 587 580,6 579,9 580,9

AIC

p/q 0 1 2 3 4

0 614 616,8 598,5 601,9 605,7

1 611,6 601,6 600 599,3 604,5

2 594,5 600 604,6 604,5 609,7

3 600 604,7 609,8 606,3 610,1

4 604,6 609,9 606,8 609,4 580,9

BIC

ARIMA(4,3)

ARIMA(4,4)

ARMA mudeli parameetrite hindamine

• Pärast mudeli identifitseerimist viiakse läbi mudeli

parameetrite hindamine

• Mudeli diagnostika

– Kas parameetrite hinnangud on statistiliselt olulised?

– Kas mudeli jääkliikmed (residuals) moodustavad valge müra?

• leitakse jääkliikmete ACF ja PACF ning uuritakse vastavaid

korrelogramme

• valge müra test Box-Jungi statistiku Q põhjal

– Kas jääkliikmed alluvad normaaljaotusele?

• Eesmärgiks on ARMA mudelisse koondada aegrea

autokorrelatsiooni struktuur, et järele jääks ainult valge

müra

Näide: majade hinnad UK-s

40

60

80

100

120

140

160

180

200

92 94 96 98 00 02 04 06

HP

Jaanuar 1991 – mai 2007

tuh G

BP

Allikas: Brooks, Introductory

Econometrics for Finance

Hind HP, tuh GBP

Mittestatsionaarne aegrida

T=197

ukhp.gdt

Mittestatsionaarse aegrea korrelogramm: ACF väheneb väga aeglaselt

Näide: majade hinnad UK-s,

muutus protsentides

-3

-2

-1

0

1

2

3

4

92 94 96 98 00 02 04 06

DHP

Hinna muutus protsentides

Statsionaarne aegrida

T=196

ukhp.gdt

1

100tt

t

HPDHP

HP


DHP korrelogrammid

ACF väheneb

ostsilleerudes,

järelikult AR

tüüpi

PACF-l kaks

tippu, järelikult

AR(2)

ukhp.gdt


AR(2) mudeli aruanneKesk-

väärtus μ

Kordajate

Φ1 ja Φ2

hinnangud

ukhp.gdt

Karakteristliku

võrrandi juuredJuurte absoluutväärtused (moodulid) >1,

järelikult statsionaarne


AR(2) mudeli aruanneAegrea

(realisatsiooni)

keskväärtus Kordaja

Standard-

viga z-statistik

Olulisuse

tõenäosus p

Jääkliikmete ehk

šokkide u keskväärtus

kordaja

standardvigaz

Schwarzi


Jääkliikmete u

standardhälve

Akaike


ukhp.gdt


AR(2) mudeli kirjutamine

NB! See on

keskväärtus μ

1 1 2 2t t t ty c y y u AR(2) mudeli üldkuju

1 20,319 0,168 0,330t t t ty y y u

1

1

1

1

p

ipi

i

i

cc

AR(p)

keskväärtuse

valemist

0,635701 1 0,168334 0,329653 0,319c Arvuta-

me c

ukhp.gdt


jääkliikmete autokorrelatsiooni testimine

Valge müra kuni

viitajani 26

PROGNOOSIMINE

Prognoosimine ja tinglik keskväärtus

Tähistame kogu informatsiooni, mis on teada ajahetkeks tt

Seda informatsiooni kasutades saame leida aegrea tingliku

keskväärtuse ajahetkel t+1

1 |t tE y

Ajahetkel t tehtud prognoos (forecast) F on tinglik keskväärtus,

sõltub ajahetkeks t teadaolevast informatsioonist.

,1 1 |t t tF E y 1 samm edasi

, |t h t h tF E y h sammu edasi

Eeldame, et genereeriv protsess on hinnatud, st

1. korrelatsiooni struktuur on teada;

2. parameetrid on hinnatud.

Aegrida 1 2{ , ,..., }t TY y y y

Prognoosimine MA mudeli korralMA(3) mudel

1 1 2 2 3 3t t t t ty u u u u Erineva pikkusega prognoosid ajahetkel t.

,1 1 1 2 1 3 2

,2 2 2 3 1

,3 3 3

,4 4

,5 5

|

|

|

|

|

....

t t t t t t

t t t t t

t t t t

t t t

t t t

F E y u u u

F E y u u

F E y u

F E y

F E y

, | ,t h t h tF E y h q

Kui prognoosime kaugemale, kui MA protsessi järk q, on prognoosiks

protsessi keskväärtus:

MA protsessi mälu pikkus on q perioodi. See määrab ära prognoosi horisondi.

Prognoosimine AR mudeli korral

1 1 2 2t t t tc uy y y Näiteks AR(2) mudel

,2 ,3 1, 3 1 2| t tt t tE c F FF y

Prognoosimisel

kasutatakse eelmisi

prognoose

Erineva pikkusega prognoosid ajahetkel t.

,1 1 1 2 1|t tt t tF E cy y y

,1,2 2 1 2|t t tt tFE cF y y

Staatiline ja dünaamiline prognoosimine

• Dünaamiline prognoosimine

– Aluseks olemasolevad tegelikud väärtused + eelnevalt

prognoositud väärtused

– Prognoositakse väärtusi, mis pole teada (praktiline

vajadus)

• Staatiline prognoosimine

– Ühesammuline prognoosimine

– Järgmise väärtuse prognoosimiseks võetakse aluseks

eelmised aktuaalsed väärtused.

– Võimalik ainult valimi sees (in sample)

– Kasutatakse mudeli prognoosimisvõime hindamiseks

Näide: staatiline ja dünaamiline

prognoosimineMajade hinnad UK-s, hinna muutus protsentides. Aegrida kuni 05.2007.

Prognoos kuni 10.2007

tegelik aegrida

prognoos

staatiline

prognoosimine

dünaamiline

prognoosimine

06 100501

2007

Prognoosi punkthinnang ja vahemikhinnang

, |t h tt hEF y punkthinnangVahemikhinnang: antakse

prognoosi usalduspiirid

95%-lise usaldatavusega.

Prognoosi

standardviga

Prognooside hindamine prognoosivea järgi

1

1 T

t

t

ME uT

2

1

1 T

t

t

MSE uT

2

1

1 T

t

t

RMSE uT

1

1| |

T

t

t

MAE uT

Mean Error, keskmine viga

Mean Square Error, keskmine ruutviga

Mean Absolute Error, keskmine absoluutviga

Root Mean Square Error, juuritud keskmine

ruutviga

1

1100

Tt

t t

uMPE

T y

1

| |1100

Tt

t t

uMAPE

T y

Mean Percentage Error, keskmine suhteline

viga, protsentides

Mean Absolute Percentage Error, keskmine

suhteline absoluutviga, protsentides

Iseloomustab prognoosi nihet: üles või alla

Näide: Eesti THI 1998-2012

Modelleeriti 1. järku diferentse.

AR(1) AR(2)

Akaike ik 347,86

1. Mõlema mudeli korral jääkliikmetel autokorrelatsioon puudub 12. viitajani

2. Jääkliikmed ei allu normaaljaotusele.

Schwarzi ik 357,42 *

345,53 *

358,28

Prognoos

mõnevõrra parem

Theil'i U (programmis Gretl)

21

1

21

1

1

1

1

1

1

Tt

t t

Tt

t

t

t

t y

T yU

y

T y

F

y

Naiivne prognoos: 1t ty y

Kui palju on mudeli abil tehtud prognoos parem naiivsest prognoosist?

Mingi mudeli abil saadud prognoos Ft

Theil, H. (1966) Applied Economic Forecasting, Amsterdam: North-Holland

U > 1 mudeli abil tehtud prognoos on halvem, kui naiivne prognoos

U =1 mudeli abil tehtud prognoos on sama, mis naiivne

U < 1 mudeli abil tehtud prognoos on parem, kui naiivne prognoos

mudeli abil tehtud prognoosi põhjal

naiivse prognoosi põhjal

NÄIDE: USA tööstustoodangu indeksUSA tööstustoodangu indeks kvartalite kaupa.

Modelleerimiseks kasutatud ajavahemik 1961:1 – 1998:3

Modelleeritud indeksi logaritmi sesoonseid diferentse

ip.gdt

Mudel ARMA(2,0)

Mudel ARMA(2,5)

Prognoos parem kui naiivne

Prognoos halvem kui naiivne

Documents

Statsionaarsed aegread · 2018. 4. 27. · Osaline autokorrelatsioon PACF • Uurime näiteks, kuidas jaanuarikuu väärtus mõjutab aprillikuu väärtust. St viitaeg on 3. Osaline