22
Elemente de analză a seriilor temporale Vom prezenta tehnicile de analiză a seriilor cronologice. Această temă, de una singură, poate fi dezvoltată şi chiar numeroase lucrări îi sunt integral consacrate. Vom studia, în prima parte, caracteristicile statistice – în termeni de staţionaritate – a seriilor de timp prezentând diferite teste (Dickey-Fuller, corelograma, etc.) corespunzătoare acestui subiect. Apoi, în a doua parte, vom prezenta diferite clase de modele (AR, MA, ARMA), studiindu-le proprietăţile. Vom analiza apoi metoda Box şi Jenkins, care sistematizează abordarea analizei seriilor de timp, care va constitui tema părţii a treia. I. Staţionaritatea A. Definiţie şi proprietăţi Înaintea prelucrării unei serii cronologice, se recomandă de a studia mai întâi caracteristicile stochastice. Dacă aceste caracteristici stochastice – adică speranţa şi varianţa sa – cunosc modificări în timp, seria cronologică este considerată drept nestaţionară; în cazul unui proces stochastic invariat, seria de timp este staţionară. În mod formal, procesul stochastic y, este staţionar dacă: , media este constantă şi independentă de timp; var(y t ) < ∞t, varianţa este finită şi independentă de timp; cov(y t , y t+k ) = E[(y t — μ)(y t+k — μ)] = γ k , covarianţa este independentă de timp. În baza acestor proprietăţi, un proces de zgomot alb ε t , este staţionar, dacă ε t sunt independente şi supuse aceleiaşi legi N(0,σ ε 2 ) . O serie cronologică este deci staţionară, dacă ea este realizarea unui proces staţionar. Faptul presupune că seria nu este supusă nici tendinţei, nici sezonalităţii şi în general nici un factor nu evoluează în timp. 1

Anaiza Previziune Box Jenkins MASTYER (1)

Embed Size (px)

Citation preview

Page 1: Anaiza Previziune Box Jenkins MASTYER (1)

Elemente de analză a seriilor temporaleVom prezenta tehnicile de analiză a seriilor cronologice. Această temă, de una

singură, poate fi dezvoltată şi chiar numeroase lucrări îi sunt integral consacrate. Vom studia, în prima parte, caracteristicile statistice – în termeni de staţionaritate – a seriilor de timp prezentând diferite teste (Dickey-Fuller, corelograma, etc.) corespunzătoare acestui subiect. Apoi, în a doua parte, vom prezenta diferite clase de modele (AR, MA, ARMA), studiindu-le proprietăţile. Vom analiza apoi metoda Box şi Jenkins, care sistematizează abordarea analizei seriilor de timp, care va constitui tema părţii a treia.

I. Staţionaritatea

A. Definiţie şi proprietăţiÎnaintea prelucrării unei serii cronologice, se recomandă de a studia mai întâi

caracteristicile stochastice. Dacă aceste caracteristici stochastice – adică speranţa şi varianţa sa – cunosc modificări în timp, seria cronologică este considerată drept nestaţionară; în cazul unui proces stochastic invariat, seria de timp este staţionară.

În mod formal, procesul stochastic y, este staţionar dacă:, media este constantă şi independentă de timp;

var(yt) < ∞t, varianţa este finită şi independentă de timp;

cov(yt, yt+k) = E[(yt — μ)(yt+k — μ)] = γk, covarianţa este independentă de timp.

În baza acestor proprietăţi, un proces de zgomot alb εt, este staţionar, dacă εt sunt independente şi supuse aceleiaşi legi N(0,σε

2) .O serie cronologică este deci staţionară, dacă ea este realizarea unui proces staţionar.

Faptul presupune că seria nu este supusă nici tendinţei, nici sezonalităţii şi în general nici un factor nu evoluează în timp.

B. Funcţiile de autocorelare simplă şi parţialăFuncţia de autocorelare (FAC) , notată ρk ,care măsoară corelaţia seriei cu ea însăşi

cu decalare de k perioade, după cum se arată în tabelul 1.Formula de calculare:

[1]

unde este media seriei calculată pentru n — k perioade, n = numărul de observaţii. Se poate deduce că:

1

Page 2: Anaiza Previziune Box Jenkins MASTYER (1)

Această formulă [1] este dificil de aplicat deoarece se cere recalcularea pentru fiecare termen ρk a mediilor şi varianţelor, de aceea se preferă funcţia de autocorelare a eşantionului:

[2]

unde este media seriei calculată pentru n perioade.Tabelul 1 Exemplu de calcul a unei funcţii de autocorelare

K 0 1 2 3 4

T yt yt-1 yt-2 yt-3 yt-4

1 1232 130 1233 125 130 1234 138 125 130 1235 145 138 125 130 1236 142 145 138 125 1307 141 142 145 138 1258 146 141 142 145 1389 147 146 141 142 14510 157 147 146 141 14211 150 157 147 146 14112 145 150 157 147 146

Media yt 140,75 142,36 143,60 145,67 146,63Media yt-k 140,75 140,36 139,40 137,44 136,25Varianţa yt 95,02 72,41 62,84 24,11 22,23Varianţa yt-k 95,02 101,87 101,84 74,91 71,44ρk 1 0,77 0,62 0,59 0,55

Atunci când numărul de observaţii n este destul de mare, prin folosirea formulelor [1] şi [2] se obţin rezultate foarte apropiate.Date: 04/04/06 Time: 11:47Sample: 1 12Included observations: 12

Autocorrelation Partial Correlation AC PAC Q-Stat Prob . |***** | . |***** | 1 0.634 0.634 6.1350 0.013 . |***. | . | . | 2 0.404 0.003 8.8707 0.012 . |* . | . **| . | 3 0.081 -0.294 8.9924 0.029 . | . | . | . | 4 -0.031 0.051 9.0130 0.061 . | . | . |* . | 5 -0.038 0.124 9.0473 0.107 . *| . | . **| . | 6 -0.140 -0.274 9.5943 0.143 .***| . | ****| . | 7 -0.372 -0.469 14.233 0.047 .***| . | . |** . | 8 -0.389 0.233 20.573 0.008 .***| . | . | . | 9 -0.399 0.047 29.482 0.001 . *| . | . *| . | 10 -0.184 -0.114 32.328 0.000

Funcţia de autocorelare parţială se aseamănă noţiunii de corelare parţială, definit anterior ca fiind calculul influenţei lui x1 asupra lui x2 prin eliminarea influenţelor altor variabile x3, x4, ..., xt. Analogic, se poate defini autocorelarea parţială de k întârzieri drept

2

Page 3: Anaiza Previziune Box Jenkins MASTYER (1)

coeficient de corelare parţială între yt şi yt-k, adică ca fiind corelarea între yt et yt-k, influenţa altor variabile decalate cu k perioade (yt-1, yt-2, …, yt-k+1) fiind eliminate.

Pentru a evita ambiguităţile între cele două funcţii de autocorelare, numim funcţie de autocorelare simplă prin funcţie de autocorelare.

C. Testele “zgomotului alb” şi a staţionarităţiiNu se pot clar identifica caracteristicile stochastice ale unei serii cronologice decât

dacă ea este staţionară. Acest studiu de staţionaritate se realizează în mare parte în baza studiului funcţiilor de autocorelare (sau a reprezentării lor grafice numită “corelogramă”). O serie cronologică este staţionară dacă ea nu este supusă nici tendinţei, nici sezonalităţii. Deci, în baza studiului corelogramei unei serii, vom încerca să arătăm în ce mod se pot evidenţia cele două componente.

Se pot distinge diferite tipuri de serii staţionare:- de memorie, adică care pot modela printr-o lege de reproducţie procesul;- identic şi independent distribuită notată i.i.d. sau numită Zgomot Alb (“White Noise”);- normal (conform unei legi normale) şi independent distribuită notată n.i.d. sau numită

Zgomotul Alb gaussian.

1) Analiza funcţiilor de autocorelareÎntrebarea care apare, atunci când se studiază funcţia de autocorelare a unei serii

cronologice, este de a cunoaşte care sunt termenii ρk semnificativi diferiţi de 0.De fapt, de exemplu, dacă nici un termen nu este semnificativ diferit de 0, se poate

conchide că procesul studiat este fără memorie şi deci el nu este afectat nici de tendinţă, nici de sezonalitate. Sau chiar, dacă o serie lunară prezintă o valoare ridicată pentru ρ12 (corelare

între yt şi yt-12), seria studiată este singura afectată de o mişcare sezoniară. Vom verifica, în baza diferitor exemple, aceste cazuri.

Testul ipotezelor pentru un termen ρk este următorul:

H0 : ρk = 0Hl : ρk ≠ 0

Se poate utiliza testul ipotezelor unui coeficient de corelare, bazat pe compararea unui test t Student empiric şi teoretic. Insă Quenouille a demonstrat că pentru un eşantion mare (n > 30), coeficientul ρk tinde în mod asimptotic spre o lege normală cu media 0 şi abaterea tip

.Intervalul de încredere al coeficientului ρk este atunci :

n = numărul de observaţii.Dacă coeficientul calculat se află în exteriorul acestui interval de încredere, el este

semnificativ diferit de 0 la pragul (în general = 0,05 şi ). Majoritatea logicielilor furnizează, odată cu corelograma, intervalul de încredere, ceea ce permite o

3

Page 4: Anaiza Previziune Box Jenkins MASTYER (1)

interpretare imediată.Este necesar de subliniat o limită a testelor de 5%, atunci când o funcţie de autocorelare

este calculată pentru un număr important de întârzieri, ne putem aştepta ca câteva să fie, în mod fortuit (întâmplător), semnificativ diferite de 0. Dacă h este numărul de întârzieri, numărul posibil de respingeri false este deci de 0,05 x h, pentru un prag de încredere de 5%.

În cazul în care corelograma nu arată nici o descreştere a termenilor săi (absenţa vre-unui “cut off”), se poate conchide că seria nu este staţionară în tendinţă.

2) Statisticile Box-Pierce şi Ljung-Box

Testul Box-Pierce permite identificarea proceselor de zgomot alb (urmare a variabilelor aleatoare ale aceleiaşi distribuţii şi independente între ele). Trebuie să

identificăm cov(yt,, yt-k) = 0 sau chiar ρk = 0 k.Un proces zgomot alb presupune că ρl = ρ2 = . . . = ρk = 0, sau ipotezele:

HO : ρ1 = ρ2 = . . . = ρk = 0

Hl : există cel puţin un ρi semnificativ diferit de 0.Pentru a efectua acest test, se va recurge la statistica Q (datorată lui Box-Pierce)

prezentată prin formula:

,unde h – numărul de întârzieri, – autocorelarea empirică de ordinul k, n – numărul de observaţii.

Statistica Q este distribuită în mod asimptotic analog distribuţiei χ2 cu h grade de

libertate. Vom respinge ipoteza zgomotului alb, cu pragul , dacă statistica Q este

superioară lui χ2 citit în tabel la pragul (1 - α) şi h grade de libertate.Se poate utiliza de asemenea o altă statistică, a cărei proprietăţi asimptotice sunt mai

bune, derivată din prima care este Q' a lui Ljung et Box:

care este de asemenea distribuită conform χ2 cu h grade de libertate şi a cărei reguli de

decizie sunt identice. Aceste teste sunt numite în engleză: “portmanteau test” sau tradus literalmente testul “total îmblănit”.

3) Teste de normalitate

Pentru a calcula intervalele de încredere prevăzute şi de asemenea pentru a efectua testele Student asupra parametrilor, se recomandă de a verifica normalitatea erorilor. Testul

4

Page 5: Anaiza Previziune Box Jenkins MASTYER (1)

Jarque şi Bera (1984), fondat pe noţiunile de Skewness (asimetrie) şi Kurtosis (aplatizare), permite verificarea normalităţii unei distribuţii statistice.

a) Testele Skewness şi Kurtosis

Fie momentul centrat de ordinul k,

coeficientul Skewness β11/2

este egal cu:

şi coeficientul Kurtosis: .

Dacă distribuţia este normală şi numărul observaţiilor mare (n > 30) :

Se construiesc atunci statisticile:

care se compară cu 1,96 (valoarea legii normale la pragul de 5%).

Dacă ipotezele H0: v1 = 0 (simetrie) şi v2 = 0 (nivelarea normală) sunt verificate, atunci v1 < 1,96 şi v2 < 1,96, în caz contrar, ipoteza de normalitate se respinge.

b) Testul Jarque şi Bera

Este vorba de un test care sintetizează rezultatele precedente, dacă β11/2 şi β2 se supun

legilor normale atunci cantitatea s: urmează un χ2 cu două grade de

libertate.Deci, dacă (2), se respinge ipoteza H0 de normalitate a reziduurilor la pragul α.Aceste teste de normalitate servesc de asemenea în cazul când este vorba

heteroscedascititate. De fapt, heteroscedascititatea se manifestă pe graficul distribuţiei prin cozile de probabilitate mai dese (distribuţia leptokurtică) decât cozile legii normale.

4) Teste de staţionaritate:testele Dickey-Fuller şi Dickey-Fuller ExtinsTestele Dickey-Fuller permit nu doar de a detecta existenţa unei tendinţe (testele de

verificare a rădăcinii unitare, Unit Root Test), dar de asemenea de a determina modalitatea bună de staţionarizare a unei cronici.

Se disting două tipuri de procese:- procese TS (Trend Stationnary) care reprezintă o nestaţionaritate de tip determinist;- procese DS (Diffeerency Stationnary) pentru procesele nestaţionare de tip aleator.

a) Procesele TS

Un proces TS se scrie: xt = ft +εt unde ft este o funcţie polinomială de timp, lineară

sau nelineară, şi εt un proces staţionar. Procesul TS cel mai simplu (şi cel mai răspândit) este reprezentat printr-o funcţie polinomială de gradul 1, care este numit linear şi se scrie:

5

Page 6: Anaiza Previziune Box Jenkins MASTYER (1)

xt=a0+a1t+εt

Acest proces TS este nestaţionar deoarece E[xt] depinde de timp. Cunoscând şi

procesul xt poate staţionariza reducând valoarea lui xt în t, valoarea estimată . În acest tip de modelizare, efectul produs printr-un şoc (sau prin

mai multe şocuri aleatoare) la un moment t este tranzitoriu. Modelul fiind detreminist, cronica îşi regăseşte mişcarea pe termen lung prin dreapta tendinţei. Este posibil de a generaliza acest exemplu la funcţii polinomiale de un anumit grad..

b) Procesele DSProcesele DS sunt procese care se pot transforma în staţionare folosind un filtru de

diferenţe: (1 — D)dxt = β + εt unde εt este un proces staţionar, β o constantă reală, D

operator de decalaj, şi d ordinul filtrului diferenţelor.Aceste procese sunt deseori reprezentate folosind filtrul diferenţelor primare (d = 1),

numit proces de prim ordin şi se scrie:

(1 - D)xt = β + εt xt = xt-1 + β + εt

Introducerea constantei β în procesul DS permite de a defini cele două procese diferite:• β=0: procesul DS fără derivă.

Procesul are forma: xt = xt-1 + εt

Precum εt , este un zgomot alb, acest proces DS este numit modelul mersului la întâmplare sau a mersului aleatoriu (Random Walk Model). Foarte des el este folosit pentru a analiza eficienţa pieţelor financiare.

Pentru a staţionariza mersul aleatoriu, este suficient de a aplica procesului filtrul

diferenţelor primare: xt = xt-1 + εt, (1 - D)xt = εt..

• β≠0: procesul este numit proces DS cu derivă.

Procesul are forma: xt = xt-1 + β + εt

Staţionarizarea acestui proces este realizată folosind filtrul diferenţelor primare:

xt = xt-1 + β + εt, (1 - D)xt =β + εt

În procesul de tip DS, un şoc la un moment dat se repercutează la infinit asupra valorilor viitoare ale seriei; efectul şocului este deci permanent şi i în descreştere.

În concluzie, pentru staţionarizarea unui proces TS, metoda cea bună este acea a celor mai mici pătrate ordinare; pentru un proces DS trebuie de folosit filtrul diferenţelor. Alegerea unui proces DS sau TS drept structură a cronicii nu este deci neutră.

c) Consecinţele unei proaste staţionarizări a procesuluiPentru un proces TS, o metoda bună de staţionarizare este acea a celor mai mici

pătrate ordinare. Ce se întâmplă , dacă pentru procesul TS de prim ordin se aplică un filtru cu diferenţe

primare. A priori, deoarece gradul polinomului e 1, acest filtru poate fi considerat drept corect, deoarece un filtru cu diferenţe de ordinul d elimină un polinom de acelaşi grad. În acelaşi timp, se demonstrează că aplicarea unui filtru cu diferenţe creează o perturbaţie artificială.

Pentru un proces DS, metoda bună de staţionarizare este filtrul cu diferenţe primare. Dacă presupunem că se aplică metoda celor mai mici pătrate ordinare (regresie în timp)

6

Page 7: Anaiza Previziune Box Jenkins MASTYER (1)

asupra observaţiilor unui eşantion al procesului, parametrii tendinţei sunt estimaţi şi în consecinţă reziduul regresiei trebuie să fie un zgomot alb. Nelson şi Kang arată în baza simulărilor, că eliminarea unei tendinţe lineare asupra unui proces de mers aleatoriu creează artificial o puternică autocorelare a reziduurilor pentru primele întârzieri.

În plan econometric, este deci primordial de a identifica clar procesul şi de a folosi metoda adecvată de staţionarizare. În caz contrar riscul de a crea “zgomote parazite” artificiale este foarte mare.

Consecinţele sunt de asemenea importante în plan economic. Să considerăm, de exemplu, PIB-ul unei ţări precum Franţa în valoare reală. Dacă acest PIB este mai degrabă DS decât TS, este necesar de a pune sub îndoială descompunerea tradiţională (tendinţă şi ciclu) şi justificarea sa teoretică: independenţa schemelor explicative. Dacă PIB-ul este de fapt DS, creşterea şi ciclul sunt legate şi nu pot fi studiate, deci, separat. Or, conform lucrărilor lui Nelson şi Plosser (1982) despre cronicile macroeconomice americane, variabilitatea constatată a componentei conjuncturale s-ar datora unei structuri DS. Ca şi până în prezent, analiza acestei componente se efectuează în baza reziduului unei regresii între PIB şi o tendinţă deterministă, această analiză supraestimează amplitudinea ciclului şi subestimează importanţa tendinţei. În baza acestei menţiuni, Beveridge S. Şi Nelson C.R. (1981) propun o descompunere a proceselor după o tendinţă stochastică (permanentă) care se supune unui mers aleator cu sau fără deviere şi o componentă staţionară (tranzitorie). Prin urmare, Harvey A.C. (1988) foloseşte modelele structurale cu componente neobservabile (modelul tendinţei mai mult ciclu şi tendinţă-ciclu) reprezentate sub forma unui model spaţiu de stări estimat prin filtrul Kalman.

d) Testele rădăcini unitare: testele Dickey-Fuller (1979)Testele Dickey-Fuller (DF) permit de a pune în evidenţă caracterul staţionar sau nu al

unei cronici prin determinarea unei tendinţe deterministe sau stochastice.Modelele care stau la baza construcţiei acestor teste sunt trei. Principiul acestor testelor

este simplu: Dacă ipoteza H0: φ1 = 1 este reţinută în unul din aceste trei modele, atunci procesul

este nestaţionar.

[1] xt = φ1xt-1 + εt Model autoregresiv de ordinul 1.[2] xt = φ1xt-1 + β + εt Model autoregresiv cu constantă.[3] xt = φ1xt-1 + bt + c + εt Model autoregresiv cu tendinţă.

Dacă ipoteza H0 este verificată cronica x nu este staţionară indiferent de modelul reţinut.

În modelul [3], dacă se acceptă H1: φ1<1 şi dacă coeficientul b este semnificativ diferit de 0, atunci procesul este un proces TS; se poate transforma în staţionar calculând reziduurile în comparaţie cu tendinţa estimată prin metoda celor mai mici pătrate ordinare.

Conform H0, regulile obişnuite de inferenţă statistică nu se pot aplica pentru a testa această ipoteză, în particular distribuţia Student a parametrului φ1; Dickey şi Fuller au studiat

7

Page 8: Anaiza Previziune Box Jenkins MASTYER (1)

distribuţia asimptotică a estimatorului φ1 în conformitate cu ipoteza H0. Cu ajutorul simulărilor Monte-Carlo, alcătuind tabele cu valori critice pentru eşantioane de mărimi diferite. Aceste tabele sunt analoage tabelelor t Student. Autorii au ales să testeze valoarea (

) în locul lui din motive pur statistice. Aceasta nu este jenant pentru test. De fapt, xt = φ1xt-1 + εt se scrie de asemenea:

xt – xt-1 = φ1xt-1 – xt-1 + εt

Δxt = (φ1 –1)xt-1 + εt

Deci, este echivalentă testarea ipotezei H0: φ1 = 1 sau φ1 - 1 = 0.

Principiile generale ale testului sunt următoare.

Se estimează prin MCO parametrii φ1 notat pentru modelele [1], [2] şi [3]. Estimarea coeficienţilor şi abaterilor tip a modelului prin MCO furnizează care este analog statisticii Student (raportul coeficientului la abaterea tip).

Dacă , atunci se acceptă ipoteza H0; există o rădăcină unitară, procesul nu este deci staţionar. Este posibil de asemenea de a efectua acest test folosind cantitatea unde n este mărimea eşantionului (numărul de observaţii). Dacă , se acceptă ipoteza H0 de existenţă a rădăcinei unitare.

Remarcă: principalele programe computerizate de analiză a seriilor de timp oferă valorile critice .

e) Testele Dickey et Fuller Extinse (ADF)În modelele precedente folosite pentru testele Dickey-Fuller simple, procesul εt, este,

ipotetic, un zgomot alb. Or, nu este nici un motiv pentru care, a priori, eroarea să nu fie corelată. Testele Dickey-Fuller Extins (ADF, 1981) ia în consideraţie această ipoteză.

Testele ADF se bazează pe ipoteza alternativă , prin estimarea prin MCMMP a trei modele:

Modelul [4]:

Modelul [5]:

Modelul [6]:

unde εt → i.i.d.Testul se derulează în mod similar cu testele DF simple, doar tabelele statistice sunt

diferite. Valoarea p este determinată conform criteriilor Akaike şi Schwarz, sau chiar în baza

unei valori destul de importante p, se estimează un model cu p–1 întârzieri, apoi cu

p–2 întârzieri, până când coeficientul al p întârzieri să fie semnificativ.

f) Testul Phillips şi Perron (1988)8

Page 9: Anaiza Previziune Box Jenkins MASTYER (1)

Acest test este construit în baza unei corecţii neparametrice a statisticilor Dickey-Fuller pentru a ţine cont de erorile heteroscedastice. El se derulează în patru etape:1) estimarea prin MCMMP a trei modele de bază cu ajutorul testelor Dickey-Fuller şi

calculul statisticilor asociate, fie et reziduul estimat;

2) estimarea varianţei ,zisă pe termen scurt ;

3) estimarea unui factor corectiv (numit varianţă pe termen lung) stabilit în baza structurii covarianţelor reziduurilor modelelor estimate anterior, astfel încât transformările realizate să conducă la distribuţii identice celor Dickey-Fuller standard:

Pentru a estima această varianţă pe termen lung, este necesar de a defini un număr de

întârzieri l (tăierea Newey-West) estimat în funcţie de numărul de observaţii n, ;

4) Calculul statisticii PP: , unde (care este egal cu 1 – în

mod asimptotic – dacă et este un zgomot alb). Această statistică se compară cu valorile critice din tabelul MacKinnon.

g) Strategia testelor

Vom constata că pentru a realiza un test de rădăcină unitară, rezultatul nu este identic conform utilizării unuia din cele trei modele precum procesul ce generează cronica începutului.

Concluziile la care se ajunge sunt deci diferite şi pot implica transformări eronate. Acesta este motivul pentru care Dickey şi Fuller, precum şi alţi autori, au elaborat strategia testelor.

Vom prezenta un exemplu simplificat (schema 1) a unei strategii de teste. Valorile

critice a care permit de a testa nulitatea coeficienţilor c şi b a modelelor [2] şi [3] sunt date în anexă.

h) Testul KPSS (1992)

Kwiatkowski şi alţii (1992) propun folosirea unui test al multiplicatorului Lagrange (LM), bazat pe ipoteza nulă de staţionaritate. După estimarea modelelor [2] sau[3], se

calculează suma parţială a reziduurilor: şi se estimează varianţa pe termen lung (

) ca şi pentru testul Philips şi Perron.

9

Page 10: Anaiza Previziune Box Jenkins MASTYER (1)

Statistica este deci . Vom respinge ipoteza de staţionaritate dacă

această statistică este mai mare decât valorile critice din tabelul elaborat de autori.

De notat că logisielele RATS şi Eviews permit utilizarea directă a acestor teste.

II. Modelele ARIMA

În continuare se va prezenta o familie de procese aleatoare care încearcă să acopere o gamă foarte largă a evoluţiei posibile a seriilor cronologice: procese autoregresive şi procese ale mediei mobile

A. Tipologia modelelor AR, MA şi ARMA1) Modelul AR (Autoregresiv)a) FormulareaÎn procesul autoregresiv de ordinul p, observaţia prezentă yt este generată de o medie

ponderată a observaţiilor trecute până la perioada p în forma următoare:

AR(1):AR(2): …AR(p): [4]

unde θ1, θ2, … , θp sunt parametrii de estimat pozitivi sau negativi, εt este un risc gaussian.Putem adăuga la acest proces o constantă care nu modifică cu nimic proprietăţile

stochastice. Ecuaţia [4] poate de asemenea fi scrisă cu ajutorul operatorul de decalaj D:

(1 - θ1D – θ2D2 - … - θpDp)yt = εt

b) Caracteristicile corelogrameiEste demonstrat că corelograma simplă a unui proces AR(p) este caracterizată printr-

o descreştere geometrică a termenilor săi tip:

ρk = ρk

Corelograma parţială are proprii săi p primi termeni diferiţi de 0.

2) Modelul MA (Moving Average : Medie Mobilă)a) FormulareaÎn procesul mediei mobile de ordin q, fiecare observaţie yt este generată de o medie

ponderată de riscuri până la perioada q.10

Page 11: Anaiza Previziune Box Jenkins MASTYER (1)

MA(1):MA(2): …MA(q): [5]

unde α1, α2, … , αq sunt parametri care pot fi pozitivi sau negativi şi εt este un risc gaussian.

Ecuaţia [5] poate de asemenea fi scrisă:

(1 - α1D – α2D2 - … - αqDq)εt = yt

În acest proces, la fel ca şi în modelul autoregresiv AR, riscurile sunt presupuse a fi generate de un proces de tip zgomot alb. Se poate interpreta modelul MA ca fiind reprezentativ de o serie cronologică ce fluctuează în jurul mediei în mod aleatoriu, de unde şi termenul de medie mobilă căci acesta, nivelând seria, şterge zgomotul creat de risc.

Trebuie de specificat că este o echivalenţă între un proces MA(1) şi un proces AR de ordinul p infinit:

MA(1) = AR(∞).b) Caracteristicile corelogramelorCorelograma simplă a unui proces MA(q) este în forma generală:

pentru k = 0, 1, … , q şi ρk = 0 pentru k > q.

Adică doar primi q termeni ai corelogramei simple sunt semnificativ diferiţi de 0.Corelograma parţială este caracterizată prin descreşterea geometrică a întârzierilor.

3) Modelul ARMA (amestecul proceselor AR şi AM)a) FormulareModelele ARMA sunt deci reprezentative ale unui proces generat de o combinare a

valorilor trecute şi a erorilor trecute. Ele sunt definite prin ecuaţia:ARMA(p,q): (1 - θ1D – θ2D2 - … - θpDp)yt = (1 - α1D – α2D2 - … - αqDq)εt

Deci, avem:ARMA(1,0) = AR(1); ARMA(0,1)=MA(1).

b) Caracteristicile corelogramelorCorelogramele simple şi parţiale sunt, în consecinţă, un amestec a două corelograme

a proceselor AR şi MA pure. Astfel se dovedeşte a fi mai delicat de a identifica aceste procese în baza studiului funcţiilor de autocorelare empirice.

Tabelul 2 sintetizează caracteristicile corelogramelor proceselor AR, MA şi ARMA.

Tab.2 – Rezumatul proprietăţilor funcţiilor de autocorelare simplă şi parţialăProcesul Funcţia de autocorelare simplă Funcţia de autocorelare parţială

AR(1) Descreştere exponenţială (θ1 > 0) sau sinusoidală amortizată (θ1 < 0)

Vârf semnificativ pentru prima întârziere: pozitiv dacă θ1 > 0, şi negativ, dacă θ1 < 0, alţi

11

Page 12: Anaiza Previziune Box Jenkins MASTYER (1)

coeficienţi nuli pentru întârzierile > 1

AR(2) Descreşterea exponenţială sau sinusoidală după semnele θ1 şi θ2

Vârf semnificativ pentru prima şi a doua întârzieri, alţi coeficienţi sunt nuli pentru întârzierile > 2

AR(p) Descreşterea exponenţială şi/sau sinusoidală

Vârf semnificativ pentru primele p întârzieri, alţi coeficienţi sunt nuli pentru întârzierile > p

MA(1) Vârf semnificativ pentru prima întârziere: pozitiv dacă α1 < 0, şi negativ, dacă α1 > 0, alţi coeficienţi nuli pentru întârzierile > 1

Descreştere exponenţială (α1 > 0) sau sinusoidală amortizată (α1 < 0)

MA(2) Vârf semnificativ pentru prima şi a doua întârzieri, alţi coeficienţi sunt nuli pentru întârzierile > 2

Descreşterea exponenţială sau sinusoidală după semnele α1 şi α2

MA(q) Vârf semnificativ pentru primele q întârzieri, alţi coeficienţi sunt nuli pentru întârzierile > q

Descreşterea exponenţială şi/sau sinusoidală

ARMA(1,1)

Descreştere geometrică în baza primei întârzieri, semnul este determinat de θ1 – α1

Descreştere exponenţială (α1 > 0) sau sinusoidală amortizată (α1 < 0)

ARMA(p,q)

Descreştere exponenţială sau sinusoidală amortizată tăiată după (q – p) întârzieri

Descreştere exponenţială sau sinusoidală amortizată tăiată după p – q întârzieri

4) Condiţiile de utilizareModelele AR, MA, ARMA nu sunt reprezentative decât pentru cronici:

- staţionare de tendinţă;- corectate de variaţiile sezoniere.

B. Extinderea proceselor ARIMA şi SARIMATestele Dickey-Fuller şi Dickey-Fuller Mărite văzute mai sus permit de a determina

dacă seria este staţionară şi în caz de nestaţionaritate, de ce tip e: TS sau DS.Dacă seria studiată este de tip TS, se recomandă de a staţionariza prin regresie asupra

timpului şi reziduul de estimare este atunci studiat conform metodologiei Box-Jenkins. Aceasta permite de a determina ordinele p şi q a părţilor AR şi MA a reziduului. Modelul este mereu, în acest caz, un ARMA(p,q).

Dacă seria studiată este de tip DS, se recomandă de a e staţionariza prin trecerea la diferenţe conform ordinului de integrare I = d (adică de câte ori trebuie diferenţiată seria pentru a o face staţionară). Seria diferenţiată este atunci studiată conform metodologiei Box-Jenkins care permite de a determina ordinele p şi q a părţilor AR şi MA se notează acest tip de model ARIMA(p,d,q).

Modelele SARIMA permit de a integra un ordin de diferenţiere legat de o

12

Page 13: Anaiza Previziune Box Jenkins MASTYER (1)

sezonalitate generalizată prin transformarea: (1 – Ds)yt = yt – yt-1 unde s corespunde periodicităţii datelor (s = 4 pentru o serie trimestrială, s = 12 pentru o serie lunară).

III. Metoda Box şi Jenkins

Partea autoregresivă a unui proces, notată AR, este constitută dintr-o combinare lineară finită a valorilor trecute a procesului. Partea medie mobilă, notată MA, este formată dintr-o combinare lineară finită în t a valorilot trecute a unui zgomot alb. Wold (1954) arată că modelele ARMA permit reprezentarea majorităţii proceselor staţionare. Abordarea Box şi Jenkins (1976) constă dintr-o metodologie de studiu sistematic a seriilor cronologice în baza caracteristicilor lor pentru a determina, în familia modelelor ARIMA, cea mai adaptată reprezentare a fenomenului studiat. Trei etape principale sunt definite.

A. Cercetarea reprezentării adecvate: identificareaFaza de identificare este cea mai importantă şi cea mai dificilă: ea constă în

determinarea modelului adecvat din familia modelelor ARIMA. Ea este fondată pe studiul corelogramelor simple şi parţiale. Se poate încerca prezentarea câtorva reguli simple ce uşurează cercetarea parametrilor p, d, q a modelului ARIMA.

1) DesezonalizareaÎn cazul unei serii afectată de o mişcare sezonieră, se recomandă de a o scoate în

prealabil, din prelucrarea statistică. Această sezonalitate este adăugată la seria prevăzută la sfârşitul prelucrării pentru a obţine o previziune în termeni bruţi.

2) Cercetarea staţionarităţii în termeni de tendinţăDacă studiul corelogramei simple şi testele statistice la care se raportează (statistica

Q) prevede o serie afectată de o tendinţă, se recomandă de a-i studia caracteristicile conform testelor Dickey-Fuller. Metoda de eliminare a tendinţei este funcţia procesului DS sau TS subordonată cronicii studiate.

După staţionarizare, putem identifica valorile parametrilor p, q din modelul ARMA.- Dacă corelograma simplă nu are decât primii săi q termeni (q = 3 maxim) diferiţi

de 0 şi că termenii corelogramei parţiale scad încet, putem pronostioca MA(q);- Dacă corelograma parţială nu are decât primii săi p termeni (p = 3 maxim) diferiţi

de 0 şi că termenii corelogramei simple scad încet, aceasta caracterizează AR(p);- Dacă funcţiile de autocorelare simplă şi parţială nu par a fi tăiate, este vorba de un

proces de tip ARMA, a căror parametri depind de foma particulară a corelogramelor.

B. Estimarea parametrilorMetodele de estimare sunt diferite în dependenţă de tipul procesului diagnosticat. În

cazul unui model AR(p), putem aplica o metodă a celor mai mici pătrate sau chiar putem folosi relaţiile existente între autocorelări şi coeficienţii modelului (ecuaţiile Yule-Walker).

Estimarea parametrilor modelului MA(q) se dovedeşte a fi complexă. Box şi Jenkins sugerează de a utiliza o procedură iterativă de tip măturare pe care o putem arăta în felul

13

Page 14: Anaiza Previziune Box Jenkins MASTYER (1)

următor.Să presupunem procesul:

(1 - θ1D – θ2D2)yt = (1 - α1D – α2D2)εt

pe care îl putem scrie:

Notăm: , şi deci avem:

[6]De unde obţinem:

unde [7]Acum putem începe procedura de măturare în baza a două intervale de valori

plauzibile pentru ( ) şi de un pas adăugare.Apoi, pentru fiecare pereche de valori ( ), notăm şi , şi calculăm

valorile estimate ale lui în baza relaţiei[7]:

După calculul tuturor valorilor , se estimează parametrii θ1 şi θ2 prin metoda celor mai mici pătrate aplicată ecuaţiei [6]:

[8]Reţinem valorile şi care reduc la minimum suma pătratelor

reziduurilor obţinută din regresia ecuaţiei [8].Această metodă de estimare nu e valabilă decât dacă numărul parametrilor de estimat

nu este destul de mare.Se pot menţiona metodele de estimare bazate pe o maximizare a funcţiilor de

asemănare ce recurg atunci la procedurile iterative de regresie nelineară, precum cele prezentate în cap.6.

C. Teste de adecvare a modelului de previziuneParametrii modelului fiind estimaţi (se verifică convergenţa procedurii iterative de

estimare), vom examina acum rezultatele de estimare. Coeficienţii modelului trebuie să fie semnificativ diferiţi de 0 (testul t Student se aplică

în mod clasic). Dacă un coeficient nu este semnificativ diferit de 0, se recomandă de a prevedea o nouă specificare prin eliminarea ordinului modelului AR sau MA nevalabile.

Analiza reziduurilor se efectuează în baza a două criterii ce trebuie respectate:- media este nulă, în caz contrar se recomandă de a adăuga o constantă la model;- reziduul este un zgomot alb, statisticile şi Box-Pierce şi Ljung-Box (gradul de

libertate este egal cu numărul de întârzieri h micşorat cu numărul de coeficienţi estimaţi), permit de a testa această ipoteză. Dacă reziduul nu este un zgomot alb, aceasta înseamnă că specificarea modelului este incompletă şi că lipseşte cel puţin

14

Page 15: Anaiza Previziune Box Jenkins MASTYER (1)

un ordin al procesului.Faza de validitate a modelului este foarte importantă şi necesită de cele mai dese ori o

întoarcere la faza de identificare.Atunci când modelul este valabil, previziunea poate fi calculată la un orizont de

câteva perioade, limitate căci varianţa erorii de previziune creşte foarte repede odata cu orizontul.

Se pot rezuma fazele metodologiei Box şi Jenkins precum e arătat în schema 2.

15

Seria xt. Analiza graficului şi a corelogramei

Analiza sezonalităţii

Testul Dickey-Fuller

Trecerea la diferenţe, dacă DSRegresie asupra timpului, dacă TS

Seria staţionară yt

Analiza corelogramelor simplă şi parţială

Determinarea ordinelor p şi q a proceslului ARMA

Estimarea parametrilor

Testul Student. Coeficienţii nesemnificativi sunt eliminaţi

Teste ale reziduurilor. Sunt ele zgomote albe?

Nu. Se adaugă un ordin p sau qDa

Previziunea ARMA

Recolorarea seriei (exponenţială, sezonalitate, …)

Schema 2 – Etapele metodologie Box şi Jenkins