Download ppt - Introducere În Econometrie

ECONOMETRIE

Titular de disciplină: Conf.univ.dr. Cornelia Tomescu

CUPRINS:

CAP.I. NOŢIUNI INTRODUCTIVE PRIVIND STUDIUL ECONOMETRIEI CAP.II. ELABORAREA MODELELOR ECONOMETRICE CAP.III. VERIFICAREA IPOTEZELOR STATISTICE CAP.IV.MODELE LINIARE UNIFACTORIALE CAP.V. MODELE MULTIFACTORIALE CAP. VI. MODELE DE REGRESIE NELINIARE

CAP.I. NOŢIUNI INTRODUCTIVE PRIVIND STUDIUL ECONOMETRIEI

Ce este econometria?

• Termenul de econometrie = eikonomia + metron• în anii ’30 ai secolului trecut - termenul de

econometrie (econometrics) = dezvoltarea teoriei pure printr-un punct de vedere matematic, cât şi estimarea empirică a relaţiilor economice.;

• astăzi - econometria se situează între economia matematică (mathematical economics) şi statistica economică (economic statistics).

• Diverse opinii care conturează definiţiile econometriei - perspectiva din care este privit domeniul:– ramură a economiei - obiectivele finale urmărite

de demersul econometric, obiective care se referă la argumentarea pe bază de date empirice a unei teorii economice sau la fundamentarea unei prognoze sau a unei politici economice;

– ramură a statisticii - metodele utilizate, caracteristicile acestora şi nu în ultimul rând, datele statistice necesare aplicării metodelor, atunci, conform unor autori.

Definiţii ale econometriei• Fr. Perroux - „econometria este o ramură a economiei,…, o economie

de intenţie ştiinţifică”;• Frisch - ceea ce realizează econometria reprezintă îmbinarea punctelor

de vedere care se referă la teoria economică, statistică şi matematică privind natura relaţiilor cantitative din economie;

• Samuelson, Koopman şi Stone - econometria presupune o analiză cantitativă a fenomenelor economice bazată pe dezvoltarea concomitentă a teoriei şi observării puse în concordanţă cu metodele de inferenţă (inducţie statistică) adecvate;

• Walters - econometria, ca şi economia, sunt discipline utilitare întrucât formulează şi investighează ipoteze, ceea ce poate fi foarte util în luarea deciziilor atât pentru guverne cât şi pentru oamenii de afaceri.

• Onicescu şi Botez - econometria este o ramură a ştiinţelor economice care îşi propune studierea relaţiilor dintre variabilele economice, aşa cum apar acestea postulate într-un model abstract.

Definiţia econometriei• În sens larg, econometria presupune analize bazate pe estimări numerice

atât a relaţiilor de dependenţă dintre fenomenele economice cât şi a aspecte lor ce privesc gradul de concentrare, de sensibilitate, dar şi intensitate a fluctuaţiilor din economie, optimizarea producerii acestora etc., adică cea mai mare parte a proceselor care implică transformări şi a căror analiză câştigă în rigoare prin exprimări cantitative (măsurare).

• În sens restrâns, econometria se limitează la studiul relaţiilor de dependenţă dintre variabilele economice, inclusiv a variabilităţii proceselor economice în timp apelând cu precădere la analiza de regresie precum şi la diverse procedee de testare.

• Econometria reprezintă un domeniu (sau, în orice caz, un mod specific de abordare) al economiei prin care se urmăreşte exploatarea datelor statistice care descriu desfăşurarea proceselor economice (în timp sau în raport cu factorii determinanţi) prin metode cantitative, predominant statistice, în vederea realizării unui spor de rigurozitate în ce priveşte teoria economică dar şi legat de analiza şi prognoza proceselor economice.

Avantajele utilizării econometriei

• în reprezentările econometrice se introduc variable care privesc bogăţia naţiunii (producţia, consumul, capitalul fix etc.) şi câştigul economic (profit, salarii, dobândă, rentă etc.) şi ecuaţii de tip comportamental, resursele având o importanţă deosebită;

• se acordă interes pentru reprezentări cu caracter sistemic în care sunt prezente obiectivele şi conexiunile existente între variabile;

• reprezentările econometrice se pot referi la un sector de activitate, sau la un ansamblu de activităţi, structurate sub formă de ecuaţii şi sisteme sau blocuri de ecuaţii;

• ecuaţiile de tip econometric cuprind factorii care determină evoluţia unor procese şi preţul în diferitele forme de manifestare (ecuaţii de balanţă pentru determinarea echilibrelor în economie);

• în modelul econometric se regăsesc obiectivele finale ale economiei şi obiectivele specifice proceselor economice (variabile endogene-efect);

• modelele econometrice permit simularea politicilor economice;• modelele econometrice exprimă echilibrul dintre cerere şi ofertă şi

neliniaritatea cererii în raport cu creşterea factorilor.

Obiectul, metoda şi domeniul econometriei

• Obiectul econometriei = aspectul cantitativ al economiei, legăturile dintre ansamblul economiei naţionale şi elementele sale componente, comportamentul acestora.

• Domeniul econometriei - aceasta caută valori numerice pentru parametrii modelelor economiei matematice şi are ca echivalente analoage modele matematico-economice.

• Metoda econometriei = rezultatul îmbinării metodelor matematice cu cele statistice şi de aici rezultă şi o delimitare clară a care trebuie evidenţiată între econometrie şi economia cantitativă în general.

Econometria şi economia

• Asemănări:– şi una şi cealaltă se confruntă cu o zonă "obscură"

care deseori afectează analizele, prognozele şi deciziile. Această zonă îşi are rădăcinile îndeosebi în psihologie şi se dezvăluie printr-un comportament uman deseori previzibil;

– fenomenele economice se dezvoltă în timp conform unor legităţi - aspect în care crede atât teoria economică, cât şi econometria. Pornind de la acest lucru ambele urmăresc elaborarea de prognoze;

– în ambele domenii, esenţialul îl constituie ansamblul relaţiilor dintre variabilele care intervin în desfăşurarea procesului.

Econometria şi economia• Deosebiri:

– în timp ce economia se bazează pe relaţii de tip determinist, econometria se foloseşte, de cele mai multe ori, de relaţii de natură aleatoare şi din acest motiv perturbaţia este frecvent luată în calcul;

– dacă economia se bazează îndeosebi pe raţionamente fundamentate pe practica economică şi pe ipoteze care, în cele mai multe cazuri, au valabilitate doar în condiţii de maximă normalitate, econometria se bazează în special pe informaţii concentrate în datele statistice, pe teoria economică precum şi pe soluţiile rezultate din rezolvarea modelului.

Econometria şi statistica

• Asemănări:– interesul deosebit al celor două ştiinţe pentru

aspectele numerice prezentate de fenomenele analizate precum şi pentru exprimarea prin formule;

– analiza relaţiilor cauză-efect cu ajutorul funcţiilor matematice şi prezentarea de soluţii însoţite, cel mai adesea, de garanţii probabiliste;

– importanţa acordată studiului acelor fenomene care se realizează într-un număr mare de cazuri, dezvăluind legităţi sau, cel puţin, repetabilităţi utile în elaborarea de predicţii.

Econometria şi statistica

• Deosebiri:– opţiunea privind metodele porneşte de la necesităţile

de analiză şi previziune din economie;– accentul deosebit de mare pus în econometrie pe

ipotezele metodelor de estimare şi, mai ales, pe procedeele destinate atenuării sau eliminării frecventelor nerespectări ale acestor ipoteze de către datele empirice privind evoluţia fenomenelor economice;

– faptul că unitatea, cazul, elementul pot face obiect de studiu în econometrie.

FUNDAMENTE TEORETICE PRIVIND MODELAREA

ECONOMETRICĂModelul econometric

Modelul econometric

Definiţie:Modelul econometric reprezintă o imagine

simplificată a relaţiilor dintre variabilele economice care priveşte atât reprezentarea anatomică a proceselor economice (definirea variabilelor), cât şi descrierea fiziologică (relaţii, condiţionări, mecanisme de funcţionare).Componente:- variabile;- parametrii;- relaţii.

Modelul econometric

Variabilele- variabile exogene - variabile endogene - variabile aleatoare

Parametrii- parametrii de regresie;- estimatori ai parametrilor de regresie; - parametrul „liber”.

Relaţiile- relaţii funcţionale, bazate pe ecuaţii de regresie;- relaţii de identitate (de balanţă, de echilibru).

Modelul econometricCondiţii:

• să poată reflecta structura sistemică a elementelor unui ansamblu real;• să aparţină unui anumit număr de transformări, definite pentru un anumit

model din aceeaşi familie;• să permită reflectarea modificărilor posibile ale oricărora dintre elementele

sale componente;• să poată explica satisfăcător toate faptele observate;• să fie rezolvabil prin tehnici cunoscute.

Perspective:• reprezintă o cale de a preîntâmpina surprizele economiei de piaţă printr-o

evaluare apriorică a comportamentului diverşilor agenţi economici;• permite anticiparea efectului unor decizii în vederea alegerii celei mai bune

politici economice (cu efecte benefice maxime şi cu implicaţii nedorite minime);

• facilitează dezvoltarea teoriei economice, întrucât este greu de acceptat că se poate face teorie economică realistă fără a apela la cuantificări, la evaluări, iar evaluările, fără o teorie adecvată nu pot demonstra nimic.

Construcţia modelelor econometrice

Ipotezele elaborării unui model econometric

Ipotezele elaborării unui model econometric

Ecuaţia unui model econometric:ƒ(x) = y

Ipotezele elaborării unui model econometric:• variabilele exogene şi endogene sunt mărimi numerice observate fără erori, iar ui

sunt variabile reziduale aleatoare neobservabile, a căror speranţă matematică este nulă pentru orice valori ale variabilelor independente;

• erorile ui urmează o distribuţie independentă de valorile observate pentru variabilele independente şi de numărul de observaţii, având o dispersie σ` şi o speranţă matematică nulă indiferent de valorile observate pentru variabilele exogene. În consecinţă distribuţia de probabilitate a variabilelor reziduale ui rămâne aceeaşi indiferent de valorile observate pentru variabilele independente;

• observaţiile sunt independente între ele, erorile rezultate din două observaţii diferite nefiind condiţionate între ele;

• erorile – variabile reziduale ui urmează o lege normală de distribuţie (ipoteza de normalitate);

• la o creştere nefinită a numărului de observaţii, valorile observate ale variabilelor exogene se reduc la media acestora, iar abaterea lor pătratică tinde spre o limită finită, nenegativă;

• nu se dispune de nici un fel de informaţii cu privire la mărimea şi semnificaţia parametrilor numerici ai modelului.

Etapele elaborării unui model

econometric • analiza de detaliu a fenomenului, procesului sau a sistemului economic real;• descrierea mecanismului ce caracterizează sistemul interdependenţelor factoriale

din cadrul fenomenului, procesului sau sistemului dat;• formularea principiilor fundamentale ale legăturilor dintre elementele componente

ale fenomenului, procesului sau sistemului, ale legilor si legităţilor stohastice, care privesc însă structura internă, mecanismul real al dezvoltării;

• definirea variabilelor modelului econometric;• alegerea structurii generale a modelului;• estimarea parametrilor modelului ecometric pe baza unui set disponibil sau cules

de date;• verificarea verosimilităţii modelului econometric;• aplicarea modelului în conformitate cu scopul propus;• confruntarea modelului cu alte situaţii ipotetice, posibile, corectarea şi adaptarea

sa la modificarea probabilă a numărului de variabile, a sensului şi intensităţii legăturilor şi influenţelor sau a unor condiţii de mediu;

• specificarea semnificaţiilor şi adaptarea deciziilor economice.

Etapele elaborării unui model econometric

Modelul econometric definit – cerinţe:• sunt definite variabilele exogene şi domeniul lor de variaţie;• este definit un ansamblu de structuri prin care se stabileşte o legătură

funcţională sau aleatoare între variabilele exogene şi cele endogene, precum şi legea de distribuţie a variabilelor reziduale.Acţiuni premergătoare aplicării generalizate a unui model econometric construit:

• testarea prin verificarea corespondenţei între structura dată a modelului şi datele reale cu privire la fenomenul, procesul sau sistemul economic a cărui stare sau evoluţie o descrie. În cazul în care testul este satisfăcător, modelul este reţinut; în caz contrar se modifică ipotezele, se introduce noi variabile explicative, se concept sau se consideră noi expresii ale funcţiilor ƒ sau se adoptă unele specificaţii mai puţin respective cu privire la legea de distribuţie a erorilor;

• estimarea parametrilor modelului şi a caracteristicilor legii de distribuţie a variabilei aleatoare;

• utilizarea modelului în explicarea mecanismului ce caracterizează fenomenul, procesul sau sistemul economic analizat.

Etapele elaborării unui model econometric

Elemente necesare rezolvării unui model econometric:

• un ansamblu de observaţii (date statistice) asupra variabilelor endogene (y din Y) definite prin n mărimi numerice observate în T perioade) (situaţii distincte) astfel încât eşantionul ales va putea fi dat ca un spaţiu Euclidian de n – T dimensiuni;

• un număr de variabile exogene cunoscute şi măsurabile;

• un ansamblu de distribuţii de probabilitate a variabilelor y din Y în spaţiul n – T dimensiuni.

Tipologia modelelor econometrice

Categorii de modele econometrice:

- modele de trend (cu serii temporale);

- modele cu o singură ecuaţie;

- modelele cu mai multe ecuaţii (de simulare, structurale).


Criterii de clasificare: 1.În funcţie de numărul variabilelor implicate în model:

- modele econometrice unifactoriale;- modele econometrice multifactoriale.

2. În funcţie de forma funcţiilor considerate: - modele econometrice liniare;- modele econometrice neliniare.

3.În funcţie de modul de considerare a influenţelor în cadrul modelului:

- modele econometrice de tip aditiv;- modele econometrice de tip multiplicativ.


4. După întinderea în timp:

- modele econometrice pe termen scurt;

- modele econometrice pe termen lung.

5. După domeniul economic abordat:

- modele microeconometrice;

- modele macroeconometrice.

Specificarea şi identificarea modelelor econometrice

Specificarea unui model econometric:- stabilirea ecuaţiilor care intră în componenţa sa. Pentru aceasta, este

foarte important să se cunoască cu exactitate domeniul economic ce urmează a fi analizat, respectiv caracteristicile acestuia, deoarece fiecare tip de economie, de proces sau fenomen economic presupune elaborarea unui model econometric adecvat.

- permite: a. stabilirea şi includerea în model a acelor variabile independente care au o influenţă covârşitoare asupra variaţiei variabilei dependente;

b. stabilirea corectă a formei ecuaţiilor modelului econometric.

Un model econometric poate fi considerat ca specificat atunci când se cunosc următoarele elemente:

– structura modelului;– valorile parametrilor modelului;– valorile variabilelor dependente (de stare) şi a celor independente, la un

moment dat sau pentru o perioadă precizată de timp.


Identificarea este o etapă specifică modelelor cu ecuaţii simultane.Tipuri de ecuaţii :

• ecuaţii identificate;• ecuaţii neidentificate;• ecuaţii supraidentificate.• O ecuaţie a unui model econometric este:• identificată – când numărul variabilelor absente din ecuaţie (dar prezente

în model) este mai mic cu unu decât numărul de ecuaţii;• neidentificată – când numărul variabilelor absente este mai mic decât

numărul de ecuaţii minus unu;• supraidentificată – când numărul de variabile absente este mai mare

decât numărul de ecuaţii minus unu.Ca urmare, un model econometric este considerat ca fiind identificat atunci când fiecare ecuaţie de regresie din cadrul modelului (ecuaţiile de identificare nu se iau în consideraţie) este identificată.


Soluţii pentru a elimina neidentificarea: - eliminarea din ecuaţia neidentificată a uneia sau mai multor variabile independente, variabile a căror influenţă asupra variabilei efect nu este considerată determinantă. Se procedează la calcularea coeficientului de determinaţie multiplă pentru variabilele rămase şi, dacă acesta nu este diminuat semnificativ, se poate recurge la eliminarea variabilei sau variabilelor suspectate.- includerea de variabile independente în ecuaţiile caracterizate ca neidentificate sau supraidentificate, variabile care exercită o influenţă destul de mare asupra variabilei dependente;- alegerea unei alte forme pentru ecuaţia neidentificată (dacă acest lucru nu contravine celor stabilite în etapa de specificare a modelului).

Cerinţe ale modelării econometrice

• 1. depistarea adevăratelor cauze care determină nivelul şi evoluţia fenomenelor si proceselor analizate;

• 2. considerarea cu prioritate a factorilor esenţiali şi includerea influenţei factorilor neesenţiali în variabila aleatoare;

• 3. evidenţierea existenţei independenţei sau multicoliniarităţii potenţiale a variabilelor explicative. Astfel, dacă prin analiza calitativă se constată că între doi sau mai mulţi factori există o relaţie obiectivă, de natură cauzală, atunci aceştia nu se reţin în totalitate ca factori de influenţă ci se reduc, rămânând doar factorii reciproc independenţi sau dependenţi într-o mai mică măsură;

• 4. specificarea variabilelor sub raportul formei de exprimare, prin stabilirea unui sistem unic de indicatori pentru caracterizarea fenomenului sau procesului analizat;

• 5. alegerea formei ecuaţiei de regresie şi deci a modelului celui mai adecvat descrierii legăturii analizate. Această alegere este înlesnită de cunoaşterea şi înţelegerea fenomenului sau procesului analizat, de existenţa unor posibilităţi reale de sintetizare în relaţii matematice a mecanismului de funcţionare a sistemului de interdependenţe;

• 6. considerarea unui număr suficient de mare de observaţii precum şi a omogenităţii datelor utilizate. Acest lucru este cu atât mai necesar cu cât în calculele econometrice se operează cu mărimi medii, care reflectă cu atât mai precis proprietăţile tipice ale colectivităţilor, cu cât acestea sunt mai omogene.

MODELUL ECONOMETRIC UNIFACTORIAL LINIAR

Definirea modelului liniar pentru două variabile (modelul unifactorial)


Un model unifactorial se prezintă astfel:y = f (x) + u

unde:• y - variabila endogenă sau dependentă sau efect sau rezultativă

(cu valorile y1 , y2 , …, yk, … , yn )• x – variabila exogenă sau independentă sau cauzală sau factorială

( cu valorile x1, x2, …, xk, …, xn)• u - variabila reziduală, aleatoare sau eroare sau perturbaţie (cu

valorile u1, u2, …, uk, …, un)


În contextul modelării econometrice, noţiunea de liniar poate fi înţeleasă în mai multe sensuri şi anume:

• a) liniar în raport cu variabilele şi cu parametrii;Modelul general are forma: y = a0 + a1x ;

• b) liniar în raport cu parametrii, dar neliniar în raport cu variabilele; Modelele pot fi de forma: y= a0 + a1x + a2x2; y= aXα Zβ (pentru α ≠ l, β ≠ 1); y = a0 + a1 (1/x);

• c) liniar în raport cu variabilele, dar neliniar în raport cu parametrii; Modelele pot avea forma: y = a + a2x; y = x;

• d) neliniar în raport cu variabilele şi eu parametrii;Forma modelului poate fi: y = a2x + ax2.


Fiind cel mai simplu model econometric, modelul liniar unifactorial are numeroase aplicaţii în teoria economică. Amintim doar câteva dintre acestea:

• 1. funcţia de consum din modelul lui Keynes :Ct = a0 + a1 Yt

Ct - consumul pentru un an,Yt - venitul pentru aceeaşi perioadă,a, b sunt parametri i modelului;

• 2. legea cererii –C = f(p) + u

C = volumul cererii unui produs p = preţul unitar al produsului;

• 3. legea ofertei O = f(p) + u

O = volumul ofertei; • 4. modelul cheltuielilor de producţie (Ch) în funcţie de volumul producţiei (Q)

Ch = f(Q) + u• 5. modelul legii impozitului (I) pe venit (V)

I = f(V) + u, variabila aleatoare u semnificând abaterea de la dependenţa funcţională a impozitului pe venitul salariaţilor, ca urmare a unor măsuri de politică socială.


Elaborarea modelului liniar unifactorial presupune:1. Identificarea celor două variabile folosite pentru definirea modelului. Se folosesc următoarele notaţii:- Y este simbolul pentru variabila endogenă sau variabila rezultativă. Seria de date pentru aceasta se notează prin ;- X este simbolul pentru variabila exogenă sau factorială. Pentru aceasta se defineşte seria ;2. Specificarea parametrilor modelului. Se notează prin a1 panta dreptei de regresie şi a0 este termenul liber sau intercept. Dacă valorile celor doi parametri sunt cunoscute, se defineşte o dependenţa deterministă între cele două variabile:

Y = a0 + a1 X.Se definesc estimatorii celor doi parametri â0 şi â1. 3. Definirea variabilei reziduale. Se notează variabila reziduală prin u.

1,i iy n

1,i ix n


Motive pentru includerea în model a variabilei reziduale:- seriile de date pentru cele două variabile sunt afectate de erori de măsurare. Acestea au o influenţă directă asupra estimării celor doi parametri; - în economie nu se întâlneşte o dependenţă liniară funcţională între două variabile, ci mai degrabă una de tip probabilist. Asupra variabilei endogene mai acţionează o serie întreagă de factori care nu sunt specificaţi în cadrul modelului de regresie. Variabila reziduală este cea care sintetizează influenţa acestor factori; - seriile de date sunt obţinute în urma unor observări asupra unor eşantioane;


4. Specificarea modelului de regresie. În raport cu natura seriilor date sunt identificate două domenii de utilizare a modelului liniar de regresie:- în analiza dependenţei dintre două variabile, în cazul în care seriile date sunt înregistrate la nivelul unităţilor statistice ale populaţiei pentru o perioadă sau un moment;- pentru caracterizarea dependenţei dintre două variabile într-un anumit orizont de timp. În acest caz sunt folosite seriile de timp. 5. Specificarea setului de ipoteze. Ipoteze care trebuie verificate în vederea utilizării ulterioare a modelului econometric:- seriile de date nu sunt afectate de erori de măsură;- variabila reziduală este de medie zero;- varianţa variabilei reziduale este invariantă în timp; - reziduurile nu sunt autocorelate;- variabila exogenă nu este corelată cu variabila reziduală. Aceasta se mai numeşte proprietatea de omoscedasticitate a modelului de regresie.6. Alegerea metodei de estimare a parametrilor modelului liniar de regresie.

Estimarea parametrilor

Estimarea parametrilor unui model econometric se poate realiza cu ajutorul mai multor metode:

• metoda celor mai mici pătrate (M.C.M.M.P.);• metoda punctelor empirice;• metoda punctelor medii;• metoda celor mai mici pătrate generalizată;• metoda verosimilităţii maxime etc.

Metoda celor mai mici pătrate (M.C.M.M.P.)

Pentru modelele liniare unifactoriale:

Acest sistem poartă numele de sistem de ecuaţii normale şi are câteva proprietăţi şi anume:

• 1) Variabila aleatoare ui este de

sumă nulă şi evident, de medie 0;

• 2) Suma valorilor empirice este egală cu

suma valorilor teoretice - principiul conservării informaţiilor.

210

10

iiii

ii

xaxayx

xaany

0)(1

10

i

n

iii uxaay 0)(

iuM

0)()(1

10

ii

n

iii yyxaay


3) dreapta de regresie trasată pe baza MCMMP trece prin punctul y de coordonate După estimarea parametrilor a0 şi a1, prin valorile , se vor putea calcula valorile teoretice ale fenomenului explicat y,

şi apoi estimaţiile variabilei aleatoare

Calitatea estimărilor, ca şi opţiunea între metodele de estimare se bazează pe următoarele criterii:

• gradul de determinare să fie cât mai mare;• abaterile dintre valorile empirice (yi) şi cele teoretice ( ) să fie cât mai mici;• estimările obţinute sunt soluţii eficiente, consistente;• costul aplicării metodei este minim.

yx,

ixaaiy 10

iyiyiu

iy


Ipotezele M.C.M.M.P. :• datele sunt obţinute corect, fără erori sistematice de observare şi în număr suficient de mare

(depăşind, în orice caz, numărul de parametrii care urmează să fie estimaţi) aşa încât soluţiile să prezinte stabilitate;

• variabila factorială nu este stochastică şi prezintă aceleaşi valori în eventualitatea în care repetăm sondajul;

• variabila x prezintă variabilitate în ceea ce priveşte nivelurile înregistrate în cadrul unui eşantion de date, astfel încât rolul acesteia să poată fi pus în evidenţă;

• modelul de regresie este liniar în raport cu parametrii;• modelul de regresie este corect specificat în sensul alegerii funcţiei potrivite (liniare sau neliniare)

şi includerii factorilor importanţi astfel încât gradul de determinare să fie suficient de mare;• variabila reziduală este de medie 0 şi urmează o repartiţie normală;• variabila reziduală prezintă o dispersie (un grad de împrăştiere) egală pentru diferitele segmente

de valori xi, caz în care eroarea este etichetată ca fiind omoscedastică, spre deosebire de situaţia contrară când este caracterizată drept eteroscedastică;

• variabila reziduală nu este corelată cu variabila factorială x;• variabila reziduală nu este auto corelată, în sensul că pentru oricare două valori xi şi xj

perturbaţiile aferente ui şi uj , pentru i j, nu sunt corelate;• factorii incluşi în model (varianta multifactorială) sunt independenţi unii în raport cu ceilalţi,

nefiind corelaţi între ei.

Metoda punctelor empirice

Pentru cazul modelului econometric unifactorial liniar:

- se vor alege două perechi (xi, yi). Astfel, de exemplu: (x3, y3); (x6, y6). Vom avea:

6106

3103xaay

xaay

;

61

31

66

33

0

x

x

xy

xy

a ;

61

31

61

31

1

x

x

y

y

a

Metoda punctelor medii

Pentru modelul unifactorial liniar:Dacă valorile pentru xi, şi yi sunt considerate pentru

vom avea:• xi: x1, x2, x3, x4, x5, x6, x7, x8, x9• yi: y1, y2, y3, y4, y5, y6, y7, y8, y9

Subseriile formate:

9,1i

5432

5432yyyy

xxxx

45432

1

45432

1yyyy

y

xxxxx

9876

9876yyyy

xxxx

498762

49876

2yyyy

y

xxxxx

Metoda punctelor medii

Se obţine:

21021101

xaay

xaay

;

21

1122

11

0

x

xxy

xy

a

;

21

11

2111

1

x

xy

y

a

Corelaţia

Spunem că variabilele X si Y sunt corelate dacă una din ele este o funcţie de cealaltă variabilă (spre exemplu: Y=αX+β).

Tipuri de corelaţie:

-Liniară - Liniară

pozitivă negativă

- Corelaţie inexistentă

- Corelaţie neliniară

Ca o măsură a corelaţiei liniare între variabilele X şi Y introducem coeficientul de corelaţie liniară Pearson (r):

sau

unde:

b – coeficientul de regresie (a1 )

σx - abaterea medie pătratică a caracteristicii factoriale

σy - abaterea medie pătratică a caracteristicii dependente

Coeficientul de corelaţie:

•Este un indicator care măsoară numai intensitatea legăturii de tip liniar dintre două variabile x şi y. •Se calculează ca o medie aritmetică a produsului abaterilor normale normate ale celor două variabile.•Poate lua valori cuprinse între -1 şi +1, adică satisface inegalităţile: - 1 ≤ ryx ≤ +1. •Semnul, ca şi cel al coeficientului de regresie, indică sensul legăturii: semnul minus indică legătura inversă, semnul plus indică legătura directă.•Cu cât coeficientul de corelaţie are valori mai apropiate de 1 sau –1, cu atât corelaţia rectilinie dintre variabilele x şi y este mai puternică. Pe măsură ce coeficientul de corelaţie se apropie de zero, scade şi intensitatea legăturii dintre cele două variabile. •În cazul în care r = 0, variabilele sunt independente ori necorelate liniar, iar pentru egal cu 1, rezultă dependenţa funcţională între cele două variabile.

Corelograma (diagrama norului de puncte) – metoda grafică de analiză a legăturii dintre două variabile.•Se construieşte pe baza unui sistem de axe OXY, prin reprezentarea pe OX a valorilor variabilei cauză şi pe OY a valorilor variabilei efect.•Evidenţiază patru aspecte privind corelaţia:-Existenţa corelaţiei -Intensitatea corelaţiei-Sensul corelaţiei-Forma corelaţiei

Raportul de corelaţie – măsură a legăturii dintre două variabile, corelate neliniar, dar şi liniar.

Interpretare:-Raportul de corelaţie poate lua valori între 0 şi 1. -Cu cât valoarea raportului este mai apropiată de 1 cu atât legătura de corelaţie este mai puternică şi invers.-În cazul corelaţiei liniare, raportul de corelaţie este egal cu coeficientul de corelaţie luat în valoare absolută.-Egalitatea celor doi indicatori poate fi considerată ca un test de verificare a liniarităţii legăturii.

Raportul de determinaţie - reprezintă proporţia din variaţia totală a lui Y care este explicată de influenta lui X.

Interpetare:•Raportul de determinatie ia valori in intervalul [0,1].•R2 = 0 dacă a1=0, deci dacă ecuaţia de regresie este o dreaptă orizontală. În acest caz variabila X nu are putere explicativă (X nu influenteaza variatia lui Y).•R2 = 1 dacă punctele determinate de observaţiile făcute asupra variabilelor x şi y se află toate pe o dreaptă, caz în care erorile vor fi zero.

VERIFICAREA IPOTEZELOR STATISTICE

• 1. Etapele verificării ipotezelor statistice• 2. Testul Student (t)

2.1. Fundamente teoretice2.2. Testarea parametrilor unui model

econometric cu Testul t2.3. Testarea indicatorilor corelaţiei

• 3. Testul Snedecor (F)• 4. Testul χ2• 5. Testul Kolmogorov-Smirnov (D)

Etapele verificării ipotezelor statistice

Motive:• numărul redus de date cu care deseori se lucrează

pentru a ajunge la estimaţii care sã poatä fi generalizate;• dificultatea departajării influentei factorilor sistematici de

influenţele aleatoare în condiţiile obţinerii de date dintr-un domeniu economic supus simultan acţiunii unui ansamblu de factori diferiţi ca putere şi sincronizare a influenţelor.Ipotezele care se verifică:

- Ipoteza nulă – H0

- Ipoteza alternativă – H1


Etape:

1. stabilirea obiectivului urmărit. 2. stabilirea ipotezei nule (Ho) 3. opţiunea în ceea ce priveşte: testul statistic indicat corespunzätor

obiectivului urmärit, repartiţia care guverneazä valorile supuse verificãrii, probabilitatea de a emite o eroare de genul 1 (având de ales, de regulă, între =0,05, = 0,l0, = 0,01, =0,001 în raport de costul erorii şi importanţa acordată preciziei), gradele de libertate, ţinând seama îndeosebi de dimensiunea eşantionului şi/sau numärul parametrilor din model

4. obţinerea valorii calculate (tcalculat, Fcalculat etc.) 5. preluarea din tabelul repartiţiei considerate a valorii tabelate 6. formularea concluziei cu privire la acceptarea sau neacceptarea

ipotezei nule


Erori care pot să apară în procesul de verificare a ipotezelor:

a) eroarea de tipul I

b) eroare de tipul II

Riscuri aferente probabilităţii emiterii de erori:

1. Probabilitatea emiterii unei erori de tipul I - riscul de gradul I (se notează cu α).

2. Probabilitatea emiterii unei erori de genul II - risc de gradul II (se notează cu β).


Exemple de situaţii în care se impune verificarea ipotezelor• semnificaţia parametrilor de regresie, caz în care se apelează la

testul t şi testul F;• verificarea verosimilităţii modelului econometric elaborat, caz în

care se apelează la testul t şi analiza variaţiei (bazată pe testul F);

• autocorelarea variabilei reziduale, caz în care se foloseşte testul Durbin- Watson (DW);

• verificarea concordanţei dintre două variabile economice, caz în care se apelează la testul X2;

• verificarea semnificaţiei indicatorilor de corelaţie, caz în care se foloseşte testul t;

• verificarea diferenţelor care pot să existe între două eşantioane sau între un eşantion şi colectivitatea generală supusă analizei prin prisma diferitelor criterii, cu ajutorul mediilor

Testul Student (t) 1. Fundamente teoretice

Când se foloseşte:

- verificarea ipotezelor referitoare la mediile colectivităţilor repartizate normal, atunci când nu se cunosc dispersiile teoretice ;

- testarea egalităţii mediilor pentru eşantioane de volum mic (cu un număr de unităţi mai mic de 30).


Relaţia generală de calcul:

unde:x - variabila independentă;y – variabila dependentăf - numărul gradelor de libertate.

Gradul de libertate reprezintă numărul de elemente independente necesare definirii colectivităţii considerate.

fxyt


Variante ale testului t:

1. când se verifică ipoteza egalităţii mediei de sondaj ( ) cu media colectivităţii generale ( )

• H0: = şi

• H1: ≠

1x0x

sx 0x

sx 0x


Testul t are expresia:

cu f = n-1 grade de libertate

n - volumul eşantionului

dispersia colectivităţii generale

n

S

xxt s

20

0

20S

1

2

n

xx iij


2) când se verifică ipoteza egalităţii a două medii care corespund la două colectivităţi normale, care au aceeaşi dispersie teoretică necunoscută

Expresia testului:

21

2

0201

11

nnS

xxt

s

libertatedegradennf

cu

nn

SnSnS sss

__2

2

11

21

21

22

212 21


3) când se verifică ipoteza egalităţii a două medii corespunzând la

două colectivităţi normale, care au dispersiile teoretice neegale

Expresia testului:

Numărul gradelor de libertate:

2

22

1

21

21

n

S

n

S

xxt ss

1

1

1

1

2

2

1

2

n

c

n

cf

2

22

1

21

1

21

n

S

n

S

n

S

c


Interpretarea testului:

• dacă tcalc > ttab : se respinge ipoteza nulă pentru numărul de grade de libertate şi pragul de semnificaţie corespunzătoare lui ttab;

• dacă tcalc < ttab: se acceptă ipoteza nulă. Probabilitatea cu care se afirmă o ipoteză sau alta este P = 1 – α.

Testul Student (t)2. Testarea parametrilor unui model

econometric cu Testul t

Considerăm modelul liniar unifactorial:

Y = a0 + a1 x + u.

Dispersiile estimatorilor:

- dispersia estimatorului parametrului a0:

- dispersia estimatorului parametrului a1:

- dispersia valorilor variabilei reziduale:

2

2

20

2 1ˆ

xx

x

nSaS

i

n

2

2

12 ˆ

xx

SaS

i

n

2

ˆ 2

2

n

yyS iin

Testul Student (t)3. Testarea indicatorilor corelaţiei

1. Testarea coeficientului de corelaţie simplă

- n este mărimea eşantionului - n-2 – numărul gradelor de libertate - r – coeficientul de corelaţie simplă Ipotezele:H0:coeficientul de corelaţie nu este semnificativH1: coeficientul de corelaţie este semnificativInterpretarea:• tcalc ttab – coeficientul de corelaţie este semnificativ;• tcalc ttab – coeficientul de corelaţie nu este semnificativ,

legătura dintre cele două variabile fiind întâmplătoare.

21 2

nr

rtcalc


2. Testarea raportului de corelaţie

- n este mărimea eşantionului - n-2 – numărul gradelor de libertate - Ry/x – raportul de corelaţieIpotezele:H0: raportul de corelaţie nu este semnificativH1: raportul de corelaţie este semnificativInterpretarea:• tcalc ttab – raportul de corelaţie este semnificativ;• tcalc ttab – raportul de corelaţie nu este semnificativ, legătura

dintre cele două variabile fiind întâmplătoare.

21 2

/

/

nR

Rt

xy

xycalc


3. Testarea coeficientului de corelaţie Spearman şi a coeficientului de corelaţie Kendall

- n este mărimea eşantionului - n-2 – numărul gradelor de libertate - CS, CK – coeficienţii de corelaţie neparametrică Ipotezele:• H0: CS / Ck - nu este semnificativ, variabilele sunt independente;• H1: CS / Ck - este semnificativ, variabilele sunt dependente. Interpretarea:• tcalc ttab – se respinge H0, coeficientul de corelaţie este semnificativ,

variabilele sunt dependente;• tcalc ttab – se acceptă H0, coeficientul de corelaţie nu este semnificativ,

variabilele sunt independente.

21 2

nC

Ct

S

Scalc 2

1 2

n

C

Ct

K

Kcalc

Testul Snedecor (F) • Relaţia generală de calcul:

unde S1

2 şi S22 - dispersiile de sondaj obţinute în două eşantioane

independente• Verificarea verosimilităţii modelului econometric – pune în evidenţă două tipuri

de abateri:1. abaterea valorilor ajustate în raport cu media

- valori ajustate ale variabilei endogenek: numărul parametrilor modelului n – volumul eşantionului

22

212

2

21 ScuSS

SF

1

ˆ2

2

k

yyS ix

iy

Testul Snedecor (F)

2. abaterea valorilor empirice de la valorile ajustate

yi – valori empirice ale variabilei endogene

k – numărul parametrilor modelului

n – volumul eşantionului

Expresia testului F :

• k -1 grade de libertate pentru numărător• n – k grade de libertate pentru numitor

kn

yyS iiu

2

2ˆ

2

2

u

x

S

SF

Testul Snedecor (F)• Ipotezele:

H0: modelul econometric nu este valid

H1: modelul econometric este valid• Interpretare:

Fcalc > Ftab : se respinge ipoteza nulă şi se acceptă ipoteza alternativă, cea a semnificaţiei estimaţiilor, deci modelul este confirmat, valid;Fcalc < Ftab : se acceptă ipoteza nulă, cea a nesemnificaţiei şi deci, modelul trebuie reconsiderat în sensul alegerii altor factori sau a unei alte funcţii de ajustare.

Testul χ2

• Relaţia testului:

cu (k-1)(p-1) grade de libertate

fij - frecvenţelor observate

fij’ - frecvenţele teoreticek - numărul de rânduri(linii);p - numărul de coloane.Frecvenţele teoretice se calculează ca produs al frecvenţelor de pe rândul i, unde i = 1,2,…,k şi al frecvenţelor marginale din coloana j unde j = 1,2,…,p împărţit la după relaţia:

k

i

R

j ij

ijij

f

ff

1 1'

2'2

k

i

P

jijfn

1 1

n

fff jiij

'''''

Testul χ2

În practică, pentru a putea fi aplicat testul χ2, repartiţiile trebuie să îndeplinească următoarele condiţii:

• numărul claselor de grupare să fie minim 5;• frecvenţele absolute ale fiecărui interval de

grupare să fie de minim 5 unităţi (în cazul în care nu este îndeplinită acea condiţie, se vor comasa intervalele adiacente respectând însă prima condiţie).

Testul Kolmogorov-Smirnov (D)• Relaţia de calcul:unde:• Fn1: frecvenţele cumulate ale primului eşantion;• Fn2: frecvenţele cumulate ale celui de-al doilea eşantion.• Relaţia de calcul a valorii teoretice:

unde: • n1 - numărul unităţilor primului eşantion;• n2 - numărul unităţilor celui de-al doilea eşantion.• Dacă Dcalc < Dtab se acceptă ipoteza nulă, a concordanţei

celor două repartiţii, iar dacă Dcalc > Dtab se acceptă ipoteza alternativă.

21max nncalc FFD

21

2136,1nn

nnDtab

ANALIZA VARIABILEI REZIDUALE

1. Normalitatea variabilei reziduale

2. Omoscedastitate. Eteroscedasticitate.

3. Autocorelarea


• Relaţia de calcul a valorilor variabilei reziduale: – în cazul modelelor aditive:

– în cazul modelelor multiplicative:

Cauze ale apariţiei variabilei reziduale:- necunoaşterea desfăşurării în timp a fenomenului analizat sub

aspectul multiplelor sale cauze- manifestarea sa atunci când acţiunea are loc într-un număr mare

de cazuri, etc.Erori care pot să apară:- erori de specificare a modelului - erori de măsurare - erori de eşantionare

t^

tt yyu

^

t

tt

y

yu


• Normalitatea variabilei reziduale:

z

pentru un prag de semnificaţie α stabilit anterior. (P = 1 – α), unde: z – se preia din tabel pentru α fixat.

- abaterea medie pătratică

n – numărul valorilor variabilei reziduale.

s(u)zus(u) t

2n

US(u)

2t


Omoscedastitate. Eteroscedasticitate.

Variabilă reziduală omoscedastică - atunci când prezintă o împrăştiere egală raportat la valorile variabilei independente, fiind deci independentă de evoluţia acestei variabile. Variabilă reziduală eteroscedastică - atunci când nu prezintă o împrăştiere egală raportat la valorile variabilei independente, fiind dependentă de evoluţia acestei variabile. Verificarea omoscedasticităţii, respectiv a eteroscedascităţii - testul Snedecor (F)


Etape:• se împarte şirul valorilor variabilei reziduale în

cel puţin două subşiruri (egale sau nu). • se fixează ipotezele de lucru: • 1. ipoteza nulă : dispersiile celor două subşiruri

nu diferă semnificativ una de cealaltă, adică perturbaţia este omoscedastică;

• 2. ipoteza alternativă : dispersiile celor două subşiruri diferă semnificativ una de cealaltă, adică perturbaţia este eteroscedastică.

ANALIZA VARIABILEI REZIDUALE• se calculează valoarea lui F cu relaţia:

Fcalc=

cu (n/2 – 1)grade de libertate pentru numărător şi numitor.

• se preia valoarea tabelată a lui Ftab din tabelele teoretice speciale;

• se compară cele două valori, astfel:Fcalc. < Ftab – se acceptă ipoteza nulă, deci

perturbaţia este omoscedastică.Fcalc. > Ftab – se respinge ipoteza nulă, deci

perturbaţia este eteroscedastică.

n

nii

n

ii

u

u

12

2

2

1

2

ANALIZA VARIABILEI REZIDUALEVerificarea omoscedasticităţii prin reprezentarea grafică – corelograma

• - dacă punctele definesc un nor de puncte precum cel din figura 1, atunci nu este satisfăcută ipoteza de omoscedasticitate;

Figura 1. Eteroscedasticitate


• - în cazul în care punctele sunt dispuse sub forma unei benzi orizontale (figura 2), atunci variabila reziduală este omoscedastică.

Figura 2. Omoscedasticitate

ANALIZA VARIABILEI REZIDUALETestul Spearman - test de detectare a eteroscedasticităţii

Etape:1. se consideră modelul ;2. se efectuează regresia lui y în funcţie x şi se obţin valorile

estimatorilor;3. se obţine seria de reziduuri, ui;4. ignorând semnul valorilor variabilei reziduale, adică considerând

modulul acestora, ui se ordonează crescător sau descrescător după valorile lui xi;

5. se calculează coeficientul Spearman definit anterior, între ui şi xi;6. presupunând coeficientul de corelaţie a rangurilor pentru întreaga

populaţie S = 0 şi n > 8, semnificaţia lui rS poate fi testată calculând:

n-2 – numărul gradelor de libertate. Dacă valoarea calculată pentru t*, depăşeşte valoarea critică, se poate accepta ipoteza de eteroscedasticitate. În caz contrar, ipoteza de eteroscedasticitate este respinsă.

21

2

s

s

r

nrt

ANALIZA VARIABILEI REZIDUALEAutocorelarea Autocorelarea perturbaţiei presupune corelarea valorilor perturbaţiei cu propriile valori, adică dependenţa valorilor sale de valorile anterioare. Eliminarea autocorelării se poate realiza prin:

• verificarea posibilităţii de a introduce o variabilă cauzală suplimentară, însă doar dacă se consideră că variabila respectivă influenţează semnificativ variabila efect;

• înlocuirea valorilor variabilelor y; x, cu diferenţele de ordinul întâi ale acestora Dy=yi+1-yi ; Dxi=xi+1 , procedeu recomandat mai ales în cazul în care se lucrează cu serii cronologice.

ANALIZA VARIABILEI REZIDUALE• Testul Durbin – Watson (DB) verificarea

independenţei perturbaţiei în raport cu propriile valori Condiţii privind aplicarea testului:

• existenţa parametrului liber (a0);• regresorul „x” este nestochastic şi are aceleaşi

valori în diverse sondaje;• ut depinde doar de ut-1;• modelul nu include variabile cu efect întârziat

yt-1, yt-2;• existenţa a două valori critice (dinf şi dsup)

reprezentând limite ale unor intervale.


Etapele aplicării testului:• stabilirea: - ipotezei nule H0: perturbaţia

nu este autocorelată; - ipotezei alternative H1:

perturbaţia este autocorelată.• calcularea testului cu relaţia:

Modul de definire a testului ,,d’’, este în strânsă legătură cu formula de definire a coeficientului de autocorelaţie .

2

21

ˆ

ˆˆ

t

ttcalc u

uud

1, tt uur


Relatia coeficientului de autocorelaţie:

2

1

1

t

ttuu u

uur

tt