ECONOMETRIE
Titular de disciplină: Conf.univ.dr. Cornelia Tomescu
CUPRINS:
CAP.I. NOŢIUNI INTRODUCTIVE PRIVIND STUDIUL ECONOMETRIEI CAP.II. ELABORAREA MODELELOR ECONOMETRICE CAP.III. VERIFICAREA IPOTEZELOR STATISTICE CAP.IV.MODELE LINIARE UNIFACTORIALE CAP.V. MODELE MULTIFACTORIALE CAP. VI. MODELE DE REGRESIE NELINIARE
CAP.I. NOŢIUNI INTRODUCTIVE PRIVIND STUDIUL ECONOMETRIEI
Ce este econometria?
• Termenul de econometrie = eikonomia + metron• în anii ’30 ai secolului trecut - termenul de
econometrie (econometrics) = dezvoltarea teoriei pure printr-un punct de vedere matematic, cât şi estimarea empirică a relaţiilor economice.;
• astăzi - econometria se situează între economia matematică (mathematical economics) şi statistica economică (economic statistics).
• Diverse opinii care conturează definiţiile econometriei - perspectiva din care este privit domeniul:– ramură a economiei - obiectivele finale urmărite
de demersul econometric, obiective care se referă la argumentarea pe bază de date empirice a unei teorii economice sau la fundamentarea unei prognoze sau a unei politici economice;
– ramură a statisticii - metodele utilizate, caracteristicile acestora şi nu în ultimul rând, datele statistice necesare aplicării metodelor, atunci, conform unor autori.
Definiţii ale econometriei• Fr. Perroux - „econometria este o ramură a economiei,…, o economie
de intenţie ştiinţifică”;• Frisch - ceea ce realizează econometria reprezintă îmbinarea punctelor
de vedere care se referă la teoria economică, statistică şi matematică privind natura relaţiilor cantitative din economie;
• Samuelson, Koopman şi Stone - econometria presupune o analiză cantitativă a fenomenelor economice bazată pe dezvoltarea concomitentă a teoriei şi observării puse în concordanţă cu metodele de inferenţă (inducţie statistică) adecvate;
• Walters - econometria, ca şi economia, sunt discipline utilitare întrucât formulează şi investighează ipoteze, ceea ce poate fi foarte util în luarea deciziilor atât pentru guverne cât şi pentru oamenii de afaceri.
• Onicescu şi Botez - econometria este o ramură a ştiinţelor economice care îşi propune studierea relaţiilor dintre variabilele economice, aşa cum apar acestea postulate într-un model abstract.
Definiţia econometriei• În sens larg, econometria presupune analize bazate pe estimări numerice
atât a relaţiilor de dependenţă dintre fenomenele economice cât şi a aspecte lor ce privesc gradul de concentrare, de sensibilitate, dar şi intensitate a fluctuaţiilor din economie, optimizarea producerii acestora etc., adică cea mai mare parte a proceselor care implică transformări şi a căror analiză câştigă în rigoare prin exprimări cantitative (măsurare).
• În sens restrâns, econometria se limitează la studiul relaţiilor de dependenţă dintre variabilele economice, inclusiv a variabilităţii proceselor economice în timp apelând cu precădere la analiza de regresie precum şi la diverse procedee de testare.
• Econometria reprezintă un domeniu (sau, în orice caz, un mod specific de abordare) al economiei prin care se urmăreşte exploatarea datelor statistice care descriu desfăşurarea proceselor economice (în timp sau în raport cu factorii determinanţi) prin metode cantitative, predominant statistice, în vederea realizării unui spor de rigurozitate în ce priveşte teoria economică dar şi legat de analiza şi prognoza proceselor economice.
Avantajele utilizării econometriei
• în reprezentările econometrice se introduc variable care privesc bogăţia naţiunii (producţia, consumul, capitalul fix etc.) şi câştigul economic (profit, salarii, dobândă, rentă etc.) şi ecuaţii de tip comportamental, resursele având o importanţă deosebită;
• se acordă interes pentru reprezentări cu caracter sistemic în care sunt prezente obiectivele şi conexiunile existente între variabile;
• reprezentările econometrice se pot referi la un sector de activitate, sau la un ansamblu de activităţi, structurate sub formă de ecuaţii şi sisteme sau blocuri de ecuaţii;
• ecuaţiile de tip econometric cuprind factorii care determină evoluţia unor procese şi preţul în diferitele forme de manifestare (ecuaţii de balanţă pentru determinarea echilibrelor în economie);
• în modelul econometric se regăsesc obiectivele finale ale economiei şi obiectivele specifice proceselor economice (variabile endogene-efect);
• modelele econometrice permit simularea politicilor economice;• modelele econometrice exprimă echilibrul dintre cerere şi ofertă şi
neliniaritatea cererii în raport cu creşterea factorilor.
Obiectul, metoda şi domeniul econometriei
• Obiectul econometriei = aspectul cantitativ al economiei, legăturile dintre ansamblul economiei naţionale şi elementele sale componente, comportamentul acestora.
• Domeniul econometriei - aceasta caută valori numerice pentru parametrii modelelor economiei matematice şi are ca echivalente analoage modele matematico-economice.
• Metoda econometriei = rezultatul îmbinării metodelor matematice cu cele statistice şi de aici rezultă şi o delimitare clară a care trebuie evidenţiată între econometrie şi economia cantitativă în general.
Econometria şi economia
• Asemănări:– şi una şi cealaltă se confruntă cu o zonă "obscură"
care deseori afectează analizele, prognozele şi deciziile. Această zonă îşi are rădăcinile îndeosebi în psihologie şi se dezvăluie printr-un comportament uman deseori previzibil;
– fenomenele economice se dezvoltă în timp conform unor legităţi - aspect în care crede atât teoria economică, cât şi econometria. Pornind de la acest lucru ambele urmăresc elaborarea de prognoze;
– în ambele domenii, esenţialul îl constituie ansamblul relaţiilor dintre variabilele care intervin în desfăşurarea procesului.
Econometria şi economia• Deosebiri:
– în timp ce economia se bazează pe relaţii de tip determinist, econometria se foloseşte, de cele mai multe ori, de relaţii de natură aleatoare şi din acest motiv perturbaţia este frecvent luată în calcul;
– dacă economia se bazează îndeosebi pe raţionamente fundamentate pe practica economică şi pe ipoteze care, în cele mai multe cazuri, au valabilitate doar în condiţii de maximă normalitate, econometria se bazează în special pe informaţii concentrate în datele statistice, pe teoria economică precum şi pe soluţiile rezultate din rezolvarea modelului.
Econometria şi statistica
• Asemănări:– interesul deosebit al celor două ştiinţe pentru
aspectele numerice prezentate de fenomenele analizate precum şi pentru exprimarea prin formule;
– analiza relaţiilor cauză-efect cu ajutorul funcţiilor matematice şi prezentarea de soluţii însoţite, cel mai adesea, de garanţii probabiliste;
– importanţa acordată studiului acelor fenomene care se realizează într-un număr mare de cazuri, dezvăluind legităţi sau, cel puţin, repetabilităţi utile în elaborarea de predicţii.
Econometria şi statistica
• Deosebiri:– opţiunea privind metodele porneşte de la necesităţile
de analiză şi previziune din economie;– accentul deosebit de mare pus în econometrie pe
ipotezele metodelor de estimare şi, mai ales, pe procedeele destinate atenuării sau eliminării frecventelor nerespectări ale acestor ipoteze de către datele empirice privind evoluţia fenomenelor economice;
– faptul că unitatea, cazul, elementul pot face obiect de studiu în econometrie.
FUNDAMENTE TEORETICE PRIVIND MODELAREA
ECONOMETRICĂModelul econometric
Modelul econometric
Definiţie:Modelul econometric reprezintă o imagine
simplificată a relaţiilor dintre variabilele economice care priveşte atât reprezentarea anatomică a proceselor economice (definirea variabilelor), cât şi descrierea fiziologică (relaţii, condiţionări, mecanisme de funcţionare).Componente:- variabile;- parametrii;- relaţii.
Modelul econometric
Variabilele- variabile exogene - variabile endogene - variabile aleatoare
Parametrii- parametrii de regresie;- estimatori ai parametrilor de regresie; - parametrul „liber”.
Relaţiile- relaţii funcţionale, bazate pe ecuaţii de regresie;- relaţii de identitate (de balanţă, de echilibru).
Modelul econometricCondiţii:
• să poată reflecta structura sistemică a elementelor unui ansamblu real;• să aparţină unui anumit număr de transformări, definite pentru un anumit
model din aceeaşi familie;• să permită reflectarea modificărilor posibile ale oricărora dintre elementele
sale componente;• să poată explica satisfăcător toate faptele observate;• să fie rezolvabil prin tehnici cunoscute.
Perspective:• reprezintă o cale de a preîntâmpina surprizele economiei de piaţă printr-o
evaluare apriorică a comportamentului diverşilor agenţi economici;• permite anticiparea efectului unor decizii în vederea alegerii celei mai bune
politici economice (cu efecte benefice maxime şi cu implicaţii nedorite minime);
• facilitează dezvoltarea teoriei economice, întrucât este greu de acceptat că se poate face teorie economică realistă fără a apela la cuantificări, la evaluări, iar evaluările, fără o teorie adecvată nu pot demonstra nimic.
Construcţia modelelor econometrice
Ipotezele elaborării unui model econometric
Ipotezele elaborării unui model econometric
Ecuaţia unui model econometric:ƒ(x) = y
Ipotezele elaborării unui model econometric:• variabilele exogene şi endogene sunt mărimi numerice observate fără erori, iar ui
sunt variabile reziduale aleatoare neobservabile, a căror speranţă matematică este nulă pentru orice valori ale variabilelor independente;
• erorile ui urmează o distribuţie independentă de valorile observate pentru variabilele independente şi de numărul de observaţii, având o dispersie σ` şi o speranţă matematică nulă indiferent de valorile observate pentru variabilele exogene. În consecinţă distribuţia de probabilitate a variabilelor reziduale ui rămâne aceeaşi indiferent de valorile observate pentru variabilele independente;
• observaţiile sunt independente între ele, erorile rezultate din două observaţii diferite nefiind condiţionate între ele;
• erorile – variabile reziduale ui urmează o lege normală de distribuţie (ipoteza de normalitate);
• la o creştere nefinită a numărului de observaţii, valorile observate ale variabilelor exogene se reduc la media acestora, iar abaterea lor pătratică tinde spre o limită finită, nenegativă;
• nu se dispune de nici un fel de informaţii cu privire la mărimea şi semnificaţia parametrilor numerici ai modelului.
Etapele elaborării unui model
econometric • analiza de detaliu a fenomenului, procesului sau a sistemului economic real;• descrierea mecanismului ce caracterizează sistemul interdependenţelor factoriale
din cadrul fenomenului, procesului sau sistemului dat;• formularea principiilor fundamentale ale legăturilor dintre elementele componente
ale fenomenului, procesului sau sistemului, ale legilor si legităţilor stohastice, care privesc însă structura internă, mecanismul real al dezvoltării;
• definirea variabilelor modelului econometric;• alegerea structurii generale a modelului;• estimarea parametrilor modelului ecometric pe baza unui set disponibil sau cules
de date;• verificarea verosimilităţii modelului econometric;• aplicarea modelului în conformitate cu scopul propus;• confruntarea modelului cu alte situaţii ipotetice, posibile, corectarea şi adaptarea
sa la modificarea probabilă a numărului de variabile, a sensului şi intensităţii legăturilor şi influenţelor sau a unor condiţii de mediu;
• specificarea semnificaţiilor şi adaptarea deciziilor economice.
Etapele elaborării unui model econometric
Modelul econometric definit – cerinţe:• sunt definite variabilele exogene şi domeniul lor de variaţie;• este definit un ansamblu de structuri prin care se stabileşte o legătură
funcţională sau aleatoare între variabilele exogene şi cele endogene, precum şi legea de distribuţie a variabilelor reziduale.Acţiuni premergătoare aplicării generalizate a unui model econometric construit:
• testarea prin verificarea corespondenţei între structura dată a modelului şi datele reale cu privire la fenomenul, procesul sau sistemul economic a cărui stare sau evoluţie o descrie. În cazul în care testul este satisfăcător, modelul este reţinut; în caz contrar se modifică ipotezele, se introduce noi variabile explicative, se concept sau se consideră noi expresii ale funcţiilor ƒ sau se adoptă unele specificaţii mai puţin respective cu privire la legea de distribuţie a erorilor;
• estimarea parametrilor modelului şi a caracteristicilor legii de distribuţie a variabilei aleatoare;
• utilizarea modelului în explicarea mecanismului ce caracterizează fenomenul, procesul sau sistemul economic analizat.
Etapele elaborării unui model econometric
Elemente necesare rezolvării unui model econometric:
• un ansamblu de observaţii (date statistice) asupra variabilelor endogene (y din Y) definite prin n mărimi numerice observate în T perioade) (situaţii distincte) astfel încât eşantionul ales va putea fi dat ca un spaţiu Euclidian de n – T dimensiuni;
• un număr de variabile exogene cunoscute şi măsurabile;
• un ansamblu de distribuţii de probabilitate a variabilelor y din Y în spaţiul n – T dimensiuni.
Tipologia modelelor econometrice
Categorii de modele econometrice:
- modele de trend (cu serii temporale);
- modele cu o singură ecuaţie;
- modelele cu mai multe ecuaţii (de simulare, structurale).
Tipologia modelelor econometrice
Criterii de clasificare: 1.În funcţie de numărul variabilelor implicate în model:
- modele econometrice unifactoriale;- modele econometrice multifactoriale.
2. În funcţie de forma funcţiilor considerate: - modele econometrice liniare;- modele econometrice neliniare.
3.În funcţie de modul de considerare a influenţelor în cadrul modelului:
- modele econometrice de tip aditiv;- modele econometrice de tip multiplicativ.
Tipologia modelelor econometrice
4. După întinderea în timp:
- modele econometrice pe termen scurt;
- modele econometrice pe termen lung.
5. După domeniul economic abordat:
- modele microeconometrice;
- modele macroeconometrice.
Specificarea şi identificarea modelelor econometrice
Specificarea unui model econometric:- stabilirea ecuaţiilor care intră în componenţa sa. Pentru aceasta, este
foarte important să se cunoască cu exactitate domeniul economic ce urmează a fi analizat, respectiv caracteristicile acestuia, deoarece fiecare tip de economie, de proces sau fenomen economic presupune elaborarea unui model econometric adecvat.
- permite: a. stabilirea şi includerea în model a acelor variabile independente care au o influenţă covârşitoare asupra variaţiei variabilei dependente;
b. stabilirea corectă a formei ecuaţiilor modelului econometric.
Un model econometric poate fi considerat ca specificat atunci când se cunosc următoarele elemente:
– structura modelului;– valorile parametrilor modelului;– valorile variabilelor dependente (de stare) şi a celor independente, la un
moment dat sau pentru o perioadă precizată de timp.
Specificarea şi identificarea modelelor econometrice
Identificarea este o etapă specifică modelelor cu ecuaţii simultane.Tipuri de ecuaţii :
• ecuaţii identificate;• ecuaţii neidentificate;• ecuaţii supraidentificate.• O ecuaţie a unui model econometric este:• identificată – când numărul variabilelor absente din ecuaţie (dar prezente
în model) este mai mic cu unu decât numărul de ecuaţii;• neidentificată – când numărul variabilelor absente este mai mic decât
numărul de ecuaţii minus unu;• supraidentificată – când numărul de variabile absente este mai mare
decât numărul de ecuaţii minus unu.Ca urmare, un model econometric este considerat ca fiind identificat atunci când fiecare ecuaţie de regresie din cadrul modelului (ecuaţiile de identificare nu se iau în consideraţie) este identificată.
Specificarea şi identificarea modelelor econometrice
Soluţii pentru a elimina neidentificarea: - eliminarea din ecuaţia neidentificată a uneia sau mai multor variabile independente, variabile a căror influenţă asupra variabilei efect nu este considerată determinantă. Se procedează la calcularea coeficientului de determinaţie multiplă pentru variabilele rămase şi, dacă acesta nu este diminuat semnificativ, se poate recurge la eliminarea variabilei sau variabilelor suspectate.- includerea de variabile independente în ecuaţiile caracterizate ca neidentificate sau supraidentificate, variabile care exercită o influenţă destul de mare asupra variabilei dependente;- alegerea unei alte forme pentru ecuaţia neidentificată (dacă acest lucru nu contravine celor stabilite în etapa de specificare a modelului).
Cerinţe ale modelării econometrice
• 1. depistarea adevăratelor cauze care determină nivelul şi evoluţia fenomenelor si proceselor analizate;
• 2. considerarea cu prioritate a factorilor esenţiali şi includerea influenţei factorilor neesenţiali în variabila aleatoare;
• 3. evidenţierea existenţei independenţei sau multicoliniarităţii potenţiale a variabilelor explicative. Astfel, dacă prin analiza calitativă se constată că între doi sau mai mulţi factori există o relaţie obiectivă, de natură cauzală, atunci aceştia nu se reţin în totalitate ca factori de influenţă ci se reduc, rămânând doar factorii reciproc independenţi sau dependenţi într-o mai mică măsură;
• 4. specificarea variabilelor sub raportul formei de exprimare, prin stabilirea unui sistem unic de indicatori pentru caracterizarea fenomenului sau procesului analizat;
• 5. alegerea formei ecuaţiei de regresie şi deci a modelului celui mai adecvat descrierii legăturii analizate. Această alegere este înlesnită de cunoaşterea şi înţelegerea fenomenului sau procesului analizat, de existenţa unor posibilităţi reale de sintetizare în relaţii matematice a mecanismului de funcţionare a sistemului de interdependenţe;
• 6. considerarea unui număr suficient de mare de observaţii precum şi a omogenităţii datelor utilizate. Acest lucru este cu atât mai necesar cu cât în calculele econometrice se operează cu mărimi medii, care reflectă cu atât mai precis proprietăţile tipice ale colectivităţilor, cu cât acestea sunt mai omogene.
MODELUL ECONOMETRIC UNIFACTORIAL LINIAR
Definirea modelului liniar pentru două variabile (modelul unifactorial)
Definirea modelului liniar pentru două variabile (modelul unifactorial)
Un model unifactorial se prezintă astfel:y = f (x) + u
unde:• y - variabila endogenă sau dependentă sau efect sau rezultativă
(cu valorile y1 , y2 , …, yk, … , yn )• x – variabila exogenă sau independentă sau cauzală sau factorială
( cu valorile x1, x2, …, xk, …, xn)• u - variabila reziduală, aleatoare sau eroare sau perturbaţie (cu
valorile u1, u2, …, uk, …, un)
Definirea modelului liniar pentru două variabile (modelul unifactorial)
În contextul modelării econometrice, noţiunea de liniar poate fi înţeleasă în mai multe sensuri şi anume:
• a) liniar în raport cu variabilele şi cu parametrii;Modelul general are forma: y = a0 + a1x ;
• b) liniar în raport cu parametrii, dar neliniar în raport cu variabilele; Modelele pot fi de forma: y= a0 + a1x + a2x2; y= aXα Zβ (pentru α ≠ l, β ≠ 1); y = a0 + a1 (1/x);
• c) liniar în raport cu variabilele, dar neliniar în raport cu parametrii; Modelele pot avea forma: y = a + a2x; y = x;
• d) neliniar în raport cu variabilele şi eu parametrii;Forma modelului poate fi: y = a2x + ax2.
Definirea modelului liniar pentru două variabile (modelul unifactorial)
Fiind cel mai simplu model econometric, modelul liniar unifactorial are numeroase aplicaţii în teoria economică. Amintim doar câteva dintre acestea:
• 1. funcţia de consum din modelul lui Keynes :Ct = a0 + a1 Yt
Ct - consumul pentru un an,Yt - venitul pentru aceeaşi perioadă,a, b sunt parametri i modelului;
• 2. legea cererii –C = f(p) + u
C = volumul cererii unui produs p = preţul unitar al produsului;
• 3. legea ofertei O = f(p) + u
O = volumul ofertei; • 4. modelul cheltuielilor de producţie (Ch) în funcţie de volumul producţiei (Q)
Ch = f(Q) + u• 5. modelul legii impozitului (I) pe venit (V)
I = f(V) + u, variabila aleatoare u semnificând abaterea de la dependenţa funcţională a impozitului pe venitul salariaţilor, ca urmare a unor măsuri de politică socială.
Definirea modelului liniar pentru două variabile (modelul unifactorial)
Elaborarea modelului liniar unifactorial presupune:1. Identificarea celor două variabile folosite pentru definirea modelului. Se folosesc următoarele notaţii:- Y este simbolul pentru variabila endogenă sau variabila rezultativă. Seria de date pentru aceasta se notează prin ;- X este simbolul pentru variabila exogenă sau factorială. Pentru aceasta se defineşte seria ;2. Specificarea parametrilor modelului. Se notează prin a1 panta dreptei de regresie şi a0 este termenul liber sau intercept. Dacă valorile celor doi parametri sunt cunoscute, se defineşte o dependenţa deterministă între cele două variabile:
Y = a0 + a1 X.Se definesc estimatorii celor doi parametri â0 şi â1. 3. Definirea variabilei reziduale. Se notează variabila reziduală prin u.
1,i iy n
1,i ix n
Definirea modelului liniar pentru două variabile (modelul unifactorial)
Motive pentru includerea în model a variabilei reziduale:- seriile de date pentru cele două variabile sunt afectate de erori de măsurare. Acestea au o influenţă directă asupra estimării celor doi parametri; - în economie nu se întâlneşte o dependenţă liniară funcţională între două variabile, ci mai degrabă una de tip probabilist. Asupra variabilei endogene mai acţionează o serie întreagă de factori care nu sunt specificaţi în cadrul modelului de regresie. Variabila reziduală este cea care sintetizează influenţa acestor factori; - seriile de date sunt obţinute în urma unor observări asupra unor eşantioane;
Definirea modelului liniar pentru două variabile (modelul unifactorial)
4. Specificarea modelului de regresie. În raport cu natura seriilor date sunt identificate două domenii de utilizare a modelului liniar de regresie:- în analiza dependenţei dintre două variabile, în cazul în care seriile date sunt înregistrate la nivelul unităţilor statistice ale populaţiei pentru o perioadă sau un moment;- pentru caracterizarea dependenţei dintre două variabile într-un anumit orizont de timp. În acest caz sunt folosite seriile de timp. 5. Specificarea setului de ipoteze. Ipoteze care trebuie verificate în vederea utilizării ulterioare a modelului econometric:- seriile de date nu sunt afectate de erori de măsură;- variabila reziduală este de medie zero;- varianţa variabilei reziduale este invariantă în timp; - reziduurile nu sunt autocorelate;- variabila exogenă nu este corelată cu variabila reziduală. Aceasta se mai numeşte proprietatea de omoscedasticitate a modelului de regresie.6. Alegerea metodei de estimare a parametrilor modelului liniar de regresie.
Estimarea parametrilor
Estimarea parametrilor unui model econometric se poate realiza cu ajutorul mai multor metode:
• metoda celor mai mici pătrate (M.C.M.M.P.);• metoda punctelor empirice;• metoda punctelor medii;• metoda celor mai mici pătrate generalizată;• metoda verosimilităţii maxime etc.
Metoda celor mai mici pătrate (M.C.M.M.P.)
Pentru modelele liniare unifactoriale:
Acest sistem poartă numele de sistem de ecuaţii normale şi are câteva proprietăţi şi anume:
• 1) Variabila aleatoare ui este de
sumă nulă şi evident, de medie 0;
• 2) Suma valorilor empirice este egală cu
suma valorilor teoretice - principiul conservării informaţiilor.
210
10
iiii
ii
xaxayx
xaany
0)(1
10
i
n
iii uxaay 0)(
iuM
0)()(1
10
ii
n
iii yyxaay
Metoda celor mai mici pătrate (M.C.M.M.P.)
3) dreapta de regresie trasată pe baza MCMMP trece prin punctul y de coordonate După estimarea parametrilor a0 şi a1, prin valorile , se vor putea calcula valorile teoretice ale fenomenului explicat y,
şi apoi estimaţiile variabilei aleatoare
Calitatea estimărilor, ca şi opţiunea între metodele de estimare se bazează pe următoarele criterii:
• gradul de determinare să fie cât mai mare;• abaterile dintre valorile empirice (yi) şi cele teoretice ( ) să fie cât mai mici;• estimările obţinute sunt soluţii eficiente, consistente;• costul aplicării metodei este minim.
yx,
ixaaiy 10
iyiyiu
iy
Metoda celor mai mici pătrate (M.C.M.M.P.)
Ipotezele M.C.M.M.P. :• datele sunt obţinute corect, fără erori sistematice de observare şi în număr suficient de mare
(depăşind, în orice caz, numărul de parametrii care urmează să fie estimaţi) aşa încât soluţiile să prezinte stabilitate;
• variabila factorială nu este stochastică şi prezintă aceleaşi valori în eventualitatea în care repetăm sondajul;
• variabila x prezintă variabilitate în ceea ce priveşte nivelurile înregistrate în cadrul unui eşantion de date, astfel încât rolul acesteia să poată fi pus în evidenţă;
• modelul de regresie este liniar în raport cu parametrii;• modelul de regresie este corect specificat în sensul alegerii funcţiei potrivite (liniare sau neliniare)
şi includerii factorilor importanţi astfel încât gradul de determinare să fie suficient de mare;• variabila reziduală este de medie 0 şi urmează o repartiţie normală;• variabila reziduală prezintă o dispersie (un grad de împrăştiere) egală pentru diferitele segmente
de valori xi, caz în care eroarea este etichetată ca fiind omoscedastică, spre deosebire de situaţia contrară când este caracterizată drept eteroscedastică;
• variabila reziduală nu este corelată cu variabila factorială x;• variabila reziduală nu este auto corelată, în sensul că pentru oricare două valori xi şi xj
perturbaţiile aferente ui şi uj , pentru i j, nu sunt corelate;• factorii incluşi în model (varianta multifactorială) sunt independenţi unii în raport cu ceilalţi,
nefiind corelaţi între ei.
Metoda punctelor empirice
Pentru cazul modelului econometric unifactorial liniar:
- se vor alege două perechi (xi, yi). Astfel, de exemplu: (x3, y3); (x6, y6). Vom avea:
6106
3103xaay
xaay
;
61
31
66
33
0
x
x
xy
xy
a ;
61
31
61
31
1
x
x
y
y
a
Metoda punctelor medii
Pentru modelul unifactorial liniar:Dacă valorile pentru xi, şi yi sunt considerate pentru
vom avea:• xi: x1, x2, x3, x4, x5, x6, x7, x8, x9• yi: y1, y2, y3, y4, y5, y6, y7, y8, y9
Subseriile formate:
9,1i
5432
5432yyyy
xxxx
45432
1
45432
1yyyy
y
xxxxx
9876
9876yyyy
xxxx
498762
49876
2yyyy
y
xxxxx
Metoda punctelor medii
Se obţine:
21021101
xaay
xaay
;
21
1122
11
0
x
xxy
xy
a
;
21
11
2111
1
x
xy
y
a
Corelaţia
Spunem că variabilele X si Y sunt corelate dacă una din ele este o funcţie de cealaltă variabilă (spre exemplu: Y=αX+β).
Tipuri de corelaţie:
-Liniară - Liniară
pozitivă negativă
- Corelaţie inexistentă
- Corelaţie neliniară
Ca o măsură a corelaţiei liniare între variabilele X şi Y introducem coeficientul de corelaţie liniară Pearson (r):
sau
unde:
b – coeficientul de regresie (a1 )
σx - abaterea medie pătratică a caracteristicii factoriale
σy - abaterea medie pătratică a caracteristicii dependente
Coeficientul de corelaţie:
•Este un indicator care măsoară numai intensitatea legăturii de tip liniar dintre două variabile x şi y. •Se calculează ca o medie aritmetică a produsului abaterilor normale normate ale celor două variabile.•Poate lua valori cuprinse între -1 şi +1, adică satisface inegalităţile: - 1 ≤ ryx ≤ +1. •Semnul, ca şi cel al coeficientului de regresie, indică sensul legăturii: semnul minus indică legătura inversă, semnul plus indică legătura directă.•Cu cât coeficientul de corelaţie are valori mai apropiate de 1 sau –1, cu atât corelaţia rectilinie dintre variabilele x şi y este mai puternică. Pe măsură ce coeficientul de corelaţie se apropie de zero, scade şi intensitatea legăturii dintre cele două variabile. •În cazul în care r = 0, variabilele sunt independente ori necorelate liniar, iar pentru egal cu 1, rezultă dependenţa funcţională între cele două variabile.
Corelograma (diagrama norului de puncte) – metoda grafică de analiză a legăturii dintre două variabile.•Se construieşte pe baza unui sistem de axe OXY, prin reprezentarea pe OX a valorilor variabilei cauză şi pe OY a valorilor variabilei efect.•Evidenţiază patru aspecte privind corelaţia:-Existenţa corelaţiei -Intensitatea corelaţiei-Sensul corelaţiei-Forma corelaţiei
Raportul de corelaţie – măsură a legăturii dintre două variabile, corelate neliniar, dar şi liniar.
Interpretare:-Raportul de corelaţie poate lua valori între 0 şi 1. -Cu cât valoarea raportului este mai apropiată de 1 cu atât legătura de corelaţie este mai puternică şi invers.-În cazul corelaţiei liniare, raportul de corelaţie este egal cu coeficientul de corelaţie luat în valoare absolută.-Egalitatea celor doi indicatori poate fi considerată ca un test de verificare a liniarităţii legăturii.
Raportul de determinaţie - reprezintă proporţia din variaţia totală a lui Y care este explicată de influenta lui X.
Interpetare:•Raportul de determinatie ia valori in intervalul [0,1].•R2 = 0 dacă a1=0, deci dacă ecuaţia de regresie este o dreaptă orizontală. În acest caz variabila X nu are putere explicativă (X nu influenteaza variatia lui Y).•R2 = 1 dacă punctele determinate de observaţiile făcute asupra variabilelor x şi y se află toate pe o dreaptă, caz în care erorile vor fi zero.
VERIFICAREA IPOTEZELOR STATISTICE
• 1. Etapele verificării ipotezelor statistice• 2. Testul Student (t)
2.1. Fundamente teoretice2.2. Testarea parametrilor unui model
econometric cu Testul t2.3. Testarea indicatorilor corelaţiei
• 3. Testul Snedecor (F)• 4. Testul χ2• 5. Testul Kolmogorov-Smirnov (D)
Etapele verificării ipotezelor statistice
Motive:• numărul redus de date cu care deseori se lucrează
pentru a ajunge la estimaţii care sã poatä fi generalizate;• dificultatea departajării influentei factorilor sistematici de
influenţele aleatoare în condiţiile obţinerii de date dintr-un domeniu economic supus simultan acţiunii unui ansamblu de factori diferiţi ca putere şi sincronizare a influenţelor.Ipotezele care se verifică:
- Ipoteza nulă – H0
- Ipoteza alternativă – H1
Etapele verificării ipotezelor statistice
Etape:
1. stabilirea obiectivului urmărit. 2. stabilirea ipotezei nule (Ho) 3. opţiunea în ceea ce priveşte: testul statistic indicat corespunzätor
obiectivului urmärit, repartiţia care guverneazä valorile supuse verificãrii, probabilitatea de a emite o eroare de genul 1 (având de ales, de regulă, între =0,05, = 0,l0, = 0,01, =0,001 în raport de costul erorii şi importanţa acordată preciziei), gradele de libertate, ţinând seama îndeosebi de dimensiunea eşantionului şi/sau numärul parametrilor din model
4. obţinerea valorii calculate (tcalculat, Fcalculat etc.) 5. preluarea din tabelul repartiţiei considerate a valorii tabelate 6. formularea concluziei cu privire la acceptarea sau neacceptarea
ipotezei nule
Etapele verificării ipotezelor statistice
Erori care pot să apară în procesul de verificare a ipotezelor:
a) eroarea de tipul I
b) eroare de tipul II
Riscuri aferente probabilităţii emiterii de erori:
1. Probabilitatea emiterii unei erori de tipul I - riscul de gradul I (se notează cu α).
2. Probabilitatea emiterii unei erori de genul II - risc de gradul II (se notează cu β).
Etapele verificării ipotezelor statistice
Exemple de situaţii în care se impune verificarea ipotezelor• semnificaţia parametrilor de regresie, caz în care se apelează la
testul t şi testul F;• verificarea verosimilităţii modelului econometric elaborat, caz în
care se apelează la testul t şi analiza variaţiei (bazată pe testul F);
• autocorelarea variabilei reziduale, caz în care se foloseşte testul Durbin- Watson (DW);
• verificarea concordanţei dintre două variabile economice, caz în care se apelează la testul X2;
• verificarea semnificaţiei indicatorilor de corelaţie, caz în care se foloseşte testul t;
• verificarea diferenţelor care pot să existe între două eşantioane sau între un eşantion şi colectivitatea generală supusă analizei prin prisma diferitelor criterii, cu ajutorul mediilor
Testul Student (t) 1. Fundamente teoretice
Când se foloseşte:
- verificarea ipotezelor referitoare la mediile colectivităţilor repartizate normal, atunci când nu se cunosc dispersiile teoretice ;
- testarea egalităţii mediilor pentru eşantioane de volum mic (cu un număr de unităţi mai mic de 30).
Testul Student (t) 1. Fundamente teoretice
Relaţia generală de calcul:
unde:x - variabila independentă;y – variabila dependentăf - numărul gradelor de libertate.
Gradul de libertate reprezintă numărul de elemente independente necesare definirii colectivităţii considerate.
fxyt
Testul Student (t) 1. Fundamente teoretice
Variante ale testului t:
1. când se verifică ipoteza egalităţii mediei de sondaj ( ) cu media colectivităţii generale ( )
• H0: = şi
• H1: ≠
1x0x
sx 0x
sx 0x
Testul Student (t) 1. Fundamente teoretice
Testul t are expresia:
cu f = n-1 grade de libertate
n - volumul eşantionului
dispersia colectivităţii generale
n
S
xxt s
20
0
20S
1
2
n
xx iij
Testul Student (t) 1. Fundamente teoretice
2) când se verifică ipoteza egalităţii a două medii care corespund la două colectivităţi normale, care au aceeaşi dispersie teoretică necunoscută
Expresia testului:
21
2
0201
11
nnS
xxt
s
libertatedegradennf
cu
nn
SnSnS sss
__2
2
11
21
21
22
212 21
Testul Student (t) 1. Fundamente teoretice
3) când se verifică ipoteza egalităţii a două medii corespunzând la
două colectivităţi normale, care au dispersiile teoretice neegale
Expresia testului:
Numărul gradelor de libertate:
2
22
1
21
21
n
S
n
S
xxt ss
1
1
1
1
2
2
1
2
n
c
n
cf
2
22
1
21
1
21
n
S
n
S
n
S
c
Testul Student (t) 1. Fundamente teoretice
Interpretarea testului:
• dacă tcalc > ttab : se respinge ipoteza nulă pentru numărul de grade de libertate şi pragul de semnificaţie corespunzătoare lui ttab;
• dacă tcalc < ttab: se acceptă ipoteza nulă. Probabilitatea cu care se afirmă o ipoteză sau alta este P = 1 – α.
Testul Student (t)2. Testarea parametrilor unui model
econometric cu Testul t
Considerăm modelul liniar unifactorial:
Y = a0 + a1 x + u.
Dispersiile estimatorilor:
- dispersia estimatorului parametrului a0:
- dispersia estimatorului parametrului a1:
- dispersia valorilor variabilei reziduale:
2
2
20
2 1ˆ
xx
x
nSaS
i
n
2
2
12 ˆ
xx
SaS
i
n
2
ˆ 2
2
n
yyS iin
Testul Student (t)3. Testarea indicatorilor corelaţiei
1. Testarea coeficientului de corelaţie simplă
- n este mărimea eşantionului - n-2 – numărul gradelor de libertate - r – coeficientul de corelaţie simplă Ipotezele:H0:coeficientul de corelaţie nu este semnificativH1: coeficientul de corelaţie este semnificativInterpretarea:• tcalc ttab – coeficientul de corelaţie este semnificativ;• tcalc ttab – coeficientul de corelaţie nu este semnificativ,
legătura dintre cele două variabile fiind întâmplătoare.
21 2
nr
rtcalc
Testul Student (t)3. Testarea indicatorilor corelaţiei
2. Testarea raportului de corelaţie
- n este mărimea eşantionului - n-2 – numărul gradelor de libertate - Ry/x – raportul de corelaţieIpotezele:H0: raportul de corelaţie nu este semnificativH1: raportul de corelaţie este semnificativInterpretarea:• tcalc ttab – raportul de corelaţie este semnificativ;• tcalc ttab – raportul de corelaţie nu este semnificativ, legătura
dintre cele două variabile fiind întâmplătoare.
21 2
/
/
nR
Rt
xy
xycalc
Testul Student (t)3. Testarea indicatorilor corelaţiei
3. Testarea coeficientului de corelaţie Spearman şi a coeficientului de corelaţie Kendall
- n este mărimea eşantionului - n-2 – numărul gradelor de libertate - CS, CK – coeficienţii de corelaţie neparametrică Ipotezele:• H0: CS / Ck - nu este semnificativ, variabilele sunt independente;• H1: CS / Ck - este semnificativ, variabilele sunt dependente. Interpretarea:• tcalc ttab – se respinge H0, coeficientul de corelaţie este semnificativ,
variabilele sunt dependente;• tcalc ttab – se acceptă H0, coeficientul de corelaţie nu este semnificativ,
variabilele sunt independente.
21 2
nC
Ct
S
Scalc 2
1 2
n
C
Ct
K
Kcalc
Testul Snedecor (F) • Relaţia generală de calcul:
unde S1
2 şi S22 - dispersiile de sondaj obţinute în două eşantioane
independente• Verificarea verosimilităţii modelului econometric – pune în evidenţă două tipuri
de abateri:1. abaterea valorilor ajustate în raport cu media
- valori ajustate ale variabilei endogenek: numărul parametrilor modelului n – volumul eşantionului
22
212
2
21 ScuSS
SF
1
ˆ2
2
k
yyS ix
iy
Testul Snedecor (F)
2. abaterea valorilor empirice de la valorile ajustate
yi – valori empirice ale variabilei endogene
k – numărul parametrilor modelului
n – volumul eşantionului
Expresia testului F :
• k -1 grade de libertate pentru numărător• n – k grade de libertate pentru numitor
kn
yyS iiu
2
2ˆ
2
2
u
x
S
SF
Testul Snedecor (F)• Ipotezele:
H0: modelul econometric nu este valid
H1: modelul econometric este valid• Interpretare:
Fcalc > Ftab : se respinge ipoteza nulă şi se acceptă ipoteza alternativă, cea a semnificaţiei estimaţiilor, deci modelul este confirmat, valid;Fcalc < Ftab : se acceptă ipoteza nulă, cea a nesemnificaţiei şi deci, modelul trebuie reconsiderat în sensul alegerii altor factori sau a unei alte funcţii de ajustare.
Testul χ2
• Relaţia testului:
cu (k-1)(p-1) grade de libertate
fij - frecvenţelor observate
fij’ - frecvenţele teoreticek - numărul de rânduri(linii);p - numărul de coloane.Frecvenţele teoretice se calculează ca produs al frecvenţelor de pe rândul i, unde i = 1,2,…,k şi al frecvenţelor marginale din coloana j unde j = 1,2,…,p împărţit la după relaţia:
k
i
R
j ij
ijij
f
ff
1 1'
2'2
k
i
P
jijfn
1 1
n
fff jiij
'''''
Testul χ2
În practică, pentru a putea fi aplicat testul χ2, repartiţiile trebuie să îndeplinească următoarele condiţii:
• numărul claselor de grupare să fie minim 5;• frecvenţele absolute ale fiecărui interval de
grupare să fie de minim 5 unităţi (în cazul în care nu este îndeplinită acea condiţie, se vor comasa intervalele adiacente respectând însă prima condiţie).
Testul Kolmogorov-Smirnov (D)• Relaţia de calcul:unde:• Fn1: frecvenţele cumulate ale primului eşantion;• Fn2: frecvenţele cumulate ale celui de-al doilea eşantion.• Relaţia de calcul a valorii teoretice:
unde: • n1 - numărul unităţilor primului eşantion;• n2 - numărul unităţilor celui de-al doilea eşantion.• Dacă Dcalc < Dtab se acceptă ipoteza nulă, a concordanţei
celor două repartiţii, iar dacă Dcalc > Dtab se acceptă ipoteza alternativă.
21max nncalc FFD
21
2136,1nn
nnDtab
ANALIZA VARIABILEI REZIDUALE
1. Normalitatea variabilei reziduale
2. Omoscedastitate. Eteroscedasticitate.
3. Autocorelarea
ANALIZA VARIABILEI REZIDUALE
• Relaţia de calcul a valorilor variabilei reziduale: – în cazul modelelor aditive:
– în cazul modelelor multiplicative:
Cauze ale apariţiei variabilei reziduale:- necunoaşterea desfăşurării în timp a fenomenului analizat sub
aspectul multiplelor sale cauze- manifestarea sa atunci când acţiunea are loc într-un număr mare
de cazuri, etc.Erori care pot să apară:- erori de specificare a modelului - erori de măsurare - erori de eşantionare
t^
tt yyu
^
t
tt
y
yu
ANALIZA VARIABILEI REZIDUALE
• Normalitatea variabilei reziduale:
z
pentru un prag de semnificaţie α stabilit anterior. (P = 1 – α), unde: z – se preia din tabel pentru α fixat.
- abaterea medie pătratică
n – numărul valorilor variabilei reziduale.
s(u)zus(u) t
2n
US(u)
2t
ANALIZA VARIABILEI REZIDUALE
Omoscedastitate. Eteroscedasticitate.
Variabilă reziduală omoscedastică - atunci când prezintă o împrăştiere egală raportat la valorile variabilei independente, fiind deci independentă de evoluţia acestei variabile. Variabilă reziduală eteroscedastică - atunci când nu prezintă o împrăştiere egală raportat la valorile variabilei independente, fiind dependentă de evoluţia acestei variabile. Verificarea omoscedasticităţii, respectiv a eteroscedascităţii - testul Snedecor (F)
ANALIZA VARIABILEI REZIDUALE
Etape:• se împarte şirul valorilor variabilei reziduale în
cel puţin două subşiruri (egale sau nu). • se fixează ipotezele de lucru: • 1. ipoteza nulă : dispersiile celor două subşiruri
nu diferă semnificativ una de cealaltă, adică perturbaţia este omoscedastică;
• 2. ipoteza alternativă : dispersiile celor două subşiruri diferă semnificativ una de cealaltă, adică perturbaţia este eteroscedastică.
ANALIZA VARIABILEI REZIDUALE• se calculează valoarea lui F cu relaţia:
Fcalc=
cu (n/2 – 1)grade de libertate pentru numărător şi numitor.
• se preia valoarea tabelată a lui Ftab din tabelele teoretice speciale;
• se compară cele două valori, astfel:Fcalc. < Ftab – se acceptă ipoteza nulă, deci
perturbaţia este omoscedastică.Fcalc. > Ftab – se respinge ipoteza nulă, deci
perturbaţia este eteroscedastică.
n
nii
n
ii
u
u
12
2
2
1
2
ANALIZA VARIABILEI REZIDUALEVerificarea omoscedasticităţii prin reprezentarea grafică – corelograma
• - dacă punctele definesc un nor de puncte precum cel din figura 1, atunci nu este satisfăcută ipoteza de omoscedasticitate;
Figura 1. Eteroscedasticitate
ANALIZA VARIABILEI REZIDUALE
• - în cazul în care punctele sunt dispuse sub forma unei benzi orizontale (figura 2), atunci variabila reziduală este omoscedastică.
Figura 2. Omoscedasticitate
ANALIZA VARIABILEI REZIDUALETestul Spearman - test de detectare a eteroscedasticităţii
Etape:1. se consideră modelul ;2. se efectuează regresia lui y în funcţie x şi se obţin valorile
estimatorilor;3. se obţine seria de reziduuri, ui;4. ignorând semnul valorilor variabilei reziduale, adică considerând
modulul acestora, ui se ordonează crescător sau descrescător după valorile lui xi;
5. se calculează coeficientul Spearman definit anterior, între ui şi xi;6. presupunând coeficientul de corelaţie a rangurilor pentru întreaga
populaţie S = 0 şi n > 8, semnificaţia lui rS poate fi testată calculând:
n-2 – numărul gradelor de libertate. Dacă valoarea calculată pentru t*, depăşeşte valoarea critică, se poate accepta ipoteza de eteroscedasticitate. În caz contrar, ipoteza de eteroscedasticitate este respinsă.
21
2
s
s
r
nrt
ANALIZA VARIABILEI REZIDUALEAutocorelarea Autocorelarea perturbaţiei presupune corelarea valorilor perturbaţiei cu propriile valori, adică dependenţa valorilor sale de valorile anterioare. Eliminarea autocorelării se poate realiza prin:
• verificarea posibilităţii de a introduce o variabilă cauzală suplimentară, însă doar dacă se consideră că variabila respectivă influenţează semnificativ variabila efect;
• înlocuirea valorilor variabilelor y; x, cu diferenţele de ordinul întâi ale acestora Dy=yi+1-yi ; Dxi=xi+1 , procedeu recomandat mai ales în cazul în care se lucrează cu serii cronologice.
ANALIZA VARIABILEI REZIDUALE• Testul Durbin – Watson (DB) verificarea
independenţei perturbaţiei în raport cu propriile valori Condiţii privind aplicarea testului:
• existenţa parametrului liber (a0);• regresorul „x” este nestochastic şi are aceleaşi
valori în diverse sondaje;• ut depinde doar de ut-1;• modelul nu include variabile cu efect întârziat
yt-1, yt-2;• existenţa a două valori critice (dinf şi dsup)
reprezentând limite ale unor intervale.
ANALIZA VARIABILEI REZIDUALE
Etapele aplicării testului:• stabilirea: - ipotezei nule H0: perturbaţia
nu este autocorelată; - ipotezei alternative H1:
perturbaţia este autocorelată.• calcularea testului cu relaţia:
Modul de definire a testului ,,d’’, este în strânsă legătură cu formula de definire a coeficientului de autocorelaţie .
2
21
ˆ
ˆˆ
t
ttcalc u
uud
1, tt uur
ANALIZA VARIABILEI REZIDUALE
Relatia coeficientului de autocorelaţie:
2
1
1
t
ttuu u
uur
tt