Transcript
Page 1: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

1

SINTEZA CURS

Econometrie şi previziune economică

(I)

Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii anului II Management va

cuprinde următoarele capitole mari: - Econometria – definiţii şi obiective; - Modelul econometric; - Testarea ipotezelor statistice; - Modele econometrice de regresie unifactorială; - Modele econometrice de regresie multifactorială; - Testarea ipotezelor modelului liniar de regresie; - Analiza seriilor cronologice.

Bibliografia recomandată 1. Mladen L., Econometrie. Suport curs, https://ush.blackboard.com - în curs de

apariţie; 2. Voineagu V., Ţiţan E., Şerban R., Ghiţă S., Todose D., Pele D., Teorie şi practică

econometrică, Editura Meteor Press, Bucureşti, 2007; 3. Pecican E., Econometrie, Editura C.H. Beck, Bucureşti, 2006; 4. Andrei T., Bourbonnais R., Econometrie, Editura Economică, Bucureşti, 2008; 5. Andrei T., Statistică şi econometrie, Editura Economică, Bucureşti, 2003.

Introducere în Econometrie

Definiţia econometriei Econometria s-a constituit ca o ramură a ştiinţei odată cu înfiinţarea Societăţii de

Econometrie în anul 1930 de către Irving Fisher, L.V. Bortkiewicy, R.Frisch, H.Hotelling şi alţii. Termenul a fost introdus de către economistul şi statisticianul norvegian Ragnar Frisch şi provine, etimologic, din cuvintele greceşti: „eikonomia” - economie şi „metren” - măsură. Econometria devenea astfel o „umbrelă” sub care se reuneau metodele de măsurare din diversele zone ale economiei.

De-a lungul timpului s-au conturat mai multe definiţii ale noii discipline; dintre ele vom menţiona trei mai importante:

� Definiţia istorică A fost formulată de către statisticianul Ragnar Frisch, în chiar primul număr al revistei

Econometrica, revista Societăţii de Econometrie lansată în anul 1933, astfel: „experienţa a

arătat că fiecare din următoarele 3 puncte de vedere, al statisticii, al teoriei economice şi al

matematicii este o condiţie necesară, dar nu şi suficientă pentru o înţelegere efectivă a

relaţiilor cantitative din economia modernă; unificarea lor este aceea care asigură eficienţa.

Econometria este tocmai această unificare.” Altfel spus, econometria reprezintă studierea fenomenelor economice pe baza

datelor statistice cu ajutorul modelelor matematice. � Definiţia restrictivă

A fost propusă de Cowles Comission for Research in Economics, (Chicago, 1940-1950). În această viziune se consideră că econometria presupune investigarea fenomenelor

economice numai cu ajutorul modelelor aleatoare (stochastice, probabilistice). � Definiţia extinsă

Aparţine economiştilor anglo-saxoni şi consideră că econometria în sens larg

înseamnă econometria în sens restrâns, la care se adaugă metodele cercetării operaţionale.

Page 2: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

2

Adică, econometria ar include aproape tot ce presupune măsurare. O astfel de accepţiune ar genera totuşi frecvente suprapuneri cu preocupările altor discipline precum: Statistică economică, Cercetări operaţionale, Teoria deciziei etc.

Econometria poate fi folosită în două moduri, care nu se exclud reciproc: • ca instrument de previziune (date fiind valori ipotetice ale anumitor variabile,

putem previziona valoarea variabilei de interes). • ca metodă explicatorie (poate fi folosită pentru a confirma sau infirma o teorie

economică).

Rolul econometriei Rolul econometriei rezultă din soluţionarea unor obiective precum: a. evidenţierea, pe baze mai obiective, a relaţiilor de cauzalitate din economie;

Ex1. Confirmarea sau infirmarea dependenţei exporturilor de fluctuaţiile cursului de schimb.

Ex2. Existenţa unei relaţii între nivelul fiscalităţii şi investiţiile directe în economie. b. stabilirea proporţiei în care unul sau mai mulţi factori determină evoluţia unei

variabile efect precum şi ierarhizarea factorilor după importanţă;

Ex. O activitate de marketing (cum sunt vânzările pe o nouă piaţă) depinde în primul rând de publicitate, iar în al doilea rând de preţ, ambii factori determinând reuşita unei astfel de activităţi în proporţie de 78%.

c. exprimarea numerică a efectului datorat creşterii cu o unitate a factorului cauză;

Ex1. Productivitatea creşte cu 2%, dacă stimulentele cresc cu o unitate (să zicem 100 lei).

Ex.2. Consumul produsului X scade cu 3 Kg în condiţiile în care preţul creşte cu 100 lei.

d. previziunea evoluţiei unui fenomen economic în raport cu factorii determinanţi

sau ţinând seama de evoluţia fenomenului în perioadele precedente;

Ex1. Se poate realiza prognoza creşterii economice în următorii ani, în condiţiile evoluţiei previzibile a investiţiilor şi a utilizării resurselor de muncă.

Ex2. Se poate determina culoarul în care se va încadra fluctuaţia cotaţiilor la bursă pentru acţiunile societăţii X.

e. aprecierea prin expresii numerice a implicaţiilor pe care o acţiune de politică

economică le are asupra mai multor sectoare economice;

Ex1. În ce măsură creşterea cu 2 p.p. a dobânzii de referinţă de către Banca Naţională a României modifică rata medie a dobânzii practicate de băncile comerciale, cererea de credite, investiţiile, inflaţia etc.

Ex2. În ce măsură creşterea cu 10% a bugetului destinat promovării produselor influenţează vânzările, costurile şi, în ultimă instanţă, profitul.

f. stabilirea intensităţii şi direcţiei fluctuaţiilor din economie;

Ex. Stabilirea perioadelor de maximă şi minimă activitate în domenii precum: acordarea de credite, vânzările unui anumit produs, consumul de resurse etc.

g. aprecierea elementelor semnificative sau nesemnificative (datorate hazardului)

din economie.

Ex1. Scumpirea unui produs a condus, în timp, la o scădere semnificativă a cererii sau această modificare s-a datorat întâmplării?

Ex2. S-au constatat modificări importante ale comportamentului investiţional. Acestea au fost produse de modificarea ratei de impozitare a profitului sau au fost determinate de alte cauze?

Page 3: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

3

Aspectele pe care econometria nu le poate rezolva sau nu le poate rezolva satisfăcător sunt:

1. încorsetarea într-un model generalizator, de mare amploare, a tuturor relaţiilor existente în economie;

2. introducerea în calcul a variabilelor calitative (ca de ex. organizarea, prudenţa, satisfacţia, motivaţia etc.) cu o suficient de mare acurateţe;

3. departajarea suficient de precisă a influenţei fiecărui factor asupra unui fenomen/proces economic, în situaţiile în care factorii ce îl determină evoluează foarte asemănător (se spune în econometrie: „prezintă un grad înalt de coliniaritate”);

4. prognoza suficient de precisă (şi mai cu seamă prognoza schimbărilor de direcţie în evoluţia unui fenomen) în situaţii conjuncturale diferite sau în situaţii în care interacţiunea factorilor reprezintă ea însăşi un factor.

Etapele demersului econometric Etapele demersului econometric sunt următoarele: 1. identificarea teoriei economice care explică fenomenul respectiv; 2. formularea matematică a ipotezelor economice; 3. specificarea modelului econometric; 4. culegerea datelor necesare; 5. estimarea parametrilor modelului econometric; 6. testarea statistică a ipotezelor propuse de teoria economică; 7. predicţia pe baza modelului; 8. utilizarea modelului econometric pentru fundamentarea deciziilor de politică

economică.

Modelul econometric

Modelul econometric este o reprezentare matematică a relaţiilor din economie (relaţii adesea foarte complexe) exprimate prin ecuaţii. Este un model economic formulat în conformitate cu principiile teoriei economice, astfel încât parametrii săi să poată fi estimaţi, dacă se face presupunerea că modelul este corect.

Modelul econometric descrie cu ajutorul unui set de simboluri relaţiile de dependenţă dintre fenomenele economice, pe baza unei ecuaţii sau a unui sistem de ecuaţii, permiţând înţelegerea, explicarea sau obţinerea de informaţii noi privind comportamentul fenomenelor cercetate.

Modelarea oricărui fenomen se poate face pornind de la următoarea schemă:

X Y unde Y=(yi) - volumul ieşirilor din sistem, i=1÷n X=(xj) - factorii cantitativi şi calitativi care influenţează ieşirile Y, j=1÷m S - structura sistemului prin intermediul căreia factorii X determină ieşirile Y

Modelele econometrice pot fi:

� Modele deterministe: y = f(x) Acestea se utilizează frecvent în practica economică pentru analiza pe factori a

variaţiei (în timp sau spaţiu) a fenomenelor social economice. De exemplu:

S

Page 4: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

4

unde Q este producţia, w este productivitatea muncii iar L este factorul muncă. � Modele nedeterministe (econometrice) ce descriu legătura statistică sau

stochastică dintre intrările sistemului (X ) şi ieşirile acestuia (Y), după o relaţie de forma: Y = f(X)+ε

unde X - factorii de influenţă Y - variabila rezultativă f - legea de manifestare a unui fenomen sau proces economic ε - variabila aleatoare Un model econometric poate fi format din una sau mai multe relaţii statistice. Aceste

relaţii pot fi: - relaţii de identitate sau deterministe: sunt formulări logice cu privire la procesul

economic descris. De exemplu: VND = C + I unde VND - Venitul Naţional Disponibil C - consumul total I - investiţiile publice şi private. - relaţii de comportament: au în vedere modificările tradiţiilor, atitudinilor,

înclinaţiilor sub raportul satisfacţie/efort De exemplu: C = a + bV

unde C - consumul V – venitul b – înclinaţia marginală spre consum a – consumul autonom (există un consum chiar şi în absenţa venitului). - relaţii tehnologice: restricţiile impuse output-urilor în raport cu input-urile. De exemplu: funcţia Cobb Douglas:

unde 0<α<1 Q – volumul producţiei K – factorul capital L – factorul muncă. - relaţii instituţionale: sunt relaţii ce apar în conformitate cu unele reglementări

impuse de lege (exemplu: amortizarea, impozitul pe venit etc.).

Variabile şi serii de date Structura modelului econometric este determinată de variabilele economice. Acestea

pot fi: - endogene → variabile determinate în cadrul sistemului (se mai numesc variabile

dependente sau rezultative); - exogene → variabile determinate în afara sistemului, despre care modelul

econometric nu are nimic de spus (se mai numesc variabile independente sau factoriale). Variabila exogenă este variabila aflată în postura de cauză a evoluţiei variabilei endogene, iar valorile sale sunt preluate din statistici.

Datele pot fi grupate în trei categorii: a) date de tip serii de timp - numite şi serii cronologice - reprezintă rezultate ale unor

măsurători efectuate asupra caracteristicilor, unităţilor populaţiei studiate, de-a lungul timpului, la momente succesive sau la anumite intervale de timp.

Page 5: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

5

Acestea sunt date de tip stoc sau de tip flux şi reprezintă "secţiuni informaţionale" de-a lungul axei timpului, de-a lungul evoluţiei; adică sunt secţiuni longitudinale în raport cu axa timpului.

O serie de timp este un set de observaţii asupra valorilor pe care o variabilă le ia la diferite momente de timp. Astfel de date pot fi colectate la intervale de timp regulate, cum ar fi zilnic (ex. prețurile de vânzare, rapoartele meteo), săptămânal (ex. oferta de monedă), lunar (ex. rata șomajului, indicele prețurilor de consum (IPC)), trimestrial (de exemplu, PIB), anual (de exemplu, veniturile şi cheltuielile publice, PIB), cincinal sau chiar decenal (recensământul populaţiei şi locuinţelor).

b) date de tip profil (sau date cross-section) - reprezintă rezultatul unor măsurători efectuate la un anumit moment dat asupra uneia sau mai multor variabile, pe mulţimea unităţilor populaţiei.

Aceste date de profil se mai numesc date de tip secvenţă sau date de tip secţiune şi reprezintă "tăieturi informaţionale" efectuate într-o populaţie la un moment dat, "tăieturi" care sunt de tip transversal, în raport cu axa timpului.

Cu alte cuvinte, datele de tip profil sunt date privind una sau mai multe variabile colectate în același punct în timp. Ex. producţia de ouă şi preţul mediu al acestora pe fiecare judeţ al ţării în anul n.

c) date de tip panel sunt combinaţii, mixturi, ale datelor de tip profil şi datelor de tipul seriilor de timp.

Ele sunt rezultate ale măsurătorilor efectuate asupra caracteristicilor unor unităţi individuale, atât de-a lungul unităţilor individuale, cât şi de-a lungul timpului, sunt "tăieturi informaţionale mixte" transversale şi logitudinale, în raport cu axa timpului. Caracteristica esenţială a acestor date este deci, simultaneitatea.

Ex. rata şomajului şi numărul şomerilor indemnizaţi pe fiecare judeţ al ţării în fiecare din cele 12 luni ale anului.

Tipologia modelelor econometrice Deşi tipologia modelelor econometrice este foarte variată, ele se pot încadra în câteva

tipuri sau clase principale. I. În funcţie de numărul factorilor luaţi în considerare

• modele unifactoriale: y = f(x)+ε Acestea se fundamentează pe ipoteza că în rândul factorilor de influenţă ai variabilei

rezultative Y există un factor determinant X, ceilalţi factori, cu excepţia acestuia având o influenţă întâmplătoare (exprimată prin intermediul variabilei reziduale ε) sau fiind invariabili în perioada analizată.

Ex. relaţia dintre vânzări şi preţ

• modele multifactoriale: y = f(x1,x2,...,xp)+ε

Aici variabila dependentă sau endogenă este explicată prin intermediul variaţiei a două sau mai multe variabile independente sau exogene.

Observaţie! Numărul factorilor luaţi în considerare nu trebuie să fie foarte mare pentru ca modelul să nu fie prea complex şi dificil de estimat.

Ex.

II. În funcţie de forma legăturii dintre variabila rezultativă şi variabilele cauză

avem: • modele liniare: dacă legătura este liniară • modele neliniare: dacă legătura este neliniară

Page 6: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

6

III. În funcţie modul de includere al factorului timp în model se disting: • modele statice: dependenţa variabilei endogene Y faţă de valorile variabilei

exogene Xj se realizează în aceeaşi perioadă de timp: yt = f(x1t,...,xjt,...,xkt) + ε t

• modele dinamice. Acestea se definesc prin următoarele forme: - introducerea variabilei timp în pachetul variabilelor explicative în mod

explicit yt = f(xt,t) + ε t

- modele autoregresive → introducerea în pachetul variabilelor explicative a variabilei y dar cu valori decalate

yt = f(xt,yt-k) + ε t

- model cu decalaj (lag): în care variabila exogenă X îşi exercită influenţa asupra variaţiei variabilei rezultative y pe mai multe perioade de timp:

yt = f(xt,xt-1,... xt-k) + ε t

unde Kt - fondurile fixe puse în funcţiune în perioada t sunt funcţie de investiţiile efectuate în perioadele precedente t-n÷t.

IV. În funcţie de numărul ecuaţiilor incluse în model distingem: • modele cu o singură ecuaţie: toate modelele prezentate anterior; • modele cu ecuaţii multiple: sunt formate dintr-un sistem de ecuaţii

=+++++++

=+++++++

=+++++++

nmnmnnnnn

mmnn

mmnn

XcXcXcYYbYb

XcXcXcYbYYb

XcXcXcYbYbY

ε

εε

......

......

......

22112211

2222212122121

1121211112121

M

niYi ,1, = - variabile rezultative sau endogene

mjX j ,1, = - variabile explicative sau exogene

Testarea ipotezelor statistice

Managerii trebuie să ia decizii, iar acest lucru îl pot face pe baza informaţiilor de care

dispun. Aceştia emit ipoteze pe care le pot testa ştiinţific utilizând metodele şi tehnicile statistice.

Ex. Un lanţ de magazine doreşte să vândă un produs nou lansat pe piaţă şi speră să aibă succes. În urma unei analize financiare, specialiştii observă că, dacă mai mult de 10% dintre potenţialii cumpărători vor cumpăra produsul, lanţul de magazine va obţine profit. Specialiştii de marketing, pentru a lua o decizie în sensul de a vinde sau nu produsul respectiv, vor selecta un eşantion aleatoriu de clienţi potenţiali, iar aceştia vor fi întrebaţi dacă vor cumpăra sau nu produsul respectiv. Parametrul este reprezentat de proporţia clienţilor care ar cumpăra produsul. Testarea ipotezei statistice se va referi la a determina dacă proporţia cumpărătorilor este mai mare de 10%.

În urma prelevării unui eşantion dintr-o populaţie statistică, prin prelucrarea datelor se va obţine un estimator al parametrului urmărit în populaţia de origine.

În exemplul nostru, dacă s-ar face analiza pe toată populaţia s-ar constata că x% din clienţi ar cumpăra produsul. Dar noi nu putem face analiza pe toată populaţia, ci doar pe un eşantion. Pe eşantion însă noi nu putem face decât o estimaţie. Putem spune că %x din cei intervievaţi ar cumpăra produsul.

Ex. , , ) + ε t

Page 7: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

7

Se pune problema de a vedea în ce măsură parametrul estimat pe baza rezultatelor sondajului asigură „credibilitatea” aprecierilor făcute asupra întregii colectivităţi. Estimatorul este, aşadar, o „presupunere” asupra parametrului, deci o ipoteză statistică. Când cunoaştem totul despre un fenomen, nu avem ce ipoteză să testăm. Testarea ipotezei se face doar atunci când există incertitudine.

Ipoteza statistică este ipoteza care se face cu privire la parametrul unei repartiţii sau la legea de repartiţie pe care o urmează anumite variabile aleatoare. O ipoteză statistică poate fi corectă sau greşită.

Ipoteza statistică ce urmează a fi testată se numeşte ipoteză nulă şi este notată cu H0. Aceasta constă în a admite că nu există deosebiri esenţiale între valoarea estimatorului şi valoarea parametrului.

Respingerea ipotezei nule care este testată implică acceptarea ipotezei alternative, notată cu H1.

Cele două ipoteze reprezintă teorii mutual exclusive şi exhaustive, asupra valorii parametrului populaţiei sau legii de repartiţie.

Cele două ipoteze sunt mutual exclusive deoarece este imposibil ca ambele ipoteze să fie adevărate.

Ipotezele sunt exhaustive deoarece acoperă toate posibilităţile. Cu alte cuvinte, ori ipoteza nulă, ori ipoteza alternativă trebuie să fie adevărată.

Procedeul de verificare a unei ipoteze statistice se numeşte test sau criteriu de

semnificaţie. Pentru testarea unei ipoteze statistice se urmează o secvenţă de paşi, astfel: 1) Se identifică ipoteza statistică specială despre parametrul populaţiei sau legea

de repartiţie. Ipoteza statistică – numită şi ipoteză nulă H0 – specifică întotdeauna o singură valoare

a parametrului populaţiei, adică ceea ce este acceptat până se dovedeşte a fi fals. 2) Ipoteza nulă este însoţită întotdeauna de ipoteza alternativă H1, ce reprezintă o

teorie care contrazice ipoteza nulă. Ea va fi acceptată doar când există suficiente dovezi, evidenţe, pentru a se stabili că este adevărată.

Ipoteza alternativă este cea mai importantă, deoarece este ipoteza care ne răspunde la întrebare.

Ipoteza alternativă poate căpăta trei forme, care răspund la trei tipuri de întrebări referitoare la parametrul studiat:

- dacă parametrul este diferit (mai mare sau mai mic) decât valoarea specificată în ipoteza nulă;

- dacă parametrul este mai mare decât valoarea specificată în ipoteza nulă; - dacă parametrul este mai mic decât valoarea specificată în ipoteza nulă; 3) Se calculează indicatorii statistici pentru eşantion şi se determină testul statistic ce

va fi utilizat drept criteriu de acceptare sau de respingere a ipotezei nule. În cazul nostru, deoarece media eşantionului este un estimator punctual al mediei din

colectivitatea generală, ea va fi utilizată în testarea ipotezelor privind parametrul media colectivităţii generale.

4) Se stabileşte regiunea critică, Rc. Regiunea critică reprezintă valorile numerice ale testului statistic pentru care ipoteza nulă va fi respinsă. Regiunea critică este astfel aleasă încât probabilitatea ca ea să conţină testul statistic, când ipoteza nulă este adevărată, să fie α, cu α având o valoare mică (ex. α=0,01 etc).

Verificarea ipotezei nule se face pe baza unui eşantion de volum n, extras dintr-o populaţie totală N. Dacă punctul definit de vectorul de sondaj cade în regiunea critică Rc, ipoteza H0 se respinge, iar dacă punctul cade în afara regiunii critice Rc, ipoteza H0 se acceptă.

Page 8: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

8

În baza legii numerelor mari, numai într-un număr foarte mic de cazuri punctul rezultat din sondaj va cădea în Rc, majoritatea vor cădea în afara regiunii critice. Nu este însă exclus ca punctul din sondaj să cadă în regiunea critică, cu toate că ipoteza nulă despre parametrul populaţiei este adevărată. Mai exact, atunci când respingem ipoteza nulă, trebuie să ne gândim de două ori, deoarece există două posibilităţi:

a. să fie falsă într-adevăr şi b. să fie totuşi adevărată, deşi pe baza datelor din sondaj o respingem. La fel şi pentru situaţia în care acceptăm ipoteza nulă H0. Şi aici există două

posibilităţi: a. ipoteza nulă este adevărată şi b. ipoteza nulă este totuşi falsă, greşită, deşi nu am respins-o. Aşadar, este mai corect să spunem că, pe baza datelor din eşantionul studiat, nu putem

respinge ipoteza nulă, decât să spunem că ipoteza nulă este adevărată.

Eroarea pe care o facem eliminând o ipoteză nulă, deşi este adevărată, se numeşte eroare de genul întâi. Probabilitatea comiterii unei astfel de erori reprezintă riscul de genul

întâi (α) şi se numeşte nivel sau prag de semnificaţie. Nivelul de încredere al unui test statistic este (1-α), iar în expresie procentuală, (1-

α)100 reprezintă probabilitatea de garantare a rezultatelor. Eroarea pe cere o facem acceptând o ipoteză nulă, deşi este falsă, se numeşte eroare

de genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se notează cu β. Puterea testului statistic este (1-β).

Legătura dintre decizia pe care o luăm referitor la ipoteza nulă şi adevărul sau falsitatea acestei este redată în tabelul de mai jos.

Tabelul 1. Erorile în testarea ipotezelor statistice

Decizia de acceptare Ipoteza adevărată

H0 H1

H0 Decizie corectă

(probabilitate 1-α) Eroare de gen II

(risc β)

H1 Eroare de gen I

(risc α) Decizie corectă

(probabilitate 1-β) Cu cât probabilităţile comiterii erorilor de genul întâi şi de genul al doilea sunt mai

mici, cu atât testul este mai bun. Prin mărirea eşantionului probabilitatea comiterii erorilor se micşorează.

5) După ce am stabilit pragul de semnificaţie şi regiunea critică, trecem la pasul următor, în care vom face principalele presupuneri despre populaţia sau populaţiile ce

sunt eşantionate (normalitate etc.). 6) Se calculează apoi testul statistic şi se determină valoarea sa numerică, pe baza

datelor din eşantion. 7) La ultimul pas, se desprind concluziile: ipoteza nulă este fie acceptată, fie respinsă,

astfel: • dacă valoarea numerică a testului statistic cade în regiunea critică Rc, respingem

ipoteza nulă şi concluzionăm că ipoteza alternativă este adevărată; • dacă valoarea numerică a testului nu cade în regiunea critică Rc, se acceptă

ipoteza nulă H0. Ipoteza alternativă poate avea, aşa cum am arătat, una din trei forme (pe care le vom

exemplifica pentru testarea egalităţii parametrului „media colectivităţii generale”, μ cu valoarea μ0):

Page 9: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

9

I) să testăm dacă parametrul din colectivitatea generală (media μ) este egal cu o anumită valoare (inclusiv zero, μ0), cu alternativa media diferită de valoarea μ0.

Atunci: H0: μ = μ0, H1: μ ≠ μ0 (μ < μ0 sau μ > μ0) şi acest test este un test bilateral;

II) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai mare decât μ0: În acest caz, H0: μ = μ0, H1: μ > μ0, care este un test unilateral dreapta; III) să testăm ipoteza nulă μ = μ0, cu alternativa media μ este mai mică decât μ0. H0: μ = μ0, H1: μ < μ0, care este un test unilateral stânga. Regiunea critică pentru testul bilateral diferă de cea pentru testul unilateral (a se vedea

pe grafic regiunea haşurată).

μ μ μ a) b) c)

Figura 1. Regiunea critică pentru: a) test bilateral; b) test unilateral dreapta; c) test unilateral stânga

Testarea ipotezei privind media populaţiei generale (μ)

pentru eşantioane de volum mare

Eşantioane de volum mare înseamnă n > 30. Testarea se face pe baza mediei

eşantionului x şi, pentru a o efectua, este nevoie să construim un test cu un nivel de semnificaţie α prestabilit.

Dacă volumul eşantionului este mare, media eşantionului x este aproximativ normal

distribuită. Se va aplica testul z. Variabila aleatoare z urmează o distribuţie normală standard. Statistica z are următoarea formă:

n

xz

x

calcσ

µ0−=

unde, x - media eşantionului; μ0 - media teoretică (media populaţiei generale) n – volumul eşantionului;

xσ - abaterea medie pătratică a populaţiei.

Valoarea calculată a lui z (calcz ) se va compara cu valoarea tabelată ( )(αtabz ) pentru

pragul de semnificaţie α ales. În funcţie de probabilitatea acceptată se respinge sau se acceptă ipoteza nulă ca în

tabelul următor.

α/2 α αα/2

Page 10: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

10

Tabelul 2. Criterii de decizie

Tipul testului Distribuţia normală (z)

Eşantion mare (n≥30)

Test unilateral stânga zcalc. > - )(αtabz acceptăm H0

zcalc. ≤ - )(αtabz respingem H0

Test unilateral dreapta zcalc. < )(αtabz acceptăm H0

zcalc. ≥ )(αtabz respingem H0

Test bilateral - )2/(αtabz < zcalc.< )2/(αtabz acceptăm H0

zcalc. ≤ - )2/(αtabz sau zcalc. ≥ )2/(αtabz respingem H0

Testarea ipotezei privind media populaţiei generale (μ)

pentru eşantioane de volum redus

În domeniul afacerilor, de multe ori deciziile trebuie luate pe baza datelor provenite din eşantioane mici. Eşantioane mici înseamnă n≤30. Aici forma distribuţiei de eşantionare a

mediei x depinde de forma populaţiei generale din care a fost extras eşantionul. În cazul

eşantioanelor de volum redus, distribuţia de eşantionare a lui x va fi normală sau aproximativ normală doar dacă colectivitatea generală este distribuită normal sau aproximativ normal.

Spre deosebire de cazul eşantioanelor de volum mare (n>30), în cazul eşantioanelor de volum redus dacă nu se cunoaşte dispersia din colectivitatea generală ( 2

xσ ), atunci dispersia

eşantionului ( 2xs ), poate să nu ofere o aproximare foarte bună a lui 2

xσ (în cazul eşantioanelor

mici). În această situaţie, în locul statisticii z care necesită cunoaşterea lui xσ , vom folosi

statistica t:

ns

xt

x

calc0

.

µ−= ,

unde: x - media eşantionului n – volumul eşantionului μ0 – media teoretică (respectiv media populaţiei generale) sx – estimaţia abaterii standard necunoscute

( )

1

2

2

−= ∑

n

xxs

i

x → ( )

1

2

−= ∑

n

xxs

i

x

Ipotezele statistice privind media colectivităţii generale (μ) pe baza datelor din

eşantioane de volum redus sunt: - pentru test bilateral H0: μ = μ0 H1: μ ≠ μ0 (μ < μ0 sau μ > μ0) - pentru test unilateral dreapta H0: μ = μ0 H1: μ > μ0 - pentru test unilateral stânga H0: μ = μ0 H1: μ < μ0

Page 11: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

11

Presupunerea specială ce trebuie făcută este aceea că populaţia generală este normal sau

aproximativ normal distribuită. Regiunea critică este dată de: I) pentru test bilateral tcalc. ≥ t tab. (α/2,n-1) sau tcalc. ≤ - t tab.(α/2,n-1) II) pentru test unilateral dreapta tcalc. ≥ t tab. (α,n-1) III) pentru test unilateral stânga

tcalc.≤ - t tab. (α,n-1)

Testarea ipotezei privind proporţia populaţiei

pentru eşantioane mari

Despre distribuţia de eşantionare a proporţiei cunoaştem că proporţia în eşantion (f)

este aproximativ normal distribuită, de medie p şi eroare standard npp /)1( − , pentru n mare.

Deoarece proporţia f este aproximativ normal distribuită, vom folosi testul:

nff

pfzcalc

/)1(0

.−

−=

Observaţie! 1) Dacă volumul eşantionului este mic, distribuţia de eşantionare a proporţiei nu este o

distribuţie t şi orice inferenţă asupra lui p trebuie să se bazeze pe distribuţia lui f, care este o distribuţie binomială.

2) Pentru testarea ipotezelor statistice privind proporţia este necesar să lucrăm cu eşantioane mari (n>100).

Ipotezele nule şi alternative pentru testarea proporţiei se construiesc în aceeaşi manieră

cu ipotezele pentru testarea mediei µ . Ipoteza nulă indică faptul că p este egală cu o valoare specificată:

00 : ppH =

Ipoteza alternativă răspunde la una dintre cele trei întrebări: - proporţia este diferită de valoarea specificată → test bilateral: 01 : ppH ≠

- proporţia este mai mare decât valoarea specificată → test unilateral dreapta: 01 : ppH >

- proporţia este mai mică decât valoarea specificată → test unilateral stânga: 01 : ppH <

Regiunea critică (Rc) este dată de: I) pentru test bilateral

)2/.(. αtabcalc zz −≤ sau )2/.(. αtabcalc zz ≥

II) pentru test unilateral dreapta

).(. αtabcalc zz ≥

III) pentru test unilateral stânga

).(. αtabcalc zz −≤

Page 12: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

12

Regula de decizie este: se respinge ipoteza nulă şi se acceptă ipoteza alternativă, dacă z se situează în regiunea critică (Rc) stabilită în funcţie de probabilitatea dorită de garantare a rezultatelor 100)1( ⋅−= αP .

Modele econometrice de regresie unifactorială

Tipuri de legături între fenomenele social-economice

Fenomenele social-economice sunt rezultatul influenţei conjugate a mai multor

fenomene cauză. Nu toate raporturile de dependenţă sunt însă la fel de importante, uneori acţiunile unor factori compensându-se reciproc.

În cea mai mare parte, legăturile dintre fenomene sunt legături de cauzalitate, bazate pe relaţia cauză-efect. Astfel, putem avea:

a) legătură nulă – când nu există niciun fel de influenţă reciprocă între variabilele considerate, acestea fiind independente;

b) legătură funcţională – când modificarea unei variabile cauză produce variaţia unei variabile efect într-o măsură ce rămâne constantă, indiferent de timpul şi de locul de referinţă. Această legătură se mai numeşte legătură de tip determinist. Frecvente în natură, în domeniul tehnic, legăturile funcţionale sunt rareori întâlnite în domeniul social-economic;

c) legătură statistică sau stochastică – când modificarea unei variabile efect este rezultatul combinării mai multor cauze, care pot acţiona în acelaşi sens sau în sensuri opuse, generând forme diferite de manifestare individuală. În domeniul social-economic cele mai frecvente sunt legăturile statistice.

Multitudinea legăturilor statistice necesită clasificarea acestora după mai multe criterii.

I. După numărul variabilelor independente luate în calcul se disting: a. legături simple – când se studiază dependenţa dintre o variabilă rezultativă (y) şi o

singură variabilă factorială (x) considerată principală. Ex. legătura de dintre suprafaţa comercială utilă (x) şi valoarea vânzărilor (y). b. legături multiple – când se studiază dependenţa dintre o variabilă rezultativă (y) şi

două sau mai multe variabile factoriale (x). Ex. legătura de dintre capacitatea de cazare (x1), numărul de înnoptări (x2) şi valoarea

încasărilor (y). II. După direcţia legăturilor avem: a. legături directe – când variabila rezultativă se modifică în acelaşi sens cu variabila

factorială: dacă x creşte y creşte, dacă x scade y scade. Ex. creşterea vânzărilor de maşini de spălat determină creşterea vânzărilor de

detergenţi pentru maşină. b. legături inverse – când variabila rezultativă se modifică în sens invers modificării

variabilei factoriale: dacă x creşte y scade, iar dacă x scade y creşte. Ex. creşterea nivelului de pregătire al muncitorilor determină scăderea numărului de

rebuturi din producţie. III. După forma legăturilor: a. legături liniare – acele dependenţe care pot fi exprimate cu ajutorul funcţiei

liniare; b. legături neliniare (curbilinii) – acele dependenţe care pot fi exprimate cu ajutorul

funcţiilor neliniare: parabolă, hiperbolă, funcţie exponenţială etc. III. După timpul în care se realizează:

Page 13: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

13

a. legături sincrone (concomitente) – se realizează în acelaşi timp, se pot urmări în dinamică pentru aceeaşi perioadă

Ex. legătura dintre productivitatea muncii şi nivelul salariilor muncitorilor. b. legături asincrone – apar atunci când variabilele factoriale (x) încep să acţioneze

asupra variabilei rezultative (y) după scurgerea unei perioade de timp. Ex. între dezvoltarea unei ramuri noi de producţie şi mărimea exportului există un

decalaj corespunzător asigurării competitivităţii produselor pe plan internaţional.

Modelul liniar simplu

Regresia este o metodă de cercetare a unei relaţii predeterminate, exprimând legătura dintre variabila rezultativă (y) şi una sau mai multe variabile independente (x).

Practic, metoda regresiei este o metodă de cercetare a legăturilor statistice cu ajutorul unor funcţii denumite funcţii de regresie.

Funcţia de regresie exprimă modificarea cantitativă a variabilei rezultative (y) ca urmare a influenţei exercitate de variabila factorială (x), ceilalţi factori fiind consideraţi neesenţiali şi cu acţiune constantă asupra tuturor unităţilor.

Forma matematică a modelului liniar unifactorial este:

iii xbay ε+⋅+=

unde: iy - variabila rezultativă/dependentă;

ix - variabila factorială/independentă;

iε - variabila aleatoare/reziduală, variabila care poate perturba relaţia dintre

principalii „actori”, expresie a acţiunii cauzelor minore, puţin cunoscute, a căror influenţă poate accentua sau diminua întrucâtva rolul factorului determinant.

a şi b sunt parametrii ecuaţiei de regresie; a - ordonata la origine, valoarea lui y când x = 0. Nu are întotdeauna o

semnificaţie economică. b - panta dreptei, numit şi coeficient unghiular de regresie. Are mare

importanţă în analiza de regresie. Dacă b = 0, cele două variabile sunt independente; variaţia lui y depinde de alţi factori, nu de cei consideraţi iniţial în model.

Dacă b ≠ 0, cele două variabile sunt dependente astfel: - dacă b > 0, legătura dintre variabile este directă, pozitivă; - dacă b < 0, legătura dintre variabile este inversă, negativă. Mărimea coeficientului „b” arată cu cât se modifică y, atunci când variabila x se modifică cu o unitate. a şi b (parametrii de regresie) sunt de fapt adevăratele valori care descriu legătura din interiorul populaţiei. În realitate, a şi b nu se cunosc şi trebuie determinate pe baza datelor din sondaj.

Asupra variabilei reziduale şi asupra variabile explicative se formulează următorul set de ipoteze:

- ipoteza I: seriile de date nu sunt afectate de erori de măsură; - ipoteza II: variabila reziduală este de medie zero; - ipoteza III: variaţia variabilei reziduale este invariabilă în timp; - ipoteza IV: reziduurile nu sunt autocorelate; - ipoteza V: variabila explicativă nu este corelată cu variabila reziduală;

Page 14: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

14

- ipoteza VI: erorile iε sunt presupuse a fi normal distribuite pentru oricare i.

Aşadar iε sunt distribuite normal şi independent, de medie zero şi varianţă

constantă. Acest lucru se notează iε ~ N(0, σ2).

Reprezentarea grafică a datelor empirice

Se consideră un set de n observaţii. Fiecare observaţie este de fapt un set de valori: o

valoare pentru x şi o valoare corespunzătoare pentru y. O modalitate simplă de a vedea dacă între x şi y există vreo legătură, precum şi

natura acestei legături este de a reprezenta grafic perechile de valori. Acest tip de reprezentare grafică poartă numele de diagramă a împrăştierii („scatter diagrame”).

Exemplu: Dorim să evidenţiem legătura dintre doza de sedativ şi timpul de adormire. Se selectează 10 subiecţi umani care primesc diverse doze de sedativ şi se

înregistrează timpii de adormire. Scopul studiului este de a cuantifica efectele sedativului.

Subiect Doză

(miligrame)

Timp de adormire

(secunde)

1 10 50 2 10 60 3 15 45 4 15 50 5 20 38 6 20 45 7 25 30 8 25 40 9 30 35 10 30 25

0

10

20

30

40

50

60

70

0 5 10 15 20 25 30 35

Tim

pu

l d

e a

do

rmir

e

Doza de sedativ

Page 15: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

15

Examinând graficul se poate constata că timpul de adormire scade pe măsura creşterii dozei de sedativ, legătura fiind liniară. Norul de puncte se aliniază de-a lungul unei drepte.

Estimarea parametrilor modelului de regresie Pentru a determina valorile ecuaţiei de regresie, trebuie să se calculeze parametrii a

şi b . Ceea ce determinăm noi pe baza datelor din sondaj sunt estimatori ai parametrilor modelului de regresie şi îi vom nota a şi b , pentru că nu cunoaştem toate datele populaţiei generale.

Pentru aceasta vom utiliza metoda celor mai mici pătrate (MCMMP). a şi b fiind estimaţii ale adevăratelor valori ai parametrilor de regresie, se va obţine o

estimaţie a dreptei de regresie: ii xbay ⋅+= ˆˆˆ

a şi b trebuie să aibă acele valori astfel încât iy să fie cât mai aproape de iy . Acest

lucru se întâmplă când suma pătratelor abaterilor valorilor empirice de la valorile adevărate este minimă:

minim)ˆ( 2 =−= ∑ ii yyS

minim)]ˆˆ([ 2 =⋅+−∑ ii xbay

Condiţia de minim se îndeplineşte atunci când derivatele parţiale în raport cu a şi b

sunt nule.

=−⋅−−=∂

=−⋅−−=∂∂

0))(ˆˆ(2ˆ

0)1)(ˆˆ(2ˆ

iii

ii

xxbayb

S

xbaya

S

Vom simplifica cu 2 şi vom separa cunoscutele de necunoscute obţinând:

⋅=+

=+

∑∑∑∑∑

iiii

ii

yxxbxa

yxban

2ˆˆ

ˆˆ

Rezolvând sistemul de ecuaţii normale se vor obţine următoarele soluţii:

∑ ∑∑ ∑ ∑ ∑

∑∑∑

∑∑∑∑

⋅−⋅==

∆∆

=22

2

2

2

)(

ˆˆ

ii

iiiii

ii

i

iii

ii

xxn

yxxxy

xx

xn

xyx

xy

p

aa

∑ ∑∑ ∑ ∑

∑∑∑∑∑∑

−==

∆∆

=22

2

)(

ˆˆ

ii

iiii

ii

i

iii

i

xxn

yxyxn

xx

xn

yxx

yn

p

bb

Page 16: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

16

Vom determina estimatorii a şi b pentru exemplul de mai sus.

Subiect

Doză

(miligrame)

ix

Timp de adormire

(secunde)

iy

2ix ii yx ⋅

1 10 50 100 500 2 10 60 100 600 3 15 45 225 675 4 15 50 225 750 5 20 38 400 760 6 20 45 400 900 7 25 30 625 750 8 25 40 625 1000 9 30 35 900 1050 10 30 25 900 750

Total 200 418 4500 7735

8,6640000450010

77352004500418

)(ˆ

22

2

=−⋅

⋅−⋅=

⋅−⋅=

∑ ∑∑ ∑ ∑ ∑

ii

iiiii

xxn

yxxxya

25,140000450010

418200773510

)(ˆ

22−=

−⋅⋅−⋅

=−

−=

∑ ∑∑ ∑ ∑

ii

iiii

xxn

yxyxnb

Aşadar, ii xy 25,18,66ˆ −=

Semnul „-„ ne arată că legătura între cele două variabile este o legătură inversă. Când doza de sedativ creşte, timpul de adormire scade. Mai exact, creşterea dozei de sedativ cu 1 mg reduce timpul de adormire cu 1,25 minute.

Coeficientul de determinaţie

Coeficientul de determinaţie (R2) ne indică în ce măsură modelul liniar de regresie

explică dependenţa dintre variabile. Coeficientul de determinaţie se calculează astfel:

∑∑

−−=

2

22

/)(

)ˆ(1

yy

yyR

i

ii

xy

]1,0[2/ ∈xyR

Dacă 02/ =xyR , variabilele sunt independente;

02/ →xyR , legătura dintre variabile este slabă;

12/ →xyR , legătura dintre variabile este puternică.

Aplicaţie: Numărul mediu de angajaţi şi profitul anual înregistrat de 10 firme dintr-o

subramură industrială se prezintă astfel:

Page 17: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

17

Se cere: a. să se analizeze existenţa, direcţia şi forma legăturii; b. să se determine parametrii funcţiei de regresie; c. să se calculeze valorile funcţiei de regresie; d. să se determine intensitatea legăturii dintre variabile utilizând coeficientul de

determinaţie.

Rezolvare: a. Variabila factorială este numărul mediu de angajaţi ( ix ) , iar variabila rezultativă este

mărimea profitului ( iy ).

Trasând graficul, observăm că între cele două variabile există o legătură directă (pe măsură ce creşte numărul mediu de angajaţi creşte şi profitul anual), de tip liniar (norul de puncte aliniindu-se de-a lungul unei drepte).

b. Sistemul de ecuaţii normale necesar pentru aflarea parametrilor funcţiei liniare este:

⋅=+

=+

∑∑∑∑∑

iiii

ii

yxxbxa

yxban

2ˆˆ

ˆˆ

0

20

40

60

80

100

120

140

0 2 4 6 8 10 12 14

Pro

fit

an

ua

l (m

il.l

ei)

Număr de angajaţi (persoane)

Nr.crt. Număr mediu de angajaţi

(persoane)

Profit anual

(mil.lei)

1 13 115

2 4 45

3 12 100

4 5 50

5 6 55

6 8 85

7 3 40

8 4 50

9 5 45

10 7 70

Total 67 655

Page 18: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

18

Utilizând rezultatele calculelor intermediare prezentate în tabelul de mai jos, coloanele 1-4, se obţine sistemul:

=+

=+

5170ˆ553ˆ67

655ˆ67ˆ10

ba

ba

Rezolvând acest sistem se obţin soluţiile: a = 15,2017

b = 7,5072

ix iy 2ix ii yx ⋅ iy 2)ˆ( ii yy − 2)( yyi −

1 2 3 4 5 6 7

13 115 169 1495 112,80 4,84 2450,25

4 45 16 180 45,23 0,05 420,25

12 100 144 1200 105,29 27,99 1190,25

5 50 25 250 52,74 7,51 240,25

6 55 36 330 60,24 27,46 110,25

8 85 64 680 75,26 94,87 380,26

3 40 9 120 37,72 5,2 650,25

4 50 16 200 45,23 22,75 240,25

5 45 25 225 52,74 59,91 420,25

7 70 49 490 67,75 5,06 20,25

67 655 553 5170 655 255,64 6122,50

c. Valorile teoretice ale profitului se vor calcula înlocuind fiecare valoare a variabilei

factoriale ix în funcţia de regresie. Rezultatele sunt prezentate în coloana 5 din tabelul

de mai sus.

ii xy ⋅+= 5072,72017,15ˆ

80,112135072,72017,15ˆ1 =⋅+=y

23,4545072,72017,15ˆ2 =⋅+=y

5,6510

655=== ∑

n

yy

i mil.lei/firmă

d. Coeficientul de determinaţie se calculează astfel:

9582,004175,0150,6122

64,2551

)(

)ˆ(1

2

22

/ =−=−=−

−−=

∑∑

yy

yyR

i

ii

xy

Această valoare foarte apropiată de 1 indică o legătură directă foarte puternică între variabile.

Estimarea valorilor variabilei dependente

Una dintre utilizările importante ale analizei regresiei simple liniare este să obţinem

previzionări sau predicţii ale variabilei dependente, condiţionate de valorile variabilei independente, adică să obţinem previzionări condiţionate.

Pentru a obţine estimaţii punctuale, folosim ecuaţia de regresie liniară în eşantion:

iii xbay ε+⋅+=

Page 19: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

19

şi atunci, înlocuind cu valoarea dată Xn+1, obţinem:

11ˆˆˆ ++ ⋅+= nn xbay

Testarea semnificaţiei modelului de regresie

Parametrii modelului, şi deci modelul în ansamblu, sunt obţinuţi pe baza datelor

dintr-un eşantion de observaţii. De aceea, este necesară verificarea rezultatelor obţinute prin teste statistice.

A. Testarea ipotezelor statistice referitoare la semnificaţia parametrilor

Testarea ipotezei asupra parametrului b este similară algoritmului de testare al oricărui parametru.

Se va porni de la testarea ipotezei nule şi anume inexistenţa unei legături liniare între cele două variabile, adică panta dreptei de regresie este 0.

H0: b = 0 ceea ce înseamnă că x nu are niciun efect (liniar) asupra lui y. H1: b ≠ 0 ceea ce înseamnă că x are un efect asupra lui y. Pentru aceasta se defineşte o statistică a testului pe baza relaţiei:

b

calc

bt

ˆ.

σ−

=

unde b - estimatorul parametrului;

b

σ - eroarea standard a estimatorului b .

Se utilizează testul t pentru un eşantion de volum mic. Dacă volumul eşantionului este mare se utilizează testul z.

Întregul demers presupus de testul t se bazează pe prezumţia conform căreia abaterile

estimaţiei b de la media sa )ˆ(bM , care s-ar obţine în cazul estimării pentru mai multe eşantioane de volum identic, urmează o repartiţie normală.

Dacă avem în vedere că abaterea de la medie împărţită la abaterea medie pătratică

−σ

)ˆ(ˆ bMb urmează, pentru eşantioane de volum redus (n<30), repartiţia Student (de unde

nivelul t – tabelat), ne interesează o astfel de transformare a estimaţiei obţinute astfel încât să devină comparabilă cu nivelul t tabelat pentru (n-k) grade de libertate şi un risc α apriori ales.

Întrucât, de regulă, nu dispunem de mai multe eşantioane, ci avem date pentru un

singur eşantion, preferăm să considerăm abaterea estimaţiei în raport cu zero

−σ

0b.

Acesta ar fi motivul pentru care ne pronunţăm în urma acestui test, cu privire la deosebirea semnificativă sau nesemnificativă a estimaţiei în raport cu zero.

tcalc.se compară cu t kntab ),2/.( −α

unde: (n-k) – numărul gradelor de libertate n – numărul observaţiilor/cazurilor k – numărul de parametri din model Pentru modelul simplu unifactorial avem (n-2) grade de libertate. Regiunea de critică este dată de ),2/.(. kntabcalc tt −> α

Pentru testarea ipotezelor formulate asupra termenului liber se parcurg aceleaşi etape ca în cazul coeficientului unghiular de regresie.

Page 20: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

20

Ipotezele testului sunt formulate astfel: H0: a = 0 H1: a ≠ 0 Statistica testului este:

acalc

at

ˆ.

σ−

=

Regiunea critică este ),2/.(. kntabcalc tt −> α

În cazul modelului unifactorial de tipul:

ε++= xbay ˆˆˆ

abaterea medie pătratică pentru estimaţia b este:

∑ −=

i

ib xx 2

2

ˆ)(

εσσ

iar abaterea medie pătratică pentru estimaţia a :

−+⋅=

∑i

i

axx

x

n 2

22

ˆ)(

1εσσ

B. Evaluarea calităţii modelului de regresie

O posibilitate de testare a calităţii modelului liniar de regresie este oferită de analiza

varianţei. Acest procedeu statistic este implementat pe majoritatea sistemelor de calcul statistic şi econometric.

Analiza varianţei este un procedeu statistic de testare a calităţii modelului ce pleacă de la descompunerea varianţei totale în varianţa datorată factorului de regresie şi varianţa

datorată acţiunii factorilor neînregistraţi.

∑ −= 2)( yySST i - suma pătratelor abaterilor totale

xi

y

X

yi

SST

SSE

SSR

_

y ∧∧∧∧

Y

y _ y ∧∧∧∧

Page 21: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

21

Aceasta reprezintă suma pătratelor abaterilor termenilor seriei variabilei endogene de la media acestei serii. Acest termen cuantifică dispersia termenilor seriei ca rezultat al acţiunii tuturor factorilor, atât a factorului de regresie, cât şi a celor neînregistraţi. ∑ −= 2)ˆ( yySSR i - suma pătratelor abaterilor determinate de regresie

Acesta cuantifică suma pătratelor abaterilor termenilor estimaţi prin modelul de regresie de la media variabilei endogene. Acest termen măsoară acţiunea factorilor de regresie.

∑∑ −== 22 )ˆ( iii yySSE ε - suma pătratelor erorilor de estimaţie

Este un termen ce cuantifică acţiunea factorilor neînregistraţi asupra gradului de dispersare a termenilor seriei variabilei endogene.

Avem aşadar egalitatea: SSESSRSST +=

unde: y - nivelul mediu al variabilei dependente;

iy - valorile observate ale variabilei dependente;

iy - valoarea estimată pentru ix .

Pentru testarea calităţii modelului apelăm la repartiţia raportului dispersiilor (repartiţia Snedecor), ceea ce implică transformarea sumelor ( SSR şi SSE ) în dispersii. Obţinem dispersii divizând suma pătratelor abaterilor la numărul gradelor de libertate.

)/()ˆ(

)1/()ˆ(

)/(

)1/(2

2

.knyy

kyy

knSSE

kSSRF

ii

i

calc−−

−−=

−−

=∑∑ (1)

unde: k – numărul de parametri ai modelului Pentru regresia liniară unifactorială:

)2/()ˆ(

1/)ˆ(2

2

.−−

−=

∑∑

nyy

yyF

ii

i

calc

Observaţie!!! Testul implică sume de abateri, SSR şi SSE , care împreună formează SST , ceea ce oferă prilejul de a extinde verificarea în direcţia determinării şi interpretării coeficientului de determinaţie ( 2R ).

SST

SSR

SST

SSESST

SST

SSE

yy

yyR

i

ii =−

=−=−

−−=

∑∑ 1

)(

)ˆ(1

2

22

Dacă avem în vedere relaţia (1) şi dacă împărţim numărătorul şi numitorul acesteia la SST rezultă:

)/()1(

)1/(

)/()/(

)1/()/(

)/(

)1/(2

2

.knR

kR

knSSTSSE

kSSTSSR

knSSE

kSSRFcalc

−−

−=

−−

=−−

=

Acest din urmă raport face posibilă aplicarea testului F în situaţia în care cunoaştem coeficientul de determinaţie.

Pentru aplicarea testului F se parcurg următoarele etape: I. Se definesc cele două ipoteze ale testului: H0: modelul nu este corect specificat care este echivalent în cazul modelului simplu

de regresie cu faptul că valoarea pantei de regresie nu diferă semnificativ de zero. b = 0 H1: modelul este corect specificat, deci valoarea coeficientului pantei diferă

semnificativ de zero. b ≠ 0 II. Se calculează statistica F şi se compară .calcF cu )];1(,.[ knktabF −−α .

Page 22: Introducere în Econometrie - se-b.spiruharet.ro · 1 SINTEZA CURS Econometrie şi previziune economică (I) Structura cursului Cursul de Econometrie pe care îl vor parcurge studenţii

22

Dacă )];1(,.[. knktabcalc FF −−> α atunci se respinge ipoteza nulă H0: b = 0 a

nesemnificaţiei, ceea ce confirmă modelul ca fiind valid.