95
6. Preverjanje predpostavk klasičnega regresijskega modela doc. dr. Miroslav Verbič [email protected] www.miroslav-verbic.si Ljubljana, februar 2014

6. Preverjanje predpostavk klasičnega regresijskega modela · 2019. 3. 21. · 6. Preverjanje predpostavk klasičnega regresijskega modela doc. dr. Miroslav Verbi č [email protected]

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

  • 6. Preverjanje predpostavk klasičnega regresijskega modela

    doc. dr. Miroslav Verbič

    [email protected]

    Ljubljana, februar 2014

  • 1/93

    Motivacija

  • 2/93

    Preverjanje predpostavke v splošnem

  • 6.1 Normalna porazdelitev slučajne spremenljivke

  • 4/93

    Pomen predpostavke

  • 5/93

    Ugotavljanje veljavnosti predpostavke

  • 6/93

    Ugotavljanje veljavnosti predpostavke

  • 7/93

    Ugotavljanje veljavnosti predpostavke

  • 8/93

    Rešitve neizpolnjevanja predpostavke

  • 6.2 Multikolinearnost

  • 10/93

    Temeljni pojmi

  • 11/93

    Pomen predpostavke

  • 12/93

    Pomen predpostavke

  • 13/93

    Pomen predpostavke

  • 14/93

    Pomen predpostavke

  • 15/93

    Pomen predpostavke

  • 16/93

    Ugotavljanje veljavnosti predpostavke

  • 17/93

    Ugotavljanje veljavnosti predpostavke

  • 18/93

    Ugotavljanje veljavnosti predpostavke

  • 19/93

    Rešitve neizpolnjevanja predpostavke

  • 20/93

    Rešitve neizpolnjevanja predpostavke

  • 21/93

    V razmislek…

  • 6.3 Heteroskedastičnost

  • 23/93

    Motivacija

  • 24/93

    Pomen predpostavke

  • 25/93

    Pomen predpostavke

  • 26/93

    Pomen predpostavke

  • 27/93

    Pomen predpostavke

  • 28/93

    Pomen predpostavke

  • 29/93

    Pomen predpostavke

  • 30/93

    (Ne)veljavnost predpostavke

  • 31/93

    (Ne)veljavnost predpostavke

    B–1 Grafična metoda odkrivanja heteroskedastičnosti

  • 32/93

    (Ne)veljavnost predpostavke

  • 33/93

    (Ne)veljavnost predpostavke

  • 34/93

    (Ne)veljavnost predpostavke

  • 35/93

    (Ne)veljavnost predpostavke

  • 36/93

    (Ne)veljavnost predpostavke

  • 37/93

    (Ne)veljavnost predpostavke

  • 38/93

    (Ne)veljavnost predpostavke

  • 39/93

    (Ne)veljavnost predpostavke

  • 40/93

    (Ne)veljavnost predpostavke

  • 41/93

    (Ne)veljavnost predpostavke

  • 42/93

    (Ne)veljavnost predpostavke

  • 43/93

    (Ne)veljavnost predpostavke

  • 44/93

    (Ne)veljavnost predpostavke

  • 45/93

    (Ne)veljavnost predpostavke

  • 46/93

    (Ne)veljavnost predpostavke

  • 47/93

    (Ne)veljavnost predpostavke

  • 48/93

    (Ne)veljavnost predpostavke

  • 49/93

    Na kaj moramo biti pozorni…

  • 50/93

    Uporaba robustnih standardnih napak

    Izpis rezultatov ocenjevanja regresijskega modela povpraševanja po denarju

    . regress hm1 ppr rvp rvv czp

    Source | SS df MS Number of obs = 96-------------+------------------------------ F( 4, 91) = 527.72

    Model | 11431132.5 4 2857783.12 Prob > F = 0.0000Residual | 492791.936 91 5415.296 R-squared = 0.9587

    -------------+------------------------------ Adj R-squared = 0.9569Total | 11923924.4 95 125514.994 Root MSE = 73.589

    ------------------------------------------------------------------------------hm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]

    -------------+----------------------------------------------------------------ppr | 1.697766 .513892 3.30 0.001 .6769831 2.71855rvp | -311.6847 45.25178 -6.89 0.000 -401.5718 -221.7976rvv | -11.57513 5.33166 -2.17 0.033 -22.16582 -.98444czp | 11.50168 1.472604 7.81 0.000 8.576535 14.42683

    _cons | -229.2038 125.2134 -1.83 0.070 -477.9248 19.51725------------------------------------------------------------------------------

  • 51/93

    Uporaba robustnih standardnih napak

    . whitetst

    White's general test statistic : 53.83009 Chi-sq(14) P-value = 1.4e-06

    . regress hm1 ppr rvp rvv czp, robust

    Linear regression Number of obs = 96F( 4, 91) = 1000.25Prob > F = 0.0000R-squared = 0.9587Root MSE = 73.589

    ------------------------------------------------------------------------------| Robust

    hm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------

    ppr | 1.697766 .5633882 3.01 0.003 .5786649 2.816868rvp | -311.6847 44.33028 -7.03 0.000 -399.7413 -223.6281rvv | -11.57513 3.532513 -3.28 0.001 -18.59203 -4.558225czp | 11.50168 1.32376 8.69 0.000 8.872196 14.13117

    _cons | -229.2038 58.25138 -3.93 0.000 -344.913 -113.4945------------------------------------------------------------------------------

  • 6.4 Avtokorelacija

  • 53/93

    Temeljni pojmi

  • 54/93

    Pomen predpostavke

  • 55/93

    Pomen predpostavke

  • 56/93

    Pomen predpostavke

  • 57/93

    Pomen predpostavke

  • 58/93

    Pomen predpostavke

  • 59/93

    Pomen predpostavke

  • 60/93

    Pomen predpostavke

  • 61/93

    Pomen predpostavke

  • 62/93

    Pomen predpostavke

  • 63/93

    Ugotavljanje veljavnosti predpostavke

  • 64/93

    Ugotavljanje veljavnosti predpostavke

  • 65/93

    Ugotavljanje veljavnosti predpostavke

  • 66/93

    Ugotavljanje veljavnosti predpostavke

  • 67/93

    Ugotavljanje veljavnosti predpostavke

  • 68/93

    Ugotavljanje veljavnosti predpostavke

  • 69/93

    Ugotavljanje veljavnosti predpostavke

  • 70/93

    Ugotavljanje veljavnosti predpostavke

  • 71/93

    Ugotavljanje veljavnosti predpostavke

  • 72/93

    Ugotavljanje veljavnosti predpostavke

  • 73/93

    V razmislek…

  • 74/93

    Rešitve neizpolnjevanja predpostavke

  • 75/93

    Rešitve neizpolnjevanja predpostavke

  • 76/93

    Rešitve neizpolnjevanja predpostavke

  • 77/93

    Rešitve neizpolnjevanja predpostavke

  • 78/93

    Rešitve neizpolnjevanja predpostavke

  • 79/93

    Rešitve neizpolnjevanja predpostavke

  • 80/93

    Rešitve neizpolnjevanja predpostavke

  • 81/93

    Rešitve neizpolnjevanja predpostavke

  • 82/93

    Uporaba HAC standardnih napak

    Izpis rezultatov ocenjevanja regresijskega modela povpraševanja po denarju

    . regress hm1 ppr rvp rvv czp

    Source | SS df MS Number of obs = 96-------------+------------------------------ F( 4, 91) = 527.72

    Model | 11431132.5 4 2857783.12 Prob > F = 0.0000Residual | 492791.936 91 5415.296 R-squared = 0.9587

    -------------+------------------------------ Adj R-squared = 0.9569Total | 11923924.4 95 125514.994 Root MSE = 73.589

    ------------------------------------------------------------------------------hm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]

    -------------+----------------------------------------------------------------ppr | 1.697766 .513892 3.30 0.001 .6769831 2.71855rvp | -311.6847 45.25178 -6.89 0.000 -401.5718 -221.7976rvv | -11.57513 5.33166 -2.17 0.033 -22.16582 -.98444czp | 11.50168 1.472604 7.81 0.000 8.576535 14.42683

    _cons | -229.2038 125.2134 -1.83 0.070 -477.9248 19.51725------------------------------------------------------------------------------

  • 83/93

    Uporaba HAC standardnih napak

    . estat bgodfrey, lags(1 2 3 4 5 6 7 8 9 10 11 12)

    Breusch-Godfrey LM test for autocorrelation---------------------------------------------------------------------------

    lags(p) | chi2 df Prob > chi2-------------+-------------------------------------------------------------

    1 | 70.771 1 0.00002 | 70.773 2 0.00003 | 71.397 3 0.00004 | 71.398 4 0.00005 | 71.639 5 0.00006 | 71.641 6 0.00007 | 73.403 7 0.00008 | 73.536 8 0.00009 | 74.066 9 0.0000

    10 | 74.112 10 0.000011 | 74.164 11 0.000012 | 76.742 12 0.0000

    ---------------------------------------------------------------------------H0: no serial correlation

  • 84/93

    Uporaba HAC standardnih napak

    . newey hm1 ppr rvp rvv czp, lag(12)

    Regression with Newey-West standard errors Number of obs = 96maximum lag: 12 F( 4, 91) = 228.95

    Prob > F = 0.0000

    ------------------------------------------------------------------------------| Newey-West

    hm1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------

    ppr | 1.697766 .3914995 4.34 0.000 .9201006 2.475432rvp | -311.6847 97.22559 -3.21 0.002 -504.8114 -118.558rvv | -11.57513 7.305648 -1.58 0.117 -26.0869 2.936644czp | 11.50168 1.012866 11.36 0.000 9.489749 13.51362

    _cons | -229.2038 118.4651 -1.93 0.056 -464.52 6.112544------------------------------------------------------------------------------

  • 6.5 Napotki ocenjevalcem in uporabnikom regresijskih modelov

  • 86/93

    Motivacija

  • 87/93

    Napotki ocenjevalcem in uporabnikom

    Kaj gre lahko narobe ?

    Kaj so posledice tega? Kako to odkrijemo (ugotovimo)?

    Kako to popravimo (odpravimo)?

    Izpuščen konstantni člen regresijskega

    modela

    Pristranske ocene bj. Nezanesljiv t–test.

    Prevera izpeljave in zapisa regresijskega modela.

    Vključitev konstantnega člena kot nadomestilo za vse ostale vplive.

    Izpuščena relevantna

    spremenljivka

    Pristranske in nekonsistentne ocene bj.

    Na podlogi teorije nepričakovani predznaki bj.

    Nizka vrednost R2.

    Vključitev relevantne spr. ali primerne nadomestne, če zanjo ni podatkov.

    Vključena irelevantna

    spremenljivka

    Zmanjšana vrednost R2adj.

    Večje standardne napake in nizke vrednosti testnih statistik.

    Teorija. Testne statistike. Njena izključitev

    lahko vpliva na reg. koeficiente ostalih spremenljivk.

    Prevera ekonomske teorije.

    Izključitev spr., če ni eksplicitno zahtevana s strani ekonomske teorije.

    Funkcijska oblika modela

    Zmanjšana zanesljivost modela.

    Pristranske in nekonsistentne ocene bj.

    RESET test. Box-Cox test. Analiza razsevnega

    diagrama.

    Transformacija ene ali več spremenljivk

    Prevera skladnosti z ekonomsko teorijo.

  • 88/93

    Napotki ocenjevalcem in uporabnikom

    Kaj gre lahko narobe ?

    Kaj so posledice tega? Kako to odkrijemo (ugotovimo)?

    Kako to popravimo (odpravimo)?

    Multi- kolinearnost

    Regresijski koeficienti niso pristranski.

    Visoke njihove standardne napake in nizke vrednosti t–statistike.

    Testi: Kleinovo pravilo, F–test, VIF in Tol, število in indeksi

    pogojenosti.

    Prevera in previdna izločitev “prave” spremenljivke.

    Oblikovanje agregatne spremenljivke

    "Ne storiti ničesar" lahko še najboljše.

    Hetero- skedastičnost

    Regresijski koeficienti niso pristranski.

    Standardne napake so pristranske in niso najnižje možne.

    Testne statistike so nezanesljive.

    Testi: grafična metoda, Park, Glejser, Goldfeld-Quandt, Breusch-Pagan, White.

    Izboljšati specifikacijo.

    Transformacija spremenljivk.

    Uporaba PNK–TNK. Uporaba robustne cenilke variance.

    Avtokorelacija Regresijski koeficienti niso pristranski.

    Standardne napake so pristranske in niso najnižje možne.

    Testne statistike so nezanesljive.

    Previsoke vrednosti R2.

    Testi: grafična metoda, test sekvenc, test asociacije, Durbin–Watson d, Wallis, Durbin h statistika, Breusch–Godfrey.

    Izboljšati specifikacijo.

    Uporaba PNK–PDE. Uporaba HAC cenilke variance.

    Uporaba Box-Jenkinsove ARIMA metodologije.

  • 89/93

    Heteroskedastičnost in avtokorelacija

    Predpostavka Homoskedastičnost Odsotnost avtokorelacije

    Oblika predpostavke ( ) ( )

    2 2i i uVar u E u σ= = ( ), , 0;i j i jCov u u x x i j= ≠

    Posledice predpostavke

    ( )E =b β

    2

    22

    2

    0 00 0

    Var cov( )

    0 0

    u

    uu

    u

    σσ

    σ

    σ

    ⎡ ⎤⎢ ⎥⎢ ⎥− = = ⋅⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

    u I

    ( ) ( ) 12Var cov uσ−′− = ⋅b XX

  • 90/93

    Heteroskedastičnost in avtokorelacija Problem Heteroskedastičnost Avtokorelacija

    Oblika problema ( ) ( )

    2 2 2ii i u u

    Var u E u σ σ= = ≠ ( ), , 0;i j i jCov u u x x i j≠ ≠

    Posledice problema

    ( )E =b β 2Var cov( ) uσ− = ≠ ⋅u W I

    1

    2

    2

    2

    2

    0 0

    0 0

    0 0n

    u

    u

    u

    σ

    σ

    σ

    ⎡ ⎤⎢ ⎥⎢ ⎥= ⎢ ⎥⎢ ⎥⎢ ⎥⎣ ⎦

    W

    11 1

    221 1

    21

    1 21 1

    11

    11

    T

    T

    T T

    ε

    ρ ρρ ρσ

    ρρ ρ

    − −

    ⎡ ⎤⎢ ⎥⎢ ⎥= ⎢ ⎥−⎢ ⎥⎢ ⎥⎣ ⎦

    W

    ( ) ( ) ( ) ( )1 1 12Var cov uσ− − −′ ′ ′ ′− = ≠ ⋅b X X X WX X X X X

    Pomen za rezultate

    Cenilka regresijskih koeficientov ostaja nepristanska.

    Cenilka regresijskih koeficientov ni več najbolj učinkovita. Cenilka variance slučajne spremenljivke postane pristranska.

    Cenilke varianc in kovarianc ocen regresijskih koeficientov so pristranske.

    Nezanesljivo statistično sklepanje.

  • 91/93

    Heteroskedastičnost in avtokorelacija

    Problem Heteroskedastičnost Avtokorelacija

    Pojavnost problema

    Modeli presečnih podatkov; tudi modeli časovnih serij

    Modeli časovnih serij; redko modeli presečnih podatkov

    Odkrivanje problema

    grafična metoda Parkov test Glejserjev test Goldfeld–Quandtov test Breusch–Paganov test Harvey–Godfreyev test Whiteov test

    grafična metoda test sekvenc test asociacije ostankov Durbin–Watsonov test Wallisov test Durbinov h–test Ljung–Boxov test Breusch–Godfreyev test

    Najcelovitejši pristop Whiteov test Breusch–Godfreyev test

  • 92/93

    Heteroskedastičnost in avtokorelacija Problem Heteroskedastičnost Avtokorelacija

    Odpravljanje (ugotovljenega) problema

    Izboljšanje slabe specifikacije modela (odpravlja nepravo heteroskedastičnost in nepravo avtokorelacijo)

    Uporaba cenilk posplošenih najmanjših kvadratov (PNK):

    cenilka tehtanih najmanjših kvadratov (TNK)

    cenilka posplošene diferenčne enačbe (PDE):

    dvostopenjski postopek iterativna procedura (CORC)

    V kolikor ugotovimo točno obliko problema, odpravimo vse njegove zgoraj navedene neugodne posledice.

  • 93/93

    Heteroskedastičnost in avtokorelacija Problem Heteroskedastičnost Avtokorelacija

    Odpravljanje (ugotovljenega) problema

    Uporaba robustnih cenilk variance (Huber/White cenilka variance)

    Uporaba HAC cenilk variance (Newey–West robustna cenilka variance)

    u IID∼

    Cenilka sprosti predpostavko o identični porazdeljenosti.

    u IID∼

    Cenilka sprosti obe predpostavki (o neodvisnosti in identični

    porazdeljenosti).

    Postopek ne vpliva na vrednosti ocen regresijskih koeficientov.

    Standardne napake spet postanejo nepristranske. Cenilka regresijskih koeficientov ne postane nujno spet najbolj učinkovita

    (standardne napake niso spet nujno najnižje možne).

    Transformacija spremenljivk AR(I)MAX metodologija

  • 6. Preverjanje predpostavk klasičnega regresijskega modela

    doc. dr. Miroslav Verbič

    [email protected]

    Ljubljana, februar 2014

    6.Preverjanje predpostavk klasičnega regresijskega modelaMotivacijaPreverjanje predpostavke v splošnem6.1Normalna porazdelitev slučajne spremenljivkePomen predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeRešitve neizpolnjevanja predpostavke6.2MultikolinearnostTemeljni pojmiPomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeRešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeV razmislek…6.3HeteroskedastičnostMotivacijaPomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavke(Ne)veljavnost predpostavkeNa kaj moramo biti pozorni…Uporaba robustnih standardnih napakUporaba robustnih standardnih napak6.4AvtokorelacijaTemeljni pojmiPomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkePomen predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeUgotavljanje veljavnosti predpostavkeV razmislek…Rešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeRešitve neizpolnjevanja predpostavkeUporaba HAC standardnih napakUporaba HAC standardnih napakUporaba HAC standardnih napak6.5Napotki ocenjevalcem in uporabnikom regresijskih modelovMotivacijaNapotki ocenjevalcem in uporabnikomNapotki ocenjevalcem in uporabnikomHeteroskedastičnost in avtokorelacijaHeteroskedastičnost in avtokorelacijaHeteroskedastičnost in avtokorelacijaHeteroskedastičnost in avtokorelacijaHeteroskedastičnost in avtokorelacija6.Preverjanje predpostavk klasičnega regresijskega modela