Econometrics-2018-11-1217 - u-toyama.ac.jp...使データ: 第7章chap7-econometrics.xlsx 教科書: pp. 313 –348（第7 章） 2 説明変数の過不：真のモデルと定式化pp.313-318

131003

計量経済学講義第 21/22 回

2018 年 12 ⽉ 17 ⽇（⽉）2/3 限担当教員: 唐渡広志（からと・こうじ）研究室: 経済学研究棟4階432号室email: [email protected]‐toyama.ac.jpwebsite: http://www3.u‐toyama.ac.jp/kkarato/

1

講義の⽬的推定式が正しいかどうかを判断するには何をしたらよいか，複数の推定式が候補としてある場合，どれを最終的な結論として採⽤すべきか，などの⽅法について学びます。

説明変数と誤差項の相関がある場合の対処法を学びます。

誤差項の分散が不均⼀である場合や，系列相関を持つ場合についての検定⽅法と修正⽅法を学びます。

keywords: 過⼩定式化，過剰定式化，多重共線性，操作変数法，連⽴（同時）⽅程式モデル，同時⽅程式バイアス，2段階最⼩2乗法，プルーシュ=ペイガン検定，ホワイト検定，分散不均⼀⼀致標準誤差，重み付き最⼩2乗法，1階の⾃⼰回帰モデル，ダービン=ワトソン検定教科書:

使⽤データ: 第7章 chap7-econometrics.xlsx

教科書: pp. 313 – 348（第 7 章）2

説明変数の過不⾜：真のモデルと定式化 pp.313-318

3

1.7. 33221 iiii uXXYA

状況 1

真のモデル真のモデル

状況 2

2.7. 2 iii uXYB

定式化したモデル定式化したモデル

2.7. 2 iii uXYB 1.7. 33221 iiii uXXYA

ろうか？して何が違っているだ

と比較のはの推定量 2][ˆ AB ろうか？して何が違っているだ

と比較のはの推定量 ][ˆ2 BA

過少定式化過剰定式化

真の原因は2つあるにも関わらず，原因を1つしか考えない場合

真の原因は1つしかないにも関わらず，原因を2つも考えてしまう場合

説明変数の選択

4

男性と⼥性の経済⾏動の違いをダミー変数で検討する場合


となるダミー変数女性のとき

可処分所得

ある商品の支出額

1::

:

3

2

i

i

i

XXY

2.7. 2 iii uXYB

[A]を推定して3の推定値が有意であれば，[B]を推定する必要はない可処分所得が同じであっても，男⼥間で⽀出額に違いあることを主張できる。

[A]を推定して3の推定値が有意でなければ，[B]を推定する必要が出てくる性別にかかわらず，⽀出額は可処分所得の⼤きさで決まることを主張できる。

【問題点】実際は何が「真のモデル」なのかは分析者にはわからない。誤ったモデルを「選択」してしまったときの悪影響の程度を知っておくことは重要。

本当は[A]のモデルが正しいにもかかわらず，[B]を推定する場合，[B]におけるの最⼩2乗推定量はどのような特徴を持つか（どんな悪影響があるか）

本当は[B]のモデルが正しいにもかかわらず，[A]を推定する場合，[A]におけるの最⼩2乗推定量はどのような特徴を持つか（どんな悪影響があるか）

過少定式化（状況1）

5

真のモデルが

であるにも関わらず，誤って

を推定したときのの最⼩2乗推定量の特徴を考える。


2.7. 2 iii uXYB

iiiiiiy uXXwYw

SS

332212222

2ˆ

式を代入に推定量 )1.7]([ˆ A

222

222

XX

XXw

i

iiただし

を利用すると22

2332222 ,1,0

SS

XwXww iiiii

iiuwSS

222

2332

ˆ

ているものとすると標準的仮定が満たされ

222

2332

ˆ SS

E ないの不偏推定量は得られを推定しても真の値 2][ B

除外変数バイアス真のモデルに含まれる説明変数を除外したモデル（過少定式化モデル）の最⼩2乗推定量は不偏推定量でない。

バイアスの⼤きさは 3, S23, S22の⼤きさ，符号に依存して決まる。

6

222

/

23

/32

ˆ

SS

E3 > 0 3 < 0

S23 > 0 + −

S23 < 0 − +

の分布のときの

または

ˆ0,0

0,0

323

323

SS

の分布のときの

または

ˆ0,0

0,0

323

323

SS

の分布

を推定したときの

2ˆ

][

A

2

過剰定式化（状況2） (1)

7

真のモデルが

であるにも関わらず，誤って

を推定したときのの最⼩2乗推定量の特徴を考える。


2.7. 2 iii uXYB

2

iiiii

yy uXhYhSSS

SSSS2233322

3232332

ˆ

式を代入に推定量 )2.7]([ˆ2 B

2233322

33232233

SSSXXSXXS

h iii

ただし

を利用すると1,0 2 iii Xhh

iiiiiii uhuhXhh2ˆ

ているものとすると標準的仮定が満たされ

ii uEhE 2ˆ

る。の不偏推定量が得られ真の値

を推定しても過剰に定式化された

][ A

過剰定式化 (2)

8

の分散を調べてみる iiuh2ˆ

2233322

332222

ˆSSS

SuEhV ii

の分散はの推定量一方，真のモデル iiYwB 2ˆ][

22

222

1ˆS

YVwV ii

22

222

222

2

22

2222

1SS

XX

SXX

w

i

ii

ただし

なのでより 2233

223

22

33

223

22

2233322

33 1 SSS

S

SSSSSS

S

22

222

233322

332 1ˆˆS

VVSSS

S

効性が失われる）。分散が大きくなる（有

定したときに比べてだが，真のモデルを推

は不偏推定量過剰に定式化された ][ A

過剰定式化 (3)

9

の分布を推定したきの

ˆ

2.7. 2 iii uXYB

の分布を推定したときの

にも関わらずが正しいモデルである

2

33221

ˆ1.7.

][

iiii uXXYAB

練習問題 (1)

10

。の期待値を求めなさいの推定量を推定する場合の

のとき，

であったとしよう。真のモデルが

ˆ2.7.5,10,4,1,2

1.7.

22322321

33221

iii

iiii

uXYBSSuXXYA

22

2332

ˆSS

E

練習問題 (2)

11

の分散を求めなさい。の推定量

。の期待値を求めなさいの推定量

を推定する場合ののとき，

であったとしよう。真のモデルが

22

22

33221

332322

2

ˆ

ˆ1.7.15,5,10,1,2

2.7.

iiii

iii

uXXYASSS

uXYB

22

222

233322

332 1ˆˆS

VVSSS

S

定式化と説明変数の数過少定式化による誤りがあるとき，最⼩2乗推定量には不偏性がない（除外変数バイアスが⽣じる）。

過剰定式化による誤りがあるとき，最⼩2乗推定量には不偏性があるが有効性がない。

どちらかと⾔えば，過剰定式化の⽅が「被害」の程度は少ない。

真のモデルを探索する「戦略」として，最初にたくさんの説明変数に可能性をもたせて過剰定式化モデルを出発点にするやり⽅がある。（⼀般から特殊へ）

逆に，最初はシンプルな特定のモデルから出発して，徐々に可能性のある説明変数を追加していくやり⽅もある。（特殊から⼀般へ）

12

説明変数間の強い相関 pp.318-320

13


の相関係数と ii XX 323322

2323 SS

Sr

乗推定量の分散の最小の 21.7 2

2233322

3322233322

3322 1

ˆrSS

SSSS

SV

乗相関係数の23322

2232

23 SSS

r

を棄却しづらくなる。説値が小さくなるので仮

になる。差）は極端に大きい値の分散（および標準誤

に近づくはに近づくと，またはが

0

ˆ0111

2

2

223332223

t

rSSr

例7.3を参照

相関係数がちょうど 1 または −1 のときは多重共線性に陥推定不能

表7.2

14

953005.0

998563.0

955124.0

23

3

2

r

r

r

y

y

iiii

iii

iii

uXXYuXYuXY

33221

331

221

次の 3 つのモデルを推定する

すべての変数の相関係数を調べる「データ分析」相関

推定値(t値)

p 値推定値(t値)

p 値推定値(t値)

p 値

定数項 19.095 0.020

0.959 0.536

1.284 0.424

(2.546) (0.631) (0.818)

X215.153

0.000 0.603

0.377 (13.680) (0.907)

X33.399

0.000 3.276

0.000 (79.061) (22.969)

R2 0.912 0.997 0.997 adj. R2 0.907 0.997 0.997

説明変数と誤差項の相関仮定 i) が満たされず，説明変数が確率変数であり，なおかつ誤差項と相関を持つ場合には，最⼩2乗推定量は不偏性をもたない。つまりバイアス（偏り）のある推定量になる。また，⼀致性もない。

Cov 𝑋 , 𝑢 0最⼩2乗推定量には不偏性がない，⼀致性もない

15

操作変数法 (1)：観測誤差が含まれるデータある1⽇のある店舗における傘の売上⾼をその⽇の降⽔量で説明するモデルを考える。

𝑌 α β𝑋∗ 𝑢 𝑌 傘の売上⾼ , 𝑋∗［降⽔量］その店舗の近辺の正確な降⽔量はデータとして得られないので，降⽔量の「代理変数」として「湿度」Xi を利⽤したとする。

𝑌 α β𝑋 𝑢

湿度 𝑋 と降⽔量 𝑋∗の間には密接な関係があり，簡単に測ることができる。その関係式が次の観測誤差 𝑣 を伴う式で与えられている。

𝑋 𝑎 𝑏𝑋∗ 𝑣

これを代理変数によるモデルに代⼊すると，𝑌 α β 𝑎 𝑏𝑋∗ 𝑣 𝑢

𝑣 と 𝑢 の相関がゼロでないかぎり， Cov 𝑋 , 𝑢 0の可能性が⽣じる。説明変数に代理変数を利⽤する場合，相関が⽣じて最⼩2乗推定量にバイアスが⽣じる可能性がでてくる。

16

操作変数法 (2) p.321

17

操作変数法 (Instrumental Variable Method)︓説明変数と誤差項の相関がある場合の対処法

操作変数の特徴操作変数 iZ

0:

0,Cov:

zxii

iiii

SXZuZuZ

と相関を持つ説明変数は［関連性］

と無相関誤差項は［外生性］

操作変数推定量

XY

SS

XXZZYYZZ

SS

IVIV

zx

zu

ii

ii

zx

zyIV

ˆˆ

ˆ

操作変数推定量は⼀致性をもたらす IVIVn ˆ,ˆが十分大きくなると，

操作変数法 (3)

18

nSn

S

SS

zx

zu

zx

zuIV

外⽣性と関連性 0,Cov ii uZ［外生性］

0, n

Sn zuが十分に大きくなると

0zxS［関連性］でないは0n

Szx

一致推定量が十分大きくなると， IVn ˆ

操作変数の候補

・時系列データの場合︓1期前のデータ Xi-1を操作変数とする。・関連性に注⽬して，Xi を定数項と Zi に回帰して，Zi の係数推定値が有意であれば，それを操作変数とする。

例7.4 能⼒と賃⾦ pp.322-323 「能⼒」の⾼い⼈ほど賃⾦が⾼い︖

「能⼒」はどのようにして測るか難しい

「教育年数（学歴）」を「能⼒」の代理変数とする

説明変数と誤差項の相関が⽣じる可能性が出る。

「教育年数」の操作変数 Zとして，例えば「両親の教育年数の和」を利⽤して，操作変数推定を⾏う。

19

賃⾦ = + *教育年数 + u（教育年数 = 能⼒ + v）

↓

賃⾦ = + *（能⼒+v） + u

例7.4 能⼒と賃⾦ pp.322-323

20

被説明変数 Y（賃⾦）最⼩2乗法操作変数法

推定値 t値 p値推定値 t値 p値定数項 7.350 0.933 0.359 3.926 0.292 0.771

X教育年数 2.091 3.713 0.001 - - -

Z両親の教育年数の和 - - - 2.340 2.406 0.016

決定係数 0.330 0.330

表7.4 最⼩2乗法と操作変数法による推定結果

340.2ˆ zx

zyIV S

S操作変数推定

091.2ˆ

2

xx

xy

SS乗推定最小

連⽴⽅程式モデル (1) pp.323-327

21

価格 P

数量 Q需要曲線 D

供給曲線 S

その他の要因需要関数 ,: PfQ

その他の要因供給関数 ,: PgQ

1P

1Q

2P

2Q

3P

3Q

i 価格 Pi 数量 Qi

1 P1 Q1

2 P2 Q2

3 P3 Q3

観察されたデータどのようにして需要曲線，供給曲線を推定するか︖

需要曲線，供給曲線のシフトによって新しいデータが観察される

連⽴⽅程式モデル (2)：線形需要関数

22

価格 P

数量 Q

需要曲線 DIaPaaQ 321: 需要関数

：所得

：価格

：数量

IPQ

P0

所得 Iの増加

所得 Iの減少

【需要の法則】価格が低い（⾼い）ほど，その財を購⼊したい（したくない）と考える数量が増える（その財を購⼊したい（したくない）と考える⼈々が増える）

02 aつまり

Q0 Q1Q2

価格 P が変わらなくても，⼈々の所得が増⼤すると「需要」も増⼤する（需要曲線の右シフト）

03 aつまり

連⽴⽅程式モデル (3)：線形供給関数

23

価格 P

数量 Q

供給曲線 S

【供給の法則】価格が⾼い（低い）ほど，その財を販売したい（したくない）と考える数量が増える（その財を販売したい（したくない）と考える企業が増える）

Q0 Q1Q2

P0

MbPbbQ 321: 供給関数：原材料価格M

原材料価格Mの下落

原材料価格Mの上昇

価格 P が変わらなくても，⽣産に必要な原材料価格が下落すると（利潤を得る機会が増えるので）「供給」も増⼤する（供給曲線の右シフト）

02 bつまり

03 bつまり

連⽴⽅程式モデル (3)：市場均衡

24

MbPbbQ

IaPaaQ

321

321

:

:

供給関数

需要関数0

0

3

2

aQI

aQP

0

0

3

2

bQM

bQP

連⽴して (Q, P) を解くMbPbbQIaPaaQ

321

321

－) MbIaPbaba 3322110

均衡価格⽅程式

均衡価格 P を需要関数（または供給関数）に代⼊する

Mba

baI

baba

bababaQ

22

32

22

23

22

2112 均衡数量⽅程式

Mba

bI

baa

babaP

22

3

22

3

22

11

連⽴⽅程式モデル (4)：市場均衡

25

価格 P

数量 Q

MbPbbQIaPaaQ

321

321

::

供給関数

需要関数

Mba

bI

baa

babaP

22

3

22

3

22

11

Mba

baI

baba

bababaQ

22

32

22

23

22

2112

需要供給モデルで決まるのは価格 Pと数量 Q

連⽴⽅程式モデル (5)：内⽣変数と外⽣変数

26

経済理論モデルで⽰される⽅程式を「モデルの構造型」とよぶ。

MbPbbQIaPaaQ

321

321

::

供給関数

需要関数構造型

経済理論モデルを「解く」ことによって決まる変数のことを「内⽣変数」とよぶ。

内⽣変数 (Q, P)

経済理論モデルの外側であらかじめ決まっていると想定される変数のことを「外⽣変数」とよぶ。

外⽣変数 (I, M)

経済理論モデルの構造型を内⽣変数について解いた式を「モデルの誘導型」とよぶ。「誘導型」は内⽣変数を外⽣変数だけで説明する式になっている。

誘導型M

baba

Ibaba

bababaQ

Mba

bI

baa

babaP

22

32

22

23

22

2112

22

3

22

3

22

11

［均衡数量方程式］

［均衡価格方程式］

連⽴⽅程式モデル (6)：需要・供給関数の回帰モデル

27

Siiii

Diiii

uMbPbbQ

uIaPaaQ

321

321

:

:

供給関数

需要関数例. p.327 表7.5 のデータを参照

供給関数を価格 Pについて解くと

ii

v

Si

P

ii vPub

Mbb

bbQ

bP

ii

*

22

3

2

1

2

11

*

観測誤差真の価格

これを需要関数に代⼊すると

Diiiii uIavPaaQ 3

*21

実際に観察された価格 Pは真の価格 Pと誤差 vからなる

説明変数と誤差項の間に相関が⽣じている。仮定 i)はもはや満たされない。

需要関数をこのまま推定すると・・・

ない。一致性もない。乗推定量には不偏性がの最小2,, 321 aaa

同時⽅程式バイアスが発⽣する

2段階最⼩2乗法 (1)

28

2段階最⼩2乗法 (Two Stage-Least Squares Method; 2SLS) を利⽤すると，パラメータの⼀致推定量が得られる。

第 1 段階需要関数の「説明変数」として利⽤されている「内⽣変数」を「定数項」，需要関数における「外⽣変数」，供給関数における「外⽣変数」に回帰して，最⼩2乗法でその理論値を計算する。

Diiii uIaPaaQ

外生変数内生変数内生変数

需要関数 321:

Piiii vMIP 321:1段階目の推定式

第 2段階

iii MIP 321 ˆˆˆˆ:1 段階目の理論値

1段階⽬の「理論値」を需要関数に代⼊して，今度は需要関数を最⼩2乗法で推定する。

Diiii uIaPaaQ 321

ˆ:2段階目の推定式

SLSSLSSLS aaa 23

22

21 ˆ,ˆ,ˆ2段階最⼩2乗推定量例. p.326 例7.5 を参照

需要関数の推定

均衡価格⽅程式

2段階最⼩2乗法 (2)

29

供給関数の推定

第 1 段階供給関数の「説明変数」として利⽤されている「内⽣変数」を「定数項」，需要関数における「外⽣変数」，供給関数における「外⽣変数」に回帰して，最⼩2乗法でその理論値を計算する。

Siiii uMbPbbQ

外生変数内生変数内生変数

供給関数 321:

Piiii vMIP 321 ˆˆˆ:1段階目の推定式需要関数の2段階推定と同

じ「均衡価格⽅程式」

iii MIP 321 ˆˆˆˆ:1 段階目の理論値需要関数の2段階推定と同じ「理論値」

第 2段階 1段階⽬の「理論値」を供給関数に代⼊して，今度は供給関数を最⼩2乗法で推定する。

Siiii uMbPbbQ 321


SLSSLSSLS bbb 23

22

21

ˆ,ˆ,ˆ2段階最⼩2乗推定量例. p.326 例7.5 を参照

表7.5

30

ガソリンの需要関数

Diiii uIaPaaQ

所得可処分

価格ガソリン数量

321

Piiii vMIP 321 ˆˆˆ:1段階目の推定式

iii MIP 28.114.047.18ˆ: 理論値残差出⼒

観測値予測値: Pi 残差1 102.441 0.5589912 111.0441 ‐0.044073 109.2388 ‐0.23884 117.6352 ‐0.635235 132.3451 0.6549126 137.4798 ‐0.479827 151.8781 0.1219418 136.4739 ‐0.473879 139.5256 0.474401

10 137.236 ‐0.2359711 134.7025 0.297514

Diiii uIaPaaQ 321


iii IPQ 71.0ˆ63.023.177ˆ: 需要関数

ガソリンの供給関数

Siiii uMbPbbQ

価格原油

価格ガソリン数量

321

Siiii uMbPbbQ 321


iii MPQ 54.6ˆ47.413.83ˆ: 供給関数

需要曲線と供給曲線の2段階推定

31

iii IPQ 71.0ˆ63.023.177ˆ: 需要関数

iii MPQ 54.6ˆ47.413.83ˆ: 供給関数

8090

100110120130140150160170180

370 390 410 430 450 470

価格

P

数量 Q

ガソリンの需要と供給

を利用して計算73.37,27.441 MI

ii PIQ ˆ63.071.023.177ˆ: 需要関数

ii PMQ ˆ47.454.613.83ˆ: 供給関数

32

【復習】分散不均⼀性

33

22iii uEuV 仮定 iii) が満たされず

4

1

3

2

22

21

nuE

uE

uE

例. 分散が不均⼀

46.6

ˆ

ˆ

2

2222

22

xx

iiii

ji ijjijiii

ii

SXX

w

uuEwwuEwV

uEwE

仮定 i), ii), iv) は満たされているものとする

仮定 i), ii), ii), iv) が満たされていれば

xxS

V2

ˆ

いない。式を正しく計算できては

から推定するが（残差分散）をデータ仮説検定では

)46.6(ˆ

ˆ2

2

→ 正しい標準誤差が計算できないので t検定ができない

（不偏性はある）

（分散が異なる）

例. 分散不均⼀が疑われる散布図

0 2 4 6 8 10

2040

6080

X

y

34

説明変数の値が⼤きくなると，被説明変数のばらつきも⼤きくなる

誤差項の分散の⼤きさが説明変数の⼤きさと関連している可能性

分散不均⼀の検定 (1)

35

分散不均⼀︓誤差の2乗の期待値（誤差項の分散 2）が観測値ごとに異なっている。

22iii uEuV

グラフによる確認

例. 残差の2乗が説明変数 Xの変動と関係性を持つ。

X

2u

Xが⼤きくなると、残差の2乗値も⼤きくなる

でない

均一分散である

01

0

::HH

H

仮説の設定

残差のばらつきが⼤きくなる

分散不均⼀の検定 (2)：ブルーシュ=ペイガン検定

36

Breusch-Pagan Test (ブルーシュ=ペイガン検定)

残差の2乗値を説明変数に回帰したときの当てはまり具合（決定係数）を利⽤して，分散不均⼀の有無を検証する⽅法

1

例. 説明変数が X2, X3 の 2つ，サンプルサイズが n = 100 のケース

推定をiiii uXXY 33221 を計算2ˆ iu

2

iiii vXXu 332212ˆ

【補助回帰式】帰無仮説を検証する式残差の2乗を定数項と説明変数に回帰

を計算補助回帰式の決定係数 2R

均一分散である帰無仮説 :

0: 320 H

乗は一定になる残差の

でならば

2

ˆ0 12

32 iu

分散不均⼀の検定 (3) ：ブルーシュ=ペイガン検定

37

4 乗分布にしたがうのカイの数補助回帰式の説明変数は自由度 222nR

有意⽔準 5% でのカイ2乗分布の上側臨界値を求める

99.5205.0,2 Excel関数 = CHIINV(0.05,2)

5

分散均一である

を棄却しないならば

分散不均一である

を棄却するならば

022

05.0,2

022

05.0,2

99.5

99.5

HnR

HnR

Breusch-Pagan 検定統計量 (BP検定統計量)を計算3

決定係数）（サンプルサイズ検定統計量 2: nR

【検定の基本】検定統計量が臨界値よりも⼤きい値のときH0を棄却する

カイ2乗分布の臨界値を求める関数

カイ2乗分布 (1)

38

)(: chiカイ

カイ2乗分布 (chi-squared distribution)とは

0 5 10 15 20

0.00

0.05

0.10

0.15

0.20

自由度 m = 3

x

f(x)

0 10 20 30 40

0.00

0.02

0.04

0.06

0.08

自由度 m = 10

x

f(x)

カイ2乗分布の確率密度関数

布によって形が変わる分自由度 m

ガンマ関数

0,2 2

1 22

xexxfmm

xm

標準正規分布にしたがう確率変数の2乗和に関する分布

カイ2乗分布 (2)

39

例. ⾃由度2 のカイ2乗分布

有意⽔準 q = 0.05(5%)

22,0.05 = 5.99

有意⽔準5%臨界値

棄却域

表7.6 カイ2乗分布 (p.329)下側確率

40

下側確率

⾃由度m

p = 0.005 0.01 0.025 0.05 0.1 0.5 0.9 0.95 0.975 0.99 0.995

1 0.00004 0.00016 0.00098 0.0039 0.0158 0.455 2.710 3.84 5.02 6.63 7.882 0.01003 0.02010 0.0506 0.1026 0.211 1.386 4.61 5.99 7.38 9.21 10.6 3 0.07172 0.1148 0.2158 0.352 0.584 2.37 6.25 7.81 9.35 11.3 12.8 4 0.2070 0.2971 0.484 0.711 1.06 3.36 7.78 9.49 11.1 13.3 14.9 ・・・

2Pr mAp

例. ⾃由度2 のカイ2乗分布

0.95

5.99

例 7.6（表7.7のデータ）：BP検定

41

iiii uXXY 33221

世帯人員

世帯年収

エンゲル係数

::

:

3

2

i

i

i

XXY1 を計算

2ˆ iu

2 iiii vXXu 332212ˆ

を計算補助回帰式の決定係数 2R

169527.0,10 2 Rn69527.1:BP 2 nR統計量3

4

99.5205.0,2 Excel関数 = CHIINV(0.05,2)

⾃由度2，有意⽔準5%のカイ2乗分布上側臨界値

5

言えない。分散不均一であるとは

い。帰無仮説を棄却できな

よりも小さいのでは臨界値検定統計量 99.569527.1 205.0,2

2 nR

均一分散0: 320 H

練習問題 (1) 表7.16 (例題42，pp.344-345) 表7.16のデータを利⽤して次の回帰モデルを最⼩2乗法で推定する︓

𝑌 β β 𝑋 β 𝑋 𝑢

最⼩2乗残差を利⽤して BP 検定を実⾏して分散不均⼀性について検証しなさい。

さらに，左辺 𝑌 のみを対数変換したモデルln 𝑌 β β 𝑋 β 𝑋 𝑢

を最⼩2乗法で推定し， BP 検定を実⾏して分散不均⼀性について検証しなさい。

42

重み付き最⼩2乗法 (1) (pp.332-334)

43

階級ごとに集計されたデータの平均値を⽤いるとき，平均をとるときの集計数によって分散が不均⼀になることがある。

3.491

7.1141

1

11

1

1

11

1

N

YY

N

XX

N

ii

N

ii

階級階級番号j 総⽀出⾷費集計世帯数

〜200万円 1 114.7 49.3 241200〜250 2 180.6 66.1 344250〜300 3 187.9 68.6 519300〜350 4 210.3 76.1 705350〜400 5 227.4 78.4 713

・・・

・・・

・・・

・・・

・・・

jX jY jNijij YX

ij食費を総支出を

の階級に属する世帯

,

表7.8

重み付き最⼩2乗法 (2) (pp.332-334)

44

世帯レベル（集計前）の回帰式 ijijij uXY

年収階級別（集計後）の回帰式 30.7jjj uXY

jN

uu

jN

iij

j

1

集計後の回帰式の誤差項

ばが満たされているなら標準的仮定 0,,0: 2 lmijijij uuEuVuE

2

2

,0 jjj jNuVuE

集計後の回帰式の誤差項は集計数 N (j)に

よって分散が異なる［明確な分散不均⼀］

重み付き最⼩2乗法 (3) (pp.332-334)

45

2 jj uNV

の分散はを乗じたに集計された誤差項 jj ujNjNu

分散均⼀化の作業

を乗じるとの両辺に jNuXY jjj 30.7

jjj ujNXjNjNYjN

この推定モデルの誤差項は均⼀分散になるので，以下のように新しい変数を定義して

j

jjjj

XjNX

jNX

ujNuYjNY

*2

*1

**

**2

*1

*jj uXXY を推定する。Yj

*をX1*とX2

*に回帰する。定数項はなし。

重み付き最⼩2乗法 (4) (pp.332-334)

46

表7.8 のデータの重み付き最⼩2乗法による推定結果

*2

*1

* 216.0119.28ˆ XXY j

33.4398.19

216.0119.28ˆjj XY

元の集計モデル(7.30)に戻す

jXjNX *2 jNX *

1 jj YjNY *

定数項なし

【復習】系列相関

47

仮定 iv) が満たされず 0,Cov ijjiji uuEuu

仮定 i), ii), iii) は満たされているものとする

48.6

ˆ

2

22

ji ijijji

xx

ji ijjijiii

wwS

uuEwwuEwV

系列 (serial)︓⼀定の順序にしたがって並べられた状態のこと。時系列データ (time series data)︓時間の順序にしたがって並べられたデータ。系列相関 (serial correlation) ︓主に時系列データにおいて誤差項が互いに相関している状態のこと

いない。式を正しく計算できては

から推定するが（残差分散）をデータ仮説検定では

)48.6(ˆˆ

2

2

（不偏性はある）

分散が異なる

→ 正しい t検定ができない

xxS

V2

ˆ

)iv

いれば

が満たされて仮定

系列相関が⽣じる理由時系列データ︓過去からの持続的・傾向的な動き（トレンド）や循環的（サイクル）な動きがデータに含まれてしまう。

過去に⽣じた誤差（経済的ショック）が将来の誤差にも影響してしまう。

そのような変数が⽋落している場合，系列相関となる可能性がある。

48

1階の⾃⼰回帰モデル AR(1) Model

49

1,,,2,11 niuu iii

0,,0 22

jiii EEE誤差項（イプシロン）：確率

数（ロー）：自己回帰係

系列相関が明⽰的な誤差項

誤差が反転の値になる可能性正の値のとき，今期は負負前期が正

の場合：

誤差が増幅の値になる可能性負の値のとき，今期も正負前期が正

の場合：

0

0

る。の相関係数を示していとは自己回帰係数 ji uu

AR (1) の乱数誤差の動き

50

‐5.000

‐4.000

‐3.000

‐2.000

‐1.000

0.000

1.000

2.000

3.000

4.000

5.000

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96

ui (=0.9)

‐5.000

‐4.000

‐3.000

‐2.000

‐1.000

0.000

1.000

2.000

3.000

4.000

5.000

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96

ui (=0.05)

‐6.000

‐4.000

‐2.000

0.000

2.000

4.000

6.000

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96

ui (=−0.9)

1,0~,100 Nn i

標準偏差 1.643 標準偏差 2.364

標準偏差 1.051

⼤きく波打つ細かく反転

1階の⾃⼰回帰モデルの期待値，分散，共分散

51

2

2

1

2

22

1

0

1,Cov

1

0

ii

ii

N

jji

ji

uu

uEuV

EuE

2

2

2

2

1

1

1

1,Cov

ii

ii

uVuVuu

相関係数

分散均⼀

系列相関がある仮定 iv) は崩れる

期待値はゼロ

ダービン=ワトソン統計量 (1)

52

えない系列相関がないとは言

系列相関がない

】【系列相関の仮説検定

0:0:

0

0

HH

検定統計量（ダービン=ワトソン統計量; DW）

統計量分布の，説明変数の数サンプルサイズ DWmn

u

uuDW n

ii

n

iii

~ˆ

ˆˆ

1

2

2

21

負の系列相関系列相関なし正の系列相関

ˆ12DWDW の関係：と表7.9 系列相関とDW統計量 (p.337)

0ˆ1 42 DW

0ˆ 2DW

1ˆ0 20 DW

DWDW = 2のとき，系列相関なし・2 < DW < 4 のとき負の系列相関の疑い・0 < DW < 2 のとき正の系列相関の疑いDWが 2 に近いかどうかが重要

0 1 2 3 4

ダービン=ワトソン統計量 (2) 臨界値

53

n m = 1 m =2 m = 3DL DU DL DU DL DU

15 1.08 1.36 0.95 1.54 0.82 1.7516 1.10 1.37 0.98 1.54 0.86 1.7317 1.13 1.38 1.02 1.54 0.90 1.7118 1.16 1.39 1.05 1.53 0.93 1.6919 1.18 1.40 1.08 1.53 0.97 1.6820 1.20 1.41 1.10 1.54 1.00 1.6821 1.22 1.42 1.13 1.54 1.03 1.6722 1.24 1.43 1.15 1.54 1.05 1.66

DW 統計量の分布は説明変数の数mだけでなく，その内容にも依存している。そのためはっきりとした形はわからないが，分布の下限 (DL) と上限 (DU) はわかっている。

DW 統計量の分布は 2 を中⼼とする分布で，0 から 4 までの値をとる。

有意⽔準5 % の下限DLと上限 DU （表7.10, p.338）

m = 1, n = 15DW 統計量の分布

真の臨界値 ? 真の臨界値 ?

2 < DW < 4 のとき負の系列相関の疑い

0 < DW < 2 のとき正の系列相関の疑い

08.1LD 36.1UD64.24 UD

92.24 LD

N. E. Savin and Kenneth J. White (1977) “The Durbin‐Watson Test for Serial Correlation with Extreme Sample Sizes or Many Regressors”

ダービン=ワトソン統計量 (3) 棄却域と判定

54

DW 統計量0

08.1LD

36.1UD

64.24 UD

92.24 LD 4

正の系列相関負の系列相関系列相関なしを棄却0:0 H を棄却しない0:0 H を棄却0:0 H

判定不能判定不能

表7.12 消費と所得 (n=39, m=1)

55

残差を出力」にチェックを入れて「回帰分析」で「残差

乗推定を最小

2iii uXY

ii XY48.17134.5

66.046.5ˆ 推定結果

を計算

n

ii

n

iii

u

uuDW

1

2

2

21

ˆ

ˆˆ

iu 1ˆ iu

1期ずらす

21ˆˆ ii uu

38.15813.2599526.357

DW

2乗和を求めるには sumsq関数を利⽤する。

例7.8 表7.12 消費と所得（続き）

56

n m = 1DL DU

・・・39 1.43 1.54・・・

54.1,43.110.7

1,39,0:0

UL DDDW

mnH分布の下限と上限はより表

を検定

DW 統計量

43.1LD 54.1

UD

46.24 UD

57.24 LD

DW

0 1 2 3 4

といえる。で正の系列相関がある有意水準

を棄却する。の領域に入るのでは

%50:038.1 0

HDDWDW L

38.1DW

正の系列相関負の系列相関

コクラン=オーカット法

57

AR(1)モデルの推定

iiii

iii

iii

iii

iii

iii

iii

XYXuXY

XYuu

ARXYu

uXY

uXYi

11

11

1

111

111

111

1)37.7(

:1

推定モデルは

モデルに代入すると

を乗じると両辺に

期の回帰式

iii uu 1

38.711 iiiii XXYY

(7.38)の推定⼿順

を求める。残差

を推定して

i

iii

uuXY

ˆ:]1[

を得る。の推定値

を推定

モデルを利用して

ˆˆˆ:

1ˆ:]2[

1 iii

i

uuARu

を推定として 38.7

ˆ

ˆ:]3[

1*

1*

iii

iii

XXX

YYY

38.7**iii XY

表7.12 消費と所得 (n=39, m=1)

58

を利用する39,,2 i

の推定結果を利用iii uXY :]1[

を推定iii uu 1ˆˆ:]2[

「ラベル」のチェックをはずす「定数に0を使⽤」にチェック

係数標準誤差 t P‐値切⽚ 0 #N/A #N/A #N/AX 値 1 0.286784 0.165299 1.734938 0.091076

286784.0ˆ

iu 1ˆ iu

年～年～ 19971960ˆ19981961ˆ 1

*

iii YYY

配列コピーを利⽤して計算

** 655.0110.4ˆii XY

コクラン=オーカット法適⽤後のDW

59

** 655.0110.4ˆii XY

74.1

1597.2379534.412

ˆ

ˆˆ

1

2

2

21

n

ii

n

iii

u

uuDW

いえない。で系列相関があるとは有意水準

を棄却しない。の領域に入るのでは

%50:474.1 0

HDDWDDW UU

コクラン=オーカット法によって系列相関は消滅

Documents

Econometrics-2018-11-1217 - u-toyama.ac.jp...使 データ: 第7章chap7-econometrics.xlsx 教科書: pp. 313 –348（第7 章） 2 説明変数の過不 ：真のモデルと定式化pp.313-318

Econometrics-2018-11-1217 - u-toyama.ac.jp...使データ: 第7章chap7-econometrics.xlsx 教科書: pp. 313 –348（第7 章） 2 説明変数の過不：真のモデルと定式化pp.313-318