Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
131003
計量経済学 講義第 21/22 回
2018 年 12 ⽉ 17 ⽇(⽉)2/3 限担当教員: 唐渡 広志(からと・こうじ)研究室: 経済学研究棟4階432号室email: [email protected]‐toyama.ac.jpwebsite: http://www3.u‐toyama.ac.jp/kkarato/
1
講義の⽬的 推定式が正しいかどうかを判断するには何をしたらよいか,複数の推定式が候補としてある場合,どれを最終的な結論として採⽤すべきか,などの⽅法について学びます。
説明変数と誤差項の相関がある場合の対処法を学びます。
誤差項の分散が不均⼀である場合や,系列相関を持つ場合についての検定⽅法と修正⽅法を学びます。
keywords: 過⼩定式化,過剰定式化,多重共線性,操作変数法,連⽴(同時)⽅程式モデル,同時⽅程式バイアス,2段階最⼩2乗法,プルーシュ=ペイガン検定,ホワイト検定,分散不均⼀⼀致標準誤差,重み付き最⼩2乗法,1階の⾃⼰回帰モデル,ダービン=ワトソン検定教科書:
使⽤データ: 第7章 chap7-econometrics.xlsx
教科書: pp. 313 – 348(第 7 章)2
説明変数の過不⾜:真のモデルと定式化 pp.313-318
3
1.7. 33221 iiii uXXYA
状況 1
真のモデル 真のモデル
状況 2
2.7. 2 iii uXYB
定式化したモデル 定式化したモデル
2.7. 2 iii uXYB 1.7. 33221 iiii uXXYA
ろうか?して何が違っているだ
と比較のはの推定量 2][ˆ AB ろうか?して何が違っているだ
と比較のはの推定量 ][ˆ2 BA
過少定式化 過剰定式化
真の原因は2つあるにも関わらず,原因を1つしか考えない場合
真の原因は1つしかないにも関わらず,原因を2つも考えてしまう場合
説明変数の選択
4
男性と⼥性の経済⾏動の違いをダミー変数で検討する場合
1.7. 33221 iiii uXXYA
となるダミー変数女性のとき
可処分所得
ある商品の支出額
1::
:
3
2
i
i
i
XXY
2.7. 2 iii uXYB
[A]を推定して3の推定値が有意であれば,[B]を推定する必要はない可処分所得が同じであっても,男⼥間で⽀出額に違いあることを主張できる。
[A]を推定して3の推定値が有意でなければ,[B]を推定する必要が出てくる性別にかかわらず,⽀出額は可処分所得の⼤きさで決まることを主張できる。
【問題点】実際は何が「真のモデル」なのかは分析者にはわからない。誤ったモデルを「選択」してしまったときの悪影響の程度を知っておくことは重要。
本当は[A]のモデルが正しいにもかかわらず,[B]を推定する場合,[B]における の最⼩2乗推定量はどのような特徴を持つか(どんな悪影響があるか)
本当は[B]のモデルが正しいにもかかわらず,[A]を推定する場合,[A]における の最⼩2乗推定量はどのような特徴を持つか(どんな悪影響があるか)
過少定式化(状況1)
5
真のモデルが
であるにも関わらず,誤って
を推定したときの の最⼩2乗推定量 の特徴を考える。
1.7. 33221 iiii uXXYA
2.7. 2 iii uXYB
iiiiiiy uXXwYw
SS
332212222
2ˆ
式を代入に推定量 )1.7]([ˆ A
222
222
XX
XXw
i
iiただし
を利用すると22
2332222 ,1,0
SS
XwXww iiiii
iiuwSS
222
2332
ˆ
ているものとすると標準的仮定が満たされ
222
2332
ˆ SS
E ないの不偏推定量は得られを推定しても真の値 2][ B
除外変数バイアス 真のモデルに含まれる説明変数を除外したモデル(過少定式化モデル)の最⼩2乗推定量は不偏推定量でない。
バイアスの⼤きさは 3, S23, S22の⼤きさ,符号に依存して決まる。
6
222
/
23
/32
ˆ
SS
E3 > 0 3 < 0
S23 > 0 + −
S23 < 0 − +
の分布のときの
または
ˆ0,0
0,0
323
323
SS
の分布のときの
または
ˆ0,0
0,0
323
323
SS
の分布
を推定したときの
2ˆ
][
A
2
過剰定式化 (状況2) (1)
7
真のモデルが
であるにも関わらず,誤って
を推定したときの の最⼩2乗推定量 の特徴を考える。
1.7. 33221 iiii uXXYA
2.7. 2 iii uXYB
2
iiiii
yy uXhYhSSS
SSSS2233322
3232332
ˆ
式を代入に推定量 )2.7]([ˆ2 B
2233322
33232233
SSSXXSXXS
h iii
ただし
を利用すると1,0 2 iii Xhh
iiiiiii uhuhXhh2ˆ
ているものとすると標準的仮定が満たされ
ii uEhE 2ˆ
る。の不偏推定量が得られ真の値
を推定しても過剰に定式化された
][ A
過剰定式化 (2)
8
の分散を調べてみる iiuh2ˆ
2233322
332222
ˆSSS
SuEhV ii
の分散はの推定量一方,真のモデル iiYwB 2ˆ][
22
222
1ˆS
YVwV ii
22
222
222
2
22
2222
1SS
XX
SXX
w
i
ii
ただし
なのでより 2233
223
22
33
223
22
2233322
33 1 SSS
S
SSSSSS
S
22
222
233322
332 1ˆˆS
VVSSS
S
効性が失われる)。分散が大きくなる(有
定したときに比べてだが,真のモデルを推
は不偏推定量過剰に定式化された ][ A
過剰定式化 (3)
9
の分布を推定したきの
ˆ
2.7. 2 iii uXYB
の分布を推定したときの
にも関わらずが正しいモデルである
2
33221
ˆ1.7.
][
iiii uXXYAB
練習問題 (1)
10
。の期待値を求めなさいの推定量を推定する場合の
のとき,
であったとしよう。真のモデルが
ˆ2.7.5,10,4,1,2
1.7.
22322321
33221
iii
iiii
uXYBSSuXXYA
22
2332
ˆSS
E
練習問題 (2)
11
の分散を求めなさい。の推定量
。の期待値を求めなさいの推定量
を推定する場合ののとき,
であったとしよう。真のモデルが
22
22
33221
332322
2
ˆ
ˆ1.7.15,5,10,1,2
2.7.
iiii
iii
uXXYASSS
uXYB
22
222
233322
332 1ˆˆS
VVSSS
S
定式化と説明変数の数 過少定式化による誤りがあるとき,最⼩2乗推定量には不偏性がない(除外変数バイアスが⽣じる)。
過剰定式化による誤りがあるとき,最⼩2乗推定量には不偏性があるが有効性がない。
どちらかと⾔えば,過剰定式化の⽅が「被害」の程度は少ない。
真のモデルを探索する「戦略」として,最初にたくさんの説明変数に可能性をもたせて過剰定式化モデルを出発点にするやり⽅がある。(⼀般から特殊へ)
逆に,最初はシンプルな特定のモデルから出発して,徐々に可能性のある説明変数を追加していくやり⽅もある。(特殊から⼀般へ)
12
説明変数間の強い相関 pp.318-320
13
1.7. 33221 iiii uXXYA
の相関係数と ii XX 323322
2323 SS
Sr
乗推定量の分散の最小の 21.7 2
2233322
3322233322
3322 1
ˆrSS
SSSS
SV
乗相関係数の23322
2232
23 SSS
r
を棄却しづらくなる。説値が小さくなるので仮
になる。差)は極端に大きい値の分散(および標準誤
に近づくはに近づくと,またはが
0
ˆ0111
2
2
223332223
t
rSSr
例7.3を参照
相関係数がちょうど 1 または −1 のときは多重共線性に陥推定不能
表7.2
14
953005.0
998563.0
955124.0
23
3
2
r
r
r
y
y
iiii
iii
iii
uXXYuXYuXY
33221
331
221
次の 3 つのモデルを推定する
すべての変数の相関係数を調べる「データ分析」相関
推定値(t値)
p 値 推定値(t値)
p 値 推定値(t値)
p 値
定数項 19.095 0.020
0.959 0.536
1.284 0.424
(2.546) (0.631) (0.818)
X215.153
0.000 0.603
0.377 (13.680) (0.907)
X33.399
0.000 3.276
0.000 (79.061) (22.969)
R2 0.912 0.997 0.997 adj. R2 0.907 0.997 0.997
説明変数と誤差項の相関 仮定 i) が満たされず,説明変数が確率変数であり,なおかつ誤差項と相関を持つ場合には,最⼩2乗推定量は不偏性をもたない。つまりバイアス(偏り)のある推定量になる。また,⼀致性もない。
Cov 𝑋 , 𝑢 0最⼩2乗推定量には不偏性がない,⼀致性もない
15
操作変数法 (1):観測誤差が含まれるデータ ある1⽇のある店舗における傘の売上⾼をその⽇の降⽔量で説明するモデルを考える。
𝑌 α β𝑋∗ 𝑢 𝑌 傘の売上⾼ , 𝑋∗[降⽔量] その店舗の近辺の正確な降⽔量はデータとして得られないので,降⽔量の「代理変数」として「湿度」Xi を利⽤したとする。
𝑌 α β𝑋 𝑢
湿度 𝑋 と降⽔量 𝑋∗の間には密接な関係があり,簡単に測ることができる。その関係式が次の観測誤差 𝑣 を伴う式で与えられている。
𝑋 𝑎 𝑏𝑋∗ 𝑣
これを代理変数によるモデルに代⼊すると,𝑌 α β 𝑎 𝑏𝑋∗ 𝑣 𝑢
𝑣 と 𝑢 の相関がゼロでないかぎり, Cov 𝑋 , 𝑢 0の可能性が⽣じる。 説明変数に代理変数を利⽤する場合,相関が⽣じて最⼩2乗推定量にバイアスが⽣じる可能性がでてくる。
16
操作変数法 (2) p.321
17
操作変数法 (Instrumental Variable Method)︓説明変数と誤差項の相関がある場合の対処法
操作変数 の特徴操作変数 iZ
0:
0,Cov:
zxii
iiii
SXZuZuZ
と相関を持つ説明変数は[関連性]
と無相関誤差項は[外生性]
操作変数推定量
XY
SS
XXZZYYZZ
SS
IVIV
zx
zu
ii
ii
zx
zyIV
ˆˆ
ˆ
操作変数推定量は⼀致性をもたらす IVIVn ˆ,ˆが十分大きくなると,
操作変数法 (3)
18
nSn
S
SS
zx
zu
zx
zuIV
外⽣性と関連性 0,Cov ii uZ[外生性]
0, n
Sn zuが十分に大きくなると
0zxS[関連性] でないは0n
Szx
一致推定量が十分大きくなると, IVn ˆ
操作変数の候補
・時系列データの場合︓1期前のデータ Xi-1を操作変数とする。・関連性に注⽬して,Xi を定数項と Zi に回帰して,Zi の係数推定値が有意であれば,それを操作変数とする。
例7.4 能⼒と賃⾦ pp.322-323 「能⼒」の⾼い⼈ほど賃⾦が⾼い︖
「能⼒」はどのようにして測るか難しい
「教育年数(学歴)」を「能⼒」の代理変数とする
説明変数と誤差項の相関が⽣じる可能性が出る。
「教育年数」の操作変数 Zとして,例えば「両親の教育年数の和」を利⽤して,操作変数推定を⾏う。
19
賃⾦ = + *教育年数 + u(教育年数 = 能⼒ + v)
↓
賃⾦ = + *(能⼒+v) + u
例7.4 能⼒と賃⾦ pp.322-323
20
被説明変数 Y(賃⾦) 最⼩2乗法 操作変数法
推定値 t値 p値 推定値 t値 p値定数項 7.350 0.933 0.359 3.926 0.292 0.771
X教育年数 2.091 3.713 0.001 - - -
Z両親の教育年数の和 - - - 2.340 2.406 0.016
決定係数 0.330 0.330
表7.4 最⼩2乗法と操作変数法による推定結果
340.2ˆ zx
zyIV S
S操作変数推定
091.2ˆ
2
xx
xy
SS乗推定最小
連⽴⽅程式モデル (1) pp.323-327
21
価格 P
数量 Q需要曲線 D
供給曲線 S
その他の要因需要関数 ,: PfQ
その他の要因供給関数 ,: PgQ
1P
1Q
2P
2Q
3P
3Q
i 価格 Pi 数量 Qi
1 P1 Q1
2 P2 Q2
3 P3 Q3
観察されたデータ どのようにして需要曲線,供給曲線を推定するか︖
需要曲線,供給曲線のシフトによって新しいデータが観察される
連⽴⽅程式モデル (2):線形需要関数
22
価格 P
数量 Q
需要曲線 DIaPaaQ 321: 需要関数
:所得
:価格
:数量
IPQ
P0
所得 Iの増加
所得 Iの減少
【需要の法則】価格が低い(⾼い)ほど,その財を購⼊したい(したくない)と考える数量が増える(その財を購⼊したい(したくない)と考える⼈々が増える)
02 aつまり
Q0 Q1Q2
価格 P が変わらなくても,⼈々の所得が増⼤すると「需要」も増⼤する(需要曲線の右シフト)
03 aつまり
連⽴⽅程式モデル (3):線形供給関数
23
価格 P
数量 Q
供給曲線 S
【供給の法則】価格が⾼い(低い)ほど,その財を販売したい(したくない)と考える数量が増える(その財を販売したい(したくない)と考える企業が増える)
Q0 Q1Q2
P0
MbPbbQ 321: 供給関数 :原材料価格M
原材料価格Mの下落
原材料価格Mの上昇
価格 P が変わらなくても,⽣産に必要な原材料価格が下落すると(利潤を得る機会が増えるので)「供給」も増⼤する(供給曲線の右シフト)
02 bつまり
03 bつまり
連⽴⽅程式モデル (3):市場均衡
24
MbPbbQ
IaPaaQ
321
321
:
:
供給関数
需要関数0
0
3
2
aQI
aQP
0
0
3
2
bQM
bQP
連⽴して (Q, P) を解くMbPbbQIaPaaQ
321
321
-) MbIaPbaba 3322110
均衡価格⽅程式
均衡価格 P を需要関数(または供給関数)に代⼊する
Mba
baI
baba
bababaQ
22
32
22
23
22
2112 均衡数量⽅程式
Mba
bI
baa
babaP
22
3
22
3
22
11
連⽴⽅程式モデル (4):市場均衡
25
価格 P
数量 Q
MbPbbQIaPaaQ
321
321
::
供給関数
需要関数
Mba
bI
baa
babaP
22
3
22
3
22
11
Mba
baI
baba
bababaQ
22
32
22
23
22
2112
需要供給モデルで決まるのは価格 Pと数量 Q
連⽴⽅程式モデル (5):内⽣変数と外⽣変数
26
経済理論モデルで⽰される⽅程式を「モデルの構造型」とよぶ。
MbPbbQIaPaaQ
321
321
::
供給関数
需要関数構造型
経済理論モデルを「解く」ことによって決まる変数のことを「内⽣変数」とよぶ。
内⽣変数 (Q, P)
経済理論モデルの外側であらかじめ決まっていると想定される変数のことを「外⽣変数」とよぶ。
外⽣変数 (I, M)
経済理論モデルの構造型を内⽣変数について解いた式を「モデルの誘導型」とよぶ。「誘導型」は内⽣変数を外⽣変数だけで説明する式になっている。
誘導型M
baba
Ibaba
bababaQ
Mba
bI
baa
babaP
22
32
22
23
22
2112
22
3
22
3
22
11
[均衡数量方程式]
[均衡価格方程式]
連⽴⽅程式モデル (6):需要・供給関数の回帰モデル
27
Siiii
Diiii
uMbPbbQ
uIaPaaQ
321
321
:
:
供給関数
需要関数 例. p.327 表7.5 のデータを参照
供給関数を価格 Pについて解くと
ii
v
Si
P
ii vPub
Mbb
bbQ
bP
ii
*
22
3
2
1
2
11
*
観測誤差真の価格
これを需要関数に代⼊すると
Diiiii uIavPaaQ 3
*21
実際に観察された価格 Pは真の価格 Pと誤差 vからなる
説明変数と誤差項の間に相関が⽣じている。仮定 i)はもはや満たされない。
需要関数をこのまま推定すると・・・
ない。一致性もない。乗推定量には不偏性がの最小2,, 321 aaa
同時⽅程式バイアスが発⽣する
2段階最⼩2乗法 (1)
28
2段階最⼩2乗法 (Two Stage-Least Squares Method; 2SLS) を利⽤すると,パラメータの⼀致推定量が得られる。
第 1 段階 需要関数の「説明変数」として利⽤されている「内⽣変数」を「定数項」,需要関数における「外⽣変数」,供給関数における「外⽣変数」に回帰して,最⼩2乗法でその理論値を計算する。
Diiii uIaPaaQ
外生変数内生変数内生変数
需要関数 321:
Piiii vMIP 321:1段階目の推定式
第 2段階
iii MIP 321 ˆˆˆˆ:1 段階目の理論値
1段階⽬の「理論値」を需要関数に代⼊して,今度は需要関数を最⼩2乗法で推定する。
Diiii uIaPaaQ 321
ˆ:2段階目の推定式
SLSSLSSLS aaa 23
22
21 ˆ,ˆ,ˆ2段階最⼩2乗推定量 例. p.326 例7.5 を参照
需要関数の推定
均衡価格⽅程式
2段階最⼩2乗法 (2)
29
供給関数の推定
第 1 段階 供給関数の「説明変数」として利⽤されている「内⽣変数」を「定数項」,需要関数における「外⽣変数」,供給関数における「外⽣変数」に回帰して,最⼩2乗法でその理論値を計算する。
Siiii uMbPbbQ
外生変数内生変数内生変数
供給関数 321:
Piiii vMIP 321 ˆˆˆ:1段階目の推定式 需要関数の2段階推定と同
じ「均衡価格⽅程式」
iii MIP 321 ˆˆˆˆ:1 段階目の理論値 需要関数の2段階推定と同じ「理論値」
第 2段階 1段階⽬の「理論値」を供給関数に代⼊して,今度は供給関数を最⼩2乗法で推定する。
Siiii uMbPbbQ 321
ˆ:2段階目の推定式
SLSSLSSLS bbb 23
22
21
ˆ,ˆ,ˆ2段階最⼩2乗推定量 例. p.326 例7.5 を参照
表7.5
30
ガソリンの需要関数
Diiii uIaPaaQ
所得可処分
価格ガソリン数量
321
Piiii vMIP 321 ˆˆˆ:1段階目の推定式
iii MIP 28.114.047.18ˆ: 理論値残差出⼒
観測値 予測値: Pi 残差1 102.441 0.5589912 111.0441 ‐0.044073 109.2388 ‐0.23884 117.6352 ‐0.635235 132.3451 0.6549126 137.4798 ‐0.479827 151.8781 0.1219418 136.4739 ‐0.473879 139.5256 0.474401
10 137.236 ‐0.2359711 134.7025 0.297514
Diiii uIaPaaQ 321
ˆ:2段階目の推定式
iii IPQ 71.0ˆ63.023.177ˆ: 需要関数
ガソリンの供給関数
Siiii uMbPbbQ
価格原油
価格ガソリン数量
321
Siiii uMbPbbQ 321
ˆ:2段階目の推定式
iii MPQ 54.6ˆ47.413.83ˆ: 供給関数
需要曲線と供給曲線の2段階推定
31
iii IPQ 71.0ˆ63.023.177ˆ: 需要関数
iii MPQ 54.6ˆ47.413.83ˆ: 供給関数
8090
100110120130140150160170180
370 390 410 430 450 470
価格
P
数量 Q
ガソリンの需要と供給
を利用して計算73.37,27.441 MI
ii PIQ ˆ63.071.023.177ˆ: 需要関数
ii PMQ ˆ47.454.613.83ˆ: 供給関数
32
【復習】分散不均⼀性
33
22iii uEuV 仮定 iii) が満たされず
4
1
3
2
22
21
nuE
uE
uE
例. 分散が不均⼀
46.6
ˆ
ˆ
2
2222
22
xx
iiii
ji ijjijiii
ii
SXX
w
uuEwwuEwV
uEwE
仮定 i), ii), iv) は満たされているものとする
仮定 i), ii), ii), iv) が満たされていれば
xxS
V2
ˆ
いない。式を正しく計算できては
から推定するが(残差分散)をデータ仮説検定では
)46.6(ˆ
ˆ2
2
→ 正しい標準誤差が計算できないので t検定ができない
(不偏性はある)
(分散が異なる)
例. 分散不均⼀が疑われる散布図
0 2 4 6 8 10
2040
6080
X
y
34
説明変数の値が⼤きくなると,被説明変数のばらつきも⼤きくなる
誤差項の分散の⼤きさが説明変数の⼤きさと関連している可能性
分散不均⼀の検定 (1)
35
分散不均⼀︓誤差の2乗の期待値(誤差項の分散 2)が観測値ごとに異なっている。
22iii uEuV
グラフによる確認
例. 残差の2乗が説明変数 Xの変動と関係性を持つ。
X
2u
Xが⼤きくなると、残差の2乗値も⼤きくなる
でない
均一分散である
01
0
::HH
H
仮説の設定
残差のばらつきが⼤きくなる
分散不均⼀の検定 (2):ブルーシュ=ペイガン検定
36
Breusch-Pagan Test (ブルーシュ=ペイガン検定)
残差の2乗値を説明変数に回帰したときの当てはまり具合(決定係数)を利⽤して,分散不均⼀の有無を検証する⽅法
1
例. 説明変数が X2, X3 の 2つ,サンプルサイズが n = 100 のケース
推定をiiii uXXY 33221 を計算2ˆ iu
2
iiii vXXu 332212ˆ
【補助回帰式】帰無仮説を検証する式残差の2乗を定数項と説明変数に回帰
を計算補助回帰式の決定係数 2R
均一分散である帰無仮説 :
0: 320 H
乗は一定になる残差の
でならば
2
ˆ0 12
32 iu
分散不均⼀の検定 (3) :ブルーシュ=ペイガン検定
37
4 乗分布にしたがうのカイの数補助回帰式の説明変数は自由度 222nR
有意⽔準 5% でのカイ2乗分布の上側臨界値を求める
99.5205.0,2 Excel関数 = CHIINV(0.05,2)
5
分散均一である
を棄却しないならば
分散不均一である
を棄却するならば
022
05.0,2
022
05.0,2
99.5
99.5
HnR
HnR
Breusch-Pagan 検定統計量 (BP検定統計量)を計算3
決定係数)(サンプルサイズ検定統計量 2: nR
【検定の基本】検定統計量が臨界値よりも⼤きい値のときH0を棄却する
カイ2乗分布の臨界値を求める関数
カイ2乗分布 (1)
38
)(: chiカイ
カイ2乗分布 (chi-squared distribution)とは
0 5 10 15 20
0.00
0.05
0.10
0.15
0.20
自由度 m = 3
x
f(x)
0 10 20 30 40
0.00
0.02
0.04
0.06
0.08
自由度 m = 10
x
f(x)
カイ2乗分布の確率密度関数
布によって形が変わる分自由度 m
ガンマ関数
0,2 2
1 22
xexxfmm
xm
標準正規分布にしたがう確率変数の2乗和に関する分布
カイ2乗分布 (2)
39
例. ⾃由度2 のカイ2乗分布
有意⽔準 q = 0.05(5%)
22,0.05 = 5.99
有意⽔準5%臨界値
棄却域
表7.6 カイ2乗分布 (p.329)下側確率
40
下側確率
⾃由度m
p = 0.005 0.01 0.025 0.05 0.1 0.5 0.9 0.95 0.975 0.99 0.995
1 0.00004 0.00016 0.00098 0.0039 0.0158 0.455 2.710 3.84 5.02 6.63 7.882 0.01003 0.02010 0.0506 0.1026 0.211 1.386 4.61 5.99 7.38 9.21 10.6 3 0.07172 0.1148 0.2158 0.352 0.584 2.37 6.25 7.81 9.35 11.3 12.8 4 0.2070 0.2971 0.484 0.711 1.06 3.36 7.78 9.49 11.1 13.3 14.9 ・・・
2Pr mAp
例. ⾃由度2 のカイ2乗分布
0.95
5.99
例 7.6(表7.7のデータ):BP検定
41
iiii uXXY 33221
世帯人員
世帯年収
エンゲル係数
::
:
3
2
i
i
i
XXY1 を計算
2ˆ iu
2 iiii vXXu 332212ˆ
を計算補助回帰式の決定係数 2R
169527.0,10 2 Rn69527.1:BP 2 nR統計量3
4
99.5205.0,2 Excel関数 = CHIINV(0.05,2)
⾃由度2,有意⽔準5%のカイ2乗分布上側臨界値
5
言えない。分散不均一であるとは
い。帰無仮説を棄却できな
よりも小さいのでは臨界値検定統計量 99.569527.1 205.0,2
2 nR
均一分散0: 320 H
練習問題 (1) 表7.16 (例題42,pp.344-345) 表7.16のデータを利⽤して次の回帰モデルを最⼩2乗法で推定する︓
𝑌 β β 𝑋 β 𝑋 𝑢
最⼩2乗残差を利⽤して BP 検定を実⾏して分散不均⼀性について検証しなさい。
さらに,左辺 𝑌 のみを対数変換したモデルln 𝑌 β β 𝑋 β 𝑋 𝑢
を最⼩2乗法で推定し, BP 検定を実⾏して分散不均⼀性について検証しなさい。
42
重み付き最⼩2乗法 (1) (pp.332-334)
43
階級ごとに集計されたデータの平均値を⽤いるとき,平均をとるときの集計数によって分散が不均⼀になることがある。
3.491
7.1141
1
11
1
1
11
1
N
YY
N
XX
N
ii
N
ii
階級 階級番号j 総⽀出 ⾷費 集計世帯数
〜200万円 1 114.7 49.3 241200〜250 2 180.6 66.1 344250〜300 3 187.9 68.6 519300〜350 4 210.3 76.1 705350〜400 5 227.4 78.4 713
・・・
・・・
・・・
・・・
・・・
jX jY jNijij YX
ij食費を総支出を
の階級に属する世帯
,
表7.8
重み付き最⼩2乗法 (2) (pp.332-334)
44
世帯レベル(集計前)の回帰式 ijijij uXY
年収階級別(集計後)の回帰式 30.7jjj uXY
jN
uu
jN
iij
j
1
集計後の回帰式の誤差項
ばが満たされているなら標準的仮定 0,,0: 2 lmijijij uuEuVuE
2
2
,0 jjj jNuVuE
集計後の回帰式の誤差項は集計数 N (j)に
よって分散が異なる[明確な分散不均⼀]
重み付き最⼩2乗法 (3) (pp.332-334)
45
2 jj uNV
の分散はを乗じたに集計された誤差項 jj ujNjNu
分散均⼀化の作業
を乗じるとの両辺に jNuXY jjj 30.7
jjj ujNXjNjNYjN
この推定モデルの誤差項は均⼀分散になるので,以下のように新しい変数を定義して
j
jjjj
XjNX
jNX
ujNuYjNY
*2
*1
**
**2
*1
*jj uXXY を推定する。Yj
*をX1*とX2
*に回帰する。定数項はなし。
重み付き最⼩2乗法 (4) (pp.332-334)
46
表7.8 のデータの重み付き最⼩2乗法による推定結果
*2
*1
* 216.0119.28ˆ XXY j
33.4398.19
216.0119.28ˆjj XY
元の集計モデル(7.30)に戻す
jXjNX *2 jNX *
1 jj YjNY *
定数項なし
【復習】系列相関
47
仮定 iv) が満たされず 0,Cov ijjiji uuEuu
仮定 i), ii), iii) は満たされているものとする
48.6
ˆ
2
22
ji ijijji
xx
ji ijjijiii
wwS
uuEwwuEwV
系列 (serial)︓⼀定の順序にしたがって並べられた状態のこと。時系列データ (time series data)︓時間の順序にしたがって並べられたデータ。系列相関 (serial correlation) ︓主に時系列データにおいて誤差項が互いに相関している状態のこと
いない。式を正しく計算できては
から推定するが(残差分散)をデータ仮説検定では
)48.6(ˆˆ
2
2
(不偏性はある)
分散が異なる
→ 正しい t検定ができない
xxS
V2
ˆ
)iv
いれば
が満たされて仮定
系列相関が⽣じる理由 時系列データ︓過去からの持続的・傾向的な動き(トレンド)や循環的(サイクル)な動きがデータに含まれてしまう。
過去に⽣じた誤差(経済的ショック)が将来の誤差にも影響してしまう。
そのような変数が⽋落している場合,系列相関となる可能性がある。
48
1階の⾃⼰回帰モデル AR(1) Model
49
1,,,2,11 niuu iii
0,,0 22
jiii EEE誤差項(イプシロン):確率
数(ロー):自己回帰係
系列相関が明⽰的な誤差項
誤差が反転の値になる可能性正の値のとき,今期は負負前期が正
の場合:
誤差が増幅の値になる可能性負の値のとき,今期も正負前期が正
の場合:
0
0
る。の相関係数を示していとは自己回帰係数 ji uu
AR (1) の乱数誤差の動き
50
‐5.000
‐4.000
‐3.000
‐2.000
‐1.000
0.000
1.000
2.000
3.000
4.000
5.000
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
ui (=0.9)
‐5.000
‐4.000
‐3.000
‐2.000
‐1.000
0.000
1.000
2.000
3.000
4.000
5.000
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
ui (=0.05)
‐6.000
‐4.000
‐2.000
0.000
2.000
4.000
6.000
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
ui (=−0.9)
1,0~,100 Nn i
標準偏差 1.643 標準偏差 2.364
標準偏差 1.051
⼤きく波打つ 細かく反転
1階の⾃⼰回帰モデルの期待値,分散,共分散
51
2
2
1
2
22
1
0
1,Cov
1
0
ii
ii
N
jji
ji
uu
uEuV
EuE
2
2
2
2
1
1
1
1,Cov
ii
ii
uVuVuu
相関係数
分散均⼀
系列相関がある 仮定 iv) は崩れる
期待値はゼロ
ダービン=ワトソン統計量 (1)
52
えない系列相関がないとは言
系列相関がない
】【系列相関の仮説検定
0:0:
0
0
HH
検定統計量(ダービン=ワトソン統計量; DW)
統計量分布の,説明変数の数サンプルサイズ DWmn
u
uuDW n
ii
n
iii
~ˆ
ˆˆ
1
2
2
21
負の系列相関系列相関なし正の系列相関
ˆ12DWDW の関係:と表7.9 系列相関とDW統計量 (p.337)
0ˆ1 42 DW
0ˆ 2DW
1ˆ0 20 DW
DWDW = 2のとき,系列相関なし・2 < DW < 4 のとき負の系列相関の疑い・0 < DW < 2 のとき正の系列相関の疑いDWが 2 に近いかどうかが重要
0 1 2 3 4
ダービン=ワトソン統計量 (2) 臨界値
53
n m = 1 m =2 m = 3DL DU DL DU DL DU
15 1.08 1.36 0.95 1.54 0.82 1.7516 1.10 1.37 0.98 1.54 0.86 1.7317 1.13 1.38 1.02 1.54 0.90 1.7118 1.16 1.39 1.05 1.53 0.93 1.6919 1.18 1.40 1.08 1.53 0.97 1.6820 1.20 1.41 1.10 1.54 1.00 1.6821 1.22 1.42 1.13 1.54 1.03 1.6722 1.24 1.43 1.15 1.54 1.05 1.66
DW 統計量の分布は説明変数の数mだけでなく,その内容にも依存している。そのためはっきりとした形はわからないが,分布の下限 (DL) と上限 (DU) はわかっている。
DW 統計量の分布は 2 を中⼼とする分布で,0 から 4 までの値をとる。
有意⽔準5 % の下限DLと上限 DU (表7.10, p.338)
m = 1, n = 15DW 統計量の分布
真の臨界値 ? 真の臨界値 ?
2 < DW < 4 のとき負の系列相関の疑い
0 < DW < 2 のとき正の系列相関の疑い
08.1LD 36.1UD64.24 UD
92.24 LD
N. E. Savin and Kenneth J. White (1977) “The Durbin‐Watson Test for Serial Correlation with Extreme Sample Sizes or Many Regressors”
ダービン=ワトソン統計量 (3) 棄却域と判定
54
DW 統計量0
08.1LD
36.1UD
64.24 UD
92.24 LD 4
正の系列相関 負の系列相関系列相関なしを棄却0:0 H を棄却しない0:0 H を棄却0:0 H
判定不能 判定不能
表7.12 消費と所得 (n=39, m=1)
55
残差を出力」にチェックを入れて「回帰分析」で「残差
乗推定を最小
2iii uXY
ii XY48.17134.5
66.046.5ˆ 推定結果
を計算
n
ii
n
iii
u
uuDW
1
2
2
21
ˆ
ˆˆ
iu 1ˆ iu
1期ずらす
21ˆˆ ii uu
38.15813.2599526.357
DW
2乗和を求めるには sumsq関数を利⽤する。
例7.8 表7.12 消費と所得(続き)
56
n m = 1DL DU
・・・39 1.43 1.54・・・
54.1,43.110.7
1,39,0:0
UL DDDW
mnH分布の下限と上限はより表
を検定
DW 統計量
43.1LD 54.1
UD
46.24 UD
57.24 LD
DW
0 1 2 3 4
といえる。で正の系列相関がある有意水準
を棄却する。の領域に入るのでは
%50:038.1 0
HDDWDW L
38.1DW
正の系列相関 負の系列相関
コクラン=オーカット法
57
AR(1)モデルの推定
iiii
iii
iii
iii
iii
iii
iii
XYXuXY
XYuu
ARXYu
uXY
uXYi
11
11
1
111
111
111
1)37.7(
:1
推定モデルは
モデルに代入すると
を乗じると両辺に
期の回帰式
iii uu 1
38.711 iiiii XXYY
(7.38)の推定⼿順
を求める。残差
を推定して
i
iii
uuXY
ˆ:]1[
を得る。の推定値
を推定
モデルを利用して
ˆˆˆ:
1ˆ:]2[
1 iii
i
uuARu
を推定として 38.7
ˆ
ˆ:]3[
1*
1*
iii
iii
XXX
YYY
38.7**iii XY
表7.12 消費と所得 (n=39, m=1)
58
を利用する39,,2 i
の推定結果を利用iii uXY :]1[
を推定iii uu 1ˆˆ:]2[
「ラベル」のチェックをはずす 「定数に0を使⽤」にチェック
係数 標準誤差 t P‐値切⽚ 0 #N/A #N/A #N/AX 値 1 0.286784 0.165299 1.734938 0.091076
286784.0ˆ
iu 1ˆ iu
年~年~ 19971960ˆ19981961ˆ 1
*
iii YYY
配列コピーを利⽤して計算
** 655.0110.4ˆii XY
コクラン=オーカット法適⽤後のDW
59
** 655.0110.4ˆii XY
74.1
1597.2379534.412
ˆ
ˆˆ
1
2
2
21
n
ii
n
iii
u
uuDW
いえない。で系列相関があるとは有意水準
を棄却しない。の領域に入るのでは
%50:474.1 0
HDDWDDW UU
コクラン=オーカット法によって系列相関は消滅