Upload
xander-david
View
42
Download
0
Embed Size (px)
DESCRIPTION
潜在変数に交互作用がある 構造方程式モデル (共分散構造モデル) : 二段階最小二乗推定値. Kenneth A. Bollen University of North Carolina at Chapel Hill. 本講演のテクニカルな内容は以下の論文を参照されたい Bollen(1995). Structural Equation Models that are Nonlinear in Latent Variables: A least Squares Approach, In Sociological Methodology (P.M. Marsden ed.). - PowerPoint PPT Presentation
Citation preview
1
潜在変数に交互作用がある構造方程式モデル(共分散構造モデ
ル):二段階最小二乗推定値
潜在変数に交互作用がある構造方程式モデル(共分散構造モデ
ル):二段階最小二乗推定値
Kenneth A. Bollen
University of North Carolina at Chapel Hill
本講演のテクニカルな内容は以下の論文を参照されたいBollen(1995). Structural Equation Models that are Nonlinear in Latent Variables: A least Squares Approach, In Sociological Methodology (P.M. Marsden ed.).
2
問題• 非線型な関係
– 収入と工業化は,逆 U 字形の関係– 生活満足度は,収入 × 健康度に影響される– 収入は,年齢の非線型関数
• 回帰モデルはこれらを扱うことができる
2次関数的関係
積による交互作用
y x x
y x x x x
1 11 1 12 12
1
1 11 1 12 2 13 1 2 1
3• 暗に(独立変数に)測定誤差がないことが仮定されている– たとえ誤差がランダムであったとしても OLS
(通常の最小二乗推定値)に偏りを生じさせる• どのようにして測定誤差を許すモデルを導入
するか1 Busemeyer-Jones(1983) :信頼性係数を既知とした
単一指標のモデル2 Kenny-Judd(1984): 多重指標モデル+非線型制約
• 欠点a. 有意性検定ができないb. 推定値などの分布が分からないc. コンピュータプログラムの作成が難しい
4
本講演の目的
1.潜在変数や観測変数の非線型関数をモデルに含めるための一般的な枠組みを与える
2. Bollen ( 1995 )による二段階最小二乗推定値 (2SLS) の利用a. 簡単で使いやすいb. 漸近的な分布の性質が分かっているc. 正規性の仮定に依存しない
3.適用例
5先行研究• Busemeyer-Jones(1983)
y L L L L
y
L L
y L
y L
L L
i e
y y
y L L L L
1 11 1 12 2 13 1 2 1
1
1 2
1
2 1 2
3 2 3
1 2 2 3 1
2 3
1 1 2 1 2
11 12 13
3
4
5
( )
( )
( )
. .
観測変数
, 潜在変数
撹乱変数(誤差項)
, , , , :正規分布
平均からの偏差で解析( 中心化してから解析)
と の信頼性係数既知
, , の共分散行列を推定
, , の一致推定値,
6
限界( Limitations )1.一つの潜在変数に対して一つの指標
(観測変数)しかない2.誤差分散が既知でないといけない3.有意性検定ができない4.切片項の推定ができない5.正規性の仮定が必要6.ロバストネス(頑健性)が未知
改良の試み:
Feucht(1989), Fuller(1980) は上記3と5を議論
しかし,結果は数値実験によるものであり魅力的ではない
7
先行研究(続)Kenny-Judd(1984) の方法
1.多重指標(複数個の観測変数)が扱える
y L L L L
y
L L
y L
y L
y L
y L
L L
1 11 1 12 2 13 1 2 1
1
1 2
1
2 1 2
3 2 3
4 41 1 4
5 52 2 5
1 2 2 3 4 5 1
6
7
8
9
10
( )
( )
( )
( )
( )
観測変数
, 潜在変数
撹乱変数(誤差項)
, , , , , , :正規分布
8Kenny-Judd(1984) の方法(続)
線形・非線型制約を置いて推定値を求めることが必要e.g., (12) 式では, と の因子負荷が( に)等しいe.g., (14) 式では, 係数に非線型制約が入る.また
L L
y y L L L L
y y L L L L
y y L L L L
y y L L L L
1 2
2 3 1 2 1 3 2 2 2 3
2 5 52 1 2 1 5 52 2 2 2 5
4 3 41 1 2 2 4 41 1 3 3 4
4 5 41 52 1 2 41 1 5 52 2 4 4 5
11
12
13
14
の指標を構成する
( )
( )
( )
( )
Var L L Var L Var L Cov L L( ) ( ) ( ) [ ( , )]1 2 1 2 1 22
L L1 2
L L1 2 L2 2 52
9
限界( Liminations )
1.正規性が崩れたときに何が起こるか,(潜在変数が)独立でないとき何が起こるかが不明
2.積の項をつくることで変数が増大する3.生データではなく中心化したデータ
( deviation scores )を扱っている
10新しいモデルと推定値L L f(L)
L
L L
f(L) L
f(L) L
L
L
B B
m
m
B m m
n
B m n
m
1 2
1
2
15
1
1
1
1
( )
潜在変数からなるベクトル
切片項からなるベクトル
から への影響の大きさを表す係数行列
の非線型関数
から への影響の大きさを表す係数行列
撹乱項(誤差項)のベクトル
測定モデル
観測変数からなるベクトル
切片項からなるベクトル
, , 影響の大きさを表す係数行列
測定誤差項からなるベクトル
y L f(L)
y
y
y
p
p
p m p n
p
1 2
1 2
16
1
1
1
( )
11
それぞれの潜在変数は尺度を決めるための指標をもつ
観測変数 を尺度決定指標 ( )と
その他 に分割する.つまり
ここで
そして
潜在変数の方程式( )に代入すると
y L
m
p m
B B f B
i i i
L
( )
(( ) )
( )
17
1
1
15
1
2
1
2
1 1
1 1
1 1 1 2 1 1 1 1 1
y y
y
yy
y
y L
L y
y y y
12潜在変数 を消去して測定モデル( )を書き換えると
潜在変数モデルの第 番目の方程式は
(潜在変数の)スケールを定める指標
行列やベクトルの第 行を表す添字.例えば,
は の第 行, はベクトル の第 要素
観測変数のモデルをつくる
誤差項が,他の変数と相関している
による二段階最小二乗法 の
適用を考える
L
f
i
y B B f B
y
i i
B B i i
y
i L i i i i i
i
i i
i
16
1 1 2 1 1 1 1
1 1 2 1 1 1 1
1 1 1
y y y
y y
( )
( )
Bollen(1995) (2SLS)
13操作変数 が必要:
が操作変数 かどうかをチェックするには
をつくる
へ を代入する
の各要素へ ( を)代入する
を確認する
操作変数をつくる:観測変数の非線型関数
1.指標の尺度を定めない観測変数( )の積は
しばしば操作変数になる.
2. 積の項の中のそれぞれの観測変数を全ての
操作変数( )の上に回帰する
予測値を計算する( , )
積 を作ると,これが操作変数になる
(IV, Instrumental Variables)
IV)
reduced form
reduced form
IVs
v
Cov v u
v
u
Cov v u
a
b e g y y
c y y
i
i i
i
i
i i
(
( ) ( , )
( )
( )
( ) ( , )
( )
( ) . .,
( )
1
2
3
4 0
2
1 2
1 2
y
『 reduced form とは』 y の定義式などを 代入することで u や v を独立変数で 表すこと
14
Kenny-Judd の例による説明
を適用する二段階最小二乗法,,,)操作変数(
で置き換える:とを,
(2SLS)
IV 325454
13213231332133122111
132133122111
23312221
52525
41414
323
212
121132121111
ˆˆ:
)()(
yyyyyy
yyu
uyyyyy
LyLyLL
Ly
Ly
Ly
Ly
LLLLy
15図 1 .積の項による交互作用(測定モデル)
英語版をご覧ください
16
積の項による交互作用(測定モデル)
y
y
y
y
y
L
LL L
y
y
y
1
2
3
4
5
21
31 32
42
1
233 1 2
1
2
3
0
0
1 0
0
0
0 1
0
0
0
0
2
3
4
[ ]
4
5
17y y L y
y y
y y y y
y
y y y y y u
u y y
y
y
1 1 2
2 21 1 21 1 2
3 4 5 1
3
3 31 1 32 5 33 1 5 3
3 31 1 32 5 33 1 5 5 1 1 5 3
1
41
42
2
3
( は の尺度を定める観測変数)に関する方程式を
に代入すると
操作変数: , , と相関あるが誤差項とは無相関
二段階最小二乗法( )を適用する
を次のように書き直す:
ここで
( )
( )
( )
( ) (
2SLS
43
2 4 2 4 1 5
)
操作変数: , , ,
二段階最小二乗法( )を適用する
y y y y y y
2SLS
18
図2.2乗の項を持つ潜在変数モデル
英語版をご覧ください
192乗の項を持つ潜在変数モデル
L L L
y L y L
y y y u
u y
E u Var
Var
y
L
L
L
3 31 1 32 12
3
1 1 1 3 3 3
3 31 1 32 12
3
3 31 1 32 1 1 32 12
3 3
3 32 1
32 1
2
3
3
3
2
尺度を決める方程式が
,
であるとすると,上記の方程式は
ここで
は切片項の推定値
( )が偏っていること( )を示す
操作変数( s):
( ) ( )
( ) biased
IV , の2乗
二段階最小二乗法 を適用する
y2
(2SLS)
20
操作変数の評価1.方程式の右辺の変数と同数の操作変数
( IVs )が必要• 方程式の識別問題に関連する
2.操作変数( IVs )がよりたくさんあれば,操作変数の適切性を検定できる• ある操作変数( IVs )が誤差項と相関して
いるかどうかの検定
3.操作変数( IVs )がどの程度,従属変数を予測できるかを測ることができる• 第一段階の推定から得られる R 2• R 2が低ければ, IVs のクオリティは低い
21表1.ブッシュ大統領に対する好感度 (feeling) のモデル (N=1944)
潜在変数L1= 回答者の経済状態の自己知覚L2= 民主党との一体感L3=L2*y1
L4= ブッシュ大統領に対する好感度 観測変数
y1= 教育年数y2=1 男性 0 女性y3=1 アフリカ系アメリカ人 0 その他y4=log(1991 年の家族の税込み総収入 )
y5=1 やむを得ず購入を延期したことがある 0 ない
次スライドへ続く
22y6=1 やむを得ず通院を延期したことがある 0 ないy7=1 やむを得ずお金を借りたことがある 0 ないy8=1 やむを得ず貯金に手を付けたことがある 0 ないy9=1 やむを得ずより多く働こうとした 0 していないy10=1 貯金がまったくできない 0 できるy11=1 家賃の支払いが遅れたことがある 0 ないy12= 民主党との一体感の程度y13= 民主党への好感度(0~10)y14= 昨年と比べたときの現在の経済状態の自己評価y15= 生活費と収入の変化の関係の自己評価y16= ブッシュ大統領への好感度(0~10)
全ての変数は, 1992 年国政選挙研究からのもの( ICPSR から入手可能)
23
補足スライド: ICPSR とは
•全ての変数は, 1992 年国政選挙研究からのもの( ICPSR から入手可能)
• ICPSR とは次の略語: The Inter-university Consortium for Political and Social Research
• http://www.icpsr.umich.edu/cgi/ab.prl?file=6230
24図3.ブッシュ大統領に対する好感度のモデル:積による交互作用の導
入
英語版をご覧ください
画質が悪いので英語版スライドか元論文 Bollen 1995243頁をご覧ください
25実データの解析:ブッシュ大統領への好感度
L
L L L L y y y
y y y
y y y y y y y u
u y
y
L
L
4
4 41 1 42 2 43 2 1 44 1 45 3 4
12 14 16
16 41 14 42 12 43 12 1 44 1 45 3 4
4 41 14 42 12 43 12 1 16 4
1
4
4
( )ブッシュ大統領への感情 の潜在変数モデル
尺度を定める指標 , , を上記方程式に代入
すると,観測変数に関する方程式を得る:
ここで
操作変数:
:
~ , , , ,
, ,
二段階最小二乗推定値( )
y y y y y y y
R y y y y
L L L L y y y
11 13 15 13 1 12 12
14 12 12 1
4 1 2 2 1 1 3
0 39 0 44 0 45
9 206 0599 0166 0 034 0 009 0 362
12 04 7 37 88 2 54 16 211
: . ( ) . ( ) . ( )
. . . . . .
( . )( . ) ( . ) ( . ) ( . ) ( . )
2SLS
26SAS 入力ファイル:Data two;set one;proc reg;model y12=y1--y11 y13 y15 y13y1output out=three p=y12hat;data four;set three;y12haty1=y12hat*y1;proc syslin 2sls;endogenous y16 y14 y12 y12y1;instruments y1--y11 y13 y15 y13y1 y12haty1;model y16=y14 y12 y12y1 y1 y3;
次スライドへ続く
27
SAS 入力ファイル ( 続 )
*データ名を “ one.” と指定してから SASプログラムを走らせる.最後の4行が,2 SLS による推定値をもとめるための鍵ステートメントである.
28
結論• 非線型潜在変数をもつモデルを推定する
新しい方法を提案した• 望ましい性質
一致推定量 推定量の漸近分布が既知 非正規分布への対応 有意性検定が可能 SAS などの2 SLS 法をサポートするソフトウェア が利用可能
29
表2.潜在変数の非線型関数への方法の比較:
Kenny-Judd (1988) versus 2SLS
次スライドへ次スライドへ続く
30Kenny-Judd(1988) versus 2SLS