構造方程式モデルによる因果探索と非ガウス性

清水昌平

大阪大学産業科学研究所

数学協働プログラム確率的グラフィカルモデル電気通信大学 2015年3月

https://sites.google.com/site/sshimizu06/indexj

応用例はココ: https://sites.google.com/site/sshimizu06/home/lingampapers#applications

Abstract

• 因果探索– 介入のないデータから因果グラフを推定

• 課題– 時間情報なし

– 潜在共通原因による疑似相関

• セミパラメトリックアプローチ– 関数形には仮定: 線形性 (or 非線形加法的)

– 分布は非ガウス(連続)

– 「適度な」仮定の下, データ分布の情報を全て利用して課題にタックル

使い方その1:

因果方向に関する仮説を比較

• 抑うつ気分と睡眠障害 (Rosenström+, 2012)

• TV視聴時間と腹囲 (Helajärvi+, 2014)

• VAAAとPAAP (von Eye+, 2012)

抑うつ気分

睡眠障害

抑うつ気分

睡眠障害

どれ？

データ行列X

推定抑うつ気分

睡眠障害

人1, 人2, …, 人1689

疫学調査抑うつ気分

睡眠障害

使い方その2:背景知識がない時に因果仮説を探索

• 2つの条件で違うのはどこ？(Mill-Finnerty+ 2014, NeuroImage)

• 因果仮説の構築支援

VMPFC DLPFC

Ant. Cing

Caudate Accumbens

Insula

VMPFC DLPFC

Ant. Cing

Caudate Accumbens

Insula

異なる条件で異なる因果構造

Positive framing Negative framing

脳活動計測

使い方その3:背景知識がない時に因果仮説を探索

• 原因変数選択 (cf. Maathuis+, 10; Campomanes+, 14; Bottou+, 14)

• 「説明」変数を原因系, 結果系, 無関係に3分

– lassoは原因と結果を区別しない(疑似相関も区別しない)

変数11

ターゲット変数

変数200

変数1

変数30 変数20

変数150

原因系結果系

変数3

変数300無関係

因果探索では

何を問題にしているか?

チョコレート消費量とノーベル賞受賞者数には正の相関

Chocolate Consumption, Cognitive Function, and Nobel Laureates

Franz H. Messerli, (2012), New England Journal of Medicine (Occasional Notes)

2002-2011チョコレートの消費量

ノーベル賞受賞者の数相関係数: 0.791

P値 < 0.0001

Messerli論文の散布図（Fig.1)

著者の主張8

Chocolate Consumption, Cognitive Function, and Nobel Laureates

Franz H. Messerli, (2012), New England Journal of Medicine

チョコ消費量

受賞者の数

ConclusionsChocolate consumption enhances cognitive function, …

相関係数: 0.791

P値 < 0.0001

データ

チョコレートをたくさん食べさせれば受賞者が増えるのか？(因果関係)

• 飛躍しすぎ (Maurage et al., 2013, J. Nutrition)

チョコ賞 ?チョコ賞

orGDP GDP

チョコ賞

相関係数 0.791

P値 < 0.001

複数の因果関係がそのような相関関係を与えるギャップ

チョコ

潜在共通原因潜在共通原因潜在共通原因

(相関関係)

ギャップが埋まる場合はある？

「3つのうち, どれがよいか」データから言える場合はある？

チョコ賞 ?チョコ賞

orGDP GDP

チョコ賞

潜在共通原因潜在共通原因潜在共通原因

3つのモデルは, 相関係数は同じかも, しかしそれ以外に違うところがあるのでは？

どんな仮定が必要？

データ分布の情報をすべて利用

因果探索のフレームワーク

チョコ賞

GDP潜在共通原因

構造方程式モデル

構造方程式モデル (SEM) (Bollen, 1989; Pearl, 2000)

• データ生成過程を記述する道具

データ生成過程

1. どういう関数で決まるか

ey ex式で

2. 外生変数はどういう分布か

ex,ey, f の分布

観測変数の分布

分布決まる

注: 概念的には、どっちかというと構造方程式モデルからグラフを描きます

因果効果(介入効果)(Rubin, 1974; Pearl, 2000)

• xの値をcからdに(外的に)変化させた時に、yの値が平均的にどのくらい変化するか

cxdoyEdxdoyE ||:)( 因果効果平均

cd -線形の場合

注: yをxに回帰しても, 回帰係数 ≠ b （潜在共通原因fを無視してはだめ)

因果探索の基本問題14

潜在共通原因ｆ潜在共通原因ｆ潜在共通原因f

データ行列x

y~i.i.d. p x, y( )

仮定: どれかがデータを生成

問題: どれが生成したかを推定

obs.nobs.2 …

ey ex ey ex ey ex

ex,ey, f の分布ex,ey, f の分布 ex,ey, f の分布

因果方向推定: 3つのアプローチ1. ノンパラ

– 関数形にも分布にも仮定おかずどれかわからない

2. パラメトリック

– 線形＋ガウス分布どれかわからない

3. セミパラ

– 線形+非ガウス分布どれからデータ生成したかわかる

潜在共通原因ｆ潜在共通原因ｆ潜在共通原因f

ey ex ey ex ey ex

ex,ey, f の分布ex,ey, f の分布 ex,ey, f の分布

適用イメージ: 思春期の攻撃性

• 入力: 質問紙調査のデータ (Finkelstein+, 1994)

• 因果方向推定 (Shimizu & Bollen 2014; Shimizu, 2015)

• Python code 公開 (今夏)

– 係数bの事後分布, ベイズ因子, 事後予測p値

データ行列(介入なし)

Verbal Aggression Against Adults (VAAA)

Physical Aggression Against Peers (PAAP)

114 boys and girls in UK

VAAA PAAP

<周辺尤度

多変数の場合も役立つ

• 多変数の場合の課題

–因果グラフの候補が膨大

• ペアごとに分析して候補の数を減らせる

–計算も助かる(貪欲法回避; パソコンで可?)

ｘ2ｘ4

ｘ1 x2

ペアごとに分析

候補の絞り込み

ｘ2ｘ4

完全グラフ

あとは辺の有無を評価

Talk outline

1.動機とフレームワーク: Done!

2.因果方向推定の基本アイデア

– 潜在共通原因「なし」の場合を例に

3.潜在共通原因「あり」の場合の因果方向推定

因果方向推定の基本アイデア

潜在共通原因が「ない」場合を例に

• 2つのモデルを比較(因果方向が反対):

– x1とx2どちらが先に生成されたか知らない

• モデル1と2が識別可能な条件 (Dodge+, 00; Shimizu+, 2006)

– e1 or e2が非ガウス

– e1 と e2が独立 (潜在共通原因なし)

とは外生(誤差)変数(連続)

時間情報なし20

モデル1: モデル2:

識別可能: 方向が違えば分布が違う

𝑒1, 𝑒2がガウス 𝑒1, 𝑒2が非ガウス(一様分布)

モデル1:

モデル2:

8.0 exx

121 8.0

1varvar 21 xx

,021 eEeE

相関係数はどれも0.8

• Linear Non-Gaussian Acyclic Model (LiNGAM) (Shimizu+, 2006)

• データXから因果方向, 係数, 切片が識別可能(一意に推定可能)

LiNGAMモデル

jijii exbx

23b13b

-非巡回

-非ガウス外生変数(誤差) ei

- ei は互いに独立(潜在共通原因なし)

外生変数の独立性がどう役立つか？23

モデル 1:

結果x2を原因x1に回帰原因x1を結果x2に回帰

2)var(

),cov(

は独立と )1(

211 )( rex

残差

),cov(1

),cov(

はと )2(

121212 )( reebx

従属

021 bガウスだと無相関＝独立

独立性最大=非ガウス性最大

• 相互情報量の差=非ガウス性の差 (Hyvarinen+, 2013)

• Hを最大エントロピー近似 (Hyvarinen, 1999)

• 多変数でも同様に可

– 「ペアごとに評価し, どのペアでも原因系の変数はroot

node」 (Shimizu et al., 2011)

)()(),(),(

rHxHrxIrxI

2変数の独立性でなく、各変数のエントロピー(1次元)

を評価すればいい (計算が楽)

• 「非線形＋加法の外生変数」のモデル

• いくつかの非線形性と外生変数の分布を除いて識別可能(Zhang & Hyvarinen, 2009; Peters et al., 2014)

• Open problem: どこまで緩められるか?

非線形＋加法の外生変数

の親

-- Hoyer et al. (2008)

-- Zhang et al. (2009)

-- Imoto et al. (2002)

巡回モデル(Lacerda et al., 2008; Hyvarinen & Smith, 2013)

• モデル:

• 識別性の十分条件

– Bの固有値の絶対値が１以下(平衡状態にある)

– ループが交わらない

– 自己ループなし

jijii exbx

時系列(Hyvarinen et al., 2008;2010)

• LiNGAM+自己回帰モデル

– 瞬間的因果構造：LiNGAM

– 時間的決定関係：自己回帰モデル

– 測定間隔と相互作用のスピード

– 計量経済学• 構造型ベクトル自己回帰モデル

(Swanson & Granger, 1997)

)()()(0

x1(t)x1(t-1)

x2(t-1) x2(t)

e1(t-1)

e2(t-1)

仮定の評価

• ガウス性の検定– 観測変数や外生変数(誤差)の非ガウス性チェッ

(Moneta+, 13)

• 外生変数（誤差)間の独立性検定– 従属潜在共通原因あり (Entner+ 2011; 2012)

• 全体的な適合度– カイ二乗検定 (Shimizu & Kano, 2008)

• 参考: 統計的信頼性評価– ブートストラップ (Komatsu, Shimizu & Shimodaira, 2010)

Talk outline

1. 動機とフレームワーク: Done!

2. 因果方向推定の基本アイデア: Done!

– 潜在共通原因「なし」の場合を例に

3. 潜在共通原因「あり」の場合の因果方向推定

潜在共通原因がある場合

• 潜在共通原因を追加 (非ガウス)

qiqii exbfx 1

潜在共通原因がある場合のLiNGAMモデル (Hoyer, Shimizu+, 2008)

ただしは独立),,1( Qqfq

x1 x2 2e1e

独立としても一般性を失わない

独立な潜在共通原因

qiqii exbfx 1

x1 x2 2e1e

:1 fef

:2 fef

従属な潜在共通原因

識別可能: 方向が違えば分布が違う

• Hoyer, Shimizu, Kerminen and Palviainen (2008)

• 忠実性

orfQ f1 fQ

… …

2e1e2e1e

推定アプローチその１

• 潜在共通原因を陽にモデリングしてモデル選択

–最尤推定 or ベイズ推定 (Hoyer+, 2008; Henao & Winther,

–潜在共通原因の数を特定する必要 – 大変

f1 fQ…

潜在共通原因を陽にモデリングしないアプローチ

S. Shimizu and K. Bollen.

Journal of Machine Learning Research,

15: 2629-2652, 2014.

推定アプローチその２

観測は, 切片が異なるかもしれないLiNGAMモデルから生成される

m exbfx

Key idea (1/2)

• 潜在共通原因ありのLiNGAMの別の見方:

f1 fQ…

……

m-番目の観測:

Key idea (2/2)

• 潜在共通原因の和を, 観測固有の切片としてモデル化:

• 潜在共通原因を陽にモデリングしない

–潜在共通原因の数Qも係数も推定不要

m exbfx

m-番目の観測:

観測固有の切片

線形の場合は, 潜在共通原因fqの影響が切片の違いとして現れる

• 因果方向の異なるモデルを周辺尤度で比較:

• 追加パラメータたくさん

– 混合モデル(やマルチレベルモデル)と同様

• 観測固有の切片に事前分布 (informative)

• 他パラメータ not very informative: 分散の大きいガウス

• p(e1), p(e2): 後の実験ではラプラスで固定

ベイズでモデル選択38

),,1;2,1()( nmim

Model 3 (x1 x2)

Model 4 (x1 x2)

観測固有の切片の事前分布の一例

• 動機: 中心極限定理

– よりたくさんの独立な変数の和は, よりガウスに

• ベル型の分布で近似

– 後の実験では自由度は6に固定

• ハイパーパラメータも周辺尤度で選択: 経験ベイズ

• 小さい : 切片が似てる

t-分布 (標準偏差 , 相関 , 自由度 )12

)},(sd0.1,),(sd2.0,0{ lll xx }9.0,,1.0,0{12

(t-分布の代わりにガウス分布を使っても構いません)

社会学データで評価実験

社会学データ

• Source: General Social Survey (n=1380)

– Non-farm background, ages 35-44, white,

male, in the labor force, no missing data for

any of the covariates, 1972-2006

Status attainment model(Duncan et al., 1972)

x2: Son’s Income

潜在共通原因を陽にモデリングするアプローチと比較

Known (temporal)

orderings of 15 pairs

Son’s

Education

Father’s

Education

Son’s

Income

Father’s

Education

Son’s

Income

Son’s

Occupation

……

まとめ

• 因果分析の難しさ: 潜在共通原因

• 潜在共通原因があっても,

因果グラフを推定可能な場合がある– 線形, 非巡回, 非ガウス潜在共通原因なしの場合のような拡張はおそらく可能？

• Open problems:– 関数形をどこまで緩められるか?

– 離散の場合はどうなる? (プロビット? Cf. Muthen 02, BHMK)

• もっと適用例– Python code順次公開予定 (今夏)

構造方程式モデルによる因果探索と非ガウス性

Science

構造方程式モデルによるデータ生成過程の学習, 特に非ガウス性の利用

2.3 ガウス分布 #prmlrevenge

20161117 srws第三回検索その２PubMed検索、引用検索、逆引き検索と文献管理

Windows® 8.1 Pro - NECsupport.express.nec.co.jp/os/win81/os/Win8.1_S1.pdf④ 検索画面から[Windows 8.1]を検索します。 ⑤ [Windows 8.1 サポート情報]から該当するモデルのサポートキットを参照し、

检索功能 —— 论文检索、期刊检索、学位检索、会议检索、作者检索、机构检索、基金检索、关键词检索、中华医学会专区检索、中国医师协会专区检索、企业在线检索、医院空间检索

ガウス混合モデルによる軌道データセットを用いる …lab.cntl.kyutech.ac.jp/~nishida/paper/2017/2P2-F03.pdfガウス混合モデルによる軌道データセットを用いる

專利檢索 - tipo.gov.tw · 專利檢索與專利分析 3 圖1 專利檢索流程圖 1.確定檢索主題確定檢索主題乃是進行專利檢索的首要步驟，檢索者必須在專利檢索進行之前，對欲檢索之技術

取扱説明書小型アリカマホゾキリモデル 5520 モデル 55203 ...小型アリカマホゾキリモデル5520 モデル55203 このたびはマキタ小型アリカマホゾキリ

重イオン衝突における非ガウスゆらぎsoken.editorial/soken... · 北沢正清（阪大）重イオン衝突における非ガウスゆらぎ MK, Asakawa, Ono, arXiv:1307.2978

P 索引...索引バランスパッド ……………………………………18 バランスボード …………………………………245 バランスボール

Google搜索与 Inter网的信息检索

如何使用SciFinder获取科技信息 - library.fudan.edu.cn · 检索——文献检索文献检索方法 – 主题检索 – 作者名检索 – 机构名检索 – 文献标识符检索

19インチラック - Fujitsu...モデル2724 モデル2737 モデル2742 モデル2616 モデル2624 モデル2642 収容ユニット数 24U 37U 42U 16U 24U 42U 型名基本ラック

SEWM2010 信息检索评测 —— 文献检索

デジタルマスフローコントローラ - HoribaSEC-N106 デジタル・アナログ通信モデルデバイスネット通信モデルプロフィバス通信モデル DC24V駆動、電流／電圧制御モデル

2.5 ガウス (Gauss) の法則 - Osaka U

索引 · 2015-11-26 · 214 215 索引索引索引 hn1280－55l・・・・・・・・・・・・・・・・・・・・・・・ hn1280－600l

SASによる機械学習入門 - sas.com · • ベイジアン・ネットワーク • カーネル密度推定 • 主成分分析 • 特異値分解 • ガウス混合モデル

古典派モデル (1) 　基本モデル

13 ガウスの法則と導体 - Sophia University › wp-content › uploads › 2019 › 02 › ...13.2 ガウスの法則の応用 187 図13.2 ガウスの法則例1：一様な直線電荷のつくる電場