Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
デザイン行列について計算特訓第4回:補助資料3
土居正明
はじめに
0.1 前提知識など
本稿では、「デザイン行列とは何か?」についてご説明します。第4回その1「最尤推定量2(回帰分析)」については、
解説の部分を読まれていることを前提としてご説明します。また、基本的な行列計算も仮定しています。不安な方は第4回
その2「行列・最小2乗推定量の計算」の前半部分を先に解いてから読まれることをお勧めします。
0.2 本稿の流れ
回帰分析・分散分析(fixed effect model)・共分散分析・クロスオーバーの解析などについて順に見ていきますが、どの
モデルにも共通した流れとして
(i) データ・モデル式を縦に並べ、ベクトル表記する。
(ii) パラメータベクトル β を作る。
(iii)「平均部分」を β と行列Xの掛け算の形で表す。
として、(iii)で得られた行列Xをデザイン行列と呼びます。
1 その1:回帰分析
1.1 具体例(単回帰分析)
まずは回帰分析についてです。「最尤推定量2」の解説部分でデータ
表 1 3人の収縮期血圧と年齢のデータ(iは被験者番号)
被験者番号 (i) 年齢 (xi) 収縮期血圧 (yi)
1 20 110
2 40 130
3 60 170
に対して、モデル
yi = a + bxi + εi (yi :被験者 iの収縮期血圧、xi :被験者 iの年齢、a, b : 定数、εi:被験者 iの誤差) (1)
をあてはめました。通常、誤差 εi には平均 0を仮定しますので、yi の平均は E[yi] = a + bxi となります。これを用いて、
右辺は「平均部分:a + bxi」と「誤差部分:εi」とに分解できます*1。
さて、(1)を全データに対して並べると
被験者番号 1: y1 = a + bx1 + ε1
*1 「平均部分」「誤差部分」という言葉は私の造語なので、他の方には通じません。ご注意ください。
1
被験者番号 2: y2 = a + bx2 + ε2
被験者番号 3: y3 = a + bx3 + ε3
と書けます。さらに数値をあてはめると
被験者番号 1: 110 = a + 20b + ε1
被験者番号 2: 130 = a + 40b + ε2
被験者番号 3: 170 = a + 60b + ε3
となります。デザイン行列とは、この「平均部分」を行列・ベクトルを用いてまとめたものです。まずはいくつかベクトル
を定義します。
y =
y1
y2
y3
=
110130170
, ε =
ε1ε2ε3
(2)
とおきます。このとき、(1)をベクトル表示すると y1
y2
y3
=
a + 20ba + 40ba + 60b
︸ ︷︷ ︸
平均部分
+
ε1ε2ε3
︸ ︷︷ ︸誤差部分
より、(2)を用いて
y =
a + 20ba + 40ba + 60b
+ ε (3)
と書けます。ここでさらに「平均部分」 a + 20ba + 40ba + 60b
(4)
の部分をまとめましょう。ポイントは「推定したいのは a, bの2つ」ということです。ですので、この2つを
β =(
ab
)とまとめて、(4)を表現しようとします。そうすると a + 20b
a + 40ba + 60b
=
1 · a + 20 · b1 · a + 40 · b1 · a + 60 · b
=
1 201 401 60
(ab
)=
1 201 401 60
β
と表現できます。これより、(3)をまとめると
y =
1 201 401 60
β + ε
となります。ここで最後まで残った行列にXという名前をつけてやり
X =
1 201 401 60
としたとき、このXのことをこの回帰分析モデルのデザイン行列と呼びます。このとき、結局 (1)は最もまとまった形で
y = Xβ + ε
と書けます。
2
1.2 具体例(重回帰分析)
では次に、説明変数が複数ある重回帰分析の具体例を見ます。本質的な部分は単回帰とほとんど同じです。
データは以下の通りとします。
表 2 4人の収縮期血圧と年齢のデータ(j は被験者番号)
被験者番号 (j) 年齢 (x1j) 1日の塩分摂取量 (x2j) 収縮期血圧 (yj)
1 20 10 110
2 40 15 130
3 50 22 165
4 60 12 170
に対して、モデル
yj = a + b1x1j + b2x2j + εj
を当てはめます。ここで単回帰と同じく、εj の平均は 0を仮定します。ここで、このモデルを用いてベクトル表記すると110130165170
=
a + 20b1 + 10b2
a + 40b1 + 15b2
a + 50b1 + 22b2
a + 60b1 + 12b2
︸ ︷︷ ︸
平均部分
+
ε1ε2ε3ε4
︸ ︷︷ ︸誤差部分
(5)
とおけます。ここで、ベクトルを
y =
y1
y2
y3
y4
=
110130165170
, ε =
ε1ε2ε3ε4
とおき、さらにパラメータも
β =
ab1
b2
とおくと、平均部分は
a + 20b1 + 10b2
a + 40b1 + 15b2
a + 50b1 + 22b2
a + 60b1 + 12b2
=
1 20 101 40 151 50 221 60 12
a
b1
b2
=
1 20 101 40 151 50 221 60 12
β
となるので、残った行列を
X =
1 20 101 40 151 50 221 60 12
3
とおくと、(5)は
y =
a + 20b1 + 10b2
a + 40b1 + 15b2
a + 50b1 + 22b2
a + 60b1 + 12b2
+ ε
y =
1 20 101 40 151 50 221 60 12
a
b1
b2
+ ε
y = Xβ + ε
となります。このとき、
X =
1 20 101 40 151 50 221 60 12
がデザイン行列となります。
1.3 一般論
では次に文字を使った一般形で表現しておきます。一般形なので、説明変数を複数とした重回帰分析を扱います。被説明
変数 yi に対して、説明変数(要因)が k 個あるとします。
表 3 n人の収縮期血圧と年齢のデータ (j は被験者番号)
被験者番号 (j) 説明変数1 (x1j) 説明変数2 (x2j) · · · 説明変数 k (xkj) 被説明変数 (yj)
1 x11 x21 · · · xk1 y1
2 x12 x22 · · · xk2 y2
3 x13 x23 · · · xk3 y3
......
... · · ·...
...
n x1n x2n · · · xkn yn
ここで、モデル
yj = a + b1x1j + b2x2j + · · · bkxkj + εj (6)
を当てはめます。今までと同様に εi の平均は 0を仮定します。このとき、このモデルを用いてベクトル表記するとy1
y2
...yn
=
a + b1x11 + b2x21 + · · · + bkxk1
a + b1x12 + b2x22 + · · · + bkxk2
...a + b1x1n + b2x2n + · · · + bkxkn
︸ ︷︷ ︸
平均部分
+
ε1ε2...
εn
︸ ︷︷ ︸誤差部分
(7)
とおけます。今までと同様、
y =
y1
y2
...yn
, ε =
ε1ε2...
εn
, β =
ab1
...bk
4
とおくと、(7)は
y =
a + b1x11 + b2x21 + · · · + bkxk1
a + b1x12 + b2x22 + · · · + bkxk2
...a + b1x1n + b2x2n + · · · + bkxkn
+ ε
=
1 x11 x21 · · · xk1
1 x12 x22 · · · xk2
...... · · ·
...1 x1n x2n · · · xkn
ab1
...bk
+ ε
=
1 x11 x21 · · · xk1
1 x12 x22 · · · xk2
...... · · ·
...1 x1n x2n · · · xkn
β + ε
となります。これより、
X =
1 x11 x21 · · · xk1
1 x12 x22 · · · xk2
...... · · ·
...1 x1n x2n · · · xkn
とおくと、このXがこのモデルのデザイン行列です。
2 その2:分散分析
次に、分散分析を考えます。分散分析はパターンが多く面倒ですが、一つ一つ見ていきます。
2.1 一元配置
まずは一元配置です。以下のデータを用います。薬剤群3群でそれぞれ3例、2例、4例の場合とします。1:プラセボ群、
2:10mg群、3:20mg群と考えてください。
表 4 3群の比較
薬剤群 (i) 群内被験者番号 (j) コレステロール低下量 (yij)
1 1 0
1 2 5
1 3 −2
2 1 11
2 2 13
3 1 30
3 2 35
3 3 19
3 4 31
ここで、データはそれぞれ各群の平均値を µ1, µ2, µ3 として、分散の等しい正規分布に従う、つまり
y1j ~ N(µ1, σ2), y2j ~ N(µ2, σ
2), y3j ~ N(µ3, σ2) (8)
とします。
5
2.1.1 一元配置1(最も簡単なモデル)
ではまず、最も簡単なモデルで考えます。(8)を書き直すと
y1j = µ1 + ε1j (ε1j ~ N(0, σ2))
y2j = µ2 + ε2j (ε2j ~ N(0, σ2))
y3j = µ3 + ε3j (ε3j ~ N(0, σ2))
とおけます*2。さらにまとめますと
yij = µi + εij (εij ~ N(0, σ2)) (9)
のように書けます。
さて、このとき回帰分析の場合と同様にモデルをベクトルの形で書いていくことにしましょう。まず最初にデータを全て
並べ
0 = µ1 + ε115 = µ1 + ε12−2 = µ1 + ε1311 = µ2 + ε2113 = µ2 + ε2230 = µ3 + ε3135 = µ3 + ε3219 = µ3 + ε3331 = µ3 + ε34
=⇒
y11 = µ1 + ε11y12 = µ1 + ε12y13 = µ1 + ε13y21 = µ2 + ε21y22 = µ2 + ε22y31 = µ3 + ε31y32 = µ3 + ε32y33 = µ3 + ε33y34 = µ3 + ε34
とおきます。次にこれをベクトルを用いて書きなおしますと
y11
y12
y13
y21
y22
y31
y32
y33
y34
=
µ1
µ1
µ1
µ2
µ2
µ3
µ3
µ3
µ3
︸ ︷︷ ︸平均部分
+
ε11ε12ε13ε21ε22ε31ε32ε33ε34
︸ ︷︷ ︸誤差部分
(10)
とおきます。
ここで、回帰分析と同様にベクトルを
y =
y11
y12
y13
y21
y22
y31
y32
y33
y34
, ε =
ε11ε12ε13ε21ε22ε31ε32ε33ε34
, β =
µ1
µ2
µ3
とおきます。
では次に平均部分を見ていくことにします。平均部分はベクトルの各要素に µ1, µ2, µ3 の1つずつしか現れない点が回帰
分析と違いますので、ここをたとえば「µ1 = 1 · µ1 + 0 · µ2 + 0 · µ3」という風に処理してやります。すると、回帰分析と同
*2 正規分布の一般的性質として x ~ N(0, σ2)のときに、定数 aを持ってくると x + a ~ N(a, σ2)となることを逆方向に用いています。
6
様に
µ1
µ1
µ1
µ2
µ2
µ3
µ3
µ3
µ3
=
1 · µ1 + 0 · µ2 + 0 · µ3
1 · µ1 + 0 · µ2 + 0 · µ3
1 · µ1 + 0 · µ2 + 0 · µ3
0 · µ1 + 1 · µ2 + 0 · µ3
0 · µ1 + 1 · µ2 + 0 · µ3
0 · µ1 + 0 · µ2 + 1 · µ3
0 · µ1 + 0 · µ2 + 1 · µ3
0 · µ1 + 0 · µ2 + 1 · µ3
0 · µ1 + 0 · µ2 + 1 · µ3
=
1 0 01 0 01 0 00 1 00 1 00 0 10 0 10 0 10 0 1
µ1
µ2
µ3
=
1 0 01 0 01 0 00 1 00 1 00 0 10 0 10 0 10 0 1
β
となり、
X =
1 0 01 0 01 0 00 1 00 1 00 0 10 0 10 0 10 0 1
(11)
とおくと、(10)は
y = Xβ
と表せ、Xがデザイン行列となります。
2.1.2 一元配置2(制約条件が必要なモデル)
次に、同じデータに対してモデルを変更しましょう。平均値 µ1, µ2, µ3 により細かい構造を入れていきます。
µ1 = µ + α1
µ2 = µ + α2
µ3 = µ + α3
のように、各 µi を「全群に共通の定数:µ」と「群ごとに異なる定数:α1, α2, α3」に分けるのです。つまり、(9)に対応
する形で書きますと
yij = µ + αi + εij (εij ~ N(0, σ2)) (12)
と書けます。
ただしここで困ったことが一つ起こるのです。それは前のモデル (9) では µ1, µ2, µ3 のパラメータ3つでちょうどよ
かったのが、今回のモデル (12)では µ, α1, α2, α3 の4つになってしまい、パラメータの数が多すぎるようになってしま
うことです*3。
*3 大体、以下のようなイメージを持ってください。連立方程式 µ1 + µ2 + µ3 = 10µ1 + 2µ2 + 3µ3 = 20−µ1 + 3µ2 − µ3 = 0
は「文字3つ式3つ」であり、(無意味な式が1つもないので)解が一つに定まります。ところがここで、今回のように µ1 = µ + α1, µ2 =
µ + α2, µ3 = µ + α3 としてしまうと、上の式は (µ + α1) + (µ + α2) + (µ + α3) = 10(µ + α1) + 2(µ + α2) + 3(µ + α3) = 20−(µ + α1) + 3(µ + α2) − (µ + α3) = 0
=⇒
3µ + α1 + α2 + α3 = 106µ + α1 + 2α2 + 3α3 = 20µ + α1 + 3α2 − α3 = 0
となって、「文字4つ、式3つ」ですので、文字の数に対して式の数が少な過ぎて、解が一つでなくなってしまいます。このようなことが起きているのだ、と思ってください。
7
この問題の対処法としては、「式を1つ増やして、文字を1つ消す」という方法がとられます。その式のことを制約条
件と言い、主に用いられるのはたとえば、ni を第 i群の例数を表すとして、
(制約条件1): α1 + α2 + α3 = 0 (αiを全部足して 0)(制約条件2): α3 = 0 (αiの一番最後が 0)(制約条件3):n1α1 + n2α2 + n3α3 = 0 (niαiを全部足して 0)
の3種類のうちのどれかです。本稿では、それぞれの制約条件の内容・利点欠点については述べずに、デザイン行列の形の
みを述べることにします。
(12)をベクトル表記するところまでは共通なのでそこまではやってしまいますと、
y11
y12
y13
y21
y22
y31
y32
y33
y34
=
µ + α1
µ + α1
µ + α1
µ + α2
µ + α2
µ + α3
µ + α3
µ + α3
µ + α3
+
ε11ε12ε13ε21ε22ε31ε32ε33ε34
(13)
となります。そして、パラメータは µ, α1, α2, α3の4つあるのですが、以下パラメータ α3 を消す、という方針で考えます
ので、
β =
µα1
α2
とおきます。
2.1.3 制約条件1:∑i
αi = 0のとき
では最初の制約条件 α1 + α2 + α3 = 0です。これを用いると
α3 = −α1 − α2
となって α3 が消せます。こよれり、(13)は
y11
y12
y13
y21
y22
y31
y32
y33
y34
=
µ + α1
µ + α1
µ + α1
µ + α2
µ + α2
µ − α1 − α2
µ − α1 − α2
µ − α1 − α2
µ − α1 − α2
︸ ︷︷ ︸
平均部分
+
ε11ε12ε13ε21ε22ε31ε32ε33ε34
︸ ︷︷ ︸誤差部分
となり、平均部分は
µ + α1
µ + α1
µ + α1
µ + α2
µ + α2
µ − α1 − α2
µ − α1 − α2
µ − α1 − α2
µ − α1 − α2
=
1 · µ + 1 · α1 + 0 · α2
1 · µ + 1 · α1 + 0 · α2
1 · µ + 1 · α1 + 0 · α2
1 · µ + 0 · α1 + 1 · α2
1 · µ + 0 · α1 + 1 · α2
1 · µ − 1 · α1 − 1 · α2
1 · µ − 1 · α1 − 1 · α2
1 · µ − 1 · α1 − 1 · α2
1 · µ − 1 · α1 − 1 · α2
=
1 1 01 1 01 1 01 0 11 0 11 −1 −11 −1 −11 −1 −11 −1 −1
µα1
α2
=
1 1 01 1 01 1 01 0 11 0 11 −1 −11 −1 −11 −1 −11 −1 −1
β
8
となり、
X =
1 1 01 1 01 1 01 0 11 0 11 −1 −11 −1 −11 −1 −11 −1 −1
とおくと、このXがデザイン行列となります。
2.1.4 制約条件2:αi の最後が 0のとき
次の制約条件は α3 = 0です。これは単に α3 を消すだけですので大変簡単です。(13)は
y11
y12
y13
y21
y22
y31
y32
y33
y34
=
µ + α1
µ + α1
µ + α1
µ + α2
µ + α2
µµµµ
+
ε11ε12ε13ε21ε22ε31ε32ε33ε34
=⇒ y =
1 · µ + 1 · α1 + 0 · α2
1 · µ + 1 · α1 + 0 · α2
1 · µ + 1 · α1 + 0 · α2
1 · µ + 0 · α1 + 1 · α2
1 · µ + 0 · α1 + 1 · α2
1 · µ + 0 · α1 + 0 · α2
1 · µ + 0 · α1 + 0 · α2
1 · µ + 0 · α1 + 0 · α2
1 · µ + 0 · α1 + 0 · α2
+ ε
=⇒ y =
1 1 01 1 01 1 01 0 11 0 11 0 01 0 01 0 01 0 0
µα1
α2
+ ε
=⇒ y =
1 1 01 1 01 1 01 0 11 0 11 0 01 0 01 0 01 0 0
β + ε
より、
X =
1 1 01 1 01 1 01 0 11 0 11 0 01 0 01 0 01 0 0
とおくと、Xがデザイン行列です。
9
2.1.5 制約条件3:∑i
niαi = 0のとき
最後の制約条件は n1α1 + n2α2 + n3α3 = 0 ですが、今回は「第1群:3例、第2群:2例、第3群:4例」なので、
3α1 + 2α2 + 4α3 = 0です。これを変形すると
α3 = −34α1 −
12α2
となり、α3 が消せます。このとき (13)は
y11
y12
y13
y21
y22
y31
y32
y33
y34
=
µ + α1
µ + α1
µ + α1
µ + α2
µ + α2
µ − 34α1 − 1
2α2
µ − 34α1 − 1
2α2
µ − 34α1 − 1
2α2
+
ε11ε12ε13ε21ε22ε31ε32ε33ε34
=⇒ y =
1 · µ + 1 · α1 + 0 · α2
1 · µ + 1 · α1 + 0 · α2
1 · µ + 1 · α1 + 0 · α2
1 · µ + 0 · α1 + 1 · α2
1 · µ + 0 · α1 + 1 · α2
1 · µ − 34 · α1 − 1
2 · α2
1 · µ − 34 · α1 − 1
2 · α2
1 · µ − 34 · α1 − 1
2 · α2
+ ε
=⇒ y =
1 1 0
1 1 0
1 1 0
1 0 1
1 0 1
1 −34 −1
2
1 −34 −1
2
1 −34 −1
2
1 −34 −1
2
µα1
α2
+ ε
10
となるので y =
1 1 0
1 1 0
1 1 0
1 0 1
1 0 1
1 − 34 − 1
2
1 − 34 − 1
2
1 − 34 − 1
2
1 − 34 − 1
2
β + ε となり、 X =
1 1 0
1 1 0
1 1 0
1 0 1
1 0 1
1 −34 − 1
2
1 −34 − 1
2
1 −34 − 1
2
1 −34 − 1
2
とおくと、このXがデザイン行列と
なります。
2.2 二元配置
2.2.1 交互作用なしのモデル
では同様に二元配置を考えます。一元配置とは説明変数が「薬剤群だけ」の場合でしたが、今度は説明変数として「薬剤
群(3群)」と「喫煙の有無」の2つを考えます。ここで、
表 5 3群の比較 (j = 1 : 喫煙あり, j = 2 : 喫煙なし)
薬剤群 (i) 喫煙の有無 (j) 群内被験者番号 (k) コレステロール低下量 (yijk)
1 1 1 0
1 1 2 5
1 2 3 −2
2 1 1 11
2 2 2 13
3 1 1 30
3 2 2 35
3 2 3 19
3 2 4 31
y11k ~ N(µ11, σ2), y12k ~ N(µ12, σ
2), y13k ~ N(µ13, σ2)
y21k ~ N(µ21, σ2), y22k ~ N(µ22, σ
2), y23k ~ N(µ23, σ2)
を仮定します。ここで各 µij の中身をより詳しく見ていきます。
最初に交互作用なしのモデルですが、これは「全体の効果」=「薬剤の効果」+「喫煙の効果」と2つの効果の足し算で
表される場合のモデルです。式で書きますと「薬剤第 i群の影響:αi」と「喫煙の有無 j 群の影響:βj」を用いて
yijk = µ + αi + βj + εijk
11
のように表されます。これを用いて、各データをベクトル表記すると
y111
y112
y121
y211
y221
y311
y321
y322
y323
=
µ + α1 + β1
µ + α1 + β1
µ + α1 + β2
µ + α2 + β1
µ + α2 + β2
µ + α3 + β1
µ + α3 + β2
µ + α3 + β2
µ + α3 + β2
+
ε111ε112ε121ε211ε221ε311ε321ε322ε323
(14)
となります。今回も一元配置と同様に制約条件を考えますが、ページ数が現時点でも多くなりすぎていますので、
α1 + α2 + α3 = 0と β1 = β2 = 0のみ入れることにします*4。
一元配置と同様に各パラメータの最後の文字を消すようにします。すると
α3 = −α1 − α2, β2 = −β1
となりますので、α3, β2 の2つを消していきます。このとき、パラメータベクトルはこの2つを除いた
β =
µα1
α2
β1
とし、(15)の平均部分のみに注目しますと
µ + α1 + β1
µ + α1 + β1
µ + α1 + β2
µ + α2 + β1
µ + α2 + β2
µ + α3 + β1
µ + α3 + β2
µ + α3 + β2
µ + α3 + β2
=⇒
µ + α1 + β1
µ + α1 + β1
µ + α1 − β1
µ + α2 + β1
µ + α2 − β1
µ − α1 − α2 + β1
µ − α1 − α2 − β1
µ − α1 − α2 − β1
µ − α1 − α2 − β1
=⇒
1 · µ + 1 · α1 + 0 · α2 + 1 · β1
1 · µ + 1 · α1 + 0 · α2 + 1 · β1
1 · µ + 1 · α1 + 0 · α2 − 1 · β1
1 · µ + 0 · α1 + 1 · α2 + 1 · β1
1 · µ + 0 · α1 + 1 · α2 − 1 · β1
1 · µ − 1 · α1 − 1 · α2 + 1 · β1
1 · µ − 1 · α1 − 1 · α2 − 1 · β1
1 · µ − 1 · α1 − 1 · α2 − 1 · β1
1 · µ − 1 · α1 − 1 · α2 − 1 · β1
=⇒
1 1 0 11 1 0 11 1 0 −11 0 1 11 0 1 −11 −1 −1 11 −1 −1 −11 −1 −1 −11 −1 −1 −1
µα1
α2
β1
=⇒
1 1 0 11 1 0 11 1 0 −11 0 1 11 0 1 −11 −1 −1 11 −1 −1 −11 −1 −1 −11 −1 −1 −1
β
となりますので、
X =
1 1 0 11 1 0 11 1 0 −11 0 1 11 0 1 −11 −1 −1 11 −1 −1 −11 −1 −1 −11 −1 −1 −1
とおくと、Xがデザイン行列です。
*4 2元配置の交互作用なしの場合の制約条件は、α1 に1つ、βj に1つの計2つ必要です。
12
2.2.2 交互作用ありのモデル
次に、交互作用ありのモデルを考えます。データは以下の通りです。薬剤3群と喫煙歴3群で考えます。これに対し
表 6 3群の比較 (j = 1 : 現在喫煙あり, j = 2 : 現在喫煙なし・喫煙歴あり, j = 3 : 喫煙なし)
薬剤群 (i) 喫煙歴 (j) 群内被験者番号 (k) コレステロール低下量 (yijk)
1 1 1 0
1 1 2 3
1 2 1 −2
1 2 2 −2
1 3 1 −5
1 3 2 −10
2 1 1 3
2 1 2 5
2 2 1 7
2 2 2 10
2 3 1 11
2 3 2 13
3 1 1 7
3 1 2 8
3 2 1 10
3 2 2 15
3 3 1 20
3 3 2 30
て、「薬の効果」と「喫煙歴の効果」の足し算だけでない部分がある以下のモデルを考えます。ここで、薬の効果:αi や
喫煙歴の効果:βj をそれぞれ「主効果」と呼び、その足し算では表現できない部分:γij のことを薬と喫煙の「交互作用」と
呼びます。
yijk = µ + αi + βj + γij + εijk (εijk ~ N(0, σ2)) (15)
であり、εijk はそれぞれ独立であると仮定します。このとき、データを縦に並べると
0 = µ + α1 + β1 + γ11 + ε1113 = µ + α1 + β1 + γ11 + ε1122 = µ + α1 + β2 + γ12 + ε121−2 = µ + α1 + β2 + γ12 + ε122−5 = µ + α1 + β3 + γ13 + ε131−10 = µ + α1 + β3 + γ13 + ε1323 = µ + α2 + β1 + γ21 + ε2115 = µ + α2 + β1 + γ21 + ε2127 = µ + α2 + β2 + γ22 + ε22110 = µ + α2 + β2 + γ22 + ε22211 = µ + α2 + β3 + γ23 + ε23113 = µ + α2 + β3 + γ23 + ε2327 = µ + α3 + β1 + γ31 + ε3118 = µ + α3 + β1 + γ31 + ε31210 = µ + α3 + β2 + γ32 + ε32115 = µ + α3 + β2 + γ32 + ε32220 = µ + α3 + β3 + γ33 + ε33130 = µ + α3 + β3 + γ33 + ε331
=⇒
y111 = µ + α1 + β1 + γ11 + ε111y112 = µ + α1 + β1 + γ11 + ε112y121 = µ + α1 + β2 + γ12 + ε121y122 = µ + α1 + β2 + γ12 + ε122y131 = µ + α1 + β3 + γ13 + ε131y132 = µ + α1 + β3 + γ13 + ε132y211 = µ + α2 + β1 + γ21 + ε211y212 = µ + α2 + β1 + γ21 + ε212y221 = µ + α2 + β2 + γ22 + ε221y222 = µ + α2 + β2 + γ22 + ε222y231 = µ + α2 + β3 + γ23 + ε231y232 = µ + α2 + β3 + γ23 + ε232y311 = µ + α3 + β1 + γ31 + ε311y312 = µ + α3 + β1 + γ31 + ε312y321 = µ + α3 + β2 + γ32 + ε321y322 = µ + α3 + β2 + γ32 + ε322y331 = µ + α3 + β3 + γ33 + ε331y332 = µ + α3 + β3 + γ33 + ε331
13
となります。ベクトル表記すると
y111
y112
y121
y122
y131
y132
y211
y212
y221
y222
y231
y232
y311
y312
y321
y322
y331
y332
=
µ + α1 + β1 + γ11
µ + α1 + β1 + γ11
µ + α1 + β2 + γ12
µ + α1 + β2 + γ12
µ + α1 + β3 + γ13
µ + α1 + β3 + γ13
µ + α2 + β1 + γ21
µ + α2 + β1 + γ21
µ + α2 + β2 + γ22
µ + α2 + β2 + γ22
µ + α2 + β3 + γ23
µ + α2 + β3 + γ23
µ + α3 + β1 + γ31
µ + α3 + β1 + γ31
µ + α3 + β2 + γ32
µ + α3 + β2 + γ32
µ + α3 + β3 + γ33
µ + α3 + β3 + γ33
+
ε111ε112ε121ε122ε131ε132ε211ε212ε221ε222ε231ε232ε311ε312ε321ε322ε331ε332
ここで制約条件を入れますが、制約条件は主効果と交互作用の両方に考えてやらないといけません。また、制約条件の入
れ方は色々ありますが、ページ数などの都合により、今回は1種類のみを考えます。
(i) 主効果 αi と βj については、交互作用なしの場合と同じく α1 + α2 + α3 = 0, β1 + β2 + β3 = 0を考えます。
(ii) 交互作用については、薬剤群1群につき1つ・喫煙群1群につき1つ考えます。つまり、順番に番号を振ると
(a) γ11 + γ12 + γ13 = 0, (b) γ21 + γ22 + γ23 = 0, (c) γ31 + γ32 + γ33 = 0
(d) γ11 + γ21 + γ31 = 0, (e) γ12 + γ22 + γ32 = 0, (f) γ13 + γ23 + γ33 = 0
の6つの式を考えます。実はこれらは6個あるのですが、実質5個分しかないのです*5*6。
これらを考えます。(i)の方は、今までと同じく α3 = −α1 − α2, β3 = −β1 − β2 となります。次に (ii)ですが、γij が3
×3=9個あり、制約条件の式が実質5個あります。式1個につき文字1個が減りますので、文字は9-5=4個残ります。
残す文字を γ11, γ12, γ21, γ22 とすると
γ13 = −γ11 − γ12, γ31 = −γ11 − γ21, γ23 = −γ21 − γ22, γ32 = −γ12 − γ22, γ33 = γ11 + γ21 + γ12 + γ22
となり、他の要素が全てこの4つで表わされます。これより、パラメータベクトルは
β =
µα1
α2
β1
β2
γ11
γ12
γ21
γ22
*5 (a)+(b)+(c)-(d)-(f) を考えると、(e) に一致しています。つまり、(e) はそれ以外のものから作り出されてしまうものなので、なくても全く問題ない、というか、あっても γ11, · · · , γ33 に関する情報量が増えていない、ということなのです。
*6 一般の二元配置の場合、薬剤群が全 I 群、喫煙群が全 J 群であるとき、制約条件は実質 I + J − 1個 となります。そのため、残る文字は IJ − (I + J − 1) = (I − 1)(J − 1)個となります。
14
とおけます。このとき、モデルの平均部分を変形していきますと*7
µ + α1 + β1 + γ11
µ + α1 + β1 + γ11
µ + α1 + β2 + γ12
µ + α1 + β2 + γ12
µ + α1 + β3 + γ13
µ + α1 + β3 + γ13
µ + α2 + β1 + γ21
µ + α2 + β1 + γ21
µ + α2 + β2 + γ22
µ + α2 + β2 + γ22
µ + α2 + β3 + γ23
µ + α2 + β3 + γ23
µ + α3 + β1 + γ31
µ + α3 + β1 + γ31
µ + α3 + β2 + γ32
µ + α3 + β2 + γ32
µ + α3 + β3 + γ33
µ + α3 + β3 + γ33
=
µ + α1 + β1 + γ11
µ + α1 + β1 + γ11
µ + α1 + β2 + γ12
µ + α1 + β2 + γ12
µ + α1 − β1 − β2 − γ11 − γ12
µ + α1 − β1 − β2 − γ11 − γ12
µ + α2 + β1 + γ21
µ + α2 + β1 + γ21
µ + α2 + β2 + γ22
µ + α2 + β2 + γ22
µ + α2 − β1 − β2 − γ21 − γ22
µ + α2 − β1 − β2 − γ21 − γ22
µ − α1 − α2 + β1 − γ11 − γ21
µ − α1 − α2 + β1 − γ11 − γ21
µ − α1 − α2 + β2 − γ12 − γ22
µ − α1 − α2 + β2 − γ12 − γ22
µ − α1 − α2 − β1 − β2 + γ11 + γ12 + γ21 + γ22
µ − α1 − α2 − β1 − β2 + γ11 + γ12 + γ21 + γ22
=
1 · µ + 1 · α1 + 0 · α2 + 1 · β1 + 0 · β2 + 1 · γ11 + 0 · γ12 + 0 · γ21 + 0 · γ22
1 · µ + 1 · α1 + 0 · α2 + 1 · β1 + 0 · β2 + 1 · γ11 + 0 · γ12 + 0 · γ21 + 0 · γ22
1 · µ + 1 · α1 + 0 · α2 + 0 · β1 + 1 · β2 + 0 · γ11 + 1 · γ12 + 0 · γ21 + 0 · γ22
1 · µ + 1 · α1 + 0 · α2 + 0 · β1 + 1 · β2 + 0 · γ11 + 1 · γ12 + 0 · γ21 + 0 · γ22
1 · µ + 1 · α1 + 0 · α2 − 1 · β1 − 1 · β2 − 1 · γ11 − 1 · γ12 + 0 · γ21 + 0 · γ22
1 · µ + 1 · α1 + 0 · α2 − 1 · β1 − 1 · β2 − 1 · γ11 − 1 · γ12 + 0 · γ21 + 0 · γ22
1 · µ + 0 · α1 + 1 · α2 + 1 · β1 + 0 · β2 + 0 · γ11 + 0 · γ12 + 1 · γ21 + 0 · γ22
1 · µ + 0 · α1 + 1 · α2 + 1 · β1 + 0 · β2 + 0 · γ11 + 0 · γ12 + 1 · γ21 + 0 · γ22
1 · µ + 0 · α1 + 1 · α2 + 0 · β1 + 1 · β2 + 0 · γ11 + 0 · γ12 + 0 · γ21 + 1 · γ22
1 · µ + 0 · α1 + 1 · α2 + 0 · β1 + 1 · β2 + 0 · γ11 + 0 · γ12 + 0 · γ21 + 1 · γ22
1 · µ + 0 · α1 + 1 · α2 − 1 · β1 − 1 · β2 + 0 · γ11 + 0 · γ12 − 1 · γ21 − 1 · γ22
1 · µ + 0 · α1 + 1 · α2 − 1 · β1 − 1 · β2 + 0 · γ11 + 0 · γ12 − 1 · γ21 − 1 · γ22
1 · µ − 1 · α1 − 1 · α2 + 1 · β1 + 0 · β2 − 1 · γ11 − 1 · γ12 + 0 · γ21 + 0 · γ22
1 · µ − 1 · α1 − 1 · α2 + 1 · β1 + 0 · β2 − 1 · γ11 − 1 · γ12 + 0 · γ21 + 0 · γ22
1 · µ − 1 · α1 − 1 · α2 + 0 · β1 + 1 · β2 + 0 · γ11 + 0 · γ12 − 1 · γ21 − 1 · γ22
1 · µ − 1 · α1 − 1 · α2 + 0 · β1 + 1 · β2 + 0 · γ11 + 0 · γ12 − 1 · γ21 − 1 · γ22
1 · µ − 1 · α1 − 1 · α2 − 1 · β1 − 1 · β2 + 1 · γ11 + 1 · γ12 + 1 · γ21 + 1 · γ22
1 · µ − 1 · α1 − 1 · α2 − 1 · β1 − 1 · β2 + 1 · γ11 + 1 · γ12 + 1 · γ21 + 1 · γ22
=
1 1 0 1 0 1 0 0 01 1 0 1 0 1 0 0 01 1 0 0 1 0 1 0 01 1 0 0 1 0 1 0 01 1 0 −1 −1 −1 −1 0 01 1 0 −1 −1 −1 −1 0 01 0 1 1 0 0 0 1 01 0 1 1 0 0 0 1 01 0 1 0 1 0 0 0 11 0 1 0 1 0 0 0 11 0 1 −1 −1 0 0 −1 −11 0 1 −1 −1 0 0 −1 −11 −1 −1 1 0 −1 0 −1 01 −1 −1 1 0 −1 0 −1 01 −1 −1 0 −1 0 −1 0 −11 −1 −1 0 −1 0 −1 0 −11 −1 −1 −1 −1 1 1 1 11 −1 −1 −1 −1 1 1 1 1
µα1
α2
β1
β2
γ11
γ12
γ21
γ22
*7 見やすさのため、ベクトル・行列中に投与群ごとに横線を引いていきます。
15
より、
X =
1 1 0 1 0 1 0 0 01 1 0 1 0 1 0 0 01 1 0 0 1 0 1 0 01 1 0 0 1 0 1 0 01 1 0 −1 −1 −1 −1 0 01 1 0 −1 −1 −1 −1 0 01 0 1 1 0 0 0 1 01 0 1 1 0 0 0 1 01 0 1 0 1 0 0 0 11 0 1 0 1 0 0 0 11 0 1 −1 −1 0 0 −1 −11 0 1 −1 −1 0 0 −1 −11 −1 −1 1 0 −1 0 −1 01 −1 −1 1 0 −1 0 −1 01 −1 −1 0 −1 0 −1 0 −11 −1 −1 0 −1 0 −1 0 −11 −1 −1 −1 −1 1 1 1 11 −1 −1 −1 −1 1 1 1 1
とおくと、Xがデザイン行列となります。
2.3 分散分析(制約条件あり)のまとめ
制約条件のある分散分析モデルの流れを整理しておきます。
(i) 制約条件なしのモデルをベクトル表記する。
(ii) 制約条件を用いてパラメータ1つを消す。
(iii) 平均部分をXβ の形で表す。
の順で、デザイン行列Xが得られます。
3 その3:共分散分析
次に、共分散分析を考えます。実は、共分散分析のデザイン行列は分散分析と回帰分析を合わせたものになっています。
表 7 収縮期血圧と年齢のデータ
薬剤群 (i) 被験者番号 (j) 年齢 (xij) 収縮期血圧 (yij)
1 1 20 110
1 2 40 131
1 3 60 172
2 1 30 139
2 2 50 161
2 3 60 203
このデータに対して、薬剤群ごとに傾きの等しい直線を当てはめます。
(第1群):y1j = µ + a + bx1j + ε1j (ε1j ~ N(0, σ2))
(第2群):y2j = µ + bx2j + ε2j (ε2j ~ N(0, σ2))
ここで、切片のパラメータは µ, aの2つであり*8、傾きは両群共通の bです。
*8 このパラメータ数は、群の数と同じになります。
16
これに対して、データを並べると
110 = µ + a + 20b + ε11131 = µ + a + 40b + ε12172 = µ + a + 60b + ε13139 = µ + 30b + ε21161 = µ + 50b + ε22203 = µ + 60b + ε23
=⇒
y11 = µ + a + bx11 + ε11y12 = µ + a + bx12 + ε12y13 = µ + a + bx13 + ε13y21 = µ + bx21 + ε21y22 = µ + bx22 + ε22y23 = µ + bx23 + ε23
ベクトル表記すると y11
y12
y13
y21
y22
y23
=
µ + a + 20bµ + a + 40bµ + a + 60bµ + 30bµ + 50bµ + 60b
+
ε11ε12ε13ε21ε22
これに対して、パラメータベクトルを
β =
µab
とおくと、平均部分は
µ + a + 20bµ + a + 40bµ + a + 60bµ + 30bµ + 50bµ + 60b
=
1 · µ + 1 · a + 20 · b1 · µ + 1 · a + 40 · b1 · µ + 1 · a + 60 · b1 · µ + 30 · b1 · µ + 50 · b1 · µ + 60 · b
=
1 1 201 1 401 1 601 0 301 0 501 0 60
µ
ab
より、
X =
1 1 201 1 401 1 601 0 301 0 501 0 60
とおくと、Xがデザイン行列である。
4 その4:クロスオーバー試験の解析
では次にクロスオーバー試験の解析を見ていきます。データは以下の通りです。なお、簡単のため、今回は「各群2例ず
つ」としてあります。
表 8 クロスオーバー試験のデザイン
時期1 時期2
第1群 薬剤1 薬剤2 (2例)
第2群 薬剤2 薬剤1 (2例)
データは以下の通り得られたものとします。
17
表 9 クロスオーバー試験のデータ
薬剤群 (i) 被験者番号 (j) 時期 (k) 収縮期血圧 (yijk)
1 1 1 120
2 1 2 110
1 2 1 130
2 2 2 140
1 3 2 150
2 3 1 130
1 4 2 100
2 4 1 110
とします*9。なお、被験者番号 1,2が第1群、3,4が第2群です。
以下、「被験者の効果」を入れるか入れないかにより、2つのモデルについて考えていきます。
4.1 fixed effect model:被験者の効果を入れないモデル
最初のモデルは、被験者の効果をモデルに入れず「薬剤:di」「時期効果:tk」をそれぞれ fixed effect (固定効果)で
入れたモデルを考えますと、モデルは以下の通りとなります。
yijk = µ + di + tk + εijk
このとき、データを全て並べると
120 = µ + d1 + t1 + ε111
110 = µ + d2 + t2 + ε212
130 = µ + d1 + t1 + ε121
140 = µ + d2 + t2 + ε222
150 = µ + d1 + t2 + ε132
130 = µ + d2 + t1 + ε231
100 = µ + d1 + t2 + ε142
110 = µ + d2 + t1 + ε241
ベクトル表記すると
120110130140150130100110
=
µ + d1 + t1µ + d2 + t2µ + d1 + t1µ + d2 + t2µ + d1 + t2µ + d2 + t1µ + d1 + t2µ + d2 + t1
+
ε111ε212ε121ε222ε132ε231ε142ε241
となります。
ここで、制約条件を
d1 + d2 = 0, t1 + t2 = 0
とおき、それぞれ
d2 = −d1, t2 = −t1
*9 今までのモデルでは「被験者番号」は投与群ごとに1からつけ直していましたが、今回は被験者番号 j = 1は1人だけ、j = 2は1人だけ…という風にします。
18
としてパラメータを減らします。結局パラメータベクトルは
β =
µd1
t1
となり、平均部分を見ると
µ + d1 + t1µ + d2 + t2µ + d1 + t1µ + d2 + t2µ + d1 + t2µ + d2 + t1µ + d1 + t2µ + d2 + t1
=
µ + d1 + t1µ − d1 − t1µ + d1 + t1µ − d1 − t1µ + d1 − t1µ − d1 + t1µ + d1 − t1µ − d1 + t1
=
1 · µ + 1 · d1 + 1 · t11 · µ − 1 · d1 − 1 · t11 · µ + 1 · d1 + 1 · t11 · µ − 1 · d1 − 1 · t11 · µ + 1 · d1 − 1 · t11 · µ − 1 · d1 + 1 · t11 · µ + 1 · d1 − 1 · t11 · µ − 1 · d1 + 1 · t1
=
1 1 11 −1 −11 1 11 −1 −11 1 −11 −1 11 1 −11 1 1
µd1
t1
より、
X =
1 1 11 −1 −11 1 11 −1 −11 1 −11 −1 11 1 −11 1 1
とおくと、Xがデザイン行列となります。
4.2 mixed model:被験者を random effectとしてモデルに入れる場合
では次に、被験者をモデルに入れる場合を考えます。被験者の影響は random effect(変量効果)としてモデルに組み込む
ことが多いです*10ので、今回も「被験者:pj」を random effectで入れた、mixed model(混合モデル)を考えます。
モデルは以下の通りとなります。
yijk = µ + di + pj + tk + εijk
*10 つまり、被験者の影響を定数でなく確率変数と考える、ということです。
19
です。デザイン行列を考える際に重要なのは fixed effect と random effect は別に扱うということです。つまり、
yijk = µ + di + tk︸ ︷︷ ︸fixed effect
+ pj︸︷︷︸random effect
+ εijk︸︷︷︸誤差部分
と分解されます。ここで、データを並べてみますと
120 = µ + d1 + t1 + p1 + ε111
110 = µ + d2 + t2 + p1 + ε212
130 = µ + d1 + t1 + p2 + ε121
140 = µ + d2 + t2 + p2 + ε222
150 = µ + d1 + t2 + p3 + ε132
130 = µ + d2 + t1 + p3 + ε231
100 = µ + d1 + t2 + p4 + ε142
110 = µ + d2 + t1 + p4 + ε241
となります。制約条件も fixed effectと同じ
d1 + d2 = 0, t1 + t2 = 0 =⇒ d2 = −d1, t2 = −t1
と考えてベクトル表記するのですが、fixed effect と random effect は別ベクトルで書いてやります。つまり、fixed
effect の部分は上と変わりませんので
β =
µd1
t1
とし、それに加えて random effectのベクトルを
p =
p1
p2
p3
p4
とおくのです*11。こうして、ベクトル表示してやりますと、
120110130140150130100110
=
µ + d1 + t1µ + d2 + t2µ + d1 + t1µ + d2 + t2µ + d1 + t2µ + d2 + t1µ + d1 + t2µ + d2 + t1
+
p1
p1
p2
p2
p3
p3
p4
p4
+
ε111ε212ε121ε222ε132ε231ε142ε241
*11 random effectには制約条件を考える必要はありません。
20
より、右辺の誤差以外の部分を考えます。fixed effectの部分は上と全く同じ計算が成り立ち、
µ + d1 + t1µ + d2 + t2µ + d1 + t1µ + d2 + t2µ + d1 + t2µ + d2 + t1µ + d1 + t2µ + d2 + t1
+
p1
p1
p2
p2
p3
p3
p4
p4
=
µ + d1 + t1µ − d1 − t1µ + d1 + t1µ − d1 − t1µ + d1 − t1µ − d1 + t1µ + d1 − t1µ − d1 + t1
+
p1
p1
p2
p2
p3
p3
p4
p4
=
1 · µ + 1 · d1 + 1 · t11 · µ − 1 · d1 − 1 · t11 · µ + 1 · d1 + 1 · t11 · µ − 1 · d1 − 1 · t11 · µ + 1 · d1 − 1 · t11 · µ − 1 · d1 + 1 · t11 · µ + 1 · d1 − 1 · t11 · µ − 1 · d1 + 1 · t1
+
1 0 0 01 0 0 00 1 0 00 1 0 00 0 1 00 0 1 00 0 0 10 0 0 1
p1
p2
p3
p4
=
1 1 11 −1 −11 1 11 −1 −11 1 −11 −1 11 1 −11 1 1
β +
1 0 0 01 0 0 00 1 0 00 1 0 00 0 1 00 0 1 00 0 0 10 0 0 1
p
と書くことができます。ここで、fixed effectと random effectを別々に
X =
1 1 11 −1 −11 1 11 −1 −11 1 −11 −1 11 1 −11 1 1
, Z =
1 0 0 01 0 0 00 1 0 00 1 0 00 0 1 00 0 1 00 0 0 10 0 0 1
とおきますと、X, Zの2つがこのモデルのデザイン行列となります。また、モデル全体は
y = Xβ + Zp + ε
と書けます*12。
*12 もう一度注意しておきますが、β は fixed effect (定数ベクトル)で、pは random effect(確率変数ベクトル)です。
21
5 ダミー変数について
最後にダミー変数について述べます。たとえば先の共分散分析のモデルをもう一度見てみます。
(第1群):y1j = µ + a + bx1j + ε1j (ε1j ~ N(0, σ2)) (16)
(第2群):y2j = µ + bx2j + ε2j (ε2j ~ N(0, σ2)) (17)
です。このとき、切片に注目しますと
(第1群)µ + a
(第2群)µ
であり、第1群の方だけに aがついています。モデル式はこれ以外の部分は同じですので、ここの部分がまとめて書ければ
両方を1つの式で書くことができるようになります。これを可能にするために用いられるのが ダミー変数 です。つまり、
ここの部分を
µ + Di · a
とおいてやり、この Di (i:投与群)を
Di ={
1 (i = 1のとき)0 (i = 2のとき)
という風にしてやります。そうすると上のモデル式 (16)(17)を1つの式にまとめて
yij = µ + Di · a + bxij + εij
と書くことができます。このように、ある特定の群にだけしか存在しない変数があるときに、全ての群でのモデルを1つの
式で表すために用いる変数をダミー変数と呼びます。
同様に、1元配置分散分析モデル
y1j = µ1 + ε1j
y2j = µ2 + ε2j
y3j = µ3 + ε3j
も、3つのダミー変数 D1i, D2i, D3i を
D1i ={
1 (i = 1のとき)0 (それ以外) D2i =
{1 (i = 2のとき)0 (それ以外) D3i =
{1 (i = 3のとき)0 (それ以外)
と定義してやると、これらを用いて
yij = D1i · µ1 + D2i · µ2 + D3i · µ3 + εij
22
と書くこともできます*13。なお、このダミー行列を用いて、デザイン行列を表現することもできます。一元配置のときに用
いた (11)の式は
X =
1 0 01 0 01 0 00 1 00 1 00 0 10 0 10 0 10 0 1
=
D11 D21 D31
D11 D21 D31
D11 D21 D31
D12 D22 D32
D12 D22 D32
D13 D23 D33
D13 D23 D33
D13 D23 D33
D13 D23 D33
のように表現できます。
*13 この D1i などは、数学では Kroneckerの δ (クロネッカーのデルタ)と呼ばれるものと同じです。Kroneckerの δ は
δij =
{1 (i = j)0 (それ以外)
と定義されるものです。
23