277
欠測のある連続量経時データに対する 統計手法について Ver2.0 2016 4 日本製薬工業協会 医薬品評価委員会 データサイエンス部会 2013 年度 タスクフォース 2 2014 年度 タスクフォース 4 欠測のあるデータの解析チーム

欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

欠測のある連続量経時データに対する統計手法について

Ver2.0

2016年 4月

日本製薬工業協会

 医薬品評価委員会 データサイエンス部会

2013年度タスクフォース 2

2014年度タスクフォース 4

欠測のあるデータの解析チーム

Page 2: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

目次

第 I 部 欠測のあるデータの解析の基礎と基本的な手法のまとめ 7

第 1章 はじめに 8

1.1 本報告書の目的と背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.2 本報告書の構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.3 注意事項 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3.1 本報告書の前提知識 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3.2 本報告書の対象となるデータ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3.3 用語・記号に関する注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3.4 略語等一覧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.5 欠測識別変数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.3.6 その他のよく用いる記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.4 その他の注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

第 2章 欠測のあるデータの基本事項~欠測メカニズム・尤度・データの紹介~ 13

2.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2 欠測メカニズムの定義と具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.1 欠測とは . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.1.1 本報告書で扱う欠測 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.1.2 欠測データと欠測のあるデータ . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.1.3 欠測識別変数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.1.4 本報告書で扱うデータの設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.2 欠測のパターンと欠測のメカニズム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.2.1 欠測パターンの分類:単調な欠測 . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.2.2 中止の種類と脱落 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.3 欠測メカニズムの種類 (MCAR, MAR, MNAR) . . . . . . . . . . . . . . . . . . . . . . . 15

2.2.3.1 Little and Rubin (2002)のMCAR, MAR, MNAR の定義 . . . . . . . . . . . . . 15

2.2.3.2 NRC(2010)のMCAR,MAR,MNAR の定義 . . . . . . . . . . . . . . . . . . 16

2.2.4 具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.4.1 MCARの具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2.4.2 MARの具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2.4.3 MNARの具体例 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2.4.4 MNARの具体例 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.2.5 臨床試験におけるMCAR,MAR,MNAR . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.3 欠測メカニズムに対する注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.1 無効な症例が存在する場合の欠測メカニズム . . . . . . . . . . . . . . . . . . . . . . . . 20

2.3.2 MARかどうか分からない場合にどう考えるか . . . . . . . . . . . . . . . . . . . . . . . 23

2.4 尤度を用いた推測 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.4.1 尤度の種類 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

1

Page 3: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

2.4.2 無視できる欠測メカニズム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.4.2.1 尤度を用いた推測の場合の定義 . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.4.2.2 欠測メカニズムが無視できる場合の統計的推測 . . . . . . . . . . . . . . . . . 26

2.5 実際の臨床試験データ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

第 3章 Estimand 30

3.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2 Estimandの定義・重要性・注意点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.1 Estimandとは . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.2 Estimandの重要性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.3 実用上の注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3 Efficacyと effectiveness. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.4 Mallinckrodt (2013)による 6つの estimand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.4.1 Estimand 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.4.2 Estimand 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4.3 Estimand 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4.4 Estimand 4, 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.4.5 Estimand 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.5 Mallinckrodtet al. (2014)による 3つの estimand . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.6 ステークホルダーと estimand. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.7 その他の参考文献など . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

第 4章 Complete case解析,LOCF,及び BOCFに対する論説 36

4.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.2 Complete case解析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.3 補完に基づくアプローチ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.3.1 LOCFについて . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4.3.2 BOCFについて . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.3.3 Estimandと LOCF,及び BOCF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.3.4 その他の補完方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.4 まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

第 5章 Selection Model 40

5.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.2 SMの一般的定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.2.1 記号の確認 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.2.2 SMの一般的定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.2.3 SMの対象となる estimand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

5.3 MARを仮定した SM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

5.3.1 MARを仮定した SMその 1(SMの一般論) . . . . . . . . . . . . . . . . . . . . . . . . 41

5.3.2 MARを仮定した SMその 2(MMRM) . . . . . . . . . . . . . . . . . . . . . . . . . . 42

5.3.3 MNAR (outcome-dependent dropout)を仮定した SM . . . . . . . . . . . . . . . . . . . . 45

5.4 SMによる感度分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

5.4.1 アプローチ 1:脱落確率モデルを固定するアプローチ(MNAR を仮定した SMその 1) 46

5.4.2 アプローチ 2:感度パラメータを用いるアプローチ(MNAR を仮定した SMその 2) . . 47

2

Page 4: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

5.5 マクロプログラムについて . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5.5.1 アプローチ 1に対するマクロ(感度パラメータなし) . . . . . . . . . . . . . . . . . . . 48

5.5.2 アプローチ 2に対するマクロ(感度パラメータあり) . . . . . . . . . . . . . . . . . . . 48

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

第 6章 Pattern-Mixture Model 50

6.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

6.2 記号の整理と前提事項 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

6.3 PMMについて . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

6.4 制約条件について . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

6.5 制約条件 CCMV,NCMV,ACMV を仮定した PMM . . . . . . . . . . . . . . . . . . . . . . . . 54

6.5.1 欠測データの分布を特定可能にする制約条件 . . . . . . . . . . . . . . . . . . . . . . . . 54

6.5.2 CCMV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

6.5.3 NCMV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

6.5.4 ACMV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

6.5.5 制約条件(CCMV,NCMV,ACMV)の利用 . . . . . . . . . . . . . . . . . . . . . . . 58

6.5.6 制約条件(CCMV,NCMV,ACMV)を仮定した PMMの実装手順 . . . . . . . . . . . 59

6.6 制約条件 (CCMV, NCMV, ACMV) のまとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

6.7 制約条件 NFMV を仮定した PMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6.7.1 制約条件 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6.7.2 制約条件 (NFMV) の利用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

6.7.3 制約条件(NFMV)を仮定した PMMの実装手順 . . . . . . . . . . . . . . . . . . . . . 68

6.7.4 感度分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

6.7.5 SMと PMMの関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6.7.6 マクロプログラム (マクロ%PATTERNMIXTURE)について . . . . . . . . . . . . . . . . 71

6.8 Multiple Imuptation(MI) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

6.8.1 Multiple Imuptationの概要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

6.8.2 Multiple Imuptationの正当化(Rubinのルールの原理) . . . . . . . . . . . . . . . . . . 72

6.8.3 単調回帰によるMultiple Imuptationの概要 . . . . . . . . . . . . . . . . . . . . . . . . . 73

6.8.4 Multiple Imputationにより得られた複数の推定量の結果統合 . . . . . . . . . . . . . . . . 73

6.9 Marginal treatment effect (周辺治療効果)の推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.10 その他の PMM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

6.10.1 対照群のデータを用いた pattern imputation(Controlled imputation) . . . . . . . . . . . 76

6.10.2 対照群のデータを用いた pattern imputationの SASでの実行 . . . . . . . . . . . . . . . . 77

6.10.3 対照群のデータを用いた,その他の pattern imputation. . . . . . . . . . . . . . . . . . . 77

6.10.4 Delta adjustmentを用いた pattern imputation. . . . . . . . . . . . . . . . . . . . . . . . . 78

6.10.5 中止理由別(AEとその他の理由で区別)の pattern imputation . . . . . . . . . . . . . . 79

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

第 7章 Shared Parameter Model 82

7.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

7.1.1 SPMの一般的な表現 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

7.2 モデルの定式化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

7.2.1 応答変数モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

7.2.2 脱落確率モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

7.3 パラメータの推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

7.4 感度分析としての SPMの位置づけ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

7.5 マクロ%shared_parameter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

3

Page 5: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

第 8章 その他の手法 87

8.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

8.2 Inverse Probability Weighted Complete-Case (IPWCC) Estimator. . . . . . . . . . . . . . . . . . . 88

8.2.1 µに対する IPWCC推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

8.2.2 IPWCC estimators for Estimating Equations. . . . . . . . . . . . . . . . . . . . . . . . . . 90

8.2.3 ブートストラップ法による IPWCC推定量の分散 . . . . . . . . . . . . . . . . . . . . . . 90

8.3 weighted Generalized Estimating Equation (wGEE). . . . . . . . . . . . . . . . . . . . . . . . . . 91

8.4 Doubly Robustな推定量 (DR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

8.5 8章のまとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

第 II 部 MMRM の詳細と感度分析 98

第 9章 MMRM 99

9.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

9.2 MMRMの概念と特徴 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

9.3 SASによる実装 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

9.3.1 PROC MIXEDステートメント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

9.3.2 CLASSステートメント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

9.3.3 MODELステートメント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

9.3.4 LSMEANSステートメント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

9.3.5 REPEATEDステートメント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

9.3.6 RANDOMステートメント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

9.4 主解析としてのMMRM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

9.5 MMRMに基づく解析の検出力と標本サイズ設計 . . . . . . . . . . . . . . . . . . . . . . . . . . 104

9.6 おわりに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

第 10章 感度分析の実行 108

10.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

10.2 シミュレーションデータと主解析の結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

10.3 完全データの分布に対する感度分析(感度分析 1) . . . . . . . . . . . . . . . . . . . . . . . . 111

10.3.1 共変量の検討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

10.3.2 分散共分散構造の検討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

10.3.3 残差診断の検討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

10.3.4 影響診断の検討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

10.4 欠測メカニズムに対する感度分析(感度分析 2) . . . . . . . . . . . . . . . . . . . . . . . . . . 113

10.4.1 主解析で仮定する欠測メカニズム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

10.4.2 Type (i),Type (ii)の仮定と欠測メカニズムに対する感度分析の必要性 . . . . . . . . . . 113

10.4.3 SMによる感度パラメータを用いた感度分析 . . . . . . . . . . . . . . . . . . . . . . . . 113

10.4.4 PMMによる感度パラメータ∆を用いた感度分析 . . . . . . . . . . . . . . . . . . . . . 115

10.4.5 SPMによる感度分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

10.5 Estimandに対する感度分析(感度分析 3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

10.6 感度分析の結果のまとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

4

Page 6: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第 11章 Estimandごとの解析手法の使い分け 123

11.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

11.2 各手法の使い分け . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

11.2.1 Estimandに基づく手法の整理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

11.2.2 Estimand 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

11.2.3 Estimand 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

11.2.4 Estimand 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

11.2.5 Estimand 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

11.2.6 Estimand 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

11.2.7 Estimand 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

11.3 Analytic Road Mapに関する注意点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

第 12章 シミュレーションによる検討 128

12.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

12.2 シミュレーション 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

12.2.1 性能比較の方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

12.2.2 シミュレーションの設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

12.2.3 データの作成方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

12.2.4 解析方法およびシミュレーションの結果 . . . . . . . . . . . . . . . . . . . . . . . . . . 133

12.3 シミュレーション 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

12.3.1 性能比較の方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

12.3.2 シミュレーションの設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

12.3.3 データの作成方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

12.3.4 解析方法およびシミュレーションの結果 . . . . . . . . . . . . . . . . . . . . . . . . . . 140

12.4 まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

5

Page 7: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

更新履歴

Ver 更新年月 更新内容・コメント

1.0 2016年 1月 初版(1~12章,Appendix A~C)

2.0 2016年 4月 第 2版(1~12章,Appendix 1, Appendix 2)

• 本文の誤植修正• Appendix A~Cの名称 (Ver1.0では Appendix)を Appendix 1

に変更 • Appendix 2を新規作成• 1~12章・Appendix 1・Appendix 2の電子ファイルを 1つに

統合• 1~12章・Appendix 1・Appendix 2に記載された各Webペー

ジへアクセス可能であることを確認(2016年 4月 14日)

6

Page 8: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第 I部

欠測のあるデータの解析の基礎と基本的な手法のまとめ

Page 9: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第1章 はじめに

1.1 本報告書の目的と背景

経時的にデータを測定する臨床試験では,計画していた全ての測定時点で適切に測定が行われるとは限らな

い.第 III 相の大規模な臨床試験などでは,データの欠測はほとんどの試験で発生している.

特に応答変数が連続変数の比較試験では,これまで主に欠測値を LOCF (Last Observation Carried Forward)

で補完した後に共分散分析を用いる,LOCF ANCOVAという手法が主に用いられ,解析結果に対する欠測の

影響の評価も,それほど詳細には検討されてこなかった (Tanakaet al., 2014).しかし近年,欧州では EMA か

らガイドライン"Guideline on Missing Data in Confirmatory Clinical Trials"が 2010年に発行され,米国ではこれ

も 2010年に National Research Councilから"The prevention and treatment of missing data in clinical trials"(以下,

NRC (2010))が出版されたことや,欠測データの取り扱いが原因で「EMAでは承認されたが,FDAでは承認

されなかった事例」が出てきたこと(JPMA, 2014b)などをきっかけに,データの欠測が解析結果に与える影

響に対して,大変多くの注目が集まっている.

データの欠測に対する対応として,最も重要なことは欠測を発生させないことである.試験デザイン,実施

の観点から工夫できる点も様々ある.この観点も含め,主に臨床試験の実施上の観点から,本タスクフォース

(医薬品評価委員会 データサイエンス部会タスクフォース 2(2013年度))から既に報告書(JPMA, 2014a;

2014b)を発行している.

一方,試験のデザインや実施をどのように工夫をしたとしても,欠測が避けられないことも多い.そのよう

な場合に,欠測が解析結果にどのような影響を与えうるか,欠測のあるデータに対してどのような手法を用い

ればよいか,等を検討したのが本報告書である.従って,本報告書では主に統計担当者をはじめとする,既存の

統計手法についてはある程度理解されている方を対象に,欠測のあるデータに対する解析手法について述べる.

また,NRC (2010)において estimandという用語が強調された.estimandとは,「推定対象」を意味する概念で

あり,estimandを明確に特定することにより,治験の目的や評価対象を今まで以上に明確化でき,解析手法の

妥当性の評価や結果の解釈を今まで以上に明晰に行う事ができるようになる,と期待されている.この概念に

ついても,NRC (2010)等を参考に解説を試みた.なお,estimandについては,ICH E9 (R1)にて検討が継続中

(2016年 1月現在)であり,2014年に Final Concept Paperが発出されている (ICH Steering Committee, 2014).

また,2015年 2月に開催された製薬協主催のシンポジウム(以下,製薬協シンポジウム)では,PMDAから安

藤友紀氏が,FDAから Lisa LaVange氏が講演を行い,発表資料が製薬協のWebページで公開されている(安

藤, 2015; LaVange, 2015).

また,2014年より企業・PMDA・アカデミアの統計家により,実務上の統計的課題の議論を行う企画として,

データサイエンス・ラウンドテーブル会議が開催されている.欠測のあるデータの解析や estimandの実務への

応用は,過去 3回で毎回議題となっており,活発な議論が行われた.会議で用いられた資料・議論のまとめは,

• 第 1回(2014年 2月):http://www.pmda.go.jp/review-services/reexamine-reevaluate/symposia/0027.html

• 第 2回(2015年 3月):https://www.pmda.go.jp/review-services/reexamine-reevaluate/symposia/0007.html

• 第 3回(2016年 2月):https://www.pmda.go.jp/review-services/reexamine-reevaluate/symposia/0049.html

にて公開されており,今後も引き続き議論のテーマとなる可能性がある.

1.2 本報告書の構成

本報告書の構成は以下の通りである.8

Page 10: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

1. (第 I 部)欠測のあるデータや estimandに対する基本的考え方や基本的解析手法を整理する.(1∼8章)

2. (第 II 部) LOCF ANCOVAの代わりに主解析としてよく用いられるようになってきた MMRM (Mixed

Model for Repeated Measures)について解説すると共に,これを主解析として選択した場合にどのような

感度分析が考えられるか,を整理する.また,手法間の比較のシミュレーションも行う.(9∼12章)

3. (Appendix)基本事項として線形混合モデル (LMM) の解説,本文中で省略した理論の詳細の解説,公開さ

れているマクロについての解説を行う.(Appendix A∼C)

なお,本報告書では「欧米で批判が強まってきている」という理由から,安易に LOCF ANCOVAを主解析

とすること自体を否定するものではない.また,LOCF ANCOVAの代替手法としてのMMRM の使用について

も,無批判に勧めるものではない.Estimandや欠測のあるデータに対する解析手法とその特徴について理解を

深め,読者が自身の状況に照らし合わせて主体的に解析方法を選択することを支援するのが,本報告書の目的

である.

以下,本報告書における基本的注意を述べる.

1.3 注意事項

1.3.1 本報告書の前提知識

本報告書では,線形モデル (Linear Model, LM)についての知識(ANCOVA含む)は前提とするが,線形混合

モデル(Linear Mixed Model, LMM)については前提としない.LMM については Appendix Aで解説する.

1.3.2 本報告書の対象となるデータ

本報告書では,応答変数が連続量の場合のみを扱う.解析手法としては頻度論に基づいた手法のみを扱う.

また,本報告書では欠測を防ぐ方法については触れない.「欠測は存在する」という前提のもとで,解析方法の

検討を行う.欠測を防ぐ方法については,NRC (2010),JPMA (2014a)や,解析担当者の実践例として Hughes

et al. (2012)などを参照のこと.また,2015年 2月に開催された製薬協シンポジウムの資料として,竹ノ内

(2015),松岡ら (2015)がある.なお,欠測データの割合が増えることによって,主解析の結果がどのような

ものであっても議論の余地が残ることが懸念される.そのため,欠測を減らす試験デザイン,試験の実施を工

夫することは,極めて重要である.

1.3.3 用語・記号に関する注意

欠測のあるデータの解析についての文献を読む際,非常に悩ましいのは,「言葉の意味や言葉遣いが文献ごと

に異なる」ことがよくある点である.たとえば,Missing At Randomではない欠測のメカニズムを"Missing Not

At Random (MNAR)"と呼ぶ文献もあれば,"Not Missing At Random (NMAR)"と呼ぶ文献もある.また,日本

語の用語としては sensitivity analysisの訳を「感度分析」と呼ぶか「感度解析」と呼ぶか,という点もある.本

報告書ではそれぞれ"MNAR"と「感度分析」を用いる1.さらに,本報告書の主題の 1つであるMMRM(9章

参照)については,「明示的に変量効果がモデルに組み込まれていない(ことが多い)」という点から"Mixed"の

名前をつけて呼ぶべきではない,という指摘もある.本報告書では慣用に従いMMRM という用語を用いるが,

今後どのような呼称を用いるか,についても引き続き検討が必要である.

このように複数の用いられ方をする用語について,本報告書では極力説明を加える,異なる定義を列挙する,

などを心がけている.一意的に定義しないものもあるが,本報告書内で限定しすぎた場合,他の文献で異なる

定義がなされていた際に理解を妨げる可能性があることを懸念し,このような対応とした.

1なお,日本語の「感度分析」と「感度解析」の違いとしては,「『感度分析』は統計解析だけでなく,より広範な分析を含む」という考え方もあるようである.

9

Page 11: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

一方,本報告書では他の文献から引用を行う場合,あまりに本報告書内での一貫性を損う場合,文献と全く

同じ記号ではなく,本報告書で定めた記号を用いたものもある.参考文献を参照される際,注意されたい.

1.3.4 略語等一覧

以下,本報告書で用いる略語等の一覧を示す.なお,たとえば選択モデル (SM)については,SeMという略

称で用いられている文献もある,など文献間で統一されていない部分も多いため,注意されたい.

表 1.1:本報告書で用いる用語一覧

本報告書での表記 日本語名 英語名

ANCOVA 共分散分析 ANalysis of COVAriance

AR(1) 1次自己回帰 AutoRegressive(1)

CS Compound Symmetry

iid 独立同分布 independent and identically distributed

LM 線形モデル Linear Model

LMM 線形混合モデル Linear Mixed Model

LOCF Last Observation Carried Forward

MAR Missing At Random

MI 多重補完法 Multiple Imputation

MMRM Mixed Model for Repeated Measures

MNAR Missing Not At Random

PMM パターン混合モデル Pattern-Mixture Model

pMI placebo Multiple Imputation

REML 制限付き最尤法(制約付き最尤法) REstricted Maximum Likelihood

SM 選択モデル Selection Model

SPM Shared Paremeter Model

1.3.5 欠測識別変数

本報告書の対象は 1被験者に対して複数回の測定が計画される経時データである.以下,iを被験者の添え

字,j を時点の添え字とする.なお,j 時点,とは j 番目の時点,という意味である.つまり,j = 1, 2, 3がそ

れぞれ 1週目,2週目,3週目などとは限らず,j = 1:1週目,j = 2:2週目,j = 3:4週目,などもありうる.

また,i = 1, · · · , N ; j = 1, · · · , nとし,1被験者あたりの計画された測定時点数 nは被験者全員で共通とする.

被験者 iの j 時点のデータが欠測しているか,観測されたか,を示す変数には(本質的には同じ)2種類の

変数が考えられる.

• 欠測したとき 1,観測されたとき 0となる変数Mij

• 観測されたとき 1,欠測したとき 0となる変数 Rij

10

Page 12: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

である.これらを被験者 iについてまとめたベクトルを,それぞれMi,Ri とおく2.また,「(被験者 iの観測

データ数)+1」をDi とおく.式で表すと

Di =n∑j=1

Rij + 1

となる.Diは「ある時点までデータが常に観測されて,その後脱落する」3場合に,最初の欠測時点(ただし,

完了例の場合は「計画された測定時点 +1」)を意味する.

これらの記号は,実際に文献ごとに記載が異なることがみられるため,読者は他の文献を読まれる際に注意

されたい.

1.3.6 その他のよく用いる記号

本報告書でよく用いる記号として,以下の n次元ベクトルを定義する.

1n =

1

1

...

1

つまり,全ての成分が 1であるベクトルである.

1.4 その他の注意

• 本報告書では,SASプログラムの例や使い方等にも触れる.特に断らない限り,SASのバージョンは

9.2,9.3もしくは 9.4である.なお,9.4で Proc MIに pMI が実装される,などしており,今後もバー

ジョンアップに従い,新たな機能が追加されることが想定される.

• 本報告書は可能な限り章ごとに独立して読み進められるように,一部の基本的内容は複数の章で重複して記載している.

• 本報告書では, NRC (2010)をよく引用するが,この文献は慣習上「NASレポート」「NRCレポート」

と呼ばれることがある.

• 主に欠測メカニズムが MNAR である場合の解析の際,Missingdata.org.uk (http://missingdata.org.uk/)に

て公開されている SASマクロ ( (http://missingdata.lshtm.ac.uk/index.php?view=category&id=61%3Amnar-

methods&option=com_content&Itemid=137)を使用している.本報告書で使用しているマクロの使用法

については,本報告書の本文各章または Appendix Cで述べる.

参考文献

[1] 安藤友紀. (2015). PMDAにおける経験、現状と将来展望.日本製薬工業協会 データサイエンス部会シン

ポジウム,臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について―NASレポート、

2たとえば,全 4時点で 3時点目まで観測,4時点目のデータが欠測している場合

Mi =

Mi1

Mi2

Mi3

Mi4

=

0

0

0

1

, Ri =

Ri1

Ri2

Ri3

Ri4

=

1

1

1

0

である.

3このような欠測を「単調な欠測」と呼ぶ.

11

Page 13: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

EMA ガイドライン、estimandと解析方法の概説―

(http://www.jpma.or.jp/information/evaluation/symposium/pdf/20150213/20150213_4.pdf).

[2] European Medicines Agency (2010). Guideline on missing data in confirmatory clinical trials.

(http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2010/09/WC500096793.pdf)

[3] Hughes, S., Harris, J., Flack, N., and Cuffe, R. L. (2012). The statistician’s role in the prevention of missing data.

Pharmaceutical statistics, 11(5), 410-416.

[4] ICH Steering Committee (2014). Final Concept Paper E9(R1): Addendum to Statistical Principles for Clinical

Trials dated 22 October 2014.

[5] JPMA (2014a).臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について- NASレポー

ト,EMA ガイドライン,estimandと解析方法の概説 -.日本製薬工業協会.

(http://www.jpma.or.jp/information/evaluation/allotment/pdf/data_140704_1.pdf).

[6] JPMA (2014b).臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について- NASレポー

ト,EMA ガイドライン,estimandと解析方法の概説 -付録審査資料で欠測データが議論された事例.日本

製薬工業協会.

(http://www.jpma.or.jp/information/evaluation/allotment/pdf/data_140704_2.pdf).

[7] LaVange, L. (2015). Missing Data Issues in Regulatory Clinical Trials.日本製薬工業協会データサイエンス部

会シンポジウム,臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について―NASレ

ポート、EMA ガイドライン、estimandと解析方法の概説―

(http://www.jpma.or.jp/information/evaluation/symposium/pdf/20150213/20150213_3.pdf)

[8] 松岡伸篤,高木弘毅,土川克,棚橋昌也,吉田早織,鵜飼裕之 (2015).事例紹介 2.日本製薬工業協会デー

タサイエンス部会シンポジウム,臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題につ

いて―NASレポート、EMA ガイドライン、estimandと解析方法の概説―

(http://www.jpma.or.jp/information/evaluation/symposium/pdf/20150213/20150213_9.pdf)

[9] National Research Council. (2010).The prevention and treatment of missing data in clinical trials. National

Academy Press.

[10] 竹ノ内一雅 (2015).事前の計画と報告,欠測予防.日本製薬工業協会データサイエンス部会シンポジウム,

臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について―NASレポート、EMAガイ

ドライン、estimandと解析方法の概説―

(http://www.jpma.or.jp/information/evaluation/symposium/pdf/20150213/20150213_8.pdf)

[11] Tanaka, S., Fukinbara, S., Tsuchiya, S., Suganami, H.,& Ito, Y. M. (2014). Current Practice in Japan for the

Prevention and Treatment of Missing Data in Confirmatory Clinical Trials A Survey of Japanese and Foreign

Pharmaceutical Manufacturers.Therapeutic Innovation& Regulatory Science, 48(6), 717-723.

12

Page 14: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第2章 欠測のあるデータの基本事項~欠測メカニズム・尤度・データの 紹介~

2.1 はじめに

本章の目的は以下の通りである.

• 欠測のあるデータに関する基本的な用語を整理する.• 欠測メカニズムについて解説する.• 尤度を導入する.• 本報告書で対象とするタイプの臨床試験のデータの構造や注意点について述べる.

2.2 欠測メカニズムの定義と具体例

2.2.1 欠測とは

2.2.1.1 本報告書で扱う欠測

NRC (2010)の 1章 (p8)では,欠測データ (missing data)の定義を「応答変数のうち,解析上意味があるが,

収集されなかったデータを指す.たとえば,ある時点で被験者が死亡した場合,その後の QOLデータには解

析上意味がないため,これを欠測データ (missing outcome)と呼ぶべきではない」としている.

本報告書では,死亡後のデータの扱い等は扱わず,投与中止・試験中止した症例も全て生存しており,デー

タの取得ができなかっただけとする.

なお,現実的には,応答変数・共変量等様々なデータの欠測が考えられるが,本報告書では特に応答変数の

欠測に注目する.そのため,単に「欠測」と書いた場合には,応答変数の欠測を意味することとする.

2.2.1.2 欠測データと欠測のあるデータ

本報告書では「欠測データ」と「欠測のあるデータ」を区別する.それぞれ定義は以下の通りである.

• 欠測データ:欠測したデータ(観測されていないデータ)• 欠測のあるデータ:測定を予定していた全データのうち,一部が欠測データであるデータセット

つまり,本報告書で扱うのは「『欠測データ』の解析」ではなく,「『欠測のあるデータ』の解析」である.

2.2.1.3 欠測識別変数

Rij を,被験者 iの j 時点の応答変数が観測されているときに 1,欠測しているときに 0をとる変数とする.

このような変数を欠測識別変数と呼ぶ1.

1「はじめに」でも述べたが,Mij を「観測を 0」「欠測を 1」と定義して欠測識別変数とする場合や,Rij を「観測を 0」「欠測を 1」とする場合など,文献によって定義が様々のため,文献ごとに確認が必要である.

13

Page 15: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

2.2.1.4 本報告書で扱うデータの設定

本報告書の主な対象となる臨床試験は,被験者ごとに複数の時点で応答変数の測定が計画されている,2群

比較試験である.また,プロトコールで計画された 1時点(以下,計画された最終時点2)での群間差を主な興

味の対象とする3.計画された最終時点の群間差が主な興味の対象となるものの,それまでの時点のデータも治

験薬の有効性に対して十分な情報を持っていると考えられる.そのため,すべての時点のデータを含めたモデ

ル化を行った上で,計画された最終時点の群間差を検討することを試みる.

• i:被験者番号 (i = 1, · · · , N)

• j:時点 (j = 1, · · · , n)• Yij:被験者 iの症例の時点 j での応答変数の値

• Yi:被験者 iの応答変数全てのベクトル(観測データ,欠測データ両方含む)

• Yoi:被験者 iの応答変数のうち,観測データを全て集めたベクトル

• Ymi :被験者 iの応答変数のうち,欠測データを全て集めたベクトル

• Ri:被験者 iの欠測識別変数を全て集めたベクトル

ここで,欠測しているデータは手に入らないため,我々の手に入るデータは (Yoi ,Ri)である.たとえば,計画

していた測定時点が 4時点で,3時点までしか観測されていない場合,被験者 iの各データは

Yi =

Yi1

Yi2

Yi3

Yi4

, Yo

i =

Yi1

Yi2

Yi3

, Ymi =

(Yi4

), Ri =

1

1

1

0

であり,観測されるデータは (Yo

i ,Ri)である.以上を受けて,

• 完全データ (full data4):(Yi,Ri)

• 観測データ (observed data):(Yoi ,Ri)

と呼ぶこととする.なお,時点 4の Yi4は欠測しているが,Ri4は「Yi4が欠測している」という情報から 0と

なる.つまり,Ri4 は欠測しない.

2.2.2 欠測のパターンと欠測のメカニズム

Little and Rubin (2002)に従い,欠測のパターンと欠測のメカニズムを区別しておく.

• 欠測のパターン:どのデータが観測されて,どのデータが欠測しているか.Ri の 0, 1の並びで表現さ

れる.たとえば,Ri = (1, 1, 1, 0)′ とRi = (1, 0, 0, 1)′ は異なる欠測のパターンである.

• 欠測メカニズム:欠測識別変数とデータの関係.つまり,欠測確率がどういうデータに(どのように)依

存しているか.

詳細は,以下で検討していく.

2.2.2.1 欠測パターンの分類:単調な欠測

欠測のパターンの重要な区分として,以下の 2つがある.

2「実際に測定された最後の時点(欠測していない最後のデータがとられた時点)」という意味ではない点に注意が必要である.3たとえば 12週間有効性評価を行うが,主要評価時点は 8週目であるような試験は想定していない.4日本語の「完全データ」は"complete data"(欠測のないデータ)の訳として用いられることも多いため,注意が必要である.

14

Page 16: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• 被験者の脱落 (dropout5)のように,応答変数が 1度欠測した際,その後のデータが全て欠測となるよう

な場合,単調な欠測(monotone missing)と呼ぶ.たとえば,Ri = (1, 1, 1, 0)′, (1, 1, 0, 0)′, (1, 0, 0, 0)の

ように,一旦 Rij が 0となった後は常に 0になる場合である.

• ある測定時点のみ来院できなかった,という場合のように,一旦欠測した後に,データが 1時点でも観

測された場合,非単調な欠測(non-monotone missing)と呼ぶ.たとえば,Ri = (1, 1, 0, 1)′, (1, 0, 1, 0)な

ど,一旦 Rij が 0となった後に,再度 1となることがある場合である.

本報告書では,特に断らない限り単調な欠測を扱う.

2.2.2.2 中止の種類と脱落

中止の区分として,治験薬の投与中止と治験の中止がある.試験の目的や,3章で述べる estimand次第では,

治験薬投与中止後にもデータの収集を続ける必要が生じることもあり得るため,この区分は治験計画・実施・

解析・結果の解釈を行う上で極めて重要である.

2.2.3 欠測メカニズムの種類 (MCAR, MAR, MNAR)

次に,欠測メカニズムを考える.欠測のあるデータの解析に対して,(Yi,Ri)の同時密度関数を以下のよ

うに分解することを考える.

f(Yi,Ri |θ,ψ) = f(Yi |θ) · f(Ri |Yi,ψ)

ここで,f(Ri |Yi,ψ)は,欠測識別変数Ri に対する応答変数Yi の影響を示しており,この関数が欠測メカ

ニズムを規定していると考えてよい.以下,この関数に対するモデルを脱落確率モデル(脱落モデル)と呼び,

具体例を用いつつ検討を行う.なお,θは応答変数の分布のパラメータ,ψは欠測識別変数の分布のパラメー

タである.

2.2.3.1 Little and Rubin (2002)のMCAR, MAR, MNAR の定義

欠測メカニズムとして,特によく用いられる区分として MCAR (Missing Completely At Random),MAR

(Missing At Random),MNAR (Missing Not At Random)の 3種類がある.Little and Rubin (2002)では,(本質的

に)以下のように定義されている6.

(MCAR) : f(Ri |Yi,ψ) = f(Ri |ψ)

(MAR) : f(Ri |Yi,ψ) = f(Ri |Yoi ,ψ)

(MNAR) : f(Ri |Yi,ψ) = f(Ri |Yoi ,ψ)

(2.1)

なお,一般にMAR はMCARを含むが,MNARはMARを含まない7,とすることが多い.しかし,本報告書

の 6章を含む Pattern-Mixture Modelの文脈などで,「MNAR は MAR を含んだ一般的な欠測メカニズム」とし

て定義されることもある.適宜注意すること.

 上記記法はよく用いられているものの,以下の 2点で本報告書で用いるには不十分な点が残る.

• 共変量の影響が明示的に示されていない(周辺化されている)• 変量効果の影響が明示的に示されていない(周辺化されている)

5withdrawal,attritionという言葉が用いられることもある.6厳密には,Little and Rubin (2002)では MNAR ではなく NMAR(Not Missing At Random)という用語が用いられていたり,Ri ではな

くMi が用いられていたりする.本報告書では,後の記載と統一をとるため,上記の記号を用いる.7つまり,式 (2.1) のように,MNAR を「MAR 以外」として定義する,という意味である.

15

Page 17: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

そこで,本報告書では Little (2008)をもとに,共変量Xi,変量効果 bi を含めた以下の記法も定義する.

(MCAR) : f(Ri |Xi,Yi,bi,ψ) = f(Ri |Xi,ψ)

(MAR) : f(Ri |Xi,Yi,bi,ψ) = f(Ri |Xi,Yoi ,ψ)

(MNAR) : f(Ri |Xi,Yi,bi,ψ) = f(Ri |Xi,Yoi ,ψ)

(2.2)

2.2.3.2 NRC(2010)のMCAR,MAR,MNAR の定義

次に,NRC (2010)での定義を考える.まず,以下の 2種類の変数を考える.

• デザイン変数X:

治験薬の投与群,ベースライン時点で取られるデータであり,主解析の際に使用される変数.全症例に

対して観測される8.

• 補助変数V:

脱落確率モデルに対する推論に役立つものであり,一般に主解析には使用されない.被験者ごとの特徴

を表す変数であり,投与前のものも投与後のものもあり得,全データが観測されるとは限らない.たと

えば,コンプライアンスや有害事象に関する情報など.

ここで,MCAR の定義は

f(Ri |Xi,Vi,Yi) = f(Ri) (2.3)

であり9,MAR の定義は

f(Ri |Xi,Vi,Yi) = f(Ri |Xi,Voi ,Y

oi )

である.なお,Voi はVi のうち観測されたデータである.MNAR は,MAR でない場合と定義している.

2.2.4 具体例

抽象的な説明だけでは分かりにくいため,MCAR,MAR,MNAR の各メカニズムの具体例をみていくこと

とする.これらの例は,シミュレーションで欠測のあるデータを発生させる際に,どのような関数を用いて各

データの欠測確率を決定すればよいか,を考える際などの参考となる.なお,簡単のため欠測確率は共変量や

変量効果に依存しない場合を考える.つまり,上で複数の定義を考えたが,共通部分である (2.1)を扱う10.再

掲しておくと,以下の通りである.

(MCAR) : f(Ri |Yi,ψ) = f(Ri |ψ)

(MAR) : f(Ri |Yi,ψ) = f(Ri |Yoi ,ψ)

(MNAR) : f(Ri |Yi,ψ) = f(Ri |Yoi ,ψ)

以下,3時点での測定を計画している試験を考える.被験者ごとの応答変数ベクトルはYi = (Yi1, Yi2, Yi3)′,

被験者ごとの欠測識別変数ベクトルはRi = (Ri1, Ri2, Ri3)′である.なお,以下の例が上記のMCAR,MAR,

MNAR の定義を満たすことの確認は,Appendix Bで行う.

8ベースライン時点のデータの欠測は本報告書では扱わない.9式 (2.2) の MCAR との違いは共変量に依存するかどうかである.式 (2.2) では共変量に依存してよいので,たとえば群ごとに別々の

メカニズムを考えることとなるが,式 (2.3) の定義では両群合わせて周辺化したモデルで考えることとなる.10また,以下の例は厳密には Seamanet al. (2013)の everywhere MCAR,everywhere MARである.これらの概念は本報告書のレベルを

超えるため,これ以上は触れない.

16

Page 18: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

2.2.4.1 MCARの具体例

最初にMCARの例を考える.単調な欠測であり,時点 1(j = 1)の応答変数 Yi1 は必ず観測され,その後の

データは「1つ前のデータが観測されていれば,応答変数Yi の値によらず次のデータが欠測する確率が 0.1」

となるようにする.つまり,

f(Ri1 = 0 |Yi) = 0 (2.4)f(Ri2 = 0 |Yi, Ri1 = 0) = 1

f(Ri2 = 0 |Yi, Ri1 = 1) = 0.1

(2.5)

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.1

(2.6)

とおく.被験者 iの時点 jに関してRi1 = · · · = Rij = 0ならば,Ri,j+1 = 0となる確率が 1になる,という部

分が単調な欠測であることを示している.また,同様に「一度欠測した場合にその後必ず 0になる」ことからf(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 1

f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) = 0

とおくこととする.

2.2.4.2 MARの具体例

次に,MARの具体例をみる.条件付き分布としては,単調な欠測となる以下のものを考える.時点 jの応答

変数 Yij が観測されたとき,時点 (j + 1)の応答変数 Yi,j+1 が観測される確率が,Yij の関数で表され,Yi,j−1

以前や Yi,j+1 の値には依存しない,とする.

f(Ri1 = 0 |Yi) = 0 (2.7) f(Ri2 = 0 |Yi, Ri1 = 0) = 1

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.5Yi1

(2.8)

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.5Yi2

(2.9)

ここで,

logitf(x) = log

(f(x)

1− f(x)

)⇐⇒ exp (logitf(x)) =

f(x)

1− f(x)

⇐⇒ f(x) =exp(logitf(x))

1 + exp(logitf(x))

である.したがって,式 (2.8),(2.9)の確率 1でない式を変形すると,それぞれ

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.5Yi1

⇐⇒ f(Ri2 = 0 |Yi1, Ri1 = 1) =exp(0.2 + 0.5Yi1)

1 + exp (0.2 + 0.5Yi1)

17

Page 19: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

と,

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.5Yi2

⇐⇒ f(Ri3 = 0 |Yi1, Ri1 = 1, Ri2 = 1) =exp(0.2 + 0.5Yi2)

1 + exp (0.2 + 0.5Yi2)

となる.さらに,単調性をもとにf(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 1

f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) = 0

とおく.これはMAR となっている.

2.2.4.3 MNARの具体例 1

次に,MNAR の具体例をみる.2つの例を考える.1つ目は単調な欠測を仮定したものである.

f(Ri1 = 0 |Yi) = 0 (2.10)f(Ri2 = 0 |Yi, Ri1 = 0) = 1

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.1Yi1 + 0.3Yi2

(2.11)

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.1Yi2 + 0.3Yi3

(2.12)

書き直すと,

f(Ri1 = 0 |Yi) = 0f(Ri2 = 0 |Yi, Ri1 = 0) = 1

f(Ri2 = 0 |Yi, Ri1 = 1) =exp(0.2 + 0.1Yi1 + 0.3Yi2)

1 + exp(0.2 + 0.1Yi1 + 0.3Yi2)f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) =exp(0.2 + 0.1Yi2 + 0.3Yi3)

1 + exp(0.2 + 0.1Yi2 + 0.3Yi3)

となる.さらに単調性をもとに f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 1

f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) = 0

とおくと,これはMNAR となっている.

2.2.4.4 MNARの具体例 2

最後に,MNARの 2つ目の例を考える.先にみたMARの例から,「単調な欠測」という条件を取り除いてみ

る.つまり,前のデータが欠測しているかどうかに関わらず,欠測確率を一定とするのである11.

f(Ri1 = 0 |Yi) = 011この例は医学的解釈が難しいが,このようなものを数理的に考えておくことは「現在よく用いているものだけが全てではないこと」

「少しイレギュラーなことが起きた場合にどのようになるか」を認識するために重要であるため,記載することとする.

18

Page 20: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

logitf(Ri2 = 0 |Yi, Ri1 = 0) = 0.2 + 0.5Yi1

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.5Yi1

logitf(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 0.2 + 0.5Yi2

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 0.2 + 0.5Yi2

logitf(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 0.2 + 0.5Yi2

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.5Yi2

とする.書き直すと,

f(Ri1 = 0 |Yi) = 0

logitf(Ri2 = 0 |Ri1Yi) = 0.2 + 0.5Yi1

logitf(Ri3 = 0 |Ri1, Ri2,Yi) = 0.2 + 0.5Yi2

⇐⇒

f(Ri1 = 0 |Yi) = 0

f(Ri2 = 0 |Ri1,Yi) =exp(0.2 + 0.5Yi1)

1 + exp(0.2 + 0.5Yi1)

f(Ri3 = 0 |Ri1, Ri2,Yi) =exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)

となる.このとき,MNAR である.

2.2.5 臨床試験におけるMCAR,MAR,MNAR

次に,臨床試験においてどのような欠測がMCAR,MAR,MNARとなるかを考える.本報告書では単調な

欠測を考えるため,脱落(治験中止)に注目する.まず,治験全体で考えるのではなく,1症例ごとに欠測し

た理由を考えていくと分かりやすい.たとえば以下のような理由が考えられる.

• MCAR:転居など,主要評価項目・有害事象の発現等とは全く無関係な治験中止

• MAR:原疾患の悪化,有害事象の発現等と関係しうる理由による欠測の場合などのうち,特に,試験

を中止した時点で悪化しているデータが十分にある,もしくは,検査結果を見た上で中止を判断した場

合12.

• MNAR:主要評価項目・有害事象の発現等と関係し得る理由による欠測であり,来院間隔が広く欠測の

原因となったデータが得られていない場合など.欠測が発現した段階で,欠測を説明しきれるだけの十

分なデータが得られていない場合.

脱落(治験中止)による欠測のメカニズムがMCAR,MAR,MNAR のどれに該当するか,は疾患の特性・プ

ロトコールの状況・組み入れられた被験者の状態等で異なり,試験ごとに個別の検討が必要である.欠測メカ

ニズムによって,得られた推定量の妥当性が変わることがありうるため,中止理由の情報を集めておくことは,

当該試験の解析のみならず,類似の薬剤・疾患の治験を計画する際にも,大変重要な情報となる13.

また,症例毎の欠測メカニズムと試験全体の欠測メカニズムを考えると,原理的には

• 全中止例のうち,全例MCARならば,試験全体でMCAR.

• 全中止例のうち,1例以上MAR が存在し,残りの全症例がMCARならば,試験全体ではMAR.

• 全中止例のうち,1例以上MNAR が存在すれば試験全体ではMNAR.

である.ここで重要な点は以下の 2点である.

• MAR か MNAR かの判断には Ym が必要になるため,観測されたデータ (Yo,X,R) からは MAR か

MNAR かは判断できない.

12中止時検査で情報を十分に収集することで,MAR に近づけることができるとも考えられる.MAR になる,という保証はない点には注意が必要である.

13なお,「正確な」中止理由を収集できるか,という点も極めて重要であるため,この点も工夫できると望ましい.

19

Page 21: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• MAR とMNAR では,MAR の解析の方が特定すべき項目も少なく,格段に容易に実行できる.そのた

め,可能な限りデザイン・モデルの工夫をすることでMAR に近づけたい.

これらを考慮して,以下のような検討方法・考え方が提案されている.

• 十分に計画された上で適切に実施され,十分な情報が収集された試験では,MAR を仮定した解析を主

解析とすることが妥当な場合は比較的多い (Mallinckrodtet al., 2008).

• MARを仮定した解析が妥当でなくなるのは,MNARとなる症例の影響である.そのため,MNARの症

例が特定できれば有益である.症例が(ある程度であれ)特定できれば,その症例を除外した解析も行

い,結果の頑健性をみることもできる.Verbeke and Molenberghs(2000)などでは,Local Influenceとい

う方法を用いて,脱落確率モデルが正しいと仮定したもとで,MNARが疑われる症例を特定する方法を

検討している.

2.3 欠測メカニズムに対する注意

欠測メカニズムは,正確に概念を把握することが極めて難しい.そこで,以下の架空の状況について検討を

加えることで,欠測メカニズムに対する理解を深めていく.目的は,データから欠測メカニズムが判断できそ

うかどうか,を考えることである.

2.3.1 無効な症例が存在する場合の欠測メカニズム

症例全体のうち一部の症例が無効14となりうる状況で,一部の症例が中止する場合,どういう欠測メカニズ

ムがあり得るか,を検討する.以下のシミュレーションデータを考える.応答変数は,値が小さい方が改善を

示すとする.最初に,中止した症例の中止後のデータも含めた「全データ」を図 2.1に示す.

14応答変数の値が,一旦は改善したとしても長期的にはベースライン近くになることを,「無効」と呼ぶこととする.

20

Page 22: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

全 デ ー タ ( 欠 測 デ ー タ 含 む )

図 2.1:全データ

次に,全データに対してMCARの欠測がある場合の観測データを図 2.2に示す.

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

観 測 デ ー タ ( M C A R )

図 2.2:観測データ(MCAR)

この観測データを,完了例・中止例に分けたものが以下の図 2.3, 2.4である.

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

完 了 例 ( M C A R )

図 2.3:完了例のデータ(MCAR)

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

中 止 例 ( M C A R )

図 2.4:中止例のデータ(MCAR)

以下,「改善症例」とは,「中止例は中止後の欠測データも含めて,結果的に改善している症例」を指すことと

し,「無効症例」も同様とする.すなわち,観測データでは無効化していなくても,その後の欠測データで無効

化していれば「無効症例」と呼ぶこととする.

いま,欠測メカニズムがMCARであるので,完了例・中止例のそれぞれの中で「改善症例」「無効症例」の

割合は同じとなるはずである.一方で,一見中止例には「無効症例」が存在しないように見える.しかし,図

2.1と図 2.3を比較すると,図 2.3の方が「無効症例」が少ないため,「無効症例」の一部は中止していることが

分かる15.このように,MCARの完了例(図 2.3)・中止例(図 2.4)のプロットを全体として比較しても,「改

善症例」・「無効症例」の割合が「同じように見える」とは限らない.中止例の中止後のデータも全て取得して

プロットすれば,同じように見えるはずである.逆に言うと,観測データから一見して完了例・中止例の振る15すなわち,観測データでは無効化していないが,欠測後に無効化している症例が存在する,ということである.

21

Page 23: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

舞いが異なるからといって,MCARの可能性が否定できるわけではない.一方で,中止例に「無効症例」が多

く,完了例に「無効症例」が全く存在しない場合は,「完了例は無効化していないことが確定している」ため,

MCARを否定する根拠となりうる.

次に,全データはMCARと同じ状況(図 2.1)で,MARによる欠測がある場合の観測データが図 2.5である.

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

観 測 デ ー タ ( M A R )

図 2.5:観測データ(MAR)

これを完了例・中止例に分けたものが図 2.6,2.7である.

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

完 了 例 ( M A R )

図 2.6:完了例のデータ(MAR)

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

中 止 例 ( M A R )

図 2.7:中止例のデータ(MAR)

22

Page 24: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

最後に,MNAR による欠測を考えた場合の観測データが図 2.8である.

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

観 測 デ ー タ ( M N A R )

図 2.8:観測データ(MNAR)

完了例と中止例に分けたものが図 2.9,2.10である.

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

完 了 例 ( M N A R )

図 2.9:完了例のデータ(MNAR)

応答

変数

9

1 2

1 5

1 8

2 1

2 4

2 7

時 点0 1 2 3 4

中 止 例 ( M N A R )

図 2.10:中止例のデータ(MNAR)

図 2.6,2.7と図 2.9,2.10を比較すると,MAR とMNAR を目で見て峻別することは大変難しい,という状

況が起こりうることが分かる.

2.3.2 MARかどうか分からない場合にどう考えるか

本章で重要な点は,「MAR かどうかが正確に判断できないときに,具体的にどのような手法がとれるか」と

いうことである.ここで極めて重要な点は,「MARのときに一致推定量となる」という主張は「MARでないと

きには必ずバイアスの入った推定量になる」ことを意味しない16,ということである.そこで,「MAR を仮定

した方法を主解析とし,MNARを仮定した感度分析を行う.感度分析の結果も含めて,推定値が妥当な範囲内

であれば,主解析の結果は頑健であると考える」のが現実的な考え方の 1つであろう.

一方,過去の類薬の試験データなどからMARでないことに十分な証拠等がある場合は,MNARを仮定した

モデルで主解析を行う必要があると考えられる.

2.4 尤度を用いた推測

次に,尤度を用いた推測を考える.

16MAR であることは推定量が一致性をもつための十分条件であり,必要条件ではない,ということである.

23

Page 25: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

2.4.1 尤度の種類

まず最初に,Molenberghs and Kenward (2007)に従い,尤度を定義する.最も興味のある対象は,応答変数

Yi = (Yoi ,Y

mi )′の分布であるが17,応答変数が欠測した場合でも,欠測識別変数Riの値は全て手に入る.通

常,Ri の値は Yi の値と独立ではないため18,Ri の値は Yi の分布に関する情報を持っているものと考えら

れる.

これより,Yiだけでなく,Riも合わせた完全データ (full-data19)(Yi,Ri)′の同時分布をもとにした尤度関数

を定義することに意味があると考えられる.まず,(Yi,Ri)の同時密度関数を用いて,完全データの尤度 (full

data likelihood)

L∗(θ,ψ |Yi) ∝N∏i=1

f(Yi,Ri |Xi,θ,ψ) =N∏i=1

f(Yoi ,Y

mi ,Ri |Xi,θ,ψ)

を考える.しかし,完全データの尤度は欠測データYmi も含むため,Ym

i の部分にデータを代入することがで

きず,これを θ,ψで微分して最尤推定等を行うことができない.そこで,Ymi を確率変数と考え,積分消去し

たもの20が観測データの尤度(observed data likelihood)

L(θ,ψ |Yoi ) ∝

∫L∗(θ,ψ |Yi)dY

mi

∝∫ N∏

i=1

f(Yi,Ri |Xi,θ,ψ)dYmi

=

N∏i=1

∫f(Yo

i ,Ymi ,Ri |Xi,θ,ψ)dY

mi

である21.この尤度に対して観測データ (Yoi ,Ri)を代入すると,未知の値はパラメータ θ,ψのみとなるため,

最尤法等の推測を行うことができる.したがって,尤度を用いた推測では基本的に観測データの尤度を用いる.

2.4.2 無視できる欠測メカニズム

2.4.2.1 尤度を用いた推測の場合の定義

Little and Rubin (2002)に従い,尤度を用いた推測を行う際,以下の 2条件を満たす場合,欠測メカニズムが

無視できる (missing-data mechanism is ignorable)と呼ぶ.

(i)欠測のメカニズムがMAR である.

(ii)応答変数のパラメータ θと脱落確率モデルのパラメータ ψが分離している.

なお,無視可能,と呼ばれることもある.

以下,パラメータが分離している,という用語について述べる.θと ψが分離している,とは「(θ,ψ)のパ

ラメータ空間 Ωθ,ψ が,θのパラメータ空間 Ωθ とψのパラメータ空間 Ωψ の直積で表されること」である.こ

れは,大まかに述べると「θの各パラメータと ψの各パラメータに重複がない」ということである.

 具体例を用いて,もう少し詳しく検討する.先で見たように,完全データの尤度を条件付き確率を用いて書

き下すと,

f(Yi,Ri |Xi,θ,ψ) = f(Yi |Xi,θ) · f(Ri |Xi,ψ)

17ベクトル Yi を厳密に記載すれば Yi = ((Yoi )

′, (Ymi )′)′ のようになるが,極端に煩雑なため以下本文のような記載とする.

18これが(ある意味で)独立であることは MCAR の定義であるため,MCAR でなければ(その意味で)独立ではないことは定義から明らかである.

19「完全データ」という用語は,"complete-data"(欠測のないデータ)の訳語として用いられることも多いため,注意が必要である.20つまり,観測データ (Yo

i ,Ri) の周辺尤度である.21Little and Rubin (2002)などでは "full likelihood" という用語が用いられている.

24

Page 26: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

と表現できる.この段階では,θと ψに共通のパラメータがあるかどうかは規定されていない.たとえば,応

答変数の分布を

f(Yi |Xi,θ) =1√

(2πσ2)3exp

(− 1

2σ2(Yi − µ)′(Yi − µ)

)と仮定する (µ = (µ1, µ2, µ3)

′).このとき,θ = (µ1, µ2, µ3, σ2)′である.次に,f(Ri, |Yi,ψ)を定義するため

に,先のMAR の具体例に類似した以下のものを用いる.

f(Ri1 = 0 |Yi,ψ) = 0f(Ri2 = 0 |Yi, Ri1 = 0,ψ) = 1

f(Ri2 = 0 |Yi, Ri1 = 1,ψ) =exp(ψ1 + ψ2Yi1)

1 + exp (ψ1 + ψ2Yi1)f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0,ψ) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0,ψ) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1,ψ) =exp(ψ1 + ψ2Yi2)

1 + exp (ψ1 + ψ2Yi2)

このとき,ψ = (ψ1, ψ2)′ である.パラメータ間にこれ以上の関係がなければ,パラメータ θとパラメータ ψ

は関係がない22.このような場合を「分離している」と呼ぶ.

次に,上の脱落に対して,「応答変数 Yij の値自体よりも,Yij から平均を引いて標準偏差で割った値に依存

する方が正しい」と考えたとする23.このとき,応答変数のパラメータは上と同じく θ = (µ1, µ2, µ3, σ2)′であ

る.一方,脱落確率モデルのパラメータを ψとおき,f(Ri |Yi, ψ)を考えると,

f(Ri1 = 0 |Yi, ψ) = 0f(Ri2 = 0 |Yi, Ri1 = 0, ψ) = 1

f(Ri2 = 0 |Yi, Ri1 = 1, ψ) =

exp

(ψ1 + ψ2 ·

Yi1 − µ1

σ

)1 + exp

(ψ1 + ψ2 ·

Yi1 − µ1

σ

)22このとき,

Ωθ =

µ1

µ2

µ3

σ2

∈ R4

∣∣∣∣∣∣∣∣∣∣µ1, µ2, µ3 ∈ R, σ2 > 0

= R3 × R>0

Ωψ =

(ψ1

ψ2

)∈ R2

∣∣∣∣∣ ψ1, ψ2 ∈ R

= R2

となる.一方,

Ω(θ,ψ) =

µ1

µ2

µ3

σ2

ψ1

ψ2

∈ R4

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣µ1, µ2, µ3 ∈ R, σ2 > 0, ψ1, ψ2 ∈ R

= (R3 × R>0)× R2

となる.したがって,

Ω(θ,ψ) = Ωθ × Ωψ

となる.23つまり,時点ごとの系統的な改善は除外した上で,時点ごとの平均からのずれ具合(をばらつきで補正したもの)が欠測確率に影響

を与えている,とするモデルである.

25

Page 27: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0, ψ) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0, ψ) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1, ψ) =

exp

(ψ1 + ψ2 ·

Yi2 − µ2

σ

)1 + exp

(ψ1 + ψ2 ·

Yi2 − µ2

σ

)と表せる.このとき,ψ = (ψ1, ψ2, µ1, µ2, σ)

′ となり,ψの成分に θ = (µ1, µ2, µ3, σ2)と重複するパラメータ

(µ1, µ2)や,θの成分 (σ2)の関数で表されるパラメータ σがでてくる.このような場合,パラメータ θと ψは

分離していない24,という.

パラメータが分離している場合,θは f(Ri |Yi)の分布に現れないため,条件が整えば f(Ri |Yi)の式に依

存しない推測が可能であるが,パラメータが分離していない場合は,観測データの対数尤度を θで微分する際

に f(Ri |Yi)の項が残ってしまうため,この分布のモデル化が避けられない.

2.4.2.2 欠測メカニズムが無視できる場合の統計的推測

式の計算の詳細は 5章の Selection Modelの解説の際に述べることとし,本節では推定量のもつ統計的性質に

ついて概要を述べる.

まず,応答変数のみの分布 f(Yoi ,Y

mi |θ)について,欠測データYm

i を積分消去した尤度

L(θ |Yoi ) =

∫f(Yo

i ,Ymi |θ)dYm

i

を考える.このとき,欠測メカニズムが無視できるならば,以下の性質が成り立つ.

• θについて,尤度 L(θ |Yoi )に基づく推定・検定が,観測データの尤度 L(θ,ψ |Yo

i )に基づくものと同じ

つまり,欠測メカニズムが無視できるならば,欠測識別変数Riを全く考慮せずに推定した推定量が,Riを考

慮した推定量と同等の性能を持つ,ということである.従って,たとえば観測データの尤度 L(θ,ψ |Yoi )に基

づく最尤推定量が一致性を持つならば,尤度 L(θ |Yoi )に基づく最尤推定量も一致性をもつ,ということであ

る.詳細は 5章や Little and Rubin (2002),岩崎 (2002)等参照のこと.

2.5 実際の臨床試験データ

本節では,本報告書のシミュレーションデータ作成の際に参考にした,脊椎損傷後の慢性中枢神経障害性疼痛

の治療に対してプレガバリン (以下 PGB)を 12週間投与する多施設共同,無作為化,二重盲検,並行群間比較

試験について紹介する(プレガバリン審査資料 http://www.pmda.go.jp/drugs/2013/P201300010/index.html).主

要有効性評価項目は,12週時の疼痛スコアのベースラインからの変化量である.PGB群及びプラセボ群 (PLB

群)の経時推移を表 2.1,図 2.11に示す.

24厳密には,Ωθ = R3 × R>0, Ωψ = R4 × R>0 である.一方,

ψ

)=

µ1

µ2

µ3

σ2

ψ1

ψ2

µ1

µ2

σ

に対するパラメータ空間は Ω(θ,ψ)

=

x1

x2

x3

x4

x5

x6

x7

x8

x9

∈ R9

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

x1 = x7, x2 = x8, x4 = x29, x4, x9 > 0

であり,明らかに Ω

(θ,ψ)= Ωθ × Ω

ψである.

26

Page 28: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 2.1:疼痛スコアのベースラインからの変化量の経時的推移

VisitPLB群 (N = 67) PGB群 (N = 69)

被験者数 平均値 SD 被験者数 平均値 SD

ベースライン 67 6.73 1.45 69 6.54 1.25

1週 67 -0.23 1.06 69 -1.42 1.58

2週 64 -0.29 1.14 67 -1.50 1.51

3週 62 -0.52 1.18 63 -1.97 1.62

4週 51 -0.65 1.41 62 -1.89 1.67

5週 47 -0.51 1.02 55 -2.06 1.66

6週 47 -0.71 1.07 55 -2.01 1.80

7週 44 -0.62 1.36 56 -1.89 1.83

8週 45 -0.59 1.64 55 -1.83 1.85

9週 40 -0.86 1.48 52 -2.01 1.90

10週 36 -0.81 1.58 51 -1.93 1.95

11週 36 -0.70 1.60 49 -2.07 2.09

12週 34 -0.56 1.53 46 -1.93 2.03

1 5

1

0.5

0BL 1 2 3 4 5 6 7 8 9 10 11 12

2.5

2

1.5

PLB PGB

図 2.11:疼痛スコアのベースラインからの変化量の経時推移図

両群で中止被験者が多数発生しており,12週完了した被験者数は,PGB群で 46名 (66.7%),PLB群では 34

名 (50.7%)となっている.また,各群における中止理由の内訳は表 2.2の通りであり,群によりその中止理由

の構成が異なっており,PGB群では,有害事象が理由で中止した被験者が多く,PLB群では効果不十分で中止

した被験者が多い.中止被験者数の構成が両群で異なっているため,発生した欠測が,解析結果の解釈に影響

を及ぼすことが予想される.本試験では,主解析として,ベースラインからの変化量 (欠測値は LOCFにより

補完)を応答変数とし,ベースラインなどを共変量とした共分散分析を実施している.解析結果は,PLB群と

の群間差 [95%CI] は −1.533 (95%CI: [−2.150,−0.916])であり,プラセボに対して統計学的に有意な鎮痛効果

が認められている (表 2.3).

27

Page 29: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 2.2:被験者の内訳

PLB群 PGB群

治験薬投与 67 70

完了 37 (55.2%) 49 (70.0%)

有効性解析対象 (ITT) 67 (100.0%) 69 (98.6%)

中止 30 (44.8%) 21 (30.0%)

 有害事象 9 (13.4%) 15 (21.4%)

 効果不十分 20 (29.9%) 5 (7.1%)

 その他 1 (1.5%) 1 (1.4%)

表 2.3:ベースライン及び最終評価時の疼痛スコア (ITT)

PLB群 PGB群差 [PGB群 −PLB群]a)

推定値 

(SE)

95%CI p値

ベースライン

   N   67   69

   平均    

    (SD)

6.727

(0.146)

6.540

(1.253)

最終評価時

   N   67   69

 最小二乗平均  

    (SE)

6.199

(0.235)

4.665

(0.231)

ベースラインからの

  変化量の   

 最小二乗平均 a)

−0.433 −1.967 −1.533

(0.312)

[−2.150, −0.916] < 0.001

a)投与群および施設を因子,ベースラインの疼痛スコアを共変量とした共分散分析による.

 そもそも,中止が発生しなければ中止による欠測の問題は起きないため,試験計画段階で中止被験者数を

減らす方策を立て,試験実施段階でも欠測に対する予防をすることは重要である.しかし,現実には,中止被

験者を 0にはできないことがほとんどであろう.発生した中止による欠測は,その理由によって 2.2.3節で述

べた欠測メカニズムが異なる可能性があり,また,1つの中止理由が複数の欠測メカニズムの混合である可能

性もある.中止被験者が多く発生し,その中止理由の構成が群間で異なった場合,解析結果に大きな影響を与

える可能性がある.そのため主解析では,欠測メカニズムを考慮した解析を行わなければならないが,例えば

MARを仮定した場合,その仮定が完全に正しいことを証明することはできない.MARを仮定した解析結果の

頑健性を検討するために,感度分析としてMNAR を仮定した場合の解析を行うことは有効であろう.

以降の章では,欠測メカニズムを考慮した様々な解析手法及び複数の観点からの感度分析について解説する.

参考文献

[1] 岩崎学. (2002).不完全データの統計解析.エコノミスト社.

[2] Little, R. J. (2008). Selection and Pattern-Mixture modes. Cphaiter 18 inAdvances in longitudinal data analaysis.

409-431.

28

Page 30: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[3] Little, R. J. A. and Rubin, D. B. (2002).Statistical analysis with missing data. 2nd edition. John Wiley& Sons.

New York.

[4] Mallinckrodt, C. H., Lane, P. W., Schnell, D., Peng, Y. and Maucuso, J. P. (2008). Recommendations for the

primary analysis of continuous endpoints in longitudinal clinical trials.Drug Information Journal, 42, 303-319.

[5] Molenberghs, G., and Kenward, M. (2007).Missing Data in Clinical Studies. Wiley.

[6] National Research Council. (2010).The prevention and treatment of missing data in clinical trials. National

Academy Press.

[7] プレガバリン審査資料. (http://www.pmda.go.jp/drugs/2013/P201300010/index.html).

[8] Seaman, S., Galati, J., Jackson, D., and Carlin, J. (2013). What Is Meant by“Missing at Random”?.Statistical

Science, 28(2), 257-268.

[9] 竹村彰通(1991).現代数理統計学.創文社.

[10] Verbeke, G, and Molenberghs, G. (2000).Linear mixed models for longitudinal data. Springer.

29

Page 31: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第3章 Estimand

3.1 はじめに

本章では,NRC (2010)の 2章,Mallinckrodt (2013)の 3,11章,Mallinckrodt et al. (2014),ICH Steering

Committee (2014)などに従い,estimandとはどういう概念か,どのような例が考えれるか,について述べる.

なお,ICH E9 (R1)にて検討が継続中(2016年 1月現在)であり,以下の内容はあくまで現時点で公開されて

いる情報に基づくものである.

3.2 Estimandの定義・重要性・注意点

3.2.1 Estimandとは

NRC (2010)の 2章,Recommendation 1 (p26)において「プロトコールでは,以下の項目を明示的に定義すべ

きである (a)治験の目的, (b)主要な応答変数,(c)応答変数がいつ・誰に・どのように測定されるか,(d)主

要な興味のある治療効果の指標 (the measures of intervention effects),つまり causal estimand.これらの指標は

全ての被験者に意味があるものであり,最小限の仮定のもとで推定可能であるべきである.特に後者に関して,

データの欠測の与える潜在的な影響と欠測データの取り扱いについてプロトコールに記載すべきである」と記

載されている.また,Mallicnkrodt (2013)の 3章 (estimandの章)の冒頭でも,データの欠測が存在することに

より,治験の目的をより明確化する必要が生じている,と述べられている.このように,estimandは治験の目

的を明確化し,治療効果について正しく判断するために役立つことが期待されている概念である.なお,現在

のところ,estimandには決まった日本語訳がみられないことから,本報告書でも和訳せず estimandと記載する.

Estimandという概念について,十分に詳細かつ実用的な定義は,Mallinckrodt (2013),NRC (2010)などにも

明示的には記載されていないようである.そのため,以下,各文献から estimandという概念を理解する上で参

考となりそうな説明を列挙する.まず,NRC (2010)の 2章 (p22)では estimandは「治験の介入の影響を要約す

る量」のように記載されており,特に「応答変数」「対象集団」を明確に特定することが重要である,と述べら

れている.Mallinckrodt (2013)の 3章では,「概念としては単に"What is being estimated"である」と述べた後,構

成要素として「パラメータ(治療効果の平均の群間差など)」「時点や曝露期間」「評価項目」「対象となる集団」

「治験薬の投与中止後 and/or rescue medication開始後に得られたデータは解析に含めるかどうか」等が含まれ

る,と記載されている.また,ICH E9 (R1)の final concept paper (ICH Steering Committee, 2014)の"Statement

of the Perceived Problem"の節 (p1)では「興味ある科学的疑問の文脈で推定されるべき特性 (property)」と記載

されている.なお,rescue medicationとは,応答変数に影響を与える可能性のある併用禁止薬・併用禁止療法

等を指す.

3.2.2 Estimandの重要性

Estimandの重要性に関して,ICH E9 (R1)の final concept paperの "Issues to be Resolved"の節 (p2)には

• Estimandを正しく選択できていない,もしくは estimandの定義が不明瞭であると,試験デザイン・実施・

解析に関する問題が生じ,推測と判断の間に不整合が生じることがありうる

と述べてある.さらに

30

Page 32: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• このガイダンスの目的は,適切な estimandが選択でき,企業と規制当局が明確な記述に基づいて合意で

きるような枠組みを述べることにある

とある.

また,NRC (2010)の 2章には

• ランダム化比較試験において,データの欠測により生じうるバイアスの可能性を明確に評価するために,estimandの選択(特に応答変数と,興味のある対象被験者集団)を明確にしておくことは重要である

とある.

3.2.3 実用上の注意

実際に治験を計画・実施・解析する際には,NRC (2010)の 2章や Mallinckrodt (2013)の 3章に示された

estimandの類型を参考にしつつも,必ずしも絶対視するのではなく,疾患領域・薬剤の特性・現在の標準治療

等に対する試験薬の位置づけ,等を考慮し,試験ごとに適切な estimandを検討することが重要である.

3.3 Efficacyと effectiveness

まず,estimandの大きな 2つの分類として,Mallinckrodt (2013)の 3章に従い,efficacyと effectivenessの 2

つを考える.Efficacyとは,意図された通りに行われた治療の効果であり,per-protocol estimand (PPS estimand)

や"de jure estimand"とも呼ばれる.一方,effectivenessは実際に行われた治療の効果であり,intention-to-treat

estimand (ITT estimand)または,"de facto estimand"とも呼ばれる.なお,「実際に行われた治療」という用語を

「中止後の rescue medicationまで含む」と考えるか,「実際に投与された治験薬のみ」と考えるかで,有効性評

価の仕方が異なってくる.そのため,Mallinckrodt (2013)では前者を estimand 1,後者を estimand 6として区

別している.

なお,Mallinckrodtet al. (2013)には「たとえば,治験の環境が実臨床に十分に一般化できる場合,POC study

では efficacyに主要な興味があり,その後開発が進むにつれて effectivenessに主要な興味が移っていくかもし

れない」とある.

一方,O’Neill and Temple (2012)では,「ITTアプローチは outcome study1では十分に標準的であり,広く受け

入れられている.一方,studies of symptom2では常に行われているわけではなく,また,明らかに望ましいと

も言い難い」と述べられている.

3.4 Mallinckrodt (2013)による 6つの estimand

Mallinckrodt (2013)では,大うつ病性障害 (Major Depressive Disorder, MDD)に対して 6種類の estimandを

考えている.以下,この 6種類について述べる.なお,最初の 5つは NRC (2010)とも概ね共通している.

なお,文献ごとに用語の使用法が異なることもあるため,本報告書では文献による違いを述べながら列挙す

ることとする.特に,NRC (2010)の 2章とMallinckrodt (2013)の 3章の間でも完全には一致していないため,

注意が必要である.

3.4.1 Estimand 1

• Estimand 1:全てのランダム化された被験者に対する計画された時点での応答変数の改善度合の差

1心血管イベントの発現や,がんの OSや PFSのようなイベント発現を主要評価項目とする試験.2生活習慣病、うつ病、疼痛などのように症状を抑えることを目的とする試験.

31

Page 33: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

この estimandは,実際に投与された薬剤には関係なく,最初に割り付けられた治療群と対照群における計画さ

れた時点での評価項目の平均の差であり,effectivenessを評価するものである.薬剤というよりも割り付け群

が比較の対象となり,治験薬を投与中止された場合,rescue medicationを受けた場合などもその後データが取

られていれば,主解析に用いられる.

なお,Mallinckrodtet al. (2012)では,「承認前は,治療方針ではなく薬剤の因果効果が主要な興味の対象とな

ることが多く,estimand 1を主要な estimandとすることは,試験によっては不適切な場合がある」と主張され

ている.

3.4.2 Estimand 2

• Estimand 2:治療に忍容可能な被験者の応答変数の改善度合の差

この estimandは,最初に行われる治療に忍容可能な被験者のみを対象集団として,治療効果の差をみるもので

ある.盲検化しない run-in phaseで実薬を投与し,治療に耐えられた被験者にのみランダム化を行い,「治療を

継続する群」と「プラセボに切り替える群」に割り付け,計画された時点での応答変数の改善度合の差をみる.

このようなデザイン(randomized withdrawal designという)を用いると,ランダム化後の脱落割合が減少し,

efficacyの評価が精度よくできる可能性が上がる.一方,この試験で得られた治療効果はあくまで制限された

集団に対するものであり,全ての患者に対しては一般化できない.臨床現場では,事前に薬剤に耐えられるか

どうかは分からないことも多いため,この薬剤を使用する全ての患者が有害事象のリスクにさらされるものの,

有効性は薬剤の使用に耐えられる患者に対してのみ確認されていることとなる.

なお,NRC (2010)では,ランダム化前にプラセボ投与によるwash-out期間を設定したり (2章,p24),run-in

phaseに投与する薬剤を試験薬以外の薬とする場合 (2章,p33)も述べられている.また,ランダム化する症例

の選択基準に,「十分な有効性が得られた被験者」という条件を付け加える方法も述べられている (2章,p33).

これは,主な中止理由が「有害事象」と「有効性不十分」の場合,前者だけでなく後者による脱落も除くこと

で,「長期使用ができる被験者」をより精度よく選択することができる,という考え方からである.

3.4.3 Estimand 3

• Estimand 3:全ての被験者が試験を完了したと仮定した場合の応答変数の改善度合の差

この estimandは,全ての被験者が試験を完了し,最初に割り付けられた薬剤が計画された評価時点まで投与さ

れた場合に,計画された時点で期待される改善度合であり,efficacyをみる estimandである.この estimandを

知ることは,薬剤の本来の薬効を知る上で重要であるが,現実にはほとんどの試験で投与中止例が存在するた

め,その影響をどう評価するか,という点が課題として残る.

NRC (2010)では,この estimandは「治療を継続させるような,実行可能かつ有効な方法 (available and effective

mechanism for ensuring adherence)がない限り使用は推奨されない」(2章,p25)「ほとんど使用されない (rarely

used)」(2章,p24)と記載されている.一方,Mallinckrodt (2013)では,実データの解析の章 (14章) でこの

estimandを主要な estimandとし,中止例の影響をみるため,副次的な estimandとして後述の estimand 6の検討

を行っている.これに関して,Mallinckrodtet al. (2012)では「estimand 3は『全ての症例がプロトコール通りに

治験薬の投与を完了した』というHypotheticalな estimandであり,必ず投与中止例の影響を含めた effectiveness

の評価も合わせて行うべきである」と述べている.

3.4.4 Estimand 4, 5

• Estimand 4:治療を継続できた期間の応答変数の Area Under the Curve (AUC)

• Estimand 5:治療を継続できた間の応答変数の改善度合の差

32

Page 34: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Estimand 4, 5は,最初に割り付けられた治療に対して,effectivenessを評価する.全ての被験者を対象として

おり,estimand 4は「応答変数の値」と「治療を継続できた期間」を同時に数値化し,estimand 5では治療が

継続した最終時点のみ,応答変数の値を評価する.そのため,原則的には脱落(投与中止)が原因となる欠測

値は存在しない.一方で,治療を継続できた期間のみで評価を行うため,治療を中止したときに治療効果がな

くなる薬剤などでは,薬剤の有効性を過大評価することにつながりかねない.そのような薬剤に対しては,特

にこれらの estimandを使用することの適切性を十分に検討する必要がある.

なお,NRC (2010)の 2章では,慢性疼痛に対する試験の例で,responder rate(応答変数に対して閾値を

決め,閾値を超えた症例数の割合.中止例は non-responderとする)も estimand 5に含めている (p32).一方,

Mallinckrodt (2013)の 3章では「その他の estimand」と扱われている (p20).

3.4.5 Estimand 6

• Estimand 6:全てのランダム化された被験者に対する,最初に割り付けられた治療の影響と考えられる,

計画された時点における応答変数の改善度合の差

この estimandは,最初に割り付けられた治療の影響の因果効果に注目して,計画されたエンドポイントでの

effectivenessを評価する.estimand 1と estimand 6の違いは,評価したいものが「割り付け群(治療方針)」か

「試験薬」かの違いである.具体的には,中止例の中止後のデータの取り扱いが一部異なる.Estimand 6は,中

止後 rescue medicationが行われた場合,この治療による交絡の影響を受けるべきではない,と考える.そして,

rescue medicationを受けた後のデータは解析に用いず,placebo Multiple Imputaion (pMI)等を用いて補完する

方法を考える3.なお,BOCFを用いることも考えられるが,特に NRC (2010)の Reccomendataion 10 (p77)に

おいて,単補完 (single imputation)の使用は,適切に正当化されない限り勧められない,との記載もあるため,

注意が必要である(4章参照).

Estimand 3との違いは,estimand 3では「全員が投与を完了したと仮定した場合」の治療効果を考えている

のに対して,estimand 6は中止例に対して,「中止後無治療であった(もしくは対照群で行われている治療が行

われた)場合」を想定している,という点である.

以上を表にまとめたものが,表 3.1である.

3.5 Mallinckrodt et al. (2014)による3つの estimand

次に,Mallinckrodtet al. (2014)で示された 3種類の estimandであるが,これは概ね上記の 6種類のうち 3つ

を取り出して,名前を変えたものである.具体的には

• Estimand A:Estimand 1とほぼ同じ

• Estimand B:Estimand 3とほぼ同じ

• Estimand C:Estimand 6とほぼ同じ

である.

3.6 ステークホルダーと estimand

薬剤には,製薬企業・規制当局・医療技術評価団体・医師・患者等さまざまなステークホルダーが存在する.

Leuchset al. (2015)では,「ステークホルダーごとに,興味のある estimandが異なるかもしれない.特に,規制

当局・医療技術評価者は公共政策決定の必要があるため,集団レベルの薬剤の効果の評価に役立つ effectiveness

に興味があり,医師・患者らは,薬剤を使い続けられた際に被験者個人レベルで期待される薬剤の効果として

解釈される efficacyに興味があるかもしれない」と述べている.

3pMI については,詳しくは 6章を参照.

33

Page 35: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 3.1: Mallinckrodt (2013)のMDD に対する 6種類の estimand

Estimand 有効性の指標 推測の対象 被験者 評価時点 rescue medication後の

データを主解析に含めるか

1 effectiveness 割り付け群 全被験者 計画された 含める

(治療方針) 時点

2 efficacy 最初に割り付け 最初に耐えられた 計画された 含めない

られた治療 被験者のみ 時点

3 efficacy 最初に割り付け 全被験者 計画された 含めない

られた治療 時点

4 effectiveness 最初に割り付け 全被験者 未定義 含めない

られた治療

5 effectiveness 最初に割り付け 全被験者 未定義 含めない

られた治療

6 effectiveness 最初に割り付け 全被験者 計画された 補完することが

られた治療 時点 望ましい

3.7 その他の参考文献など

以下,重要な論点についての文献を再掲を含めて整理しておく.まず,数理統計学における estimandの定義

は Lehmann and Casella (1998)などで数学的に厳密に定義してある.しかしここで定義されている estimandは,

NRC (2010)以降で重要視されている「応答変数」「対象集団」等について全く触れられておらず,今回の議論

と完全には一致しない.また,Rubin (1996)では,"scientific estimand"という概念を,「科学的興味のある量で,

集団に対して計算され,データ収集のデザインに依存して値が変わらないもの」のように述べた上で,詳細な

説明を行っている.

NRC (2010)以降の基本的文献としては,すでに本報告書内で繰り返し引用されている,ICH Steering Committee

(2014),Mallinckrodtet al. (2012),Mallinckrodt (2013),Mallinckrodtet al. (2014)などが挙げられる.

規制当局の意見としては,FDAの統計家の意見は O’Neill and Temple (2012)や Soon (2009)にある.また,

2015年 2月に製薬協主催のシンポジウムにて,PMDAの安藤友紀氏と FDA CDER (Center for Drug Evaluation

and Research)の Lisa LaVange氏による講演が行われ,その際の発表スライドが公開されている (安藤, 2015;

LaVange, 2015).さらに,Leuchset al. (2015)では,ドイツの BfArM (Federal Institute for Drugs and Medical

Devices)の統計家の意見が述べてある.

また,Holzhaueret al. (2015)では,倫理的な理由から,病態が悪化した症例には rescue medicationの使用が

推奨されている,糖尿病の試験の estimandを検討している.

参考文献

[1] 安藤友紀. (2015). PMDAにおける経験、現状と将来展望.日本製薬工業協会データサイエンス部会シンポ

ジウム,臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

―NASレポート、EMA ガイドライン、estimandと解析方法の概説―

(http://www.jpma.or.jp/information/evaluation/symposium/pdf/20150213/20150213_4.pdf).

34

Page 36: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[2] Holzhauer, B., Akacha, M.,& Bermann, G. (2015). Choice of estimand and analysis methods in diabetes trials

with rescue medication.Pharmaceutical statistics.

[3] ICH Steering Committee (2014). Final Concept Paper E9(R1): Addendum to Statistical Principles for Clinical

Trials dated 22 October 2014.

[4] LaVange, L. (2015). Missing Data Issues in Regulatory Clinical Trials.日本製薬工業協会データサイエンス部

会シンポジウム,臨床試験の欠測データの取り扱いに関する最近の展開と今後の課題について

―NASレポート、EMA ガイドライン、estimandと解析方法の概説―

(http://www.jpma.or.jp/information/evaluation/symposium/pdf/20150213/20150213_3.pdf).

[5] Lehmann, E. L.,& Casella, G. (1998).Theory of point estimation. Springer Science& Business Media.

[6] Leuchs, A. K., Zinserling, J., Brandt, A., Wirtz, D.,& Benda, N. (2015). Choosing Appropriate Estimands in

Clinical Trials.Therapeutic Innovation& Regulatory Science, 2168479014567317.

[7] Mallinckrodt, C. H. (2013).Preventing and treating missing data in longitudinal clinical trials. Cambridge

University Press.

[8] Mallinckrodt, C. H., Lin, Q., Lipkovich, I.,& Molenberghs, G. (2012). A structured approach to choosing

estimands and estimators in longitudinal clinical trials.Pharmaceutical statistics, 11(6), 456-461.

[9] Mallinckrodt, C., Roger, J., Chuang-Stein, C., Molenberghs, G., Lane, P. W., O’Kelly, M., Ratitch, B., Xu,

L., Gilbert, S., Mehrotra, D. V., Wolfinger, R.,& Thijs, H. (2013). Missing data: turning guidance into action.

Statistics in Biopharmaceutical Research, 5(4), 369-382.

[10] Mallinckrodt, C. H, Roger, J., Chuang-Stein, G., Molenberghs, G., O’Kelly, M., Ratitch, B., Janssens, M.,

and Bunouf, P. (2014). Recent Developments in the Prevention and Treatment of Missing Data.Therapeutic

Innovation& Regulatory Science. 48. 68-80.

[11] National Research Council. (2010).The prevention and treatment of missing data in clinical trials. National

Academy Press.

[12] O’Neill, R. T., & Temple, R. (2012). The prevention and treatment of missing data in clinical trials: an FDA

perspective on the importance of dealing with it.Clinical Pharmacology& Therapeutics, 91(3), 550-554.

[13] Soon, G. G. (2009). Minimizing missing data in clinical trials: Design, operation, and regulatory considerations.

Drug Information Journal,43(4), 485-492.

[14] Rubin, D. B. (1996). Multiple imputation after 18+ years.Journal of the American statistical Association,

91(434), 473-489.

35

Page 37: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第4章 Complete case解析,LOCF,及びBOCFに対する論説

4.1 はじめに

本章では従来から用いられてきているComplete case解析,LOCF,及び BOCFの性能について,論文等で取

り上げられている論説を紹介する.

欠測のあるデータに対して良く知られた一般的な解析アプローチとして,以下の 3つがある.

1.完了例ではない被験者のデータを削除して,完了例のみのデータセット (完備データセット)に対して解

析を行う.

2.完了例ではない被験者の欠測値に対して補完を行い,補完されたデータセットに対して解析を行う.

3.完了例ではない被験者については,観測された全データを用いて,補完せずに解析を行う.

1.のように,完了例だけにデータを絞って行う解析は complete case解析と呼ばれている.2.の欠測値に対

する補完方法として最も良く知られている方法が LOCF (Last Observation Carried Forward)である.これは欠

測値に対して,欠測する直前に測定された値で補完する方法である.その他に,ベースライン値で欠測値を補

完する BOCF (Baseline Observation Carried Forward)も多く利用されている.また,3.の解析としては,最大尤

度,制限付き最大尤度といった尤度に基づく方法や,ベイズ統計に基づく方法,モーメントに基づく方法 (GEE

やそれらの応用的方法)などが含まれる.代表的な方法が本報告書の 9章で述べられる MMRM (Mixed-effect

Models for Repeated Measures)である.

本章ではこれらのアプローチのうち,まず complete case解析について述べ,その後,主として NRC (2010),

EMA (2010),及び Kenward and Molenberghs (2009)で述べられている LOCF,BOCFに対する論説を取り上

げる.

4.2 Complete case解析

欠測値のあるデータに対する最も単純なアプローチは,complete case解析である.この手法は,完了例では

ない被験者のデータを削除して,全評価時点の測定値が観測された被験者,つまり完了例に対して事前に規定

された解析方法を適用する方法である.このアプローチの優れた点としては,解析の実行が非常に容易である

ことが挙げられる.

Complete case解析が,根拠のある妥当な推定結果を与えるという状況は,特に欠測メカニズムがMCARの

もとでは幾つか考えられるかもしれないが,一般的には不適切であることが多い.完了例ではない被験者のデー

タを用いないまま解析を行うため,バイアスを引き起こす可能性があること,及び精度の低下の 2点で問題が

あると考えられる.たとえば,試験薬群で無効中止が多い場合に,完了例のデータのみを利用した解析では,

有効性を過大評価する事に繋がり,薬効評価において重大なバイアスを引き起こす可能性がある.また,ラン

ダム化された被験者の中で完了例のみのデータを利用することで,例数が減少して,精度の低下に繋がると考

えられる.

ただし,欠測割合が非常に少ない臨床試験においては,complete case解析の結果は被験者全体の結果を反映

しており,complete case解析の適用の可能性があると考えられる.

36

Page 38: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

4.3 補完に基づくアプローチ

欠測値を補完する方法は,complete case解析に比べて,完了例ではない被験者の情報を利用できるという長

所がある.そのため,適切な補完を行うことで,complete case解析で懸念されるバイアスや精度の低下を緩

和することが可能であると考えられる.一般的な臨床試験で得られるような反復測定経時データに対しては,

LOCFや BOCFといった手法が知られている.これらは完了例ではない被験者の欠測値をそれぞれ,その被験

者の欠測する直前に測定された値,またはその被験者のベースライン測定値で補完する手法である.これらは,

被験者ごとに,最後に測定された値,またはベースライン値といった単一の値で補完するため,NRC (2010)で

は single imputation method (以下,単一補完法)と呼ばれている.これらの単一補完法については,理論的に,

あるいは経験的に,多くの懸念点があることが知られている.また,NRC (2010, p77)では,LOCFや BOCF

といった単一補完法は,前提となっている仮定が科学的に妥当でない限り,主要な方法として使うべきではな

いと明記している.

4.3.1 LOCFについて

単一補完の方法である LOCFは単調な欠測,及び非単調な欠測の両者に対して適用可能である.NRC (2010,

p65-66)に記載されている通り,LOCFは,プロトコールで規定された時点で評価を行う試験において,被験者

の応答変数が脱落後に変化しないという強い仮定が成り立つ場合に,導かれる応答変数の推定量にバイアスが

入らないとされる補完法である.ただし,この仮定を満たすかどうかについて十分精査されることなく,広く

一般的に使用されている可能性がある.そのため,脱落以降は被験者の応答変数の値が変化しないことの妥当

性が疾患領域,薬剤の特徴や臨床現場の実情等と合致しているかについて十分考察を与えたもとで,適用を検

討しなければいけない.

慢性疾患の治療薬の治験などでは,脱落した被験者が存在する場合,その被験者の応答プロファイルが,脱落

後にすぐに変化するか,又は段々と初期症状に戻っていくのではと考えられるかもしれない.脱落後に応答変

数の値が一定であるという LOCFの仮定は,そのような場合には満たされないことが想定される.また,LOCF

は補完した値を,あたかも測定値のように扱うため,complete case解析に比べて,データの情報量が増える.

このことによって,線形モデルを特徴づけるパラメータ (平均差,分散,相関など)のすべてに対して影響を与

えることを,理解しておく必要がある.

LOCFを用いた解析は,一時的に治療群間で治療効果に差がある場合,最終時点における治療効果に対して

誤った結論を導く可能性が高いと考えられている.Molenberghset al. (2004)では論文中の全てのケースにお

いて,LOCFは真の,ただし未知である治療効果に依存したバイアスを持つことを示している.Kenward and

Molenberghs (2009)に記載されている一つの例として,治療効果の差が試験期間の初期は時間と共に増加する

場合で,試験期間の中盤で効果の差が最大になる状況を考えよう.その後効果の差が減少していき,治療期間

の最後 (評価時点)には効果の差が完全に消失しているとする.さらに脱落の大部分は試験の中盤で起こってい

るとする.このとき,LOCFに基づく解析では,群間差が開いている中盤での値が補完されてしまうため,治療

効果の差が無いという帰無仮説を誤って棄却する可能性が高くなってしまうだろう.このため,LOCFを用い

るときは,自然経過で改善を示す疾患かどうかについて留意しておくことが必要である.また,治療の目的が

疾患の症状を維持させることで,放置しておくと悪化するような疾患の場合 (アルツハイマー病など)に LOCF

を適用すると,誤って治療効果を過大評価してしまう.LOCFの性質については 12章のシミュレーションでも

取り上げているため,参照されたい.

最後に,NRC (2010, p65-66)に基づき,欠測メカニズムとの関係における注意点を述べる.LOCFは欠測メ

カニズムが MCARのもとか,又は MAR のもとでは,妥当な方法であると誤って理解されていることがある

が,LOCFを妥当とする仮定は,MNARの仮定であることを強調したい.ここで,n個の予定評価時点があり,

最終評価時点 nの欠測値に制限して考える.欠測メカニズムがMARであることの仮定は,以下のようになる.

なお,被験者 iの添え字を省略している.

P (Yn|X,Yo, R = 1) = P (Yn|X,Yo, R = 0) (4.1)

37

Page 39: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

ここで,Rは時点 nの欠測識別変数で,R = 0であれば欠測であること,R = 1であれば測定されていること

を意味する.つまり,式 (4.1)はデザイン行列Xと観測データYo = (Y1, ..., Yn−1)に基づいた Yn の予測分布

が,欠測した場合と観測された場合で同じであることを示している.一方,LOCFを用いた推定量にバイアス

が入らないための(十分)条件は,欠測値 Ynは,確率 1で Yn−1と等しい.式で表すと,それは以下のように

なる.

P (Yn = Yn−1|X,Yo) = 1

ゆえに,一般的に P (Yn|X,Yo, R = 0) = P (Yn|X,Yo, R = 1)であり,LOCFはMCAR,及びMAR のときに

妥当な手法であることを保証していない.

なお,ここまでは主に NRC (2010),及び Kenward and Molenberghs (2009)で論じられている内容を中心に取

り上げてきた.一方,EMA (2010)においては,具体的な状況については明記されていないが,規制上の見地

から,明らかに保守的な解析 (試験治療の効果を過小評価する解析)に基づく結論は,説得力のあるエビデンス

となりうると述べられている.そのため,保守的な推定値を与えると考えられる状況下では,LOCF適用につ

いて,検討の余地があると考えられる.

4.3.2 BOCFについて

LOCFと同じく単一補完の手法として BOCFがある.この方法は完了例ではない被験者の欠測値をその被験

者のベースライン測定値で補完する手法である.つまり,ベースラインからの変化量をエンドポイントとする

場合には,欠測値は全て 0で置き換えられる.

BOCFは,慢性疼痛のような疾患で,脱落後には薬剤の効果が消えて,治療前の状態に戻ると想定すること

が妥当な場合においては,BOCFの選択が可能と考えられる旨が EMA (2010)に記載されている.

一方で,これまで述べてきたような LOCFに対する論説は BOCFに対しても同様にあてはまる.特に,ある

被験者が試験の途中で急激な悪化症状を示して脱落となった場合,BOCFはこの症状が悪化したという事実を

完全に無視してしまう.この面においては LOCFよりも顕著であり,BOCFを利用する際には十分考慮してお

くことが必要である.

また,LOCF,及び BOCFといった単一補完の方法は,本来持つであろうデータの不確実性を,単一の値で

補完することで無視することに繋がり,真のデータの複雑さとは異なるものになってしまうと考えられる.

4.3.3 Estimandと LOCF,及び BOCF

LOCF,BOCFは,今まで見てきたような側面があるが,解析結果が妥当となる状況,もしくは明らかに保

守的な推定値を与える状況下では,主要な estimandに対する解析として利用可能である.具体的には,NRC

(2010),及び Ayele et al. (2014)において,LOCF,BOCFはそれぞれ efficacy,及び effectivenessの estimand

に対する解析に対して,アプローチの一つとなり得る旨が記載されている.

LOCFは治療が中止されるまでの期間に計画通りに投与された薬剤の効果を反映していることから efficacyと

して,BOCFは治療が中止された後は治療開始時の元の状態になるという仮定が妥当であるときに,effectiveness

として適切となり得ると考えられる.具体的には,Ayeleet al. (2014)に基づけば,estimand 3に対して LOCF

の適用が,estimand 6に対して BOCFの適用が考えられ得る.

ただし,これ以外の estimandにおいても,解析結果が妥当となること,もしくは明らかに保守的な推定値を与

えることといった,LOCF,BOCFを妥当とする仮定を十分検討したうえであれば,両手法はそれぞれ efficacy,

及び effectivenessに対する解析の方法として,臨床試験で適用していくことが考えられる.これらも踏まえた

感度分析については本報告書の 10章以降を参照されたい.

4.3.4 その他の補完方法

本章では complete case解析,及び単一補完の方法として LOCFと BOCFを取り上げた.今まで述べてきた

ように,これらの適用は容易であり,また,妥当な仮定のもとでは,適切な場合があり得る一方で,多くの懸38

Page 40: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

念点がある.これらの懸念点の一部を解消できる方法として,Multiple Imputation (MI)が提案されている.

MI は欠測値に対して,補完を複数回 (M 回)行う.このため,単一の値で補完を行う LOCFや BOCFに比

べて,欠測値の予測に対する不確実性をより考慮することが可能であると考えられる.また,欠測メカニズム

がMARの場合,補完モデル,及び解析モデルが正しければ,バイアスのない解析が可能である.この方法は,

補完をM 回行い,M 個の完備データセットを生成し,各完備データセットに対して解析を行い,M 個の解析

結果を 1つの結果として統合する方法である.Pattern Mixture Model (PMM)の解析で利用されることも多いた

め,詳細は 6章に記載する.

4.4 まとめ

LOCFや BOCFのような単一補完法は,実行が容易だが,2つの誤解がある.1つ目はMAR またはMCAR

の欠測メカニズムのときに正しい推測ができる方法であるという誤解,2つ目はそれらは試験治療に対して,

プラセボ群や標準治療が有利に働く傾向にある (保守的である) という誤解である.特に後者は一般的には真

実ではないことを正しく認識しておく必要がある.なぜならこれらの方法は前述したように,疾患の特性など

によっては,常に保守的な推定値,標準誤差,信頼区間を与えるとは限らず,保守的とはみなされない場合,

NRC (2010)や EMA (2010)共に使用が推奨されていないからである.

一方で,疾患の特性などによって適切な仮定を満たしていると考えられ,明らかに保守的な推定値を与える

ような場合は,選択肢の一つとなり得ることも認識しておく必要がある.加えて,他の選択肢としてMI があ

り,これは補完による不確実性を考慮できる方法である.MI の詳細は 6章で述べる.

参考文献

[1] Ayele, B. T., Lipkovich, I., Molenberghs, G., and Mallinckrodt, C. H. (2014). A Multiple-Imputation-Based Ap-

proach to Sensitivity Analyses and Effectiveness Assessments in Longitudinal Clinical Trials.Journal of biophar-

maceutical statistics, 24(2), 211-228.

[2] European Medicines Agency. Committee for Medicinal Products for Human Use (CHMP).Guideline on missing

data in confirmatory clinical trials. EMA/CPMP/EWP/1776/99 Rev. 1.

http://www.ema.europa.eu/docs/en_GB/document_library/Scientific_guideline/2010/09/WC500096793.pdf.

Published July 2, 2010.

[3] Kenward, M. G., and Molenberghs, G. (2009). Last observation carried forward: a crystal ball?.Journal of bio-

pharmaceutical statistics, 19(5), 872-888.

[4] Molenberghs, G., Thijs, H., Jansen, I., Beunckens, C., Kenward, M. G., Mallinckrodt, C., and Carroll, R. J. (2004).

Analyzing incomplete longitudinal clinical trial data.Biostatistics, 5(3), 445-464.

[5] National Research Council.The Prevention and Treatment of Missing Data in Clinical Trials. Panel on Handling

Missing Data in Clinical Trials.Committee on National Statistics, Division of Behavioral and Social Sciences and

Education. Washington, DC: The National Academies Press; 2010.

39

Page 41: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第5章 Selection Model

5.1 はじめに

本章では Selection Model (SM)を扱う.SMは,欠測のあるデータの解析に用いられる基本的なモデルであ

り,本報告書の主題の 1つであるMMRM もMAR を仮定した SMの 1つである.

本章では,

• 一般のMAR を仮定した SMの中でのMMRM の特徴

• MMRM を主解析とした場合に,感度分析として用いる手法とMMRM との違い

に注意しつつ,「MAR を仮定した SM」,「MMRM」,「MNAR を仮定した SM」の順に説明する.

5.2 SMの一般的定義

5.2.1 記号の確認

• i:被験者番号 (i = 1, · · · , N)

• j:時点 (j = 1, · · · , n)• Yij:被験者 iの症例の時点 j での応答変数の値

• Yi:被験者 iの応答変数全てのベクトル(観測,欠測両方含む)

• Yoi:被験者 iの応答変数のうち,観測されたものを全て集めたベクトル

• Ymi :被験者 iの応答変数のうち,欠測したものを全て集めたベクトル

• Ri:被験者 iの欠測識別変数を全て集めたベクトル

• 完全データ (full data1):(Yi,Ri)

• 観測データ (observed data):(Yoi ,Ri)

5.2.2 SMの一般的定義

SMの定義は以下の通りである (Little and Rubin, 2002).

f(Yi,Ri |θ,ψ) = f(Yi |θ) · f(Ri |Yi,ψ)

ここで,重要な点は以下のことである.

• 応答変数Yiの分布 f(Yi |θ)はRiで条件づけられていない周辺分布を用いており,欠測識別変数Riの

分布はYi を与えたもとでの条件付き分布を用いている.

次に,本報告書では以下のことを仮定する.

• 応答変数の分布のパラメータ θと,欠測識別変数の分布のパラメータψは分離している.つまり,θとψの間には重複も(自明でない)関数関係もない2.

1日本語の「完全データ」は"complete data"(欠測のないデータ)に対して用いられることも多いため,注意が必要である.2詳しくは 2章の「2.4.2無視できる欠測メカニズム」参照.

40

Page 42: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

次に,共変量Xiと変量効果 biを明示的に表示したモデルを考える.まず,応答変数のパラメータベクトル θ

を,

θ =

(θ1

θ2

)

と分け,変量効果 bi,共変量Xi を与えたもとでの応答変数Yi の条件付き分布の密度関数を

f(Yi |Xi,bi,θ1)

とし,共変量Xi を与えたもとでの変量効果 bi の分布の密度関数を

f(bi |Xi,θ2)

とおく.このとき,応答変数の周辺分布の密度関数は

f(Yi |Xi,θ) =

∫f(Yi, |Xi,bi,θ1) · f(bi |Xi,θ2)dbi

と表せる.これより,変量効果・共変量を明示的に示した SMは以下のようになる.

f(Ri,Yi,bi |Xi,θ,ψ) = f(Yi |Xi,bi,θ1) · f(Ri |Xi,Yi,bi,ψ) · f(bi |Xi,θ2) (5.1)

以下,このモデルを用い,尤度を用いた推定を考える.その際,欠測データが存在することを想定するため,2

章で定義した観測データの尤度を考える3.

5.2.3 SMの対象となる estimand

SMの対象となる estimandは,大別すると efficacyである.つまり,全例プロトコール通りに投与を完了し

たと想定した場合の有効性が評価対象である.そのため,投与中止後に薬効が消失し,応答変数がベースライ

ン値近くに戻る場合などであっても,投与中止後の推移は考慮されていないことに注意が必要である.3章の

Mallinckrodtの 6つの分類の中では,estimand 2, 3が該当する.

5.3 MARを仮定したSM

同じ SMであっても,欠測メカニズムとして MAR を仮定するか MNAR を仮定するかによって,解析の理

論・実装の容易さや結果の評価の仕方が大きく異なる.以下,この違いにも注目しつつ,式を追いながら解析

手法を検討していく.なお,パラメータが分離していることを仮定しているため,MAR の場合は 2章で定義

した「無視できる欠測メカニズム」となる.このとき,計算が極めて容易になることを以下で確認する.

5.3.1 MARを仮定した SMその 1(SMの一般論)

MARを仮定し,興味あるパラメータが応答変数の分布のパラメータ θのみとする.このとき,Riの(条件

付き)分布は

f(Ri |Xi,Yi,bi,ψ) = f(Ri |Xi,Yoi ,ψ)

3記号が煩雑となるため,繰り返しておくが

θ =

(θ1θ2

)である.

41

Page 43: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.これより,完全データの尤度 (変量効果あり)は

f(Yi,Ri,bi |Xi,θ,ψ) = f(Yi |Xi,bi,θ1) · f(Ri |Xi,Yoi ,ψ) · f(bi |Xi,θ2) (5.2)

となる.しがたって,観測データの尤度は

f(Yoi ,Ri |Xi,θ,ψ) =

∫ ∫f(Yi,Ri,bi |Xi,θ,ψ)dbidY

mi

=

∫ ∫f(Yi |Xi,bi,θ1) · f(Ri |Xi,Y

oi ,ψ) · f(bi |Xi,θ2)dbidY

mi (∵ (5.2))

= f(Ri |Xi,Yoi ,ψ) ·

∫ ∫f(Yi |Xi,bi,θ1) · f(bi |Xi,θ2)dbidY

mi

= f(Ri |Xi,Yoi ,ψ)

∫f(Yo

i ,Ymi |Xi,θ1,θ2)dY

mi

= f(Ri |Xi,Yoi ,ψ) · f(Yo

i |Xi,θ)

となる.ここで,両辺の対数をとると,

log f(Yoi ,Ri |Xi,θ,ψ) = logf(Ri |Xi,Y

oi ,ψ) · f(Yo

i |Xi,θ)

= logf(Ri |Xi,Yoi ,ψ)+ logf(Yo

i |Xi,θ)

となる.つまり,応答変数の分布のパラメータ θのみが興味の対象であり,推定に最尤法を用いる場合,脱落

確率の(条件付き)分布 f(Ri |Xi,Yoi ,ψ)がどのように変わっても,θで微分すると 0となるため,θの推定

には影響を与えない.つまり,欠測メカニズムが「無視できる」わけである.

【Yi の分布の仮定】

いま,応答変数Yi の分布については特に規定することなく,一般論で検討してきた.しかし,実際の解析

では,この分布に対して何らかの仮定をすることが普通である.

現実的によく用いられる仮定の 1つは,Yi に線形混合モデルを,変量効果・誤差共に正規分布を仮定する

ものである.このとき,解析はたとえば SASの PROC MIXED等を用いて容易に行える.一方,正規分布を当

てはめることが妥当であったか,という点に検討の余地が残る.

別の方法として,Yiの分布に極力仮定をしない,という方法も考えられる.というのも,SMでは,f(Yi |Xi,bi) =

f(Yoi ,Y

mi |Xi,bi)に分布を仮定しても,欠測がある場合は一般にその分布の仮定が正しいかどうかを確認す

ることができない4ので,「できるだけ分布の仮定を少なくすることで,誤特定のリスクを減らしたい」と考え

るためである.このような目的で用いられる方法に,IPW,GEE,wGEEや Doubly Robustな推定量等を用い

るセミパラメトリックな方法がある5.これらについては 8章で述べるが,モデルの仮定が少ないため,誤特定

が減らせる反面,推定量の分散の計算やソフトウェアでの実行がやや面倒となる.また,パラメトリックなモ

デルが正しい場合には,推定量の分散をより大きく推定してしまうことが多くなる.

5.3.2 MARを仮定した SMその 2(MMRM )

次に,MAR を仮定した一般の SMとの違いに注目しながら,MMRM (Mixed Model for Repeated Measures)

について少し触れる.MMRM は 9章でより詳しく扱う.

"MMRM"という用語は,文献によって異なる定義で用いられており,モデルや推定方法が厳密に表現されて

いるとは言えない.Mallinckrodt (2013)の 7.2節には,「"MMRM"という用語自体の使用が推奨されておらず,

Direct Likelihood (DL)法と呼んだ上で,解析計画を立てる際はモデルの詳細を追記するのが望ましい」旨が述

べられている.一方,本報告書では「モデル・推定方法に対して適切な指定をした上であれば,用語を使用す4感度分析の部分で詳しく述べるが,Type (i)の検証不能な仮定である.5NRC (2010)の p73では,このような理由から,5章の感度分析で SMに対してセミパラメトリックなモデルを用いて検討する旨が記

載されている.

42

Page 44: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

ること自体は許容する」という立場をとる.本章ではMMRM という名前のもとに比較的よく用いられている

モデル・推定方法に対して,一般の SMの中で特徴的な部分について述べる.

まず,固定効果は「投与群」「時点(カテゴリ値)」「時点と投与群の交互作用」とする.次に,分散共分散

構造を考えるが,線形混合モデルでは変量効果の分布と誤差の分布を解析者が特定する必要がある(詳しくは

Appendix A参照).この部分の指定が,MAR を仮定した一般の SMの中で,MMRM の特徴的な部分である.

【MAR を仮定した一般の SM】

MARを仮定した一般の SMでは,上でも述べた通り一般に応答変数の分布を特定していない6.しかし,以

下,特にMMRM との対応を考えるため,応答変数に(多変量)正規分布を仮定したモデルを扱う.

このとき,変量効果と誤差のそれぞれに対して分散共分散行列を指定する.たとえば,3時点,変量効果は

被験者のみ切片項に含め,誤差は独立同分布で分散 σ2 のとき,

Yi = Xiβ + bi13 + ϵi (biiid∼ N(0, ν2), ϵi

iid∼ N(0, σ2I3), biとϵiは独立)

となる.このとき,周辺分散は

V [Yi] = V [bi13 + ϵi]

= 13V [bi]1′3 + V [ϵi]

= 13ν21′

3 + σ2I3

= ν2

1 1 1

1 1 1

1 1 1

+ σ2

1 0 0

0 1 0

0 0 1

=

ν2 + σ2 ν2 ν2

ν2 ν2 + σ2 ν2

ν2 ν2 ν2 + σ2

となる.なお,変量効果として被験者を切片項に入れる場合,通常は誤差分散に無構造 (unstructured)を用いる

ことはない.理由は以下のMMRM の項で説明する.

【MMRM 】

MMRM でよく用いられるモデルでは誤差分散を無構造 (unstructured)とする.ここでたとえば,3時点,変

量効果は被験者のみ切片項に含め,誤差分散を unstructuredとし,変量効果と誤差が独立とすると

Yi = Xiβ + bi13 + ϵi

bi iid∼ N(0, ν2), ϵiiid∼ N

0

0

0

,

σ21 σ12 σ13

σ12 σ22 σ23

σ13 σ23 σ23

となる.このとき,周辺分散は

V [Yi] = V [bi13 + ϵi] (5.3)

= 13V [bi]1′3 + V [ϵi] (5.4)

= 13ν21′

3 +

σ21 σ12 σ13

σ12 σ22 σ23

σ13 σ23 σ23

6本報告書の対象外であるため深入りしないが,カテゴリカルデータに対して一般化線形混合モデルを用いることも可能である.

43

Page 45: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= ν2

1 1 1

1 1 1

1 1 1

+

σ21 σ12 σ13

σ12 σ22 σ23

σ13 σ23 σ23

=

ν2 + σ21 ν2 + σ12 ν2 + σ13

ν2 + σ12 ν2 + σ22 ν2 + σ23

ν2 + σ13 ν2 + σ23 ν2 + σ23

(5.5)

となり,全ての成分にν2が出てくる.いま,異なる被験者のデータは全て独立のため,この状況ではν2, σ21 , σ12, · · ·

の推定値を 1つに絞ることができない7.

以上より,変量効果と誤差(相関構造:unstructured)の両方を指定した場合,分散成分のパラメータを 1つ

1つ推定することはできないことがわかる8.また,「変量効果を特定する」ということは,「誤差の持っている

複雑でよくわからない時点間相関・不等分散などを,変量効果という解釈可能な成分に特定(モデリング)し

てやり,その分だけ誤差の分布をより簡単なものにする」こととも考えることができる.そのように考えるな

らば,変量効果を指定した後でも誤差分散が unstructured,ということは,変量効果を指定しても誤差の複雑さ

が改善されなかった,ということとなる.

MMRM という手法が提案されたMallinckrodtet al. (2001)では,MMRM のモデルの式中に変量効果として

被験者を用いている.その上で,誤差分散を unstructuredとして,推定の際は変量効果は誤差と合わせて推定

している.これは一見奇妙なようにも思えるが,以下のように解釈できる.

• 1被験者の経時データは全て相関していると考えられるため,変量効果として被験者を考慮することは

自然である.

• その上で,誤差の分散共分散構造は事前に想定できないため,unstructuredを指定する.

• このとき,解析する際に,変量効果と誤差を別々に指定すると,パラメータの推定ができなくなるため,「変量効果の分散 +誤差分散」を 1パラメータとして考える.具体的には,5.5)中の ”ν2 + σ2

1”や

”ν2 + σ12”のような「足し算されたもの」をそれぞれ 1パラメータと考え,推定する.

つまり,モデルに変量効果は指定するものの,全てのパラメータの推定はできないため,変量効果の分散と合

わせたものだけを推定する,と考えるのである.

では,次にどうしてこのような面倒なことを考えるのかについて,Mallinckrodt (2013) 7.4節に即して述べる.

まず,事前情報の量にもよるが,相関構造を事前に予測することは難しいことが多いこと,実際に unstructured

が最もデータに適合することが多いことが挙げられている.さらに,Mallinckrodtet al. (2008)での検討による

と,変量効果を正しく特定するのではなくこのように扱ったとしても,薬剤の効果の推定にはほぼ影響を与え

ないようである.また,Mallinckrodtet al. (2004)での検討によると,最尤法を用いて推定した結果,相関構造

の誤特定により αエラーのインフレが起こることがあるようである.これらの観点から,MMRM では上記の

ようなモデリングが基本となっているようである.一方で,血圧や臨床検査値等のようにデータの被験者内相

関のうち,被験者特有の要因が最も大きいような場合には,Compound Symmetryのような構造が適切である

かもしれない.このような倹約な (parsimonious)モデルは,(正しく特定できるならば)unstructuredを仮定した

モデルより検出力が上がる,等のメリットがある.常に unstructuredの使用が推奨されているわけではない点

にも,注意が必要である.また,相関構造を 1つに特定するのではなく,複数の候補を設定し,情報量規準等

でモデル選択を行うと同時に推定・検定する方法なども考えられる.その場合,モデル選択と推定・検定を同

7識別性 (identifiablity)がない,という.具体例で考えると, ν2 + σ21 ν2 + σ12 ν2 + σ13ν2 + σ12 ν2 + σ22 ν2 + σ23ν2 + σ13 ν2 + σ23 ν2 + σ2

3

=

1 0.9 0.80.9 1 0.90.8 0.9 1

の場合,例えば

1. ν2 = 0.8 で σ21 = σ22 = σ23 = 0.2, σ12 = σ23 = 0.1, σ13 = 0

2. ν2 = 0.5 で σ21 = σ22 = σ23 = 0.5, σ12 = σ23 = 0.4, σ13 = 0.3

の区別をつけることができない.0 < ν2 < 1 の他の場合も同様に区別がつかない.8ただし,変量効果として施設等,被験者以外の要因を追加することは可能である.

44

Page 46: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

一データで行うことの妥当性について,判断が必要となるであろう.妥当でないと判断された場合には,相関

構造に順番をつけておき,最初に収束した構造を選択する,という方法もありうるかもしれない.これらの点

については,その正当性や統計的性能について,引き続き検討が必要であろう.

5.3.3 MNAR (outcome-dependent dropout)を仮定した SM

次に,欠測のメカニズムとしてMNARのうち,Little (2008)で定義された outcome-dependent dropoutを仮定

した場合を考える9.つまり,

f(Ri |Xi,Yi,bi,ψ) = f(Ri |Xi,Yi,ψ)

を仮定する.

このとき,完全データの尤度は

f(Yi,Ri,bi |Xi,θ,ψ) = f(Yi |Xi,bi,θ1) · f(Ri |Xi,Yi,ψ) · f(bi |Xi,θ2)

となる.ここで,まず変量効果 bi で積分すると

f(Yi,Ri |Xi,θ,ψ) =

∫f(Yi |Xi,bi,θ1) · f(Ri |Xi,Yi,ψ) · f(bi |Xi,θ2)dbi

= f(Yi |Xi,θ) · f(Ri |Xi,Yi,ψ) (5.6)

となる.(5.6)で変量効果 biが脱落確率モデル(f(Ri |Xi,Yi,ψ))に含まれていないことで,積分の計算が可

能となっている10.これを用いて,観測データの(周辺)尤度は

f(Yoi ,Ri |Xi,θ,ψ) =

∫f(Yo

i ,Ymi |Xi,θ) · f(Ri |Xi,Y

oi ,Y

mi ,ψ)dY

mi (5.7)

と表せる.MARの場合と異なり,一般に積分はこれ以上計算できない.そこで,Diggle and Kenward (1994)に

ならい,欠測識別変数Ri に以下のモデルを仮定して,積分の数値計算を行う.Rij = 1が「観測」,Rij = 0

が「欠測」であることに注意して,脱落確率モデルを

logitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ1 + ψ2Yi,j−1 + ψ3Yij (j = 2, · · · , n) (5.8)

Pr(Rij = 0 |Ri,j−1 = 0,Yi,Xi,ψ) = 1 (j = 2, · · · , n) (5.9)

Pr(Ri1 = 1 |Yi,Xi,ψ) = 1 (5.10)

とおく11.このとき,ψ = (ψ1, ψ2, ψ3)′である.また,式 (5.8)は,「被験者 iの時点 j のデータ Yij の脱落に影

響を与えているのは,1時点前の値 Yi,j−1とその時点の値 Yij の高々2つである.特に ψ3 = 0のとき,脱落は

観測値 Yi,j−1 のみに影響を受けるため,MAR となる」ことを意味し,式 (5.9)は「単調な欠測」を意味する.

式 (5.10)は,「ベースライン (j = 1)の値は必ず測定される」ことを意味する.

なお,このモデルは以下のことなどを仮定している.

9再度注意しておくが,本節の内容は一般には応答変数に正規性を仮定していない.たとえば,NRC (2010)の 5章の感度分析では,応答変数に正規性は仮定せず,セミパラメトリックなモデルに対して IPW法を用いて推定する方法が提示されている.

10ここで,f(Yi |Xi,bi,θ1) と f(Yi |Xi, θ) の違いは,たとえば線形混合モデル

Yi = Xiβ + Zibi + ϵi, biiid∼ N(0,D), ϵi

iid∼ N(0,Σ)

で bi と ϵi も独立の場合,

f(Yi |Xi,bi,θ1) =⇒ Yi |bi ∼ N(Xiβ + Zibi,Σ),f(Yi |Xi,θ) =⇒ Yi ∼ N(Xiβ,ZiDZ′

i +Σ)

という違いである.ここで,θ2 は変量効果 bi の分散共分散行列 D の成分のパラメータベクトルであり,Yi |bi の分布には含まれていないが,Yi の分布には含まれていることにも注意が必要である.

11左辺に出てくる Xi が右辺では消えているのは,Xi に依存しないモデルであることを意味している.

45

Page 47: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

1. 脱落確率の(条件付き)分布の確率関数が logistic関数で表現される.

2. 時点 j の値が欠測する確率は時点 j, (j − 1)の 2時点の Y の値にしか影響をうけない.

3. j が異なっても,「1時点前の Y の値」が脱落確率に与える影響は変わらない.つまり,「時点 2で脱落す

るかどうかに対して,時点 1のデータの与える影響の強さ(Yi1 の係数)」と「時点 4で脱落するかどう

かに対して,時点 3のデータの与える影響の強さ(Yi3 の係数)」は等しい.

このモデルが,一般の MNAR を全て扱っている訳ではない,という点には注意が必要である.なお,このモ

デルはMNARの中でも特にNFD (Non Future dependence)というメカニズムの例となっている.NFDについて

は 6章や Appendix Bで述べる.

数値計算の方法は,Diggle and Kenward (1994)では Nelder-Mead法が用いられている.Nelder and Mead法

については,Nelder and Mead (1965a, 1965b)参照.

5.4 SMによる感度分析

以下,第 II 部で主題となるMMRM を主解析にしたときの感度分析について考える.感度分析の考え方は 10

章で主に扱うが,重要であるため本章でもNRC (2010)の 5章に従った大まかな考え方を述べておく.まず,仮

定を

• Type (i):検証不能(untestable)な仮定

• Type (ii):検証可能(testable)な仮定

の 2種類に分ける.そして,Type (ii)の仮定に対しては通常のモデル診断基準などを用いた診断を行う.一方,

Type (i)の仮定に対しては,「仮定の正しさ」は確認できないため,「色々なモデルを当てはめてみて,結果の安定

性を見る」のである.特に以下,Type (i)の仮定である欠測メカニズムに対する感度分析に注目する.つまり,

主解析を(MAR を仮定した方法である)MMRM とし,一方で「MAR であるという仮定は Type (i)の仮定で

ある」ため, MNARを仮定した SMも検討する.MNARを仮定する場合,脱落確率モデル化が必要となる.以

下で,SMを用いた感度分析の 2つのアプローチを検討する.

5.4.1 アプローチ 1:脱落確率モデルを固定するアプローチ(MNAR を仮定したSMその 1)

1つ目は,脱落確率モデルを 1つ仮定し,固定するアプローチである.上で示した「MNARを仮定した SM」

と「MMRM」の結果を比較する.たとえば上で示した Diggle and Kenward (1994)では,脱落確率の(条件付

き)分布

logitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ1 + ψ2Yi,j−1 + ψ3Yij (j = 2, · · · , n) (5.11)

Pr(Rij = 0 |Ri,j−1 = 0, Ri,j−2, · · · , Ri1,Yi,Xi,ψ) = 1 (j = 2, · · · , n)

Pr(Ri1 = 1 |Yi,Xi,ψ) = 1

に対して(真ん中の式のRi,j−2, · · ·Ri1は任意),ψ1, ψ2, ψ3を全て推定すべきパラメータと考える.このとき,

モデルの特定が正しければ,ψ3 = 0のときに MAR,ψ3 = 0のときに MNAR となる.すなわち,ψ3 の値が

MARかMNARかを決める.さらに,ψ3の絶対値の大きさがMARからの乖離具合と解釈できる.Verbeke and

Molenberghs (2000)では,H0 : ψ3 = 0, H1 : ψ3 = 0とした尤度比検定を行うことで「MAR かMNAR かを判

断する」方法が提案されている12.

なお,本感度分析の主要な目的は,MAR からの乖離具合自身ではなく,群間差の推定値の変動であること

が多い.

12この方法は「脱落確率モデルが正しい」ことを前提としている.そのため,脱落確率モデルが誤っている場合の検定結果の妥当性は,一般には保証されない.

46

Page 48: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

5.4.2 アプローチ 2:感度パラメータを用いるアプローチ(MNAR を仮定した SMその 2)

2つ目のアプローチとして,脱落確率モデルが Type (i)の検証不能な仮定であることに,より重点をおくア

プローチを示す.つまり,脱落確率モデルの正しさは観測データから判断できないため,1つのモデルを考え

るのではなく複数のモデルを当てはめ,結果の安定性を判断しようとするのである.具体的には,脱落確率モ

デルの式自体は上と同じとするが,全パラメータを推定対象とするのではなく,MAR からの「ずれ具合」の

パラメータに対しては「解析者が様々な値を指定して,モデルを変えた場合の結果の安定性を見る」のである.

つまり,Diggle and Kenward (1994)のモデル

logitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ1 + ψ2Yi,j−1 + ψ3Yij (j = 2, · · · , n) (5.12)

Pr(Rij = 0 |Ri,j−1 = 0, Ri,j−2, · · · , Ri1,Yi,Xi,ψ) = 1 (j = 2, · · · , n)

Pr(Ri1 = 1 |Yi,Xi,ψ) = 1

に対して(真ん中の式のRi,j−2, · · ·Ri1は任意),MARかMNARかを分けるパラメータ ψ3の値を推定対象で

はなく,「解析者が事前に設定する値」とするのである.このとき,ψ3の値が大きくなればなるほど,MARか

らの乖離が大きくなる.そのため,ψ3にいくつかの値を代入して,応答変数のパラメータの推定値の変動をみ

ることで,MARから乖離したときの応答変数のパラメータの安定性を確認することができる.この ψ3のよう

な,MAR からの乖離を表すパラメータを,NRC (2010)の 5章では,感度パラメータ (sensitivity parameter)と

呼んでいる.また,感度パラメータは∆で表現されることも多いため,これを用いる方法を Delta adjustment

と呼ぶこともある13.

実際の解析は,以下の手順で行われる.

(i) ψ3 の値の候補を決める(たとえば「−1 ∼ 1の間を 0.1区切りで」など).

(ii) (i) の中から ψ3 の値を 1つ固定し,MNAR を仮定した SMのモデルに対して,尤度の最大化を行う.

(iii) (i) で決めた ψ3 の候補全てに対して,(ii) を実行する.

10章で,この方法を用いた感度分析の例を紹介する.

以下,紹介した 2つの感度分析の限界について述べる.まず,2つ目のアプローチは 1つ目よりも「多くの

モデル」を当てはめていることは間違いないが,あくまで脱落確率モデルの関数形は logistic関数のみであり,

「全てのMNAR のモデル」を検討しているわけではない.一方で,現実的には「全てのMNAR のモデル」を

検討することは不可能である14.また,感度パラメータ ψ3の臨床的な意味づけが難しいことから,「ψ3の妥当

な範囲を計画段階で定める」ことは非常に難しい問題である.以上を考慮した上で,今後「SMの欠測メカニ

ズムに対する十分な感度分析とは何か」について,継続して検討していくことが必要であると考えられる.こ

こで,MMRM が SMの一部である,つまり,上記内容は MMRM の感度分析に対する課題でもあることを強

調しておく.

5.5 マクロプログラムについて

以下,Missingdata.org.ukで公開されている SMのマクロについて簡単に述べる.このマクロは,先に示した

SMのアプローチ 1,2に対応するものである.詳細は Appendix Cを参照のこと.

上の説明では脱落確率モデルに対して投与群の影響を考えていないが,本マクロでは 2群に対して別々の指

定が可能である.具体的には,

(第 1群) logitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ1 + ψ3Yi,j−1 + ψ5Yij

(第 2群) logitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ2 + ψ4Yi,j−1 + ψ6Yij(5.13)

というモデル化を考える.このモデルは,群ごとに各パラメータの値が異なってよい,とするモデルであり,

今まで考えてきたモデルの式 (5.11)や (5.12)と比べて,文字 ψ1, ψ2, ψ3の示すものが異なっている点に注意が

必要である.13特に Pattern-Mixture Modelでは ∆ で表現されることが多いようである.SMでは ψi で表されることも多い.14無限通りの可能性があるため.

47

Page 49: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

5.5.1 アプローチ 1に対するマクロ(感度パラメータなし)

アプローチ 1に対するマクロが"%Selection_Model2"である.つまり式 (5.13)中の ψ1 ∼ ψ6 の全てが推定対

象である.

指定すべき変数を以下に示す.

• inputds:インプットデータセット名

• covtype:分散共分散構造(UN,TOEP,TOEPH,ARH,AR,CSH,CS)

• response:応答変数

• model:平均構造

• clasvar:カテゴリカル変数

• mech:欠測メカニズム(MCAR,MAR,MNAR)

• const:数値積分の積分範囲に関する値(3~8)

• derivative:数値計算に関するフラグ (0, 1)

• method:非線形最適化の方法(NR:Newton-Raphoson ridge,QN:準 Newton法)

• out1:アウトプットデータセット名(パラメータ推定値)

• out2:アウトプットデータセット名(差の LSMEAN)

• out3:アウトプットデータセット名(LSMEAN)

• debug:0

5.5.2 アプローチ 2に対するマクロ(感度パラメータあり)

アプローチ 2に対するマクロが"%SM_GridSearch"である.このとき,式 (5.13)の ψ1, ψ2, ψ3, ψ4は推定対象

であるが,感度パラメータ ψ5, ψ6 は解析者が指定する.

指定すべき変数を以下に示す.

• inputds:インプットデータセット名

• psi5grid:1群目の感度パラメータ ψ5(-1∼1)

• psi6grid:2群目の感度パラメータ ψ6(-1∼1)

• inputds:インプットデータセット名

• covtype:分散共分散構造(UN,TOEP,TOEPH,ARH,AR,CSH,CS)

• response:応答変数

• model:平均構造

• clasvar:カテゴリカル変数

• mech:欠測メカニズム(MCAR,MAR,MNAR)

• const:数値積分の積分範囲に関する値(3~8)

• derivative:数値計算に関するフラグ (0, 1)

• method:非線形最適化の方法(NR:Newton-Raphoson ridge,QN:準 Newton法)

• out1:アウトプットデータセット名(パラメータ推定値)

• out2:アウトプットデータセット名(差の LSMEAN)

• out3:アウトプットデータセット名(LSMEAN)

• debug:0

参考文献

[1] Diggle, P. and Kenward, M. G. (1994). Informative drop-out in longitudinal data analysis.Journal of Applied

Statistics, 43, 49-93.

48

Page 50: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[2] Little, R. J. (2008). Selection and Pattern-Mixture modes. Cphaiter 18 inAdvances in longitudinal data analaysis.

409-431.

[3] Little, R. J. A. and Rubin, D. B. (2002).Statistical analysis with missing data. 2nd edition. John Wiley& Sons.

New York.

[4] Mallinckrodt, C. H. (2013).Preventing and treating missing data in longitudinal clinical trials. Cambridge

University Press.

[5] Mallinckrodt C. H., Clark W. S. and David S. R. (2001). Accounting for dropout bias using mixed-effects models.

Journal Biopharmaceutical Statistics, 11, 9-21.

[6] Mallinckrodt, C. H., Kaiser, C. J., Watkin, J. G., Molenberghs, G.,& Carroll, R. J. (2004). The effect of correla-

tion structure on treatment contrasts estimated from incomplete clinical trial data with likelihood-based repeated

measures compared with last observation carried forward ANOVA.Clinical Trials, 1(6), 477-489.

[7] Mallinckrod, C. H., Lane, P. W., Schnell, D., Peng, Y.,& Mancuso, J. P. (2008). Recommendations for the

primary analysis of continuous endpoints in longitudinal clinical trials.Drug Information Journal, 42(4), 303-

319.

[8] National Research Council. (2010).The prevention and treatment of missing data in clinical trials. National

Academy Press.

[9] Nelder, J. A., and Mead, R. (1965a). A simplex method for function minimization.The computer journal, 7(4),

308-313.

[10] Nelder, J. A., and Mead, R. (1965b). A simplex method for function minimization - errata.The computer journal,

8(1), 27.

[11] Verbeke, G, and Molenberghs, G. (2000).Linear mixed models for longitudinal data. Springer.

49

Page 51: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第6章 Pattern-Mixture Model

6.1 はじめに

本章では,Pattern-Mixture Model(以下,PMM)の理解を深めるために,以下を述べる.

• PMMとは何か

• PMMにおける Identifying Restrictions(以下,制約条件),また制約条件と欠測メカニズムとの関連

• その他の PMM(Controlled imputationなど)

PMMに着目する理由として,以下の内容が Ratitchet al. (2013)の Introductionに記載されている.

• 定義したパターンごとに各被験者の経時データを分類し,欠測値に対する仮定が理解しやすい• 感度分析を臨床試験の標準の解析の一部とするならば,再現性が取れる及び独立にプログラミングできる

また,最近ではMallinckrodtet al. (2013)において,Jump to reference (J2R),Copy reference (CR), Copy increment

reference (CIR)などの Controlled imputationの手法も紹介されている.このように,さまざまな状況を仮定し

た多くの種類の PMMが提案され,感度分析を適切に行うために手法の選択が重要になってきた.以下に PMM

の適応を検討する際のイメージを説明する.

図 6.1は,ある臨床試験のデータをまとめたものである.応答変数は値が低いほど有効性が高いとし,中止例

については,投与中止時点ごとに部分集団を作り,完了例と区別して,各部分集団の平均をプロットした.な

お,評価時点は時点 3とし,中止例のその後の推移を点線で示した(実際の臨床試験では未知の値).このと

き,完了例は有効性が大きく,中止例は完了例ほどは有効性が大きくない.また,中止例も,中止時点ごとに

推移が異なっている.そのため,被験者全体を 1つの集団と考えて応答変数の分布を仮定するのではなく,中

止時点からなる部分集団ごとに別々の応答変数の分布(推移)を当てはめる方が,妥当な解析ができそうであ

る.このように,「応答変数の分布が異なるであろう部分集団」を,以下「パターン」と呼ぶこととし,パター

ンごとに別々の分布を考える.複数のパターンが混在した状況を扱うモデルの 1つが,「パターン混合モデル

(Patterm-Mixture Model, PMM)」である.

図 6.1において,PMMは,時点 3まで観測されている完了パターンと時点 1または時点 2まで観測されて

いる未完了パターンの応答変数の推移は,それぞれ異なっていることを仮定している.この場合,完了例だけ

を用いた時点 3での有効性の解析を行った場合,薬剤にとって有利な方向にバイアスが入ることになる.

いま,脱落パターンの実線部分である観測データから,完了例の応答変数の分布は推定可能(特定可能)で

ある.一方,点線部分である欠測データは観測できないことから未知であり,観測されているデータから応答

変数の分布は推定不可能(特定不能)である.すなわち,中止例の各部分集団の時点 3の値(図の点線の部分)

も用いて解析を行いたいが,中止例のデータは存在しないため,推定ができない.この特定不能な分布を何と

かして特定するための仮定として「制約条件」を設定し,未知の点線部分を推定する.なお,どのような制約

条件を用いるかにより,点線部分の推定結果は変わる.

PMMの対象となる estimandについて簡単に記載する.PMMは,上記の通り各脱落パターンに対して,投与

中止後の各時点に対しても応答変数の推移を想定する.その際,「投与を継続していたと仮定した推移」を想定す

るならば efficacyとなる.一方,「投与を中止した後の推移」を想定するならば effectivenessとなる.Mallinckrodt

et al. (2013)の 12章の Analytic road mapでは,PMMの estimandは efficacy (estimand 3)と考えることができ,

一方で,contorolled imputationである placebo multiple imputationは effectiveness (estimand 6)と考えられるこ

とが示されている.また, Ayeleet al. (2014)によると,placebo multiple imputationは,effectivenessの立場と

して,疾患及び薬剤の特性に応じて,適切な補完モデルを選択することで,effectivenessに対する妥当な推定

50

Page 52: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

量を与えると解釈できる.一方,efficacyの立場として,補完モデルによって efficacyに対する保守的な推定量

を与えることから,MNAR を仮定した感度分析としてとして解釈できる.このように,「脱落パターンに対し

て,どのような推移を想定するか」によって,両方の estimandを推定対象とできることに注意したい.

図 6.1:各脱落パターンごとの応答変数の推移図

6.2 記号の整理と前提事項

PMMで用いられる確率密度関数の定義の説明及び記号の整理を行う.

• 確率密度関数 1:最終観測時点 Rを j とし,かつ応答変数 Y1, .., Yt−1を条件付けたもとでの応答変数 Yt

の確率密度関数を以下のように定義する.

fj (Yt|Y1, .., Yt−1) := f (Yt|Y1, .., Yt−1, R = j)

この Rはこれまでの章で用いてきた欠測識別変数ベクトルではなく,最終観測時点であることに注意し

たい1.この場合,最終観測時点Rが jであることから,応答変数 Y1, .., Yj までは観測されているデータ

となる,一方,応答変数 Yj+1, .., Yt は未観測のデータとなる.既に観測されているデータは分布が特定

可能 (分布のパラメータが,観測されたデータから推定できるという意味)となるが,未観測のデータが

従う分布は特定不能な分布となる.ここで,後ほど説明する制約条件 NFMVを仮定した PMMを考える

上で,応答変数が過去,現在,未来のどれに相当するか考える必要がある.応答変数の最終観測時点 R

が jのとき,(j + 1)時点で最初の欠測が起こるため,j時点は過去,(j + 1)時点は現在,(j + 2)時点以

降は未来の応答変数に相当すると考える.j = 1のときの Y3 の確率密度関数の具体例を示す.

例 1)

f1 (Y3|Y1, Y2) = f (Y3|Y1, Y2, R = 1)

1単調性を仮定する場合,「欠測識別変数」と 1:1に対応するため,本章では後に記載する Ri は被験者 i の欠測識別変数ベクトルとし,R は最終観測時点のスカラーとする.Molenberghset al. (1998), Kenwardet al. (2003)と同様の記法である.

51

Page 53: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f1(3|12) = f (Y3|Y1, Y2, R = 1)

2行目は,1行目の確率分布関数を簡略化した記法であり,後で使用する.最終観測時点 Rが 1である.

すなわち,応答変数 Y1は過去に観測されているデータ,応答変数 Y2は現在の未観測のデータ,応答変数

Y3 は未来の未観測のデータとなる.この場合,上記の応答変数 Y3 の条件付き分布は特定不能な分布と

なる.

例 2)

f2 (Y3|Y1, Y2) = f (Y3|Y1, Y2, R = 2)

f2(3|12) = f (Y3|Y1, Y2, R = 2)

最終観測時点Rが 2である.すなわち,応答変数 Y1, Y2は過去に観測されているデータ,応答変数 Y3は

現在の未観測のデータである.したがって,上記の応答変数 Y3の条件付き分布は特定不能な分布となる.

例 3)

f3 (Y3|Y1, Y2) = f (Y3|Y1, Y2, R = 3)

f3(3|12) = f (Y3|Y1, Y2, R = 3)

最終観測時点 Rが 3である.すなわち,応答変数 Y1, Y2, Y3 は過去に観測されているデータである.し

たがって,上記の応答変数 Y3 の条件付き分布は特定可能な分布となる.

• 確率密度関数 2:最終観測時点Rが t以上と条件付けたもとでの応答変数 Y1, ..., YT の確率密度関数を以

下のように示す.

f(≥t) (Y1, .., YT ) = f (Y1, .., YT |R ≥ t)

6.3 PMMについて

PMMは,Little (1993, 1994, 1995)により,欠測のあるデータの解析において,Selection Model(SM)に対

するもう一つの別の方法として提案された.PMMの一般的な確率モデルを示す.

f(Yoi ,Y

mi ,Ri|Xi, θ, ψ

)= f

(Ri|Xi, ψ

)f(Yoi ,Y

mi |Ri,Xi, θ

)Yoi :被験者 iの観測された応答変数

Ymi :被験者 iの観測されなかった応答変数(欠測データ)

Ri :被験者 iの欠測識別変数ベクトル

Xi :被験者 iの共変量

ψ :脱落確率モデルのパラメータベクトル

θ :応答変数モデルのパラメータ

ここで,ψ, θにおける˜の記載理由は,SMと PMMとではパラメータの設定が一般に異なるためである.5.2.2

節の SMとの対比について述べると,以下のようになる.

• 応答変数Yiの分布はRiを与えたもとでの条件つき分布を用いており,欠測識別変数 Riの分布は周辺

分布を用いている.

52

Page 54: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

完全データYoi ,Y

mi の確率分布は共変量Xi及び欠測識別変数ベクトルRiでモデル化されている.PMMの

確率モデルの式には,欠測識別変数ベクトルごとに観測されなかった応答変数の分布が含まれているため,こ

の完全データの確率分布は観測されたデータでは推定不可能である.すなわち,共変量Xi と観測されなかっ

た応答変数Ymi の関係を構築することができない.このため,PMMは"under-identified"と呼ばれている.しか

しながら,観測されたデータから推定不可能な欠測データの分布のパラメータに関して何らかの明示的な仮定

を置くことにより,上記の完全データの分布が推定可能となる.Little (1993, 1994)は,この仮定を"Identifying

restriction"と呼び,本報告書では「制約条件」と訳す.この制約条件の具体例は 6.4節で説明する.ここで,上

記の完全データの確率分布モデル f(Yoi ,Y

mi ,Ri|Xi, θ, ψ

)の式をもう少し分解すると,以下のようになる.

f(Yoi ,Y

mi ,Ri|Xi, θ, ψ

)= f

(Ri|Xi, ψ

)f(Yoi |Ri,Xi, θ

)f(Ymi |Yo

i ,Ri,Xi, θ)

上の式において,f(Ri|Xi, ψ

)と f

(Yoi |Ri,Xi, θ

)の確率分布は観測されているデータから推定可能であ

るが,f(Ymi |Yo

i ,Ri,Xi, θ)は観測されているデータからは推定不可能であるため,推定不可能な欠測データ

の確率分布のパラメータに何らかの仮定 (制約条件)を置くことが必要となる.

本章で取り扱う欠測パターンと Ri について説明する.上記の式にある各被験者の 0と 1が並んだ欠測識別

変数ベクトルRiから欠測パターンをつくることを考える.すなわち,Ri は欠測識別変数ベクトルであり,最

終観測時点 Ri と異なる意味を持っていることに注意したい.本報告書で意味するパターンは最終観測時点に

基づく脱落パターンと定義する.他にも,脱落理由別にも基づく脱落パターンなども考えられるが,本報告

書では時点に基づく脱落パターンを取り扱う.また,本報告書の他の章同様,単調な欠測を仮定する.単調な

欠測を仮定する場合,Ri と Ri の間に 1対 1の対応がつく.

6.4 制約条件について

まず,制約条件を PMMのどの部分で用いる必要があるのかを図 6.1及び図 6.2を用いて説明する.図 6.1の

状況で時点 3の評価を行う場合,時点 1で脱落したパターン 1,時点 2で脱落したパターン 2の時点 3での値を

どのように推定するかという点が重要である.そのため,点線部分(パターン 1なら時点 2~3,パターン 2な

ら時点 3)の分布について仮定を付け加えて,なんとか推定できるようにしたい.たとえば,中止後の推移が,

• 完了例と同じとする仮定 (CCMV)

• 次の時点で中止した集団(最も近いパターン)と同じとする仮定 (NCMV)

• その中止時点で観測されている全集団と同じとする仮定 (ACMV)

などが考えられる.上記の仮定を模式的に図で表すと図 6.2となる.

図 6.2:補完のイメージ図

53

Page 55: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

上述の仮定は,脱落症例(最終時点まで到達していない症例)のパターンにおけるデータの分布の推定不可

能なパラメータに対して,何らかの制約を加えることに相当する.この推定不可能なパラメータを特定可能に

する仮定として,先述の制約条件がある.制約条件は,解析者が欠測データの平均を推定するために仮定して

いる条件であるため,NRC(2010,5, p85)の観測されているデータから妥当性の確認ができない Type (i)の

仮定である.これまでに,いくつかの制約条件が提案されている.まず,Little (1993, 1994)は脱落パターンの

データの分布の(推定不可能な)パラメータと完了例のデータの確率分布のパラメータを同じとする制約条件を

提案し,脱落症例のパターンにおけるデータの分布を特定可能とした.これがいわゆる Complete Case Missing

Values (CCMV)と呼ばれる制約条件である.すなわち,完了した被験者の情報から欠測データの情報を推定す

る方法である.その後,さらに二つの制約条件が提案されている. 一つ目は中止例のパターンと最も近いパ

ターンの被験者の情報から推定不可能なパラメータを特定するNeighboring Case Missing Values (NCMV),二つ

目は途中まで観測されている被験者から完了例までの被験者のデータを全て含めた情報から特定する Available

Case Missing Values (ACMV)である.さらに,Thijs et al. (2002)はこれら 3つの制約条件を一般化し,統一的に

扱えることを示した.これらの制約条件は全て観測されたデータの分布のみを利用して観測されなかったデー

タの分布を特定しているので,Kenwardet al. (2003)はこの制約条件の集合を”Interior family”と呼んでいる

((6.2)式参照).

  PMMを用いた解析は,以下のステップで行う.ただし,検証できない仮定を置いているので,感度分析に

おいて推定量の大きさを検討することが重要である.

(1) 欠測パターン(パターンの種類を考える)を定義し,応答変数のモデルを構築する

(2) 応答変数のモデルを,特定可能な部分と特定不能な部分に分解する

(3) 特定不能な部分に制約条件(検証できない仮定)を仮定し,モデルを特定可能にする

(4) 制約条件を用いて,特定可能にした分布から欠測値に対する補完値を生成し,多重補完されたデータを

生成する

(5) 多重補完されたデータに対し解析を実行し,多重補完されたデータの解析結果を統合する

PMMを用いた感度分析では,上記の項目 (3)の検証できない仮定(制約条件)に対して,制約条件を変えた場

合に推定量がどのように変化するかの検討を行う.以降では,各制約条件を用いた PMMの理論と実施方法に

ついて述べる.

6.5 制約条件CCMV,NCMV,ACMV を仮定したPMM

最初に,全時点のデータの同時密度関数を示す.脱落のパターンを R = 1,…, T とし,R = tは t時点まで

観測されたことを意味する.このとき,パターン tに対する全ての時点のデータの同時密度関数は

f(Y1, ..., YT , R = t|X, θ, ψ

)= ft

(Y1, .., Yt|X, θ

)× ft

(Yt+1, Yt+2, ..., YT |Y1, .., Yt,X, θ

)× f

(R = t|X, ψ

)(6.1)

と表せる.ただし,Xは共変量, θは応答変数に関するパラメータ,ψ は欠測パターンに関するパラメータを

示す.右辺の 1つ目の部分 ft

(Y1, .., Yt|X, θ

)は,観測データの分布のため,特定可能となる.2つ目の部分

ft

(Yt+1, Yt+2, ..., YT |Y1, .., Yt,X, θ

)は,欠測データの分布のため,制約条件を適用することで特定可能とな

る.なお,簡単な記載とするため,以降の節において共変量 X,応答変数に関するパラメータ θ 及び欠測パ

ターンに関するパラメータ ψは除いて記載する.

6.5.1 欠測データの分布を特定可能にする制約条件

以下,制約条件 CCMV, NCMV, ACMV を扱うが,基本的な考え方に共通部分があるため,Thijs et al. (2002)

が示した一般形をはじめに示す.(s − 1)時点までの応答変数,Y1, ..., Ys−1 のデータを与えた上で,全てのパ54

Page 56: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

ターン (j = s, ..., T )をもとに Ys が特定可能となる CCMV,NCMV,ACMV を扱える一般的な制約条件は,

ft (Ys|Y1, ..., Ys−1)︸ ︷︷ ︸特定不能な密度関数

=T∑j=s

ωsjfj (Ys|Y1, ..., Ys−1)︸ ︷︷ ︸特定可能な密度関数

, s = t+ 1, .., T (6.2)

= ωssfs (Ys|Y1, ..., Ys−1) + · · ·+ ωsT fT (Ys|Y1, ..., Ys−1)

と表せる.また,(6.2)式において,sと tの大小関係は,各制約条件を示すうえで必要な情報となるため,注

意したい.右辺の密度関数は,fs (Ys|Y1, ..., Ys−1) , · · · , fT (Ys|Y1, ..., Ys−1)の重み付き和であり,最終観測時

点 Rが s以上となっているため,これらの Ys の条件付き分布は特定可能であることが分かる.この密度関数

が interior familyの密度関数であり,イメージを以下の表 6.1に示す.4時点の脱落パターンの×の表におい

て,×の表を縦方向に眺め,×の分布をの分布の一次結合で示した混合分布を interior familyの密度関数

と呼び,一次結合の係数が (6.2)式の ωsj に相当する.

表 6.1:計画された時点が 4の場合の脱落パターン(:観測,×:欠測)時点 1 時点 2 時点 3 時点 4

パターン A

パターン B ×パターン C × ×パターン D × × ×

さらに,特定不能な密度関数が図 6.1の欠測データ(点線)に対応し,特定可能な密度関数が観測データ(実

線)に対応している.これから見ていく制約条件 CCMV, NCMV, ACMV は,縦方向のどのを,どのように

×に結びつけるのかの違いで表すことができ,重み ωsj の設定により,3つの制約条件を具体的に表すことが

できる.

6.5.2 CCMV

CCMV (Little, 1993)は以下の条件である.

ωT,T = ωT−1,T = ωT−2,T = ... = ωt+1,T = 1

かつ,

ωsj = 0, j = T.

この制約条件下で Ys の条件付き分布は

ft(Ys|Y1, ..., Ys−1) = fT (Ys|Y1, ..., Ys−1), s = t+ 1, ..., T (6.3)

となる.これは最後まで測定された完了例の情報から欠測の情報を補完するものである.完了している場合の

データを利用するため,多くの被験者が完了している場合には有用である.また,非単調な欠測のときにも利

用が容易である.具体的に,4時点までの経時測定データにおいて,CCMVを用いた場合に特定不能である密

度関数がどのように特定されるかを示す.

f3 (4|123)︸ ︷︷ ︸×の式

= f4 (4|123)︸ ︷︷ ︸の式

(以下,同様)

f2 (3|12) = f4 (3|12) , f2 (4|123) = f4 (4|123)55

Page 57: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f1 (2|1) = f4 (2|1) , f1 (3|12) = f4 (3|12) , f1 (4|123) = f4 (4|123)

CCMVのイメージは,表 6.1において全ての×の分布を時点 4まで観測されているパターン Aの各時点のの

分布で補完することである.また,CCMVで特定される分布を表 6.2に示す.

表 6.2: CCMVで特定される分布 (太字:×の部分 )時点 1 時点 2 時点 3 時点 4

パターン A f4(1) f4(2|1) f4(3|12) f4(4|123)パターン B f3(1) f3(2|1) f3(3|12) f4(4|123)パターン C f2(1) f2(2|1) f4(3|12) f4(4|123)パターン D f1(1) f4(2|1) f4(3|12) f4(4|123)

6.5.3 NCMV

NCMV は以下の条件である.

ωT,T = ωT−1,T−1 = ωT−2,T−2 = ... = ωt+1,t+1 = 1

かつ,

ωsj = 0, j = s.

この制約条件下で Ys の条件付き分布は

ft(Ys|Y1, ..., Ys−1) = fs(Ys|Y1, ..., Ys−1), s = t+ 1, ..., T (6.4)

となる.これは,欠測したパターンに対して,一番近いパターンの情報から欠測の情報を当てはめるものであ

る.具体的に,4時点までにおける経時測定データにおいて,NCMVを用いた場合に特定不能である密度関数

がどのように特定されるかを示す.

f3 (4|123) = f4 (4|123)

f2 (3|12) = f3 (3|12) , f2 (4|123) = f4 (4|123)

f1 (2|1) = f2 (2|1) , f1 (3|12) = f3 (3|12) , f1 (4|123) = f4 (4|123)

NCMVのイメージは,表 6.1において「×の分布」を「一番欠測パターンが近いの分布」で補完することで

ある.例えば,パターン Cとパターン Dの時点 3の×の分布は,パターン Bの時点 3のの分布で補完する.

また,NCMV によって特定される分布は表 6.3である.

表 6.3: NCMV で特定される分布 (太字:×の部分 )時点 1 時点 2 時点 3 時点 4

パターン A f4(1) f4(2|1) f4(3|12) f4(4|123)パターン B f3(1) f3(2|1) f3(3|12) f4(4|123)パターン C f2(1) f2(2|1) f3(3|12) f4(4|123)パターン D f1(1) f2(2|1) f3(3|12) f4(4|123)

56

Page 58: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

6.5.4 ACMV

ACMV(Molenberghset al., 1998)は以下の条件である.

ft(Ys|Y1, ..., Ys−1) = f≥s(Ys|Y1, ..., Ys−1)

= f(Ys|Y1, ..., Ys−1, R ≥ s)

=f(Y1, ..., Ys−1, Ys, R ≥ s)

f(Y1, ..., Ys−1, R ≥ s)

=f(Y1, ..., Ys−1, Ys|R = s)f(R = s) + ...+ f(Y1, ..., Ys−1, Ys|R = T )f(R = T )

f(Y1, ..., Ys−1|R = s)f(R = s) + ...+ f(Y1, ..., Ys−1|R = T )f(R = T )

=αsfs(Y1, ..., Ys−1, Ys) + ...+ αsfT (Y1, ..., Ys−1, Ys)

αsfs(Y1, ..., Ys−1) + ...+ αT fT (Y1, ..., Ys−1)  (ただし,f(R = j) = αj)

=

T∑j=s

αjfj(Y1, ..., Ys)

T∑j=s

αjfj(Y1, ..., Ys−1)

=

T∑j=s

αjfj(Y1, ..., Ys−1)T∑l=s

αlfl(Y1, ..., Ys−1)

fj (Ys|Y1, .., Ys−1)

=

T∑j=s

ωsjfj (Ys|Y1, .., Ys−1) , s = t+ 1, ..., T. (6.5)

ただし,ωsj =αjfj(Y1, ..., Ys−1)

T∑l=s

αlfl(Y1, · · · , Ys−1)

ここで記載されているαjは,全被験者数に対する観測された脱落パターン jの被験数の割合を示す(Molenberghs

et al., 1998).具体的に,4時点までにおける経時測定データにおいて,ACMV を用いた場合に特定不能であ

る密度関数がどのように特定されるかを示す.

f3 (4|123) = f4 (4|123)

f2 (3|12) = f≥3 (3|12) , f2 (4|123) = f4 (4|123)

f1 (2|1) = f≥2 (2|1) , f1 (3|12) = f≥3 (3|12) , f1 (4|123) = f4 (4|123)

ACMV のイメージは,表 6.1において全て×の分布を×の時点が観測されている全てのパターンのの分布で

補完することである.例えば,パターン Dの時点 2の×の分布は,時点 2が観測されている全てのパターン

A,B,Cの時点 2のの分布で補完する.また,ACMV に特定される分布は表 6.4である.

表 6.4: ACMV で特定される分布 (太字:×の部分 )時点 1 時点 2 時点 3 時点 4

パターン A f4(1) f4(2|1) f4(3|12) f4(4|123)パターン B f3(1) f3(2|1) f3(3|12) f4(4|123)パターン C f2(1) f2(2|1) f≥3(3|12) f4(4|123)パターン D f1(1) f≥2(2|1) f≥3(3|12) f4(4|123)

Molenberghset al. (1998)は以下の定理 1を示した.定理の証明は Appendix Bで述べる.

定理 1:脱落を伴う経時測定データにおいて,MAR と ACMV は同値である

57

Page 59: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

6.5.5 制約条件(CCMV,NCMV,ACMV)の利用

制約条件 (6.2)式を完全データの分布関数の (6.1)式に代入すると,各パターン tの観測データの密度関数を

用いて,全ての時点データの同時密度関数が以下の式で示せる.

ft (Y1, ..., YT ) = ft (Y1, .., Yt)

T−t−1∏s=0

T∑j=T−s

ωT−s,jfj (YT−s|Y1, ..., YT−s−1)

(6.6)

具体的に,4時点までにおける経時測定データにおいて,CCMV,NCMV,ACMV を用いて 4パターンの同時

密度関数を示す.なお,ω33 + ω34 = 1, ω44 = 1である.簡略化のため,後ほど ω := ω33とし,ω34 = 1− ωと

おく.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) f3 (4|123)

= f3 (123)ω44 · f4 (4|123) (∵ CCMV, NCMV, ACMV 共通)

= f3 (123) f4 (4|123) (∵ ω44 = 1)

f2 (1234) = f2 (12) f2 (3|12) f2 (4|123)

= f2 (12) [ω33 · f3 (3|12) + ω34 · f4 (3|12)]ω44 · f4 (4|123) (∵ (6.6))

= f2 (12) [ω · f3 (3|12) + (1− ω) f4 (3|12)] f4 (4|123) (∵ ω33 = ω, ω34 = 1− ω, ω44 = 1)

f1 (1234) = f1 (1) f1 (2|1) f1 (3|12) f1 (4|123)

= f1 (1) [ω22 · f2 (2|1) + ω23 · f3 (2|1) + ω24 · f4 (2|1)]

× [ω33 · f3 (3|12) + ω34 · f4 (3|12)]ω44 · f4 (4|123) (∵ (6.6))

= f1 (1) [ω22 · f2 (2|1) + ω23 · f3 (2|1) + ω24 · f4 (2|1)]

× [ω · f3 (3|12) + (1− ω)f4 (3|12)] f4 (4|123) (∵ ω33 = ω, ω34 = 1− ω, ω44 = 1) (6.7)

次に,各制約条件において ωの設定を行う.ここで各制約条件に対して Case Xという形で記載する.

Case 1: CCMV

ω = ω33 = ω22 = ω23 = 0,

ω44 = ω34 = ω24 = 1

このとき,(6.7)式における CCMVを用いた 4パターンの同時密度関数は以下となる.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) f4 (4|123)

f2 (1234) = f2 (12) f4 (3|12) f4 (4|123)

f1 (1234) = f1 (1) f4 (2|1) f4 (3|12) f4 (4|123)

Case 2: NCMV

ω = ω33 = ω22 = 1,

ω34 = ω23 (1) = ω24 (1) = 0

58

Page 60: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

このとき,上記の例における CCMVを用いた 4パターンの同時密度関数は以下となる.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) f4 (4|123)

f2 (1234) = f2 (12) f3 (3|12) f4 (4|123)

f1 (1234) = f1 (1) f2 (2|1) f3 (3|12) f4 (4|123)

Case 3: ACMV

ω = ω33 =α3f3 (12)

α3f3 (12) + α4f4 (12), 1− ω = ω34 =

α4f4 (12)

α3f3 (12) + α4f4 (12),

ω22 =α2f2 (1)

α2f2 (1) + α3f3 (1) + α4f4 (1), ω23 =

α3f3 (1)

α2f2 (1) + α3f3 (1) + α4f4 (1),

ω24 =α4f4 (1)

α2f2 (1) + α3f3 (1) + α4f4 (1)

ただし,αj = f(R = j)とする.

このとき,上記の例における ACMV を用いた 4パターンの同時密度関数は,Case 3で指定した ωを (6.7)式

に代入した場合である.以上より,すべての時点のデータが特定可能となった.また,欠測メカニズムとして

MAR を仮定する場合には,Case 3のようなを制約条件を設定することになる.

O’Kelly and Ratitch(2014)は,制約条件の使い分けについて以下のように述べている.

• CCMVは,欠測データの分布を完了例のみの分布を用いて解析しているため,バイアスが入る可能性が

ある

• NCMVは,欠測データの分布に一番近いパターンの分布を用いて解析しているため,そのパターンの例

数が十分に存在しない可能性があり,パラメータの推定が不安定になる場合がある

• ACMV は,欠測メカニズム MAR を仮定しているため,MAR を仮定した解析を主解析とした場合の,

欠測メカニズムに対する感度分析としては有益でない

したがって,MARを仮定した解析(たとえば,MMRM)を主解析とした場合,上記の制約条件を用いた感度分

析としてはどれも十分なものでない方法である,と述べている.また,O’Kelly and Ratitch(2014)には,MAR

を仮定したMI が制約条件 ACMV を用いた PMMとみなせることも記載されている.一方,本タスクフォース

内での議論であるが,例えば「臨床試験の前半時点の脱落による理由が有害事象,後半時点の脱落による理由

が無効中止」の場合,ACMV を適用すると,前半時点の脱落被験者及び後半時点の脱落被験者の観測されて

いるデータをひとまとめに利用することになり,利用するデータの適切性に疑問が生じる可能性があるとの意

見があった.このケースであれば,ACMV よりも NCMV も利用することが妥当になるかもしれない.また,

O’Kelly and Ratitch(2014)の上記 3点の指摘のうち,CCMVと ACMV の指摘はデータに依存しない指摘なの

に対し,NCMVの指摘はデータに依存する指摘であるため,各パターンのデータが十分であり,上述のような

NCMV が当てはまる場合もあるとの意見もあった.

6.5.6 制約条件(CCMV,NCMV,ACMV)を仮定した PMM の実装手順

これまでは欠測データの分布の特定に関する内容であったが,ここでは推定に関する実装手順を示す.

• Step1

各脱落パターン t (= 1, ..., T )における観測されたデータの分布 ft(Y1, .., Yt)に対してモデル化を行い,観

測された分布のパラメータの推定を行う.

• Step2

制約条件として CCMV,NCMV,ACMV のいずれかを選択する.

59

Page 61: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• Step3

Step2で選択された制約条件を用いて,未観測のデータの条件付き分布 ft(Yt+1, ..., YT |Y1, ..., Yt)を特定する.その際,この条件付き分布は重み ωで表現されている混合分布となるため,以下の 2つの Step(3-1

及び 3-2)が必要となる.

• Step3-1

(6.2)式は混合分布を示しているため,混合分布を構成している密度関数から 1つの分布を選択する.具

体的には,(6.2)式において (T − s+ 1)個の重み ωsj (s = t+ 1, ..., T ; j = s, ..., T )の中から一つそれに

対応する密度関数 fj(Ys|Y1, ..., Ys−1)を選択するするため,一様分布に従う確率変数 U の乱数を発生さ

せる.添え字 s1つに対して 1個の一様乱数を発生させる.添え字 sは (T − t)種類存在するため,対応

する乱数も (T − t)個必要となる.下記の条件を満たすとき k (= s, ..., T )番目の密度関数(コンポーネ

ント)が選択される.

k−1∑j=s

ωsj ≤ U ≤k∑j=s

ωsj , (k = s, · · · , T, k ≥ 2)

0 ≤ U ≤ ω11, (k = 1)

• Step3-2

k番目の密度関数より乱数として Ys のデータを発生させる.

• Step4

Step3-2により得られた乱数を用いて,多重補完を適用する.

• Step5

多重補完されたデータを適切な解析モデル(MMRM など)を用いて解析する.

• Step6

多重補完の枠組み(Rubinのルール,6.8節で説明)で薬剤の効果の推測を行う.

以上より,簡単に流れをまとめると以下となる.

1. モデルの特定(MAR の場合:ACMV)

2. MI を用いて欠測データの補完

3. 補完後,各データに対して別々に解析

4.  3.の解析結果をまとめて,1つの結論を出す

6.6 制約条件 (CCMV, NCMV, ACMV) のまとめ

いくつかの制約条件を記載したため,ここで一度整理することとする.

• 3つの制約条件 CCMV, NCMV, ACMV を説明し,これらの条件が interior familyという枠組みで取り扱

えることを示した.

• 欠測メカニズムの観点から制約条件を評価する場合,CCMV,NCMVは基本的にMNAR,ACMV はMAR

に相当する.

• 制約条件 CCMV,NCMV は MNAR ではあるため,MAR を仮定した主解析の欠測メカニズムに対する

感度分析として実施することができるが,これらの制約条件はO’Kelly and Ratitch(2014)が述べている

制約条件の使い分けの観点から好ましくないため,感度分析として十分ではなさそうと考えられる.

60

Page 62: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

また,Interior familyの重要な特徴と,以下に述べる Non Future Missing Values (NFMV)との違いを以下にま

とめる.

• Interior familyは全ての分布を特定しようとし,「どういう特定をすれば推定可能になるか」という観点で

作られている

• NFMVは「MNARの中で,比較的現実的な状況とは何か」という観点で設定されており,「特定しきれる

か」という観点がない

6.7 制約条件NFMV を仮定したPMM

CCMV, NCMVの欠測メカニズムは基本的に MNAR であるが,6.5.5節で述べたように,主解析に MAR を

仮定した場合の,欠測メカニズムに対する感度分析としては欠点がある.そこで,MNAR のうち,もう少し

現実的に仮定できそうな欠測メカニズムについて検討する.特に,現在の欠測が将来の応答変数には依存しな

い仮定を意味する,MNFD (Missing Non Future Dependence)を考える.次に,MNFDに対応する制約条件であ

る NFMV を用いた PMMを示す.なお,MNFDは NFDと記載されている文献もある(そのため,Appendix

Bでは NFDと記載している).MNFDは,仮に MAR に基づく PMMの解析を主解析とした場合,この結果

が MNAR の下でどのくらい頑健性を持つのか確認する目的として利用できる.Kenwardet al. (2003)が提案

したモデルは制約条件 NFMV を用いた PMMである.先述の Interior familyである制約条件(CCMV, ACMV,

NCMV)は「欠測データの分布を全て特定することを目的とした条件」であったのに対して,制約条件 NFMV

は「MNAR の中で,比較的現実的だと想定される部分集合を取り出すことを目的とした条件」であり,欠測

データの分布が完全に特定しきれない(ことも仕方ない)部分があることに注意したい.

まず初めに,SMの復習を行う.脱落パターンをR = 1,…, T とし,R = tは t時点まで観測されたことを意

味する.このとき,SMは下記のように与えられる.

f(Y1, .., YT , R = t|X, θ, ψ

)= f

(Y1, ..., YT |X, θ

)f(R = t|Y1, ..., YT ,X.ψ

)(6.8)

一方,PMMの同時密度関数は下記のように与えられる.

f(Y1, ..., YT , R = t|X, θ, ψ

)= f

(Y1, ..., YT |R = t,X, θ

)f(R = t|X, ψ

)= ft

(Y1, ..., YT |X, θ

)f(R = t|X, ψ

)= ft

(Y1, ..., Yt|X, θ

)ft

(Yt+1|Y1, ..., Yt,X, θ

)×ft

(Yt+2, ..., YT |Y1, ..., Yt+1,X, θ

)×f(R = t|X, ψ

)(6.9)

(6.9)式2において,最後の式の 3つの同時密度関数は過去(t時点まで:ft(Y1, ..., Yt|X, θ)),現在(t+ 1時

点:ft(Yt+1|Y1, ..., Yt,X, θ)),未来(t+ 2時点以降:ft(Yt+2, ..., YT |Y1, ..., Yt+1,X, θ))の分布を示している.

観測されたデータより分布が特定可能なのは,1つ目と 4つ目 (f(R = t|X, ψ

))の脱落パターンの分布のみで

ある.ここでも同様に,簡単な記載とするため,以降の章において共変量X,応答変数に関するパラメータ θ

及び欠測パターンに関するパラメータ ψは除いて記載する.

6.7.1 制約条件

制約条件 NFMVは,もともと SMの欠測メカニズムMNFDに対応する形で誕生した.この欠測メカニズム

Missing Non-Future Dependent(MNFD)は以下である.2(6.1)式との違いについて:(6.1)式は t時点まで観測,(t+ 1)時点は未観測と考えているのに対し,(6.9)式は過去の t時点まで観測,

現在の (t + 1) 時点は未観測,未来の (t + 2) 時点以降は未観測と考えている.そして,未来の (t + 2) 時点以降の分布だけに制約条件NFMV を仮定する点が,(6.1) 式とは異なる.

61

Page 63: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

最終観測時点 R = tとし,t時点まで観測されている応答変数ベクトル Yo = (Y1, · · · , Yt)′,t + 1時点以

降において未観測の応答変数ベクトル Ym = (Yt+1, · · · , YT )′ を与えたもとで,以下の条件を MNFDと呼ぶ

(Kenwardet al., 2003).

f (R = t|Y1, ..., YT ) = f (R = t|Y1, ..., Yt+1) (6.10)

これは,時点 (t+1)での脱落が今現在観測されていないデータ Yt+1に依存し,未来の観測されていないデー

タ Yt+2, ..., YT には依存しない,という欠測メカニズムを示している.また,2.2.3.1節で説明されているよう

に,Little and Rubin (2002)では MNAR は MAR を含まないが,本章では Molenberghset al. (2007)にならい,

MNAR はMAR を含める(図 6.5参照).このように,欠測メカニズムの定義も文献ごとに異なるため,注意

が必要である.MNARの枠組みで,SMの中で最もよく使用される Diggle and Kenward (1994)の脱落(条件付

き)確率モデル3

logitPr(Ri,t+1 = 0 |Ri1 = 1, · · · , Ri,t = 1,Yi,Xi,ψ) = ψ1 + ψ2Yi,t + ψ3Yi,t+1

もMNFDの仮定を満たすモデルとなっている.ここで,PMMの枠組みで,MNFDと同等の条件となる,Non-

Future Missing Value restrictions(NFMV)を下記のように定義する.

s ≥ t+ 2に対して,

f (Ys|Y1, ..., Ys−1, R = t) = f (Ys|Y1, ..., Ys−1, R ≥ s− 1) (6.11)

Kenwardet al. (2003)は,単調な欠測の場合にMNFDと NFMVの同値性を証明した.証明は Appendix Bで述

べる.パターン tにおいて,Ytまで過去に観測され,現在で未観測の Yt+1,または未来で未観測の Yt+2, ..., Ys−1

のデータを条件付けたうえでの未来の Ys の分布が,パターン (s− 1)以上における現在未観測の Ys または過

去に観測された Ys の分布に等しいことを示している.また,NFMV は完全にデータの分布を特定できない制

約条件になっている.具体的な例は下記である.

(例)s = 5, t = 3, 2, 1のとき

f (Y5|Y1, Y2, Y3, Y4, R = 3) = f (Y5|Y1, Y2, Y3, Y4, R ≥ 4)

⇒ Y3 までは過去に観測され,Y4 は現在未観測

  f (Y5|Y1, Y2, Y3, Y4, R = 2) = f (Y5|Y1, Y2, Y3, Y4, R ≥ 4)

⇒ Y2 までは過去に観測され,Y3 は現在未観測

f (Y5|Y1, Y2, Y3, Y4, R = 1) = f (Y5|Y1, Y2, Y3, Y4, R ≥ 4)

⇒ Y1 までは過去に観測され,Y2 は現在未観測

上記の例において,右辺は最終観測時点が R = 4を含み,このとき Y5 は現在未観測となるため,右辺も特

定不可能な分布になっていることが分かる.

また,NFMV のイメージは,表 6.1において各パターンの最終観測時点から 2時点先の×の時点に対して,

の分布で特定することである.しかし,特定した分布も完全に特定できないことを後程説明する.例えば,

パターンDであれば時点 3の×の分布に対して特定するが,一部特定されない分布が含まれている. NFMVに

よって特定される分布は以下の表 6.5のようになる.

3このモデルは Missingdata.org.ukで公開されている選択モデルのマクロでも使用している.

62

Page 64: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 6.5: NFMV で特定される分布(?:特定されない分布,f∗:一部特定されない分布を含む分布)時点 1 時点 2 時点 3 時点 4

パターン A f4(1) f4(2|1) f4(3|12) f4(4|123)パターン B f3(1) f3(2|1) f3(3|12) ?

パターン C f2(1) f2(2|1) ?   f∗≥3(4|123)パターン D f1(1) ? f∗≥2(3|12) f∗≥3(4|123)

ここで (6.11)式の右辺 f (Ys|Y1, ..., Ys−1, R ≥ s− 1)に着目する.この分布関数はパターンR = s−1とR ≥ s

に以下のように分解可能である.

f (Ys|Y1, ..., Ys−1, R ≥ s− 1) = f (Ys|Y1, ..., Ys−1, R = s− 1)︸ ︷︷ ︸特定不可能な分布

f (R = s− 1|R ≥ s− 1)

+ f (Ys|Y1, ..., Ys−1, R ≥ s)︸ ︷︷ ︸特定可能な分布

f (R ≥ s|R ≥ s− 1)

上記のパターンR = s− 1の場合は Ysの分布が特定不可能だが,R ≥ sの場合は Ysの分布は特定可能となる.

すなわち,不完全なパターンにおける下記の条件付き分布だけが特定されていない.

f (Ys|Y1,…Ys−1, R = s− 1) (6.12)

たとえば,s = 5のとき f (Y5|Y1, Y2, Y3, Y4, R = 4) だけが特定されないことが分かる.NFMV は,過去の観

測値を与えたもとでの現在観測されていない分布に対しては何も制約をおいていないことが分かる.つまり

NFMV は未特定の分布を含んでいる.そこで,NFMV だけでは決まらない部分に対する追加の制約条件とし

て CCMV,NCMV を用いることが考えられる.なお,制約条件 NFMV を適用した後,1時点先の欠測データ

の分布に対して制約条件 ACMV を適用した場合,全体の制約条件としては ACMV を適用したものと等しくな

る.これらの詳細な理論は Appendix Bで述べる.そして,ACMV がMAR に対応するのと同様に,NFMV に

おいても,Kenwardet al. (2003)は下記の定理が成立することを示した.定理の証明は Appendix Bで述べる.

定理 2:脱落を伴う経時測定データにおいて,MNFDと NFMV は同値である

証明は,Molenberghset al. (1998)が MAR と ACMV が同値であること(定理 1)を証明した方法と同様であ

る.また,制約条件 NFMV に加え,(6.12)式の現在特定されていない分布を CCMVや NCMV を用いて特定

するとき,欠測のメカニズムはMNARを仮定することになる(Mallinckrodtet al., 2013).また,ACMV は欠

測メカニズムとしてMARを仮定するため,制約条件 ACMV を仮定した PMMの結果と,NFMVと CCMVを

組み合わせた制約条件又は NFMVと NCMVを組み合わせた制約条件を仮定した PMMの結果を比較すること

は,MAR の欠測メカニズムからの乖離を評価することにつながることが,Mallinckrodt et al. (2013)によって

述べられている.

6.7.2 制約条件 (NFMV) の利用

NFMV におけるパターン tに対しての完全データの同時密度関数を下記に示す.

ft (Y1, ..., YT ) = ft (Y1, ..., Yt) ft (Yt+1|Y1, ..., Yt) ft (Yt+2, ..., YT |Y1, ..., Yt+1)

= ft (Y1, ..., Yt) ft (Yt+1|Y1, ..., Yt)T∏

s=t+2

ft (Ys|Y1, ..., Ys−1) (6.13)

一つ目の同時密度関数は,観測されたデータを用いて特定可能である.よって,二つ目及び三つ目の密度関数

を特定するのに制約条件が必要となる.まず二つ目は現在の未特定の分布のため,何からの制約のもと分布を63

Page 65: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

特定することになる.また,三つ目に (6.11)式を適用すると,特定できない部分が残るが,その部分にも二つ

目の部分に対して用いた制約条件を用いることで特定可能となる.

具体的に,T = 4時点の最終観測時点 R = 1の場合を例に示す.

f1 (Y1, Y2, Y3, Y4) = f1 (Y1) f1 (Y2|Y1)4∏s=3

f1 (Ys|Y1, Y2)

= f1 (Y1)︸ ︷︷ ︸1

× f1 (Y2|Y1)︸ ︷︷ ︸2

× f1 (Y3|Y1, Y2)︸ ︷︷ ︸3

× f1 (Y4|Y1, Y2, Y3)︸ ︷︷ ︸3

1:特定可能な分布,2:NFMV で特定しきれない分布,

3:NFMV で特定される分布

ここで,制約条件 NFMV の (6.11)式を詳しく見ていくことにする.

  s = t+ 2,…, T に対して

ft (Ys|Y1, ..., Ys−1) = f (Ys|Y1, ..., Ys−1, R ≥ s− 1)

= f≥s−1 (Ys|Y1, ..., Ys−1) (6.14)

また,この式を下記のように書き換えることが可能となる.

s = t+ 2, ..., T に対して,

f≥s−1 (Ys|Y1, ..., Ys−1) =

T∑j=s−1

αjfj (Y1, ..., Ys)

T∑j=s−1

αjfj (Y1, ..., Ys−1)

=T∑

j=s−1

αjfj (Y1, ..., Ys−1)T∑

l=s−1

αlfl (Y1, · · · , Ys−1)

fj (Ys|Y1, .., Ys−1)

=

T∑j=s−1

ωsjfj (Ys|Y1, ..., Ys−1) (6.15)

ただし,

ωsj =αjfj (Y1, ..., Ys−1)

T∑l=s−1

αlfl (Y1, · · · , Ys−1)

,

αj :パターン j において観測されている割合

である.MNARのとき,観測されたデータに基づく未観測のデータの条件付き分布は,何らかの仮定により特

定する必要がある.従って,NFMVの仮定のもとで,現在観測されなかった(最初に未観測)データの条件付

き分布は,何らかの仮定により特定する必要がある.すなわち,(6.12)式は特定されていない分布となるため,

何らかの仮定が必要となる.

ここで 4時点までの経時測定データにおいて,NFMVの制約条件を用いた 4つのパターンの同時密度関数を

示す.ただし,(6.15)式及び (6.11)式において,(6.12)式のような特定されていない分布の密度関数を何らか

の関数 gを用いて示す.ただし,f2 (1234)については細かく示し.他の分布については,同様に展開する.な

お,ω21 + ω22 + ω23 + ω23 = 1, ω32 + ω33 + ω34, ω43 + ω44 = 1である.簡単のため,後ほど δ := ω43 とし,

ω44 = 1− δとおく.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) f3 (4|123) = f3 (123) g3 (4|123)

f2 (1234) = f2 (12) f2 (3|12) f2 (4|123)64

Page 66: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= f2 (12) f2 (3|12) f≥3 (4|123) (∵ NFMV)

= f2 (12) g2 (3|12)f≥3 (4|123) (NFMV で特定しきれない分布を g2 とおく)

= f2 (12) g2 (3|12) [ω43 · f3 (4|123) + ω44 · f4 (4|123)] (∵ (6.15))

= f2 (12) g2 (3|12)[δ · g3 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ)

(さらに NFMV で特定しきれない分布を g3 とおく)

f1 (1234) = f1 (1) f1 (2|1) f1 (34|12)

= f1 (1) g1 (2|1) f1 (3|12) f1 (4|123)

= f1 (1) g1 (2|1)f≥2 (3|12) f≥3 (4|123) (∵ NFMV)

= f1 (1) g1 (2|1) [ω32 · f2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)]

×[ω43 · g3 (4|123) + ω44 · f4 (4|123)

](∵ (6.15))

= f1 (1) g1 (2|1)[ω32 · g2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]×[δ · g3 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ)

ただし,δを用いた理由は以下のように二つのパラメータ ω43, ω44を一つのパラメータ δで表現するためである.

δ = ω43 =α3f3 (123)

α3f3 (123) + α4f4 (123), 1− δ = ω44 =

α4f4 (123)

α3f3 (123) + α4f4 (123),

ω32 =α2f2 (12)

α2f2 (12) + α3f3 (12) + α4f4 (12), ω33 =

α3f3 (12)

α2f2 (12) + α3f3 (12) + α4f4 (12),

ω34 =α4f4 (12)

α2f2 (12) + α3f3 (12) + α4f4 (12)

NFMV のもとでは g1, g2, g3 の関数を規定することで,すべての時点のデータの分布が特定されることにな

る. Kenwardet al. (2003)において示されているNFD1は下記のCase 4に該当し,NFD2が下記のCase 5に該当

する.NFD1及びNFD2は interior familyにおけるCCMVやNCMVとは異なる.NFD1とNFD2で特定される

分布の表を以下に示す.表 6.5に登場した NFMVで特定されていない「?」の部分について,完了例に基づく

CCMV又は一番類似のパターンに基づく補完である NCMV により,全ての分布が特定される(表 6.6,6.7).

表 6.6: NFD1 (NFMV + CCMV)で特定される分布時点 1 時点 2 時点 3 時点 4

パターン A f4(1) f4(2|1) f4(3|12) f4(4|123)パターン B f3(1) f3(2|1) f3(3|12) f4(4|123)パターン C f2(1) f2(2|1) f4(3|12) f4(4|123)パターン D f1(1) f4(2|1) (1 − ω33 (12)) f4 (3|12) + ω33 (12) f3 (3|12) f4(4|123)

表 6.7: NFD2 (NFMV + NCMV)で特定される分布時点 1 時点 2 時点 3 時点 4

パターン A f4(1) f4(2|1) f4(3|12) f4(4|123)パターン B f3(1) f3(2|1) f3(3|12) f4(4|123)パターン C f2(1) f2(2|1) f3(3|12) f4(4|123)パターン D f1(1) f2(2|1) (1 − ω34 (12)) f3 (3|12) + ω34 (12) f4 (3|12) f4(4|123)

下記に NFMV と合わせた,いくつかの制約条件と 4時点までの同時密度関数を示す.

Case 4: NFMV+CCMV (NFD1)

g1 (2|1) = f4 (2|1) , g2 (3|12) = f4 (3|12) , g3 (4|123) = f4 (4|123)65

Page 67: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

このときの 4時点までの経時測定データにおける同時密度関数は以下となる.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) f3 (4|123)

= f3 (123) f4 (4|123)

f2 (1234) = f2 (12) f2 (3|12) f2 (4|123)

= f2 (12) f4 (3|12)f≥3 (4|123) (∵ CCMV, NFMV)

= f2 (12) f4 (3|12) [ω43 · f3 (4|123) + ω44 · f4 (4|123)] (∵ (6.15))

= f2 (12) f4 (3|12)[δ · f4 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ, CCMV)

= f2 (12) f4 (3|12)f4 (4|123)

f1 (1234) = f1 (1) f1 (2|1) f1 (34|12)

= f1 (1) f4 (2|1) f1 (3|12) f1 (4|123)

= f1 (1) f4 (2|1)f≥2 (3|12) f≥3 (4|123) (∵ NFMV)

= f1 (1) f1 (2|1) [ω32 · f2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)]

× [ω43 · f3 (4|123) + ω44 · f4 (4|123)] (∵ (6.15))

= f1 (1) f4 (2|1)[ω32 · f4 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]×[δ · f4 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ,CCMV)

= f1 (1) f4 (2|1)[(1− ω33) f4 (3|12) + ω33 · f3 (3|12)

]f4 (4|123) (∵ ω32 + ω33 + ω34 = 1)

4時点までの経時測定データにおける Case 1: CCMVの密度関数では,全ての未観測データの分布が欠測パ

ターン R = 4の分布で補完される形になっているのに対して,Case 4: NFD1の密度関数では,f1 (3|12)の未観測のデータの分布が欠測パターン R = 3の分布 f3 (3|12)と欠測パターン R = 4の分布 f4 (3|12)の混合分布で補完する形となっていることが分かる.このように表 6.2を表 6.6と比べると,NFD1は CCMVとは異なり,

完了例のデータの分布による補完だけではないことが分かる.

Case 5: NFMV+NCMV (NFD2)

g1 (2|1) = f2 (2|1) , g2 (3|12) = f3 (3|12) , g3 (4|123) = f4 (4|123)

このときの 4時点までの経時測定データにおける同時密度関数は以下となる.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) f3 (4|123) = f3 (123) f4 (4|123)

f2 (1234) = f2 (12) f2 (3|12) f2 (4|123)

= f2 (12) f3 (3|12)f≥3 (4|123) (∵ NFMV)

= f2 (12) f3 (3|12) [ω43 · f3 (4|123) + ω44 · f4 (4|123)] (∵ (6.15))

= f2 (12) f3 (3|12)[δ · f4 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ, NCMV)

= f2 (12) f3 (3|12)f4 (4|123)

f1 (1234) = f1 (1) f1 (2|1) f1 (34|12)

= f1 (1) f4 (2|1) f1 (3|12) f1 (4|123)

= f1 (1) f2 (2|1)f≥2 (3|12) f≥3 (4|123) (∵ NFMV)

= f1 (1) f2 (2|1) [ω32 · f2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)]

× [ω43 · f4 (4|123) + ω44 · f4 (4|123)] (∵ (6.15))

66

Page 68: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= f1 (1) f2 (2|1) [ω32 · f2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)]

×[δ · f4 (4|123) + (1− δ) f4 (4|123)

](∵ NCMV, ω43 = δ, ω44 = 1− δ)

= f1 (1) f2 (2|1)[ω32 · f3 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]× f4 (4|123) (∵ NCMV)

= f1 (1) f2 (2|1)[(1− ω34) f3 (3|12) + ω34 · f4 (3|12)

]× f4 (4|123) (∵ ω32 + ω33 + ω34 = 1)

4時点までの経時測定データにおける Case 2: NCMVの密度関数では,全ての未観測データの分布が類似の欠

測パターンの分布で補完される形になっているのに対して,Case 5: NFD2の密度関数では,f1 (3|12)の未観測のデータの分布が欠測パターン R = 3の分布 f3 (3|12)と欠測パターン R = 4の分布 f4 (3|12)の混合分布で補完する形となっていることが分かる.このように表 6.3と表 6.7を比べると,NFD2は NCMVとは異なり,類

似の欠測パターンの被験者のデータの分布による補完だけではないことが分かる.

 ここで 4時点のデータにおける Case 4,5の補完イメージを図 6.3及び図 6.4に示す.

図 6.3: Case 4の補完イメージ図

67

Page 69: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

図 6.4: Case 5の補完イメージ図

6.7.3 制約条件(NFMV)を仮定した PMM の実装手順

• Step1

パターンごとに特定可能な同時密度関数 ft (Y1, ..., Yt)を推定し,モデル化を行う.

• Step2

制約条件CCMVまたはNCMVを用いて,現在観測されていない Yt+1のデータの分布 ft (Yt+1|Y1, ..., Yt)のモデル化を行う.ちなみに,この分布は制約条件NFMVに含まれている未特定の分布f (Ys|Y1,…Ys−1, R = s− 1)

も対象とする.すなわち,先述の例の未特定の関数 gに対して,制約条件 Case 4 (NFMV+CCMV)又は

Case 5 (NFMV+ NCMV)の中に含まれる制約条件 CCMVまたは NCMV を適用することである.

• Step3

NFMVの制約条件を用いて,観測されたデータ及び現在観測されなかったデータを与えた上で,未来の

未観測データ ft (Yt+2, .., YT |Y1, .., Yt+1)の条件付き分布の特定を行う.

68

Page 70: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• Step4

多重補完 (Multiple Imputaiton)の考え方を用いて,パターンごとに特定された同時密度関数

ft (Yt+2, .., YT |Y1, .., Yt+1) , ft (Yt+1|Y1, .., Yt)の未観測のデータに対して多重補完する.詳細は 6.8章を

参照されたい.

• Step5

多重補完されたデータに対して選択した統計的モデル(MMRM など)を適用し解析を行う.もし,デー

タに正規性の仮定をおいているならば,データの補完に対しても同じ分布を仮定する.

• Step6

Rubin (1987)の方法を用いて,複数のデータセットに対して行われた解析結果を統合する.各パターンの薬

剤効果の推定値及び,全体の平均的な薬剤効果に興味がある場合には周辺効果として周辺解析(Marginal

analysis)が適用される.詳細は本報告書の 6.8章及び Verbeke and Molenberghs (2009)を参照されたい.

6.7.4 感度分析

ここでは 6.7.3節で示した PMMの実装手順に加えて,欠測時点から 1時点先の未観測データの分布,すな

わち,先述の 6.7.2節に記載した NFMVの制約条件を用いた 4つのパターンの同時密度関数の例にある g関数

に対して,制約条件 ACMV を用いた場合,及びこの制約条件に加え,10章で導入される感度パラメータ (∆)

を用いた PMMの実装手順を示す.ただし,感度パラメータの向きと大きさの設定方法については,議論の最

中であり,現在のところ決定的な方法は存在しないが,観測されているデータの分布を踏まえ,欠測データの

分布の位置がどの程度になるのかを臨床家と検討のうえ,決定することになるであろう.

Step2以外の手順は 6.7.3節と同様である.また,Step 2については,現在観測されていない Yt+1 のデータ

の分布 ft (Yt+1|Y1, ..., Yt)のモデル化を行う際,先述の 6.7.2節に記載した同じ例にある g 関数に対して制約

条件 ACMV を適用する.さらに,感度パラメータを加える.すなわち,Case 6 (NFMV+ACMV) 又は Case 7

(NFMV+ACMV+∆)の制約条件を適用する.

Case 6: NFMV+ACMV(ACMV 及びMAR と同値)

2 ≤ s ≤ T に対して,

gs−1 (Ys|Y1, ..., Ys−1) = f≥s (Ys|Y1, ..., Ys−1)

=T∑j=s

ωsjfj (Ys|Y1, .., Ys−1)

4時点の密度関数は以下となる.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) g3 (4|123)

f2 (1234) = f2 (12) g2 (3|12)[δ · g3 (4|123) + (1− δ) f4 (4|123)

]f1 (1234) = f1 (1) g1 (2|1)

[ω32 · g2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]×[δ · g3 (4|123) + (1− δ) f4 (4|123)

]また,上記の関数 gは以下となる.

g1 (2|1) = f≥2 (2|1) = ω22 · f2 (2|1) + ω23 · f3 (2|1) + ω24 · f4 (2|1)

g2 (3|12) = f≥3 (3|12) = ω33 · f3 (3|12) + ω34 · f4 (3|12)

g3 (4|123) = f≥4 (4|123) = f4 (4|123)

69

Page 71: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Case 7: NFMV+ACMV +∆

gs−1 (Ys|Y1, ..., Ys−1) = f≥s (Ys −∆|Y1, ..., Ys−1)

=

T∑j=s

ωsjfj (Ys −∆|Y1, .., Ys−1)

となり,密度関数は Case 6と同じになるため,関数 gのみ示す.

g1 (2|1) = f≥2 (2−∆|1) = ω22 · f2 (2−∆|1) + ω23 · f3 (2−∆|1) + ω24 · f4 (2−∆|1)

g2 (3|12) = f≥3 (3−∆|12) = ω33 · f3 (3−∆|12) + ω34 · f4 (3−∆|12)

g3 (4|123) = f≥4 (4−∆|123) = f4 (4−∆|123)

ただし,

ωsj =αjfj(Y1, ..., Ys−1)T∑l=s

αlfl(f1, ..., fs−1)

である.具体的には,

ω22 =α2f2 (1)

α2f2 (1) + α3f3 (1) + α4f4 (1), ω23 =

α3f3 (1)

α2f2 (1) + α3f3 (1) + α4f4 (1),

ω24 =α4f4 (1)

α2f2 (1) + α3f3 (1) + α4f4 (1), ω33 =

α3f3 (12)

α3f3 (12) + α4f4 (12),

ω34 =α4f4 (12)

α3f3 (12) + α4f4 (12)

となる.Case 7の制約条件は,∆ = 0のときがMARに該当する.感度分析として,この∆を,現実的な仮定

の範囲内で動かした結果を確認することにより,MAR の結果からの乖離を確認することができ,このことが

NRC (2010)の 5章にも記載されている.

6.7.5 SMと PMM の関係

Molenberghset al. (1998)は,制約条件である ACMV が SMにおけるMissing At Random (MAR)に対応する

ことを示している.このことは,SMと PMMの関係を明確にしたという点で,極めて重要な性質である.一

方,上記で示した他の CCMVや NCMV の制約条件は,Missing Not At Random (MNAR)全体の中で,極めて

限定的なものである.

そこで,Kenwardet al. (2003)は,MNARは広いメカニズムを含む概念であることを踏まえ,SMの構築の際

に,「現在の時点での欠測が,過去に観測されているデータと現在観測されていないデータに依存し,未来の観

測されていないデータには依存しない」という制約条件をMissing Non-Future Dependent (MNFDまたは NFD)

と呼び,MNAR の中で現実的な部分集合として位置づけた.この制約条件は SMの枠組みとして自然な仮定

であり,取り扱いやすくなる4.そして,Kenwardet al. (2003)は,MNFDに対応する PMMの制約条件である

Non-Future Missing Value (NFMV) restrictionを提案している.この条件は ACMV を含むが,Interior familyと

は異なる制約条件となっている.このため,欠測のメカニズムに関しても Kenwardet al. (2003)では,MCAR,

MAR, MNAR と分類し,さらにMNARを Non-future dependent及び Future dependentに分類している.これら

の関係をまとめたのが,図 6.5(Molenberghset al., 2007, p37)である.

4Shared parameter modelsでは Non-Future Dependentのような欠測メカニズムが存在しないことが示されている (Wu and Bailey, 1989;Little, 1995)

70

Page 72: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

図 6.5: SMと PMMの関係図

図 6.5より欠測メカニズムベースで制約条件を選択することができる.例えば,主解析の欠測メカニズムに

MAR を仮定した場合,欠測メカニズム MNAR に対応する PMM を感度分析として行うことにより,欠測メ

カニズムの仮定に対する感度解析を行うことができる.

6.7.6 マクロプログラム (マクロ%PATTERNMIXTURE) について

本章では,本報告書のシミュレーションを作成するにあたり使用したマクロプログラムの概略を示す.マク

ロ%PATTERNMIXTUREを構成しているマクロは以下の 6つである.

%FIRSTANL(constraint =, type =, yvar =, classvars =)

このマクロは,欠側値を補完する際に使用する分布のパラメータ(平均や共分散行列)を推定する.被験者の

サブグループごとに統計モデルを適用する.

%GENCOV (incovmean =, incovvar =, outcovset =, visitval =)

このマクロは,MIXED モデルで解析して得られた共分散パラメータの推定値とこの推定値の分散共分散行列

を用いて,共分散行列の値の乱数を生成する.

%GENPARMS(inparm =, incov =, outparm =)

このマクロは,線形混合モデルで解析して得られた固定効果の解及び固定効果の分散共分散行列を用いて,固

定効果の値の乱数を生成する.

%GENV ALS(dataset =, firstvis =, basevis =, yvar =)

各時点の欠側値を補完する値を生成する.

%MEGACALL(numimp =, Itype =, Iconstraint =, yvar =, firstv =, lastvis =)

マクロ%GENCOV,%GENPARM,%GENVALSを用いて完全データセットを作成する.numimpは補完する

回数を示す.Itypeは,時点制約(visit constraint)として NFMV を設定するか ALL を設定するかの 2種類の

みとなる.さらに,Iconstraintは時点制約により,まだ未特定な分布に対して,追加でどんな制約条件を加え

るかの設定である.これは,特定可能な制約条件の設定を意味する.この制約条件には,2つの種類 CCMV,

NCMV がある.ただし,ACMV の指定はこのマクロでは現在サポートされていない.

%ANALY ZE(numimp =, yvar =,model2 =, calssvars2 =, othervars =)

MIXED モデルを補完回数分の完全データセットに対して解析モデルを適用し,多重補完のルールにより全体

のパラメータの推定値及びパラメータの分散共分散行列を推定する.その後,各時点の各群の LSMEAN及び

信頼区間を算出する.71

Page 73: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

6.8 Multiple Imuptation(MI)

6.8.1 Multiple Imuptation の概要

MI はもともと Rubin(1978, 1987)によって提案された方法であり,以下の特徴があることが言われている.

• 欠測メカニズムがMAR であると仮定した場合,MAR に基づくMI の解析は妥当.

• 複数回の補完を行うことで,欠測値の補完に対して不確実性を考慮する.• Mallinckrodt(2013,9.4節)は,MI における解析モデルと補完モデルに使用した説明変数が尤度ベー

スのモデルの説明変数と同じならば,MI の結果は尤度ベースの結果と類似するとを指摘した.ただし,

補完モデルは,欠測値を補完するための統計モデルであり,一方,解析モデルは,多重補完された完全

データを用いて解析するための統計モデルである.

• Dmitrienkoet al. (2005)は,MI の有用性として,共変量の欠測補完を行える点,PMMの枠組みでも

適用可能な点,そして,非単調な欠測を補完し,単調な欠測をつくられる点をあげている.

6.8.2 Multiple Imuptation の正当化(Rubinのルールの原理)

MI の核となる部分はベイズ流の考え方にある.ここに 2つのパラメータ θ1, θ2 とデータ Y を仮定する.ベ

イズ流の解析では,これらのパラメータの同時事後分布は下記となる.

f (θ1, θ2|Y )

ここで,θ1 を局外パラメータとみなし,θ2 を興味あるパラメータとする.このとき,上記の事後分布は,

f (θ1, θ2|Y ) = f (θ1|Y ) f (θ2|θ1, Y )

のように分解できる.したがって,θ2 の周辺事後分布は,

f (θ2|Y ) = Eθ1 [f (θ2|θ1, Y )] =

∫f (θ1|Y ) f (θ2|θ1, Y ) dθ1

のように表せる.このとき,θ2 の周辺事後分布の平均及び分散は,

E [θ2|Y ] = Eθ1 [Eθ2 [θ2|θ1, Y ]]

V ar [θ2|Y ] = Eθ1 [V arθ2 [θ2|θ1, Y ]] + V arθ1 [Eθ2 [θ2|θ1, Y ]]

のように示せる.これらは経験モーメントを利用し近似することができる.θ1の周辺事後分布より得られたサ

ンプルを θ(m)1 ,m = 1, ...,M とする.このとき,近似的に

E [θ2|Y ] =1

M

M∑m=1

Eθ2

[θ2|θ(m)

1 , Y]= θ2

V ar [θ2|Y ] =1

M

M∑m=1

V arθ2

[θ2|θ(m)

1 , Y]+

1

M − 1

M∑m=1

(Eθ2

[θ2|θ(m)

1 , Y]− θ2

)2となる.これらの式はパラメータベクトルに拡張でき一般化できる.これらの式において,θ2は興味あるモデ

ルのパラメータとし,θ1を欠測データとする.そして,十分な標本において,θ2の条件付き事後モーメントは

最尤法または完全データセットから得られる推定量により上記の近似が可能となる.これがベイズ流事後分布

から得られるサンプルの補完が欠測データの補完に利用される理由となっている.このようにして,興味ある

パラメータ及び分散のMI の推定値がベイズ流事後分布の平均と分散の近似値となっている.事後分布の大標

本近似は正規分布の近似で得られる事後分布のパラメータに適用されるべきである.たとえば,興味あるパラ

メータがオッズ比ならば対数オッズ比を用いることである.詳細はMolenberghset al, (2007)の p107-108を参

照されたい.72

Page 74: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

6.8.3 単調回帰によるMultiple Imuptation の概要

PMMの制約条件の一つである ACMV と関係が深い MI の単調回帰の概要について記載する.この方法は,

MARを仮定したMI であり,efficacyである estimand 3を推定対象とする.また,ACMV は,欠測パターンご

とにある時点で観測された全てのデータを用いて,欠測値を補完をするのに対し,MARにもとづくMI は,パ

ターンに関係なく,観測された全てのデータを用いて,欠測値の補完をする.詳細は Yuan(2011)を参照され

たい.

最終観測時点R = tのとき,ある時点 j = t+1, t+2, ..., T の欠測値 Yj を補完するため,観測されたデータ

Y1, ..., Yj−1を用いて予測分布 Yj ∼ f (Yj |Y1, ..., Yj−1)を構築し,欠測値を多重補完する.具体的には,以下の

作業となる.

作業 1.まず線形回帰モデル Yj = β0+β1Y1+ ...+βj−1Yj−1を構築し,観測されたデータ Y1, ..., Yjを用いて,回

帰パラメータの推定値 β =(β0, β1, ..., βj−1

)′,及びその推定値の分散共分散行列の推定値 σ2

jVj = σ2j (X

′X)−1

を得る.このとき,(X′X)は Y1, ..., Yj−1 で構成されるデザイン行列となる.

作業 2.作業 1で得られた推定値 σ2j , β を用いて,以下のサンプルを得る.

分散のサンプル: σ2∗j = σ2

j (nj − j) /G, G ∼ χ2nj−j

回帰係数のサンプル: β∗ = β + σ∗jV′hjZ

ここで,nj は Yj が観測されているデータ数,Zは j 個の変数で互いに独立な標準正規変数ベクトル,V′hj は

コレスキー分解Vj = V′hjVhj により得られる上三角行列とする.このとき,パラメータの事後分布のサンプ

ルとして,β∗ = (β∗0, β∗1, ..., β∗j−1)′, σ2

∗j を得る.

作業 3.作業 2.で得られたサンプルを用いて,下記の式より欠測値 Yj の補完値 Yj を構成する.

Yj = β∗0 + β∗1Y1 + ...+ β∗j−1Yj−1 + ziσ∗j

作業 4.作業 1から作業 3をM 回繰り返す.

SASで実行する場合,PROC MIのMONOTONE METHOD = REGを指定することで実行できる.

6.8.4 Multiple Imputation により得られた複数の推定量の結果統合

興味ある k次元パラメータベクトルを θとする.補完回数をM 回とし,M 個の完全データセットから推定

されたM 個の推定量を θ(1), θ

(2), ..., θ

(M)が得られたとする.このとき,各完全データセットで得られた各推

定量 θ(m)

,m = 1, 2, ...,M の分布が下記に漸近的に従うとする.(θ(m)

− θ)

·≈ N(0,U(m)

)次に,上記を併合した推定量 θ

∗=

1

M

M∑m=1

θ(m)を考える.このとき,θ

∗の漸近分布は下記となる.   (

θ∗− θ

) ·≈ N(0,V)

V = W +

(M + 1

M

)B

ここで,

W =

M∑m=1

U(m)

M73

Page 75: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

B =

M∑m=1

(θ(m)

− θ∗)(

θ(m)

− θ∗)′

M − 1

であり,Wは平均補完内分散を示し,Bは補完間分散を示す.上記より漸近正規性により下記の検定統計量

を構成することができる. (θ∗− θ

)′V−1

(θ∗− θ

) ·≈ χ2

k

 しかし,上記の χ2k 分布に基づく推測は標本数 N だけでなく,補完数M にも依存する.そこで,Li et al.

(1991)による F 分布に基づく推測を利用する.仮説H0 : θ = θ0,H1 : θ = θ0の検定における F 統計量と p値

は下記となる.

F =

(θ∗− θ0

)′V−1

(θ∗− θ0

)k (R+ 1)

·≈ F kw

p値 = Pr(F kw > F

)ここで,

w = 4 + (τ − 4)

(1 +

1− 2τ−1

R

)2

(τ > 4の場合)

R =1

k

(1 +

1

M

)tr(BW−1)

τ = k (M − 1)

であり,M → ∞とするとき上記の従う F 分布は Fk,∞ = χ2/kの分布に近似することが知られている.SAS

で実行する際には,解析モデルで得られたM 個の解析結果を用いて,PROC MIANALYZEにより解析結果を

一つに統合することができる.ただし,この PROC MIANALYZEにおいて,τ ≤ 4の場合,上記の F 統計量

が従う第 2自由度が

w =1

2+ (k + 1) (M − 1)

(1 +

1

R

)となることに注意したい (Rubin, 1987, p137).

また,この手順は θに対する推測として,ベクトル θが仮説検定の対象である場合だけでなく,線形対比の

集合を対象とすることができる.たとえば対比統計量 Lθ に対して推測する場合には,下記となる.ただし,

L :対比ベクトルである. (Lθ

∗− Lθ

) ·≈ N

(0,LVL′)

ここで,

LVL′ = LWL′ +

(M + 1

M

)LBL′

W =

M∑m=1

U(m)

M

B =

M∑m=1

(θ(m)

− θ∗)(

θ(m)

− θ∗)′

M − 1

である.次に,MI の推定効率について記載する.Rubin (1987, p114)は補完に基づいた推定値の効率を近似的

に下記で示した.

Efficiency=(1 +

γ

M

)−1

74

Page 76: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

ここで,γ は推定すべき値に対する欠測割合である.γ はデータに欠測が全く無かったと仮定した場合に,推

定値の精度がどの程度上がるのかを定量的に示している.さまざまな補完回数M と欠測割合 γ に対して達成

される推定効率を図 6.6(抜粋:Molenberghset al, 2007, p110)に示す.

図 6.6:補完回数と推定効率の関係図

また,この表では最初の数回の補完では,欠測割合が増えるにつれて効率が急激に縮小していることを示し

ている.つまり,この表は補完データセットを数個以上作成しても,推定効率の観点からはほとんど利点がな

いことを示している.このように当初は,補完回数が 10回から 20回で十分であることが示唆されていた.ま

た,Rubin (1987)では,補完回数が 3回から 5回で十分と言われていたが,近年,適切な補完回数についての

検討が行われている.一般的に,補完回数を増やすことにより,補完間分散共分散行列Bの推定精度が上がる.

また,kが小さくない場合,補完回数が少なければ,行列 B の推定値が非正則になるかもしれない.Graham

et al. (2007)は 10% ∼ 30%の欠測割合で,検出力の低下を 1%未満にしたい場合は,20回以上の補完を推奨

している.Siddiqui (2011)は 40%以下の欠測割合で,補完回数を 10回としたシミュレーションを実施し,補

完回数について検討をしている.Whiteet al.(2011)は 100×欠測割合の補完回数を推奨し,一方,Royston

and White(2011)は,多重補完を用いた手法を比較する際には,モンテカルロエラーを考慮し,100~1,000

回を推奨している.さらに,大江ら (2015)は補完回数を増やした場合の MI の性能評価を行った.この中で,

Rubin (1987, p114)が示した漸近推定効率の式の値とシミュレーションにより求めた推定効率の値がほぼ合致し

ているとことを示したと同時に,データによっては,補完回数を 5回から 100回に増やすことにより,検出力

が 10%程度増加することがありうることを示した.補完回数を十分大きくとるほど,信頼区間及び p値の近似

精度は高くなるが,補完回数が小さすぎると,近似精度が不十分である可能性もある.我々は推定効率より検

出力の方に興味があることが多いため,対象データの欠測割合を考慮のうえ,補完回数を複数試行し,p値や

推定値の安定性を確認することが必要だと考えられる.

6.9 Marginal treatment effect (周辺治療効果)の推定

Kenwardet al.(2003)の PMMの解析において,各パターンごとの治療効果は得られるが,主な興味として

は,各パターンを統合した周辺治療効果となる.ここで各パターンの t = 1, ..., T における各群 l = 1, ..., g の

治療効果の推定値を βlt とする.また,各パターン t = 1, ..., T の被験者割合 πt とする.このとき周辺治療効

果 βl は下記となる.

βl (marginal treatment effect) =T∑t=1

βltπt, l = 1, ..., g

また,デルタ法より分散は下記となる.

V ar(β1, ..., βg

)= AVA′

ここで,

V =

Var(βlt

)O

O Var(βt

) , A =∂ (β1, .., βg)

∂ (β11, .., βTg, π1, .., πT )

75

Page 77: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

である.これより,仮説H0 : β1 = ... = βg = 0の検定については下記のWald検定統計量で検定可能となる.

(β1, ..., βg

)′ (AVA′)−1

β1...

βg

·∼ χ2g

6.10 その他のPMM

Ratitchet al. (2013)や Mallinckrodt et al. (2013)は近年,欠測データの補完に今まで述べた制約条件以外に

1. Controlled/Refernece群のデータを用いた pattern imputation,2. Delta adjustmentを用いた pattern imputation,

3.脱落理由別(AEとその他の理由で区別)の pattern imputationなどを紹介している.以下,概略を述べるが,

詳細は Ratitchet al. (2013), Mallinckrodtet al. (2013)などを参照されたい.

6.10.1 対照群のデータを用いた pattern imputation(Controlled imputation)

この補完方法は,逐次回帰及びMI を用いて,試験治療の脱落後の応答変数が対照群の応答変数の分布に従う

ようなデータ補完 (Controlled imputation)である.対照群がプラセボ群となるとき,「placebo Multiple Imputation

(pMI)」と呼ばれる5.

欠測しているデータの補完モデルを先に示す.シンプルに 2時点 Y0, Y1の状況を考え,Y0はベースラインの

応答変数とし,常に観測されるものとする.Y1はベースライン後の応答変数とし,未観測のデータも含むとす

る.このとき,Y1 の欠測識別変数を R = 0(未観測), 1(観測)とする.また,治療を示す変数を Trt = 0(対照

群), 1(試験治療群),応答変数に関するパラメータを θ,そして,共変量をXとする.このとき,欠測メカニ

ズムMNAR は下記の条件のように表せる.

f(Y1|Trt = 0, Y0, R = 0,X, θ

)= f

(Y1|Trt = 0, Y0, R = 1,X, θ

)or

f(Y1|Trt = 1, Y0, R = 0,X, θ

)= f

(Y1|Trt = 1, Y0, R = 1,X.θ

)このとき,上記の式の右辺と左辺が異なることから,MNARのひとつのシナリオ (シナリオ 1)として,試験

治療群の欠測している応答変数 Y1 は,下記の式のように対照群で観測されたデータの事後予測分布から補完

することを考える.

f(Y1|Trt = 1, Y0, R = 0,X, θ

)= f

(Y1|Trt = 0, Y0, R = 1,X, θ

) 次に,Mallinkckrodt (2013)の 10.5節 (p98-99)に記載されているデータ補完のプロセスの概略を示す.経時

データの場合,まず時点 t = 1, ..., T の欠測データを補完するために,逐次的に SASの PROC MIを用いて下

記のデータ補完から解析までを行う.

• Step 1.初期設定.ベースライン時点として t = 0をセットする.

• Step 2.反復.t = t+1をセットし,観察された被験者特有の共変量Xをもつ試験治療群とプラセボ群の

データセットを結合させる.その際,時点 1, · · · , t− 1までが観測された値または補完された値をもち,

時点 tで欠測している試験治療群とプラセボ群の被験者データを集める.

• Step 3.欠測補完.時点 1から (t− 1)の応答変数とベースライン共変量を用いて,上記で集めた時点 tの

欠測値の補完をベイズ流の回帰を用いて行う.SASでは PROC MIを用いる.ここで大事な点は,時点 t

の欠測値の補完において,プラセボ群のデータから得られる事後予測分布を推定し,プラセボ群のデー

タが補完モデルとして試験治療群とプラセボ群の時点 tの欠測している被験者データに利用されるとい

う点である.5pMI という言葉の意味も文献によって異なることがあるため,注意が必要である.

76

Page 78: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• Step 4.時点 tの欠測値の補完が完了した後,もし t < T ならば Step 2へ.t = T ならば,Step 5へ進む.

• Step 5. Step 1から Step 4の作業をM 回繰り返し,M 個の補完された完全データセットを作成する.

• Step 6.解析.M 個の完全データに対して,それぞれMMRM などの適切な解析モデルを適用する.

• Step 7.複数のデータセットから Rubin (1987)のルールを用いて,統合した点推定値,信頼区間,そして

p値を計算する.SASでは PROC MIANALYIZE を利用する.

この方法の特徴は,ある時点で対照群及び試験治療群の被験者の欠測データの補完に,その時点で観測され

た試験治療群の観測データは用いず,対照群の観測データを用いることである.このため,試験治療と対照群

の治療の差を小さくする可能性があるため,治療効果の差の推定値として,保守的な値を与える.この補完の

考えは論文 Little and Yau (1996)にある.Controlled imputationは,MNARを仮定した欠測データの補完方法に

よる解析であり,MAR による解析結果と,controlled imputationを用いた解析結果を比べ,推定量の乖離具合

を判断する感度分析として用いることも可能である.

この方法は,3章で扱った estimand 6に関連があり,"effectiveness"の枠組みにおいて,LOCFや BOCFに比

べ,同様の目的(脱落後は無治療の状態となる,という保守的な仮定)に対して,より reasonableな方法であ

ることが,Mallinckrodt (2013)に記載されている.第1の理由は,この方法は多重補完の考えを用いているた

め,単一補完である LOCFや BOCFに比べて,補完の不確実性を考慮に入れていること.第 2の理由は,この

方法は欠測値の補完の推測に対照群/プラセボ群のデータを用いて試験効果や対照/プラセボ効果を考慮してい

るのに対し,LOCFや BOCFはそれらの効果を考慮していないという点にある.一方で,efficacyの観点から

は,保守的な推定量ともみなせる. 

6.10.2 対照群のデータを用いた pattern imputation の SASでの実行

本節は,対照群のデータを用いた pattern imputationにおいて,SASでの実行方法記載する.詳細は Ratitch

et al. (2011)や Yuan (2014)を参照されたい.

PROC MI (SAS Ver 9.4)において,PMMを用いた欠測補完のために,新しくMNAR ステートメントが追加

された.このステートメントは,MNARに対応している.また,このステートメントにおいて 2つの主要なオ

プションがある.一つはMODELオプション,もう一つは ADJUSTオプションである.MODELオプションは,

どんな補完モデルを用いて,どの変数のデータから補完したいのかを規定するものである.下記に controlled

imputationの方法の SAS codeの一例を示す.

(シナリオ 1)の SAS code例

PROC MI DATA = XXXX;

  SEED = 14821;

  NIMPUTE = 100; /*補完回数の指定*/

  OUT = result;

  CLASS trt;

 MONOTONE REG(y1); /*補完したい変数名の指定及び単調回帰に基づく補完*/

 MNAR MODEL(y1/ MODELOBS = (trt = ’0’));

   /*trt=0(コントロール群)の観測された y1のデータの分布に基づいて補完*/

  VAR x0 y1; /*ベースラインデータ x0も含めて,補完に用いる変数を指定*/

RUN;

6.10.3 対照群のデータを用いた,その他の pattern imputation

Mallinckrodt et al. (2013)において,controlled imputation又は referenced based imputationとは別に Jump to

reference (J2R),Copy reference (CR),Copy increment method (CIR)が紹介され,Missingdata.org.ukで公開さ77

Page 79: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

れている PMM five macroで実行可能である.詳細は,このマクロの中の資料「MissingmacroDoc20.docx」を

参照されたい.また,各 pattern imputationのイメージ図については,Kenwardの

http://www.biostatistiikanseura.org/kenward_pmm_talk.pdfを参照されたい.

なお,対象とする estimandは,6.10.1節同様である.また,数理的な内容は,「MissingmacroDoc20.docx」に,

各パターンに多変量正規分布を仮定した方法が記載されている.本報告書で簡単に説明する.まず,被験者 i,

群 j (= 1, 2, ..., q),時点 k (= 1, ..., t)の応答変数を Yijk とする.また,参照する群 r,中止した時点(最終観

測時点)p (= 0, .., t)とする.pは脱落パターンに相当する.資料「MissingmacroDoc20.docx」においては,共

変量も含めた形で記載している.本報告書では,欠測しているデータの推定不可能な時点と群の交互作用項が,

どのパターンの交互作用項で置き換わっているのかに焦点を絞るために共変量の項を取り除き,基本モデルと

して以下を考える.

E (Yijk) = Ajk ただし,Ajk は時点 j と群 kの交互作用項

次に,補完モデルとして,共変量を取り除いて以下を考える.

Ep (Yijk) = Bpjk ただし,Bpjk は最終観測時点 pの時点 j と群 kの交互作用項

基本モデルの Ajk と補完モデルの Bpjk の関係を構築することで,J2R,CR,CIRの方法をそれぞれ構築でき

る.

J2R (Jump to reference)

Bpjk =

Ajk (for k ≤ p)

Ark (for k > p)

この方法では,脱落するまでのデータが,脱落した被験者の群の推移に基づき得られる.一方,脱落後の欠

測データは,参照群 rと同じ分布に基づき得られる.このような補完は,疼痛領域のように無治療となった瞬

間に脱落するまでの治療の影響を全くうけないような場合に適している.MNARを仮定したモデルであり,de

factoな解析 (effectivenessの評価)として適切である.

CR (Copy Reference)

Bpjk = Ark (for all p, j, k)

この方法では,脱落した被験者のデータが,脱落前後の全てのデータが参照群 r の推移に基づき得られる.

よって,脱落した被験者の脱落前のデータが無視される.

CIR (Copy Increment Reference)

Bpjk =

Ajk (for k ≤ p)

Ajp +Ark −Arp (for k > p)

この方法では,脱落するまでの被験者のデータが,脱落した被験者の群の推移に基づき得られ,一方,脱落

した以降のデータは,参照群 rの推移と並行する位置での推移に基づき得られる.Ark − Arp が参照群 rの p

時点から k時点まで効果の変化量分を意味し,この変化量が中止時点 pの群 jの効果 Ajpに足される形で表現

されていることから,脱落した以降のデータは,参照群 rと並行する形の推移に基づいていることが分かる.

この方法は,脱落するまでの治療が残存効果という形で存在する場合に適している.また,この方法も J2Rと

同様に de factoな解析として適切である.

6.10.4 Delta adjustmentを用いた pattern imputation

Delta adjustmentを用いた pattern imputationによるデータ補完方法は,感度パラメータ (∆, 10章)を用いた方

法である.対象とする estimandは,各脱落パターンに対して「投与を継続した場合」を想定するなら efficacy,78

Page 80: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

「投与中止後の推移」を想定するなら effectivenessとなる.この補完はMNAR の欠測メカニズムを仮定してい

る.ある時点で試験治療群の被験者の欠測データには,その時点で試験治療群の被験者の観測されたデータよ

りも∆分悪化しているとして補完をする.一方,対照群の被験者の欠測データには,そのまま対照群の被験者

の観測データを用いて補完をする.この補完の特徴は,試験治療群で脱落後の被験者の状態は観測された試験

治療の応答変数や共変量より得られた補完値よりも ∆分悪化していることを仮定していることである.さら

に,∆の値を変更していき,MARを仮定した解析結果から結論が変わる点がどの程度の∆なのかを確認する

ストレステストがある.その際,結論が変化する点を tipping pointと呼び,MARを仮定した解析の感度解析と

して tipping point analysisと呼ばれている.

補完モデルは以下である.6.10.1節で取り扱った 2時点 Y0, Y1 の状況において,もう一つの MNAR のシナ

リオ (シナリオ 2)として,同じ群の中で観測されている応答変数 Y1と未観測の応答変数 Y1の違いが系統的に

∆分だけ異なっていることを反映した分布から,下記のように補完することが考えられる.

f(Y1|Trt = 1, Y0, R = 0,X, θ

)= f

(Y1 +∆|Trt = 1, Y0, R = 1,X, θ

)また,MNAR のシナリオは,上記シナリオ 1,2以外の他にも考えられることに注意したい.

SASで実行する場合,ADJUSTオプションを用いて,補完したい変数を特定し,観測されたデータの分布か

らどの程度位置をシフトさせた状態で補完をするかを規定する.Delta adjustmentを用いた pattern imputationの

SASコードの一例を下記に示す.

(シナリオ 2)の SAS code例

PROC MI DATA = XXXX;

  SEED = 14821;

  NIMPUTE = 100; /*補完回数の指定*/

  OUT = result;

  CLASS trt;

 MONOTONE REG(y1); /*補完したい変数名の指定及び単調回帰に基づく補完*/

 MNAR ADJUST(y1 / SHIFT =∆ ADJUSTOBS = (trt = ’1’)); 

   /*trt = 1(試験治療群)の観測された y1のデータの分布に基づいて,∆(例,-2,-1など)分

    シフトさせた状態の分布にもとづき補完*/

  VAR trt x0 y1; /*ベースラインデータ x0も含めて,補完に用いる変数を指定*/

RUN;

6.10.5 中止理由別(AEとその他の理由で区別)の pattern imputation

この補完方法は,脱落パターンごとに欠測値を補完するのではなく,たとえば脱落理由として有害事象の影

響で脱落した人とそれ以外の理由で脱落した人でパターンを作り,欠測値の補完を行う (Ratitchet al., 2013).

投与中止後の推移を想定しているため,対象とする estimandは effectivenessとなる.有害事象で途中脱落した

試験治療群及び対照群の被験者の欠測データには,両群のベースラインの応答変数データで補完する.一方,

その他の理由で脱落した試験治療群/対照群の被験者の欠測値には,それぞれの群の試験を完了したパターンの

被験者のデータでそれぞれ補完をする (CCMV).この補完方法の特徴は,特に疼痛の領域において使用される

ベースラインのデータで単補完する BOCFに近いコンセプトをもっている.もし,被験者が薬剤の服用を続け

ることができないならば,脱落後のその被験者に治療のベネフィットは与えられなかったと考えることは自然

である.このため,脱落後の被験者の欠測データはベースラインの応答変数データで補完し保守的な取扱いを

する.BOCFでは単補完であり,補完値の不確実性を考慮していないことから,この補完方法はこの不確実性

を考慮した多重補完と BOCFを組み合わせた方法となっている.

 上記以外にも,中止理由ごとに別々の補完モデルを用いることや,残りの症例が MAR を仮定した補完を

行うことなど,中止理由別の patter imputaionの事例が出始めていることに注目されたい(計量生物セミナー,

2015).

79

Page 81: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

参考文献

[1] Ayele, B. T., Lipkovich, I., Molenberghs, G.& Mallinckrodt, C. H. (2014). A multiple-imputation-based

approach to sensitivity analysis and effectiveness assesments in longitudinal clinical trials.Journal of

Biopharmaceutical Statistics. 24, 211-228.

[2] Diggle, P.,& Kenward, M. G. (1994). Informative drop-out in longitudinal data analysis.Applied statistics,

49-93.

[3] Dmitrienko, A., Molenberghs, G., Chuang-Stein, C.,& Offen, W. W. (2005).Analysis of clinical trials using

SAS: A practical guide. SAS Institute.

[4] Graham, J. W., Olchowski, A. E.& Gilreath, T. D. (2007). How many imputations are really needed? Some

practical clarifications of multiple imputation theory.Prevention Science, 8, 206-213.

[5] Kenward, M. G., Molenberghs, G.,& Thijs, H. (2003). Pattern‐ mixture models with proper time dependence.

Biometrika, 90(1), 53-71.

[6] Li, K. H., Raghunathan, T. E.,& Rubin, D. B. (1991). Large-sample significance levels from multiply imputed

data using moment-based statistics and an F reference distribution.Journal of the American Statistical

Association, 86(416), 1065-1073.

[7] Little, R. J. (1993). Pattern-mixture models for multivariate incomplete data.Journal of the American Statistical

Association, 88(421), 125-134.

[8] Little, R. J. (1994). A class of pattern-mixture models for normal incomplete data.Biometrika, 81(3), 471-483.

[9] Little, R. J. (1995). Modeling the drop-out mechanism in repeated-measures studies.Journal of the American

Statistical Association, 90(431), 1112-1121.

[10] Little, R. J.& Yau, L. (1996). Intent-to-treat analysis for longitudinal studies with drop-outs.Biometrics,

1324-1333.

[11] Little, R. J. A. and Rubin, D. B. (2002).Statistical analysis with missing data. 2nd edition. John Wiley& Sons.

New York.

[12] Mallinckrodt, C. H. (2013).Preventing and treating missing data in longitudinal clinical trials: a practical

guide. Cambridge University Press.

[13] Mallinckrodt, C., Roger, J., Chuang-Stein, C., Molenberghs, G., O’Kelly, M., Ratitch, B., ...& Bunouf, P.

(2013). Recent Developments in the Prevention and Treatment of Missing Data.Therapeutic Innovation&

Regulatory Science, 2168479013501310.

[14] Molenberghs, G., Michiels, B., Kenward, M. G.,& Diggle, P. J. (1998). Monotone missing data and pattern‐

mixture models.Statistica Neerlandica, 52(2), 153-161.

[15] Molenberghs, G.,& Kenward, M. (2007).Missing data in clinical studies(Vol. 61). John Wiley& Sons.

[16] National Research Council (2010).The Prevention and Treatment of Missing Data in Clinical Trials.

Washington, DC: The National Academies Press.

[17] O’Kelly, M., & Ratitch, B. (2014).Clinical Trials with Missing Data: A Guide for Practitioners. John Wiley&

Sons.

[18] Ratitch, B.,& O’Kelly, M. (2011). Implementation of pattern-mixture models using standard SAS/STAT

procedures.PharmaSUG, Paper-SP04.

80

Page 82: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[19] Ratitch, B., O’Kelly, M.,& Tosiello, R. (2013). Missing data in clinical trials: from clinical assumptions to

statistical analysis using pattern mixture models.Pharmaceutical statistics, 12(6), 337-347.

[20] Royston, P.,& White, I. R. (2011). Multiple imputation by chained equations (MICE): implementation in

Stata.J Stat Softw, 45(4), 1-20.

[21] Rubin, D.B. (1978), Multiple Imputations in Sample Surveys - A Phenomenological Bayesian Approach to

Nonresponse,Proceedings of the Survey Research Methods Section of the American Statistical Association,

20-34.

[22] Rubin, D. B. (1987).Multiple imputation for nonresponse in surveys. John Wiley& Sons.

[23] Siddiqui, O. (2011). MMRM versus MI in dealing with missing data― a comparison based on 25 NDA data

sets.Journal of Biopharmaceutical Statistics. 21, 423-436.

[24] Thijs, H., Molenberghs, G., Michiels, B., Verbeke, G.,& Curran, D. (2002). Strategies to fit pattern‐ mixture

models.Biostatistics, 3(2), 245-265.

[25] Verbeke, G.,& Molenberghs, G. (2009).Linear mixed models for longitudinal data. Springer Science&

Business Media.

[26] Wu, M. C.,& Bailey, K. R. (1989). Estimation and comparison of changes in the presence of informative right

censoring: conditional linear model.Biometrics, 939-955.

[27] White, I. R., Royston, P.,& Wood, A. M. (2011). Multiple imputation using chained equations: issues and

guidance for practice.Statistics in medicine, 30(4), 377-399.

[28] Yuan, Y. (2011). Multiple imputation using SAS software.Journal of Statistical Software, 45(6), 1-25.

[29] Yuan, Y. (2014). Sensitivity Analysis in Multiple Imputation for Missing Data. In Proceedings of the SAS

Global Forum 2014 Conference.(http://support.sas.com/resources/papers/proceedings14/SAS270-2014.pdf).

[30] 大江基貴,鵜飼裕之,大浦智紀,土居正明,藤原正和,横山雄一. (2015). (2)多重補完 (Multiple

Imputation:MI) に基づく連続量経時データの解析. SASユーザー総会論文集.

81

Page 83: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第7章 Shared Parameter Model

7.1 はじめに

応答変数と欠測識別変数の同時密度関数を応答変数モデル,及び脱落確率モデルに分解して考えた場合,前

章までに見てきた Selection Model (SM),及び Pattern Mixture Model (PMM)はそれぞれ,応答変数が脱落確率

に影響を与えると考えるモデル,脱落時点のパターンごとに応答変数の密度関数を考えていくモデルであった.

5,6章で欠測メカニズムがMAR,MNARの場合における,これらの手法について見てきた.本章では,欠測

メカニズムがMNARの場合におけるもう一つの解析アプローチとして,Wu and Carroll (1988),Wu and Bailey

(1989),及び Follmann and Wu (1995)で提案された Shared Parameter Model (以下,SPM)について取り上げる.

端的に述べると,SPMは,応答変数モデル,及び脱落確率モデルの両方に影響する潜在変数 (変量効果)を

仮定するモデルである.前述した 2つのモデルと異なり,本手法は,ある時点の欠測確率が,応答変数にも関

連した変量効果に依存すると考える.

7.1.1 SPMの一般的な表現

(Yij , Rij , Xij)を被験者 i(i = 1, · · · , N) に対する経時測定データとする.j(j = 1, · · · , n) は時点を表すとし,Yij は i 番目の被験者の j 時点目の応答変数を表す.被験者 i の観測値を Yi

o,欠測値を Yim で表し,

Yi = (Yo,Ym)′ とする.Rij は欠測識別変数であり,1であれば j 時点目で観測されており,0であれば j 時

点目の測定値が欠測であることを示す.

変量効果を含む同時密度関数は以下のように書ける.

f(Yi,Ri,bi|Xi,θ,ψ) (7.1)

ここで,XiはYi及びRiに影響を与える被験者 iの共変量を表し,θ及び ψはそれぞれ応答変数モデルの

パラメータ,及び脱落確率モデルのパラメータを表す.本章ではこれまでと同様に,欠測は単調であると仮定

する.また,DiをDi =∑j Rij + 1とし,完了例に対してはDi = n+ 1を取る値として定義する.前章まで

と同様に記載を簡略化するため,Xi,θ及び ψについては,以降では表記を省略する.

被験者 iに対して,q 個ずつの潜在的な変量効果を考える.これらを bi = (bi1, bi2, ..., biq)′ で表し,平均 0

で分散共分散行列Gの多変量正規分布に従うと仮定する.i番目の被験者の密度関数を f(Yi,Ri,bi)で記載す

る場合,SPMは次のように定義される.

f(Yi,Ri,bi) = f(Yi|Ri,bi)f(Ri|bi)f(bi) (7.2)

上式のように,SPMは,応答変数モデルと脱落確率モデルの両者に影響を与える潜在変数として変量効果を

組み込むモデルである.またここで,Yij と Rij は,biが与えられた条件下で独立であると仮定する.つまり

以下の式が成立すると仮定する.

f(Yi|Ri,bi) = f(Yi|bi) (7.3)

さらに,Yi の要素であるYio とYi

m について,bi が与えられた条件下で以下のように分離できると仮定

する.

f(Yi|bi) = f(Yio|bi)f(Yi

m|bi) (7.4)

以上のことから,(7.2)式は以下のように表記できる.

f(Yi,Ri,bi) = f(Yio|bi)f(Yi

m|bi)f(Ri|bi)f(bi) (7.5)

82

Page 84: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

これが一般的な SPMの定式化となる.つまり,応答変数モデルと脱落確率モデルの両者に対して変量効果

が shareされているもとで,応答変数,及び脱落確率モデルが構築されると考えていくアプローチである.

最後に,Fitzmauriceet al. (2008)に基づき,SPMは欠測メカニズムとして MNAR に対応している旨を述べ

る.Yi = (Yoi ,Y

mi )′ が与えられたもとで,Rij の条件付き密度関数は以下のようになる.

f(Rij |Yio,Yi

m) =

∫bif(Rij |bi)f(Yi

o,Yim|bi)f(bi)dbi∫

bif(Yi

o,Yim|bi)f(bi)dbi

=

∫bi

f(Rij |bi)f(bi|Yio,Yi

m)dbi (7.6)

f(bi|Yio,Yi

m)は一般的に Yim に依存するため,条件付き密度関数は Yi

m に依存することになる.この

ため,SPMは欠測メカニズムとしてMNAR を仮定したモデルであることが分かる.以上のことから SPMは,

Selection Model (SM),及び Pattern Mixture Model (PMM)と並び,欠測メカニズムがMNARの場合におけるも

う一つの解析アプローチとなる.

7.2 モデルの定式化

前節の SPMの定義式に基づき,観測データ f(Yio,Ri)に対する密度関数は以下のように導出される.

f(Yio,Ri) =

∫ym

∫b

f(Yio,Yi

m,Ri,bi)dbidYim

=

∫ym

∫b

f(Yio,Yi

m|Ri,bi)f(Ri|bi)f(bi)dbidYim

=

∫ym

∫b

f(Yio,Yi

m|bi)f(Ri|bi)f(bi)dbidYim (∵ (7.3))

=

∫ym

∫b

f(Yio|bi)f(Yi

m|bi)f(Ri|bi)f(bi)dbidYim (∵ (7.4))

=

∫b

f(Yio|bi)f(Ri|bi)f(bi)

(∫ym

f(Yim|bi)dYi

m

)dbi

=

∫b

f(Yio|bi)f(Ri|bi)f(bi)dbi (7.7)

SPMを実装するためには,応答変数モデル f(Yio|bi)と,脱落確率モデル f(Ri|bi)について考える必要が

ある.

7.2.1 応答変数モデル

まず,応答変数モデル f(Yio|bi)について考える.応答変数モデルは,解析される経時的な応答変数のデー

タに依存するが,ここでは単純な線形混合モデルを考える.

たとえば応答変数 yij に対して,群 (Groupi),時点 (Timeij),群と時点の交互作用 (Timeij ×Groupi )を固

定効果とする.次に SPMの特徴である,応答変数モデル,及び脱落確率モデルの両方に影響する潜在変数 (変

量効果)を考える.変量効果は複数考えることが可能だが,本報告書においては,切片と時点に対する変量効

果のみを取り上げる.つまり,応答変数モデルとして,上記の固定効果に加えて,切片として変量効果を含む

モデル,及び切片と時点に対する変量効果を含む 2つのモデルを考える.前者をモデル (a)として,後者をモ

デル (b)とする.

なお,変量効果ついては,たとえば Creemerset al. (2010)では,群と時点の交互作用に対する変量効果を含

むモデルも検討されている.そのため,本報告書で取り上げている効果以外にも,試験や解析の目的に応じて,

様々なモデルを考えることが可能である.

83

Page 85: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

さて,切片と時点に対する変量効果をそれぞれ bi0, bi1で表記すると,モデル (a)の応答変数モデル f(Yio|bi)

は式 (7.8)で記述でき,モデル (b)は式 (7.9)で表現される.

Yij = β0 + β1Timeij + β2Groupi + β3Timeij ×Groupi + bi0 + eij (7.8)

Yij = β0 + β1Timeij + β2Groupi + β3Timeij ×Groupi + bi0 + bi1Timeij + eij (7.9)

ここで,(bi0, bi1)′ ∼ N(0, G)に従うと仮定する.なお,式 (7.8)には時点に対する変量効果 bi1 が含まれて

ないことに注意する.Gは変量効果に関する分散共分散行列を表す.同様に,測定誤差 eij についても正規分

布を仮定する.

7.2.2 脱落確率モデル

次に,脱落確率モデル f(Ri|bi)として,Complementary log-log linkモデルを考える.本報告書では,脱落確

率モデルに対しても,応答変数モデルと同様に,切片に対する変量効果だけを含むモデル (c),及び切片と時点

に対する変量効果を含むモデル (d)を取り上げる.これについても応答変数モデルと同様に,たとえばCreemers

et al. (2010)では,群と時点の交互作用に対する変量効果を含むモデルも検討されている.

モデル (c)は式 (7.10)で,モデル (d)は式 (7.11)で定式化される.α0j , γ1, γ2 はパラメータを表す.

Pr(Di ≤ j) = 1− exp(− exp(α0j + γ1bi0)) (7.10)

Pr(Di ≤ j) = 1− exp(− exp(α0j + γ1bi0 + γ2bi1)) (7.11)

(7.10)式の意味を考える.これは,ベースライン値があり,ベースライン後 1時点目までに脱落する確率が

以下の (7.12)式のように表現されることを意味している.

Pr(Di ≤ 1) = 1− exp(− exp(α01 + γ1bi0)) (7.12)

また,ベースライン後 1時点目までデータがあり,ベースライン後 2時点目までに脱落する確率は,以下の

ようになる.

Pr(Di ≤ 2)− Pr(Di ≤ 1)

= 1− exp(− exp(α02 + γ1bi0))− 1− exp(− exp(α01 + γ1bi0))

以降も同様である.

また,脱落確率モデルとして,ロジットモデルも考えることができる.切片に対する変量効果だけを含むモ

デル,及び切片と時点に対する変量効果を含むモデルはそれぞれ以下のようになる.

logitPr(Di ≤ j) = α0j + γ1bi0 (7.13)

logitPr(Di ≤ j) = α0j + γ1bi0 + γ2bi1 (7.14)

7.3 パラメータの推定

パラメータ推定のアプローチとして,尤度関数 L =∏f(Yi

o,Ri)を最大化する最尤推定量を求める方法が

考えられる.ただし尤度関数は積分を含むため,最尤推定値の計算は一般的には困難である.この積分計算を

行うために,Monte Carlo EM (McCulloch, 1997)や尤度の Laplace近似 (Gao, 2004)といった方法が利用可能で

ある.また,応答変数モデルと脱落確率モデルで共有する変量効果の数は一般的には多くないため,Gauss求

積法や適応型 Gauss求積法を利用することも可能である.

実際には,SPMは SASの PROC NLMIXEDを用いることで実装可能となる.PROC NLMIXEDを用いた

SPMのプログラムコードについては,Appendix Cを参照していただきたい.PROC NLMIXEDでは,尤度関

84

Page 86: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

数の積分計算法としては,Gauss求積法や,適応型 Gauss求積法等が利用可能である.PROC NLMIXEDの仕

様については SASヘルプを,数値計算については Pinheiroet al. (1995)等を参考にしていただきたい.

また,パラメータ推定のために幾つか別のアプローチもあり,Unweighted Analysis法や,Approximate Con-

ditional Modelを用いた方法などが提案されている.しかし,これらの手法は本報告書の Appendix Cで紹介す

るマクロでカバーされていないため,取り上げないこととする.詳細は Fitzmauriceet al. (2008)を参照され

たい.

7.4 感度分析としてのSPMの位置づけ

本章の内容を扱うマクロ%shared_parameterでは,今まで述べてきたような応答変数モデル,及び脱落確率

モデルを考えることができ,SPMが実装可能である.

Little (1995)では,SPMは応答変数の測定誤差が大きく,脱落するかどうかに応答変数の値が依存すると考

えるより,病態の進行度合いのような潜在的な効果が関係していると思われる状況において,有用なアプロー

チと考えられると述べられている.

このような場合に SPMを用いることで,SM,及び PMMでは想定することのできない潜在的な効果が,欠

測,及び応答変数に関係すると考えた状況下でのパラメータ推定値を導くことができ,この点における感度分

析が実行できると考えられる.10,11章でも取り上げているが,estimand 3に対する解析として利用すること

が可能と考えられている.

7.5 マクロ%shared_parameter

本章では,マクロプログラム%shared_parameter使用におけるポイントを述べる.マクロプログラム%shared_parameter

の詳細は,本報告書の Appendix Cを参照されたい.ここでは引数MODL,LINK, RANDOM_SLOPE に

ついてのみ説明を行う.

MODLは応答変数モデルに含まれる固定効果を表す.また,LINKは脱落確率モデルを指定する.CLOGLOG

を指定すると Complementary log-log linkモデルを用いることになり,LOGIT はロジットモデルを用いること

に対応する.

RANDOM_SLOPE は NONE,または LINEARを指定する.NONE は応答変数モデルに変量効果と

して切片しか含まないモデルを指定することを表し,LINEARは応答変数モデルに変量効果として切片,及

び時点に対する効果を含むモデルを指定することを表す.また,マクロプログラム%shared_parameterの中で

自動的に,応答変数モデルに含めた変量効果を脱落確率モデルに含まない解析結果と,応答変数モデルに含め

た変量効果を脱落確率モデルに含む解析結果を表示してくれる.このことから,7.2節で述べた SPMを適用す

ることが可能となる.

なお,マクロプログラム%shared_parameterでは,変量効果として切片,時点,及び時点の 2次に対する効

果を含むモデルを指定することも可能である.ただし,本報告書では適用可能性の面から,より重要と考えら

れる,切片の変量効果を含むモデル,及び切片と時点に対する変量効果を含むモデルに絞って取り上げた.

参考文献

[1] Creemers, A., Hens, N., Aerts, M., Molenberghs, G., Verbeke, G., and Kenward, M. G. (2010). A Sensitivity

Analysis for Shared‐ Parameter Models for Incomplete Longitudinal Outcomes.Biometrical Journal, 52(1), 111-

125.

[2] Fitzmaurice, G., Davidian, M., Verbeke, G., and Molenberghs, G. (2008).Longitudinal data analysis. CRC Press.

[3] Follmann, D., and Wu, M. (1995). An approximate generalized linear model with random effects for informative

missing data.Biometrics, 51(1), 151-168.

85

Page 87: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[4] Gao, S. (2004). A shared random effect parameter approach for longitudinal dementia data with non‐ ignorable

missing data.Statistics in Medicine, 23(2), 211-219.

[5] Little, R. J. (1995). Modeling the drop-out mechanism in repeated-measures studies.Journal of the American

Statistical Association, 90(431), 1112-1121.

[6] McCulloch, C. E. (1997). Maximum likelihood algorithms for generalized linear mixed models.Journal of the

American statistical Association, 92(437), 162-170.

[7] Pinheiro, J. C., and Bates, D. M. (1995). Approximations to the log-likelihood function in the nonlinear mixed-

effects model.Journal of computational and Graphical Statistics, 4(1), 12-35.

[8] Wu, M. C., and Carroll, R. J. (1988). Estimation and comparison of changes in the presence of informative right

censoring by modeling the censoring process.Biometrics, 44(1), 175-188.

[9] Wu, M. C., and Bailey, K. R. (1989). Estimation and comparison of changes in the presence of informative right

censoring: conditional linear model.Biometrics, 45(3), 939-955.

86

Page 88: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第8章 その他の手法

8.1 はじめに

本章では IPWCC,wGEE,Doubly Robustな性能をもつ推定量について説明する.estimandは estimand3を

想定している.これらはモデルを完全には特定しないセミパラメトリックな推定手法である.そのため,これ

までの章で紹介した手法と比較してモデルが正しく特定されている場合の推定精度は落ちるが,モデルの誤特

定による影響は少なく頑健な推定量が得られると言われている.また,一般的に欠測メカニズムはMAR を仮

定した解析であるため,SM,PMM及び SPMのように,MARを仮定した解析を主解析とした際の,欠測メカ

ニズムに対する感度分析には用いられない.まず 8.1~8.2節で用いるデータ構造は,以下を想定する(用いる

データ構造が変更になったらその都度説明する).

• 1群の代表値を求めることを目的とする

• データは経時的に測定されているものの,応答変数に用いるのは計画している最終時点のみである• 最終時点の応答変数の平均パラメータを µとおき,以下 µの推定について検討する

被験者 iの最終時点の応答変数を Yi,欠測識別変数をRi(1:観測,0:欠測),ランダム割付した被験者数を

nとする.はじめに µの推定量として,

µ =

n∑i=1

Yi

n(8.1)

を考える.µは(緩やかな正則条件のもとで)µの一致推定量であり,また,正規性を仮定した場合には最尤

推定量となる,などよい性質を様々もっているため,求まるならこの推定量を求めたい.しかし,Yiが 1症例

でも欠測することがあれば,これは算出できない.そこで,途中脱落した症例のデータは用いず,完了例のみ

を用いて解析する場合を考える.つまり,µの推定量 µを

µ =

n∑i=1

RiYi

n∑i=1

Ri

(8.2)

で定義する.式(8.2)では,Yi が欠測のとき Ri = 0である.そのため,このとき Yi の値によらず RiYi = 0

となり,µは計算できる.欠測メカニズムがMCARである場合,µは,µの一致推定量と一致する.しかしな

がら,欠測メカニズムがMNAR である場合,一般に,上記推定量の一致性は保証されない1.以下に数式を用

いて説明する.

データ Yi,欠測識別変数 Ri の同時分布を,MCAR及びMNAR それぞれの下で考える.

• MCARの場合:

PRiYi(Ri = 1, Yi = yi|θ,ψ) = PRi(Ri = 1|ψ) · PYi(Yi = yi|θ)

1MAR の場合も同様に一致推定量が得られないが,今,応答変数データ Yi は 1時点であり,モデルも特に仮定していないためここでは詳細について触れない.

87

Page 89: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• MNAR の場合 :

PRiYi(Ri = 1, Yi = yi|θ,ψ) = PRi|Yi(Ri = 1|Yi = yi,ψ) · PYi(Yi = yi|θ)

なお,PRi|Yi(Ri = 1|Yi = yi,ψ)について,Ri は二値データであるため

π(yi) = PRi|Yi(Ri = 1|Yi = yi,ψ) (8.3)

とおくと,Ri はパラメータ π(yi)の Bernoulli分布に従う.

また,

E[Ri|Yi] = 1 · P (Ri = 1|Yi) + 0 · P (Ri = 0|Yi)

= P (Ri = 1|Yi)

= π(Yi) (8.4)

E[Ri] = E[E[Ri|Yi]]

= E[π(Yi)] (8.5)

は,今後の計算で用いる.

以上より,n→ ∞のとき,式(8.2)の性質はそれぞれ以下の通りとなる.

• MCARの場合:

µ =

n∑i=1

RiYi

n∑i=1

Ri

=

n−1n∑i=1

RiYi

n−1n∑i=1

Ri

n→∞−→ E[RY ]

E[R]=E[R] · E[Y ]

E[R]= E[Y ] = µ (8.6)

• MNAR の場合: (8.4),(8.5)より,一般に

µ =

n∑i=1

RiYi

n∑i=1

Ri

=

n−1n∑i=1

RiYi

n−1n∑i=1

Ri

n→∞−→ E[RY ]

E[R]=

E[E[RY |Y ]]

E[R]=E[Y · E[R|Y ]]

E[E[R|Y ]]

=E[Y π(Y )]

E[π(Y )]= E[Y ] = µ (8.7)

以上より,µは

• MCARのときには µの一致推定量である

• MNAR のときには,一般に µの一致推定量にはならない.

8.2 Inverse Probability Weighted Complete-Case (IPWCC) Estimator

8.2.1 µに対する IPWCC 推定量

前述の通り,式 (8.2)の推定量 µはMNARのとき,一般に µの一致推定量とはならない.そこで,データの

欠測確率は欠測データには依存せず,治験薬及び試験デザインに関するデータ:Xi及びベースライン時点の共

変量:W i に依存するMAR の状況下を考える.

88

Page 90: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

欠測メカニズムMAR を以下のように定義する (Tsiatis, 2006).

P (Ri = 1|Yi = yi,Wi = wi,Xi = xi) = P (Ri = 1|Wi = wi,Xi = xi,ψ) (8.8)

Wi は,欠測の有無や欠測後の応答変数の分布に関する情報を持っている(相関がある)変数とし,補助変

数(auxiliary variable)と呼ばれている2.上記ではベースライン時点のデータと限定しているが,ベースライ

ン後のデータを用いることも考えられる.主解析ではベースライン後の共変量は用いないことが望ましいとさ

れているが,感度分析として観測確率モデルの共変量に,ベースライン後の共変量を用いることは許容する,

という考え方もある3(Mallinckrodt, 2013,7.5節,12.4節).

以下,この観測確率モデルを記号 π(Wi,Xi,ψ)で表す.すなわち

π(Wi,Xi,ψ) = P (Ri = 1|Wi = wi,Xi = xi,ψ) (8.9)

とおく.ここで各 Yi に対して重み 1/π を被験者ごとにつけた以下の推定量は,モデルが正しく特定されて

いるとき,µの一致推定量になる.

µIPW =1

n

n∑i=1

RiYi

πi(Wi,Xi, ψ)(8.10)

ψを既知としたときの一致性は以下の式から分かる.

µIPW =1

n

n∑i=1

RiYi

πi(Wi,Xi, ψ)

n→∞−→ E

[RiYi

πi(Wi,Xi,ψ)

]= E

[E

[RY

π(W,X,ψ)

∣∣∣Y,W,X

]]= E

[Y

π(W,X,ψ)E [R|Y,W,X]

]= E

[Y

π(W,X,ψ)π(W,X,ψ)

]= E [Y ] = µ (8.11)

このように完了例の最終時点のデータに対し,観測確率 πで重みづけしたものをデータとして解析する推定

量を Inverse Probability Weighted Complete-Case (IPWCC) Estimator(式(8.10))と呼ぶ (Robinset al., 1994).

観測確率が小さい症例に対して,その観測値に対する重みが大きくなり,IPWCC推定量への影響度合いも大

きくなるのが特徴である.

観測確率 πのモデルは一般的にロジスティックモデルが用いられることが多い.データの欠測がMAR を仮

定でき,さらに仮定した観測確率のモデルが正しかった場合,IPWCC推定量は一致推定量となる.しかしな

がら,観測確率のモデルが正しくない場合は推定量の一致性は一般には成り立たない.さらに観測確率のモデ

ルが厳密に正しいことを示すのは難しい.また,大きな重みがつけられたデータがあるとき(つまり観測確率

が 0に近い値であったとき)IPWCC推定量はこのデータの影響を強く受けてしまう.その対策方法としては

推定された観測確率を基に層別で解析する方法があるが,こちらの方法も完全に適合するモデルを選択できる

のは稀であり,基本的に一致推定量は得られない(Williamsonet al., 2012).

なお,本方法は応答変数と欠測識別変数の同時分布をP (Y,R) = P (Y )P (R|Y )と分解しているため,Selection

Modelと考えられる.特に観測確率モデルに対してパラメトリックなモデルを仮定し,応答変数に対してはモ

デルの全てを特定していないことから,セミパラメトリック Selection Modelと呼ばれることがある.IPWCC

推定量を用いた推定の手順は以下の通りである.

2Collinset al. (2001)では,補助変数を a)欠測の有無及び応答変数の両方に相関する,b)欠測の有無とは相関しないが,応答変数とは相関する,c)欠測の有無とは相関するが,応答変数とは相関しない,の 3種類に分類している.

3観測確率モデルについては,応答変数の過去の値がある場合はそれを説明変数に含めることが妥当なことも多い.

89

Page 91: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

<手順>

1. 観測確率モデルを定義し,パラメータ ψについて,ロジスティックモデルで推定する.

π(W,X,ψ) = P (R = 1|W,X,ψ)

logit P (R = 1|W,X) = ψ0 +Wψ1 +Xψ2

2. 観測確率で重み付けした,応答変数 Y の IPWCC推定量 µIPW を算出する (Robinset al., 1994).

µIPW =1

n

n∑i=1

RiYi

πi(Wi,Xi, ψ)

3. 推定量の標準誤差はブートストラップ法により計算する(詳細は 8.2.3節参照).

8.2.2 IPWCC estimators for Estimating Equations

臨床試験において推定したいものは応答変数の平均値 µではなく,特定のモデルパラメータ θ(治験薬の影

響など)の推定値であることが多い.その際,欠測データが存在しない場合は,以下のような推定方程式を解

くことが多い.n∑i=1

U(Yi,Xi,θ) = 0 (8.12)

例えば線形モデル4に対する代表的な推定方程式は

n∑i=1

Xi(Yi −X′iβ) = 0 (8.13)

である.また,8.2.1節で述べた観測確率で重み付けする方法はデータ Yiのみならず関数Uに対しても適応可

能である.つまり,欠測のあるデータに対しては,推定方程式

n∑i=1

Riπi

U(Yi,Xi,θ) = 0 (8.14)

を解けばよい,従って,IPW推定量の線形モデルに対する推定方程式は

n∑i=1

Riπi

·Xi(Yi −X′iβ) = 0 (8.15)

である.この方程式の解を βIPW

とおくと,

µIPWi = X′iβIPW

となる.

8.2.3 ブートストラップ法による IPWCC 推定量の分散

本章では IPWCC推定量の分散をブートストラップ法を用いて求める.しかし,観測確率に重みの大きいデー

タがある場合,推定精度が落ちる傾向があるので注意が必要である.

4Y = X′β + ϵ とする.ここで,E[ϵ] = 0 は仮定するが,誤差 ϵ の正規性は仮定しない.

90

Page 92: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

<ブートストラップ法による推定量の分散の計算手順>

1. 被験者ごとに重み付けされた n個の観測データ(Y1π1, · · · Yn

πn

)からの復元抽出によって,大きさ nのブー

トストラップ標本を B 組用意する.標本数 B は 1000以上が望ましい(Barker, 2005).

2. 各ブートストラップ標本について目的とする推定値 θ(b) を求める.

3. 求めた B 個の推定値 θ(1), · · · θ(B) の標本標準偏差を,θの標準誤差にとする.

ブートストラップ法については小西 (2008),Carpenter and Bithell(2000)等参照.

8.3 weighted Generalized Estimating Equation (wGEE)

IPWCC推定量は完了例の最終時点のデータのみを用いたが,これらの方法を経時データの解析へ拡張する

方法の 1つとして,一般化推定方程式(Generalized Estimating Equation:GEE)を用いる方法がある.

GEE法は経時的に収集された応答変数のデータを全て用いる解析であり,IPWCC推定量のような計画され

た最終時点のデータが得られた症例のみを用いた解析と比較してより多くの情報量を用いた解析といえる.ま

た,GEE法では,平均構造・リンク関数・分散共分散構造等の指定が必要となるが,分散共分散構造が真の構

造に近くなくても,平均構造のモデルが正しいなど,いくつかの仮定を満たせば βの一致性は保持されるとい

う性質がある( Liang and Zeger, 1986; Panet al., 2000; Pepe and Anderson, 1994).しかしながら,欠測メカニ

ズムがMARやMNARである場合,これらの性質は一般には保持されず,推定量は相関構造の指定に大きく依

存するため,バイアスが入る可能性が高くなる.つまり,GEE法においてMAR 及びMNAR の欠測メカニズ

ムは"non-ignorable"である(Hoganet al., 2004; Touloumiet al., 2001).そこで,GEE法においても,観測確率

で重み付けすることにより,欠測がMAR の下で,観測確率モデルが正しく特定できたときにパラメータの一

致推定量が得られる方法が提案されており,weighted Generalized Estimating Equation (wGEE)法と呼ばれてい

る(Robinset al., 1995).重みは observation-specific(被験者・時点ごとに別々の重み)と subject-specific(被

験者ごとに全時点共通の重み)の 2通りが考案されている(Robinset al., 1995; Preisseret al., 2002; Fitzmaurice

et al., 1995; Hoganet al., 2004).12章で扱う主解析の選択のシミュレーションに用いたマクロ%WGEEは後者

の subject-specificのみ扱える.一方,Proc GEEでは observation-specificも扱える(駒嵜ら, 2015).さらに観測

確率モデルには治験薬投与開始後のデータWij を入れたモデル5の構築も可能であり,これら変数をモデルに

入れるとMNARであった欠測をMARに近づけられる可能性がある.そのため欠測データを考慮したモデルを

検討する際に wGEE法は有力な候補となる(Mallinckrodt, 2013, 12.4節).なお,駒嵜ら (2015)には wGEE法

のシミュレーションも実施している.

<重みづけが異なる二種類の wGEE>

前述の通り,wGEE法は主に重みの違い(observation-specific及び subject-specific)で 2通りの推定方程式が提

案されている(式 8.16,式 8.17).それぞれの推定方程式及び重みの算出方法を示す.

Observation-specific (OS) weighted GEE

Sos(β) =

N∑i=1

∂µ′i

∂βVi(ρ)

−1∆i (Yi − µi) = 0 (8.16)

Yi :被験者 iの(観測・欠測合わせた)全時点のデータベクトル

Xi :被験者 iのデザイン行列

β :固定効果パラメータベクトル

µi = E [Yi] :被験者 iにおける各時点の期待値ベクトル5Inclusive Modelと呼ぶ.

91

Page 93: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

ηi = g(µi) = Xiβ :リンク関数

Vi(ρ) :相間構造パラメータ ρに依存する分散共分散行列

∆i :被験者 iの重み(行列)

Subject-specific (SS) weighted GEE

Sss(β) =N∑i=1

∆i(ss) ·∂(µoi )

∂β(Vo

i (ρ))−1

(Yoi − µoi ) = 0 (8.17)

Yoi :被験者 iの観測データベクトル

Xi :被験者 iのデザイン行列

β :固定効果パラメータベクトル

µoi = E [Yoi ] :被験者 iにおける観測データの各時点の期待値ベクトル

ηi = g(µoi ) = Xiβ :リンク関数

Voi (ρ) :相間構造パラメータ ρに依存する分散共分散行列

∆i(ss) :被験者 iの重み(スカラー)

• Observation-specific weighted GEEの重み

Observation-specific weighted GEEは,被験者・時点ごとに,別々の重みをつける.式 (8.18),式 (8.19)の

通り,被験者 i,時点 j の条件付き観測確率モデル ϕij(Wij ,Xi,ψ)を定義し,パラメータ ψ について,

ロジスティックモデルで推定する.なお,ここでの条件付き観測確率とは,時点 (j − 1)まで観測された

条件の下,時点 j でも観測される確率である.さらに,単調な欠測を仮定する.

ϕij(Wij ,Xi,ψ) = P (Rij = 1|Ri,j−1 = 1,Wij ,Xi,ψ) (8.18)

logit P (Rij = 1|Ri,j−1 = 1,Wij = wij ,Xi = xi,ψ) = Wijψ1 +Xiψ2 (8.19)

上記の観測確率モデルを用いると,被験者 iの時点 j における観測確率 πij は以下のように表せる.な

お,時点 j = 1はベースラインとし,この時の観測確率は 1とする.

πij(Wi,Xi,ψ) =

j∏k=1

ϕik(Wik,Xi,ψ) (8.20)

Observation-specific weighted GEEは,各時点の観測確率の逆数である ∆ij = (πij(Wi,Xi,ψ))−1 を Yij

に対する重みとする.症例単位の重み∆i は,ni× ni の対角行列(ni は被験者 iの観測データ数)で,

(j, j)成分が∆ij,非対角成分は 0である.欠測がMARの下で,モデルが正しく特定されれば,パラメー

タの一致推定量が得られる (Robinset al., 1995).

• Subject-specific weighted GEEの重み

Subject-specificの場合,当該被験者の観測された全時点のデータに共通の重みを与える.そのため,∆i

の構造は observation-specificでは∆i は対角行列であったのに対し,subject-specificでは ∆i(ss)はスカ

ラーとなる.ここで,Fitzmauriceet al. (1995)を参考に被験者 iの欠測時点を示す変数 Di を定義する.

まず,計画した最終時点を J とし,被験者 iに対して,Di =J∑k=1

Rik + 1とおくと,単調な欠測を仮定い

ているため,Di は最初の欠測時点となる.k時点目に応答変数が観測された場合 Rik = 1,欠測の場合

Rik = 0より,Dは 1から (J + 1)までの値をとり,完了例は (J + 1)となる.ここで欠測時点変数Di

が diとなる確率 P (Di = di|Wi,Xi,ψ)は式 (8.18),式 (8.19)と同様の観測確率モデルを用いて以下の通

り表現できる.

92

Page 94: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

完了例のとき (di = J + 1)

∆i(ss) = P (D = di|Wi,Xi,ψ) = P (RiJ = 1|Wi,Xi,ψ)−1

= (πiJ(Wi,Xi,ψ))−1 (8.21)

中止例のとき (di 5 J)

∆i(ss) = P (D = di|Wi,Xi,ψ) = P (Ridi = 0, Ridi−1 = 1|Wi,Xi,ψ)−1

= ((πidi−1(Wi,Xi,ψ))× (1− ϕidi(Widi ,Xi,ψ)))−1 (8.22)

Subject-specific weighted GEEは式 (8.21),式 (8.22)で求めた欠測時点変数 Di が di となる確率 P (D =

di|Wi,Xi,ψ)を逆数とした値を重みとする.こちらも observation-specific weighted GEEと同様,欠測が

MAR の下で,モデルが正しく特定され,さらに適切な重みが与えられれば,パラメータの一致推定量が

得られる (Fitzmauriceet al., 1995).

<パラメータ βの推定手順>

Subject-specific wGEE及び observation-specific wGEEは,推定方程式が異なる以外,解析手順は同じで

ある(Robin, 1995; Preisseret al., 2002; Fitzmauriceet al., 1995; Hoganet al., 2004; Seaman, 2009).SAS

では Ver 9.3では PROC GENMODで SSと OSの一部が,Ver 9.4から PROC GEEでは SS,OS共に実

行できる.プログラム例については,駒嵜ら (2015)参照のこと.12章で用いたマクロ %WGEEでは,

subject-specific weighted GEEしか指定できない.主に以下の手順でパラメータ βを推定している.

1. 式 (8.18),式 (8.19)の通り,logistic回帰モデルにより観測確率を推定し,式 (8.20)または式 (8.21),

式 (8.22)に従って重み∆i を算出する.

2. 分散共分散構造に独立を仮定した一般化線形モデルにより β0 を推定し,初期値を得る.

3. 2.推定した β0,標準化残差及び仮定した相関構造より,分散共分散行列 Vi(ρ)を求める.

4. 式 (8.23)に従い,βを更新する.

βr+1 = βr +

[n∑i=1

∂µ′i

∂βVi(ρ)

−1 ∂µi∂β

]−1 [ n∑i=1

∂µ′i

∂βVi(ρ)

−1∆i(Yi − µi)

](8.23)

5. 3., 4.を収束するまで繰り返し,収束基準を満たした値を βとおく.

6. 推定量の標準誤差はサンドウィッチ分散(ロバスト分散)もしくはブートストラップ法により算出

する.

なお,observation-specific wGEEにて分散共分散構造に independent以外を指定した場合,PROC GENMOD

ではパラメータ推定量の漸近分散が保守的に算出される(つまり PROC GEEで算出するより漸近分散が

大きくなる)ため注意が必要である (Rodriguez, 2014).これは PROC GENMODでは漸近分散算出の際,

重みに用いた観測確率を既知として取り扱っているための可能性がある6.詳細はRobin, (1995),Preisser

et al., (2002)を参照.

8.4 Doubly Robustな推定量 (DR)

前述の IPWCC推定量による方法では,完了例のみが解析の対象となっていたため,完了例の応答変数 Yiの

み解析に含まれ,欠測症例の応答変数 Yi については解析に含めていない.また,仮定したモデルが正しくな6観測確率は,観測確率モデルにパラメータ推定値を代入した値のため,ばらつきが考慮されるべきだが,Proc GENMODでは観測確

率を固定した値として取り扱っている.

93

Page 95: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

かった場合,推定値にバイアスが入る可能性が高い.それを受けて,途中脱落により最終時点のデータが欠測で

ある被験者も解析に含めることが可能な Augmented IPW(AIPW)という解析方法が考案されている (Rotnitzky

et al., 1998).なお,ここでは IPWCC推定量のときと同様,欠測メカニズムがMARの場合を想定している.実

薬群の平均を µ1,プラセボ群の平均を µ0とすると,µ1, µ0の AIPW推定量はそれぞれ以下の式で算出できる

(Tsiatis, 2006).

µ1 =1

n

n∑i=1

Ri1Yi1

π(Wi1,Xi1, ψ)− 1

n

n∑i=1

Ri1

π(Wi1,Xi1, ψ)− 1

g(Wi1,Xi1, β)

µ0 =1

n

n∑i=1

Ri0Yi0

π(Wi0,Xi0, ψ)− 1

n

n∑i=1

Ri0

π(Wi0,Xi0, ψ)− 1

g(Wi0,Xi0, β) (8.24)

応答変数 Y は最終時点の 1時点のみのデータとする.ここで,第一項目は IPWCC推定量であり,第二項目

g(Wij ,Xij , β)は,観測時点より前のデータ及び未知パラメータの推定値 β により構成された応答変数 Y の

回帰式で補完されたデータである(つまり,g(Wij ,Xij ,β) = E[Yi|Wij ,Xij ]).式(8.24)は観測確率モデル

π(Wij ,Xij ,ψ)もしくは応答変数 Y の回帰モデル g(Wij ,Xij ,β)のいずれかが正しく特定された場合,β の

一致推定量が得られる(Tsiatis, 2006; Caoet al., 2009; Carpenteret al., 2006).このような性質をもつ推定量を

Doubly Robust推定量と呼ぶ.

なお,各群の推定量が一致推定量である場合,明らかに群間差の推定量 µ1 − µ0も µ1 − µ0の一致推定量と

なる.

式(8.24)は以下の通り式変形できる.

j = 0, 1として,

µj =1

n

n∑i=1

[Yij +

Rij − π(Wij ,Xij , ψ)

π(Wij ,Xij , ψ)

Yij − g(Wij ,Xij , β)

]

観測確率モデルもしくは応答変数モデルが正しく特定された場合,各群の期待値 E[µ1]及び E[µ0]は以下の

通りである.ここで β,ψは真の値とし,β∗,ψ∗はモデルを正しく特定できなかった場合のパラメータとする.

1. 観測確率モデル π(Wij ,Xij ,ψ)が正しく特定された場合(ψは真値を用いる)

j = 0, 1として,

E[µj ] = E

[Yij +

Rij − π(Wij ,Xij ,ψ)

π(Wij ,Xij ,ψ)Yij − g(Wij ,Xij ,β

∗)]

= E[Yij ] + E

[Rij − P (Rij = 1|Wij ,Xij ,ψ)

P (Rij = 1|Wij ,Xij ,ψ)Yij − g(Wij ,Xij ,β

∗)](∵ (8.5))

= E[Yij ] + E

[E[P (Rij = 1|Wij ,Xij ,ψ)]− P (Rij = 1|Wij ,Xij ,ψ)

P (Rij = 1|Wij ,Xij ,ψ)Yij − g(Wij ,Xij ,β

∗)]

= E[Yij ] + E [0× Yij − g(Wij ,Xij ,β∗)]

= E[Yij ] = µj

2. 応答変数 Y の回帰モデル g(Wij ,Xij ,β)が正しく特定された場合

j = 0, 1として,

E[µj ] = E

[Yij +

Rij − π(Wij ,Xij ,ψ∗)

π(Wij ,Xij ,ψ∗)

Yij − g(Wij ,Xij ,β)]

= E[Yij ] + E

[Rij − π(Wij ,Xij ,ψ

∗)

π(Wij ,Xij ,ψ∗)

E [Yij − g(Wij ,Xij ,β)|Wij ,Xij]]

94

Page 96: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= E[Yij ] + E

[Rij − π(Wij ,Xij ,ψ

∗)

π(Wij ,Xij ,ψ∗)

E [Yij |Wij ,Xij ]− g(Wij ,Xij ,β)]

= E[Yij ] + E

[Rij − π(Wij ,Xij ,ψ

∗)

π(Wij ,Xij ,ψ∗)

× 0

]= E[Yij ] = µj

これより,いずれかのモデルが正しく定義された場合,µj の一致推定量が得られることが分かり,IPWCC推

定量よりも頑健であるといわれている.パラメータの標準誤差は,IPWCC推定量と同様にブートストラップ法

を用いればよい.現在は本手法を経時データに対して適用できるよう拡張した方法も紹介されている (Seaman

and Copas, 2009; Belinda, 2013).なお,”Doubly Robust”は推定量の性質を示すものであり,同一のパラメー

タに対して複数の Doubly Robustな推定量が提案されている.バイアス及び標準誤差の小さい推定量を検討す

るために,現在も研究の対象となっている.主な参考書籍として Tsiatis (2006)や,日本語の総説として,逸見

(2014)がある.

8.5 8章のまとめ

本章で紹介した推定量について,以下に要点をまとめる.なお,以下の記載は本章で紹介したものに関する

ものであり,各手法・推定量の一般的性質について述べているわけではない点に注意が必要である.

• µ =

n∑i=1

Yi

n:

• データの欠測が生じると計算不可

• µ =

n∑i=1

RiYi

n∑i=1

Ri

• データの欠測が生じても計算可能• MAR またはMNAR のとき,一般に推定の一致性は成り立たない

• IPWCC推定量:µIPW =1

n

n∑i=1

RiYi

π(Wi,Xi, ψ):

• 応答変数は最終時点データのみ用いる• MAR であり,観測確率モデルが正しく特定されていると仮定

• 極端に小さい観測確率が推定されるとパラメータ推定値に大きな影響を与えることがある• 推定量の標準誤差はブートストラップ法により算出

• wGEE:

• 応答変数は経時データを用いる• MAR であり,観測確率モデルが正しく特定されていると仮定

• IPWCC推定量と同様,極端に小さい観測確率が推定されるとパラメータ推定値に大きな影響を与

えることがある

• 推定量の標準誤差はサンドウィッチ分散またはブートストラップ法により算出

95

Page 97: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• Doubly Robustな推定量:

• 応答変数は最終時点データのみ用いる• 観測確率モデルはMAR を仮定

• 観測確率モデル,応答変数 Y の回帰モデルのいずれかのモデルが正しく特定できた場合,一致推

定量が得られることから Doubly-Robustな推定量と呼ばれている.従って,”Double Robust”とい

う語句はあくまで推定量の性質をさしているだけであるため,様々な推定量が考案されている.

参考文献

[1] Barker, N. (2005). A practical introduction to the bootstrap using the SAS system. In SAS Conference Proceed-

ings: Phuse 2005: October 10-12 2005; Heidelberg, Germany SAS.

[2] Cao, W., Tsiatis, A. A., and Davidian, M. (2009). Improving efficiency and robustness of the doubly robust

estimator for a population mean with incomplete data.Biometrika, asp033.

[3] Carpenter, J., and Bithell, J. (2000). Bootstrap confidence intervals: when, which, what? A practical guide for

medical statisticians.Statistics in medicine, 19(9), 1141-1164.

[4] Carpenter, J. R., Kenward, M. G., and Vansteelandt, S. (2006). A comparison of

multiple imputation and doubly robust estimation for analyses with missing data.

Journal of the Royal Statistical Society: Series A (Statistics in Society), 169(3), 571-584.

[5] Collins, L. M., Schafer, J. L., and Kam, C. M. (2001). A comparison of inclusive and restrictive strategies in

modern missing data procedures.Psychological methods,6(4), 330.

[6] Fitzmaurice, G. M., Molenberghs, G., and Lipsitz, S. R. (1995). Regression models for longitudinal binary

responses with informative drop-outs.Journal of the Royal Statistical Society. Series B (Methodological), 691-

704.

[7] 逸見昌之. (2014).欠測データに対するセミパラメトリックな解析法.統計数理, 62(1), 103-122.

[8] Hogan, J. W., Roy, J., and Korkontzelou, C. (2004). Handling drop‐ out in longitudinal studies.

Statistics in medicine, 23(9), 1455-1497.

[9] 小西貞則, (2008),計算統計学の方法:ブートストラップ・EMアルゴリズム・MCMC.朝倉書店, 2008.

[10] 駒嵜弘,土居正明,横山雄一,鵜飼裕之,藤原正和. (2015).【企画セッション】欠測のあるデータにおける

主解析の検討 (3)Proc GEEによる wGEE法を用いた連続量経時データの解析.SASユーザー総会論文集.

[11] Liang, K. Y., and Zeger, S. L. (1986). Longitudinal data analysis using generalized linear models.

Biometrika,73(1), 13-22.

[12] Mallinckrodt, C. H. (2013).Preventing and Treating Missing Data in Longitudinal Clinical Trials. Cambridge

Press.

[13] Pan, W., Louis, T. A., and Connett, J. E. (2000). A note on marginal linear regression with correlated response

data.The American Statistician, 54(3), 191-195.

[14] Pepe, S, M., and Anderson, G. L. (1994). A cautionary note on inference for marginal regression models with lon-

gitudinal data and general correlated response data.Communications in Statistics-Simulation and Computation,

23(4), 939-951.

96

Page 98: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[15] Preisser, J. S., Lohman, K. K., and Rathouz, P. J. (2002). Performance of weighted estimating equations for

longitudinal binary data with drop‐ outs missing at random.Statistics in medicine, 21(20), 3035-3054.

[16] Robins, J. M., Rotnitzky, A., and Zhao, L. P. (1994). Estimation of regression coefficients when some regressors

are not always observed.Journal of the American Statistical Association, 89(427), 846-866.

[17] Robins, J. M., Rotnitzky, A., and Zhao, L. P. (1995). Analysis of semiparametric regression models for repeated

outcomes in the presence of missing data.Journal of the American Statistical Association, 90(429), 106-121.

[18] Rodriguez, R. N., and Stokes, M. (2014). SAS/STATR 13.1 Round-Up.

[19] Rotnitzky, A., Robins, J. M., and Scharfstein, D. O. (1998). Semiparametric regression for repeated outcomes

with nonignorable nonresponse.Journal of the American Statistical Association, 93(444), 1321-1339.

[20] Seaman, S., and Copas, A. (2009). Doubly robust generalized estimating equations for longitudinal data.

Statistics in medicine, 28(6), 937-955.

[21] Touloumi, G., Babiker, A. G., Pocock, S. J., and Darbyshire, J. H. (2001). Impact of missing data due to drop‐

outs on estimators for rates of change in longitudinal studies: a simulation study.Statistics in medicine, 20(24),

3715-3728.

[22] Tsiatis, A. (2006).Semiparametric theory and missing data. Springer.

[23] Williamson, E. J., Morley, R., Lucas, A., and Carpenter, J. R. (2012). Variance estimation for stratified propensity

score estimators.Statistics in medicine, 31(15), 1617-1632.

97

Page 99: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第 II 部

MMRM の詳細と感度分析

Page 100: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第9章 MMRM

9.1 はじめに

経時測定データを伴う臨床試験では,特定の時点 (多くの場合,計画された観察期間の最終時点)での治療群

間差に基づいて有効性の評価が行われる.このような試験の解析でしばしば問題とされるのは,被験者の試験

からの脱落に起因するデータの欠測である.このような欠測データに対する処方として,LOCFによる単補完

法に基づく解析が,検証的試験の主要な有効性解析などで慣例的に用いられてきた.この理由として,分散分

析のような完全データに対する解析方法を適用することができること,治療効果を過小推定する傾向にあると

いう点で一般に保守的であると (誤って)見做されていること,実装が容易であることなどが挙げられる.ま

た,実際には LOCFの適切性は非常に強い仮定に依っているが,各治療群で異なる欠測が起こる時点,欠測

データの占める割合,欠測理由に起因する偏りを潜在的に相殺することで,complete case解析よりも偏りが少

ないと見做されるとの見方もある (Mallinckrodtet al., 2008).しかし,4章で考察したように,LOCFを含む単

補完に基づく方法には多くの議論があり,これに代わる方法論の研究が進んできている.本章で焦点を当てる

MMRM(Mixed Model for Repeated Measures)に基づく解析は,LOCFに代わる柔軟な方法として近年ますます

注目を集めている.

2章で述べたように,Rubin(1976)及び Little & Rubin(2002)では 3つの欠測メカニズムMCAR,MAR,MNAR

を定義しているが,彼らは尤度に基づく解析の観点で,下記の 2つの欠測メカニズムの性質も定義している.

• 尤度に基づく解析が,欠測メカニズムの分布を無視した場合でもパラメータの妥当な推測を与えるならば,その欠測メカニズムは「無視可能」(Ignorable)と呼ばれる.

• 尤度に基づく解析が,欠測メカニズムの分布を無視した場合にパラメータの妥当な推測を与えないならば,その欠測メカニズムは「無視不可能」(Non-ignorable)と呼ばれる.

Laird(1988)は,MCARとMARが無視可能な欠測メカニズムであり,欠測識別変数を無視した尤度に基づく解

析が妥当であることを示した.一方,MNARは無視不可能な欠測メカニズムであり,欠測識別変数を無視した

尤度に基づく解析は潜在的に偏りをもつ推測を与えうる.

Laird & Ware (1982)は,経時測定データを扱う臨床試験から得られた不完全な (欠測を伴う)データを解析す

るために,線形混合モデルを利用した尤度に基づく解析を提案している.尤度に基づく解析では,観測データ

の尤度関数に基づきパラメータの推定値を与える.一般に,欠測メカニズムと応答変数に関するパラメータが

異なる,かつ独立である (すなわち,パラメータの分離条件が満たされている)と想定される場合に,尤度に基

づく方法において欠測が無視可能であること,すなわち観測データの周辺分布 (直接尤度,Direct Likelifood:

DLとも呼ばれる)を利用した推測が妥当であることは,欠測メカニズムがMAR(あるいはMCAR)であること

と同等である.逆に言えば,欠測メカニズムにMAR を想定することができる場合,尤度に基づく方法は妥当

な推測結果を与える.Mallinckrodt et al. (2001a; 2001b)は,尤度に基づく方法の解析モデルの一つの特別な形

式として線形混合モデルを検討し,これを"MMRM"と呼んだ.すなわち,MMRM による解析は尤度に基づく

解析の一つであり,欠測メカニズムがMAR であれば DL に基づいて妥当な推測結果を得ることができる.こ

の意味で,MMRM は,MARを想定した SMの一つの特殊な形式であると考えることができる.詳細は 5章を

参照されたい.

99

Page 101: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

9.2 MMRM の概念と特徴

MMRM は尤度に基づくモデルの幅広いクラスを包括する.異なる複数の時点のデータ間の分散共分散構造

を推定することにより,個々の被験者の完全又は部分的に観測されたデータを利用する.MMRM は線形混合

モデル (Linear Mixed Model:LMM) の特別な形式である.Laird & Ware (1982)は,以下を満足する任意のモデ

ルとして,LMM を導入した1.

Yi = Xiβ + Zibi + ϵi, i = 1, . . . , N

bi ∼ N(0,D),

ϵi ∼ N(0,Σi),

b1, . . . ,bN , ϵ1, . . . , ϵNは独立.

(9.1)

ここに,Yiは被験者 iにおける ni次元2の応答変数ベクトル,βは p次元の固定効果ベクトル,biは q次元の

(主に被験者特異的な)変量効果ベクトル,Xi 及び Zi は,それぞれ固定効果及び変量効果に対応する (ni × p)

及び (ni × q)行列,ϵi は ni 次元の誤差ベクトル,Dは (i, j)成分 dij に対して dij = dji となる (q × q)分散

共分散行列,Σi は (ni × ni)分散共分散行列 (通常,測定時点が同じであれば被験者間で共通3)である.LMM

の重要な一般的特徴は,一般線形モデル (General Linear Model:LM) が固定効果のみを含むのに対して,固定

効果と変量効果の両方を含む点である,臨床試験では,被験者特異的な (ランダムな)効果は重要な推測対象と

はならず,一般には固定効果,特に治療効果の差を評価するように試験がデザインされることが多い.しかし,

固定効果に関してより適切に推測を行うためには,被験者ごとの相関を変量効果等を用いて説明することが重

要である.

ここで,(9.1)の応答変数の周辺分布が多変量正規分布として以下のように記述されることに着目する.

Yi ∼ N(Xiβ,Vi),

Vi = ZiDZ′i +Σi.

これより,(9.1)のように変量効果を明示的にモデリングする代わりに,分散共分散行列Vi を直接的にモデリ

ングすることが考えられる.Mallinckrodt et al. (2001a; 2001b)はこのようなモデリングをMMRM と呼んでお

り,被験者単位の変量効果を被験者内の誤差相関構造の一部としてパラメータ化することが,MMRM と他の

LMM を区別する特徴である4.一方で,変量効果をモデルに組み込むのは,そもそも変量効果自体に関心があ

るためであり,"MMRM"という呼称を使うことによる混乱を危惧する議論もある.

被験者内の誤差相関構造として,様々な分散共分散構造を選択することができる.分割型実験や被験者を変量効

果とした LMM のような経時測定データに対する古典的線形モデル解析では,複合対称 (Compound Symmetory:

CS)構造が選択される.CS構造は,分散一定ですべての時点間の相関が等しいとする構造であるが,経時測

定データでは時点が離れると相関が小さくなることがあり,そのような場面では CSの適用に注意を要する.

CSの他に,1次自己回帰 (1-AutoRegression:AR(1),等分散かつ相関が指数的に減少),Toeplitz (等分散かつ時

点間の区切りの水準ごとに異なる相関),無構造 (Unstructured:UN,すべての分散共分散行列の成分が異なる)

等の,様々な構造を選択することができる.分散共分散構造に対するモデルを選択を行うために,2つの接近

法が考えられる.一つは,赤池情報量規準 (Akaike Information Criteria:AIC) や Bayes情報量規準 (Bayessian

Information Criteria:BIC)などの共分散パラメータの数で調整したモデル適合指標に基づいて,分散共分散構

造モデルを比較することである.もう一方は,分散共分散構造のネスト構造を利用して尤度比検定を行い,追

加のパラメータが分散共分散構造モデルの適合に対して統計学的に有意な改善を与えるか否かを判断すること

である.いずれの方法も利用可能であるが,Lu & Mehrotra (2009)は分散共分散構造の「最適な」モデリング

が不要であると指摘している.これは,標本サイズが適度に大きい場合は,一般に無構造共分散を利用しても,

推定効率に関する損失は無視可能な程度であるためである.この観点から,Mallinckrodtet al. (2001a;2001b)や

1本報告書では Laird & Ware (1982)に基いて変量効果及び誤差に正規分布を仮定するが,他の分布を仮定することも可能である.2欠測データも含めた完全データを n次元とし,ここでは観測データのみの次元として ni (ni ≤ n, i = 1, . . . , N ) を定義した.3被験者ごとに異なる分散共分散行列を想定することも可能である.4ただし,施設等の他の変量効果を含めたモデルを MMRM に含めることもある.

100

Page 102: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 9.1: MMRM 解析による欠測データの取り扱いの例示のための仮想データセット.低値になるほど状態が改

善していることを示す.

Visit

被験者 治療群 Baseline   1    2    3    4    5    6 

1 1 22 20 18 19 14 12 10

2 1 22 21 18 11 12 11 6

3 1 22 22 21 20 19 * *

4 2 20 20 20 20 19 21 22

5 2 21 22 22 23 23 25 26

6 2 18 19 20 * * * *

* 被験者の脱落に起因する欠測データ

Siddiqui (2011)は,とくに本報告書の主題である第 III 相試験で,分散共分散構造に UNを指定したMMRM に

基づく解析を示唆しているが,標本サイズが十分に大きくない場合や群間でアンバランスな場合には別の選択

も考えられる5.もちろん,真の構造に基づくモデルを用いることができれば推定精度が上がるため,真の構造

の探索も検討すべき事項となりうる.

観測データから得られる情報は,欠測データに関する情報を与えるために被験者内の相関構造の推定に利用

されるが,パラメータを推測するために欠測データを明示的に補完することはない.表 9.1の仮想データセット

を用いて,MMRM に基づく解析における欠測データの取り扱いを例示する.とくに被験者 3は,治療群平均

よりも改善の程度が小さい傾向にある.治療群 1の時点 5及び時点 6の治療群平均は,被験者 3が試験に残っ

たとして,その時点 5及び時点 6の観測値が治療群平均よりも悪い傾向にありそうだという内容を反映するよ

うに調整される.しかし同時に,治療群 1の他の患者がすべて改善していることから,被験者 3はいくらか改

善するかもしれないと予測される.被験者 6も,その治療群平均よりも僅かに悪化傾向にある.治療群 2の時

点 3~時点 6の群平均は,被験者 6が試験に残ったとして,その観測値が治療群平均よりも僅かに大きな割合

で悪化し続ける傾向にありそうだということを反映するように調整される.

この調整の程度は,被験者内の誤差相関の強さ及び欠測データをもつ被験者の観測データが群平均からどれ

だけ乖離しているかによって決まる.また調整の不確実性は,群平均の算出に用いるデータの個数,欠測データ

をもつ被験者の観測データの個数,被験者内の誤差相関によって決定される (Mallinckrodtet al., 2001b).これら

の調整の大きさは,理論的に求めることができる.詳細は,Laird & Ware (1982),Cnaanet al. (1997),Verbeke

& Molenberghs(1997)などを参照されたい.

9.3 SASによる実装

前節で述べたように,MMRM は LMM の特別な形式であり,SASの PROC MIXEDを用いて比較的容易に

実装することができる.本節では,MMRM に基づく解析のための標準的なプログラム・コードおよびその概

説を与える.

説明のため,経時測定データを扱う臨床試験において表 9.2の形式でデータセットが得られているとする.

このようなデータセットに対するMMRM に基づく標準的な解析は,以下のように実装することができる.

PROC MIXED DATA=datasetName;

CLASS TREATMENT TIME_POINT SUBJECT_ID;

MODEL RESPONSE = BASELINE TREATMENT TIME_POINT TREATMENT* TIME_POINT / DDFM=KR;

LSMEANS TREATMENT* TIME_POINT / ALPHA=0.05 CL DIFF=CONTROL(’PLACEBO’,’tn’);

REPEATED TIME_POINT / SUBJECT=SUBJECT_ID TYPE=UN;

RUN;

5例えば,群ごとに異なる分散をもつ UN など.

101

Page 103: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 9.2: MMRM 解析のデータ構造の例

SUBJECT_ID TREATMENT BASELINE TIME_POINT RESPONSE

A-01 Drug 1234 t1 1234

A-01 Drug 1234 t2 1234...

......

......

A-02 Placebo 1234 t1 1234...

......

......

A-03 Placebo 1234 t1 1234...

......

......

PROC MIXEDの各ステートメントの詳細については SASのヘルプを参照されたい.ここでは,全体の概説

及び特に重要と思われる部分をピックアップして説明する.

9.3.1 PROC MIXEDステートメント

PROC MIXEDステートメントでは,読み込むデータセットの指定を行うほか,推定や出力に関する様々な

オプションを指定することができる.とくに MMRM と関連するのは,EMPIRICALオプションと SCORING

オプションである.EMPRICALオプションを指定すると,パラメータのモデルに基づく分散推定量の代わり

にいわゆるサンドウィッチ (ロバスト)分散推定量 (Huber, 1967; Liang & Zeger, 1986)を出力する.分散共分散

構造に UNを指定すればパラメータの推定値に偏りは含まれないが,収束の問題等でより特定した構造 (CSな

ど)を採用せざるを得ない場合,分散共分散構造を誤って特定すると,欠測データの有無にかかわらずモデル

に基づく分散推定量は偏りをもつことが知られている.このような場面では,EMPRICALオプションを指定

し,サンドウィッチ分散推定量を利用することが必要である.サンドウィッチ分散推定量は,平均構造が正し

く特定されていれば一致性をもつことが知られている6.

PROC MIXEDのデフォルトの推定方法は制限付き最尤法 (Restricted Maximum Likelihood Method:REML)

であり,その推定は反復過程を伴う.デフォルトでは Newton-Raphson法に基づき観測情報量を利用して反復

推定を行うが,とくに分散共分散構造に UNを指定するとき,欠測データの数が過剰に多い場合や時点間相関

が非常に高い場合,データに比して時点数が多い場合などに,反復過程が収束しない恐れがあることが指摘さ

れている (Lu & Mehrotra, 2009).収束しない原因の一つに,PROC MIXEDの与える初期値が不適切な値であ

る可能性があるため,このような場面の一つの対処法は,Newton-Raphson法の代わりに Fisher’s scoringアル

ゴリズムを適用し,反復の初期値を得ることである.SCORINGオプションを指定すると,SCORING=で指定

した数値分だけ Fisher’s Scoringアルゴリズムで反復を行い,その反復内で収束しなければ Newton-Raphson法

に切り替えて反復を行う.初期値のみを Fisher’s Scoringアルゴリズムで得るためには,SCORING=1を指定す

れば良い.

9.3.2 CLASSステートメント

CLASSステートメントでは,モデルで利用するカテゴリカル変数を特定する.必要に応じて,連続な数値変

数を指定することも可能である.先述の標準プログラムでは,時点をカテゴリカル変数として扱っている.

6ただし,サンドウィッチ分散推定量の一致性は,欠測メカニズムが MCARであることを仮定しているという指摘もある (Mallinckrodt,2013).

102

Page 104: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

9.3.3 MODELステートメント

MODELステートメントでは,モデルに含まれる応答変数と固定効果の関係 (平均構造)を特定する.本報告

書では,ベースライン,治療,時点,治療と時点の交互作用を説明変数とするモデルを実装するプログラムを

「標準」として示したが,それ以外にも様々な解析モデルを選択することができる.例えば,疾患領域によっ

ては,ベースラインと各時点の応答の共分散がそれぞれ異なると想定とすることが適切であることもある.こ

の場合は,ベースラインと時点の交互作用を組み込んだモデルがより適切であるかもしれない.ベースライ

ンの測定値をモデルに組み込む方法については,例えば Dinh & Yang (2011)に詳細が与えられている.また,

MODELステートメントの重要なオプションに,自由度の計算方法を指定する DDFMオプションがある.欠測

によりデータがアンバランスであるとき,固定効果の自由度はデータから推定することが必要であり,PROC

MIXED ではいくつかの方法が用意されている.多くの文献で,モデルに基づくパラメータの分散推定量の過小

推定の傾向7を調整し,その分散推定量に基づいて Satterthwaiteの調整自由度を推定する Kenward-Roger (KR)

法 (Kenward & Roger, 1997)の使用が推奨されている.

9.3.4 LSMEANSステートメント

LSMEANSステートメントは,固定効果の最小二乗平均を計算するために用いる.提示したプログラムのよ

うに TREATMENT × TIME_POINTを指定すると,治療群ごとにすべての測定時点における最小二乗平均を

出力する.有意水準の指定 (ALPHAオプション),信頼区間の出力 (CLオプション),最小二乗平均の差の計算

(DIFFオプション)などが可能である.多重比較を行う場合には,ADJUSTオプションで多重性の調整を行う

ことができる.

9.3.5 REPEATEDステートメント

REPEATEDステートメントは,誤差成分 ϵi の分散共分散構造Σi を指定するために用いる.SUBJECTオプ

ションで繰り返し測定の単位を指定し,TYPEオプションで分散共分散構造のタイプを指定する8.データセッ

トの構造上,繰り返しの単位内でデータの順序が自明でない場合 (例えば非単調な欠測で,欠測データのレコー

ドが存在しないデータ構造の場合)は,データの順序の情報をもつ変数を REPEATEDステートメントで指定す

ることが必要となるが,そうでない場合は省略することができる.なお,Σiの推定値を出力するためにRオプ

ション,推定されたΣi に対応する相関行列を出力するために RCORRオプションを利用することができる9.

9.3.6 RANDOMステートメント

前節で述べたように,MMRM では,変量効果をモデルに組み込む代わりに,誤差成分の分散共分散行列を

直接的にパラメータ化し,相関を構造化する.したがって,一般に RANDOMステートメントを利用せずとも

MMRM を実装することができる.しかし,これは変量効果をモデルに組み込むことができないということを

意味するものではない.一般には,変量効果の分散共分散行列と誤差成分の分散共分散行列を別々に構造化す

ることで,幅広い相関構造を表現することが可能である.注意が必要となるのは,MMRM で誤差成分の分散

共分散構造に UNを選択した場合である.誤差成分の分散共分散構造に UNを選択したうえで,さらに変量効

果に被験者を設定すると,モデル (パラメータ)の識別性10が失われ REMLの推定が不安定になる.実際に,こ

の組合せで REPEATEDステートメントと RANDOMステートメントを指定すると,共分散パラメータの推定

7分散共分散構造が正しく特定できたとしても,モデルに基づくパラメータの分散推定量はそれ自体に分散分散共分散行列の推定量を含むため,その推定に伴うばらつきを考慮しないと過小推定される.

8先述の CS,AR(1),Toeplitz,UN のほかに多くのタイプが用意されている.詳細は SAS HELPを参照.9デフォルトでは最初の被験者のものだけが出力される.例えば i番目の被験者の Σi を出力したい場合は"R=i",対応する相関行列を

出力したい場合は"RCORR=i"のように指定すればよい.10一般に識別性 (Identifiability)とは,適切な推測ができるためにモデルが満足しなくてはならない特性を意味する.この場合では,誤

差成分の分散共分散構造のパラメータが過剰になり,パラメータの真値が一意に定まらないため,モデルの識別性がないと考えられる.

103

Page 105: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

に関する Hessianが正定値でないことがある.この場合,収束条件を満たしたとしても,推測結果は一意的で

はないので注意しなければならない.この点については,Appendix Aの A.7.11節も参照のこと.

9.4 主解析としてのMMRM

Mallinckrodtet al. (2008)では,臨床試験の主要な解析方法としてMMRM に基づく解析が推奨される点につ

いて,下記の理由を挙げている.

• 臨床試験において,MAR の想定が妥当である場面は多いと考えられること

とくに治療効果の発現を経時測定デザインで評価する試験では,観測データと解析モデルによりほとん

どの欠測を説明することができると考えられる.この点は,主要評価項目とそれらに影響を及ぼす因子

を観察するために十分なコントロールを行い,欠測データ (とくにMNARデータ)の数を減らすために良

くデザインされた試験ではとくに当てはまり,MAR の尤もらしさが増すと考えられる.

• モデルの事前明記が可能なことMMRM で特定されるモデルの特徴のほとんどは臨床試験のデザインから理論的に導かれるため,解析計

画の中で事前に明記をすることが可能である.

• 汎用的なモデルの指定ができること誤差成分の分散共分散構造に UNを指定することにより,時点間相関構造に対しては適用場面に依らな

い汎用的なモデルとなるため,事前明記の観点で利用しやすい.ただし,REMLによる反復推定の収束

に問題をもつことがある.この場合,分散共分散構造を特定する順も事前に特定し,最初に収束した分

散共分散構造で主要な解析の結果を提示することができる.

一方で,MAR が正しいと思われる状況が必ずしも多くないとの指摘もあり (LaVange, 2014),実務での適用

には注意を要すると考えられる.

前節で紹介したように,"MMRM"という名称は非常に広範な解析モデルのクラスを表しており,この名称自

体が特定の解析方法を示すものではない.したがって,実務的には解析計画でいくつか特定しなければならな

い項目がある.Mallinckrodtet al. (2008)では,下記のような解析計画の記載例を紹介している.

MMRM…制限つき最尤法 (REML)により,ベースラインからの平均変化量を解析する.解析モデルには,カテゴリカル変数の固定効果として治療,施設,時点及び治療と時点の交互作用,連続変数の固定効果としてベースライン値及びベースライン値と時点の交互作用を共変量に含める.被験者内誤差のモデリングには,無構造の分散共分散構造を用いる.この解析が収束に失敗した場合には,次の分散共分散構造を検討し赤池情報量規準を最小にする構造を主要な解析として採用する:(適切な構造のリストを記載する).自由度の推定には,Kenward-Rogerの方法を用いる.有意水準 α = 0.05 (両側)で,最小 2乗平均に基づいて仮説検定を行う.解析は (ソフトウェアパッケージ名を記載)を用いて行う.主たる治療の比較は,最終時点での治療間の対比で行う.

この記載例から見ることができる要点は,共変量,相関構造,自由度調整法である.言い換えれば,これら

は,MMRM を主解析モデルとして位置づけた場合に感度分析の対象となりうる項目であると捉えられる.共

変量については,とくに欠測メカニズムが MAR であるか否かの感度分析の観点で,Collins et al. (2001)や

Mallinckrodtet al. (2013)で説明されている"Restrictive Model","Inclusive Model"の考え方が深く関係する.こ

れらの詳細は 10章で紹介する.また,MAR のもとで妥当な結果を与えるとされる他の方法に,多重補完法

(Multiple Imputaion:MI),重みつき一般化推定方程式 (weighted Generalized Estimating Equation:wGEE)が挙

げられる.MMRM に基づく解析結果とこれらの方法での解析結果の違いについては,12章のシミュレーショ

ンの結果を参照されたい.

9.5 MMRM に基づく解析の検出力と標本サイズ設計

検証的な臨床試験では,主要な解析に対応して検出力と標本サイズに関する計算を行うことが必要である.

最近では,Lu et al. (2008)により,欠測データを考慮した反復測定データの尤度に基づいてこれらの計算を行

う方法が提案されている.104

Page 106: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

J 時点の反復測定デザインを検討する.時点ごとの被験者数を n1, n2, . . . , nJ で表し,ここでは単調な欠測

を想定し n1 ≥ n2 ≥ · · · ≥ nJ であるとする.ただし,計算の便宜上 nJ+1 = 0とする.被験者間のデータは

独立で,i番目の被験者の応答Yi = (yi1, . . . , yiJ)′ は,平均 µ = (µ1, . . . , µJ)

′ ,分散共分散行列 Σの同じ多

変量正規分布に従うとする.ただし Σ は,その (j, k) 成分が σjk (j, k = 1, . . . , J) の対称行列である.また,

rj = nj/n1(j = 1, . . . , J)は第 j 時点で試験に残っている被験者の比率 (残存率)を表し,r = (r1, . . . , rJ)′ と表

す.MMRM に基づく µの最尤推定量を µとすると,µの漸近分散は I−1 で与えられる.なお,

I =J∑j=1

(nj − nj+1)

(Σ−1j 0j×(J−j)

0(J−j)×j 0(J−j)×(J−j)

)(9.2)

である.ここに,Σj はΣの最初の (j × j)部分行列,0kl は 0の (k× l)行列 (l = 0の場合,空ベクトル)であ

る.和の第 j 項は,最初の j 個の測定値しかもたない被験者,すなわち第 j 時点の後に脱落し,以降の測定値

が欠測である被験者の情報寄与を意味している.さらに以下を定義する.

I∗ =

J∑j=1

(rj − rj+1)

(R−1j 0j×(J−j)

0(J−j)×j 0(J−j)×(J−j)

)(9.3)

ここに,Rj は相関行列Rの最初の (j × j)部分を表す.ただし,Rは,その (j, k)成分が σjk/(σjσk) (j, k =

1, . . . , J)で表される対称行列であり,σj = σ1/2jj である.このとき,式 (9.2)より,最終時点における平均の漸

近分散は Var(µJ ) = ϕ(σ2J/n1)で与えられる.ここに,ϕ = [I∗]−1

JJ である.この漸近分散に基づいて,標準的

な方法により検出力及び標本サイズを計算することができる.欠測データが存在する場合の µJ の分散は欠測

データが存在しない場合の ϕ倍となるため,Lu et al. (2008)では ϕを"Inflation factor"と呼んでいる.式 (9.3)

から分かるように,ϕは被験者の残存率 r,相関構造Rに依存するため,この方法に基づく検出力及び標本サ

イズの計算ではこれらを事前に想定することが必要となる.計算の詳細は Lu et al. (2008)を参照いただきたい.

9.6 おわりに

本章では,欠測メカニズムが MAR である場合に妥当な推測結果を与える方法の一つとして,SMの一つの

特殊な形式であるMMRM を紹介し,主解析として推奨される理由について述べた.しかし一般に,どのよう

な臨床試験のデータであっても,欠測がMNAR である可能性を排除することはできない.この意味で,MAR

の仮定は常に適切であるとは言い切ることができない.Mallinckrodt et al. (2001b)は,シミュレーション研究

により MNAR データが MMRM に基づく解析に及ぼす影響を評価しており,彼らが調査したシナリオの範囲

内で比較的に頑健な推測を与えると報告しているが,一方で大きくバイアスをもつ推測を与えるという報告も

ある (Yuan & Little, 2009).また,検定問題のみを考えるのであれば,帰無仮説のもとでの推論が妥当であれ

ば問題がないので,検討する帰無仮説のもとで第一種の過誤がインフレーションしなければ良いとの見方もあ

る.一般の状況を考えると,5章,6章,7章で示したようなMNAR の仮定のもとで妥当な方法を用いるべき

であるが,これらの方法はより多くの検証不可能な仮定に依存し,さらにその仮定によって解析結果が大きく

変わる恐れがあることから,これらを主要な解析方法として位置づけることは難しいとの考え方もある.以上

のことを踏まえると,MMRM などのMAR を仮定した解析方法を主要な解析と位置づけたもとで,MNAR を

仮定した解析を「感度分析」として実施することは有益であると考えられる (Mallinckrodt et al., 2004; Shenet

al., 2006; Mallinckrodtet al., 2008).次章では,感度分析について体系的に説明を行う.

参考文献

[1] Collins, L. M., Schafer, J. L. & Kam, C. M. (2001). A comparison of inclusive and restrictive strategies in modern

missing data process.Psychological Methods, 6(4), 330-351.

[2] Cnaan, A., Laird, N. M. & Slasor, P. (1997). Using the general linear mixed model to analysis unbalanced repeated

measures and longitudinal data.Statistics in Medicine., 16, 2349-2380.

105

Page 107: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[3] Dinh, P. & Yang, P. (2011). Handling baselines in repeated measures analysis with missing data at random.Journal

of Biopharmaceutical Statistics, 21, 326-341.

[4] Huber, P. J. (1967). The behavior of maximum likelihood estimation under nonstandard conditions.Proceeding

of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, 1, LeCam, L. M. and Neyman, J.

editors. University of California Press, 221-233.

[5] Kenward, M. G. & Roger, J. H. (1997). Small sample inference for mixed effects from restricted maximum

likelihood.Biometrics, 53(3), 983-997.

[6] Laird,N. M. (1988). Missing Data in Longitudinal Studies.Stat. Med., 7,305-315.

[7] Laird, N. M. & Ware, J. H. (1982). Random-effects models for longitudinal data.Biometrics, 38(4), 963-974.

[8] LaVange, L. M. (2014). The role of statistics in regulatory decision making.Therapeutic Innovation & Regulatory

Science, 48(1), 10-19.

[9] Liang, Kung-Yee, & Zeger, S. L. (1986). Longitudinal data analysis using generalized linear models.Biometrika,

73(1), 13-22.

[10] Little, R. J. A. & Rubin, D. B. (2002).Statistical analysis with missing data, 2nded. New York: Wiley.

[11] Lu, K., Luo, X. & Chen, P. Y. (2008). Sample size estimation for repeated measures analysis in randomized

clinical trials with missing data.The International Journal of Biostatistics, 4(1), 1-16.

[12] Lu, K. & Mehrotra D. V. (2009). Specification of covariance structure in longitudinal data analysis for random-

ized clinical trials.Statistics in Medicine, 29, 474-488.

[13] Mallinckrodt, C. H. (2013). Preventing and Treating Missing Data in Longitudinal Clinical Trials. Cambridge

University press.

[14] Mallinckrodt, C. H., Clark, W. S. & David, S. R. (2001a). Accounting for dropout bias using mixed-effects

models.Journal Biopharmaceutical Statistics, 11, 9-21.

[15] Mallinckrodt, C. H., Clark, W. S. & David, S. R. (2001b). Type I error rates from mixed effects model repeated

measures versus fixed effects anova with missing values imputed via last observation carried forward.Drug Infor-

mation Journal, 35, 1215-1225.

[16] Mallinckrodt, C. H., Kaiser, C. J., Watkin, J. G., Molenberghs, G. & Carroll R. J. (2004). The effect of correla-

tion structure on treatment contrasts estimated from incomplete clinical trial data with likelihood-based repeated

measures compared with last observation carried forward ANOVA.Clinical trials (London, England), 1, 244-489.

[17] Mallinckrodt, C. H., Lane, P. W., Schnell, D., Peng, Y. & Maucuso, J. P. (2008). Recommendations for the

primary analysis of continuous endpoints in longitudinal clinical trials.Drug Information Journal, 42, 303-319.

[18] Mallinckrodt, C. H., Roger, J., Chuang-Stein, C., Molenberghs, G., O’Kelly, M., Ratitch, B., Janssens, M. &

Bunouf, P. (2013) Recent developments in the prevention and treatment of missing data.Therapeutic Innovation

& Regulatory Science, published online.

[19] Rubin, D. B. (1976). Inference and missing data.Biometrika, 63, 581-592.

[20] Shen, S., Beunckens, C., Mallinckrodt, C. & Molenberghs, G. (2006). A local influence sensitivity analysis for

incomplete longitudinal depression data.J. Biopharm. Stat., 16, 365-384.

[21] Siddiqui, O. (2011). MMRM versus MI in dealing with missing data - A comparison based on 25 NDA data sets.

Journal of Biopharmaceutical Statistics, 21, 423-436.

106

Page 108: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[22] Verbeke, G. & Molenberghs, G. (1997).Linear mixed models in practice: a SAS oriented approach, New York :

Springer-Verlag.

[23] Yuan, Y. & Little, R. J. A. (2009). Mixed-effect hybrid models for longitudinal data with nonignorable dropout.

Biometrics, 65, 478-486.

[24] 松山・山口 (2001).医学統計のための線形混合モデル (編訳).サイエンティスト社.

107

Page 109: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第10章 感度分析の実行

10.1 はじめに

我々が主解析を実施する際,いくつもの仮定をおいている.これらの仮定の中には,正しいかどうか観測デー

タからは判断できないものもあるので,仮定を変えた解析を行い解析結果にどの程度影響を与えるかを確認す

ることは重要である.これが感度分析の 1つの考え方である1.NRC(2010)では感度分析の種類を「完全データ

の分布に対する感度分析」,「欠測メカニズムに対する感度分析」,「外れ値,外れた症例に対する感度分析」の 3

種類に分類し,どの種類の仮定に対する感度を検討しているかについて,意識しながら解析することの重要性

を説明している.Mallinckrodt (2013)ではさらに複数の estimandに対する検討も感度分析に含め,個々の感度

分析の全体像を示した Analytic Road Mapを提示している.図 10.1は Mallinckrodt(2013)で示された Analytic

Road Mapを微修正したものである2.例えば,主解析として,(1)モデルには 9.2節で紹介したMMRM を採用

し,共変量は時点,薬剤,時点と薬剤の交互作用,及びベースライン値を用い,(2)欠測メカニズムは MAR,

(3)estimandは estimand 3(efficacy)とする.ここで,(1)~(3)のそれぞれの仮定に対する感度分析として,(1)

では正規分布の妥当性,共変量の追加による影響を検討し,(2)では欠測データの欠測メカニズムがMARから

乖離した場合の影響,(3)では副次的な estimandとして effectivenessの観点で薬剤の効果を評価することが考

えられる.本章では Analytic Road MapをはじめとするMallinckrodt (2013)の 14章及び NRC(2010)の 5章を

参考に,(1),(2),(3)の感度分析の定義を整理すると共に,その内の主要なものについてはシミュレーション

データを用いて実行例を紹介する.なお,複数の estimandに対する検討は,目的の異なる解析となるため感度

分析ではないという考え方も可能であるが,本報告書ではMallinckrodt (2013)に従い,感度分析に含めること

とした.

図 10.1: Analytic Road Map(著者らによる加工あり)

1感度分析という言葉の正確な定義は,ICH E9 (R1)でも検討の対象となっており,現段階では統一されていない.2オリジナルでは,MMRM は DL,モデル診断は Diagnostics: residuals, influence, correlation, timeと記載されている.また,一部を日

本語訳に変更し,解説を追加している.本報告書では説明のしやすさを優先して表記を編集した

108

Page 110: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

10.2 シミュレーションデータと主解析の結果

うつ病の第 III 相臨床試験を想定したシミュレーションデータ(主要評価項目:HAM-D スコアの時点 4での

ベースラインからの変化量)の要約を図 10.2,表 10.1に示す.解析の応答変数としてはベースラインからの変

化量を用いた.なお,脱落確率は両群でほぼ等しく,時点 4(12週目)で約 20%と設定した.興味のあるパラ

メータは,時点 4(12週目)の群間差とする.主要な estimandを estimand 3としている.

図 10.2: 群ごとの HAM-D スコアの推移(平均± SD)

表 10.1:時点ごとの症例数・HAM-D スコアの平均・SDベースライン 時点 1 時点 2 時点 3 時点 4

(3週目) (6週目) (9週目) (12週目)

例数 平均 例数 平均 例数 平均 例数 平均 例数 平均

(SD) (SD) (SD) (SD) (SD)

実薬群 100 20.0 93 18.1 89 14.9 84 11.0 83 8.5

(4.1) (4.2) (5.4) (6.3) (6.8)

プラセボ群 100 20.1 90 17.5 87 15.4 85 13.3 80 11.0

(4.2) (4.2) (4.6) (6.3) (6.1)

解析に用いる SASデータセットを以下に示す.

図 10.3: データセット(最初の 3例のみ)

109

Page 111: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

ここで,各変数の意味は

• id : 被験者番号

• trt : 投与群

• x0 :ベースライン値

• time :時点

• val :応答変数

である.

主解析として 9章で紹介したMMRM を実行した.解析仕様,SASプログラム及び解析結果を以下に示す.

• 応答変数:HAM-D スコアのベースラインからの変化量

• 共変量:ベースライン値,投与群,時点(カテゴリ値),投与群と時点の交互作用• 変量効果:被験者の影響を誤差と合わせてモデル化するため,明示的には特定しない• 相関構造:Unstructured(両群で共通).なお,収束しなかった場合

(1)初期値を Fisher’s scoring法で得られた値とする

(2)相関構造を Toeplitz, Heterogeneous CS,AR(1),CS,VCの順に指定する.

• 推定方法:REML

• 自由度調整方法:Kenward Roger

• 帰無仮説:時点 4で群間差が 0

• 有意水準:両側 5%

ODS OUTPUT DIFFS = diffs;

PROC MIXED DATA = inputds;

CLASS trt time id ; *治験薬 時点 被験者;

MODEL val = x0 trt time trt * time / DDFM = kr;

*応答変数 =ベースライン値 治験薬 時点 治験薬×時点 ;

REPEATED time / TYPE = un SUBJECT = id;

LSMEANS trt * time / DIFF;

RUN;

結果を表 10.2に示す.主解析では群間差は-2.26と推定され,有意水準両側 5%で有意であった.以下,感度

分析でこの結果の頑健性を検討する.図 10.1の Analytic Road Mapをもとに,検討事項を表 10.3にまとめた.

表 10.2:主解析の結果解析手法 時点 4における各群の 群間差 群間差の SE p値

点推定値 (SE)

実薬群 プラセボ群

MMRM -11.22 (0.69) -8.97 (0.70) -2.26 0.99 0.024

110

Page 112: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 10.3:感度分析の内容仮説 estimand 欠測 解析 その他

メカニズム 手法

主解析 efficacy 3 (primary) MAR MMRM感度分析 1 efficacy MAR MMRM 残差診断

(完全データの分布) 影響診断MNAR SM 感度パラメータ

感度分析 2 -1~1(欠測メカニズム) efficacy PMM 感度パラメータ

MNAR + -1~1MMRM

感度分析 3 pMI(estimand) effectiveness 6 (secondary) MNAR +

MMRM

10.3 完全データの分布に対する感度分析(感度分析 1)

Mallinckrodt (2013)の 12.3節では,完全データ分布に対する感度分析の項目として,"共変量", "分散共分

散構造","残差診断","影響診断"の 4項目を挙げている.

10.3.1 共変量の検討

NRC (2010)の 4章 (p49)及びMallinckrodt (2013)の 7.5節,12.4節では共変量を以下の 2種類に分けている.

• デザイン変数:投与群やベースライン時に得られる共変量で,全ての症例に対して観測され,主解析に用いられるもの.

• 補助変数 (auxiliary variables):欠測データに対する推測に利用できる変数.投与前のものもあれば投与後

のものもある.例えば,コンプライアンスや副作用に関するデータなどが挙げられる.通常,投与後の

データは試験治療の影響を受けている可能性があるため,主解析の共変量には用いられない.しかしなが

ら,脱落確率や欠測データの分布のモデリングの際にこれら補助変数をモデルに入れることにより,欠

測メカニズムをMNAR からMAR に近づけられる可能性がある.

Mallinckrodt (2013),Collins et al. (2001)らはデザイン変数のみを含めたモデルを"Restrictive Model",デザイ

ン変数と補助変数の両方を含めたモデルを"Inclusive Model"と定義している.Restrictive Modelを用いた主解析

の結果と,感度分析として Inclusive Modelを用いたMI や wGEEの結果を比較することは,欠測データが解析

結果に与える影響度合いを検討する上で有益な情報となることがある.

10.3.2 分散共分散構造の検討

分散共分散構造の違いが結果に与える影響についても,感度分析の対象となりうる.MMRM では,分散共

分散構造として,仮定が少なくあてはまりのよいことが想定される無構造 (Unstructured)を指定する場合が多

いが,これ以外の分散共分散構造を用いた場合の結果と比較することで,結果の頑健性の確認や真の構造の探

索などを行うことができる.例えば,主解析で分散分析構造に Unstructuredを指定している場合,より倹約な

(パラメータ数の少ない)相関構造を指定し,結果の頑健性を確認する方法が考えられる(パラメータ数の少

ない相関構造の順番は,例えば Toeplitz→ Heterogeneous CS→ AR(1)→ CS→ VCなどが考えられる).複雑

なモデルから単純なモデルに変更するのでこのような方法を感度分析と見做すかどうか,という点にも検討の

余地がある.逆に,さらに仮定を少なくするために群間で異なる無構造(Unstructured)の分散共分散行列を当

てはめることも考えられる.また,AIC等のモデル評価基準を用いて妥当な相関構造について検討することも

できる(9章参照).

111

Page 113: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

10.3.3 残差診断の検討

モデル適合度をみる方法として,残差診断はよく用いられる方法である.主解析としてMMRM を用いる場

合,SASの MIXED PROCEDUREのモデルステートメントの RESIDUALオプションで観測データに対して

様々な残差を出力できる.算出された残差に対して,(1)全体的なプロットを眺めて傾向をみる,(2)閾値を決

め,閾値を超えるものを外れ値と考え,それを除外した上で主解析と同様の解析を再度行うことにより,外れ

値の推定値に与える影響を評価する,などが考えられる.なお,Mallinckrodt (2013)の p134では Student化残

差の絶対値が 2以上の場合を外れ値と考え,除外した解析との結果を比較している(Appendix A参照).シ

ミュレーションデータに対する Student化残差の残差プロットを図 10.4の左に示す.やや負の値が多く見える

ものの,全体的に 0に対してほぼ対称に分布しており,特に偏りはみられなかった.Student化残差の絶対値が

2を超えるデータは 31ポイント存在した.これらのデータを除いて,主解析と同じモデルでMMRM による解

析を実施した結果を表 10.4に示した.群間差や群間差の SEはやや異なるものの,有効性に関する結果は主解

析と大きく変わらなかった.

10.3.4 影響診断の検討

影響の大きい症例や施設など,影響の大きいクラスタの探索方法について述べる.以下,主解析としてMMRM

を想定する.容易に実行できるのは, Cookの D統計量を用いる方法である.これは,MIXED PROCEDURE

のモデルステートメントの INFLUENCEオプションで算出できる.Cookの D統計量の値が大きい症例や施設

を,影響の大きい症例・施設と考え,それを除外した上で主解析と同様の解析を再度行うことにより,影響の

大きい症例や施設の,主解析の結果に与える影響が検討できる.今回は Cookの D統計量が 0.03以上の症例を

影響の強い症例とみなし,除外した解析を実施した.

シミュレーションデータに対するCookのD統計量のプロットを図 10.4の右に示す.CookのD統計量が 0.03

を超える症例は 1症例存在した.この症例を除いて,主解析と同じモデルでMMRM による解析を実施した結

果を表 10.4に示す.こちらの結果も残差診断での結果と同様,有効性に関する結果は大きく変わらなかった.

また,別の影響診断の方法として,local influenceを用いる方法があるが,本報告書ではこれ以上は触れな

い.詳細は Verbeke and Molenberghs (2000),Molenberghs and Kenward (2007)などを参照.

図 10.4: 残差プロット(Student化残差),Cookの D統計量

112

Page 114: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 10.4:外れ値・影響の強い症例の検討除外判定基準 症例数 データ数 群間差 群間差の SE

主解析 183 691 -2.26 0.99

感度分析 1 Student化残差 183 660 -2.37 0.87

(外れ値除外) 絶対値 2以上

感度分析 1 Cookの D統計量 182 687 -2.24 1.00

(外れた症例除外) 0.03以上

10.4 欠測メカニズムに対する感度分析(感度分析 2)

10.4.1 主解析で仮定する欠測メカニズム

主解析の内容を決める際,欠測メカニズムとしてMCAR,MAR,MNARのいずれかを仮定する必要がある.

通常の臨床試験データでMCARが妥当である状況はまれである (Mallinckrodt, 2013).また,MNAR では多く

の検証できない仮定をおく必要があり,仮定が間違っていた場合にMAR を仮定した解析よりも大きなバイア

スが入りやすいと言われている (Little, 1995).一方,9章 (MMRM) でも述べた通り,データの欠測に対してデ

ザイン上,綿密に検討された試験計画を策定すれば,MNARになり得る欠測もMARの欠測に近づけることが

できる可能性があるため,主解析における欠測メカニズムにMAR を仮定するのは妥当であるという主張もあ

る (Mallinckrodt, 2013).

10.4.2 Type (i),Type (ii)の仮定と欠測メカニズムに対する感度分析の必要性

欠測のあるデータを解析する際,各解析手法は様々な仮定のもとでのみ正当化されている.それらの仮定

は,以下で示す Type (i),(ii) の二種類の仮定に分けられ,それぞれ感度分析の方法は異なる (NRC, 2010, p85).

Type (ii)の仮定は観測データの分布に対する検証可能 (testable)な仮定のことを指し,仮定の正しさはモデルの

適合度等をみることで確認できる.一方,Type (i)の仮定は欠測データの分布に対する検証不可能 (untestable)

な仮定のことを指し,仮定の検証ができないため,様々なモデルを当てはめ,パラメータの推定値が安定して

いるか確認することが感度分析となる.欠測メカニズムが MAR であるか MNAR であるかは Type (i)の仮定

であり,観測データからは検証できない.上でも述べた通り,主解析では MAR を仮定して解析することも,

現在のところ比較的よく行われているが,その場合でもMNAR である可能性も常に考慮しておくべきである.

そのため NRC(2010)の 5章では,主解析でMAR を仮定した解析を行う際,感度分析としてMNAR の仮定の

下で別途解析し,MAR の仮定からの乖離に対する頑健性を確認する感度分析を行うことを強く推奨している

(Recommendation 15).現在,MNAR を仮定した解析は PMM,SM,SPMによる解析方法が提案されており,

SASのマクロプログラム等も利用可能である.本章では NRC(2010),Mallinckrodt (2013)に記載されている

SM,PMM,SPMを用いた欠測メカニズムに対する感度分析の方法を紹介する.

10.4.3 SMによる感度パラメータを用いた感度分析

5.2節及び 5.5節で紹介した SMの定義と脱落確率モデル式を再掲する(式 (10.1),式 (10.2)).ψ5 及び ψ6

は応答変数 Yij の値自身が Yij の欠測確率に与える影響度合いを説明するパラメータであり,モデルが正しい

もとで,ψ5及び ψ6が 0のときMAR,0以外のときMNARを仮定していることとなる.ここで ψ5及び ψ6を

感度パラメータとし,解析者が値を設定した下で,興味のあるパラメータ(計画している最終時点の群間差)

の推定値の安定性を確認することにより欠測メカニズムに対する感度分析を実行する.なお,感度パラメータ

の設定範囲は関連試験の結果等を参考に事前に定義しておくのが望ましい(Mallinckrodt et al., 2013).また,

113

Page 115: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

SMでは欠測モデルに加え,応答変数モデルも Type (i)の仮定である.これらの仮定も感度分析の対象となり

うる.

f(Yi,Ri|θ,ψ) = f(Yi|θ) · f(Ri|Yi,ψ) (10.1)

(第 1群) logitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ1 + ψ3Yi,j−1 + ψ5Yij

(第 2群) logitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ2 + ψ4Yi,j−1 + ψ6Yij(10.2)

シミュレーションデータに対してSMにより感度分析を行った際に用いたマクロプログラム(%SM_GridSearch)

を以下に示す.さらに解析結果を表 10.5,図 10.5,図 10.6に示す.感度パラメータを両群とも -1~1の範囲

(0.2区切り)と設定したもとで解析し3,時点 4での各群の最小二乗平均値と,群間差の最小二乗平均値を求

めた.その結果,感度パラメータの値が小さくなるほど,群間差の値が小さくなる傾向がみられた.群間差の

最小値は-1.92であった.

%SM_GridSearch( psi5grid = -1.0 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1.0,

psi6grid = -1.0 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1.0,

const = 4,

inputds = inputds, *用いるデータセット名;

covtype = un,

response = val,

modl = x0 trt time trt * time,

clasvar = trt time,

mech = MNARS,

derivative = 1,

method = %str(QN),

out1 = &h._sp_estimates, * 推定値出力用データセット ;

out2 = &h._sp_diffs, * 群間差推定値出力用データセット ;

out3 = &h._sp_lsmeans, * lsmeans 出力用データセット ;

debug = 0

);

表 10.5:感度パラメータごとの解析結果 (SM)時点 4における各群の

解析手法 感度パラメータ 点推定値 (SE) 群間差 群間差の SE

実薬群 プラセボ群

-1.0 -11.83(0.72) -9.91(0.72) -1.92 1.01

-0.8 -11.78(0.71) -9.84(0.71) -1.94 1.01

-0.6 -11.71(0.70) -9.74(0.71) -1.96 1.00

-0.4 -11.60(0.70) -9.58(0.70) -2.02 0.99

-0.2 -11.44(0.69) -9.31(0.70) -2.12 0.98

SM 0.0 -11.22(0.69) -8.96(0.70) -2.26 0.98

0.2 -10.98(0.71) -8.60(0.72) -2.38 1.00

0.4 -10.76(0.73) -8.29(0.74) -2.48 1.03

0.6 -10.63(0.75) -8.09(0.75) -2.54 1.05

0.8 -10.55(0.76) -8.00(0.76) -2.55 1.07

1.0 -10.50(0.76) -7.94(0.76) -2.56 1.08

3本シミュレーションにおいて,感度パラメータは両群に対して共通の値を設定しているが,異なる値を設定することもできる.

114

Page 116: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

図 10.5:感度パラメータごとの両群の点推定値± SE(SM) 図 10.6:感度パラメータごとの群間差± SE (SM)

10.4.4 PMMによる感度パラメータ∆を用いた感度分析

以下,PMMの感度分析について示す.6章の記載をベースライン+4時点の場合に修正して記載する.6章で

はベースラインを含めた 4時点で,ベースライン時点の値は常に観測される状況であった.一方,今回はベース

ライン以後 4時点であり,時点 1から欠測しうる.投与後の 4時点のベースラインからの変化量を Y1, Y2, Y3, Y4

とおく.

ここでは 6.7.4節で紹介した以下の制約条件を用いる.これは NRC(2010)の 5章で紹介した PMMの感度分

析の方法に対応する.

(6章) Case 7:NFMV+ACMV+∆

gs−1 (Ys|Y1, ..., Ys−1) = f≥s (Ys −∆|Y1, ..., Ys−1)

=T∑j=s

ωsjfj (Ys −∆|Y1, .., Ys−1) (10.3)

ベースライン +4時点のデータの分布関数は NFMV により以下の通り式変形できる.なお,ω43 + ω44 =

1, ω32 + ω33 + ω34 = 1である.後ほど,簡単のため δ = ω43 とおき,ω44 = 1− δを代入する.

f4 (1234) = f4 (1234)

f3 (1234) = f3 (123) f3 (4|123)

= f3 (123) g3 (4|123)

f2 (1234) = f2 (12) f2 (3|12) f2 (4|123)

= f2 (12) g2 (3|12)f≥3 (4|123) (∵ NFMV)

= f2 (12) g2 (3|12) [ω43 · f3 (4|123) + ω44 · f4 (4|123)]

= f2 (12) g2 (3|12)[δ · g3 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ)

f1 (1234) = f1 (1) f1 (2|1) f1 (34|12)

= f1 (1) g1 (2|1) f1 (3|12) f1 (4|123)

= f1 (1) g1 (2|1)f≥2 (3|12) f≥3 (4|123) (∵ NFMV)

= f1 (1) g1 (2|1) [ω32 · f2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)]

× [ω43 · f3 (4|123) + ω44 · f4 (4|123)]

= f1 (1) g1 (2|1) [ω32 · f2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)]

115

Page 117: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

×[δ · g3 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ)

= f1 (1) g1 (2|1)[ω32 · g2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]×[δ · g3 (4|123) + (1− δ) f4 (4|123)

]f0 (1234) = f0 (1) f0 (2|1) f0 (34|12)

= g0 (1)f0 (2|1) f0 (3|12) f0 (4|123)

= g0 (1)f≥1(2|1)f≥2(3|12)f≥3(4|123)

= g0 (1) [ω21 · f1(2|1) + ω22 · f2(2|1) + ω23 · f3(2|1) + ω24 · f4(2|1)]

×[ω32 · g2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]×[ω43 · g3 (4|123) + (1− ω44) f4 (4|123)

](∵ NFMV)

= g0 (1) [ω21 · f1(2|1) + ω22 · f2(2|1) + ω23 · f3(2|1) + ω24 · f4(2|1)]

×[ω32 · g2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]×[δ · g3 (4|123) + (1− δ) f4 (4|123)

](∵ ω43 = δ, ω44 = 1− δ)

= g0 (1)[ω21 · g1(2|1) + ω22 · f2(2|1) + ω23 · f3(2|1) + ω24 · f4(2|1)

]×[ω32 · g2 (3|12) + ω33 · f3 (3|12) + ω34 · f4 (3|12)

]×[δ · g3 (4|123) + (1− δ) f4 (4|123)

](10.4)

ここで,

δ = ω43 =α3f3 (123)

α3f3 (123) + α4f4 (123), 1− δ = ω44 =

α4f4 (123)

α3f3 (123) + α4f4 (123)

ω32 =α2f2 (12)

α2f2 (12) + α3f3 (12) + α4f4 (12), ω33 =

α3f3 (12)

α2f2 (12) + α3f3 (12) + α4f4 (12),

ω34 =α4f4 (12)

α2f2 (12) + α3f3 (12) + α4f4 (12),

ω21 =α1f1 (1)

α1f1 (1) + α2f2 (1) + α3f3 (1) + α4f4 (1), ω22 =

α2f2 (1)

α1f1 (1) + α2f2 (1) + α3f3 (1) + α4f4 (1),

ω23 =α3f3 (1)

α1f1 (1) + α2f2 (1) + α3f3 (1) + α4f4 (1), ω24 =

α4f4 (1)

α1f1 (1) + α2f2 (1) + α3f3 (1) + α4f4 (1)

である.

また,g1(2|1),g2(3|12),g3(4|123)は未特定の分布の確率密度関数であるが,6.5.4節で紹介した通り,ACMV

の制約条件を与えることにより特定可能となる.さらに感度パラメータ ∆の値を解析者が設定することによ

り,観測データと欠測データの分布の乖離度合いを仮定することができる.つまり,

gs−1 (Ys|Y1, ..., Ys−1) = f≥s (Ys −∆|Y1, ..., Ys−1) (10.5)

を上の式に代入する.個別に書き下すと

g0(1) = f≥1(1−∆)

g1 (2|1) = f≥2 (2−∆|1)

g2 (3|12) = f≥3 (3−∆|12) (10.6)

g3 (4|123) = f4 (4−∆|123)

となる.

116

Page 118: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

なお∆を設定した場合でも,∆をMARからのずれと考えるならば,efficacyの評価(estimand 3である)を

行うことに変わりはないと考えられる4.上記の内容を,NRC(2010)における PMMの感度分析と対応する形で

記載しておく5.まず,観測データの条件付き分布の平均は以下のようになる.なお,以下たとえばE[Y1 |R ≥ 1]

とは f≥1(1)の平均,E[Y2 |Y1, R ≥ 2]は f≥2(2|1)の平均である.Rは欠測識別変数ではなく,最終観測時点である.

E[Y1 |R ≥ 1] = µ1

E[Y2 |Y1, R ≥ 2] = µ2 + Y1β2

E[Y3 |Y2, R ≥ 3] = µ3 +Y′2β3

E[Y4 |Y3, R = 4] = µ4 +Y′3β4

(10.7)

次に,NFMV の仮定から

E[Y2 |Y1, R = 0] = E[Y2 |Y1, R ≥ 1]

E[Y3 |Y2, R = 0] = E[Y3 |Y2, R = 1] = E[Y3 |Y2, R ≥ 2]

E[Y4 |Y3, R = 0] = E[Y4 |Y3, R = 1] = E[Y4 |Y3, R = 2] = E[Y4 |Y3, R ≥ 3]

が成り立つ.最後に,gに対して,式 (10.6)を代入すると,以下のようになる.

E[Y1 |R = 0] = µ1 +∆

E[Y2 |Y1, R = 1] = µ2 +∆+ Y1β2

E[Y3 |Y2, R = 2] = µ3 +∆+Y′2β3

E[Y4 |Y3, R = 3] = µ4 +∆+Y′3β4

(10.8)

ここで,たとえば E[Y1 |R = 0]は g0(1) = f≥1(1−∆)の平均である6.

PMMにおいても SMと同様,感度パラメータを動かした下で興味のある推定値の安定性を確認することに

より欠測メカニズムに対する感度分析を実行する.なお,感度パラメータの持つ意味は,SMと PMMで大きく

異なるため,注意が必要である.SMの感度パラメータは観測確率に対するMARからの乖離度合いを,PMM

の感度パラメータは応答変数に対する MAR からの乖離度合いを表している.感度パラメータ ∆の設定範囲

は SMと同様,関連試験の結果を参考に事前に定義しておく.PMMの詳細な解析手順の説明は 6.5.4節~6.5.6

節,6.7.4節,6.10.4節を参照.

シミュレーションデータに対して PMMにより感度分析を行った際に用いたマクロプログラム (%delta_pmm)を

以下に示す.さらに解析結果を図 10.7,図 10.8,表 10.6,に示す.ACMV+∆の制約条件の下,感度パラメー

タを-3~3の範囲(1区切り)で設定したもとで解析し7,興味のある推定値(最終時点の群間差)を求めた.

その結果,感度パラメータの値が小さくなるほど,群間差の値が小さくなる傾向がみられた.群間差の最小値

は-2.20であった.

4一方で,∆ を「投与中止後の悪化(投与中止による影響を考慮している)」と考えるならば,effectivenessの評価と考える方が妥当かもしれない.この点についても,引き続き検討が必要であろう.

5NRC(2010)とは状況が少し異なるため,厳密には一致しない.また,少し追加の条件付けが必要となる.6式 (10.6),式 (10.8) 間で,感度パラメータ ∆ の符合が-から+へ変わっているように見えるが以下の式変形の通り,一致することが

分かる.∫Y2 · f≥2

(Y2∣∣Y1) dY2 = µ としたときに,E[Y2 |Y1, R = 1] は g1 (2|1) の期待値であり,

E[Y2 |Y1, R = 1] =

∫Y2 · g1 (2|1) dY

=

∫Y2 · f≥2

(Y2 −∆

∣∣Y1) dY2=

∫(Y2 −∆)f≥2

(Y2 −∆

∣∣Y1) dY2 +∆

∫f≥2

(Y2 −∆

∣∣Y1) dY2= µ+∆

7感度パラメータは両群に対して共通の値を設定している

117

Page 119: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

%delta_pmm(datain = inputds,

trtname = trt,

subjname = id,

visname = time,

basecont = %str(v0),

postcont = %str(val),

seed = 34535499,

nimp = 10,

deltavis = %str(first),

deltacont = %str(&delta),

deltacontarm = %str(0,1),

deltacontmethod = %str(meanabs),

favorcont = %str(&fav),

primaryname = val,

analcovarcont = %str(v0),

analmethod = mmrm,

repstr = %str(un),

trtref = 0,

dataout = data0imputed1,

resout = pmmresults1

);

• &deltavisでは感度パラメータの設定を,欠測した最初の 1時点のみとするか ("FIRST"),欠測した時点

以降すべてとするか ("ALL") を指定する.

• 上記 &delta,&favに入力する内容及び表 6の感度パラメータは以下の通り対応する.

(&delta ,&fav ,感度パラメータ)=

(3, high, -3.0) ,(2, high, -2.0) ,(1, high, -1.0) ,(0, high, 0.0) ,(1, low, 1.0) ,

(2, low, 2.0) ,(3, low, 3.0)

図 10.7:感度パラメータごとの両群の点推定値± SE(PMM) 図 10.8:感度パラメータごとの群間差± SE (PMM)

118

Page 120: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 10.6:感度パラメータごとの解析結果 (PMM)時点 4における各群の

解析手法 感度パラメータ 点推定値 (SE) 群間差 群間差の SE

実薬群 プラセボ群

-3.0 -11.37(0.69) -9.18(0.71) -2.20 0.962

-2.0 -11.31(0.69) -9.09(0.71) -2.22 0.962

-1.0 -11.25(0.69) -9.00(0.71) -2.25 0.963

PMM:NFV (NCMV) 0.0 -11.19(0.69) -8.91(0.72) -2.27 0.965

1.0 -11.13(0.69) -8.83(0.72) -2.30 0.969

2.0 -11.07(0.69) -8.74(0.72) -2.33 0.973

3.0 -11.00(0.70) -8.65(0.73) -2.35 0.979

10.4.5 SPMによる感度分析

7章で説明した通り,SPMは,式 (10.9)の通り,応答変数モデルと脱落確率モデルに共通の変量効果が入り,

一般にMNAR を仮定したモデルとなる.さらに感度パラメータを入れる方法も提案されていない.そのため,

SPMはMARを仮定した主解析と同様の共変量を用いて解析を行い,主解析の結果と比較することにより欠測

メカニズムに対する感度分析を考える.

f(Yi,Ri,bi) = f(Yio|bi)f(Yi

m|bi)f(Ri|bi)f(bi) (10.9)

7章では,切片として変量効果を含むモデル及び切片と時点に対する変量効果を含むモデルを紹介したが,本

解析では変量効果に切片のみに含める(式 (10.10)).さらに脱落確率モデルのリンク関数に Complementary

log-log linkモデル及びロジットモデルを紹介したが,本解析では Complementary log-log linkモデルを用いて

いる(式 (10.11)).

Yij = β0 + β1Timeij + β2Groupi + β3Timeij ×Groupi + bi0 + eij (10.10)

Pr(Di ≤ j) = 1− exp(− exp(α0j + γ1bi0)) (10.11)

シミュレーションデータに対して変量切片を考慮した SPMによる解析に用いたマクロプログラムを以下に

示す.さらに解析結果を表 10.7に示す.その結果,群間差は-2.65であった.なお,本シミュレーションに用

いたマクロでは,実薬群・プラセボ群の点推定値・SEは出力されなかった.

%SHARED_PARAMETER(INPUTDS = inputds,

SUBJVAR = id,

TRTVAR = trt,

TIME = time,

MODL = %STR(val = x0 trt time trt * time),

LINK = CLOGLOG,

RANDOM_SLOPE = %STR(NONE), * 変量効果は切片しか含まない ;

DEBUG = 0

);

• &LINK では脱落確率に対するモデルを指定する."CLOGLOG"を指定するとComplementary log-log link

モデルを用い,"LOGIT" を指定するとロジットモデルを用いる.

• &RANDOM_SLOPEでは変量効果のモデルを指定する."NONE"を指定すると応答変数モデルに変量効

果として切片しか含まないモデルを用いる,"LINEAR"を指定すると応答変数モデルに変量効果として切

片及び時点に対する効果を含むモデルを用いる.

119

Page 121: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• 出力結果は以下の二通りのモデルによる結果が両方出力される.

モデル 1:応答変数のモデルに含めた変量効果を,脱落確率モデルは含まない

モデル 2:応答変数のモデルに含めた変量効果を,脱落確率モデルも含む

表 10.7:SPMの解析結果(モデル 2)解析手法 時点 4における各群の 群間差 群間差の SE

点推定値 (SE)

実薬群 プラセボ群

SPM - - -2.65 0.76

10.5 Estimandに対する感度分析(感度分析 3)

3章で estimandの種類について紹介し,これらは efficacyと effectivenessに大きく分類されることを述べた.

主要な estimandに efficacyを設定した際,デザイン上可能であれば副次的な estimandに effectivenessを設定す

ることがある.これら estimand間では欠測データの量,主解析の方法,制約条件が変わり,さらに評価対象も

異なるため,異なる estimandに対する解析結果の比較は感度分析と考えるかどうかについては議論の余地があ

るが,本報告書ではMallinckrodt (2013)の 14章に従い,感度分析に含めることとした.

シミュレーションデータに対して pMIによる補完後,MMRM により解析した際に用いたマクロプログラム

(%cbi_pmm)を以下に示す.さらに解析結果を表 10.8に示す.群間差は-2.06となり,主解析の結果(-2.26)

よりやや小さい値となった.プラセボ群のデータを用いて両群の中止後のデータを補完したため,群間差が小

さくなったと考えられる.

%cbi_pmm(datain = inputds,

trtname = trt,

subjname = id,

visname = time,

basecont = %str(v0),

baseclass = ,

postcont = %str(val),

postclass = ,

seed = 34535499,

nimp = 100,

primaryname = val,

analcovarcont = %str(v0),

trtref = 0,

analmethod = mmrm,

repstr = un,

dataout = data0imputed2,

resout = pmmresults2

);

120

Page 122: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 10.8:pMI で補完後のMMRM の解析結果解析手法 時点 4における各群の 群間差 群間差の SE

点推定値 (SE)

実薬群 プラセボ群

pMI -11.03 (0.70) -8.97 (0.71) -2.06 0.99

10.6 感度分析の結果のまとめ

以上,主解析をMMRM とし,(1)完全データの分布(外れ値,外れた症例),(2)欠測メカニズム,(3)estimand

に対する感度分析を実行した.表 10.9に各解析の群間差の点推定値(又は,その最大値・最小値)をまとめた

ものを示す.

表 10.9:主解析・感度分析の群間差一覧解析手法 その他 群間差

最小 最大

主解析 MMRM estimand 3 -2.26

感度分析 1 MMRM 残差診断,影響診断 -2.24 -2.37

SM 感度パラメータ-1~1 -1.92 -2.56

感度分析 2 PMM+MMRM 感度パラメータ-3~3 -2.20 -2.35

SPM -2.65

感度分析 3 pMI+MMRM estimand 6 -2.06

群間差は主解析と比較してやや小さくなるものもみられたが,点推定値は-1.92~-2.65であり,主解析の結

果と大きく乖離するものではないと考えられた.そのため,本薬剤の有効性について結果の頑健性はあると考

えられた.しかし,これら結果のまとめ方(特に,感度パラメータを用いた感度分析の結果の解釈方法)につ

いては現在のところ一般論が存在しない.群間の脱落割合や脱落理由の確認,または感度パラメータの範囲で

の結果の変動の大きさ(点推定値及び信頼区間の変動が臨床的に意味のある範囲であるか)については十分に

考察するべきである (NRC,2010; Mallinckrodt, 2013).考察方法について,今後さらなる検討が必要であると考

えられる.

参考文献

[1] Collins, L. M., Schafer, J. L., and Kam, C. M. (2001). A comparison of inclusive and restrictive strategies in

modern missing data procedures. Psychological methods,6(4), 330.

[2] Little, R. J. A. (1995). Modeling the drop-out mechanism in repeated measure studies.Journal of American

statistical Association, 90(431): 1112-1121.

[3] Mallinckrodt, C. H. (2013).Preventing and Treating Missing Data in Longitudinal Clinical Trials. Cambridge

Press .

[4] Mallinckrodt, C., Roger, J., Chuang-Stein, C., Molenberghs, G., O’Kelly, M., Ratitch, B., and Bunouf, P. (2013).

Recent developments in the prevention and treatment of missing data. Therapeutic Innovation and Regulatory

Science, 2168479013501310.

[5] Molenberghs, G., and Kenward, M. G. (2007).Missing Data in Clinical Studies. Wiley.

121

Page 123: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[6] National Research Council. (2010).The Prevention and Treatment of Missing Data in Clinical Trials. The Na-

tional Academies Press.

[7] Verbeke, G., and Molenberghs, G. (2000).Linear Mixed Models for Longitudinal Data. Springer.

122

Page 124: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第11章 Estimandごとの解析手法の使い分け

11.1 はじめに

本章では,これまでに述べた各手法の使い分けと,注意点について述べる.具体的には

• 本報告書で解説した各手法が,それぞれどのような状況で使用可能か• Analytic Road Mapに関する注意点

を扱う.

11.2 各手法の使い分け

11.2.1 Estimandに基づく手法の整理

本報告書で扱ってきた各手法がどういう状況で使用できるか,について,本報告書の 3章で示したMallinckrodt

(2013)の 6種類の estimandに沿って整理する1.なお,estimand 1から順番に述べるのではなく,類似した手

法が使用できるものについてまとめて説明する.最初に,3章で示した 6種類の estimandに,それぞれ用いら

れる主解析を追記したものを表 11.1に示す.

1この estimandは大うつ病性障害(Major Depression Disorder, MDD)をもとにして定義されたものである.

123

Page 125: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表11

.1:M

allin

ckro

dt(2

013)の

MD

Dに対する

6種類の

estim

andと対応する主解析

Est

iman

d有効性の指標

推測の対象

被験者

評価時点

resc

uem

edic

atio

n後の

主解析の方法

データを主解析に含めるか

1ef

fect

iven

ess

割り付け群

全被験者

計画された

含める

MM

RM

(治療方針)

時点

AN

CO

VA

2ef

ficac

y最初に割り付け

最初に耐えられた

計画された

含めない

(MA

R)

MM

RM

,PM

M(A

CM

V),

MI-

AN

CO

VA,

られた治療

被験者のみ

時点

   

MI-

MM

RM

,wG

EE

(MN

AR

)S

M,P

MM

(AC

MV以外

),S

PM

3ef

ficac

y最初に割り付け

全被験者

計画された

含めない

(MA

R)

MM

RM

,PM

M(A

CM

V),

MI-

AN

CO

VA,

られた治療

時点

   

MI-

MM

RM

,wG

EE

(MN

AR

)S

M,P

MM

(AC

MV以外

),S

PM

4ef

fect

iven

ess最初に割り付け

全被験者

未定義

含めない

t検定

,AN

OVA

,AN

CO

VA,L

MM

られた治療

5ef

fect

iven

ess最初に割り付け

全被験者

未定義

含めない

t検定

,AN

OVA

,AN

CO

VA,L

MM

られた治療

6ef

fect

iven

ess最初に割り付け

全被験者

計画された

補完することが

pMIA

NC

OVA

,pM

IMM

RM

られた治療

時点

望ましい

BO

CF

AN

CO

VA,B

OC

FM

MR

M

124

Page 126: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

11.2.2 Estimand 3

まず,本報告書の 10章の感度分析で primary estimandとして提示した estimand 3について考える.全症例が

投与を完了したと想定した場合の,計画された時点での群間差の評価が目的である.欠測メカニズムにもよる

が,MAR を仮定した手法としては

• MMRM (9章)

• PMM (ACMV) (6章)

• MI ANCOVA,MI MMRM (6 章)

• wGEE(8章)

などが考えられる.上記のうちどの手法が主解析として適切であるか,については,12章のシミュレーション

等を参考に,試験ごとに計画段階で十分な検討が必要である.

次に,MNAR を仮定した方法としては

• SM(5章)

• PMM(ACMV 以外)(6章)

• SPM(7章)

が考えられる.また,適切に正当化できる場合には

• LOCF ANCOVA

の使用も考えられるが,計画段階で十分な検討が必要である.正当化については,4章および 12章参照のこと.

11.2.3 Estimand 2

次に,active run-inを設定する estimand 2であるが,estimand 3と同様の手法が用いられる.欠測が少ないこ

とが想定されるため,estimand 3の項で示した各手法を用いて解析を行った場合,LOCF ANCOVAとそれ以外

の手法の推定値の違いは,estimand 3より小さくなることが想定される2.

11.2.4 Estimand 1

Estimand 1は,計画された時点での割り付け群(治療方針)の影響を評価するものである.治験薬の投与中

止後も,計画された時点までデータを取り続けることが重要であり,欠測が発生しないように計画するべきで

ある.そのため,理想的に実施された状況では欠測が発生せず,解析時に欠測に対する考慮が必要ない.その

場合,

• MMRM(9章)

• ANCOVA3

等が使用可能である.

一方で,十分に計画・実施された試験においても,欠測が発生してしまうことは十分に起こりうる.そのよ

うな場合は,「Rescue medicationの使用有無別に『参照群』を作り,controlled imputationにより欠測を補完す

る」方法が Mallinckrodt (2013)の 11章で提案されている.欠測が補完された後は,上記解析方法を用いるこ

とが考えられる.

2結果的に想定より欠測が増えてしまうこともあるため,計画段階で「LOCF ANCOVAを使用してよい」ということが常に言えるわけではない点には注意が必要である.また,欠測の少なさが LOCFの使用を正当化する根拠となりうるか,という点も検討が必要であろう.

3LOCFによる補完は理想的状況では行われないため,その場合 LOCFの妥当性は問題とならない.

125

Page 127: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

11.2.5 Estimand 6

Estimand 6は,最初に割り付けられた治療の影響の因果効果に注目して,計画されたエンドポイントでの

effectivenessを評価する estimandである.投与中止後のデータも基本的には収集し,データの解析に含める方

向ではあるものの,興味の対象は最初に割り付けられた治療であるため,rescue medication使用後のデータは

使用せず,その後は無治療(対照群と同様の治療)であることを想定する.そのため,rescue medication使用

後のデータに対しては,「無治療」と考えられるような値で補完を行う必要がある.そのための方法として,

• BOCFによる補完 (4章, 6章)

• プラセボ群を参照群とした controlled imputation (pMI)による補完 (6章)

等が考えられる.どのような補完方法・補完モデルがよいか,は疾患領域・薬剤の特性を踏まえ,試験ごとに

検討が必要である.

11.2.6 Estimand 4

投与期間と応答変数を 1つに合わせた AUC で評価するため,各被験者で使用できる応答変数の値は 1つ

(ベースライン値を合わせると 2つ)である.そのため

• t検定

• ANOVA

• ANCOVA

を用いることが考えられる.施設等を変量効果として用いる場合は,

• LMM(Appendix A)

による解析も可能である.

11.2.7 Estimand 5

治験薬の投与された最終時点のデータが評価の対象のため,estimand 4同様,各被験者で使用できる応答変

数の値は 1つ(ベースライン値を合わせると 2つ)である.そのため

• t検定

• ANOVA

• ANCOVA

を用いることが考えられる.施設等を変量効果として用いる場合は,

• LMM(Appendix A)

による解析も可能である.

11.3 Analytic Road Mapに関する注意点

10章で示した Analytic Road Mapを以下に再掲する.

126

Page 128: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

図 11.1:Analytic Road Map(著者らによる加工あり)

この図はあくまで「主要な estimandとして efficacy,主解析の欠測メカニズムとしてMAR」等を選択した場

合のものである.たとえば effectivenessを主要な estimandとした場合や,MNAR を仮定した解析を主解析と

した場合,このまま使用することは難しい.しかし,本質的に検討すべき項目の多くは共通していると思われ

るため,内容をよく理解した上で,適切に変更して使用することが望まれる.

参考文献

[1] Mallinckrodt, C. H. (2013).Preventing and treating missing data in longitudinal clinical trials. Cambridge

University Press.

127

Page 129: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

第12章 シミュレーションによる検討

12.1 はじめに

本章では,主解析の選択を目的とした架空の事例におけるシミュレーションについて紹介する.想定した試

験(うつ病の第 III 相試験,慢性疼痛の第 III 相試験)に対して,estimandとしては estimand 3(efficacy),欠

測メカニズムとしてはMARを仮定した場合に,図 12.1に示した「Analytic Road Map(Mallinckrodt, 2013)を

少し加工した図」において主解析の候補となっているMMRM,MI,wGEEのうち,いずれを主解析に用いる

か検討するため,上記 3手法の性能比較(検出力,αエラーなどの比較)を 2つのシミュレーションに基づき

行った.また,これまで広く用いられてきている LOCF ANCOVAとOC ANCOVAの性能も合わせて検討した.

図 12.1:Analytic Road Map(著者らによる加工あり)

1つ目のシミュレーションでは,うつ病の第 III 相試験を想定し,欠測メカニズムがMARのデータならびに

MNAR のデータを作成し,性能比較を行った.欠測メカニズムがMAR のデータだけでなくMNAR のデータ

も作成した理由は,実際のデータでは欠測メカニズムが MNAR になる可能性があることを考慮し,その場合

の各手法の性能を評価するためである.

2つ目のシミュレーションでは,慢性疼痛の第 III 相試験を想定し,MCARとMARの欠測メカニズムを混合

させたデータならびに MCARと MNAR の欠測メカニズムを混合させたデータを作成し,性能比較を行った.

欠測メカニズムを混合させた理由は,欠測理由が複数あることを考慮し,その場合の各手法の性能を評価する

ためである.

なお,本章で提示する結果は,2つのシミュレーション・シナリオに基づくものであるため,各手法の特徴

を掴むには有用であるが,一般化するにはより詳細な検討が必要である.すなわち,実際に主解析の手法を検

討する際は,個別の試験の状況に応じたシミュレーションの条件を設定することが重要である.

128

Page 130: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

12.2 シミュレーション 1

12.2.1 性能比較の方法

手法の性能比較を行うため,欠測メカニズムが MAR のデータならびに MNAR のデータをそれぞれ 10,000

組作成し,検出力,αエラーなどの算出を行った.

以降,シミュレーションの設定とデータの作成方法を提示した後に,シミュレーションの結果を示す.

12.2.2 シミュレーションの設定

うつ病の第 III 相試験を想定し,以下のようにシミュレーションの設定を行った.

• 応答変数:HAM-D スコア

• 群:2群  g(g = 1:実薬群,g = 2:プラセボ群)

• 被験者数:100例/群

• 時点数:ベースライン+ 4時点(時点 4が主要評価時点)

     (y0:ベースライン値,yi:時点 iの測定値,i = 1, 2, 3, 4)

• 各時点の測定値の平均,SD:

表 12.1:完全データの各時点の測定値の平均(SD)

測定値の平均(SD) ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 20.0 (4.0) 18.0 (5.0) 15.0 (5.0) 12.0 (6.0) 9.0 (6.0)

プラセボ群 20.0 (4.0) 18.0 (5.0) 16.0 (5.0) 14.0 (6.0) 12.0 (6.0)

図 12.2:完全データの測定値の平均構造

129

Page 131: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• ベースラインと各時点の測定値の相関:

表 12.2:完全データのベースラインと各時点の測定値の相関ベースライン 時点 1 時点 2 時点 3 時点 4

ベースライン 1.00 0.30 0.30 0.20 0.10

時点 1 - 1.00 0.60 0.55 0.50

時点 2 - - 1.00 0.60 0.55

時点 3 - - - 1.00 0.60

時点 4 - - - - 1.00

• 時点毎の累積欠測確率の目標値:

表 12.3:時点毎の累積欠測確率の目標値(両群で共通)ベースライン 時点 1 時点 2 時点 3 時点 4

0% 5% 10% 13% 15%

また,αエラー算出の際は,SD,相関,欠測確率の目標値は上述のまま不変とし,平均構造のみ以下の通り変

更した.(帰無仮説 H0 : µA4 = µP4.ここで,µA4 は実薬群の時点 4におけるベースラインからの変化量の平

均,µP4 はプラセボ群の時点 4におけるベースラインからの変化量の平均を表す.)

• αエラー算出時の各時点の測定値の平均:

表 12.4:完全データの各時点の測定値の平均:αエラー算出時(帰無仮説の下での評価)測定値の平均(SD) ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 20.0 18.0 16.0 14.0 12.0

プラセボ群 20.0 18.0 16.0 14.0 12.0

図 12.3:完全データの測定値の平均構造:αエラー算出時

130

Page 132: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

12.2.3 データの作成方法

表 12.1,表 12.2で設定した平均,SD,相関ならびに多変量正規分布に基づく乱数から完全データを作成し

た.作成した 1組のシミュレーションデータを以下に示す.

図 12.4:作成した完全データの推移図

表 12.5:作成した完全データの例数,平均,SDベースライン 時点 1 時点 2 時点 3 時点 4

群 例数 平均 例数 平均 例数 平均 例数 平均 例数 平均

(SD) (SD) (SD) (SD) (SD)

実薬群 100 20.0 100 18.4 100 15.6 100 12.0 100 9.4

(4.1) (4.4) (5.7) (6.6) (6.9)

プラセボ群 100 20.1 100 17.8 100 15.7 100 13.7 100 11.2

(4.2) (4.5) (4.7) (6.5) (6.2)

次に,作成した完全データと以下に示す欠測確率の関数ならびに Bernoulli乱数に基づき,欠測メカニズムが

MAR の観測データならびにMNAR の観測データをそれぞれ図 12.5ならびに表 12.6のように作成した.

なお,時点毎の欠測確率の目標値は表 12.3に示した値とし,単調な欠測を仮定した.

欠測確率の関数は下記の通りとし,両群で同じ関数を用いた(y0:ベースライン値,yi:時点 i の測定値,

i = 1, 2, 3, 4).

• MAR における時点の欠測確率(両群共通):pi = 1− 1

1 + exp(−5.70 + 0.14yi−1)

• MNAR における時点の欠測確率(両群共通):pi = 1− 1

1 + exp(−5.70 + 0.05yi−1 + 0.10yi)

上記の欠測確率の関数のパラメータは,実際に発生させた完全データをもとにパラメータの調整を行い,欠

測確率の目標値に近づくように設定した.

131

Page 133: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

図 12.5:欠測メカニズムがMAR(左)ならびにMNAR(右)の観測データ

表 12.6:欠測メカニズムがMAR(上)ならびにMNAR(下)の観測データMAR ベースライン 時点 1 時点 2 時点 3 時点 4

群 例数 平均 例数 平均 例数 平均 例数 平均 例数 平均

(SD) (SD) (SD) (SD) (SD)

実薬群 100 20.0 95 18.3 91 15.2 84 11.2 83 8.7

(4.1) (4.3) (5.5) (6.4) (6.8)

プラセボ群 100 20.1 92 17.8 89 15.6 85 13.5 80 11.2

(4.2) (4.5) (4.7) (6.7) (6.2)

MNAR ベースライン 時点 1 時点 2 時点 3 時点 4

群 例数 平均 例数 平均 例数 平均 例数 平均 例数 平均

(SD) (SD) (SD) (SD) (SD)

実薬群 100 20.0 93 18.1 89 14.9 84 11.0 83 8.5

(4.1) (4.2) (5.4) (6.3) (6.8)

プラセボ群 100 20.1 90 17.5 87 15.4 85 13.3 80 11.0

(4.2) (4.2) (4.6) (6.3) (6.1)

上記を 10,000回繰り返し,欠測メカニズムがMARのデータならびにMNARのデータをそれぞれ 10,000組

ずつ作成した.同様に,αエラー算出時のデータについても,平均構造のみ表 12.4に示した値に変更し,MAR

とMNAR ごとに 10,000組ずつ作成した.

132

Page 134: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

12.2.4 解析方法およびシミュレーションの結果

12.2.3節で作成した欠測メカニズムがMAR のデータならびにMNAR のデータ(それぞれ 10,000組)に対

して,表 12.7に示す手法を適用し,主要評価時点である時点 4での検出力,αエラーなどの算出を行った.な

お,データの作成は測定値について行ったが,解析ではベースラインからの変化量を用いた.また,有意水準

は両側 5%とした.

表 12.7:手法とその解析方法解析手法 解析方法

MMRM 解析モデル

 説明変数:ベースライン,投与群,時点,投与群と時点の交互作用

 変量効果:被験者の影響を誤差と合わせてモデル化するため,明示的には特定

      せず

 相関構造:Unstructured

 推定方法:REML

 自由度調整方法:Kenward Roger

MI ANCOVA 補完モデル(投与群ごとの単調回帰モデル)

 説明変数:ベースライン,各時点の変化量

 補完回数:5回(補完回数を増やすことで標準誤差の観点から推定値が安定す

      ることが期待される.補完回数の設定については,今後検討が必要

      である.)

解析モデル(時点 4に対する ANCOVA)

 説明変数:投与群,ベースライン

wGEE 観測確率モデル(logisticモデル)

 説明変数:各時点の変化量,ベースライン,投与群,投与群と各時点の変化量

      の交互作用

解析モデル

 重み:subject-specific

 説明変数:ベースライン,投与群,時点,投与群と時点の交互作用

 相関構造:EXCH

※Missingdata.org.ukに公開されているマクロ%WGEEを使用

LOCF ANCOVA 解析モデル(LOCFにより補完した時点 4に対する ANCOVA)

 説明変数:投与群,ベースライン

OC ANCOVA 解析モデル(時点 4のデータが観測された症例に対する時点 4に対するANCOVA)

 説明変数:投与群,ベースライン

133

Page 135: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

以下に,結果を示す(以降に記載のある「推定値」は,「時点 4における群間差の推定値」を意味する).

【MAR】

表 12.8:累積脱落率:10,000個の平均(MAR)群 ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 0.0% 5.9% 10.5% 13.4% 15.4%

プラセボ群 0.0% 6.0% 10.5% 13.8% 16.5%

表 12.9:手法の性能比較(MAR)解析手法 αエラー(%) 検出力(%) 10,000個の 10,000個の MSE

推定値の平均 推定値の SD

(真値:-3.00)

MMRM 4.79 90.40 -2.9988 0.9083 0.8250

MI ANCOVA 4.80 89.19 -2.9984 0.9164 0.8397

wGEE 11.12 69.31 -2.9975 1.5172 2.3016

LOCF ANCOVA 4.78 83.42 -2.8162 0.9464 0.9293

OC ANCOVA 4.85 89.59 -2.9696 0.9108 0.8303

図 12.6:各手法の推定値の箱ひげ図(MAR)

134

Page 136: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

【MNAR】

表 12.10:累積脱落率:10,000個の平均(MNAR)群 ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 0.0% 6.0% 10.0% 12.6% 14.3%

プラセボ群 0.0% 6.0% 10.4% 13.7% 16.1%

表 12.11:手法の性能比較(MNAR)解析手法 αエラー(%) 検出力(%) 10,000個の 10,000個の MSE

推定値の平均 推定値の SD

(真値:-3.00)

MMRM 4.84 90.53 -2.9688 0.8970 0.8055

MI ANCOVA 4.70 89.16 -2.9654 0.9077 0.8250

wGEE 10.40 69.28 -2.9678 1.4776 2.1840

LOCF ANCOVA 4.76 86.33 -2.8562 0.9233 0.8731

OC ANCOVA 4.85 89.27 -2.9265 0.8994 0.8143

図 12.7:各手法の推定値の箱ひげ図(MNAR)

【考察】

αエラーは,MAR,MNAR ともに wGEE以外の手法は 5%未満に制御され,wGEEは高度に増大した.

検出力は,MAR,MNARともにMMRM,OC ANCOVA,MI ANCOVA,LOCF ANCOVA,wGEEの順で高

かった.

推定値は,MMRM,MI ANCOVA,wGEEは真値周りに分布したが,LOCF ANCOVAはやや過小評価され

る傾向がみられた.また,推定値の SDは,wGEEが大きくなった.

以上より,本シミュレーションデータにおいて,各手法の性能を総合的に判断すると,MMRM が最も優れ

た手法と考えられた.なお,MI ANCOVA,OC ANCOVAもやや劣るものの,ほぼ同様の傾向を示した.ただ

し,MMRM,MI ANCOVA はMARのもとで妥当な手法として提案されており,MNARのもとでは推定値への

バイアスや,αエラーの観点から,その性能に対して懸念がある.ゆえに,この結果はあくまで今回のシミュ

レーションの設定に基づくものであることに注意が必要である.

wGEEは,検出力が他の手法よりも低く,αエラーが有意水準の 5%を大きく超えていた.これは推定値の

ばらつきが大きくなったことが原因であり(図 12.6,図 12.7参照),重みが極めて大きいデータが影響を与え

た可能性がある.なお,本シミュレーションの状況や実行可能なプログラムは限定されたものであり,今回の

135

Page 137: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

シミュレーション結果が wGEEの使用を全面的に否定するものではない.駒嵜ら (2015)において,αエラー

の増大の原因が,観測確率モデルの誤特定及び重みの種類(subject-specific)にあることが示唆された.ただ

し,Fitzmauriceet al. (1995)において,重みが subject-specificであっても,観測確率モデルが正しいことをは

じめとした一定の条件下で一致性が保証されている.そのため,駒嵜ら (2015)でのうつ病データの再解析のよ

うに,観測確率モデルが正しく特定されている場合の αエラーの増大等は,例数が少ないことが原因の可能性

が考えられる.以上のように,wGEEの適切な使用のためには,上記検討事項などに対する適切な性能評価が

必要である.

LOCF ANCOVAは,今回のシミュレーションの設定では αエラーには問題ないものの,検出力がMMRM,

MI ANCOVA,OC ANCOVAに比べて劣り,また推定値を過小評価する可能性が考えられるため,MMRM 等

が使用可能ならば,本シミュレーションデータに対して,今回検討した基準からは推奨されない.

12.3 シミュレーション 2

12.3.1 性能比較の方法

シミュレーション 1と同様のシミュレーションを,設定を変更して行った.シミュレーション 1と大きく異

なる部分は,データの平均構造ならびに欠測メカニズムを混合させたデータを作成したところである.MCAR

とMARの欠測メカニズムを混合させたデータならびにMCARとMNARの欠測メカニズムを混合させたデー

タをそれぞれ作成した.性能比較は,シミュレーション 1と同様に,検出力,αエラーなどに基づき行った.

以降,シミュレーションの設定とデータの作成方法を提示した後に,シミュレーションの結果を示す.

12.3.2 シミュレーションの設定

慢性疼痛の第 III 相試験を想定し,以下のようにシミュレーションの設定を行った.

• 応答変数:疼痛スコア(0~10)

• 群:2群  g(g = 1:実薬群,g = 2:プラセボ群)

• 被験者数:100例/群

• 時点数:ベースライン+ 4時点(時点 4が主要評価時点)

      (y0:ベースライン値,yi:時点 iの測定値,i = 1, 2, 3, 4)

• 各時点の測定値の平均,SD:

表 12.12:完全データの各時点の測定値の平均(SD)測定値の平均(SD) ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 7.00 (1.40) 6.00 (1.60) 5.00 (1.80) 5.00 (2.00) 5.00 (2.00)

プラセボ群 7.00 (1.40) 6.75 (1.60) 6.50 (1.80) 6.25 (2.00) 6.00 (2.00)

図 12.8:完全データの測定値の平均構造

136

Page 138: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• ベースラインと各時点の測定値の相関:

表 12.13:完全データのベースラインと各時点の測定値の相関ベースライン 時点 1 時点 2 時点 3 時点 4

ベースライン 1.00 0.60 0.50 0.40 0.30

時点 1 - 1.00 0.60 0.50 0.40

時点 2 - - 1.00 0.60 0.50

時点 3 - - - 1.00 0.60

時点 4 - - - - 1.00

• 時点毎の累積欠測確率の目標値:

表 12.14:時点毎の累積欠測確率の目標値群 ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 0% 20% 26% 30% 34%

プラセボ群 0% 18% 30% 40% 48%

また,αエラー算出の際は,SD,相関,欠測確率の目標値は上述のまま不変とし,平均構造のみ以下の通り

変更した.(帰無仮説 H0 : µA4 = µP4.ここで,µA4 は実薬群の時点 4におけるベースラインからの変化量の

平均,µP4 はプラセボ群の時点 4におけるベースラインからの変化量の平均を表す.)

• αエラー算出時の各時点の測定値の平均:

表 12.15:完全データの各時点の測定値の平均:αエラー算出時(帰無仮説の下での評価)測定値の平均(SD) ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 7.00 6.00 5.00 5.00 5.00

プラセボ群 7.00 6.50 6.00 5.50 5.00

図 12.9:完全データの測定値の平均構造:αエラー算出時

なお,本設定は,「時点 4の群間差」を estimandとして設定しているため,上記の設定が αエラーとなるが,

「時点 1や時点 2の時点の群間差を薬効として評価したい」という estimandを設定すれば,上記の設定は αエ

ラーではなくなる.つまり,ある設定が αエラーになるかどうかも,estimandの設定に依存して変わりうる.

ゆえに,疾患・薬剤の特性等に注意して,適切な estimandを設定することが重要である.

12.3.3 データの作成方法

表 12.12,表 12.13で設定した平均,SD,相関ならびに多変量正規分布に基づく乱数から完全データを作成

した.作成した 1組のシミュレーションデータを以下に示す.

137

Page 139: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

図 12.10:作成した完全データの推移図

表 12.16:作成した完全データの例数,平均,SDベースライン 時点 1 時点 2 時点 3 時点 4

群 例数 平均 例数 平均 例数 平均 例数 平均 例数 平均

(SD) (SD) (SD) (SD) (SD)

実薬群 100 7.0 100 6.1 100 5.2 100 5.0 100 5.1

(1.4) (1.4) (2.0) (2.2) (2.3)

プラセボ群 100 7.0 100 6.7 100 6.4 100 6.2 100 5.7

(1.5) (1.4) (1.7) (2.2) (2.1)

次に,作成した完全データと以下に示す欠測確率の関数ならびに Bernoulli乱数に基づき,MCARと MAR

の欠測メカニズムを混合させた観測データ(以下,MCAR+MAR)ならびにMCARとMNARの欠測メカニズ

ムを混合させた観測データ(以下,MCAR+MNAR)をそれぞれ図 12.11ならびに表 12.17のように作成した.

なお,時点毎の欠測確率の目標値は表 12.14に示した値とし,単調な欠測を仮定した.

また,欠測メカニズムを混合する際は,MCAR+MARの場合は,100例/群のうち 50例は欠測メカニズムが

MCARのデータ,残りの 50例は欠測メカニズムがMARのデータとし,1 : 1の割合で混合した.MCAR+MNAR

の場合も同様の方法を用い,1 : 1の割合で混合した.

欠測確率の関数は,MCARでは群ごとに異なる関数を用い,MAR とMNAR では両群で同じ関数を用いた.

• MCARにおける群 gの時点 iの欠測確率:pgi = 1− 1

1 + exp(γgi)

γgi 実薬群(g = 1) プラセボ群(g = 2)

時点 1(i = 1) -1.39 -1.73

時点 2(i = 2) -2.94 -1.73

時点 3(i = 3) -2.94 -1.73

時点 4(i = 4) -2.94 -1.73

• MAR における時点 iの欠測確率(群間で共通):pi = 1− 1

1 + exp(−7.30 + 0.80yi−1)

• MNAR における時点 iの欠測確率(群間で共通):pi = 1− 1

1 + exp(−7.30 + 0.42yi−1 + 0.42yi)

138

Page 140: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

上記の欠測確率の関数のパラメータは,実際に発生させた完全データをもとにパラメータの調整を行い,欠

測確率の目標値に近づくように設定した.

図 12.11:欠測メカニズムがMCAR+MAR(左)ならびにMCAR+MNAR(右)の観測データ

表 12.17:欠測メカニズムがMCAR+MAR(上)ならびにMCAR+MNAR(下)の観測データMCAR+MAR ベースライン 時点 1 時点 2 時点 3 時点 4

群 例数 平均 例数 平均 例数 平均 例数 平均 例数 平均

(SD) (SD) (SD) (SD) (SD)

実薬群 100 7.0 77 6.1 68 5.0 64 4.8 62 4.8

(1.4) (1.4) (2.1) (2.2) (2.2)

プラセボ群 100 7.0 83 6.7 72 6.4 64 6.1 60 5.9

(1.5) (1.5) (1.7) (2.1) (2.2)

MCAR+MNAR ベースライン 時点 1 時点 2 時点 3 時点 4

群 例数 平均 例数 平均 例数 平均 例数 平均 例数 平均

(SD) (SD) (SD) (SD) (SD)

実薬群 100 7.0 78 6.1 68 4.9 64 4.8 62 4.7

(1.4) (1.4) (2.1) (2.2) (2.1)

プラセボ群 100 7.0 84 6.7 71 6.3 63 6.0 58 5.7

(1.5) (1.5) (1.7) (2.1) (2.2)

上記を 10,000回繰り返し,MCAR+MAR のデータならびに MCAR+MNAR のデータをそれぞれ 10,000組

ずつ作成した.同様に,α エラー算出時のデータについても,平均構造のみ表 12.15に示した値に変更し,

MCAR+MARとMCAR+MNARごとに 10,000組ずつ作成した.

139

Page 141: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

12.3.4 解析方法およびシミュレーションの結果

12.3.3節で作成したMCAR+MAR,MCAR+MNARのデータ(それぞれ 10,000組)に対して,表 12.18に示

す手法を適用し,主要評価時点である時点 4での検出力,αエラーなどの算出を行った.なお,データの作成

は測定値について行ったが,解析ではベースラインからの変化量を用いた.また,有意水準は両側 5%とした.

表 12.18:手法とその解析方法解析手法 解析方法

MMRM 解析モデル

 説明変数:ベースライン,投与群,時点,投与群と時点の交互作用

 変量効果:被験者の影響を誤差と合わせてモデル化するため,明示的には特定

      せず

 相関構造:Unstructured

 推定方法:REML

 自由度調整方法:Kenward Roger

MI ANCOVA 補完モデル(投与群ごとの単調回帰モデル)

 説明変数:ベースライン,各時点の変化量

 補完回数:100回(当初はシミュレーション 1と同様に補完回数は 5回としてい

      たが,補完回数が 5回の場合,推定値が安定しなかったため,安定

することが確認できた 100回という補完回数をシミュレーション 2では用いた.)

解析モデル(時点 4に対する ANCOVA)

 説明変数:投与群,ベースライン

wGEE 観測確率モデル(logisticモデル)

 説明変数:各時点の変化量,ベースライン,投与群,投与群と各時点の変化量

      の交互作用

解析モデル

 重み:subject-specific

 説明変数:ベースライン,投与群,時点,投与群と時点の交互作用

 相関構造:EXCH

※Missingdata.org.ukに公開されているマクロ%WGEEを使用

LOCF ANCOVA 解析モデル(LOCFにより補完した時点 4に対する ANCOVA)

 説明変数:投与群,ベースライン

OC ANCOVA 解析モデル(時点 4のデータが観測された症例に対する時点 4に対するANCOVA)

 説明変数:投与群,ベースライン

140

Page 142: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

以下に,結果を示す(以降に記載のある「推定値」は,「時点 4における群間差の推定値」を意味する).

【MCAR+MAR】

表 12.19:累積脱落率:10,000個の平均(MCAR+MAR)群 ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 0.0% 20.0% 26.3% 30.3% 34.3%

プラセボ群 0.0% 17.6% 30.7% 40.7% 48.9%

表 12.20:手法の性能比較(MCAR+MAR)解析手法 αエラー(%) 検出力(%) 10,000個の 10,000個の MSE

推定値の平均 推定値の SD

(真値:-1.00)

MMRM 4.98 81.99 -1.0168 0.3526 0.1246

MI ANCOVA 4.36 77.67 -1.0032 0.3580 0.1282

wGEE 7.29 69.61 -1.0159 0.4474 0.2004

LOCF ANCOVA 17.86 97.08 -1.1634 0.3010 0.1173

OC ANCOVA 4.90 74.00 -0.9314 0.3532 0.1295

図 12.12:各手法の推定値の箱ひげ図(MCAR+MAR)

141

Page 143: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

【MCAR+MNAR】

表 12.21:累積脱落率:10,000個の平均(MCAR+MNAR)群 ベースライン 時点 1 時点 2 時点 3 時点 4

実薬群 0.0% 19.1% 24.8% 29.1% 33.2%

プラセボ群 0.0% 18.8% 31.9% 41.9% 49.7%

表 12.22:手法の性能比較(MCAR+MNAR)解析手法 αエラー(%) 検出力(%) 10,000個の 10,000個の MSE

推定値の平均 推定値の SD

(真値:-1.00)

MMRM 4.96 79.37 -0.9696 0.3488 0.1226

MI ANCOVA 4.31 74.88 -0.9536 0.3537 0.1273

wGEE 6.76 69.19 -0.9601 0.4120 0.1713

LOCF ANCOVA 16.97 96.87 -1.1294 0.2929 0.1025

OC ANCOVA 5.25 71.92 -0.9031 0.3526 0.1337

図 12.13:各手法の推定値の箱ひげ図(MCAR+MNAR)

【考察】

αエラーは,MCAR+MAR,MCAR+MNARともにMMRMとMI ANCOVA のみが5%未満に制御され,LOCF

ANCOVA はいずれのデータにおいても高度に増大した.

検出力は,MCAR+MAR,MCAR+MNARともに LOCF ANCOVA,MMRM,MI ANCOVA,OC ANCOVA,

wGEEの順で高かった.

推定値は,MMRM,MI ANCOVA,wGEEは真値周りに分布したが,LOCF ANCOVAは真値から偏って分布

し,実薬の有効性を過大評価する傾向がみられた.また,推定値のSDは,他の手法と比較して LOCF ANCOVA

は小さく,wGEEは大きくなった.

以上より,本シミュレーションデータにおいて,各手法の性能を総合的に判断すると,MMRM が最も優れ

た手法と考えられた.なお,MI ANCOVA もやや劣るものの,ほぼ同様の傾向を示した.ただし,MMRM,MI

ANCOVAはMARのもとで妥当な手法として提案されており,MNARのもとでは推定値へのバイアスや,αエ

ラーの観点から,その性能に対して懸念がある.ゆえに,この結果はあくまで今回のシミュレーションに基づ

くものであることに注意が必要である.

wGEEは,検出力が他の手法よりも低く,αエラーが有意水準の 5%を超えており,シミュレーション 1と

同様,推定値のばらつきが大きくなったことが原因と考えられた(図 12.12,図 12.13参照).142

Page 144: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

LOCF ANCOVAは,αエラーが高度に増大しており,また推定値が過大評価され,さらに推定値の SDが他

の手法と比較して小さくなっており,今回のシミュレーションと類似したデータに対する解析として使用する

場合,妥当でないと考えられた.

12.4 まとめ

本章では,2つの想定した試験に対して,MMRM,MI ANCOVA,wGEE,LOCF ANCOVA,OC ANCOVA

のうち,いずれを主解析に用いるべきか検討するため,これらの手法の性能比較をシミュレーションに基づき

行った.

今回の 2つのシミュレーションの状況において,各手法の性能を総合的に判断すると,MMRM が最も優れ

た手法であり,estimand 3を前提として,MARを仮定した状態で,Mallinckrodt (2013)の主解析候補で考えた

とき,主解析として望ましいと考えられた.しかしながら,この結果は今回のシミュレーションの設定に基づ

くものである.繰り返しになるが,結果を一般化し過ぎないことに注意が必要であり,個別の試験ごとに設定

を変更し,最適な主解析の選択を行うことが重要であるる.

また,LOCF ANCOVAの αエラーについて,シミュレーション 1では有意水準の 5%未満に制御できたの

に対して,シミュレーション 2では高度に増大した.これは αエラーを算出する際の平均構造の設定が影響し

ていると考えられた(図 12.14,図 12.15参照).ゆえに,LOCF ANCOVAを主解析として用いるかを検討す

る場合は,αエラーを算出する際の平均構造をどのように設定するかにも注意を払う必要があると考える.

最後に,本章では被験者数を 100例/群と固定してシミュレーションを実施したが,被験者数を変更し,同様

のシミュレーションを行うことで,検出力ベースの例数設計も行うことが可能と考える.

図 12.14:シミュレーション 1における αエラー算出時の完全データの平均構造(再掲)

図 12.15:シミュレーション 2における αエラー算出時の完全データの平均構造(再掲)

143

Page 145: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

参考文献

[1] Fitzmaurice, G. M., Molenberghs, G., and Lipsitz, S. R. (1995). Regression models for longitudinal binary

responses with informative drop-outs.Journal of the Royal Statistical Society. Series B (Methodological), 691-

704.

[2] 駒嵜弘,土居正明,横山雄一,鵜飼裕之,藤原正和. (2015).【企画セッション】欠測のあるデータにおける主

解析の検討 (3)Proc GEEによる wGEE法を用いた連続量経時データの解析. SASユーザー総会論文集.

[3] Mallinckrodt, C. H. (2013).Preventing and treating missing data in longitudinal clinical trials. Cambridge

University Press.

144

Page 146: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

資料作成者・タスクフォースメンバー日本製薬工業協会 医薬品評価委員会 データサイエンス部会

2013年度タスクフォース 2・2014年度タスクフォース 4

【方法論・SASプログラム検討チーム(資料作成者)】土居 正明 東レ株式会社(サブリーダー) 1章, 2章 (2.1~2.4), 3章, 5章, 11章,

Appendix A, B担当

縄田 成毅 杏林製薬株式会社 (2013年度サブリーダー) 2章 (2.5), Appendix C担当(分担)

藤原 正和 塩野義製薬株式会社 (2014年度サブリーダー) 4章, 7章担当

横山 雄一 持田製薬株式会社 (2014年度サブリーダー) 12章(分担),Appendix C担当(分担)

大浦 智紀 日本イーライリリー株式会社 Appendix C担当(分担)

大江 基貴 株式会社大塚製薬工場 9章担当

駒嵜 弘 マルホ株式会社 8章・10章担当

高橋 文博 田辺三菱製薬株式会社 6章担当

横溝 孝明 大正製薬株式会社 12章担当(分担)

【NRCレポート・EMA ガイドライン検討チーム】竹ノ内 一雅 アステラス製薬株式会社 (サブリーダー)

北川 忠行 武田薬品工業株式会社

佐伯 浩之 富士フイルム RIファーマ株式会社

野村 真功 株式会社三和化学研究所

片岡 尚子 ノバルティスファーマ株式会社 (2013年 10月まで)

【FDA, EMA, PMDA 事例調査検討チーム】

松岡 伸篤 ファイザー株式会社 (サブリーダー)

高木 弘毅 サノフィ株式会社

土川 克 ゼリア新薬工業株式会社

鵜飼 裕之 日本ベーリンガーインゲルハイム株式会社

笹川 裕次 Meiji Seikaファルマ株式会社

棚橋 昌也 興和株式会社

吉田 早織 日本化薬株式会社(2014年 4月から)

145

Page 147: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

タスクフォースリーダー兼,推進委員冨金原 悟 小野薬品工業株式会社

菅波 秀規 興和株式会社

土屋 悟 大日本住友製薬株式会社

担当副部会長廣岡 秀樹 アステラス製薬株式会社

146

Page 148: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Appendix 1

欠測のある連続量経時データに対する統計手法について

日本製薬工業協会

 医薬品評価委員会 データサイエンス部会

2013年度タスクフォース 2

2014年度タスクフォース 4

欠測のあるデータの解析チーム

Page 149: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

目次

Appendix A  線形混合モデル概論 4

A.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

A.2 線形モデルと線形混合モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

A.3 条件付き分布と周辺分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

A.4 固定効果の検討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

A.5 変量効果と誤差の相関構造 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

A.5.1 例 1:変量効果 1つ.誤差は独立等分散. . . . . . . . . . . . . . . . . . . . . . . . . . 9

A.5.2 重要な注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

A.5.3 例 2:変量効果 2つ.変量効果の相関は無特定.誤差は独立等分散. . . . . . . . . . . 14

A.5.4 例 3:変量効果 1つ.誤差の分散共分散構造は AR(1). . . . . . . . . . . . . . . . . . . 16

A.5.5 例 4:変量効果 1つ.誤差の分散共分散構造は指数関数の系列相関. . . . . . . . . . . 17

A.5.6 例 5:変量効果なし.誤差の分散共分散構造は Compound Symmetry. . . . . . . . . . . 18

A.5.7 一般論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

A.6 残差プロット . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

A.6.1 影響診断 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

A.7 サンプル SASコードと出力例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

A.7.1 テストデータの発生 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

A.7.2 例 1の解析プログラムと出力 1(例 1-1) . . . . . . . . . . . . . . . . . . . . . . . . . . 24

A.7.3 例 1-2:自由度調整方法を変更 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

A.7.4 例 1-3:ロバスト分散の使用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

A.7.5 例 2の解析プログラムと出力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

A.7.6 例 3の解析プログラムと出力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

A.7.7 例 4の解析プログラムと出力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

A.7.8 例 5の解析プログラムと出力 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

A.7.9 例 1の残差プロットのプログラム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

A.7.10 影響診断のプログラム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

A.7.11 計算が収束しない場合の例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

A.8 欠測のあるデータに対するモデリングの考え方 . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

A.8.1 自由度の算出方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

A.8.2 ロバスト分散 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

A.9 推定方法:最尤法と制限付き最尤法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

A.9.1 尤度関数の構成と最尤法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

A.9.2 尤度関数の導出 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

A.9.3 制限付き最尤 (REML)法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

A.9.4 最尤法と制限付き最尤法の比較・まとめ . . . . . . . . . . . . . . . . . . . . . . . . . . 44

A.9.5 変量効果の予測 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

A.10この分野をさらに学習するために . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

1

Page 150: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Appendix B  理論の詳細 47

B.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

B.2 【2章】欠測メカニズムの具体例の詳細 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

B.2.1 欠測メカニズムの復習 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

B.2.2 具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

B.2.2.1 MCARの具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

B.2.2.2 MARの具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

B.2.2.3 MNARの具体例 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

B.2.2.4 MNARの具体例 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

B.3 【5章】Selection Modelの補足 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

B.3.1 MNARを仮定したモデルの計算の詳細 . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

B.3.1.1 脱落のない症例 i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

B.3.1.2 時点 j (j ≥ 3)で脱落した症例 i . . . . . . . . . . . . . . . . . . . . . . . . . . 55

B.3.1.3 時点 2で脱落した症例 i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

B.4 【6章】NFMV,NFD,ACMV,MAR に対する補足 . . . . . . . . . . . . . . . . . . . . . . . 57

B.4.1 記号の整理と前提事項 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

B.4.1.1 前提 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

B.4.1.2 記号 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

B.4.1.3 仮定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

B.4.1.4 よく用いる公式 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

B.4.1.5 状況設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

B.4.1.6 具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

B.4.2 NFMVと ACMV の関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

B.4.2.1 NFMVの定義と具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

B.4.2.1.1 NFMVの定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

B.4.2.2 NFMVの具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

B.4.2.3 ACMVの定義と具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

B.4.2.3.1 ACMVの定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

B.4.2.3.2 ACMVの具体例 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

B.4.2.4 NFMVと ACMV の関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

B.4.2.4.1 具体例からの検討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

B.4.2.4.2 一般論の検討 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

B.4.3 NRC (2010)の PMMの感度分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

B.4.4 ACMVとMAR の同値性の証明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

B.4.4.1 用語の整理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

B.4.4.2 仮定の整理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

B.4.4.3 補題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

B.4.4.4 定理 B.4.1の証明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

B.4.5 NFMVと NFDの同値性の証明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

B.4.5.1 用語の整理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

B.4.5.2 仮定の整理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

B.4.5.3 補題 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

B.4.5.4 定理 B.4.2の証明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

2

Page 151: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Appendix C   SASマクロの紹介 77

C.1 はじめに . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

C.2 プログラム仕様書:Selection_Model2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

C.2.1 基本情報と実行方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

C.2.2 引数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

C.2.3 マクロの説明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

C.2.4 使用上の注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

C.2.5 その他:参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

C.3 プログラム仕様書:cbi_pmm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

C.3.1 基本情報と実行方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

C.3.2 引数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

C.3.3 マクロの説明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

C.3.4 使用上の注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

C.3.5 その他:参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

C.4 プログラム仕様書:delta_pmm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

C.4.1 基本情報と実行方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

C.4.2 引数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

C.4.3 マクロの説明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

C.4.4 使用上の注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

C.4.5 その他:参考文献 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

C.5 プログラム仕様書:Shared_Parameter1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

C.5.1 基本情報と実行方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

C.5.2 引数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

C.5.3 マクロの説明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

C.5.4 使用上の注意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3

Page 152: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Appendix A 線形混合モデル概論

A.1 はじめに

本報告書の主な対象となる臨床試験は,被験者ごとに複数の時点で応答変数の測定が計画されている,2群

比較試験である.また,応答変数の計画された時点1の群間差が主な興味の対象とする.計画された時点(最

終投与時点と一致することも多い)の群間差が主な興味となるものの,それまでに試験を中止した症例の観測

されたデータも,治験薬の有効性に対して十分な情報を持っていると考えられる.そのため,すべての時点の

データを含めたモデリングを行った上で,計画された時点の群間差を検討することを試みる.

しかし,例えば「ベースラインと計画された時点のデータのみを用いた共分散分析」等と比べると,モデル

が極めて複雑になり,考慮しなければならない点も多くなる.そこで本章では,線形モデルは既知だが線形混

合モデルにはなじみのない読者に向けて,それらの基本的な内容(モデルの構成方法・推定方法など)を整理

すると同時に,SASプログラムと解析結果の例を示す.また,欠測のあるデータに対するMMRM のモデリン

グの考え方,感度分析についても少し触れる.

なお,本章では欠測メカニズムは MCARまでしか考えず,欠測の推定値に与える影響には触れないものと

する.

本報告書で用いる線形混合モデルの大きな特徴は以下の通りである.

• 同一被験者の各時点のデータは相関することを仮定する• 変量効果を導入することで,時点間の相関(の一部)を表現する

A.2 線形モデルと線形混合モデル

被験者 iに対して,1 ∼ ni時点2の応答変数のデータが得られたとする.Yi = (Yi1, · · · , Yini)′, (i = 1, · · · , N)

とおく.最初に,被験者 iに対する線形モデル (Linear Model, LM)は,

Yi = Xiβ + ϵi

と表されるモデルである.ここで,βは固定効果,Xiは固定効果に対するデザイン行列,ϵiは誤差である.線

形回帰分析・(固定効果)分散分析・共分散分析などの基本的なモデルは,この線形モデルに含まれる.なお,

誤差に関しては E[ϵi] = 0は仮定することが多いが,ϵi ∼ N(0, σ2Ini)は必ずしも仮定する必要はない.

本章の主題となる線形混合モデル (Linear Mixed Model, LMM)は,これに被験者ごとの特徴を表す確率変数

bi(変量効果)を追加して

Yi = Xiβ + Zibi + ϵi (A.1)

と表されるモデルである.ここで,Ziは変量効果に対するデザイン行列である.固定効果・変量効果として用

いられるのは,たとえば,

• 固定効果 β:薬剤,時点,薬剤と時点の交互作用など

• 変量効果 bi:被験者,施設など

1中止例の「実際に測定された最後の時点(欠測していない最後のデータがとられた時点)」とは異なる.2被験者ごとに観測データ数が異なってもよい,と想定している.本章では,欠測があった場合も気にせず観測されたデータのみを用

いて尤度の計算をするため,被験者ごとのデータ数は必ずしも一致しない.

4

Page 153: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

である.たとえば,1群・3時点で時点ごとに平均が異なるモデルを考える.被験者 iの時点 j (j = 1, 2, 3)の

データは,tj を時点(カテゴリ値),bi を変量効果として,

Yi1 = µ+ t1 + bi + ϵi1

Yi2 = µ+ t2 + bi + ϵi2

Yi3 = µ+ t3 + bi + ϵi3

(A.2)

と表せる.これをベクトル・行列を用いてまとめる.まず,

Yi =

Yi1

Yi2

Yi3

, β =

µ

t1

t2

t3

, ϵi =

ϵi1

ϵi2

ϵi3

とおき,デザイン行列を

Xi =

1 1 0 0

1 0 1 0

1 0 0 1

, Zi =

1

1

1

とおくと,式 (A.2)は

Yi = Xiβ + Zibi + ϵi

と表現できる.

ここで,重要な点は以下の通りである.

• データとして手に入るのは,Yi,Xi,Zi のみである.β,bi, ϵi は手に入らない.

• 固定効果 βは線形回帰分析・分散分析等と同じく,それ自身が推定 (estimation)の対象となる.

• 変量効果 bi は確率変数であり,ある分布に従うことを仮定する3.つまり,たとえば被験者を変量効果

とする場合,被験者がある集団からのランダムサンプリングであると想定する4.統計モデルを考える際

に,変量効果が果たす極めて大きな特徴は,

(i)データの相関を表現する

(ii)誤差の分散を減らす・構造を簡単にする

の 2つである5.(i) は,被験者 1人の各時点のデータに対して,共通の変量効果を入れることで,時点

間の相関が考慮できるようになる6.(ii) は,データのばらつきの一部を「被験者の違いによるばらつき」

と考えることで,変量効果を考えないモデルと比べて誤差の分散が減少する,また,誤差の構造が簡単

になる.3(多変量)正規分布に従うことを仮定することが多い.しかし,それは「計算が容易」であることが主な理由であることが多く,正規

性の妥当性は気にせずに使用することも多い.4現実的には,この仮定の妥当性はあまり検証されないことが多い.5応答変数に影響を与える要因をモデルに組み込むことができる,という根本的な部分を除く.6同じ被験者に対して 2 回くり返し測定したデータ Y1 = µ + b1 + ϵ1, Y2 = µ + b1 + ϵ2 を考える.b1, ϵ1, ϵ2 は全て独立とし,

V [b1] = σ2b , V [ϵ1] = V [ϵ2] = σ2 とおくと,Y1, Y2 の共分散は

Cov[Y1, Y2] = Cov[µ+ b1 + ϵ1, µ+ b1 + ϵ2] = Cov[b1, b1] = σ2b

となり,分散は

V [Y1] = V [b1] + V [ϵ1] = σ2b + σ2, V [Y2] = V [b1] + V [ϵ2] = σ2

b + σ2

となるので,Y1 と Y2 の相関は

Corr[Y1, Y2] =Cov[Y1, Y2]√V [Y1]

√V [Y2]

=σ2b

σ2b + σ2

となり,時点間の相関を表現できる.

5

Page 154: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• 以上を受けて,本報告書では変量効果に対する主な関心は「変量効果の個別値がいくらであるか」ではなく,「時点間相関がどのくらいあるか」「データのばらつき全体のうち,変量効果で説明できる部分はどの

くらいか(誤差分散はどのくらいか)」にあるとする.これらの性質は,変量効果の従う分布のパラメー

タによって特徴づけられる.つまり,本報告書では変量効果に対して推測の主な対象となるのは,変量効

果自身の値よりも,まずはその従う分布のパラメータであるとする.つまり,たとえば bi ∼ N(0, τ2Im)

を仮定した場合,bi 自身ではなく,τ2 を推定の主な対象とすることが多い.次のステップとして,個

別の bi の値にも興味がある場合もある.その場合,bi が確率変数であるため,固定効果の場合の推定

(estimation)・推定量 (estimator)と区別して,bi の予測 (prediction)・予測量 (predictor)ということが多

い7.代表的な予測量の 1つとして,応答変数を与えたもとでの変量効果の事後平均 bi = E[bi|Yi]があ

る.本報告書では,予測についてはあまり扱わない.

• 誤差 ϵi にも正規分布を仮定することが多いが,「誤差は時点間で独立」とするか「誤差も時点間相関す

る」ようにするか,検討が必要である.

なお,本報告書では,簡単のため以下を仮定する.

• 変量効果と誤差は全て(多変量)正規分布に従う.• 変量効果と誤差は独立.つまり,bi と ϵj は i, j の値によらず独立.

• 異なる被験者のデータは全て独立.つまり,i = j の場合,bi と bj,ϵi と ϵj は独立.

これらは,基本的なモデルでは仮定されることが多い.

A.3 条件付き分布と周辺分布

応答変数に時点間相関のある経時データを扱う際,よく用いられる分布のタイプは 2種類ある.1つは (A.1)

式のように,変量効果を明示した分布であり,これを条件付き分布と呼ぶ.

一方,変量効果は確率変数であり,分布に従う未知の変数である.そのため,biのばらつきも込みにしたYi

全体の分布を考えることがある.この分布を周辺分布と呼ぶ.計算上は,周辺分布の確率密度関数は条件付き

分布の確率密度関数を,変量効果の確率密度関数をかけた上で積分すれば求まる.以下,これをみていくこと

とする.たとえば式 (A.1)

Yi = Xiβ + Zibi + ϵi

に対して,bi ∼ N(0,D), ϵi ∼ N(0,Σi)で bi と ϵi が独立,を仮定した場合,

• 条件付分布Yi|bi ∼ N(Xiβ,Σi)

• 周辺分布Yi ∼ N(Xiβ,ZiDZ′i +Σi)

となる.また,条件付分布の密度関数 f(Yi|bi)と周辺分布の密度関数 f(Yi)の関係は,変量効果の密度関数

g(bi)を用いて

f(Yi) =

∫f(Yi|bi) · g(bi)dbi

と表現できる.

A.4 固定効果の検討

固定効果について検討すべき点をいくつか整理する.

(i)時点をカテゴリ値にするか,連続値にするか

7文献によっては,変量効果に対しても「推定」「推定量」という用語を用いているため,以上の区別は絶対的なものではない.

6

Page 155: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

(ii)交互作用はどこまで入れるべきか

(iii)ベースライン値は応答変数か共変量か

まず (i)を見る.例えば各被験者 iに対して,時点 t1, t2, t3で 3回応答変数 Yij を測定した場合を考える.この

とき,時間 ti を連続値にすると,時間に関する 1次関数

Yij = β0 + β1tj + ϵi

や,2次関数

Yij = β0 + β1tj + β2t2j + ϵi

のようなモデルが考えられる.このとき,t1, t2, t3はデータであり既知の値,パラメータ β0, β1, β2が推定の対

象となる.これらの場合,時間の経過に従ってデータの平均構造がどのように変化するか,が明確にモデリン

グされている.

一方,時点をカテゴリ値とする場合,

Yij = β0 + tj + ϵij

のように書ける.このとき,t1, t2, t3 はデータではなく,「時点 t1, t2, t3 の,応答変数へ与える影響を示す固定

効果」であり,「推定すべき対象」である.そして,「時点の影響は時点ごとにばらばら」と考えるため,平均構

造が時間経過に従ってどのように変化するか,という点に対する制約が少ない.従って,時点ごとにどのよう

な変化をするデータに対しても柔軟に対応できる8.

次に,(ii) である.固定効果が複数ある場合,交互作用をどのように入れるか,という問題が生じる.特に,

本報告書の主題の 1つであるMMRM では,時点をカテゴリ値とした上で,「薬剤と時点の交互作用」をモデル

に組み込むことが多い.このようにすることで,群間差が時点によって異なることも表現可能となる9.

言葉だけでは分かりにくいため,以下,図で確認する.図 A.1のような平均構造を持つ 2群・5時点のデー

タを考える.応答変数が下がれば改善しているとし,時点 5での群間差を評価したいとする.群間差が徐々に

図 A.1:真の平均構造

開いていき,途中で両群とも定常状態に達している.この平均構造をもつデータを,1群 15例ずつ発生させた

シミュレーションデータが以下の図 A.2,A.3である.

このデータに,以下の 6通りの平均構造をもつモデルを当てはめ,推定された平均構造を図で示していく.

なお,簡単のためベースライン値は応答変数とする.

• 平均構造 1:時点は連続値(時間に関する 1次関数).両群同じ傾き

• 平均構造 2:時点は連続値(時間に関する 1次関数).群毎に異なる傾き8一方で,増減を繰り返す,など経時的変化の仕方が容易には解釈しづらいモデルとなる可能性もある.9以下,図で確認していくが,時点と投与群の交互作用を入れない場合,全時点で群間差が同じとなってしまうため,「最初はあまり群

間に差がないが,途中から差が表れる」ようなタイプのデータに対する当てはまりが悪くなる.

7

Page 156: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

図 A.2:プラセボ群のデータ 図 A.3:実薬群のデータ

• 平均構造 3:時点は連続値(時間に関する 2次関数).2次・1次の係数は両群同じ

• 平均構造 4:時点は連続値(時間に関する 2次関数).2次・1次の係数は群毎に異なる

• 平均構造 5:時点はカテゴリ値.群と時点の交互作用なし

• 平均構造 6:時点はカテゴリ値.群と時点の交互作用あり

図 A.4:時点:連続値(時間の 1次関数),両群

同じ傾き

図 A.5:時点:連続値(時間の 1次関数),群毎

に異なる傾き

最初に 1次関数(平均構造 1,2)を当てはめた結果が図 A.4, A.5である.どちらも真の平均構造である図

A.1とはかなり異なっている.

図 A.6:時点:連続値(時間の 2次関数),2次・

1次の係数は両群で同じ

図 A.7:時点:連続値(時間の 2次関数),2次・

1次の係数は群毎に異なる

8

Page 157: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

次に,2次関数(平均構造 3,4)を当てはめた結果が図 A.6, A.7である.直線を当てはめた場合よりだいぶ

真の平均構造に近くなっている.しかし特に図 A.7の実薬群で顕著であるが,初期に急激に減少した反動で,

時点 5で増加傾向がみられている.この点が真の構造とは異なっている.今回,時点 5での群間差を評価しよ

うとしているため,時点 5での推定値にバイアスが入る可能性がある構造は,可能な限り避けたい.また,途

中まで減少していたものが増加に転じた場合,医学的状態に何らかの変化があった可能性も懸念されるため,

このようなバイアスは解釈を無用に難しくする可能性がある.

図 A.8: 時点:カテゴリ値,薬剤と時点の交互

作用なし

図 A.9: 時点:カテゴリ値,薬剤と時点の交互

作用あり

時点をカテゴリ値としたモデル(平均構造 5,6)を当てはめた結果が図 A.8, A.9である.薬剤と時点の交互

作用ありの場合が最も真の構造に近く,かなり真の構造に近い推定ができている.2次関数を当てはめた場合

とは異なり,時点 5での値も時点 4とほぼ同等である.一方,交互作用がない図 A.8では,時点ごとの群間差

が等しい,つまり時点 1から時点 5まで群間差が等しくなっており,「段々群間差が開いていく」という真の構

造を適切に反映しているとは言い難い.

このように,時間に対する依存関係が簡単に表現できない場合でも,時点をカテゴリ値にし,時点と薬剤の

交互作用を入れることで真の構造に近い平均構造が推定ができるようになる.

最後に (iii) であるが,ベースラインの値は薬剤の影響はないため,LOCF ANCOVAでも共変量とされる.同

様に,MMRM でもベースライン値は共変量と考えることが多い.一方で,応答変数の 0時点での値,と考え,

応答変数と考える文献もみられる (Liang and Zeger, 2000).

A.5 変量効果と誤差の相関構造

次に,変量効果と誤差について,検討すべきことを考える.一般論を議論するのは難しいため,以下,式

(A.1) Yi = Xiβ + Zibi + ϵi で表現されるモデルに対して,具体例に即して述べることとする.

A.5.1 例 1:変量効果 1つ.誤差は独立等分散.

3時点,固定効果は群(2群,β1, β2)・時点 (t1, t2, t3:連続値),変量効果は被験者 biを切片項のみに含める

場合を考える.実薬群 2例,プラセボ群 2例の場合を考える.被験者番号 iの j時点のデータを Yij と書くこと

とし,i = 1, 2:プラセボ群,i = 3, 4:実薬群とする.簡単のため,ベースライン値は共変量に含まないものと

する.このとき,時間に対して 1次関数で依存するようにモデル化する(傾きは両群で等しいと仮定する)と,

Y11 = µ+ β1 + γt1 + b1 + ϵ11

Y12 = µ+ β1 + γt2 + b1 + ϵ12

Y13 = µ+ β1 + γt3 + b1 + ϵ13

Y21 = µ+ β1 + γt1 + b2 + ϵ21

9

Page 158: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Y22 = µ+ β1 + γt2 + b2 + ϵ22

Y23 = µ+ β1 + γt3 + b2 + ϵ23

Y31 = µ+ β2 + γt1 + b3 + ϵ31

Y32 = µ+ β2 + γt2 + b3 + ϵ32

Y33 = µ+ β2 + γt3 + b3 + ϵ33

Y41 = µ+ β2 + γt1 + b4 + ϵ41

Y42 = µ+ β2 + γt2 + b4 + ϵ42

Y43 = µ+ β2 + γt3 + b4 + ϵ43

となる10.以下,ベクトル・行列でまとめる.被験者 iに対して,

Yi =

Yi1

Yi2

Yi3

, β =

µ

β1

β2

γ

, ϵi =

ϵi1

ϵi2

ϵi3

とし,デザイン行列を

X1 = X2 =

1 1 0 t1

1 1 0 t2

1 1 0 t3

, X3 = X4 =

1 0 1 t1

1 0 1 t2

1 0 1 t3

,

Z1 = Z2 = Z3 = Z4 =

1

1

1

= 13

とおく11.まず被験者毎にデータをまとめると,

Y1 = X1β + Z1b1 + ϵ1

Y2 = X2β + Z2b2 + ϵ2

Y3 = X3β + Z3b3 + ϵ3

Y4 = X4β + Z4b4 + ϵ4

となる.さらに全被験者をまとめて表示すると,

Yi = Xiβ + Zibi + ϵi (i = 1, 2, 3, 4) (A.3)

10このように,切片項に入れた変量効果を,「変量切片」と呼ぶことがある.11X1 と X2,X3 と X4 がそれぞれ等しいのは,投与群と時点が等しいから(つまり,固定効果の部分が共通だから)である.

10

Page 159: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.次に,全被験者合わせたベクトル・行列による表現を考えると,

Y =

Y1

Y2

Y3

Y4

=

Y11

Y12

Y13

Y21

Y22

Y23

Y31

Y32

Y33

Y41

Y42

Y43

, b =

b1

b2

b3

b4

, ϵ =

ϵ1

ϵ2

ϵ3

ϵ4

=

ϵ11

ϵ12

ϵ13

ϵ21

ϵ22

ϵ23

ϵ31

ϵ32

ϵ33

ϵ41

ϵ42

ϵ43

X =

X1

X2

X3

X4

=

1 1 0 t1

1 1 0 t2

1 1 0 t3

1 1 0 t1

1 1 0 t2

1 1 0 t3

1 0 1 t1

1 0 1 t2

1 0 1 t3

1 0 1 t1

1 0 1 t2

1 0 1 t3

, Z =

Z1 0 0 0

0 Z2 0 0

0 0 Z3 0

0 0 0 Z4

=

1 0 0 0

1 0 0 0

1 0 0 0

0 1 0 0

0 1 0 0

0 1 0 0

0 0 1 0

0 0 1 0

0 0 1 0

0 0 0 1

0 0 0 1

0 0 0 1

となる.以上より,(A.3)の i = 1, 2, 3, 4をまとめて表示すると,

Y = Xβ + Zb+ ϵ

となる.次に重要なことは確率変数 bi と誤差 ϵi の従う分布の特定である.いま,

biiid∼ N(0, ν2), ϵi

iid∼ N(0, σ2I3)

とし,bi と ϵi は独立とする.このとき,(A.3)より,データYi の分散共分散行列は

V [Yi] = V [Zibi + ϵi]

= ZiV [bi]Z′i + V [ϵi]

= 13V [bi]1′3 + σ2I3

11

Page 160: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= ν2

1 1 1

1 1 1

1 1 1

+ σ2

1 0 0

0 1 0

0 0 1

∵ 131

′3 =

1 1 1

1 1 1

1 1 1

=

ν2 + σ2 ν2 ν2

ν2 ν2 + σ2 ν2

ν2 ν2 ν2 + σ2

(A.4)

となる.このような「各時点の分散が等しい」「異なる時点間の相関が,時点によらず等しい12」Yi の相関構

造を Compound Symmetryと呼ぶ.

たとえば,ν2 = 2, σ2 = 3の場合,

V [Yi] =

2 + 3 2 2

2 2 + 3 2

2 2 2 + 3

=

5 2 2

2 5 2

2 2 5

となる.これより,j = kのとき,Yij と Yik の共分散は

Cov[Yij , Yik] = 2

となり,時点間の相関は

Cor[Yij , Yik] =Cov[Yij , Yik]√V [Yij ] · V [Yij ]

=2√5 · 5

= 0.4

となる.

次に,全データを合わせた場合をみる.

Y = Xβ + Zb+ ϵ

となるため,全体の分散共分散行列は

V [Y] = V [Zb] + V [ϵ]

= ZV [b]Z′ + V [ϵ]

=

Z1 0 0 0

0 Z2 0 0

0 0 Z3 0

0 0 0 Z4

(ν2I4

)

Z′1 0 0 0

0 Z′2 0 0

0 0 Z′3 0

0 0 0 Z′4

+

σ2I3 0 0 0

0 σ2I3 0 0

0 0 σ2I3 0

0 0 0 σ2I3

= ν2

Z1Z′1 0 0 0

0 Z2Z′2 0 0

0 0 Z3Z′3 0

0 0 0 Z4Z′4

+

σ2I3 0 0 0

0 σ2I3 0 0

0 0 σ2I3 0

0 0 0 σ2I3

=

ν2Z1Z′1 + σ2I3 0 0 0

0 ν2Z2Z′2 + σ2I3 0 0

0 0 ν2Z3Z′3 + σ2I3 0

0 0 0 ν2Z4Z′4 + σ2I3

12つまり,1時点目と 2時点目の相関が,1時点目と 3時点目との相関と等しい,などである.

12

Page 161: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.さらに全成分を書き下す.いま,i = 1, 2, 3, 4に対して

ZiZ′i = 131

′3 =

1

1

1

( 1 1 1)=

1 1 1

1 1 1

1 1 1

より,

ν2ZiZ′i + σ2I3 = ν2

1 1 1

1 1 1

1 1 1

+ σ2

1 0 0

0 1 0

0 0 1

=

ν2 + σ2 ν2 ν2

ν2 ν2 + σ2 ν2

ν2 ν2 ν2 + σ2

となる.これより,スペースの都合上 τ2 = ν2 + σ2 とおくと,

V [Y] =

τ2 ν2 ν2 0 0 0 0 0 0 0 0 0

ν2 τ2 ν2 0 0 0 0 0 0 0 0 0

ν2 ν2 τ2 0 0 0 0 0 0 0 0 0

0 0 0 τ2 ν2 ν2 0 0 0 0 0 0

0 0 0 ν2 τ2 ν2 0 0 0 0 0 0

0 0 0 ν2 ν2 τ2 0 0 0 0 0 0

0 0 0 0 0 0 τ2 ν2 ν2 0 0 0

0 0 0 0 0 0 ν2 τ2 ν2 0 0 0

0 0 0 0 0 0 ν2 ν2 τ2 0 0 0

0 0 0 0 0 0 0 0 0 τ2 ν2 ν2

0 0 0 0 0 0 0 0 0 ν2 τ2 ν2

0 0 0 0 0 0 0 0 0 ν2 ν2 τ2

と表せる.

A.5.2 重要な注意

相関構造を考える際,非常に注意すべき点がある.それは,「変量効果の相関構造について述べているのか」

「誤差の相関構造について述べているのか」「両方合わせたデータ(周辺分布)の相関構造について言っている

のか」を明確に区別することである.

上の例 1のモデルは

• 変量効果 bi:互いに独立に正規分布に従う.ϵi とも独立.

• 誤差 ϵi:時点間で独立等分散

であり,結局

• データYi(の周辺分布):Compound Symmetry

である.ここで,「誤差 (ϵi)に Compound Symmetryを仮定している」と勘違いしてしまうと,異なるモデルと

なってしまう13.相関構造について考える場合は,必ず「変量効果なのか」「誤差なのか」「データ(の周辺分

布)なのか」に注意する習慣をつけることが望ましい.13この指定の場合,計算が収束しなくなる.

13

Page 162: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

A.5.3 例 2:変量効果 2つ.変量効果の相関は無特定.誤差は独立等分散.

次に,変量効果が複数ある場合を考える.例 1では被験者ごとに切片項にのみ変量効果を入れたが,それに

加えて時点間の傾きにも変量効果を入れてみる.ここで,i = 1, 2:プラセボ群,i = 3, 4:実薬群とする.さら

に,変数 kを,i = 1, 2(プラセボ群)のとき k = 1,i = 3, 4(実薬群)のとき k = 2とおき14,モデル

Yij = µ+ βk + γtj + bi1 + bi2tj + ϵij

を考える.このとき,被験者 iの変量効果は bi1, b2iのため,全員分の変量効果を全て数えると b11, b12, b21, b22, b31, b32, b41, b42

の 8つとなる.ここで,被験者 iの変量効果 bi = (bi1, bi2)′ の分布として, bi1

bi2

iid∼ N

0

0

,

ν21 0

0 ν22

を仮定し,誤差は ϵ

iid∼ N(0, σ2I3)とする.ここで,b1i と b2i は PROC MIXEDのデフォルトに合わせて,独

立だが分散は異なってよい Variance Componentsを仮定する15.なお,D =

ν21 0

0 ν22

とおく.次に,データYi のベクトル表示を考える.まず,

Yi =

Yi1

Yi2

Yi3

, β =

µ

β1

β2

γ

, bi =

bi1

bi2

, ϵi =

ϵi1

ϵi2

ϵi3

とし,デザイン行列を

X1 = X2 =

1 1 0 t1

1 1 0 t2

1 1 0 t3

, X3 = X4 =

1 0 1 t1

1 0 1 t2

1 0 1 t3

Z1 = Z2 = Z3 = Z4 =

1 t1

1 t2

1 t3

とおくと,被験者 iに対して

Yi = Xiβ + Zibi + ϵi (i = 1, 2, 3, 4)

となる.平均・分散はそれぞれ

E[Yi] = Xiβ

V [Yi] = V [Zibi] + V [ϵi]

= ZiV [bi]Z′i + σ2I3

= ZiDZ′i + σ2I3

14少し見づらいが,βk の部分で k = 1, 2 を指定している.15変量効果同士の相関構造はよく分からないことも多いので,「仮にあったとしてもそれほど困らないように」という意図から,相関の

パラメータ ν12 を設定し,D =

(ν21 ν12

ν12 ν22

)とすることもよくある.SASの指定は RANDOM ステートメントに " / TYPE = UN; "

と指定すればよい.

14

Page 163: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

=

1 t1

1 t2

1 t3

ν21 0

0 ν22

1 1 1

t1 t2 t3

+

σ2 0 0

0 σ2 0

0 0 σ2

=

ν21 + t21ν

22 + σ2 ν21 + t1t2ν

22 ν21 + t1t3ν

22

ν21 + t1t2ν22 ν21 + t22ν

22 + σ2 ν21 + t2t3ν

22

ν21 + t1t3ν22 ν21 + t2t3ν

22 ν21 + t23ν

22 + σ2

となる.次に,全被験者を合わせて考える.

Y =

Y1

Y2

Y3

Y4

=

Y11

Y12

Y13

Y21

Y22

Y23

Y31

Y32

Y33

Y41

Y42

Y43

, b =

b1

b2

b3

b4

=

b11

b12

b21

b22

b31

b32

b41

b42

, ϵ =

ϵ1

ϵ2

ϵ3

ϵ4

=

ϵ11

ϵ12

ϵ13

ϵ21

ϵ22

ϵ23

ϵ31

ϵ32

ϵ33

ϵ41

ϵ42

ϵ43

X =

X1

X2

X3

X4

=

1 1 0 t1

1 1 0 t2

1 1 0 t3

1 1 0 t1

1 1 0 t2

1 1 0 t3

1 0 1 t1

1 0 1 t2

1 0 1 t3

1 0 1 t1

1 0 1 t2

1 0 1 t3

, Z =

Z1 0 0 0

0 Z2 0 0

0 0 Z3 0

0 0 0 Z4

=

1 t1 0 0 0 0 0 0

1 t2 0 0 0 0 0 0

1 t3 0 0 0 0 0 0

0 0 1 t1 0 0 0 0

0 0 1 t2 0 0 0 0

0 0 1 t3 0 0 0 0

0 0 0 0 1 t1 0 0

0 0 0 0 1 t2 0 0

0 0 0 0 1 t3 0 0

0 0 0 0 0 0 1 t1

0 0 0 0 0 0 1 t2

0 0 0 0 0 0 1 t3

とおくと,

Y = Xβ + Zb+ ϵ

15

Page 164: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.これより,平均構造は

E[Y] = Xβ =

X1

X2

X3

X4

β =

X1β

X2β

X3β

X4β

であり,周辺分散は

V [Y] = ZV [b]Z′ + V [ϵ]

=

Z1 0 0 0

0 Z2 0 0

0 0 Z3 0

0 0 0 Z4

D 0 0 0

0 D 0 0

0 0 D 0

0 0 0 D

Z′1 0 0 0

0 Z′2 0 0

0 0 Z′3 0

0 0 0 Z′4

+

σ2I3 0 0 0

0 σ2I3 0 0

0 0 σ2I3 0

0 0 0 σ2I3

=

Z1DZ′1 + σ2I3 0 0 0

0 Z2DZ′2 + σ2I3 0 0

0 0 Z3DZ′3 + σ2I3 0

0 0 0 Z4DZ′4 + σ2I3

となる.

A.5.4 例 3:変量効果 1つ.誤差の分散共分散構造は AR(1).

次に,例 1と固定効果・変量効果は同じであるが,誤差に相関がある場合を考える.「誤差が相関している」

という表現は奇妙に聞こえるかもしれない.理想的には,「誤差」とはばらばらでばらつきも均等なものである

べきであろう.つまり,時点間で独立で,分散も時点によらず等しいことが望ましい.これを逆から見ると,

データに相関があるならば,何らかの「相関の原因」が存在する,という考え方となる.そうして,その「原

因」を全て変量効果としてモデル化し,「残った誤差は独立かつ等分散」,とできたとすると,そのモデルは満

足のいくものに近いと考えられる16.しかし,現実にデータ解析を行う場合,相関の原因が十分に特定できな

い場合や,検証試験の主解析で事前にモデルを特定しておきたい場合など,「変量効果を考えた上でも,時点間

相関がないとは言えない」ことが起こりうる.そのような場合に合わせて,誤差に独立性を仮定しないことも

よくある.なお,「誤差に時点間相関があるデータに対して,時点間が独立なモデルを当てはめる」場合,モデ

ルの誤特定となり推定量にバイアスが入る可能性があるが,「現実に独立だがモデルの誤差構造に相関を仮定す

る」場合,分散共分散行列の非対角成分の「真値が 0」と捉えることでモデルの誤特定とはならず,最尤推定

量の一致性は担保される17.

16さらに要因を考慮することで,ばらつきが減少する可能性があるため,「これで十分である」とは言えるとは限らない.17一致性は「例数が多い場合」の性質を保証するもののため,少数例の場合は注意が必要である.また,欠測の影響は本章では考えない.

16

Page 165: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

誤差の分散共分散構造には様々なものが存在するが,ここでは AR(1)を考える.つまり,−1 < ρ < 1として,

biiid∼ N(0, ν2), ϵij

iid∼ N

0, σ2

1 ρ ρ2

ρ 1 ρ

ρ2 ρ 1

とする18.これに従いデータYi の平均・分散共分散行列を計算する.モデルは

Yi = Xiβ + Zibi + ϵi

で,Zi = 13, bi ∼ N(0, σ2)より,

E[Yi] = Xiβ

V [Yi] = 13V [bi]1′3 + V [ϵi]

= ν2

1 1 1

1 1 1

1 1 1

+ σ2

1 ρ ρ2

ρ 1 ρ

ρ2 ρ 1

=

ν2 + σ2 ν2 + σ2ρ ν2 + σ2ρ2

ν2 + σ2ρ ν2 + σ2 ν2 + σ2ρ

ν2 + σ2ρ2 ν2 + σ2ρ ν2 + σ2

(A.5)

となる.(A.4)と比べると−1 < ρ < 1のため,AR(1)は「時点が近いほど相関が強く,離れるほど相関が弱い」

状況を表現していることが分かる.例えば,ν2 = 1, σ2 = 2, ρ = 0.5の場合を考えると,

V [Yi] =

1 + 2 1 + 2 · 0.5 1 + 2 · 0.52

1 + 2 · 0.5 1 + 2 1 + 2 · 0.5

1 + 2 · 0.52 1 + 2 · 0.5 1 + 2

=

3 2 1.5

2 3 2

1.5 2 3

となり,時点 j と時点 kの共分散は

Cov[Yij , Yik] = 1 + 2 · 0.5|j−k|

となり,相関は

Corr[Yij , Yik] =Cov[Yij , Yik]√V [Yij ]

√V [Yik]

=1 + 2 · 0.5|j−k|√

3 · 3=

1 + 2 · 0.5|j−k|

3

となる.相関を具体的に計算してみると

Corr[Yi1, Yi2] = Corr[Yi2, Yi3] =1 + 1

3; 0.67

Corr[Yi1, Yi3] =1 + 0.5

3= 0.5

となる.

A.5.5 例 4:変量効果 1つ.誤差の分散共分散構造は指数関数の系列相関.

例 3では,誤差の分散共分散構造に AR(1)を仮定した.つまり,

V [ϵi] = σ2

1 ρ ρ2

ρ 1 ρ

ρ2 ρ 1

18ϵij の分散共分散行列の (i, j) 成分は σ2ρ|i−j| と表せる.

17

Page 166: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

とおいた.この構造は「時点間の相関を考える」「時点間が離れるごとに相関が小さくなる」という性質から,

現実的な設定の 1つと考えられる.しかし,たとえばこの 3時点が「1週目,2週目,4週目」であると仮定す

ると,AR(1)では「1週目と 2週目の誤差の相関」と「2週目と 4週目の誤差の相関」が等しくなる.測定間

隔が広がれば相関が下がると考えるのが自然な場合も多いため,AR(1)よりもさらに柔軟な相関構造を指定し

たい場合も多いであろう.そこで,「時点間の相関を,時点間の間隔によって変化させる」モデルを考える.

このような場合,時点 kと時点 l(ここで k, lはそれぞれ k番目,l番目を指す)をそれぞれ tk 週目と tl 週

目としたときに (tk − tl)に依存するような関数を用いることが考えられる.特に,誤差の分散共分散構造を

V [ϵi] = σ2

1 exp

(−|t1 − t2|

θ

)exp

(−|t1 − t3|

θ

)exp

(−|t1 − t2|

θ

)1 exp

(−|t2 − t3|

θ

)exp

(−|t1 − t3|

θ

)exp

(−|t2 − t3|

θ

)1

のように指定することを考える19.たとえば,t1 = 1, t2 = 2, t3 = 4, θ = 0.5のとき,

V [ϵi] = σ2

1 exp

(− 1

0.5

)exp

(− 2

0.5

)exp

(− 1

0.5

)1 exp

(− 1

0.5

)exp

(− 2

0.5

)exp

(− 1

0.5

)1

= σ2

1 exp (−2) exp (−4)

exp (−2) 1 exp (−2)

exp (−4) exp (−2) 1

= σ2

1 0.14 0.02

0.14 1 0.14

0.02 0.14 1

となる.これにより,時点間隔が均等でない場合に「何週(何ヶ月,何年)間隔」であるかを利用した解析を

行うことができる.

SASの PROC MIXEDでは,REPEATEDステートメントの指定で得られ,Spatial Covariance Structureと呼

ばれている.

A.5.6 例 5:変量効果なし.誤差の分散共分散構造はCompound Symmetry.

最後の例は,固定効果は例 1・例 2と同じであるが,変量効果をなくしたものである20.しかし,ただなく

すだけでは面白くないので,周辺分布の分散 V [Yi]を例 1と同じとする.つまり,モデルは

Yi = Xiβ + ϵi

とし,誤差の分布を

ϵiiid∼ N

0

0

0

,

ν2 + σ2 ν2 ν2

ν2 ν2 + σ2 ν2

ν2 ν2 ν2 + σ2

とする.このとき,

E[Yi] = Xiβ

19絶対値がついているのは,「大きい方から小さい方を引く」「どちらからどちらを引くか,ということをいちいち考えなくてもよいようにしたい」というだけの目的である.

20つまり,以上は線形混合モデル (LMM) の話であったが,この例は線形モデル (LM) である.MMRM もこのモデルの拡張と考えることができる.そのため,「MMRM(Mixed Model for Repeated Measures)という名称が妥当ではない」という批判は,主にこの点に由来する.

18

Page 167: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

V [Yi] =

ν2 + σ2 ν2 ν2

ν2 ν2 + σ2 ν2

ν2 ν2 ν2 + σ2

となり,Yi の平均も分散共分散構造も共に例 1と等しくなる.では,例 1との違いは何であろうか.それは,

例 1では「時点間相関の原因が『被験者』と特定できている」のに対して,例 5では「何が原因か分からない

けれど誤差が相関している」という,「モデルの解釈」である21.

式の上では,この例の ϵiを,例 1では Zibi + ϵiのように「『変量効果(被験者の影響)』と『誤差』に分解

したもの」と考えることもできる.

A.5.7 一般論

最後にまとめて一般論を考える.(A.1)のモデル

Yi = Xiβ + Zibi + ϵi

に対して,biiid∼ N(0,D), ϵi

iid∼ N(0,Σi),bi と ϵi が独立,を仮定すると,

E[Yi] = Xiβ, V [Yi] = ZiDZ′i +Σi

となる22.上記具体例でみてきたように,モデルの相関構造は変量効果と誤差の分布に「解析者が何を指定す

るか」によって変わる.相関構造の誤特定により,平均構造のパラメータ推定値や検定結果が影響を受けるこ

ともある.そのため,十分注意を払って設定する必要がある.

また,SASの PROC MIXEDでは,変量効果 biは RANDOMステートメント,誤差 ϵiは REPEATEDステー

トメントで指定する.

A.6 残差プロット

以上,モデルの種類・構築について述べてきた.次に,データにモデルを当てはめた際,データに対して「よ

くあてはまっている」モデルかどうかを判断する方法の 1つである,残差プロットについて考える.残差プロッ

トは,想定したモデルを用いてパラメータを推定した結果が,どの程度データとずれているか,を目で見て確

認できるようにする方法の 1つである.

線形混合モデルでは,大きく分けて以下の 2種類の残差を考える.それぞれ被験者 iのものに限定すると,

(i)周辺残差:rm,i = Yi −Xiβ

(ii)条件付き残差 rc,i = Yi −Xiβ − Zibi

である.ここで,βや bi の推定・予測の方法は後の推定・予測の節で述べる.

(i) の周辺残差は,固定効果の特定の妥当性をみるものであり,(ii) の条件付き残差は,変量効果の予測値ま

で含めたモデルの妥当性をみるものである.この残差を縦軸に,横軸にはXiβ(周辺残差)Xiβ+Zibi(条件

付き残差)をプロットしたものが,残差プロットである23.

また,残差は「誤差」もしくは「変量効果 +誤差」の予測量,という風に解釈することもできるため,その

大きさはデータのばらつきに影響を受ける24.そのため,ばらつきで補正した残差も検討に値することが多い.

これを Student化残差 (studentized residual)と呼ぶ.21もしくは「被験者による影響にはあまり興味がない(解釈するつもりがない)ので,『誤差に含める』という扱いで十分」と考えてい

る,という見方もできる.22Σi に i がついているのは,被験者ごとに測定時点数が異なることの影響などで,被験者ごとに分散共分散行列が異なってもよいよう

にするためである.一方,変量効果は,通常全被験者に共通の要因を考えるため,D は i に依存させないことが多い.23rm,i, rc,i はベクトルであるが,プロットの際は成分ごとに別々の点として表現する.24たとえば,後の時点ほどデータの分散が大きい場合,後の時点のデータの方が残差のばらつきも大きくなることが「自然」である.

19

Page 168: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

(i)’Student化周辺残差:rm,i√V [rm,i]

(ii)’Student化条件付き残差rc,i√V [rc,i]

で定義される.なお,ここでVi = ZiDZi +Σi, Qi = Xi(X′iV

−i Xi)

−X′i, Ki = I − ZiDZ′

iV−1i として,

V [rm,i] = Vi −Qi

V [rc,i] = Ki(Vi −Qi)K′i

である.

SASの PROC MIXEDでは,RANDOMステートメントに residualオプションを記載して,ods graphicsを on

にすれば htmlに出力される.プログラムは A.7.9節に示した.出力例は以下の図 A.10の左上である.なお,デ

フォルトの設定では上の (i),(ii),(i)’,(ii)’ を含む 6種類の残差が出力される.

y

BIC 310.22AICC 308.49AIC 308.23 304.23

4.8392 10.446 0.19 -14.39 53

-2 -1 0 1 2

-15

-10

-5

0

5

10

-14 -10 -6 -2 2 6 10 14

0

10

20

30

40

5 10 15

-15

-10

-5

0

5

10

図 A.10:残差プロットの例

注目すべき点は 2点あり

(a)0の上下に均等にばらついているか?

(b)Student化残差のばらつきは横軸の値によらず一定か?

である.一般に,線形混合モデルYi = Xiβ+Zibi + ϵiに対して,E[Zibi] = 0, E[ϵi] = 0を仮定することが

多い.そのため,条件付き残差を ϵiの予測量,周辺残差を Zibi + ϵiの予測量と考えた場合,モデルの特定が

正しければ,ともに平均的には 0の周りにばらつくことが想定される.

さらに,時点間で異なるばらつきを想定している場合,残差のばらつきは時点に依存して異なることが想定

される.それを調整するのが Student化された残差である.そのため,モデルが正しければ,Student化残差は

共変量の値によらず一定の間隔でばらつくことが多い.

A.6.1 影響診断

残差診断では応答変数のデータ 1つ 1つを別々に扱ったが,次にクラスター単位で考える.クラスターとは

複数のデータをまとめる単位で,たとえば被験者や施設などがよく用いられる.クラスターごとにまとめて考

20

Page 169: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

えた場合,どのクラスターがパラメータ推定値に影響を強く与えるかどうかを調べる統計量として,Cookの

D統計量 (Cook, 1977)がよく用いられる.

以下,クラスターを被験者として考える.Cookの D統計量の考え方は,

• 全症例を用いた推定値 βと被験者 iを除いたデータからの推定値 β(i)を比べて,違いが大きく異なるよ

うなら,被験者 iがパラメータ βの推定に与える影響が大きい

というものである25.具体的には被験者 iの平均パラメータ βに対する Cookの D統計量は

Di =1

rank(X)(β − β(i))

′V [β]−(β − β(i))

で定義される.なお,V [β]− は βの分散共分散行列の一般化逆行列である.

SASの PROC MIXEDでは influenceオプションで容易に出力される.なお,全症例分を出力すると煩雑にな

るため,各群 4例ずつ出力する.プログラムは A.7.10節に示す.出力は以下の図 A.11の上 2つである.

y

Deleted patno(drug)

CovRatio

1

2

3

4

1

2

3

4

0.0

0.5

1.0

1.5

2.0

2.5

Cook D

1

2

3

4

1

2

3

4

0

1

2

3

4

5

CovRatio

1

2

3

4

1

2

3

4

0.0

0.5

1.0

1.5

2.0

Cook D

1

2

3

4

1

2

3

4

0.0

0.2

0.4

0.6

0.8

1.0

図 A.11:影響統計量の例

固定効果に対する影響をみると,プラセボ群の 3番目の症例が最もパラメータに対する影響が大きい.影響

の大きい症例が判明した場合,その症例がパラメータにどの程度の影響を与えているかを判断するため,その

症例を除外した解析を行い,結果の頑健性を検討することなどが行われる.

A.7 サンプルSASコードと出力例

推定方法の説明の前であるが,理論にそれほど興味のない読者や「とりあえず使えるようになりたい」とい

う読者のために,今まで見てきた例 1~5について SASのサンプルプログラムを示す.推定方法の概略は以下

の節で述べるため,「理論を理解するまでは使いたくない」という読者は,先に A.8, A.9節を読まれるとよい.

A.7.1 テストデータの発生

以下のテストデータを考える.まず,1群 10例の 2群比較の状況を考える.以下,今まで同様 iは被験者番

号,j は時点とする.また,変量効果 bi は独立にN(0, 42)に従い,誤差 ϵij は独立にN(0, 42)に従うとする.25つまり,被験者 iが「集団の中で平均的被験者」の場合,β も β(i) もほぼ同じとなる.一方,「集団の中で極めて特異な推移をする被

験者」である場合,β はその被験者の影響を受けており,β(i) にはその被験者の影響は含まれないため,β と β(i) は比較的大きく異なり得る.

21

Page 170: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

変数の意味は以下の通りである.

• i:被験者番号(ただし,実薬群の i = 1とプラセボ群の i = 1は別の被験者.以下同様)

• j:時点の添え字 (1, 2, 3)

• di:薬剤(1:プラセボ群,2:実薬群)

• ti:時点(1, 2, 3)(カテゴリ値)

いま,ベースラインは投与群によらず

Yi1 = 20 + bi − 3ti + ϵi1 (i = 1, · · · , 10)

とする.投与後のデータは

Yij = 20 + bi − 3di − 3ti + ϵi1 (i = 1, · · · , 10, j = 2, 3)

とする.また,時点 3のデータについては,データの値とは独立に 30%の確率で欠測が起こるものとする.つ

まり,時点 3のデータに関してMCARの欠測である.

データの発生・脱落の発生プログラムは以下の通りである.一旦全症例に対して,3時点分のデータを発生

させ,その後 30%の確率で時点 3の脱落を考える.

*データの発生;

DATA D1;

  CALL STREAMINIT(16747);

  DO DRUG = 1 TO 2;

   DO PATNO = 1 TO 10;

    PAT = RAND(’NORM’, 0, 4); *変量効果;

    TIME = 1; *時点 1;

    TIMECLASS = TIME;

    E = RAND(’NORM’, 0, 4); *誤差;

    Y = 20 + PAT - 3*TIME + E ; *ベースライン値(薬剤の影響なし);

    OUTPUT;

    DO TIME = 2, 3; *時点 2, 3;

     TIMECLASS = TIME;

     E = RAND(’NORM’, 0, 4); *誤差;

     Y = 20 + PAT - 3* DRUG - 3*TIME + E ; *時点 2,3のときの値(薬剤の影響あり);

     OUTPUT;

    END;

   END;

  END;

RUN;

22

Page 171: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

*脱落の発生;

DATA D2;

  SET D1;

  CALL STREAMINIT(51885);

  IF TIME = 3 THEN DO;

   IF RAND(’UNIF’) < 0.3 THEN DELETE; *時点 3のみ確率 30%で脱落;

  END;

RUN;

解析に用いるデータセット D2の主要な部分は以下のような構造である.

S A S シ ス テ ムS A S シ ス テ ム

O B S D R U G P A T N O T I M E T I M E C L A S S Y

1 1 1 1 1 1 8 . 7 4 2 5

2 1 1 2 2 1 4 . 7 1 3 3

3 1 1 3 3 1 5 . 2 8 6 4

4 1 2 1 1 2 4 . 9 0 5 7

5 1 2 2 2 1 3 . 4 8 5 9

6 1 2 3 3 1 0 . 2 0 8 5

7 1 3 1 1 1 6 . 5 2 0 1

8 1 3 2 2 8 . 3 2 0 4

9 1 3 3 3 1 0 . 5 4 8 2

図 A.12:データセット D2(最初の 3例のみ)

ここで,各変数の意味は

• DRUG:投与群

• PATNO:被験者番号

• TIME:時点

• TIMECLASS:時点(カテゴリ値)

• Y:応答変数

である.

23

Page 172: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

群ごとに全症例のプロットを示す.

図 A.13:プラセボ群のデータ 図 A.14:実薬群のデータ

以下,このデータに対して,例 1~5のそれぞれのモデルを当てはめ,解析結果を検討していく.

なお,簡単のため固定効果は「投与群」「時点(連続量)」のみとし,主に変量効果の指定の違いを見ていく

こととする.つまり

Yij = µ+ bi + βdi + γti + ϵij

を当てはめる.なお βdi はやや見づらいが,プラセボ群のとき di = 1であり,βdi = β1,実薬群のとき di = 2

であり,βdi = β2 となる.

A.7.2 例 1の解析プログラムと出力 1(例 1-1)

まずは例 1,変量効果 1つの場合である.1つ目の解析のプログラムは以下の通りである.

PROC MIXED DATA = D2;

   CLASS DRUG PATNO;

  MODEL Y = DRUG TIME / S ;

   RANDOM INT / SUB = PATNO(DRUG) ;

RUN;

出力は以下の通りである.最初の例のみ,結果を詳細にみていくこととする.

まずはモデルの詳細である.

モデルの情報

データセット WORK.D2

従属変数 Y

共分散構造 Variance Components

サブジェクト効果 PATNO(DRUG)

推定法 REML

残差分散法 Profile

固定効果 SE法 Model−Based

自由度の算出法 Containment

24

Page 173: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

次に,分類変数(カテゴリ変数)の水準である.

分類変数の水準の情報

分類 水準 値

DRUG 2 プラセボ群実薬群

PATNO 10 1 2 3 4 5 6 7 8 9 10

ここで被験者(PATNO)は 10症例しか存在しないようにみえるが,変量効果を PATNO(DRUG)としている

ため,プラセボと実薬のそれぞれに 10症例ずつの変量効果を別々に考えている.

次は,行列のサイズ等である.

次元の数

共分散パラメータ 2

X の列 4

サブジェクト毎の Zの列 1

サブジェクト 20

サブジェクト毎の最大 Obs 3

上で述べたとおり,サブジェクトが 20になっている.次は,データ数である.

オブザベーション数

読み込んだオブザベーション 53

使用されたオブザベーション 53

使用されなかったオブザベーション 0

次に計算の反復のくり返しと,収束したかどうかの判定である.

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 2 304.25255206 0.00018631

2 1 304.23163293 0.00000160

3 1 304.23146203 0.00000000

収束基準は満たされました.

正しく計算結果が収束していることが分かる.計算が収束していない,もしくは収束基準は満たすものの,妥

当性に欠ける値となっている場合,結果の数値の信頼性に欠けることが多いため,正しく収束していることを

確認するのは極めて重要である.収束しない場合にどのような対策が考えられるか,については 9章のMMRM

の解説の際に述べる.

ようやく,パラメータの推定値に入る.25

Page 174: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

共分散パラメータ推定値

共分散パラメータ サブジェクト 推定値

Intercept PATNO(DRUG) 11.7316

Residual 13.8325

まず,変量効果,誤差の分布として,bi ∼ N(0, ν2), ϵi ∼ N(0, σ2I3)を仮定している.ここで,

ν2 = 11.7316, σ2 = 13.8325

である.これより,Yi の分散共分散行列は

V [Yi] =

ν2 + σ2 ν2 ν2

ν2 ν2 + σ2 ν2

ν2 ν2 ν2 + σ2

=

25.5641 11.7316 11.7316

11.7316 25.5641 11.7316

11.7316 11.7316 25.5641

となる26.従って,時点間相関は

Corr[Yij , Yik] =ν2√

ν2 + σ2√ν2 + σ2

=11.7316√

25.5641√25.5641

; 0.4589 (j = k)

となる.

次は,モデルの適合度統計量である.複数の候補モデルの検討・共変量の選択等が必要な場合に有用なもの

であるが,本報告書では真のモデルの探索には深入りしないため,「複数のモデルを比較する基準であり,概ね

小さい数値がよいモデルであることを示すことが多い」ということを述べるに留める.

適合度統計量

-2残差対数尤度 304.2

AIC (小さいほどよい) 308.2

AICC (小さいほどよい) 308.5

BIC (小さいほどよい) 310.2

固定効果の出力は以下の通りである.

固定効果の解

効果 投与群 推定値 標準誤差 自由度 t値 Pr > |t|

Intercept 20.4135 1.8280 18 11.17 <.0001

DRUG プラセボ群 3.7349 1.8512 18 2.02 0.0588

DRUG 実薬群 0 . . . .

TIME −6.1296 0.6757 32 −9.07 <.0001

26V [Yi] に がついているのは,V [Yi] の推定値を示しているからである.以下,Corr や SE なども同様.

26

Page 175: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

これより,

β =

µ

β1

β2

γ

=

20.4135

3.7349

0

−6.1296

となる.なお,Containmentによる自由度はそれぞれ µ : 18, β1 : 18, γ : 32である.これを用いて,モデルベー

ストな標準誤差はそれぞれ

SE[µ] = 1.8280, SE[β1] = 1.8512, SE[γ] = 0.6757

である.

最後に,固定効果の Type 3検定の結果である.

固定効果の Type 3検定

効果 分子の自由度 分母の自由度 F値 Pr > F

DRUG 1 18 4.07 0.0588

TIME 1 32 82.30 <.0001

となり,薬剤の影響に対する検定の検定統計量は

F =

(β1

SE[β1]

)2

=

(3.7349

1.8512

)2

; 4.07

であり,両側 p値は 0.0588となり,有意水準両側 5%でぎりぎり有意にはならない.

A.7.3 例 1-2:自由度調整方法を変更

次に,自由度調整の方法を Kenward-Rogerの方法に変更する.プログラムは以下の通りである.

PROC MIXED DATA = D2 ;

   CLASS DRUG PATNO;

  MODEL Y = DRUG TIME / SDDFM = KR ;

   RANDOM INT / SUB = PATNO(DRUG) ;

RUN;

以下,結果は特に重要な部分のみ述べる.収束判定は極めて重要なため,毎回チェックすることとする.

27

Page 176: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 2 304.25255206 0.00018631

2 1 304.23163293 0.00000160

3 1 304.23146203 0.00000000

収束基準は満たされました.

次に,念のため変量効果と誤差の分散共分散パラメータの推定値を見てみる.以下で述べる計算方法を考え

れば当然であるが,例 1-1と全く同じである.

共分散パラメータ推定値

共分散パラメータ サブジェクト 推定値

Intercept PATNO(DRUG) 11.7316

Residual 13.8325

自由度の算出方法を変えた場合に影響を受けるのは固定効果の推定量の分散のため,最も重要なものは固定

効果 β の推定値と標準誤差である27.

固定効果の解

効果 投与群 推定値 標準誤差 自由度 t値 Pr > |t|

Intercept 20.4135 1.8309 44.5 11.15 <.0001

DRUG プラセボ群 3.7349 1.8525 16.9 2.02 0.0600

DRUG 実薬群 0 . . . .

TIME −6.1296 0.6787 32.6 −9.03 <.0001

自由度は µ : 44.5, β1 : 16.9, γ : 32.6となり,例 1の場合と大きく異なっている.結果として,標準誤差は

SE[µ] = 1.8309, SE[β1] = 1.8525, SE[γ] = 0.6787

となり,例 1-1の場合と比べてやや大きくなっている.Containmentによる自由度調整で求めたモデルベースト

な分散は,特に例数が少ない場合に過小評価されている可能性があるため,例 1-1で少し過小評価されており,

本方法の方が妥当な結果であると思われる.

A.7.4 例 1-3:ロバスト分散の使用

次は,自由度はデフォルトの設定に戻し,ロバスト分散を用いた推定をみる.プログラムは以下の通りであ

る.なお,ロバスト分散の説明はやや長くなるため A.8.2節に回す.

27固定効果の点推定値は,例 1-1と同じである.

28

Page 177: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

PROC MIXED DATA = D2EMPIRICAL ;

   CLASS DRUG PATNO;

  MODEL Y = DRUG TIME / S;

   RANDOM INT / SUB = PATNO(DRUG) ;

RUN;

次に,出力は以下の通りである.まずは収束を確認する.

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 2 304.25255206 0.00018631

2 1 304.23163293 0.00000160

3 1 304.23146203 0.00000000

収束基準は満たされました.

これも重要なのは固定効果の推定量の標準誤差のため,固定効果の部分に注目する.

固定効果の解

効果 投与群 推定値 標準誤差 自由度 t値 Pr > |t|

Intercept 20.4135 2.1093 18 9.68 <.0001

DRUG プラセボ群 3.7349 1.7504 18 2.13 0.0469

DRUG 実薬群 0 . . . .

TIME −6.1296 0.7116 32 −8.61 <.0001

自由度は Containmentのため,例 1-1と同じく µ : 18, β1 : 18, γ : 32である.一方,標準誤差は

SE[µ] = 2.1093, SE[β1] = 1.7504, SE[γ] = 0.7116

となる.

A.7.5 例 2の解析プログラムと出力

次に,例 2のモデルでの解析を行う.つまり,切片項のみならず,時点の傾きにも変量効果を考慮する.な

お,以下分散共分散構造を検討の対象とすることが多いため,自由度は Containmentで計算し,分散をロバス

ト分散とする.このとき,プログラムは以下の通りである.

29

Page 178: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

PROC MIXED DATA = D2 EMPIRICAL;

   CLASS DRUG PATNO;

  MODEL Y = DRUG TIME / S ;

   RANDOM INT TIME / SUB = PATNO(DRUG) ;

RUN;

まず収束の確認をする.

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 2 304.23224552 0.00000832

2 1 304.23134943 0.00000000

収束基準は満たされました.

次に,分散共分散パラメータの推定値は以下の通りである.

共分散パラメータ推定値

共分散パラメータ サブジェクト 推定値

Intercept PATNO(DRUG) 11.6953

TIME PATNO(DRUG) 0.01465

Residual 13.8164

いま,モデルは

bi =

bi1

bi2

iid∼ N(0,D), ϵi ∼ N(0, σ2I3)

であり,D =

ν21 0

0 ν22

である.これより,各パラメータの推定値はν21 = 11.6953, ν22 = 0.01465, σ2 = 13.8164

である.これより,

V [Yi] = ZiDZ′i + σ2I3

=

ν21 + t21ν

22 ν21 + t1t2ν

22 ν21 + t1t3ν

22

ν21 + t1t2ν22 ν21 + t22ν

22 ν21 + t2t3ν

22

ν21 + t1t3ν22 ν21 + t2t3ν

22 ν21 + t23ν

22

+ σ2

1 0 0

0 1 0

0 0 1

=

11.6953 + 12 · 0.01465 11.6953 + 1 · 2 · 0.01465 11.6953 + 1 · 3 · 0.01465

11.6953 + 1 · 2 · 0.01465 11.6953 + 22 · 0.01465 11.6953 + 2 · 3 · 0.01465

11.6953 + 1 · 3 · 0.01465 11.6953 + 2 · 3 · 0.01465 11.6953 + 32 · 0.01465

30

Page 179: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

+

13.8164 0 0

0 13.8164 0

0 0 13.8164

=

25.52635 11.72460 11.73925

11.72460 25.57030 11.78320

11.73925 11.78320 25.64355

となる.対角成分の値が微妙に異なっていることから,時点間のデータのばらつきが少しだけ異なっている(ほ

とんど変わらない)ことが分かる.

次に固定効果をみると,

固定効果の解

効果 投与群 推定値 標準誤差 自由度 t値 Pr > |t|

Intercept 20.4173 2.1086 18 9.68 <.0001

DRUG プラセボ群 3.7300 1.7509 18 2.13 0.0472

DRUG 実薬群 0 . . . .

TIME −6.1307 0.7115 19 −8.62 <.0001

より,

β =

µ

β1

β2

γ

=

20.4173

3.7300

0

−6.1307

となる.自由度の算出方法は Containmentのため例 1-1等と同じである.標準誤差は

SE[µ] = 2.1086, SE[β1] = 1.7509, SE[γ] = 0.7115

となる.

A.7.6 例 3の解析プログラムと出力

次に,誤差の分散共分散構造をAR(1)とした場合である.プログラムは以下の通りである.なお,REPEATED

ステートメントにはカテゴリ変数しか指定できない.今回,変数 TIMEは連続変数として指定する必要がある

ため,TIME と全く同じ TIMECLASS変数を作成し,TIMECLASSをカテゴリ変数とする.

PROC MIXED DATA = D2 EMPIRICAL;

   CLASS DRUG PATNOTIMECLASS ;

  MODEL Y = DRUG TIME / S;

   RANDOM INT / SUB = PATNO(DRUG);

   REPEATED TIMECLASS / SUB = PATNO(DRUG) TYPE = AR(1) ;

RUN;

まず,収束を確認する.

31

Page 180: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 2 304.14795232 0.00024208

2 1 304.12259445 0.00000152

3 1 304.12243332 0.00000000

収束基準は満たされました.

次に,分散共分散パラメータをみる.

共分散パラメータ推定値

共分散パラメータ サブジェクト 推定値

Intercept PATNO(DRUG) 10.2559

AR(1) PATNO(DRUG) 0.1326

Residual 15.3901

モデルは,

bi ∼ N(0, ν2), ϵi ∼ N

0, σ2

1 ρ ρ2

ρ 1 ρ

ρ2 ρ 1

である.これより,推定値は

ν2 = 10.2559, ρ = 0.1326, σ2 = 15.3901

となる.従って,

V [Yi] = ν2

1 1 1

1 1 1

1 1 1

+ σ2

1 ρ ρ2

ρ 1 ρ

ρ2 ρ 1

=

ν2 + σ2 ν2 + σ2 · ρ ν2 + σ2 · ρ2

ν2 + σ2 · ρ ν2 + σ2 ν2 + σ2 · ρ

ν2 + σ2 · ρ2 ν2 + σ2 · ρ ν2 + σ2

=

10.2559 + 15.3901 10.2559 + 15.3901 · 0.1326 10.2559 + 15.3901 · 0.13262

10.2559 + 15.3901 · 0.1326 10.2559 + 15.3901 10.2559 + 15.3901 · 0.1326

10.2559 + 15.3901 · 0.13262 10.2559 + 15.3901 · 0.1326 10.2559 + 15.3901

=

25.6460 12.29663 10.5265

12.29663 25.6460 12.29663

10.5265 12.29663 25.6460

32

Page 181: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.固定効果の推定値は以下の通りである.

固定効果の解

効果 投与群 推定値 標準誤差 自由度 t値 Pr > |t|

Intercept 20.4566 2.1090 18 9.70 <.0001

DRUG プラセボ群 3.6948 1.7519 18 2.11 0.0492

DRUG 実薬群 0 . . . .

TIME −6.1027 0.7144 32 −8.54 <.0001

より,

β =

µ

β1

β2

γ

=

20.4566

3.6948

0

−6.1027

となり,標準誤差は

SE[µ] = 2.1090, SE[β1] = 1.7519, SE[γ] = 0.7144

となる.

A.7.7 例 4の解析プログラムと出力

次に,誤差分散に指数関数の系列相関を用いたモデルを見る.プログラムは以下の通りである.

PROC MIXED DATA = D2 EMPIRICAL;

   CLASS DRUG PATNO TIMECLASS;

  MODEL Y = DRUG TIME / S ;

   RANDOM INT / SUB = PATNO(DRUG);

   REPEATED TIMECLASS / SUB = PATNO(DRUG)TYPE = SP(EXP)(TIME) ;

RUN;

結果は以下の通りである.

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 3 304.52100381 0.00569450

2 2 304.16991962 0.00040220

3 2 304.12355844 0.00001042

4 1 304.12243410 0.00000001

33

Page 182: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

収束基準は満たされました.

分散共分散パラメータの推定値は以下の通りである.

共分散パラメータ推定値

共分散パラメータ サブジェクト 推定値

Intercept PATNO(DRUG) 10.2493

SP(EXP) PATNO(DRUG) 0.4951

Residual 15.3939

モデルは,

bi ∼ N(0, ν2), ϵi ∼ N

0, σ2

1 exp

(−|t1 − t2|

θ

)exp

(−|t1 − t3|

θ

)exp

(−|t1 − t2|

θ

)1 exp

(−|t2 − t3|

θ

)exp

(−|t1 − t3|

θ

)exp

(−|t2 − t3|

θ

)1

である.これより,各推定値は,

ν2 = 10.2493, θ = 0.4951, σ2 = 15.3939

である.したがって,

V [Yi] = ν2

1 1 1

1 1 1

1 1 1

+ σ2

1 exp

(−|t1 − t2|

θ

)exp

(−|t1 − t3|

θ

)exp

(−|t1 − t2|

θ

)1 exp

(−|t2 − t3|

θ

)exp

(−|t1 − t3|

θ

)exp

(−|t2 − t3|

θ

)1

=

ν2 + σ2 ν2 + σ2 · exp

(−|t1 − t2|

θ

)ν2 + σ2 · exp

(−|t1 − t3|

θ

)ν2 + σ2 · exp

(−|t1 − t2|

θ

)ν2 + σ2 ν2 + σ2 · exp

(−|t2 − t3|

θ

)ν2 + σ2 · exp

(−|t1 − t3|

θ

)ν2 + σ2 · exp

(−|t2 − t3|

θ

)ν2 + σ2

=

10.2493 + 15.3939 10.2493 + 15.3939 · exp

(−1

0.4951

)10.2493 + 15.3939 · exp

(−2

0.4951

)10.2493 + 15.3939 · exp

(−1

0.4951

)10.2493 + 15.3939 10.2493 + 15.3939 · exp

(−1

0.4951

)10.2493 + 15.3939 · exp

(−2

0.4951

)10.2493 + 15.3939 · exp

(−1

0.4951

)10.2493 + 15.3939

=

25.6432 12.29181 10.52031

12.29181 25.6432 12.29181

10.52031 12.29181 25.6432

となる.固定効果の推定値は以下の通りである.

34

Page 183: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

固定効果の解

効果 投与群 推定値 標準誤差 自由度 t値 Pr > |t|

Intercept 20.4565 2.1091 18 9.70 <.0001

DRUG プラセボ群 3.6948 1.7519 18 2.11 0.0492

DRUG 実薬群 0 . . . .

time −6.1026 0.7144 32 −8.54 <.0001

より

β =

µ

β1

β2

γ

=

20.4565

3.6948

0

−6.1026

となり,標準誤差は

SE[µ] = 2.1091, SE[β1] = 1.7519, SE[γ] = 0.7144

となる.

A.7.8 例 5の解析プログラムと出力

最後に,変量効果を入れず,誤差の分散共分散構造を CSとした場合である.プログラムは以下の通りであ

る.

PROC MIXED DATA = D2 EMPIRICAL;

   CLASS DRUG PATNO TIMECLASS;

  MODEL Y = DRUG TIME / S;

   REPEATED TIMECLASS / SUB = PATNO(DRUG)TYPE = CS;

RUN;

出力は以下の通りである.

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 2 304.25255206 0.00018631

2 1 304.23163293 0.00000160

3 1 304.23146203 0.00000000

収束基準は満たされました.

35

Page 184: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

分散共分散パラメータは以下の通りである.

共分散パラメータ推定値

共分散パラメータ サブジェクト 推定値

CS PATNO(DRUG) 11.7316

Residual 13.8325

モデルは

ϵi ∼ N

0,

ν2 + σ2 ν2 ν2

ν2 ν2 + σ2 ν2

ν2 ν2 ν2 + σ2

である.これより,推定値は

ν2 = 11.7316, σ2 = 13.8325

また,固定効果の推定値の出力は,

固定効果の解

効果 投与群 推定値 標準誤差 自由度 t値 Pr > |t|

Intercept 20.4135 2.1093 18 9.68 <.0001

DRUG プラセボ群 3.7349 1.7504 18 2.13 0.0469

DRUG 実薬群 0 . . . .

TIME −6.1296 0.7116 32 −8.61 <.0001

より,

β =

µ

β1

β2

γ

=

20.4135

3.7349

0

−6.1296

であり,標準誤差は

SE[µ] = 2.1093, SE[β1] = 1.7504, SE[γ] = 0.7116

となり,例 1-3と全く同じである.このように,固定効果の推定値だけ見た場合,「変量効果を指定した場合」

と,「変量効果を指定せず,誤差に周辺モデルの分散共分散構造を指定した場合」は,周辺分布が同じであれば

区別はつかない.

A.7.9 例 1の残差プロットのプログラム

次に,残差プロットについて検討する.プログラムは以下の通り,Modelステートメントに Residualと記載

すればよい.

36

Page 185: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

PROC MIXED DATA = D2 ;

  CLASS DRUG PATNO;

 MODEL Y = DRUG TIME / SRESIDUAL ;

  RANDOM INT / SUB = PATNO(DRUG) ;

RUN;

プロットは,図 A.10ですでに示している通りである.

A.7.10 影響診断のプログラム

以下,影響診断のプログラムを示す.

PROC MIXED DATA = D2 ;

  CLASS DRUG PATNO;

 MODEL Y = DRUG TIME / S INFLUENCE (EFFECT = PATNO(DRUG) ITER = 5) ;

  RANDOM INT / SUB = PATNO(DRUG) ;

RUN;

パラメータ β の影響診断では,被験者を 1例ずつ除外して β(i) を全症例分計算しなければならない.そのた

め,計算量が膨大になってしまう可能性がある.この点を制御するのが iterオプションである.これは,症例 i

ごとに β(i)の計算をする際の,繰り返し回数の上限である.つまり,iter = 5の場合,収束基準を満たすか,5

回繰り返し計算をした場合に計算を終了する.なお,初期値は全データを用いた βである.

プロットは,図 A.11ですでに示している通りである.

A.7.11 計算が収束しない場合の例

最後に,計算が収束しない場合の典型例について述べる.特に,パラメータの数が過剰で,推定しきれない

場合について述べる.例 1で,誤差の相関構造を CS(つまり,例 5と同じ)とした場合である.このとき,

biiid∼ N(0, ν2), ϵi

iid∼ N

0

0

0

,

σ2 + η2 η2 η2

η2 σ2 + η2 η2

η2 η2 σ2 + η2

となるため,Yi の分散は

V [Yi] = 13V [bi]1′3 + V [ϵi]

= ν2

1 1 1

1 1 1

1 1 1

+

σ2 + η2 η2 η2

η2 σ2 + η2 η2

η2 η2 σ2 + η2

=

σ2 + (ν2 + η2) (ν2 + η2) (ν2 + η2)

(ν2 + η2) σ2 + (ν2 + η2) (ν2 + η2)

(ν2 + η2) (ν2 + η2) σ2 + (ν2 + η2)

となる.このように,ν2と η2は「常に (ν2 + η2)の形で出てくる」「これ以上の制約条件がない」ため,たと

えば仮に,ν2 + η2 = 3となったとして,それから先「ν2をいくつにして,η2をいくつにするべきか」を決定

することが不可能となる.そのような際,たとえば「ν2 = 0とおく」のようなルールを決めておけば,η2 の37

Page 186: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

値は推定できるが,SASの PROC MIXEDではそのようなルールは存在しない.結果として「計算が収束しな

い」「形式上収束したようになるが,明らかに変な値を返す」ということが起こる.このようになる例を確認

していく.プログラムは以下の通りである.

PROC MIXED DATA = D2 EMPIRICAL;

  CLASS TIMECLASS DRUG PATNO;

 MODEL Y = DRUG TIME / S;

  RANDOM INT /SUB = PATNO(DRUG) ;

  REPEATED TIMECLASS / SUB = PATNO(DRUG)TYPE = CS;

RUN;

収束判定の部分は以下のように出力される.

反復履歴

反復 評価 -2残差対数尤度 基準

0 1 311.37481227

1 2 304.26238430 0.00469096

2 1 304.23186699 0.00005330

3 1 304.23146210 0.00000001

4 1 304.23146201 0.00000000

収束基準が満たされましたが,最終 Hessian行列は正定値ではありません.

なお,線形モデルの固定効果の場合も,パラメータの数が過剰で推定しきれない場合は極めて普通に起こる.

たとえば,2群の場合で

yij = µ+ αi + ϵij (i = 1, 2, j = 1, · · · , ni)

とおく場合も,パラメータ数が過剰で一意的な推定はできない.そこで,SASでは,最後の群のパラメータを

0にする制約条件をつけるのと同等となるような一般化逆行列を用いて計算を行い,その結果を出力する28.そ

の際,「暗黙の約束」として,「群のパラメータ β1, β2自身の値には単独では意味がなく,µや γtiらと合わせた

値のみに意味がある」という風に考える.

一方で,変量効果の分布のパラメータの場合は,「計算結果が変」という結果を返すのである.

A.8 欠測のあるデータに対するモデリングの考え方

これまで見てきたように,線形混合モデルでは平均パラメータのモデリング,変量効果の分散共分散構造の

モデリング,誤差の分散共分散構造のモデリング,等,解析者が特定しなければならないものが数多く存在し,

正しいモデルを特定するのは大変難しい.さらに,本報告書の主題である欠測データが存在する場合,検証で

きない仮定も出てきてしまうため,「正しくモデリングできていることを確認する」ことすらできなくなること

が多い.そのため,「完全に正しいモデリングをする」ことは現実的には不可能であろう29.そこで,特に今後28これまでの例で,第 2群の推定値が β2 = 0 となっていたのはこのためである.29「変数選択をすればよいではないか」と思うかもしれないが,「そもそも応答変数に影響を与える全ての因子のデータが取れているか」

「誤差の分布が正確に正規分布か」等を考え始めると,特別な場合を除いて,「完全に正しいモデリングができる」確率はほぼ 0であろう.特に,分散共分散構造の「厳密な特定」は,一般的な系列相関を視野に入れる場合,極めて難しい.そして,分散共分散構造が異なると,固定効果の推定値も少しずつ異なってくることは,先に示した数値例からも分かる.

38

Page 187: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

欠測のあるデータのモデリングを考える際,本報告書では Box and Draper (1976)の "Esentially, all models are

wrong, but some are useful"という言葉に従い,視点を「『正しい』モデル」から「『役に立つ』モデル」へと移

行させる.今回の状況で「役に立つ」モデルとは,たとえば「比較的誤特定が起こりにくい柔軟なモデル」で

あるとする.それに合わせて,推定方法も「仮に誤特定したとしても,漸近的な性質等が保障されやすい推定

方法」を検討することは意味があるであろう.

本報告書の主題である欠測のあるデータの解析の際,「検証不可能な仮定」をした上で,十分な性能を持つ推

定量が得られるようなモデルが数多く存在する.そのため,「モデリングが間違っていれば結論に全く意味がな

い」という考え方では,結論の妥当性自体が評価できないことが多い.そこで,仮に「計画された時点での群

間差の妥当な推定値(と検定統計量)が得たい」ということに目的を限定するなら,「モデルは少しくらい間違

えていても,結果が頑健ならば問題ない」という立場をとることも可能となるであろう.このように,本報告

書では,「モデルが正しいかどうか」ではなく,「推測したい対象に対して,どの程度安定した推定値が得られて

いるか」に注目することも多い.そのために,「色々仮定を変えた状況で推測を行い,結果がどのくらい変動す

るかをみる」ことをする.そのような解析は「感度分析 (sensitivity analysis)」と呼ばれる解析に含まれる30.

以下,MMRM についても少し検討する.MMRM は,これまでよく用いられてきた LOCF ANCOVAと同様,

応答変数が連続量である場合に,非常に多種多様なデータに対して用いられることが想定されている.「幅広い

データに対して,同じモデルを用いることができる」ということが魅力の一つである.しかし,「幅広いデータ

に対して用いることができる」ということは,裏を返せば「特定のデータの構造を利用していない」というこ

とでもある.

つまり,あまり詳細なモデルを目指すのではなく,「どのデータに対しても詳細にモデリングできるわけでは

ないが,どのデータに対しても外れが少ない」モデルを目指している,と考えられる.具体的には,周辺分布

の相関構造を無構造(unstructured)としている.各時点間の相関構造に制約を入れないため,多くのデータに

対して「大きく外れる」ことはない31.また,本報告書の対象は第 III 相試験であり,ある程度以上の例数が確

保されていることを前提としているため,「パラメータ数が多すぎることが原因で,漸近的な推論の妥当性に疑

問が生じる」ことはないと想定している32.

一方で,疾患や薬剤の情報が十分にある場合など,より正確なモデリングが可能であると考えられる場合に

は,モデル化を進め,真の構造の特定を目指すことも重要である.

A.8.1 自由度の算出方法

固定効果の分散の推定の際に,自由度の計算方法がいくつか考えられ,その指定によって固定効果の推定量

の標準誤差が変わってしまう.そのため,特に例数がそれほど大きくない場合,自由度算出方法を適切に指定

することは重要である.しかし,自由度の理論は複雑になるため本報告書では述べない.SASの PROC MIXED

でのデフォルトの指定と,よく用いられる方法についてのみ記載する.

まず,RANDOMステートメントを指定した場合,デフォルトは Containmentである.次に,REPEATEDス

テートメントがあり,RANDOMステートメントがない場合,デフォルトは Between-withinである.しかし,

通常はデフォルトではなく,Satterthwaite,もしくは Kenward-Rogerの方法がよく用いられている.

特に,RANDOMステートメントがなく,REPEATEDステートメントがあり,Type = UNの場合,SASのヘ

ルプでは Kenward-Rogerの方法が推奨されている.

自由度とは,分散パラメータの推定量が近似的に従う χ2 分布の自由度のことである.詳細については本報

告書では立ち入らず,自由度調整をする場合,近年よく用いられている Kenward-Rogerの方法を用いる.なお,

SAS/STAT 14.1からは KenwardRoger2という修正版の自由度算出方法も使用可能となったようである.

30感度分析という言葉をどのような意味で用いるか,も文献によって異なるため,注意が必要である.31欠測の影響は考慮していない.32例数が少ない第 II 相試験などでは,この点に対する検討が必要となる可能性がある.

39

Page 188: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

A.8.2 ロバスト分散

上記のように,線形混合モデルでは,モデルが「完全に正しい」確率は低いと考えることが多い.その場合

に,「仮に間違っていても,大きな影響のないように」という風に考えらえた方法の 1つが,ロバスト分散であ

る.ロバスト分散とは,固定効果 βの推定量 βの分散の推定の際に用いられる推定量であり,大きな特徴は以

下の通りである.

• 平均構造のモデリングが正しければ,分散共分散構造の指定が間違っていても,分散共分散パラメータが真値の場合に,分散の不偏推定量が得られる.

式は以下の通りである.まずは通常の分散(モデル分散)は

Vm[β] = (X′V −1X)−1

である.次にロバスト分散は

Vr[β] = (X′V (α)−1X)−1

(n∑i=1

XiV−1i (Yi −Xiβ)(Yi −Xiβ)

′V −1i Xi

)(X′V (α)−1X)−1

である.SASの PROC MIXEDでは,PROC MIXEDステートメントで,EMPIRICALと指定すればよい.

なお,SAS Ver 9.3では,ロバスト分散を用いた場合,Satterthwaiteの方法や Kenward-Rogerの方法を用いた

自由度調整はできないため,どちらを使用するか決定しなければならない.どちらを主に使用するにせよ,も

う一方の結果も出力し,結果の安定性をみることは重要であろう.

A.9 推定方法:最尤法と制限付き最尤法

以下,推定方法について検討するが,その前に推定したい対象を整理する.モデルは

Yi = Xiβ + Zibi + ϵi (bi ∼ N(0,D), ϵi ∼ N(0,Σ))

である.まずは固定効果 βである.我々の最も興味のある「薬剤の影響」は通常ここに含まれる.次に,分散

共分散行列であるが,変量効果の分散共分散行列を D,誤差の分散共分散行列を Σとおくとき,例えば例 2

では

D =

ν21 0

0 ν22

, Σ = σ2

1 0 0

0 1 0

0 0 1

であり,現れるパラメータは (ν21 , ν

22 , σ

2)の 3つである.また,例 3では

D =(ν2), Σ = σ2

1 ρ ρ2

ρ 1 ρ

ρ2 ρ 1

であり,現れるパラメータは (ν2, σ2, ρ)の 3つである.このように,「変量効果の分散共分散行列のパラメータ」

と「誤差の分散共分散行列のパラメータ」を合わせたベクトルを,分散共分散パラメータベクトルと呼び,α

で表す.固定効果は,ベクトル β自体が推定対象のパラメータ全体であったが,変量効果・誤差の分散共分散

行列D,Σ中にはパラメータの重複等があるため,D,Σを推定対象とするのではなく,パラメータだけを取り

出したαを推定対象とするのである.この記号使いは,αで微分する場合に特に重要である.つまり,固定効

果ベクトル βで尤度関数を微分することはあるが,行列D,Σで微分することはない.代わりに,分散共分散

40

Page 189: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

パラメータベクトルαで微分するのである.ただし,微分する際以外は,大きな混乱はないものと思われるた

め,Σ,Dでパラメータを表すこともある33.

さて,線形混合モデルの基本的な推定方法は,最尤法 (ML) と制限付き最尤法 (REML)の大きく分けて 2つ

である.以下,この 2つについて解説する.

A.9.1 尤度関数の構成と最尤法

通常用いる方法は,最尤法 (ML) と制限付き最尤法 (REML)である.そのため,まず尤度関数について考える.

被験者 i (i = 1, · · · , N)のデータを

Yi = Xiβ + Zibi + ϵi

とし,測定時点は ni 時点とする34.ここで,

biiid∼ N(0,D), ϵi

iid∼ N (0,Σi)

であり,bi と ϵi が独立であることを仮定する.ここで,固定効果 βの推定には周辺分布

Yiiid∼ N(Xiβ,ZiDZ′

i +Σi)

を用いる.このとき,被験者 iの周辺尤度関数は多変量正規分布の密度関数を用いて,

f(Yi|β,α) =1√

(2π)ni |ZiDZ′i +Σi|

exp

(−1

2(Yi −Xiβ)

′(ZiDZ′i +Σi)

−1(Yi −Xiβ)

)(A.6)

と表せる.さらに,異なる被験者のデータは独立であると仮定するので,全被験者のデータを用いた尤度関数は

L(β,α) =N∏i=1

f(Yi |β,α)

となり,対数尤度関数は

l(β,α) =

N∑i=1

log f(Yi |β,α)

となる.この関数を最大化すれば,パラメータβ,αの最尤推定値が得られる.最大化には,Newton-Raphson法,

Fisher’s Scoring法などの数値計算法が用いられる.SASの PROC MIXEDでは,デフォルトは ridge-stabilized

Newton-Raphsonアルゴリズムであり,Fisher’s scoring法も PROC MIXEDステートメントの scoringオプショ

ンで指定できる.本報告書では,数値計算の詳細にはこれ以上触れない.

以上,天下りに尤度関数の導出を解説したが,以下の節でどうして周辺分布を用いるのかについて解説する.

理論の詳細に興味のない読者は飛ばしても差し支えないが,欠測データは変量効果と同じく「未知の確率変数」

と扱われることが多いため,あまり詳しくない読者は引き続き読まれることをお勧めする35.

A.9.2 尤度関数の導出

被験者 iの,変量効果 bi で条件づけたもとでの,Yi の条件付き分布を用いた同時密度関数(条件付き分

布)は

f(Yi |β,bi,Σi) =1√

(2π)ni |Σi|exp

(−1

2(Yi −Xiβ − Zibi)

′Σ−1i (Yi −Xiβ − Zibi)

)(A.7)

となる.ここで,この関数内の文字(ベクトル)を分類すると,33特に,変量効果の分散共分散パラメータと誤差の分散共分散パラメータを別々に扱いたい場合は,Σ,Dでパラメータを表すことにす

る.α = (α1,α2) などと分けることも考えられるが,記号が増えすぎて煩雑となるため,本報告書では採用しない.34最初にも述べたが,中止した被験者に対しては中止までのデータを用いるため,測定時点数 ni は被験者ごとに異なってよいようにし

ている.35本文 9.2節も参照のこと.

41

Page 190: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

• データ(既知):Yi,Xi,Zi

• パラメータ(推定対象.未知):β,α• その他(確率変数.未知):bi

となる.なお,以下,簡単のため,Vi,X′iViXiは(Viに適切な推定値を代入した場合もすべて含めて)逆行

列が存在する場合を考える36.

ここで,biは未知の確率変数である.biが確率変数であることにより,被験者内の時点間相関を表現するこ

とができる.そして,相関の強さは bi の従う分布 N(0,D)のパラメータに依存している.これは固定効果と

変量効果の極めて大きな違いである.そのため,bi を固定効果 βと同じように扱うことは通常は行わない37.

いま,興味があるのは biの従う分布のパラメータ(つまり,D中のパラメータ)であるため,biを消してD

が出てくるようにする.具体的には,bi の分布で積分するのである.まずは形式的に

f(Yi |β,bi,Σi) : Yiの従う条件付き分布

f(bi |D) : biの従う分布

から,確率変数 bi を積分消去 (integrate out)すればよいのである.つまり,

f(Yi |β,α) =∫f(Yi |β,bi,Σi) · f(bi |D)dbi (A.8)

を用いればよい.これにより,変量効果 bi が消えるとともに,データの時点間相関に関わる Dが出てくる.

このとき,

f(Yi |β,α)

が周辺分布である.なお,ここで (A.8)の積分計算を実行すれば

f(Yi |β,α) =1√

(2π)ni |ZiDZ′i +Σi|

exp

(−1

2(Yi −Xiβ)

′ (ZiDZ′i +Σi)

−1(Yi −Xiβ)

)が得られる38.ここで,簡単のため

Vi = ZiDZ′i +Σi

とおく.なお,Vi は αに依存するので,Vi(α)と書くこともある.

これより,対数尤度関数は

ℓ(α,β) = −N∑i=1

1

2log((2π)ni |Vi|

)+

1

2(Yi −Xiβ)

′V−1i (Yi −Xiβ)

(A.9)

となる.これより,βの最尤推定量は

β =N∑i=1

(X′iV

−1i Xi

)−1

X′iV

−1i Yi

で得られる.なお,βは分散Viの推定量に依存している.つまり,βは分散パラメータ αに依存する.した

がって,αの推定ができなければ,βの最尤推定量も求まらない.最尤法の場合,βを (A.9)に代入して,

ℓML(α) = −N∑i=1

1

2log((2π)3|Vi|

)+

1

2(Yi −Xiβ)

′V−1i (Yi −Xiβ)

を最大化すれば,αの最尤推定値が求まる.

36存在しない場合は,一般化逆行列を考える.37Lee and Nelder (1996)などでは,変量効果を固定効果と同じように扱い「推定」する考え方も提唱されているため,「決して同じよう

な推定をしない」というわけではない.しかし,本報告書ではこれらには深入りせず,標準的な考え方を示す.38積分計算の詳細は省略する.

42

Page 191: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

A.9.3 制限付き最尤 (REML) 法

次に,制限付き最尤法について考える.最尤 (ML) 法と制限付き最尤 (REML)法の違いは,分散共分散パラ

メータ αの推定方法である.ただし,上で述べた通り,β の最尤推定量も αに依存するため,ML と REML

で,βの推定値も変わってくる.

まずはよく知られた具体例から述べる.独立に正規分布N(µ, σ2)に従うデータ x1, · · · , xN が与えられたとき,µ, σ2 の最尤推定量は

µ =1

N

N∑i=1

xi, σ2 =1

N

N∑i=1

(xi − µ)2

となる.このとき,分散の最尤推定量はE[σ2] =N − 1

Nσ2となり,不偏推定量とはならない.そのため,通常

は不偏推定量である

σ2 =1

N − 1

N∑i=1

(xi − µ)2

を用いて推測を行う.この σ2 が,制限付き最尤 (REML) 推定量の最も簡単な例である.この場合,分母の

(N − 1)を「なんとなく (N − 1)で割る」,「E[σ2]を計算して,帳尻を合わせるために (N − 1)で割る」と考え

ることもできるが,線形混合モデルにも適用できるよう,より一般的な導出を考える.

基本的な考え方は,「データを 1次変換して,『分散共分散パラメータ推定用データ』を(実質的に)減らす」

ことである.

詳細はやや煩雑な計算が必要となるが,もう少しだけ詳しく説明する.全データ数を N とし,rank(X) = p

とする.このとき,Xの行数は N と仮定すると,Xの全ての列ベクトルと直交するような N 次元ベクトルが

(N − p)個取れる.このベクトルを a1, · · · ,aN−pとおき,これらを並べた N × (N − p)行列をAとおく39.つ

まり,

A =(a1, · · · ,aN−p

)とおく.このとき,データベクトルYに行列A′ をかけたベクトルを

W = A′Y

とおくと,N =N∑i=1

ni とおいたときに,Wは (N − p)次元正規分布に従うベクトルであり,平均・分散は

E[W] = E[A′Y] = A′E[Y] = A′Xβ = 0

(∵ A′の各行とXの各列は直交する)

V [W] = V [A′Y] = A′V [Y]A = A′VA

となる.これより,Wをデータと考えると,平均は 0のため推定する必要がなく,分散パラメータ αのみ推

定すればよい.このように,Wを用いて αの最尤法を行う方法が REML法である.

このとき,REML法で用いる対数尤度関数は以下の通りとなる.rank(X) = p,dim(Yi) = ni, N =N∑i=1

ni と

おくと,

ℓREML(α) =− N − p

2log(2π) +

1

2log

∣∣∣∣∣N∑i=1

XiX′i

∣∣∣∣∣− 1

2log

∣∣∣∣∣N∑i=1

XiV−1i X′

i

∣∣∣∣∣− 1

2

N∑i=1

log |Vi|

− 1

2

N∑i=1

(Yi −Xiβ

)′V−1i

(Yi −Xiβ

)39A は X が分かれば計算できる行列である.つまり,未知パラメータを含まない.

43

Page 192: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.ML 法の場合の対数尤度関数と比較すると,

ℓREML(α) = −1

2log

∣∣∣∣∣N∑i=1

XiV−1i Xi

∣∣∣∣∣+ ℓML(α) + C (C はα,βに依存しない定数)

という関係が成り立つ.

A.9.4 最尤法と制限付き最尤法の比較・まとめ

• αの推定方法が異なる.• βの推定に分散パラメータ αの値を使用しているため,βの推定値も変わる.

• SAS PROC MIXEDのデフォルトは REML.

• 尤度関数同士の関係が,

ℓREML(α) = −1

2log

∣∣∣∣∣N∑i=1

XiV−1i Xi

∣∣∣∣∣+ ℓML(α) + C (C はα,βに依存しない定数)

と表せる.

A.9.5 変量効果の予測

先に,変量効果 biはデータの時点間相関を与えたり,分散を減少させる要因のため,主な関心は bi自体で

はなく,bi の従う分布のパラメータDであることが多い,と述べた.しかし,「個別の bi の値にも興味があ

る」という場合もある.そのため,パラメータ β,αを推定した後で,biの値に対する推測をすることがある.

なお,先にも述べたとおり「推定」という言葉は固定効果(定数)に対して用いられる言葉であり,変量効果

に対しては「予測(prediction)」という言葉を用いることが多い.また,推定量 (estimatior)・推定値 (estimated

value)に対応する言葉はそれぞれ予測量 (predictor)・予測値 (predicted value)である.

予測量としては,EBLUP(Empirical Best Linear Unbiased Predictor)を考える.求めるものは条件付き期待値

b = E[b|Y]

に,パラメータの推定値を代入したもの(bとおく)である.なお,計算方法としては,条件付き期待値を計

算する代わりに,Mixed Model Equation X′Σ−1X X′Σ−1Z

Z′Σ−1X Z′Σ−1Z+D

β

b

=

X′V−1Y

Z′V−1Y

を解くことでも求まる.bのみ記載すると,

b = DZ′V−1(Y −Xβ)

となる.プログラムは以下の通りである.

PROC MIXED DATA = D2 ;

   CLASS DRUG PATNO;

  MODEL Y = DRUG TIME / S ;

   RANDOM INT / SUB = PATNO(DRUG)S;

RUN;

出力(変量効果の部分のみ)は以下の通りである.

44

Page 193: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

変量効果の解

効果 投与群 PATNO 推定値 予測値の標準誤差 自由度 t値 Pr > |t|

Intercept プラセボ群 1 3.1286 2.0544 32 1.52 0.1376

Intercept プラセボ群 2 3.0946 2.0544 32 1.51 0.1418

Intercept プラセボ群 3 −0.06669 2.0544 32 −0.03 0.9743

Intercept プラセボ群 4 −1.1690 2.2480 32 −0.52 0.6066

Intercept プラセボ群 5 −0.7702 2.0544 32 −0.37 0.7102

Intercept プラセボ群 6 −2.9946 2.2480 32 −1.33 0.1922

Intercept プラセボ群 7 −2.3944 2.2480 32 −1.07 0.2948

Intercept プラセボ群 8 −0.5445 2.0544 32 −0.27 0.7927

Intercept プラセボ群 9 1.4880 2.2480 32 0.66 0.5128

Intercept プラセボ群 10 0.2280 2.2480 32 0.10 0.9198

Intercept 実薬群 1 −1.8138 2.0434 32 −0.89 0.3814

Intercept 実薬群 2 −1.3644 2.0434 32 −0.67 0.5091

Intercept 実薬群 3 −0.9974 2.0434 32 −0.49 0.6288

Intercept 実薬群 4 −0.9353 2.0434 32 −0.46 0.6502

Intercept 実薬群 5 1.7064 2.0434 32 0.84 0.4099

Intercept 実薬群 6 −7.3572 2.2460 32 −3.28 0.0025

Intercept 実薬群 7 0.1979 2.0434 32 0.10 0.9235

Intercept 実薬群 8 3.2250 2.0434 32 1.58 0.1243

Intercept 実薬群 9 5.2110 2.0434 32 2.55 0.0158

Intercept 実薬群 10 2.1278 2.2460 32 0.95 0.3506

A.10 この分野をさらに学習するために

線形混合モデルに対して,まず,日本語で読める参考文献をいくつか挙げる.SASの使い方に詳しいものと

して,松山ら (2001)がある.数理的な面を強調したものとしては,経時データ全般を扱ったものとして藤越

(2009)が,線形モデル・線形混合モデル・一般化線形モデル・一般化線形混合モデルまで幅広く扱ったものと

して土居ら (2011)がある.

次に洋書では,まず Verbeke and Molenberghs (2000)が挙げられる.本書は,本章で扱った線形混合モデルの

みならず,正規分布に従う,欠測のあるデータの解析に対しても非常に詳細に検討してある.また,Molenberghs

氏のWebページでは,本書で解析した実例の一部のデータ・SASマクロも公開されている.

SASの使い方を詳細に説明した本としては Little et al. (2006)が挙げられる.

参考文献

[1] Box,G.E.P. and Draper,N.R. (1987).Empirical Model-Building and Response Surfaces. Wiley.

[2] Cook, R. D. (1977), Detection of Influential Observations in Linear Regression,Technometrics, 19, 15―18.

45

Page 194: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

[3] 藤越康祝. (2009).経時データ解析の数理.朝倉書店.

[4] Liang, K. Y.,& Zeger, S. L. (2000). Longitudinal data analysis of continuous and discrete responses for pre-post

designs.Sankhya: The Indian Journal of Statistics, Series B, 134-148.

[5] McCulloch, C. E., Searle, S. R. and Neuhaus, J. M. (2008). Generalized, Linear, and Mixed Models (2nd Ed.),

Wiley (土居正明,横道洋司,青山淑子,五百路徹也,中村竜児,吉田和生,白岩健,松下勲,西山毅,井

上永介,上原秀昭,山口亨,酒井美良訳. (2011).『線形モデルとその拡張』CAC).

[6] Little, R, C, Milliken, G, A, Stroup, Wolfinger, R, D, and Schabenberber, O. (2006).SAS for Mixed Models. SAS

Institute.

[7] Verbeke, G, and Molenberghs, G. (1997).Linear Mixed Models in Practice: A SAS-oriented approach. Springer.

(松山裕,山口拓洋編訳 (2001)医学統計のための線形混合モデル-SASによるアプローチ-.サイエンティス

ト社.)

[8] Verbeke, G, and Molenberghs, G. (2000).Linear Mixed models for longitudinal data. Springer.

46

Page 195: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Appendix B 理論の詳細

B.1 はじめに

本章では,本報告書本文で省略した各章の理論の詳細について述べる.具体的には

• 2章

• 欠測メカニズムの関数形の具体例が,それぞれMCAR,MAR,MNARとなっていることの確認

• 5章

• MNAR を仮定した SMの積分計算

• 6章

• (i) 「NFMV かつ ACMV 」が ACMV となることの証明

• (ii) ACMV が MAR と同値であることの証明

• (iii) NFMV が NFDと同値であることの証明

を扱う.

B.2 【2章】欠測メカニズムの具体例の詳細

B.2.1 欠測メカニズムの復習

まず,Little and Rubin (2002)のMCAR,MAR,MNAR の定義を復習する.

(MCAR) : f(Ri |Yi,ψ) = f(Ri |ψ)

(MAR) : f(Ri |Yi,ψ) = f(Ri |Yoi ,ψ)

(MNAR) : f(Ri |Yi,ψ) = f(Ri |Yoi ,ψ)

(B.1)

以下,2章で扱ったMCAR・MAR・MNARの欠測確率を示す関数の例が,それぞれMCAR・MAR・MNARと

なっていることを確認する.

B.2.2 具体例

3時点での測定を計画している試験を考える.被験者 iの時点 j の応答変数を Yij とおき,被験者ごとにま

とめてYi = (Yi1, Yi2, Yi3)′とおく.また,被験者ごとの欠測識別変数をまとめてRi = (Ri1, Ri2, Ri3)

′とおく.

なお,Rij = 1:観測,Rij = 0:欠測,である.

B.2.2.1 MCARの具体例

最初に 2章でみたMCARの例を考える1.単調な欠測であり,ベースラインは必ず観測され,その後のデー

タは「1つ前のデータが観測されていれば,次のデータが欠測する確率が 0.1」となるようにする.つまり,

f(Ri1 = 0 |Yi) = 0 (B.2)1以下の例は厳密には Seamanet al. (2013)の everywhere MCARの例である.MAR の例も同様である.これらの概念は本報告書のレ

ベルを超えるため,これ以上は触れない.

47

Page 196: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f(Ri2 = 0 |Yi, Ri1 = 0) = 1

f(Ri2 = 0 |Yi, Ri1 = 1) = 0.1(B.3)

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.1

(B.4)

とおく.被験者 iの時点 j に関して Rij = 0ならば,Ri,j+1 = 0となる確率が 1になる,という部分が単調な

欠測であることを示している.また,同じく単調性をもとに f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 1

f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) = 0(B.5)

とおくこととする.

これらは全て「1時点前までのRijの値で条件づけた条件付き確率」であるのに対し,(B.1)はRi = (Ri1, Ri2, Ri3)

の同時分布であるため,(B.2)∼(B.5)が (B.1)を満たしていることは一見しただけでは分かりにくい2.そこで,

Riの同時分布を算出することで,これがMCARとなっていることを確認していく.まず最初に,(B.2)~(B.5)

の各式から自然に導かれる確率を求めると,

f(Ri1 = 1 |Yi) = 1 f(Ri2 = 1 |Yi, Ri1 = 0) = 0

f(Ri2 = 1 |Yi, Ri1 = 1) = 0.9f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 0) = 0

f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 0) = 0

f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) = 0.9

となる.これをもとにRi = (Ri1, Ri2, Ri3)′の同時分布の全てのとりうる値3に対して,確率を計算する.たと

えば,

f(Ri1 = 1, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1, Ri1 = 1 |Yi)

= f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

= 0.9 · 0.9 · 1 = 0.81

である.同様に他の場合も計算を進めると,

f(Ri1 = 0, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 0 · 0 · 0 = 0

f(Ri1 = 1, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

= 0 · 0.1 · 1 = 0

f(Ri1 = 0, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 0 · 1 · 0 = 0

f(Ri1 = 1, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

2以下,表現が煩雑となるため「Yi で条件付けた分布」であることは前提として,Ri のみに注目した表現とする.3つまり,Ri1 = 0, 1, Ri2 = 0, 1, Ri3 = 0, 1 の 2× 2× 2 = 8 通りである.

48

Page 197: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= 0.1 · 0.9 · 1 = 0.09

f(Ri1 = 0, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 1 · 0 · 0 = 0

f(Ri1 = 1, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

= 1 · 0.1 · 1 = 0.1

f(Ri1 = 0, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 1 · 1 · 0 = 0

となる.以上全ての場合において,欠測識別変数が各値をとる確率について,応答変数Yi の値は影響を与え

ていない.従って,

f(Ri |Yi) = f(Ri)

と表せる.これより,(B.1)からMCARであることが分かる.

B.2.2.2 MARの具体例

次に,MAR の具体例を検討する.単調な欠測と仮定しており,

f(Ri1 = 0 |Yi) = 0 (B.6) f(Ri2 = 0 |Yi, Ri1 = 0) = 1

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.5Yi1

(B.7)

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.5Yi2

(B.8)

である.ここで,

logitf(x) = log

(f(x)

1− f(x)

)⇐⇒ exp (logitf(x)) =

f(x)

1− f(x)

⇐⇒ f(x) =exp(logitf(x))

1 + exp(logitf(x))

である.したがって,(B.7),(B.8)の確率 1でない式を変形すると,それぞれ

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.5Yi1

⇐⇒ f(Ri2 = 0 |Yi1, Ri1 = 1) =exp(0.2 + 0.5Yi1)

1 + exp (0.2 + 0.5Yi1)

と,

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.5Yi2

⇐⇒ f(Ri3 = 0 |Yi1, Ri1 = 1, Ri2 = 1) =exp(0.2 + 0.5Yi2)

1 + exp (0.2 + 0.5Yi2)

となる.これより,(B.6)~(B.8)を書き直すと,

f(Ri1 = 0 |Yi) = 0

49

Page 198: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f(Ri2 = 0 |Yi, Ri1 = 0) = 1

f(Ri2 = 0 |Yi, Ri1 = 1) =exp(0.2 + 0.5Yi1)

1 + exp (0.2 + 0.5Yi1)f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) =exp(0.2 + 0.5Yi2)

1 + exp (0.2 + 0.5Yi2)

となる.さらに,単調性をもとに,

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 1

f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) = 0

を仮定する.これより,以下の式が導かれる.

f(Ri1 = 1 |Yi) = 1f(Ri2 = 1 |Yi, Ri1 = 0) = 0

f(Ri2 = 1 |Yi, Ri1 = 1) =1

1 + exp (0.2 + 0.5Yi1)f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 0) = 0

f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 0) = 0

f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) =1

1 + exp (0.2 + 0.5Yi2)

となる.これをもとに同時分布のすべての場合を計算する.なお,MAR であることの判断に用いるため,Yoi

も記載しておく(ϕは空集合).

f(Ri1 = 1, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=1

1 + exp (0.2 + 0.5Yi2)· 1

1 + exp (0.2 + 0.5Yi1)· 1

=1

1 + exp (0.2 + 0.5Yi2)1 + exp (0.2 + 0.5Yi1)(Yo

i = (Yi1, Yi2, Yi3)′)

f(Ri1 = 0, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 0 · 0 · 0 = 0 (Yoi = (Yi2, Yi3)

′)

f(Ri1 = 1, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

= 0 · exp(0.2 + 0.5Yi1)

1 + exp (0.2 + 0.5Yi1)· 1 = 0 (Yo

i = (Yi1, Yi3))

f(Ri1 = 0, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 0 · 1 · 0 = 0 (Yoi = (Yi3))

f(Ri1 = 1, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=exp(0.2 + 0.5Yi2)

1 + exp (0.2 + 0.5Yi2)· 1

1 + exp (0.2 + 0.5Yi1)· 1

=exp(0.2 + 0.5Yi2)

1 + exp (0.2 + 0.5Yi2)1 + exp (0.2 + 0.5Yi1)(Yo

i = (Yi1, Yi2)′)

f(Ri1 = 0, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 1 · 0 · 0 = 0 (Yoi = (Yi2))

50

Page 199: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f(Ri1 = 1, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

= 1 · exp(0.2 + 0.5Yi1)

1 + exp (0.2 + 0.5Yi1)· 1 =

exp(0.2 + 0.5Yi1)

1 + exp (0.2 + 0.5Yi1)(Yo

i = (Yi1))

f(Ri1 = 0, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 1 · 1 · 0 = 0 (Yoi = ϕ)

となる.以上全ての式で,右辺に現れる Yij は全てYoi に含まれている.したがって,

f(Ri |Yi) = f(Ri |Yo)

と表現できるため,(B.1)からMAR であることが分かる.

B.2.2.3 MNARの具体例 1

次に,2章でみたMNAR の具体例を検討する.1つ目は以下の式で与えられる.

f(Ri1 = 0 |Yi) = 0 (B.9) f(Ri2 = 0 |Yi, Ri1 = 0) = 1

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.1Yi1 + 0.3Yi2

(B.10)

f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.1Yi2 + 0.3Yi3

(B.11)

書き直すと,

f(Ri1 = 0 |Yi) = 0f(Ri2 = 0 |Yi, Ri1 = 0) = 1

f(Ri2 = 0 |Yi, Ri1 = 1) =exp(0.2 + 0.1Yi1 + 0.3Yi2)

1 + exp(0.2 + 0.1Yi1 + 0.3Yi2)f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 1

f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) =exp(0.2 + 0.1Yi2 + 0.3Yi3)

1 + exp(0.2 + 0.1Yi2 + 0.3Yi3)

となる.また,単調性をもとに, f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 1

f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) = 0

を仮定する.これより,

f(Ri1 = 1 |Yi) = 1f(Ri2 = 1 |Yi, Ri1 = 0) = 0

f(Ri2 = 1 |Yi, Ri1 = 1) =1

1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 0) = 0

f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 0) = 0

f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) =1

1 + exp (0.2 + 0.1Yi2 + 0.3Yi3)

51

Page 200: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.これをもとに同時分布のすべての場合を計算する.なお,MNAR であることの判断のため,Yoi も記

載しておく(ϕは空集合)

f(Ri1 = 1, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=1

1 + exp (0.2 + 0.1Yi2 + 0.3Yi3)· 1

1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)· 1

=1

1 + exp (0.2 + 0.1Yi2 + 0.3Yi3)1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)

(Yoi = (Yi1, Yi2, Yi3)

′)

f(Ri1 = 0, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 0 · 0 · 0 = 0 (Yoi = (Yi2, Yi3)

′)

f(Ri1 = 1, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

= 0 · exp(0.2 + 0.1Yi1 + 0.3Yi2)

1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)· 1 = 0 (Yo

i = (Yi1, Yi3))

f(Ri1 = 0, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 0 · 1 · 0 = 0 (Yoi = (Yi3))

f(Ri1 = 1, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=exp(0.2 + 0.1Yi2 + 0.3Yi3)

1 + exp (0.2 + 0.1Yi2 + 0.3Yi3)· 1

1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)· 1

=exp(0.2 + 0.1Yi2 + 0.3Yi3)

1 + exp (0.2 + 0.1Yi2 + 0.3Yi3)1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)(Yo

i = (Yi1, Yi2)′)

f(Ri1 = 0, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 1 · 0 · 0 = 0 (Yoi = (Yi2))

f(Ri1 = 1, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

= 1 · exp(0.2 + 0.1Yi1 + 0.3Yi2)

1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)· 1

=exp(0.2 + 0.1Yi1 + 0.3Yi2)

1 + exp (0.2 + 0.1Yi1 + 0.3Yi2)(Yo

i = (Yi1))

f(Ri1 = 0, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

= 1 · 1 · 0 = 0 (Yoi = ϕ)

となる.たとえば f(Ri1 = 1, Ri2 = 1, Ri3 = 0)の場合など,式の右辺にYoi に含まれない Yij が現れることも

ある.したがって,MNAR である.

B.2.2.4 MNARの具体例 2

最後に,MNARの 2つ目の例を考える.先にみたMARの例から,「単調な欠測」という条件を取り除き,さ

らに以前の Rij の値には全く依存しないようにする.つまり,

f(Ri1 = 0 |Yi) = 0 logitf(Ri2 = 0 |Yi, Ri1 = 0) = 0.2 + 0.5Yi1

logitf(Ri2 = 0 |Yi, Ri1 = 1) = 0.2 + 0.5Yi1

52

Page 201: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

logitf(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) = 0.2 + 0.5Yi2

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) = 0.2 + 0.5Yi2

logitf(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) = 0.2 + 0.5Yi2

logitf(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) = 0.2 + 0.5Yi2

とする.書き直すと,

f(Ri1 = 0 |Yi) = 0

logitf(Ri2 = 0 |Yi, Ri1) = 0.2 + 0.5Yi1

logitf(Ri3 = 0 |Yi, Ri1, Ri2) = 0.2 + 0.5Yi2

⇐⇒

f(Ri1 = 0 |Yi) = 0

f(Ri2 = 0 |Yi, Ri1) =exp(0.2 + 0.5Yi1)

1 + exp(0.2 + 0.5Yi1)

f(Ri3 = 0 |Yi, Ri1, Ri2) =exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)

となる.これより

f(Ri1 = 1 |Yi) = 1

f(Ri2 = 1 |Yi, Ri1) =1

1 + exp(0.2 + 0.5Yi1)

f(Ri3 = 1 |Yi, Ri1, Ri2) =1

1 + exp(0.2 + 0.5Yi2)

となる.同時分布を求めると,

f(Ri1 = 1, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=1

1 + exp(0.2 + 0.5Yi2)· 1

1 + exp(0.2 + 0.5Yi1)· 1

=1

1 + exp(0.2 + 0.5Yi21 + exp(0.2 + 0.5Yi1)(Yo

i = (Yi1, Yi2, Yi3)′)

f(Ri1 = 0, Ri2 = 1, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

=1

1 + exp(0.2 + 0.5Yi2)· 1

1 + exp(0.2 + 0.5Yi1)· 0

= 0 (Yoi = (Yi2, Yi3)

′)

f(Ri1 = 1, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=1

1 + exp(0.2 + 0.5Yi2)· exp(0.2 + 0.5Yi1)

1 + exp(0.2 + 0.5Yi1)· 1

=exp(0.2 + 0.5Yi1)

1 + exp(0.2 + 0.5Yi2)1 + exp(0.2 + 0.5Yi1)(Yo

i = (Yi1, Yi3)′)

f(Ri1 = 0, Ri2 = 0, Ri3 = 1 |Yi) = f(Ri3 = 1 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

=1

1 + exp(0.2 + 0.5Yi2)· exp(0.2 + 0.5Yi1)

1 + exp(0.2 + 0.5Yi1)· 0

= 0 (Yoi = (Yi3))

f(Ri1 = 1, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)· 1

1 + exp(0.2 + 0.5Yi1)· 1

=exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)1 + exp(0.2 + 0.5Yi1)(Yo

i = (Yi1, Yi2)′)

53

Page 202: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f(Ri1 = 0, Ri2 = 1, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 1) · f(Ri2 = 1 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

=exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)· 1

1 + exp(0.2 + 0.5Yi1)· 0

= 0 (Yoi = (Yi2))

f(Ri1 = 1, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 1, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 1) · f(Ri1 = 1 |Yi)

=exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)· exp(0.2 + 0.5Yi1)

1 + exp(0.2 + 0.5Yi1)· 1

=exp(0.2 + 0.5Yi1) · exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)1 + exp(0.2 + 0.5Yi1)(Yo

i = (Yi1))

f(Ri1 = 0, Ri2 = 0, Ri3 = 0 |Yi) = f(Ri3 = 0 |Yi, Ri1 = 0, Ri2 = 0) · f(Ri2 = 0 |Yi, Ri1 = 0) · f(Ri1 = 0 |Yi)

=exp(0.2 + 0.5Yi2)

1 + exp(0.2 + 0.5Yi2)· exp(0.2 + 0.5Yi1)

1 + exp(0.2 + 0.5Yi1)· 0

= 0 (Yoi = ϕ)

となる.これより f(Ri1 = 1, Ri2 = 0, Ri3 = 1, |Yi)など,式の右辺にYoi に含まれない Yij が現れることも

ある.したがって,MNAR である.

B.3 【5章】Selection Modelの補足

次に,5章でみたMNAR の計算の詳細を検討する.

B.3.1 MNARを仮定したモデルの計算の詳細

以下,MNAR を仮定した Selection Modelの積分計算の詳細を述べる.脱落確率のモデルはlogitPr(Rij = 0 |Ri1 = 1, · · · , Ri,j−1 = 1,Yi,Xi,ψ) = ψ1 + ψ2Yi,j−1 + ψ3Yij (j = 2, · · · , n)

Pr(Rij = 0 |Ri,j−1 = 0, Ri,j−2, · · ·Ri1,Yi,Xi,ψ) = 1 (j = 2, · · · , n)

Pr(Ri1 = 1 |Yi,Xi,ψ) = 1

(B.12)

である(真ん中の式の Ri,j−2, · · ·Ri1は任意).なお,このモデルはMNAR一般に対するモデルではなく,あ

くまで一例であることには注意が必要である.脱落確率がその時点のデータと 1時点前のデータのみに依存す

るモデル,つまり 6章で定義した NFD (Non-Future Dependence)の仮定を満すモデルとなっている.

以下,状況によって 3通りの場合分けをする.

B.3.1.1 脱落のない症例 i

観測データの尤度は完全データの尤度と一致する.つまり,Yoi = Yi, Ri1 = Ri2 = · · ·Rin = 1のため,以

下のようになる.

f(Yoi ,Ri |Xi,θ,ψ) = f(Y,Ri |Xi,θ,ψ)

= f(Yi |Xi,θ) · f(Ri |Yi,Xi,ψ)

= f(Yi |Xi,θ) · Pr(Ri1 = 1, · · · , Rin = 1 |Yi,ψ)

= f(Yi |Xi,θ) · Pr(Ri1 = 1 |Xi,Yi,ψ)

54

Page 203: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

× Pr(Ri2 = 1 |Ri1 = 1,Xi,Yi,ψ)

× · · · × Pr(Rin = 1 |Ri1 = · · · = Ri,n−1 = 1,Yi,Xi,ψ) (B.13)

この式に,応答変数の確率密度関数の式 f(Yi |Xi,θ,ψ)と,式 (B.12)を代入し,尤度関数を最大化すること

で,θ,ψが推定できる4.

さらにもう少し具体化を行う.(B.12)の式のうち,脱落確率の部分を書き直すと

Pr(Rij = 0 |Ri1 = · · · = Ri,j−1 = 1,Yi,Xi,ψ) =exp(ψ1 + ψ2Yi,j−1 + ψ3Yij)

1 + exp(ψ1 + ψ2Yi,j−1 + ψ3Yij)

となる.これより,

Pr(Rij = 1 |Ri1 = · · · = Ri,j−1 = 1,Yi,Xi,ψ)

=1− Pr(Rij = 0 |Ri1 = · · · = Ri,j−1 = 1,Yi,Xi,ψ)

=1

1 + exp(ψ1 + ψ2Yi,j−1 + ψ3Yij)

である.

次に,応答変数の分布を多変量正規分布

f(Yi |Xi,θ) =1√

(2π)n |Σ|exp

(−1

2(Yi − µi)′Σ−1(Yi − µi)

)と仮定する5.Yi = Yo

i に注意して,これを (B.13)に代入すると,

f(Yoi ,Ri |Xi,θ,ψ) =

1√(2π)n |Σ|

exp

(−1

2(Yi − µi)′Σ−1(Yi − µi)

)× 1

× 1

1 + exp(ψ1 + ψ2Yi1 + ψ3Yi2)× · · · × 1

1 + exp(ψ1 + ψ2Yi,n−1 + ψ3Yin)

となる.これが被験者 iの尤度である.

B.3.1.2 時点 j (j ≥ 3)で脱落した症例 i

このとき,Ri1 = · · · = Ri,j−1 = 1, Rij = · · · = Rin = 0 であり,Yoi = (Yi1, · · · , Yi,j−1)

′, Ymi =

(Yij , · · · , Yin)′ である.これより,観測データの尤度は以下のようになる.

f(Yoi ,Ri |Xi,θ,ψ)

=

∫f(Yo

i ,Ymi ,Ri |Xi,θ,ψ)dY

mi

=

∫f(Yo

i ,Ymi |Xi,θ) · f(Ri |Xi,Y

oi ,Y

mi ,ψ)dY

mi

=

∫f(Ym

i |Yoi ,Xi,θ) · f(Yo

i |Xi,θ) · Pr(Rij = · · · = Rin = 0 |Ri1 = · · · = Ri,j−1 = 1,Xi,Yi,ψ)

× Pr(Ri1 = · · · = Ri,j−1 = 1 |Xi,Yoi ,ψ)dY

mi

= f(Yoi |Xi,θ) · Pr(Ri1 = · · · = Ri,j−1 = 1 |Xi,Y

oi ,ψ)

×∫f(Ym

i |Yoi ,Xi,θ) · Pr(Rij = · · · = Rin = 0 |Ri1 = · · · = Ri,j−1 = 1,Xi, Yi,j−1, · · · , Yin,ψ)dYij · · · dYin

(∵ Ymi = (Yij , · · · , Yin)′)

4実際は,この段階では 1症例分のため,全症例(脱落時点はそれぞれ異なってよい)の尤度関数を全て求め,全体の尤度関数を算出した後に対数を取り,最大化を行う.

5µi に添え字 i がついているのは,たとえば µi = Xiβ のように,Xi に依存する状況を想定しているためである.

55

Page 204: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= f(Yoi |Xi,θ) · Pr(Ri1 = · · · = Ri,j−1 = 1 |Xi,Y

oi ,ψ)

×∫f(Yij , · · · , Yin |Yi1, · · · , Yi,j−1,Xi,θ) · Pr(Rij = 0 |Ri1 = · · · = Ri,j−1 = 1,Xi, Yi,j−1, Yij ,ψ)

× Pr(Ri,j+1 = 0 |Ri1 = · · · = Ri,j−1 = 1, Rij = 0,Xi, Yij , Yi,j+1,ψ)

× · · · × Pr(Rin = 0 |Ri1 = · · · = Ri,j−1 = 1, Rij = · · · = Ri,n−1 = 0,Xi, Yi,n−1, Yin,ψ)dYij · · · dYin(∵ NFD)

= f(Yoi |Xi,θ) · Pr(Ri1 = 1 |Xi, Y1,ψ) · Pr(Ri2 = 1 |Ri1 = 1,Xi, Y1, Y2,ψ)

× · · · × Pr(Ri,j−1 = 1 |Ri1 = · · · = Ri,j−2 = 1, Yi,j−2, Yi,j−1,Xi,ψ)

×∫f(Yij , · · · , Yin |Yi1, · · · , Yi,j−1,Xi,θ) · Pr(Rij = 0 |Ri1 = · · · = Ri,j−1 = 1,Xi, Yi,j−1, Yij ,ψ)

× 1 · · · 1 dYijdYi,j+1 · · · dYin

= f(Yoi |Xi,θ)

× Pr(Ri2 = 1 |Ri1 = 1,Xi, Yi1, Yi2,ψ)

× · · · × Pr(Ri,j−1 = 1 |Ri1 = · · · = Ri,j−2 = 1,Xi, Yi,j−2, Yi,j−1,ψ)

×∫f(Yij |Yo

i ,Xi,θ) · Pr(Rij = 0 |Ri1 = · · · = Ri,j−1 = 1,Xi, Yi,j−1, Yij ,ψ)dYij (B.14)

となり,NFDの仮定から,積分は 1変数に帰着される.ここで,積分の数値計算は,Diggle and Kenward (1994)

では Nelder-Mead法を用いている6.一方,マクロ%Selection_Model2,%SM_GridSearch,ではNewton-Raphson

ridge法,準 Newton法から選択が可能である.

ここで,応答変数に多変量正規分布を仮定して積分の式をもう少し書き下す.

f(Yij |Yoi ,θ) =

1√2πσ2

ij

exp

(− (Yij − µij)

2

2σ2ij

)

とおく.なお,この µij , σ2ij は,ともに Yo

i = (Yi1, · · · , Yi,j−1)を与えたもとでの Yij の条件付き分布のパラ

メータである.Yij の周辺分布の平均・分散ではないため注意が必要である.

脱落確率の関数は,(B.12)より,

Pr(Rij = 0 |Ri1 = · · · = Ri,j−1 = 1,Xi,Yi,ψ) =exp(ψ1 + ψ2Yi,j−1 + ψ3Yij)

1 + exp(ψ1 + ψ2Yi,j−1 + ψ3Yij)

となるので,(B.14)の積分の部分を書き下すと∫1√2πσ2

ij

exp

(− (Yij − µij)

2

2σ2ij

)· exp(ψ1 + ψ2Yi,j−1 + ψ3Yij)

1 + exp(ψ1 + ψ2Yi,j−1 + ψ3Yij)dYij

となる(Yi,j−1 は観測されている).これを用いて,被験者 iの尤度を構成すればよい.

B.3.1.3 時点 2で脱落した症例 i

時点3以上で脱落した場合では,観測データの尤度の積分以外の部分に,「Yoi の(条件付き)分布 f(Yo

i |Xi,θ)」

と「今まで観測されてきたデータに対する観測確率 Pr(Ri2 = 1 |Ri1 = 1,Xi, Yi1, Yi2,ψ) · · ·」の 2つの要素が

存在する.

一方,時点 2で脱落するとき,「ベースラインは常に観測」「時点 2で欠測」「それ以降は常に欠測」であるた

め,上の「今まで観測されてきたデータに対する観測確率」の部分が必要なくなる.結果として,尤度関数の

6Nelder-Mead法は SASの Proc IML NLPNRRルーチンなどで実行可能.理論の詳細は Nelder-Mead (1965a, 1965b)参照.

56

Page 205: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表現が時点 3以上と微妙に異なることとなるため,別扱いとする.いま,Ri1 = 1, Ri2 = Ri3 = · · · = Rin =

0, Yoi = (Yi1), Y

mi = (Yi2, · · · , Yin)′ であり,観測データの尤度は以下の通りとなる.

f(Yoi ,Ri |Xi,θ,ψ)

= f(Yi1,Ri |Xi,θ,ψ)

=

∫f(Yi1,Y

mi ,Ri |Xi,θ,ψ)dY

mi

=

∫f(Yi1,Y

mi |Xi,θ) · Pr(Ri1 = 1, Ri2 = · · · = Rin = 0 |Xi, Yi1,Y

mi ,ψ)dY

mi

=

∫f(Yi2, · · · , Yin |Yi1,Xi,θ) · f(Yi1 |Xi,θ) · Pr(Ri2 = · · · = Rin = 0 |Ri1 = 1,Xi,Yi,ψ)

× Pr(Ri1 = 1 |Xi, Yi1,ψ)dYi2 · · · dYin

= f(Yi1 |Xi,θ) · Pr(Ri1 = 1 |Xi, Yi1,ψ)

×∫f(Yi2, · · · , Yin |Yi1,Xi,θ) · Pr(Ri2 = · · · = Rin = 0 |Ri1 = 1,Xi, Yi1, · · · , Yin,ψ)dYi2 · · · dYin

= f(Yoi |Xi,θ) · 1

×∫f(Yi2, · · · , Yin |Yi1,Xi,θ) · Pr(Ri2 = 0 |Ri1 = 1,Xi, Yi1, Yi2,ψ)

× Pr(Ri3 = 0 |Ri1 = 1, Ri2 = 0,Xi, Yi2, Yi3,ψ)

× · · · × Pr(Rin = 0 |Ri1 = 1, Ri,2 = · · · = Ri,n−1 = 0,Xi, Yi,n−1, Yin,ψ)dYi2 · · · dYin

= f(Yoi |Xi,θ)

×∫f(Yi2, Yi3, · · · , Yin |Yi1,Xi,θ) · Pr(Ri2 = 0 |Ri1 = 1,Xi, Yi1, Yi2,ψ) · 1 · · · 1 dYi2dYi3 · · · dYin

= f(Yoi |Xi,θ)×

∫f(Yi2 |Yi1,Xi,θ) · Pr(Ri2 = 0 |Ri1 = 1,Xi, Yi1, Yi2,ψ)dYi2

となる.これ以降の手順は,j (j ≥ 3)で脱落した症例と同様である.

B.4 【6章】NFMV,NFD,ACMV,MAR に対する補足

6章の補足では,以下のことを示す.単調な欠測のみで,脱落時点ごと(最終測定時点ごと)にパターンを

作る場合,

1. 「NFMV かつ ACMV」は ACMV と同値であること

2. ACMVはMAR と同値であること

3. NFMVは NFDと同値であること

2,3は SMと PMMの関係を明確化させるものであり,1.は NRC (2010)の 5章に記載されている PMMの感

度分析を正しく解釈するために必須となる.そのため,3つとも極めて重要なものである.本節の到達目標は,

NRC (2010)の 5章の PMMの感度分析で「何を考えているのか」と「MAR からの乖離と解釈する方法」につ

いて理解を深めることである.

B.4.1 記号の整理と前提事項

以下,議論・数式が煩雑になりすぎないために,以下を仮定する.

57

Page 206: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

B.4.1.1 前提

• 基本的に 1群の記載とする.

• ベースラインの測定値は全症例測定されているとする.• 欠測は単調とする.• パターンは観測された最終時点ごとに作るものとする7.

• "ACMV ⇔ MAR"と"NFMV ⇔ NFD"の証明は後に回し,最初は事実として用いる.

• 被験者番号は記載しないこととする.• パラメータも記載しないこととする.• 6章の言葉づかい・式の表現と微妙に異なる部分がある.

• 行末の 2は「証明終わり」を意味する.

• ∀i,∀j 等は,特に断らなければ自然数とする.

B.4.1.2 記号

• i:時点(被験者番号ではない).1 ≤ i ≤ T とする.ベースラインは i = 1とする.

• R:観測された最終時点を示す確率変数(この値ごとにパターンを作成する).

• Yi:時点 iの応答変数(1時点.スカラー).

• Yi:時点 iまでの応答変数(i > 1の場合,ベクトル).

• f(Yi |Yi−1, R = j):時点 j が最終観測時点の症例の,Yi の(条件付き)確率密度関数(Yj−1 を与え

たもとで).たとえば f(Y3 |Y2, R = 1) は,「時点 1が最終観測の症例の,時点 3の(条件付き)分

布」であり,観測されていないデータに関する分布のため,このままでは分布が推定できない.一方,

f(Y3 |Y2, R ≥ 3)は「時点 3以上が最終観測時点の症例の時点 3の(条件付き)分布」であり,時点 3

で観測されている症例のデータから推定できる.なお,6章では fj(Yi |Yi−1)という記号で表現したが,

本章では条件付き分布の計算を詳細に行うため,f(Yi |Yi−1, R = j)という表現を用いることとする.

B.4.1.3 仮定

• Pr(R = t− 1 |R ≥ t− 1) = 0 (∀t ≥ 2)を仮定する.

• ∀i ≥ 1における ∀Yi に対して,f(Yi) > 0を仮定する.

B.4.1.4 よく用いる公式

以下の公式をよく用いる.

f(Yi |Yi−1, R ≥ j)

=f(Yi |Yi−1, R = j) · P (R = j |Yi−1, R ≥ j) + f(Yi |Yi−1, R ≥ j + 1) · P (R ≥ j + 1 |Yi−1, R ≥ j) (B.15)

証明.

f(Yi |Yi−1, R ≥ j)

=f(Yi,Yi−1, R ≥ j)

f(Yi−1, R ≥ j)

=f(Yi,Yi−1, R = j) + f(Yi,Yi−1, R ≥ j + 1)

f(Yi−1, R ≥ j)

7つまり「時点 2で脱落した症例のパターン」「時点 3で脱落した症例のパターン」· · ·「時点 (T − 1)で脱落した症例のパターン」「治験を完了した症例のパターン」のみ考えることとする.

58

Page 207: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

=f(Yi,Yi−1, R = j)

f(Yi−1, R = j)· f(Yi−1, R = j)

f(Yi−1, R ≥ j)+f(Yi,Yi−1, R ≥ j + 1)

f(Yi−1, R ≥ j + 1)· f(Yi−1, R ≥ j + 1)

f(Yi−1, R ≥ j)

=f(Yi |Yi−1, R = j) · P (R = j |Yi−1, R ≥ j) + f(Yi |Yi−1, R ≥ j + 1) · P (R ≥ j + 1 |Yi−1, R ≥ j)

B.4.1.5 状況設定

特定可能(データから推定可能)な分布と特定不能(データから推定不可能)な分布を区別する.一般には

∀t ≥ 2, ∀j ≤ t− 1に対して,

特定可能: f(Yt |Yt−1, R ≥ t)

特定不能: f(Yt |Yt−1, R = j)

である.重要であるため再度繰り返しておくと,f(Yt |Yt−1, R ≥ t)は,R ≥ tより,「最終観測時点が時点 t

以上」のため,時点 tのデータは観測されている.そのため,この分布はデータから推定可能である.一方,

∀j ≤ t− 1のとき,R = j < tとなるため,f(Yt |Yt−1, R = j)は「最終観測時点が時点 j (< t)」であり,時

点 tのデータは観測されていない.そのため,データからは推定不可能である.

B.4.1.6 具体例

具体的に,計画された評価時点が 4時点目のデータ(1~4時点までのデータ)について述べる.特定可能な

分布は

f(Y4 |Y3, R = 4),

f(Y3 |Y2, R = 4), f(Y3 |Y2, R = 3),

f(Y2 |Y1, R = 4), f(Y2 |Y1, R = 3), f(Y2 |Y1, R ≥ 2)

であり8,特定不能な分布は

f(Y4 |Y3, R = 3), f(Y4 |Y3, R = 2), f(Y4 |Y3, R = 1),

f(Y3 |Y2, R = 2), f(Y3 |Y2, R = 1),

f(Y2 |Y1, R = 1)

である.以下,イメージを示す.パターンは脱落時点であり,ベースライン(時点 1)は常に観測されるため,

パターンは以下の 4つとなる.

表 B.1:計画された測定が 4時点の場合の脱落パターン(:観測,×:欠測)

時点 1 時点 2 時点 3 時点 4

パターン 1

パターン 2 ×

パターン 3 × ×

パターン 4 × × ×

8f(Y3 |Y2, R ≥ 3)は R の値でさらに分けて,f(Y3 |Y2, R = 3), f(Y3 |Y2, R = 4)も特定可能だが,以下の文脈では別々には用いないのでまとめることとした.6章で述べた interior familyで表現する際には,別々の表現が有用となる.

59

Page 208: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 B.2:パターン・時点ごとの条件付き分布と特定可能・特定不能(:観測,×:欠測)

時点 1 時点 2 時点 3 時点 4

パターン 1 f(Y1 |R = 4) f(Y2 |Y1, R = 4) f(Y3 |Y2, R = 4) f(Y4 |Y3, R = 4)

(完了) (:特定可能) (:特定可能) (:特定可能) (:特定可能)

パターン 2 f(Y1 |R = 3) f(Y2 |Y1, R = 3) f(Y3 |Y2, R = 3) f(Y4 |Y3, R = 3)

(時点 4で脱落) (:特定可能) (:特定可能) (:特定可能) (×:特定不能 )

パターン 3 f(Y1 |R = 2) f(Y2 |Y1, R = 2) f(Y3 |Y2, R = 2) f(Y4 |Y3, R = 2)

(時点 3から脱落) (:特定可能) (:特定可能) (×:特定不能 ) (×:特定不能 )

パターン 4 f(Y1 |R = 1) f(Y2 |Y1, R = 1) f(Y3 |Y2, R = 1) f(Y4 |Y3, R = 1)

(時点 2から脱落) (:特定可能) (×:特定不能 ) (×:特定不能 ) (×:特定不能 )

いま,計画された評価時点は時点 4である.特定可能なパターン 1の f(Y4 |Y3, R = 4)のみを用いて推定

を行う方法は,complete case解析などに相当し,バイアスが入ることが懸念されることも多い.そのため,パ

ターン 2∼4の f(Y4 |Y3, R = 3), f(Y4 |Y3, R = 2), f(Y4 |Y3, R = 1)などをうまく解析に組み込むことで,欠

測データの影響も含めたバイアスの少ない解析を行いたい.しかし,これらは特定不能であるため,このまま

では解析に用いることができない.そこで,仮定を追加して解析に利用することを考える.

B.4.2 NFMVと ACMV の関係

上でみた通り,PMMを考える場合,脱落が 1例でも存在すれば特定可能な分布と特定不能な分布が存在す

るが,特定不能な分布を無視して推定を行うとバイアスが入る可能性がある.そのため,特定不能な分布も考

慮に入れた推測を行いたい.そこで,特定不能な分布を特定可能な分布と結びつけることを目的として,特定

不能な分布に対して仮定を追加することがある.本報告書では制約条件という仮定を用いる.代表的な制約条

件には,CCMV,NCMV,ACMV,NFMV などがあるが,詳しくは 6章で述べてあるため,本章では NFMV

と ACMV に注目し,この 2つの関係を考える.

B.4.2.1 NFMVの定義と具体例

B.4.2.1.1 NFMVの定義

∀t ≥ 3, ∀j ≤ t− 2のとき

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t− 1) (B.16)

が成り立つとき,NFMV という9.ここで,

f(Yt |Yt−1, R = 1) = f(Yt |Yt−1, R = 2) = · · · = f(Yt |Yt−1, R = t− 2)

が成り立つことは重要である.

B.4.2.2 NFMVの具体例

計画された測定時点が 4時点のデータで,NFMVの例を考えてみる.まず,t = 4, j = 1 (≤ 2 = t− 2)のと

き,(B.16)は

f(Y4 |Y3, R = 1) = f(Y4 |Y3, R ≥ 3) (B.17)9Kenwardet al. (2003)では t = 2 も許容されているようだが, t = 2 の場合左辺が f(Y2 |Y1, R = 0) となり,ベースラインを 0時点

としなければ意味をもたない.本報告書ではベースラインを時点 1としているため,t ≥ 3 とした.

60

Page 209: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

である10.同様に,t = 4, j = 2のとき,t = 3, j = 1のときをそれぞれ考えると,

f(Y4 |Y3, R = 2) = f(Y4 |Y3, R ≥ 3) (B.18)

f(Y3 |Y2, R = 1) = f(Y3 |Y2, R ≥ 2) (B.19)

となる.いま,∀t ≥ 3, ∀j ≤ t − 2より,上記のもので NFMV の定義 (B.16)を尽くしている.重要なことは,

NFMV とは上の式 (B.17)~(B.19)が全て成り立つことを言う,ということである.

式を整理すると,

f(Y4 |Y3, R = 1) = f(Y4 |Y3, R = 2) = f(Y4 |Y3, R ≥ 3)

f(Y3 |Y2, R = 1) = f(Y3 |Y2, R ≥ 2)

となる.重要なことは以下の 2点である.(i) 上の定義から特定不能な分布 f(Y4 |Y3, R = 1), f(Y4 |Y3, R =

2), f(Y3 |Y2, R = 1) は特定可能な分布と ある程度 結びついた11.(ii) f(Y4 |Y3, R = 3), f(Y3 |Y2, R =

2), f(Y2 |Y1, R = 1)に対しては何も述べられていないため,特定不能なまま,ということである12.以上より,

NFMV という条件だけでは,全ての分布が特定可能とはなっていないことが分かる.

以下に,計画された測定が 4時点の場合のイメージを示す.

表 B.3:計画された測定が 4時点の場合の脱落パターン(:観測,×:欠測)

時点 1 時点 2 時点 3 時点 4

パターン 1

パターン 2 ×

パターン 3 × ×

パターン 4 × × ×

表 B.4: NFMV で特定される分布のイメージ(?:特定不能な分布)

時点 1 時点 2 時点 3 時点 4

パターン 1 f(Y1 |R = 4) f(Y2 |Y1, R = 4) f(Y3 |Y2, R = 4) f(Y4 |Y3, R = 4)

パターン 2 f(Y1 |R = 3) f(Y2 |Y1, R = 3) f(Y3 |Y2, R = 3) ?

パターン 3 f(Y1 |R = 2) f(Y2 |Y1, R = 2) ? f(Y4 |Y3, R ≥ 3)(?)

パターン 4 f(Y1 |R = 1) ? f(Y3 |Y2, R ≥ 2)(?) f(Y4 |Y3, R ≥ 3)(?)

B.4.2.3 ACMVの定義と具体例

B.4.2.3.1 ACMVの定義

∀t ≥ 2, ∀j ≤ t− 1のとき,

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t) (B.20)

が成り立つとき,ACMV という.10全 4時点であるため,R = 4 は R ≥ 4 と同じ意味である.11f(Y4 |Y3, R ≥ 3) は特定不能な分布である.ただし,

f(Y4 |Y3, R ≥ 3) = f(Y4 |Y3, R = 3)︸ ︷︷ ︸特定不能

·P (R = 3 |Y3, R ≥ 3) + f(Y4 |Y3, R = 4)︸ ︷︷ ︸特定可能

·P (R = 4 |Y3, R ≥ 3)

より,特定可能な分布まであと一歩である.12つまり,欠測した最初の時点のデータの(条件付き)分布については,何も条件をつけていない(ため特定不能なままである).

61

Page 210: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

B.4.2.3.2 ACMVの具体例

上の NFMV の具体例と対応するように,4時点のデータで記載してみると,

f(Y4 |Y3, R = 1) = f(Y4 |Y3, R = 4) (B.21)

f(Y4 |Y3, R = 2) = f(Y4 |Y3, R = 4) (B.22)

f(Y4 |Y3, R = 3) = f(Y4 |Y3, R = 4) (B.23)

f(Y3 |Y2, R = 1) = f(Y3 |Y2, R ≥ 3) (B.24)

f(Y3 |Y2, R = 2) = f(Y3 |Y2, R ≥ 3) (B.25)

f(Y2 |Y1, R = 1) = f(Y2 |Y1, R ≥ 2) (B.26)

となる.整理すると

f(Y4 |Y3, R = 1) = f(Y4 |Y3, R = 2) = f(Y4 |Y3, R = 3) =f(Y4 |Y3, R = 4)

f(Y3 |Y2, R = 1) = f(Y3 |Y2, R = 2) =f(Y3 |Y2, R ≥ 3)

f(Y2 |Y1, R = 1) =f(Y2 |Y1, R ≥ 2)

となる.重要なことは,NFMVとは異なり,全ての特定不能な分布が特定可能な分布と結びついている,とい

うことである.

NFMV 同様,イメージ図を示す.

表 B.5:計画された時点が 4の場合の脱落パターン(:観測,×:欠測)

時点 1 時点 2 時点 3 時点 4

パターン 1

パターン 2 ×

パターン 3 × ×

パターン 4 × × ×

表 B.6: ACMV で特定される分布のイメージ(全て特定可能)

時点 1 時点 2 時点 3 時点 4

パターン 1 f(Y1 |R = 4) f(Y2 |Y1, R = 4) f(Y3 |Y2, R = 4) f(Y4 |Y3, R = 4)

パターン 2 f(Y1 |R = 3) f(Y2 |Y1, R = 3) f(Y3 |Y2, R = 3) f(Y4 |Y3, R = 4)

パターン 3 f(Y1 |R = 2) f(Y2 |Y1, R = 2) f(Y3 |Y2, R ≥ 3) f(Y4 |Y3, R = 4)

パターン 4 f(Y1 |R = 1) f(Y2 |Y1, R ≥ 2) f(Y3 |Y2, R ≥ 3) f(Y4 |Y3, R = 4)

重要な特徴として,欠測部分の分布(×に対応する分布)は同じ時点では全て等しく,また同じ時点の「

に対応する分布を全て合わせたもの」となっている13.

B.4.2.4 NFMVと ACMV の関係

式の形などから,NFMVと ACMV は「何となく似ている」ようである.一方で,「ACMV は全ての分布が特

定可能」「NFMVは特定不能な分布が残る」点などから,ACMV の方がより強い制約条件になっている可能性

がある.13つまりだとえば,時点 3のパターン 3とパターン 4が同じ f(Y3 |Y2, R ≥ 3)であり,これはその上の f(Y3 |Y2, R = 3), f(Y3 |Y2, R =

4) を合わせたものである,ということである.

62

Page 211: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

以下,NFMV と ACMV の関係を考えてみる.目的は,

• 「『NFMV かつ(何か条件)』⇔ ACMV」

を満たすような「(何か条件)」をみつけることである.なお,ここで重要な点は「最初に NFMV を考え,特

定しきれない部分に対して(何か条件)を用いる」ということである.つまり,たとえば先にあげた 4時点の

例では,表 B.4の「?」のみのセル14に「(何か条件)」を適用する,ということである.

B.4.2.4.1 具体例からの検討

突然一般論に入ると難しいため,具体例から検討を行う.最初に,先の4時点の例を用いて,「ACMV⇒NFMV」を示す.

つまり,「ACMV は NFMV の一種である」ということを示す.具体的には,「『(B.21) ∼ (B.26)が全て成り立つ』

ならば,『(B.17) ∼ (B.19)が全て成り立つ』」を示す.より詳細には,

• 「(B.21) ∼ (B.23)」⇒ (B.17),(B.18)

• 「(B.24),(B.25)」⇒ (B.19)

を示す.まず,(B.21) ∼ (B.23)が成り立てば,(B.17), (B.18)が成り立つことを示す.(B.23)から f(Y4 |Y3, R =

3) = f(Y4 |Y3, R = 4)より,この 2つは f(Y4 |Y3, R ≥ 3)とも等しい15.つまり,

f(Y4 |Y3, R = 4) = f(Y4 |Y3, R = 3) = f(Y4 |Y3, R ≥ 3) (B.27)

である.これを (B.21)と合わせると,

f(Y4 |Y3, R = 1) = f(Y4 |Y3, R = 4) = f(Y4 |Y3, R ≥ 3)

となり,最初と最後をみると,(B.17)と一致している.同じく,(B.22)を (B.27)と合わせると,

f(Y4 |Y3, R = 2) = f(Y4 |Y3, R = 4) = f(Y4 |Y3, R ≥ 3)

となり,最初と最後をみると (B.18)と一致している.以上より,「(B.21) ∼ (B.23) ⇒ (B.17),(B.18)」が示され

た.同様に,(B.24), (B.25)から (B.19)が示される.まず,(B.25) f(Y3 |Y2, R = 2) = f(Y3 |Y2, R ≥ 3)から,

これは f(Y3 |Y2, R ≥ 2)と等しい16.これと,(B.24)より,

f(Y3 |Y2, R = 1) = f(Y3 |Y2, R ≥ 3) = f(Y3 |Y2, R ≥ 2)

となり,最初と最後をみると,(B.19)と一致している.従って,「(B.24),(B.25) ⇒(B.19)」が示された.

以上より,「(B.21) ∼ (B.26) ⇒ (B.17) ∼(B.19)」が成り立つ.(B.26)は使っていないが,十分条件を検討して

いるので問題ない.すなわち,上の具体例について,「ACMV ⇒ NFMV 」が成り立つことが分かった.次に,14「(数式)(?)」のセルは含まない.15厳密に式で書くと,

f(Y4 |Y3, R ≥ 3) = f(Y4 |Y3, R = 3) · P (R = 3 |Y3, R ≥ 3) + f(Y4 |Y3, R = 4) · P (R = 4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4) · P (R = 3 |Y3, R ≥ 3) + f(Y4 |Y3, R = 4) · P (R = 4 |Y3, R ≥ 3) (∵ (B.23))

= f(Y4 |Y3, R = 4)P (R = 3 |Y3, R ≥ 3) + P (R = 4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4) · P (R ≥ 3 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4)

となる.(B.23) より,最後の式は f(Y4 |Y3, R = 3) とも等しい.16これも厳密には

f(Y3 |Y2, R ≥ 2) = f(Y3 |Y2, R = 2) · P (R = 2 |Y2, R ≥ 2) + f(Y3 |Y2, R ≥ 3) · P (R ≥ 3 |Y2, R ≥ 2)

= f(Y3 |Y2, R ≥ 3) · P (R = 2 |Y2, R ≥ 2) + f(Y3 |Y2, R ≥ 3) · P (R ≥ 3 |Y2, R ≥ 2) (∵ (B.25))

= f(Y3 |Y2, R ≥ 3)P (R = 2 |Y2, R ≥ 2) + P (R ≥ 3 |Y2, R ≥ 2)

= f(Y3 |Y2, R ≥ 3)

である.

63

Page 212: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

逆方向を考える.つまり,「NFMV ⇒ ACMV」が成り立つのはいつか,という問題を考える17.上の説明を

丁寧に見ていくと

• 「(B.21)かつ (B.23)」⇒ (B.17)

• 「(B.22)かつ (B.23)」⇒ (B.18)

• 「(B.24)かつ (B.25)」⇒ (B.19)

であった.「(B.21)と (B.17)」「(B.22)と (B.18)」「(B.24)と (B.19)」がそれぞれ似ていることを考えると,(B.23)と (B.25)が「追加の条件」として重要そう

である.また,上で用いていない (B.26)と合わせて,NFMVで規定しなかった f(Yt |Yt−1, R = t−1),つまり欠測

した最初のデータの(条件付き)分布が重要そうである18.以上を受けて,「『NFMV かつ (B.23), (B.25), (B.26)』⇒ ACMV」

を示す.言い換えると,「『(B.17) ∼ (B.19),(B.23),(B.25),(B.26)』⇒『(B.21)∼ (B.26)』」を示す.より具体

的には

(1)「(B.17)かつ (B.23)」⇒ (B.21)

(2)「(B.18)かつ (B.23)」⇒ (B.22)

(3) (B.23) ⇒(B.23)

(4)「(B.19)かつ (B.25)」⇒ (B.24)

(5) (B.25) ⇒ (B.25)

(6) (B.26) ⇒ (B.26)

を順に示す.まず,(1)「『(B.17)かつ (B.23)』⇒ (B.21)」を示す.(B.17)を (B.15)を用いて変形すると,

f(Y4 |Y3, R = 1) = f(Y4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 3) · P (R = 3 |Y3, R ≥ 3) + f(Y4 |Y3, R = 4) · P (R = 4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4) · P (R = 3 |Y3, R ≥ 3) + f(Y4 |Y3, R = 4) · P (R = 4 |Y3, R ≥ 3)

(∵ (B.23))

= f(Y4 |Y3, R = 4)P (R = 3 |Y3, R ≥ 3) + P (R = 4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4) · P (R ≥ 3 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4)

より,結局 f(Y4 |Y3, R = 1) = f(Y4 |Y3, R = 4),つまり (B.21)が成り立つことが分かる.よって「『(B.17)

かつ (B.23)』⇒ (B.21)」が示された.同様に,(2)「『(B.18)かつ (B.23)』⇒ (B.22)」を示す.(B.18)を (B.23)

を用いて変形すると,

f(Y4 |Y3, R = 2) = f(Y4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 3) · P (R = 3 |Y3, R ≥ 3) + f(Y4 |Y3, R = 4) · P (R = 4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4) · P (R = 3 |Y3, R ≥ 3) + f(Y4 |Y3, R = 4) · P (R = 4 |Y3, R ≥ 3)

(∵ (B.23))

= f(Y4 |Y3, R = 4)P (R = 3 |Y3, R ≥ 3) + P (R = 4 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4) · P (R ≥ 3 |Y3, R ≥ 3)

= f(Y4 |Y3, R = 4)

となり,(B.22)が成り立つ.よって,「『(B.18)かつ (B.23)』⇒ (B.22)」が示された.(3)「(B.23)⇒(B.23)」は自

明である.次に,(4)「『(B.19)かつ (B.25)』⇒ (B.24)」が成り立つことをみる.

f(Y3 |Y2, R = 1) = f(Y3 |Y2, R ≥ 2)

17一般に成り立たないことの証明は,極めて容易に反例が作れることから略す.18これは表 B.4の「?」のみのセルに対応する.

64

Page 213: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= f(Y3 |Y2, R = 2) · P (R = 2 |Y2, R ≥ 2) + f(Y3 |Y2, R ≥ 3) · P (R ≥ 3 |Y2, R ≥ 2)

= f(Y3 |Y2, R ≥ 3) · P (R = 2 |Y2, R ≥ 2) + f(Y3 |Y2, R ≥ 3) · P (R ≥ 3 |Y2, R ≥ 2)

(∵ (B.25))

= f(Y3 |Y2, R ≥ 3)P (R = 2 |Y2, R ≥ 2) + P (R ≥ 3 |Y2, R ≥ 2)

= f(Y3 |Y2, R ≥ 3)

となり,(B.24)が成り立つことが示せた.従って「『(B.19)かつ (B.25)』⇒ (B.24)」である.残りの (5)「(B.25)⇒(B.25)」,

(6)「(B.26)⇒(B.26)」は自明である.以上より,「『NFMV かつ (B.23), (B.25), (B.26)』⇒ ACMV」が示された.

したがって,今回の具体例に対して,(1)∼(6)の全てが示されたため,

• 「NFMV かつ (B.23), (B.25), (B.26)」⇔ ACMV

が示された.

一般論の説明に移る前に (B.23), (B.25), (B.26)の位置づけを確認しておく.NFMV を考えた場合の表 B.4を

再掲すると,表 B.7となり,(B.23), (B.25), (B.26)はそれぞれ

f(Y4 |Y3, R = 3) = f(Y4 |Y3, R = 4)

f(Y3 |Y2, R = 2) = f(Y3 |Y2, R ≥ 3)

f(Y2 |Y1, R = 1) = f(Y2 |Y1, R ≥ 2)

であることから,左辺はそれぞれ表 B.7の「?」のみのセルを条件づけていることとなる.

表 B.7: NFMV で特定される分布のイメージ(?:特定不能な分布).表 B.4再掲

時点 1 時点 2 時点 3 時点 4

パターン 1 f(Y1 |R = 4) f(Y2 |Y1, R = 4) f(Y3 |Y2, R = 4) f(Y4 |Y3, R = 4)

パターン 2 f(Y1 |R = 3) f(Y2 |Y1, R = 3) f(Y3 |Y2, R = 3) ?

パターン 3 f(Y1 |R = 2) f(Y2 |Y1, R = 2) ? f(Y4 |Y3, R ≥ 3)(?)

パターン 4 f(Y1 |R = 1) ? f(Y3 |Y2, R ≥ 2)(?) f(Y4 |Y3, R ≥ 3)(?)

ここで,NFMV の定義を振り返ると,以下のものであった.∀t ≥ 3, ∀j ≤ t− 1のとき

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t− 1)

また,上の 3つの「追加の式」は,まとめて,

f(Yt |Yt−1, R = t− 1) = f(Yt |Yt−1, R ≥ t) (∀t ≥ 2)

と表現できる.これを NFMV と組み合わせることで ACMV の別表現が以下のように得られる.

ACMV の別表現

以下の全てが満たされることは,ACMV と同値である.

∀t ≥ 3, ∀j ≤ t− 2のとき,f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t− 1)

∀t ≥ 2のとき,f(Yt |Yt−1, R = t− 1) = f(Yt |Yt−1, R ≥ t)

が満たされるとき,ACMV である19.

これを表にすると表 B.8のようになる.19微妙な違いのため注意しておくが,NFMV との違いは t, j の範囲のみである (NFMV は ∀t ≥ 3, ∀j ≤ t− 2).

65

Page 214: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 B.8: ACMV の別表現

時点 1 時点 2 時点 3 時点 4

パターン 1 f(Y1 |R = 4) f(Y2 |Y1, R = 4) f(Y3 |Y2, R = 4) f(Y4 |Y3, R = 4)

パターン 2 f(Y1 |R = 3) f(Y2 |Y1, R = 3) f(Y3 |Y2, R = 3) f(Y4 |Y3, R = 4)

パターン 3 f(Y1 |R = 2) f(Y2 |Y1, R = 2) f(Y3 |Y2, R ≥ 3) f(Y4 |Y3, R ≥ 3)

パターン 4 f(Y1 |R = 1) f(Y2 |Y1, R ≥ 2) f(Y3 |Y2, R ≥ 2) f(Y4 |Y3, R ≥ 3)

B.4.2.4.2 一般論の検討

以上の例をうけて,一般論を述べる.上の具体例で (B.23) f(Y4 |Y3, R = 3) = f(Y4 |Y3, R = 4),(B.25)

f(Y3 |Y2, R = 2) = f(Y3 |Y2, R ≥ 3),(B.26)f(Y2 |Y1, R = 1) = f(Y2 |Y1, R ≥ 2)が重要そうであることが分

かった.これを一般化して,

f(Yt |Yt−1, R ≥ t) = f(Yt |Yt−1, R = t− 1) (∀t ≥ 2) (B.28)

という条件を考えるとよさそうである.これをもとに

• 「NFMV かつ (B.28)」⇔ ACMV

が成り立つことを示す.証明は,本質的に 4時点の場合と同様である.

まず,「ACMV ⇒ NFMV かつ (B.28)」を示す.(B.28)は ACMV の定義に含まれるため,「ACMV ⇒ NFMV」

が示されれば十分である.いま,ACMV から,∀t ≥ 3に対して,

f(Yt |Yt−1, R ≥ t) = f(Yt |Yt−1, R = t− 1) = f(Yt |Yt−1, R ≥ t− 1)

が成り立つことが分かる.これより,(B.20)から ∀t ≥ 3, ∀j ≤ t− 2に対して,

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t) = f(Yt |Yt−1, R ≥ t− 1)

となる.これより,(B.16)つまり NFMV が成り立つことが分かる.従って,「ACMV ⇒ NFMV」が示された.

これより「ACMV ⇒ NFMV かつ (B.28)」が成り立つ.

次に,「『NFMV かつ (B.28)』⇒ ACMV」を示す.∀t ≥ 3, ∀j ≤ t− 2に対して,NFMV の式 (B.16)から,

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t− 1)

= f(Yt |Yt−1, R = t− 1) · P (R = t− 1 |Yt−1, R ≥ t− 1)

+ f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1, R ≥ t− 1)

= f(Yt |Yt−1, R ≥ t) · P (R = t− 1 |Yt−1, R ≥ t− 1)

+ f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1, R ≥ t− 1) (∵ (B.28))

= f(Yt |Yt−1, R ≥ t)P (R = t− 1 |Yt−1, R ≥ t− 1) + P (R ≥ t |Yt−1, R ≥ t− 1)

= f(Yt |Yt−1, R ≥ t)

となる.以上より,∀t ≥ 3, ∀j ≤ t− 2に対して(B.20) が成り立つことが分かった.ACMV が成り立つには,

t ≥ 2に対して,j = t− 1の場合にも (B.20)を満たす必要があるが,これはまさに (B.28)であるため,「『NFMV

かつ (B.28)』⇒ ACMV」が示された.以上より,一般に

• 「NFMV かつ (B.28)」⇔ ACMV

が示された.以上を書き直すと,

「NFMV かつ ”f(Yt |Yt−1, R = t− 1) = f(Yt |Yt−1, R ≥ t) (∀t ≥ 2)”」 ⇐⇒ ACMV

66

Page 215: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.これより,NFMV が ACMV と一致するかどうかは式 (B.28)

f(Yt |Yt−1, R = t− 1) = f(Yt |Yt−1, R ≥ t) (∀t ≥ 2)

が成り立つかどうか,ということとなる.繰り返すと,NFMVの「特殊な場合」が ACMV ということとなり,

「特殊な」という部分は「(B.28)が成り立つ」ということである.

単調な欠測に対して,脱落時点ごとにパターンを作る場合に,「ACMV ⇔ MAR」であることを用いると20,

(B.28)が

• 成り立つ =⇒ MAR

• 成り立たない =⇒ MAR でない

となる.これより,NFMV を仮定した感度分析として,「f(Yt |Yt−1, R = t− 1)(表 B.7(?)のみのセルの内

容)が (B.28)からずれたときの影響をみることで,MAR からずれたときの影響を検討する」ものを考えるこ

とができる.これが NRC (2010)の 5章に記載されている PMMの欠測メカニズムに対する感度分析である.

B.4.3 NRC (2010)の PMM の感度分析

以上の議論を踏まえて,NRC (2010)の 5章の PMMの感度分析が何を考えているのか,を検討する.まず,

NRC (2010) p98の下の方で NFMV を仮定していることに注意する21.まず,NRC (2010)の p99の真ん中あた

りに「f(Yt |Yt−1, R = t− 1)は f(Yt |Yt−1, R ≥ t)と同じパラメトリックな分布に従い,パラメータの値だけ

が異なるとする」とある.そこで以下,平均パラメータのみに注目した記載とする.なお,以下 (NRC 22)の

ような記号は「NRC (2010)の式 (22)」を示すものとする.(NRC 22)~(NRC 32)より,観測データに対する条

件付き分布を,時点 1~4について書き直すと,

E[Y1] = µ1

E[Y2 |Y1, R ≥ 2] = µ2 + Y1β2

E[Y3 |Y2, R ≥ 3] = µ3 +Y′2β3

E[Y4 |Y3, R = 4] = µ4 +Y′3β4

(B.29)

となる.また,欠測データに対する条件付き分布のうち,最初の欠測時点での条件付き分布の式 (NRC 33)を

書き直すと,

E[Y2 |Y1, R = 1] = µ∗2 + Y1β

∗2

E[Y3 |Y2, R = 2] = µ∗3 +Y′

2β∗3

E[Y4 |Y3, R = 3] = µ∗4 +Y′

3β∗4

(B.30)

となる.「NFMVかつ (B.28)」がACMV と同値であったため,(B.29)と (B.30)がうまい具合に一致すればACMV

(⇔ MAR) となる22.パラメータ数の増加を減らすために,NRC (2010)の 5章では以下を仮定している.

β2 = β∗2 , β3 = β∗

3, β4 = β∗4,

20証明は後から行う.21厳密には NFDを仮定している.単調な欠測のみの場合に,脱落時点でパターンを作る際,”NFD ⇔ NFMV”は後で示す.22 (B.28) が成り立つとき,

E[Y2 |Y1, R = 1] = E[Y2 |Y1, R ≥ 2]

E[Y3 |Y2, R = 2] = E[Y3 |Y2, R ≥ 3]

E[Y4 |Y3, R = 3] = E[Y4 |Y3, R = 4]

が成り立つ.厳密には,(B.28) では分布そのものが一致する,ということが要請されているが,本章では NRC (2010)に習い,平均パラメータ以外は一致していることを前提に,平均パラメータのみに焦点を絞って記載する.

67

Page 216: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

µ∗2 = µ2 +∆µ2

µ∗3 = µ3 +∆µ3

µ∗4 = µ4 +∆µ4

これより,(B.30)は

E[Y2 |Y1, R = 1] = µ2 +∆µ2 + Y1β2 (= E[Y2 |Y1, R ≥ 2] + ∆µ2)

E[Y3 |Y2, R = 2] = µ3 +∆µ3 +Y′2β3 (= E[Y3 |Y2, R ≥ 3] + ∆µ3)

E[Y4 |Y3, R = 3] = µ4 +∆µ4 +Y′3β4 (= E[Y4 |Y3, R = 4] + ∆µ4)

となる.これより,∆µ2 = ∆µ3 = ∆µ4 = 0のとき,ACMV (⇔ MAR) となる23.逆に,「∆µ2 ,∆µ3 ,∆µ4 の 0か

らのずれ具合」が「MARからのずれ具合」となる.このようにして,感度パラメータ∆µ2 ,∆µ3 ,∆µ4 を用いて

MARからのずれを検討する方法が NRC (2010)の 5章に記載されている PMMの感度分析である.なお,この

手法をMI を用いて実装するには,missingdata.org.ukで公開されているマクロ%delta_pmmや%cbi_pmmを用

いればよい.マクロの指定は Appendix C参照.

B.4.4 ACMVとMAR の同値性の証明

以下,先延ばしにしてきた「ACMV ⇔ MAR」「NFMV ⇔ NFD」の証明を行う.まずは「ACMV ⇔ MAR」

からである.

定理 B.4.1. 単調な欠測のみであり,脱落時点ごとにパターンを作る場合,ACMV ⇔ MAR が成り立つ.

証明は,大筋はMolenberghset al. (1998),Verbeke and Molenberghs (2000)に従うが,誤植の訂正と一部を修

正した.

B.4.4.1 用語の整理

まず,用語の整理をする.MAR とは ∀t ≥ 1に対して,以下が成り立つときにいう.

P (R = t |YT ) = P (R = t |Yt)

ACMV とは ∀t ≥ 2, ∀j ≤ t− 1に対して,以下が成り立つときにいう.

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t)

なお,この式は f(Yt |Yt−1, R = 1) = f(Yt |Yt−1, R = 2) = · · · = f(Yt |Yt−1, R = t − 1)の形でもよく用い

る.また,1 ≤ i ≤ j ≤ T を満たす自然数 i, j に対して記号を以下のように定める.

Yji = (Yi, · · · , Yj)′

なお,YTi の T は「計画された評価時点(最終観測時点)」を指し,転置行列を示すものではない.また,i = j

のとき,Yji = Yi (= Yj)となり,スカラーであるが,統一的に扱うためベクトル表記(太字に)することも

ある.

B.4.4.2 仮定の整理

以下の 2つを仮定する.

• 1 ≤ ∀j ≤ T, 1 ≤ ∀t ≤ T, に対して P (R = j |Yt) > 0.

• ∀Yj に対して,f(Yj) > 0.

23NFMV と ACMV(⇔ MAR)のギャップは,上で検討した通り,欠測した最初の時点での(条件付き)分布のみである.

68

Page 217: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

B.4.4.3 補題

定理の証明の前に,補題を 3つ準備する.

補題 B.4.1. 単調な欠測のみであり,脱落時点ごとにパターンを作る場合,AMCV と以下の条件は同値.

∀t ≥ 2, ∀j ≤ t− 1に対して f(Yt |Yt−1, R = j) = f(Yt |Yt−1) (B.31)

証明. ACMV と (B.31)で tと j に関する条件は同じであるため,条件を満たす任意の t, j を 1つ固定して考え

る.まず,一般に以下の式が成り立つ.

f(Yt |Yt−1) =

t−1∑i=1

f(Yt |Yt−1, R = i) · P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1) (B.32)

最初に,ACMV ⇒(B.31) を示す.(B.32)の右辺を ACMV の性質を用いて変形すると,

f(Yt |Yt−1) =t−1∑i=1

f(Yt |Yt−1, R = i) · P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1)

=t−1∑i=1

f(Yt |Yt−1, R = j) · P (R = i |Yt−1)

+ f(Yt |Yt−1, R = j) · P (R ≥ t |Yt−1) (∵ ACMV の定義)

= f(Yt |Yt−1, R = j)t−1∑i=1

P (R = i |Yt−1) + f(Yt |Yt−1, R = j) · P (R ≥ t |Yt−1)

= f(Yt |Yt−1, R = j)

t−1∑i=1

P (R = i |Yt−1) + P (R ≥ t |Yt−1)

= f(Yt |Yt−1, R = j)

より,(B.31)は示された.

次に,(B.31) ⇒ ACMV を示す.(B.32)の両辺を (B.31)を用いて変形する.重要な式は f(Yt |Yt−1, R = 1) =

f(Yt |Yt−1, R = 2) = · · · = f(Yt |Yt−1, R = t− 1) = f(Yt |Yt−1)である.いま,j ≤ t− 1より,

f(Yt |Yt−1) =

t−1∑i=1

f(Yt |Yt−1, R = i) · P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1)

f(Yt |Yt−1, R = j) =

t−1∑i=1

f(Yt |Yt−1, R = j) · P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1)

(∵ j ≤ t− 1, (B.31))

= f(Yt |Yt−1, R = j)

t−1∑i=1

P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1)

となる.右辺の前半を移項すると,

f(Yt |Yt−1, R = j)− f(Yt |Yt−1, R = j)t−1∑i=1

P (R = i |Yt−1) = f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1)

f(Yt |Yt−1, R = j)

1−

t−1∑i=1

P (R = i |Yt−1)

= f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1)

f(Yt |Yt−1, R = j) · P (R ≥ t |Yt−1) = f(Yt |Yt−1, R ≥ t) · P (R ≥ t |Yt−1)

69

Page 218: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

となる.ここで,∀t ≥ 2に対して,P (R ≥ t |Yt−1) > 0を仮定しているので,

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t)

が成り立つ.以上の議論は ∀t ≥ 2, j ≤ t− 1について成り立つので,ACMV が示された.以上より,「(B.31)⇔ACMV」が示された.

補題 B.4.2. MAR が成り立つとき,1 ≤ t ≤ u ≤ T を満たす任意の自然数 t, uに対して,以下の式が成り立つ

P (R = t |Yu) = P (R = t |Yt)

証明. まず,u = tのときは明らかになり立つ.次に,u = T のときはMARの定義式であるため,これも自明

である.従って,残りの 1 ≤ ∀t < ∀u < T の場合のみ示せばよい.このとき,

P (R = t |Yu) =f(R = t,Yu)

f(Yu)

=

∫f(R = t,Yu,Y

Tu+1)dY

Tu+1

f(Yu)

=

∫f(R = t,YT )dY

Tu+1

f(Yu)

=

∫P (R = t |YT )f(YT )dY

Tu+1

f(Yu)

=

∫P (R = t |Yt)f(YT )dY

Tu+1

f(Yu)(∵ MAR)

=P (R = t |Yt)

∫f(YT )dY

Tu+1

f(Yu)(∵ u > t)

=P (R = t |Yt) · f(Yu)

f(Yu)

= P (R = t |Yt)

以上より,1 ≤ ∀t ≤ ∀u ≤ T の場合に,P (R = t |Yu) = P (R = t |Yt)が成り立つことが示された.

補題 B.4.3. 0 < i < j ≤ T を満たす任意の自然数 i, j について,以下が成り立つ.

f(Yji+1 |Yi) =

j−1∏t=i

f(Yt+1 |Yt)

証明. まず,任意の 3つの確率変数(ベクトル)X,Y, Z について

f(X,Y |Z) = f(X |Y, Z) · f(Y |Z)

であることを示す.

f(X,Y |Z) = f(X,Y, Z)

f(Z)

=f(X,Y, Z)

f(Y, Z)· f(Y,Z)f(Z)

= f(X |Y, Z) · f(Y |Z)

これをくり返し用いると,

f(Yji+1 |Yi) = f(Yj−1

i+1 , Yj |Yi)

70

Page 219: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

= f(Yj |Yj−1i+1 ,Yi) · f(Yj−1

i+1 |Yi)

= f(Yj |Yj−1) · f(Yj−2i+1 , Yj−1 |Yi)

= f(Yj |Yj−1) · f(Yj−1 |Yj−2i+1 ,Yi) · f(Yj−2

i+1 |Yi)

= f(Yj |Yj−1) · f(Yj−1 |Yj−2) · f(Yj−2i+1 |Yi)

...

= f(Yj |Yj−1) · f(Yj−1 |Yj−2) · · · f(Yi+1 |Yi)

=

j−1∏t=i

f(Yt+1 |Yt)

が成り立つ.

B.4.4.4 定理 B.4.1の証明

以下,定理 B.4.1の証明を述べる.

証明. 補題 B.4.1より,脱落時点ごとにパターンを作る場合,ACMV ⇔ (B.31) である.そのため,MAR ⇔(B.31)が示せればよい.以下,これを示す.

まず,MAR ⇒ (B.31)を示す.MAR から,∀j ≥ 1に対して,

f(YT , R = j) = P (R = j |YT ) · f(YT )

= P (R = j |Yj) · f(YT ) (∵ MAR) (B.33)

が成り立つ.次に,MAR から 1 ≤ ∀j < ∀t ≤ T のときに補題 B.4.2を利用して,

f(YT , R = j) = f(Yt,YTt+1, R = j)

= f(YTt+1 |Yt, R = j) · P (R = j |Yt) · f(Yt)

= f(YTt+1 |Yt, R = j) · P (R = j |Yj) · f(Yt) (∵ t > j より,補題 B.4.2から) (B.34)

これより,(B.33) = (B.34)から,

f(YTt+1 |Yt, R = j) · P (R = j |Yj) · f(Yt) = P (R = j |Yj) · f(YT )

∴ f(YTt+1 |Yt, R = j) =

f(YT )

f(Yt)=f(Yt,Y

Tt+1)

f(Yt)= f(YT

t+1 |Yt) (∵ P (R = j |Yj) > 0)

となる.これより,両辺をYTt+2 で積分すれば

f(Yt+1 |Yt, R = j) = f(Yt+1 |Yt)

となる.なお,t = T − 1のときは積分は不要で,t = T のときは (B.34)が

f(YT , R = j) = f(YT−1, YT , R = j)

= f(YT |YT−1, R = j) · P (R = j |YT−1) · f(YT−1)

= f(YT |YT−1, R = j) · P (R = j |Yj) · f(YT−1)

となるため,(B.33)と合わせて

f(YT |YT−1, R = j) · P (R = j |Yj) · f(YT−1) = P (R = j |Yj) · f(YT )

71

Page 220: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f(YT |YT−1, R = j) =f(YT )

f(YT−1)= f(YT |YT−1) (∵ P (R = j |Yj) > 0)

となる.以上を全てまとめると,「MAR ⇒(B.31)」が示された.

次に,(B.31) ⇒ MAR を示す.∀t ≥ 2, ∀j ≤ t− 1に対して,

f(YT , R = j) = f(Yj , R = j) · f(YTj+1 |Yj , R = j)

= f(Yj , R = j)T∏

t=j+1

f(Yt |Yt−1, R = j) (∵補題 B.4.3)

= f(Yj , R = j)T∏

t=j+1

f(Yt |Yt−1) (∵ (B.31))

= f(Yj , R = j) · f(Yj+1 |Yj) · f(Yj+2 |Yj+1) · · · f(YT |YT−1) (∵補題 B.4.3)

= f(Yj , R = j) · f(YTj+1 |Yj)

= P (R = j |Yj) · f(Yj) · f(YTj+1 |Yj)

= P (R = j |Yj) · f(YT ) (B.35)

となる.一方,一般に

f(YT , R = j) = P (R = j |YT ) · f(YT ) (B.36)

が成り立つ.これより,(B.35),(B.36)の右辺が等しいことから,

P (R = j |Yj) · f(YT ) = P (R = j |YT ) · f(YT )

となる.ここで,f(YT ) > 0を仮定しているので,

P (R = j |Yj) = P (R = j |YT )

となる.これが ∀t ≥ 2, ∀j ≤ t− 1に対して成り立つので,1 ≤ ∀j ≤ T − 1に対して成り立つ.j = T のとき

は自明である.従って,「(B.31) ⇒MAR」が示された.

以上より,「MAR ⇔ (B.31)」が成り立ち,補題 B.4.1より「MAR ⇔ ACMV」が示された.

B.4.5 NFMVとNFDの同値性の証明

ACMV とMARの同値性の証明と同様の議論で,NFMVと NFDの同値性が示せる.以下の定理を証明する.

定理 B.4.2. 単調な欠測のみであり,脱落時点ごとにパターンを作る場合,NFMV ⇔ NFDが成り立つ.

証明は,基本的には Kenward (2003)に従うが,誤植の訂正と一部を修正したものを示す.

B.4.5.1 用語の整理

まず,用語の整理をする.NFD (Non Future Dependence)とは ∀t ≥ 1に対して,以下が成り立つときにいう.

P (R = t |YT ) = P (R = t |Yt+1)

NFMV とは ∀t ≥ 3, ∀j ≤ t− 2に対して,以下が成り立つときにいう.

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t− 1)

なお,この式は f(Yt |Yt−1, R = 1) = f(Yt |Yt−1, R = 2) = · · · = f(Yt |Yt−1, R = t−2)の形でもよく用いる.72

Page 221: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

B.4.5.2 仮定の整理

定理 B.4.1と同様に,以下の 2つを仮定する.

• 1 ≤ ∀j ≤ T, 1 ≤ ∀t ≤ T, に対して P (R = j |Yt) > 0.

• ∀Yj に対して,f(Yj) > 0.

B.4.5.3 補題

定理の証明の前に,「ACMV ⇔ MAR」の証明の際と同様の補題を 2つ準備する.

補題 B.4.4. 単調な欠測のみであり,脱落時点ごとにパターンを作る場合,NFMV と以下の条件は同値.

∀t ≥ 3,∀j ≤ t− 2に対して f(Yt |Yt−1, R = j) = f(Yt |Yt−1) (B.37)

証明. NFMV と (B.37)で tと j に関する条件は同じであるため,条件を満たす t, j を 1つ固定して考える.

f(Yt |Yt−1) =t−2∑i=1

f(Yt |Yt−1, R = i) · P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1)

(B.38)

を用いる.最初に,NFMV ⇒(B.37) を示す.(B.38)の右辺を NFMV の性質を用いて変形すると,

f(Yt |Yt−1) =t−2∑i=1

f(Yt |Yt−1, R = i) · P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1)

=t−2∑i=1

f(Yt |Yt−1, R = j) · P (R = i |Yt−1)

+ f(Yt |Yt−1, R = j) · P (R ≥ t− 1 |Yt−1) (∵ (NFMV の定義))

= f(Yt |Yt−1, R = j)t−2∑i=1

P (R = i |Yt−1) + f(Yt |Yt−1, R = j) · P (R ≥ t− 1 |Yt−1)

= f(Yt |Yt−1, R = j)

t−2∑i=1

P (R = i |Yt−1) + P (R ≥ t− 1 |Yt−1)

= f(Yt |Yt−1, R = j)

より,「NFMV ⇒(B.37)」は示された.

次に,(B.37) ⇒ NFMV を示す.(B.38)の両辺を (B.37)を用いて変形する.重要な式は f(Yt |Yt−1, R = 1) =

f(Yt |Yt−1, R = 2) = · · · = f(Yt |Yt−1, R = t− 2) = f(Yt |Yt−1)である.

f(Yt |Yt−1) =t−2∑i=1

f(Yt |Yt−1, R = i) · P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1)

f(Yt |Yt−1, R = j) =t−2∑i=1

f(Yt |Yt−1, R = j) · P (R = i |Yt−1)

+ f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1) (∵ (B.37))

= f(Yt |Yt−1, R = j)t−2∑i=1

P (R = i |Yt−1) + f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1)

右辺の前半を移項すると,

f(Yt |Yt−1, R = j)− f(Yt |Yt−1, R = j)

t−2∑i=1

P (R = i |Yt−1) = f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1)

73

Page 222: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

f(Yt |Yt−1, R = j)

1−

t−2∑i=1

P (R = i |Yt−1)

= f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1)

f(Yt |Yt−1, R = j) · P (R ≥ t− 1 |Yt−1) = f(Yt |Yt−1, R ≥ t− 1) · P (R ≥ t− 1 |Yt−1)

となる.ここで,∀t ≥ 2に対して,P (R ≥ t− 1 |Yt−1) > 0を仮定しているので,

f(Yt |Yt−1, R = j) = f(Yt |Yt−1, R ≥ t− 1)

が成り立つ.これより,「(B.37) ⇒NFMV」が示された.

以上より,「(B.37)⇔ NFMV」が示された.

補題 B.4.5. NFDが成り立つとき,1 ≤ t < u ≤ T を満たす任意の自然数 t, uに対して,以下の式が成り立つ

P (R = t |Yu) = P (R = t |Yt+1)

証明. u = T のときは,NFDの定義より明らかである.従って,以下,1 ≤ ∀t < ∀u < T に対して示す.

P (R = t |Yu) =f(R = t,Yu)

f(Yu)

=

∫f(R = t,Yu,Y

Tu+1)dY

Tu+1

f(Yu)

=

∫f(R = t,YT )dY

Tu+1

f(Yu)

=

∫P (R = t |YT )f(YT )dY

Tu+1

f(Yu)

=

∫P (R = t |Yt+1)f(YT )dY

Tu+1

f(Yu)(∵ NFD)

=P (R = t |Yt+1)

∫f(YT )dY

Tu+1

f(Yu)(∵ u > t)

=P (R = t |Yt+1) · f(Yu)

f(Yu)

= P (R = t |Yt+1)

となる.以上より,1 ≤ ∀t < ∀u ≤ T に対して,P (R = t |Yu) = P (R = t |Yt+1)が成り立つことが示され

た.

B.4.5.4 定理 B.4.2の証明

以下,定理 B.4.2の証明を述べる.

証明. 補題 B.4.4より,脱落時点ごとにパターンを作る場合,NFMV ⇔ (B.37) である.そのため,「NFD ⇔(B.37)」を示せば良い.

まず,NFD⇒ (B.37)を示す.NFDから,∀j ≥ 1に対して,

f(YT , R = j) = P (R = j |YT ) · f(YT )

= P (R = j |Yj+1) · f(YT ) (∵ NFD) (B.39)

74

Page 223: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

が成り立つ.次に,補題 B.4.5を利用して,t ≥ 3, j ≤ t− 2を満たす tに対して,

f(YT , R = j) = f(Yt,YTt+1, R = j)

= f(YTt+1 |Yt, R = j) · P (R = j |Yt) · f(Yt)

= f(YTt+1 |Yt, R = j) · P (R = j |Yj+1) · f(Yt) (∵ t > j より,補題 B.4.5から) (B.40)

となる.これより,(B.39) = (B.40)から,

f(YTt+1 |Yt, R = j) · P (R = j |Yj+1) · f(Yt) = P (R = j |Yj+1) · f(YT )

∴ f(YTt+1 |Yt, R = j) =

f(YT )

f(Yt)=f(Yt,Y

Tt+1)

f(Yt)= f(YT

t+1 |Yt) (∵ P (R = j |Yj+1) > 0)

となる.これより,両辺をYTt+2 で積分すれば

f(Yt+1 |Yt, R = j) = f(Yt+1 |Yt)

となる.t = T − 1の場合は積分が不要で,t = T の場合は,

f(YT , R = j) = f(Yt,YTt+1, R = j)

= f(YT |YT−1, R = j) · P (R = j |YT−1) · f(YT−1)

= f(YT |YT−1, R = j) · P (R = j |Yj+1) · f(YT−1)

となることから同様に示される.

以上より,「NFD⇒ (B.37)」が示された.

次に,(B.37) ⇒ NFD を示す.∀t ≥ 3, ∀j ≤ t− 2に対して,

f(YT , R = j) = f(Yj+1, R = j) · f(YTj+2 |Yj+1, R = j)

= f(Yj+1, R = j)T∏

t=j+2

f(Yt |Yt−1, R = j) (∵補題 B.4.3)

= f(Yj+1, R = j)T∏

t=j+2

f(Yt |Yt−1) (∵ (B.37))

= f(Yj+1, R = j) · f(Yj+2 |Yj+1) · f(Yj+3 |Yj+2) · · · f(YT |YT−1)

= f(Yj+1, R = j) · f(YTj+2 |Yj+1) (∵補題 B.4.3) 

= P (R = j |Yj+1) · f(Yj+1) · f(YTj+2 |Yj+1)

= P (R = j |Yj+1) · f(YT ) (B.41)

となる.一方,一般に

f(YT , R = j) = P (R = j |YT ) · f(YT ) (B.42)

が成り立つ.これより,(B.41),(B.42)の右辺が等しいことから,

P (R = j |Yj+1) · f(YT ) = P (R = j |YT ) · f(YT )

となる.いま,f(YT ) > 0を仮定しているので,

P (R = j |Yj+1) = P (R = j |YT )

となる.これが ∀t ≥ 3, ∀j ≤ t− 2に対して成り立つので,1 ≤ ∀j ≤ T − 2については成り立つ.j = T − 1

の場合は自明のため,「(B.37) ⇒NFD」が示された.

以上より,「NFD⇔ (B.37)」が成り立ち,補題 B.4.4より「NFD ⇔ NFMV」が示された.

75

Page 224: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

参考文献

[1] Diggle, P. and Kenward, M. G. (1994). Informative drop-out in longitudinal data analysis.Journal of Applied

Statistics, 43, 49-93.

[2] Kenward, M. G., Molenberghs, G., and Thijs, H. (2003). Pattern-mixture models with proper time dependence.

Biometrika, 90(1), 53-71.

[3] Mallinckrodt, C. H. (2013).Preventing and treating missing data in longitudinal clinical trials. Cambridge

University Press.

[4] Molenberghs, G., Michiels, B., Kenward, M. G., and Diggle, P. J. (1998). Monotone missing data and pattern-

mixture models.Statistica Neerlandica, 52(2), 153-161.

[5] Nelder, J. A., and Mead, R. (1965a). A simplex method for function minimization.The computer journal, 7(4),

308-313.

[6] Nelder, J. A., and Mead, R. (1965b). A simplex method for function minimization - errata.The computer journal,

8(1), 27.

[7] National Research Council. (2010).The prevention and treatment of missing data in clinical trials. National

Academy Press.

[8] Seaman, S., Galati, J., Jackson, D., and Carlin, J. (2013). What Is Meant by“Missing at Random”?.Statistical

Science, 28(2), 257-268.

[9] Verbeke, G., and Molenberghs, G. (2000).Linear mixed models for longitudinal data. Springer.

76

Page 225: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

Appendix C SASマクロの紹介

C.1 はじめに

DIA (Drug Information Association) Scientific Working Group on Missing Data(以下,DIA working group)は

欠測データの取扱いについて,近年出されたガイダンスを踏まえて,欠測の防止と解析における取扱いについ

てコンセンサスを報告したMallinckrodt et al. (2013).DIA working groupの成果の一部として,欠測データの

感度分析に利用可能な SASマクロが,ウェブサイト(http://missingdata.lshtm.ac.uk/)に公開されている.サイ

トのメインメニューから DIA working groupをクリックすると,感度分析の手法ごとに整理された情報へのリ

ンクが表示される(図 C.1).DIA working groupから公開されている SASマクロの一覧を表 C.1に示した.本

タスクフォースでは報告書の付録として,当レポートに含まれるシミュレーションに使用した主なマクロにつ

いて,日本語による簡単な仕様を整備した資料をまとめた.それぞれの SASマクロについて,プログラムの目

的,引数の指定及び実行方法を中心に説明した.なお,プログラムのバリデーションを保証するものではなく,

使用者の責任において利用していただきたい.

図 C.1: DIA working groupの SASマクロへのアクセス

77

Page 226: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

表 C.1: DIA working groupの公開マクロ一覧

カテゴリ サブカテゴリ パッケージ名と手法 本報告書

で仕様を

整備

Descriptive

Summaries

SAS Code for Descriptive Summaries

and Plot

Descriptive Statistics:記述統計

Inclusive

Modeling

Approaches

Vansteelandt’s Doubly Robust Estima-

tion Method

Dbrobust:VansteelandtのDoubly Ro-

bustな方法

Direct Likelihood Approach Including

Influence and Residual Diagnosis

Direct Likelihood:MMRM

Inclusive Multiple Imputation (MI)

and Weighted Generalized Estimation

Equation (wGEE)

MI Inclusive and WGEE:共変量を追

加したMI, WGEE

Missing Not

at Random

(MNAR)

Methods

Pattern Mixture Model PMM Identifiability Constraints:

CCMV および NCMV 制約条件のも

とでのパターン混合モデルによる解

析.

Shared Parameter Model SPM:Shared Parameter Modelによる

解析.

Selection Model Selection Model:選択モデルによる感

度パラメータを用いた解析.

Control-

Based

Multiple

Imputation

Reference-based MI via Multivariate

Normal Repeated measures (MNRM)

Five Macros:5種類(CIR, J2R, CR,

ALMCFおよびOLMCF)のパターン

混合モデルによる解析.

Placebo MI including Tipping Point

Analysis with Delta-Adjusting Imputa-

tion

PMM Delta Tipping Point and CBI:パ

ターン混合モデルによる感度パラメー

タを用いた解析.Placebo multiple im-

putationによる解析.

Example

Datasets

サンプルデータセット.

参考文献

Mallinckrodt, C. H., Roger, J., Chuang-Stein, C., Molengerghs, G., Lane, P. W., O’Kelly, M., Ratitch, B., Xu, Lei.,

Gilbert, S., Mehrotra, D. V., Wolfinger, R., and Thijs, H. (2013), Missing Data: Turning Guidance into Action.

Statistics in Biopharmaceutial Research. 5, 369-382

78

Page 227: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

C.2 プログラム仕様書:Selection_Model2

C.2.1 基本情報と実行方法

基本情報

ファイル名 Selection_Model2

解析目的 Diggle and Kenward (1994)の選択モデル(MAR, MNAR)による欠

測のある経時データの感度解析を実施するプログラム.

本文との対応 5章 Selection Model

引用先 http://www.missingdata.org.uk/                 

下記のメニューよりアクセス可能.              

DIA working group→ Missing Not at Random (MNAR) Methods→Selection Model  

SASプロダクト Base SAS, SAS/Stat, SAS/IML

実行方法

実行例             

%Selection_Model2(                  INPUTDS = HMGR,       COVTYPE =UN,        

response = change,              MODL = seq therapy seq*therapy basval basval*seq,

CLASVAR = seq therapy,     mech= MNAR,         psi5=-.02, psi6=-.02,       const= 8,            derivative= 1,          out1 = HMGR_estimates,     out2 = HMGR_lsmeandifferences, out3 = HMGR_lsmeans      

);              

実行結果  

Out1:パラメータの推定値   Out2:時点ごとの群間差    Out3:時点ごとの最小二乗平均値

C.2.2 引数

引数

引数名 区分 指定例 初期値 説明

INPUTDS 必須 INPUTDS=HMGR 入力データセット名.

COVTYPE 必須 COVTYPE=UN 被験者内分散共分散構造.UN, TOEP,

TOEPH, ARH, AR, CSH, CSのいずれか

を指定できる.Proc mixedのヘルプを参

照.

response 必須 Response= change 応答変数名.

79

Page 228: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

引数

引数名 区分 指定例 初期値 説明

MODL 必須 model = seq therapy

seq*therapy basval

basval*seq

応答変数のモデルに含まれる項を指定.

応答変数の指定は含まない.Proc mixed

のモデル指定方法とまったく同じではな

い.

CLASVAR CLASVAR = seq therapy カテゴリカル変数の指定.

mech 必須 mech= MNAR 欠測メカニズムの指定.MCAR MAR

MNAR: 欠測モデルのパラメータ(ψ5,

ψ6)も推定.MNARS: MNARの特別な

場合.ユーザは欠測モデルのパラメータ

(ψ5, ψ6)を指定する必要がある.

psi5 psi5 = -.02 0 感度パラメータ(5章の ψ5).欠測メカ

ニズムが,mech=MNARSの場合のみ指

定する必要がある.値は一番目の投与群

について,-0.1から 0.1の間を指定する.

(注)マクロの誤記の可能性あり(マク

ロ中のサンプルプログラムで-1~1が指

定されており,実行できた).

psi6 psi6 = -.02 0 感度パラメータ(5章の ψ6).欠測メカ

ニズムが,mech=MNARSの場合のみ指

定する必要がある.値は二番目の投与群

について,-0.1から 0.1の間を指定する.

const const= 8 8 積分範囲のパラメータ.デフォルトは 8.

この場合,(µ-8σ, µ+8σ).3から 8の間

を指定することを推奨.µと σは,症例

ごとの応答変数の平均と分散の期待値.

derivative 必須 derivative = 1 偏導関数を解析的に計算するかどうかの

指定.1: 解析的に偏導関数を計算する.

Loglikderivativeを使用.0:有限差分法に

より偏導関数を計算する.

out1 必須 out1 = HMGR_estimates 解析結果を出力するデータセット名の指

定.全ての推定値を含む.

out2 必須 out2 =

HMGR_lsmeandifferences

解析結果を出力するデータセット名の指

定.全ての対比較の最小二乗平均を含む.

out3 必須 out3 = HMGR_lsmeans 解析結果を出力するデータセット名の指

定.時点ごとの最小二乗平均と標準誤差

を含む.

C.2.3 マクロの説明

ユーザは 2種類のマクロを使用して解析を実施できる.Selection_Model2は感度パラメータを含めた全パ

ラメータを推定することができるマクロであり,SM_GridSearchは感度パラメータ(ψ5 および ψ6)をユー

80

Page 229: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

ザが指定するマクロである.Selection_Model2:ユーザが使用する主要なマクロ. Selection_Modelは"initial"お

よび"SeM"を呼び出す.ユーザが"initial" と"SeM"を直接呼び出すことはない.Initial: (1)proc logisticで使用す

るデザイン行列,(2) proc mixedを用いて MMRM の解析を行うことで,Selection Modelの計算の初期値を求

める,および,(3)ユーザが指定する共分散構造を生成する.また,完全データ(すべての被験者のすべての

visitのデータ)を生成する.SeM2:主要な最適化ルーチン.いくつかの proc imlのコードから成る.最初にデ

ザイン行列を正しい形式に調整する.次に二つの関数,loglik と loglikderivativeが定義される.Loglik は,対

数尤度を算出する.Loglikderivativeは対数尤度のパラメータに関する導関数を計算する.その後 SASに内蔵

された最適化ルーチン”nlpnrr”が呼び出され最尤推定量が算出される.“ derivative”の値によって,”nlpnrr”

は,”loglikderivate”または有限差分法を用いて,導関数およびヘッセ行列を算出する.最適化完了後,SASの”

nlpfdd”(有限差分法)により,最適化パラメータのもとでのヘッセ行列が算出される.その後,時点ごとの最

小二乗平均値および群間差を算出する.アウトプットはレポートを作成するために使用可能なデータセットで

ある.推定値および最小二乗平均値は proc printにより出力することもできる.SM_GridSearchは,psi5gridと

psi6gridで指定した複数の psi5および psi6で Selection_Model2を実行するマクロ.

C.2.4 使用上の注意

1. 複数の投与群を比較できる.

2. Visitの変数名は"seq"とする.

3. 投与群の変数名"therapy"とする.

4. 被験者 ID の変数名は"patient"とする.

5. モデルは基本的に正確ではないが,良い近似とみなすことができる.

6. 選択モデルは積分を含み,SASに内蔵された非線形最適化機能を利用して計算を行うため非常に遅い.

7. 改善方法としては,ヘッセ行列の計算を有限差分法を使用せずに計算することが考えられる.

8. 収束しない場合があるのでログファイルを確認しなければならない.

9. 注意:コードは極端な場合についてはテストされていない.

10. 推奨: "derivative = 1"を推奨する."derivative = 0"と比較して速いので.(10分対 30分),しかし,積分

が収束しない場合があり,そのときは"derivative=0"に変更するとよい.

11. 詳細および選択モデルの数学的な導出についてはリクエストがあれば提供する1.

C.2.5 その他:参考文献

1.Diggle, P.& Kenward, M. G. (1994). Informative drop-out in longitudinal data analysis.Applied Statistics.

43(1), 49-93.

1提供するのはマクロらの作成者であり,本報告書作成者ではない.

81

Page 230: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

C.3 プログラム仕様書:cbi_pmm

C.3.1 基本情報と実行方法

基本情報

ファイル名 cbi_pmm

解析目的 Pattern mixture modelにより,欠測のある経時データの感度解析を

実施するプログラム.欠測後のデータが対照群と同様のふるまいを

すると仮定して補完を行う (Control based imputation).

本文との対応 6章 Pattern Mixture Model

10章感度分析の実行

引用先 http://www.missingdata.org.uk/                 

下記のメニューよりアクセス可能.              

DIA working group→ Control-Based Multiple Imputation→ Placebo

MI including Tipping Point Analysis with Delta-Adjusting Imputation

SASプロダクト Base SAS and SAS/STAT

実行方法

実行例                   

%cbi_pmm(            datain=data0s,   trtname=trt,    subjname=id,    visname=visit,

      basecont=%str(v0),   baseclass=,

      postcont=%str(val),   postclass=,

     seed=34535499,   nimp=100,

     primaryname=val,        analcovarcont=%str(v0),

  trtref=0,       analmethod=mmrm,

   repstr=un,        dataout=data0imputed,      resout=pmmresults

);

実行結果  Resoutで指定した名前のデータセットに,各時点での推定値,群間

差,群間差の検定などの統計量が出力される.また,SASのOutput

ウィンドウに出力される.

C.3.2 引数

引数

引数名 区分 指定例 初期値 説明

datain 必須 入力データセット名.

82

Page 231: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

引数

引数名 区分 指定例 初期値 説明

trtname 必須 trtname=trt 投与群を指定する数値変数名.

subjname 必須 subjname=subjid 被験者 ID の変数名.

visname 必須 visname=timeptn Visit の ID の変数名.Visit は 0

(ベースライン)を始まりとする

連続した数値.(0,1,2,…)

poolsite 任意 poolsite=invid 施設の ID の変数名.

basecont 任意 共変量の変数のリスト.ベースラ

インの連続値.補完モデルで使用

される.

baseclass 任意 共変量の変数名のリスト.補完モ

デルで使用されるカテゴリカル変

数.解析モデルに含まれる変数も,

ここで指定する.

postcont 必須 postcont=%str(SCOREPR

SCORESC)

投与後の変数.補完モデルで使用

される変数.プライマリエンドポ

イントを必ず含む.解析モデルに

含まれる変数も,ここで指定する.

postclass 任意 postclass=%str(SCORETR

SCOREOT)

投与後の変数.補完モデルで使用

される変数.解析モデルに含まれ

る変数も,ここで指定する.

seed 任意 seed=123456 345354 乱数のシード.

nimp 任意 nimp=1000 100 補完の回数.

primaryname 必須 主要エンドポイントの変数名.

analcovarcont 任意 解析モデルの共変量(連続値)

analcovarclass 任意 解析モデルの共変量(カテゴリ値)

trtref 必須 0 プラセボまたは実薬対照群の水準.

analmethod 必須 analmethod=%str(mmrm) ancova Imputeされたデータの解析手法.

ancovaまたはmmrmを指定可能.

デフォルトは ancova.

repstr 任意 repstr=un 共分散構造の指定.解析モデ

ルが analmethod=mmrmの場合

に指定する.type=unのときは,

DDFM=KRが使用される.

dataout 任意 pmmimputations 補完後の完全データセット名.

resout 任意 pmmresults 解析結果のデータセット名.

C.3.3 マクロの説明

cbi_pmm:ユーザが直接呼び出すマクロ.83

Page 232: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

C.3.4 使用上の注意

proc MIによる単調な欠測の回帰モデルによる補完を行う.非単調な欠測については MAR を仮定し,proc

MI MCMC により補完を行う.この仮定があてはまらない場合は,他の方法で非単調な欠測を補完したのち,

このマクロにより,単調な欠測を補完することができる.

C.3.5 その他:参考文献

1.Ratitch B, O’Kelly M. Implementation of Pattern-Mixture Models Using Standard SAS/STAT Procedures.

PharmaSUG 2011. Available athttp://pharmasug.org/proceedings/2011/SP/PharmaSUG-2011-SP04.pdf

84

Page 233: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

C.4 プログラム仕様書:delta_pmm

C.4.1 基本情報と実行方法

基本情報

ファイル名 delta_pmm

解析目的 Pattern mixture modelにより,欠測のある経時データの感度解析を

実施するプログラム.感度パラメータを用いた感度分析を含む.

本文との対応 6章 Pattern Mixture Model

10章感度分析の実行

引用先 http://www.missingdata.org.uk/                

 下記のメニューよりアクセス可能.             

  DIA working group→ Missing Not at Random (MNAR) Methods

→ Placebo MI including Tipping Point Analysis with Delta-Adjusting

Imputation

SASプロダクト Base SAS, SAS/Stat

実行方法

実行例                              

%delta_pmm(    datain=data0,

trtname=trt,subjname=patient,visname=visit,poolsite=poolinv,basecont=%str(basval),baseclass=%str(gendern),postcont=%str(hamdtl17 hamatotl),postclass=%str(pgiimp),seed=34535499,nimp=100,deltavis=all,deltacont=%str(1 0.2),deltacontarm=%str(1 1),deltacontmethod=%str(meanabs meanper),favorcont=%str(low low),deltacontlimit=%str(),deltaclass=%str(0.5),deltaclassarm=%str(1),favorclass=%str(low),deltaclasslimit=%str(7),primaryname=hamdtl17,analcovarcont=%str(basval basval*visit),analcovarclass=%str(poolinv),trtref=0,

analmethod=mmrm,repstr=un,dataout=data0imputed2,resout=pmmresults2);  

85

Page 234: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

実行結果 Resoutで指定した名前のデータセットに,各時点での推定値,群間

差,群間差の検定などの統計量が出力される.また,SASのOutput

ウィンドウに出力される.

C.4.2 引数

引数

引数名 区分 指定例 初期値 説明

datain 必須 入力データセット名.

trtname 必須 trtname=trt 投与群を指定する数値変数名.

subjname 必須 subjname=subjid 被験者 ID の変数名.

visname 必須 visname=timeptn Visit の ID の変数名.Visit は 0

(ベースライン)を始まりとする

連続した数値.(0,1,2,…)

poolsite 任意 poolsite=invid 施設の ID の変数名.

basecont 任意 共変量の変数のリスト.ベースラ

インの連続値.補完モデルで使用

される.

baseclass 任意 共変量の変数名のリスト.補完モ

デルで使用されるカテゴリカル変

数.解析モデルに含まれる変数も,

ここで指定する.

postcont 必須 postcont=%str(SCOREPR

SCORESC)

投与後の変数.補完モデルで使用

される共変量.プライマリエンド

ポイントを必ず含む.解析モデル

に含まれる変数も,ここで指定す

る.

postclass 任意 postclass=%str(SCORETR

SCOREOT)

投与後の変数.補完モデルで使用

される共変量.解析モデルに含ま

れる変数も,ここで指定する.

seed 任意 seed=123456 345354 乱数のシード.

nimp 任意 nimp=1000 100 補完の回数.

deltavis 任意 deltavis=%str(all) first Delta adjustmentを欠測した最初

の visit のみで行うか,欠測した

visitから後のすべての visitで行う

かを指定する.allまたは firstを指

定可能. NRC(2010)では firstを

用いた感度分析が記載されている.

86

Page 235: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

引数

引数名 区分 指定例 初期値 説明

deltacont 任意 deltacont=%str(1 0.1) postcontで指定した変数に対す

る delta パラメータのリスト.

スペースで区切る.指定しな

い場合は,MAR にもとづく多

重補完を行う.指定した値を

加えるか引くかは,favorcont

オプションにより指定される.

Mean delta adjustment (deltacon-

tmethod=meanabs)の場合:delta

パラメータを数値で指定する.割

合による Mean delta adjustment

(deltacontmethod=meanper): 0

から 1 の間の数値で指定する.

MAR で補完される値の割合.傾

き(deltacontmethod=slopeper)

の場合: 0から 1の間の数値で指

定する.前の visitからの変化.

deltacontarm 任意 deltacontarm=%str(1 0,1) どの投与群において delta adjust-

mentを行うかを指定する.スペー

スで区切る.指定する項目数は

postcontで指定した変数の数と一

致させる.例の場合,postcontで指

定した 1個目の変数については投

与群1でのみdelta adjustmentを行

う.2個目の変数については,両方

の投与群 (0,1)で delta adjustment

を行う.

deltacontmethod任意 deltacontmethod=%str(meanabs

slopeper)

Delta adjustmentの手法を指定す

るキーワードのリスト.Postcont

で指定した変数のそれぞれにつ

いて指定する.項目はスペース

で区切る.使用可能なキーワード

は,meanabs, meanper, slopeperの

3個.

favorcont 任意 favorcont=%str(low high) 応答変数の状態がよい方向を指定

するキーワードのリスト.スペー

スで区切る.Postcontで指定した

変数のそれぞれについて指定する.

Lowまたは highを指定する.

87

Page 236: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

引数

引数名 区分 指定例 初期値 説明

deltacontlimit 任意 deltacontlimit=%str(0 10) それぞれの変数の限界値を指定し

た数値のリスト.Postcontで指定

したそれぞれの変数に対する最悪

の値をスペースで区切って指定す

る.

deltaclass 任意 deltaclass=%str(0.1 0.2) postclassで指定した変数に対する

deltaパラメータのリスト.スペー

スで区切る.指定しない場合は,

MARにもとづく多重補完を行う.

カテゴリが悪化する確率.改善す

る方向は,favorclassオプションに

より指定される.

deltaclassarm 任意 deltaclassarm=%str(1 0,1) どの投与群において delta adjust-

mentを行うかを指定する.スペー

スで区切る.指定する項目数は

postclassで指定した変数の数と一

致させる.例の場合,postclassで

指定した 1個目の変数については

投与群 1 でのみ delta adjustment

を行う.2個目の変数については,

両方の投与群 (0,1)で delta adjust-

mentを行う.

favorclass 任意 favorclass=%str(low high) 応答変数の状態がよい方向を指定

するキーワードのリスト.スペー

スで区切る.Postclassで指定した

変数のそれぞれについて指定する.

Lowまたは highを指定する.

deltaclasslimit 任意 deltaclasslimit=%str(0 5) それぞれの変数の限界値を指定し

た数値のリスト.Postclassで指定

したそれぞれの変数に対する最悪

の値をスペースで区切って指定す

る.

primaryname 必須 主要エンドポイントの変数名.

analcovarcont 任意 解析モデルの共変量(連続値).

analcovarclass 任意 解析モデルの共変量(カテゴリ値)

trtref 必須 プラセボまたは実薬対照群の水準.

analmethod 必須 analmethod=%str(mmrm) Imputeされたデータの解析手法.

ancovaまたはmmrmを指定可能.

デフォルトは ancova.

88

Page 237: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

引数

引数名 区分 指定例 初期値 説明

repstr 任意 repstr=unr 共分散構造の指定.解析モデルが

analmethod=mmrmの場合に指定

する.

dataout 任意 myimputations 補完後の完全データセット名.

resout 任意 pmmresults 解析結果のデータセット名.

C.4.3 マクロの説明

delta_pmm:ユーザが直接呼び出すマクロ.

C.4.4 使用上の注意

このマクロは,単調な欠測について,(1) MARの仮定,または,(2)脱落した被験者については,脱落後の

visitにおける有効性の指標が,脱落しなかった被験者に比べて低くなるという仮定の,いずれかの仮定にもと

づく欠測値の補完を行うことができる.

C.4.5 その他:参考文献

1. National Research Council. Panel on Handling Missing Data in Clinical Trials. Committee on National Statis-

tics, Division of Behavioral and Social Sciences and Education.The Prevention and Treatment of Missing Data

in Clinical Trials. The National Academies Press: Washington, DC; 2010.

2. Van Buuren S., Boshuizen, H.C., and Knook, D.L. Miltiple Imputation of Missing Blood Pressure Covariates

in Survival Analysis.Statistics in Medicine, 1999(18), 681-694.

3. Bohdana Ratitch, Michael O’Kelly and Robert Tosiello. Missing Data in Clinical Trials: from Clinical As-

sumptions to Statistical Analysis Using Pattern Mixture Models.Pharmaceutical Statistics, 2013,(12) 337―

347

89

Page 238: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

C.5 プログラム仕様書:Shared_Parameter1

C.5.1 基本情報と実行方法

基本情報

ファイル名 Shared_Parameter1

解析目的 Shared Parameter Modelにより,欠測のある経時データの感度分析を実施するプ

ログラム.

本文との対応 7章 Shared Parameter Model

引用先 http://www.missingdata.org.uk/                      

 下記のメニューよりアクセス可能.                   

DIA working group→ Missing Not at Random (MNAR) Methods       

→ Shared Parameter Model   

SASプロダクト Base SAS,SAS/Stat,SAS/IML

実行方法

実行例         

%shared_parameter(  INPUTDS=TEMP,SUBJVAR=PATIENT,TRTVAR=DRUG,TIME=SWK,Additional_Class=%STR(POOLINV GENDER),MODL=%STR(CHANGE=POOLINV BASE DRUG SWK SWK*DRUG),LINK=%STR(CLOGLOG),RANDOM_SLOPE=%STR(LINEAR),DEBUG=0);  

実行結果 _SP_OUT_FINAL(出力データセット名)

C.5.2 引数

引数

引数名 区分 指定例 初期値 説明

INPUTDS 必須 INPUTDS=TEMP 入力データセット名

を指定する.

SUBJVAR 必須 SUBJVAR=PATIENT 被験者 ID の変数を

指定する.

TRTVAR 必須 TRTVAR=DRUG 投与群の変数を指定

する.0:プラセボ群

1:実薬群

TIME 必須 TIME=SWK 解析に用いる連続的

な時間変数を指定す

る.

90

Page 239: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

引数

引数名 区分 指定例 初期値 説明

QUADTIME 任意 QUADTIME=QUADWEEK 必要に応じて,連続

的な時間の二乗変数

を指定する.

Additional_Class 任意 Additional_Class=%STR(POOLINV

GENDER)

必 要 に 応 じ て ,

MODL の引数に含

まれるカテゴリカル

変数を追加で指定す

る.PROC MIXED

の CLASSステート

メントで指定するよ

うな変数を用いる

(ただし,SUBJVAR

と TRTVAR で指定

された変数は除く).

LINK 任意 LINK=%STR(CLOGLOG) CLOGLOG 脱落確率モデルを指

定する(下記 2 通

り).      

 ・CLOGLOG  

 ・LOGIT

MODL 必須 MODL=%STR(CHANGE=POOLINV

BASE DRUG SWK SWK*DRUG)

応答変数モデルを

指定する.PROC

MIXED の MODEL

ステートメントで

指定するようなモ

デルを用いる(固定

効果の部分).

RANDOM_SLOPE 必須 RANDOM_SLOPE=%STR(LINEAR) 応答変数モデルと脱

落確率モデルの両者

で共有される変量効

果を指定する(下記

の 3通り).   

 ・NONE    

 ・LINEAR   

 ・QUAD

CRIT 任意 CRIT=0.0001 0.0001 小数点を持つ時間変

数の出力桁数を指定

する.

DEBUG 任意 DEBUG=0 0 DEBUG=1と指定す

ると実行時の中間

データセットを削除

せずに残す.

91

Page 240: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

C.5.3 マクロの説明

欠測のある経時データに用いられる shaped parameter modelに適合している.

【応答変数モデル】変量効果を用いたMixedモデルに従う.

Yi = Xiβ + ZiUi + ϵi (C.1)

【脱落確率モデル】デフォルトでは,Complementary log-log linkモデルが用いられる.なお,(C.2)式と C.3)式

は等価である.

log(− log(1− Prob(Di = j |Di ≥ j))) = Wiα+ ΓiUi (C.2)

log(− log(1− Prob(Di ≤ j)) = Wiα+ ΓiUi (C.3)

(C.4)

また,LINK=%STR(CLOGLOG)の指定により,ロジットモデルを用いることもできる.

logit(Prob(Di ≤ j)) =Wi ∗ α+ Γ ∗ Ui (C.5)

【変量効果の指定】

応答変数モデルと脱落確率モデルは,潜在的な(観測できない)変量効果ベクトル Ui によって結合される.

RANDOM_SLOPE=STR(XXXX)の指定により,下記の 3つのオプションを選択できる.

• NONE:両方のモデルに,共通の変量切片が入る

• LINEAR:両方のモデルに共通の変量効果として,切片と時間の 1次の係数の 2つが入る

• QUAD:両方のモデルに共通の変量効果として,切片と時間の 1次の係数と 2次の係数の 3つが入る

【交互作用項の指定】

交互作用項に投与群の変数が含まれていれば自動的に検出し,それぞれに対応した投与群間の差(endpoint)

を算出する.「時間と投与群の交互作用項」の場合には,時間変数の最大値(最終時点)における投与群間の差

(endpoint)を算出する.「ベースラインと投与群の交互作用項」の場合には,ベースラインの全体平均レベルで

の投与群間の差(endpoint)を算出する.

【実行結果】

PROC NLMIXEDを用いて実行される.なお,下記の 3つのモデル及びMIXED モデル(参考)の実行結果が

表示される.

• モデル 1:応答変数モデルに含めた変量効果を脱落確率モデルに含まない(MAR の仮定に従う)

• モデル 2:応答変数モデルに含めた変量効果を脱落確率モデルに含む

• モデル 3:応答変数モデルに含めた変量効果を脱落確率モデルに含む(ただし,投与群によって異なる)

C.5.4 使用上の注意

1. 変量効果の指定「RANDOM_SLOPE=STR(QUAD)」は現実的でなく,解釈も難しい為,本文ではフォロー

されていない.

2. 入力データ(データ数,欠測データの発現状況),解析モデル及び変量効果の指定などが原因で,PROC

NLMIXED の積分計算の箇所で収束せず,結果が出力されない場合がある.

3. このマクロで時間変数は,連続変数として扱われている為,他の手法と結果を比較する際には注意が必

要である.

92

Page 241: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

資料作成者・タスクフォースメンバー日本製薬工業協会 医薬品評価委員会 データサイエンス部会

2013年度タスクフォース 2・2014年度タスクフォース 4

【方法論・SASプログラム検討チーム(資料作成者)】土居 正明 東レ株式会社(サブリーダー) 1章, 2章 (2.1~2.4), 3章, 5章, 11章,

Appendix A, B担当

縄田 成毅 杏林製薬株式会社 (2013年度サブリーダー) 2章 (2.5), Appendix C担当(分担)

藤原 正和 塩野義製薬株式会社 (2014年度サブリーダー) 4章, 7章担当

横山 雄一 持田製薬株式会社 (2014年度サブリーダー) 12章(分担),Appendix C担当(分担)

大浦 智紀 日本イーライリリー株式会社 Appendix C担当(分担)

大江 基貴 株式会社大塚製薬工場 9章担当

駒嵜 弘 マルホ株式会社 8章・10章担当

高橋 文博 田辺三菱製薬株式会社 6章担当

横溝 孝明 大正製薬株式会社 12章担当(分担)

【NRCレポート・EMA ガイドライン検討チーム】竹ノ内 一雅 アステラス製薬株式会社 (サブリーダー)

北川 忠行 武田薬品工業株式会社

佐伯 浩之 富士フイルム RIファーマ株式会社

野村 真功 株式会社三和化学研究所

片岡 尚子 ノバルティスファーマ株式会社 (2013年 10月まで)

【FDA, EMA, PMDA 事例調査検討チーム】

松岡 伸篤 ファイザー株式会社 (サブリーダー)

高木 弘毅 サノフィ株式会社

土川 克 ゼリア新薬工業株式会社

鵜飼 裕之 日本ベーリンガーインゲルハイム株式会社

笹川 裕次 Meiji Seikaファルマ株式会社

棚橋 昌也 興和株式会社

吉田 早織 日本化薬株式会社(2014年 4月から)

93

Page 242: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

タスクフォースリーダー兼,推進委員冨金原 悟 小野薬品工業株式会社

菅波 秀規 興和株式会社

土屋 悟 大日本住友製薬株式会社

担当副部会長廣岡 秀樹 アステラス製薬株式会社

94

Page 243: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

1

Appendix 2

欠測のあるデータに関する感度分析の事例

日本製薬工業協会

医薬品評価委員会 データサイエンス部会

2015 年度 タスクフォース 4

欠測のあるデータの解析チーム

Page 244: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

2

目次

1. はじめに .......................................................................................................................... 3 2. 事例調査の方法 ............................................................................................................... 4 3. 各事例 .............................................................................................................................. 5

3.1 Brexpiprazole(REXULTI®) ............................................................................ 5 3.1.1 背景 .............................................................................................................. 5 3.1.2 統合失調症の治療 ......................................................................................... 5 3.1.3 大うつ病の補助療法..................................................................................... 10 3.1.4 参考文献 ...................................................................................................... 12

3.2 Nintedanib(OFEV®) ...................................................................................... 13 3.2.1 背景 ............................................................................................................. 13 3.2.2 INPULSIS 試験 ........................................................................................... 13 3.2.3 参考文献 ...................................................................................................... 18

3.3 Riociguat(ADEMPAS®) ................................................................................. 19 3.3.1 背景 ............................................................................................................. 19 3.3.2 12934 試験(PATENT-1) .......................................................................... 19 3.3.3 感度分析 ...................................................................................................... 21 3.3.4 Reviewer の見解 .......................................................................................... 24 3.3.5 参考文献 ...................................................................................................... 24

3.4 Vedolizumab(Entyvio®) ................................................................................. 25 3.4.1 背景 ............................................................................................................. 25 3.4.2 試験デザイン ............................................................................................... 25 3.4.3 試験結果 ...................................................................................................... 26 3.4.4 参考文献 ...................................................................................................... 34

Page 245: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

3

1. はじめに

医薬品評価委員会 データサイエンス部会 2013 年度タスクフォース 2 では,医薬品開発にお

いて欠測データによって生じる問題を把握するために,承認審査において欠測データの影響につ

いて議論された事例を調査した.当時の調査対象は,2010 年 1 月から 2013 年 6 月の期間に承認

された品目の FDA,EMA および PMDA の審査報告書であった(詳細な調査範囲については 2014

年 7 月に公開された「審査資料で欠測データが議論された事例」を参照).NRC レポートは 2010

年に公開されたことから,対象とした試験のほとんどは NRC レポートが公開される前,または

公開されて間もない段階で第 3 相試験が計画,実施されていたと考えられ,欠測メカニズムに

MNAR を仮定した pattern-mixture model に基づく感度分析を実施した事例は見られなかった.

そのため今回の調査は前調査のフォローアップとして,FDA の審査報告書(特に statistical

review)において欠測データの取り扱いが議論になっており,さらに欠測メカニズムに MNAR

を仮定した下で pattern-mixture model などを利用した感度分析を実施している試験に注目した.

今回注目した品目の事例については,2015 年 12 月 22 日に実施された 2015 年計量生物セミナー

にて口頭発表またはスライド*の公開により紹介を行った.本 appendix 2 は,その内容を報告書

として再構成したものである.

*http://www.biometrics.gr.jp/news/all/seminar_2015-5.pdf

本調査の方法の詳細を 2 章に示した.取り上げた事例は,FDA の審査報告書および関連する

論文での記述を基に 3 章に記載した.なお,3 章での記載は FDA の審査報告書や論文の内容を

日本語化し,タスクフォースメンバーにより再構成したものであるため,記載した文章および用

語等が元の文献の逐語的な翻訳には必ずしもなっていないことに留意していただきたい.

Page 246: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

4

2. 事例調査の方法

FDA の web*上に公開されている承認品目一覧(New Molecular Entity and New Therapeutic

Biological Product Approvals)から,承認日が 2013 年 7 月 1 日から 2015 年 7 月 31 日までの品目

を調査対象として特定した(診断薬及び抗悪性腫瘍薬を除いた 57 件).次に,該当品目の審査報

告書,特に statistical review を調査し,欠測メカニズムに MNAR を仮定した下で pattern-mixture

model などを利用した感度分析を実施しているものとして,Brexpiprazole(REXULTI®),Nintedanib

(OFEV®),Riociguat(ADEMPAS®),および Vedolizumab(ENTYVIO®)の 4 品目を注目する事

例として取り上げることとした.なお,ANOROTM ELLIPTA®は該当品目の一つであり,jump to

reference による解析を感度分析として実施しているが,2015 年 2 月 13 日に開催された,日本製

薬工業協会 データサイエンス部会シンポジウム「臨床試験の欠測データの取り扱いに関する最

近の展開と今後の課題について―NAS レポート,EMA ガイドライン,estimand と解析方法の概

説―」で紹介された事例であるため本 Appendix 2 では取り上げない.

*http://www.fda.gov/Drugs/DevelopmentApprovalProcess/DrugInnovation/default.htm

Page 247: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

5

3. 各事例

3.1 Brexpiprazole(REXULTI®) 3.1.1 背景

Brexpiprazole(商品名 REXULTI®)は,統合失調症及び大うつ病(補助療法)の治療薬とし

て 2015 年 7 月に米国で承認された.申請データパッケージにおいては,各適応症に対して,そ

れぞれ 2 本ずつの第 3 相試験の結果が提出された.

統合失調症の治療 : Study 230,231

大うつ病の補助療法 : Trial 227,228

以下では,それぞれの適応症ごとに,statistical review に記載のあった欠測データの取扱い

に関する議論について要約する.

3.1.2 統合失調症の治療 3.1.2.1 試験デザイン 「統合失調症の治療」に対しては,2 本の第 3 相試験が実施された(Study 230,231).いず

れの試験もランダム化二重盲検プラセボ対照並行群間比較試験であり,試験デザインについては,

群の構成及びその割付比を除いて,ほとんどの部分で共通していた(表 3.1.1).

表 3.1.1 Study 230 と 231 の群構成及びその割付比

Study 230 Study 231

群 プラセボ,1 mg,2 mg,4 mg プラセボ,0.25 mg,2 mg,4 mg

割付比 3:2:3:3 2:1:2:2

観察期間は 6 週間で,主要評価項目は 6 週時点の PANSS total score の変化量,主解析には

MMRM,その感度分析として multiple imputation を利用した pattern-mixture approach が

設定された.次項で感度分析の詳細について説明する.

3.1.2.2 感度分析の詳細 主解析のMMRMに対する感度分析として,multiple imputationを利用した pattern-mixture

approach が実施された.当該感度分析では,以下に示した 2 つのシナリオが申請者により検討

されている.

シナリオ 1 : Brexpiprazole 投与群において lack of efficacy で中止した被験者に MNAR

を仮定し,Brexpiprazole 投与群におけるその他の理由による中止,及びプラセボ投与群に

おける中止に対しては MAR を仮定したもの.

シナリオ 2 : Brexpiprazole 投与群において lack of efficacy または adverse event で中止

した被験者に MNAR を仮定し,Brexpiprazole 投与群におけるその他の理由による中止,

及びプラセボ投与群における中止に対しては MAR を仮定したもの.

Page 248: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

6

MNAR を仮定した被験者に対しては以下の手順で補完を行う.まず,MAR を仮定した

multiple imputation によって欠測データを補完する.次に,その補完した値から,主解析の

MMRM で推定された群間差の k%だけマイナスする.k を 0,10,20,…,100,…,と動か

していき,主解析の結論が逆転する k,すなわち,tipping point を探索する(tipping point

analysis).

3.1.2.3 試験結果 中止割合

被験者の内訳を表 3.1.2,表 3.1.3 に示す.いずれの試験も中止割合は概ね 30~40%程度であ

った.

表 3.1.2 Study 230 の被験者の内訳

(Brexpiprazole FDA statistical review. (2015). p. 23. Table 11 より改変)

Brexpiprazole

プラセボ 1 mg 2 mg 4 mg

ランダム化例数 120 (100%) 186 (100%) 184 (100%) 184 (100%)

有効性解析対象例数 117 (97.5%) 179 (96.2%) 181 (98.4%) 180 (97.8%)

試験完了例数 81 (67.5%) 129 (69.4%) 130 (70.7%) 118 (64.1%)

試験中止例数 39 (32.5%) 57 (30.6%) 54 (29.3%) 66 (35.9%)

追跡不能 0 (0%) 0 (0%) 0 (0%) 0 (0%)

有害事象 11 (9.2%) 11 (5.9%) 13 (7.1%) 22 (12.0%)

中止基準に該当 0 (0%) 0 (0%) 2 (1.1%) 1 (0.5%)

治験責任医師による

同意撤回 2 (1.7%) 0 (0%) 0 (0%) 1 (0.5%)

被験者による

同意撤回 15 (12.5%) 25 (13.4%) 23 (12.5%) 21 (11.4%)

プロトコールからの

逸脱 2 (1.7%) 1 (0.5%) 0 (0%) 0 (0%)

有効性の欠如 9 (7.5%) 20 (10.8%) 16 (8.7%) 21 (11.4%)

Page 249: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

7

表 3.1.3 Study 231 の患者の内訳

(Brexpiprazole FDA statistical review. (2015). p. 23. Table 12 より改変)

Brexpiprazole

プラセボ 1 mg 2 mg 4 mg

ランダム化例数 90 (100%) 182 (100%) 180 (100%) 184 (100%)

有効性解析対象例数 87 (96.7%) 180 (98.9%) 178 (98.9%) 178 (96.7%)

試験完了例数 56 (62.2%) 124 (68.1%) 121 (67.2%) 109 (59.2%)

試験中止例数 34 (37.8%) 58 (31.9%) 59 (32.8%) 75 (40.8%)

追跡不能 0 (0%) 0 (0%) 0 (0%) 1 (0.5%)

有害事象 12 (13.3%) 15 (8.2%) 17 (9.4%) 32 (17.4%)

中止基準に該当 1 (1.1%) 0 (0%) 1 (0.6%) 0 (0%)

治験責任医師による

同意撤回 0 (0%) 1 (0.5%) 1 (0.6%) 3 (1.6%)

被験者による

同意撤回 13 (14.4%) 24 (13.2%) 31 (17.2%) 21 (11.4%)

プロトコールからの

逸脱 1 (1.1%) 1 (0.5%) 2 (1.1%) 0 (0%)

有効性の欠如 7 (7.8%) 17 (9.3%) 7 (3.9%) 18 (9.8%)

主解析の結果

Study 230 では,4 mg で有意差が認められ,Study 231 では,4 mg に加えて 2 mg において

も有意差が認められた(表 3.1.4).

Page 250: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

8

表 3.1.4 Study 230 と 231 の主解析の結果

(Brexpiprazole FDA statistical review. (2015). p. 13. Table 3 より改変)

Study 230 Brex. 1 mg Brex. 2 mg Brex. 4 mg Placebo

Number of patients N=117 N=179 N=181 N=180

Baseline Mean (SD) 93.2 (12.7) 96.3 (12.9) 95.0 (12.4) 94.6 (12.8)

Mean Change at Week 6 (SE) -16.9 (1.9) -16.6 (1.5) -20.0 (1.5) -13.5 (1.5)

Treatment Difference -3.4 -3.1 -6.5 -

95% Confidence Interval (-8.1, 1.3) (-7.2, 1.1) (-10.6, -2.3) -

p-value 0.16 0.15 0.0022 -

Average Effect (2mg & 4mg)

versus Placebo

LS Mean Difference=-4.78, p-value=0.0093

Study 231 Brex. 0.25 mg Brex. 2 mg Brex. 4 mg Placebo

Number of patients N=87 N=180 N=178 N=178

Baseline Mean (SD) 93.6 (11.5) 95.9 (13.7) 94.7 (12.1) 95.7 (11.5)

Mean Change at Week 6 (SE) -14.9 (2.2) -20.7 (1.5) -19.7 (1.5) -12.0 (1.6)

Treatment Difference -2.9 -8.7 -7.6 -

95% Confidence Interval (-8.3, 2.5) (-13.1, -4.4) (-12.0, -3.3) -

p-value 0.29 <0.0001 0.0006 -

Average Effect (2mg & 4mg)

versus Placebo

LS Mean Difference=-8.18, p-value<0.0001

N=number of patients, SD=Standard Deviation, SE=Standard Error

感度分析の結果

感度分析の結果を表 3.1.5(Study 230)と表 3.1.6(Study 231)に示す.先に挙げた 2 つの

シナリオに加えて,「Brexpiprazole 投与群において中止したすべての被験者に MNAR を仮定し

たもの」であるシナリオ 3 が reviewer によって実施された.

Study 230 では,シナリオ 1,2,3 の tipping point はそれぞれ,260(%),130(%),80(%)で

あった.Study 231 では,シナリオ 2 と 3 の tipping point はそれぞれ,300(%),160(%)であっ

たが,シナリオ 1 においては,k を 500(%)まで動かしても主解析の結論が逆転することはなか

った.

Page 251: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

9

表 3.1.5 Study 230 の感度分析の結果

(Brexpiprazole FDA statistical review. (2015). p. 15. Table 4 より改変)

Percentage of

Treatment Effect

Subtracted from

MAR imputed

missing data

Treatment

Comparison

Treatment

Difference

95% Confidence

Interval

p-value

Lack of Efficacy in Brex Group as MNAR(シナリオ 1)

k=100(%) Brex.2mg vs Placebo -2.8 (-7.3, 1.7) 0.22

Brex.4mg vs Placebo -5.2 (-9.7, -0.7) 0.0244

k=260(%)

(tipping point)

Brex.2mg vs Placebo -2.3 (-6.7, 2.1) 0.31

Brex.4mg vs Placebo -4.3 (-8.8, 0.1) 0.0571

Lack of Efficacy and AE in Brex Group as MNAR(シナリオ 2)

k=100(%) Brex.2mg vs Placebo -2.7 (-7.2, 1.9) 0.25

Brex.4mg vs Placebo -4.8 (-9.3, -0.2) 0.0395

k=130(%)

(tipping point)

Brex.2mg vs Placebo -2.7 (-7.2, 1.8) 0.25

Brex.4mg vs Placebo -4.4 (-8.9, 0.1) 0.0526

Dropout due to Any Reason in Brex Group as MNAR(シナリオ 3)

k=80(%)

(tipping point)

Brex.2mg vs Placebo -2.8 (-7.6, 2.0) 0.25

Brex.4mg vs Placebo -4.4 (-8.9, 0.1) 0.0529

Page 252: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

10

表 3.1.6 Study 231 の感度分析の結果

(Brexpiprazole FDA statistical review. (2015). p. 16. Table 5 より改変)

Percentage of

Treatment Effect

Subtracted from

MAR imputed

missing data

Treatment

Comparison

Treatment

Difference

95% Confidence

Interval

p-value

Lack of Efficacy in Brex Group as MNAR(シナリオ 1)

k=100(%) Brex.2mg vs Placebo -9.1 (-14.0, -4.3) 0.0002

Brex.4mg vs Placebo -8.4 (-13.0, -3.9) 0.0003

k=500(%) (tipping

point not reached)

Brex.2mg vs Placebo -5.9 (-11.1, -0.8) 0.024

Brex.4mg vs Placebo -7.2 (-12.4, -2.0) 0.0066

Lack of Efficacy and AE in Brex Group as MNAR(シナリオ 2)

k=100(%) Brex.2mg vs Placebo -8.6 (-13.4, -3.9) 0.0004

Brex.4mg vs Placebo -7.9 (-12.5, -3.2) 0.0009

k=300(%)

(tipping point)

Brex.2mg vs Placebo -5.0 (-10.1, 0.2) 0.058

Brex.4mg vs Placebo -5.3 (-10.7, 0.2) 0.061

Dropout due to Any Reason in Brex Group as MNAR(シナリオ 3)

k=100(%) Brex.2mg vs Placebo -7.2 (-12.3, -2.1) 0.0057

Brex.4mg vs Placebo -6.2 (-11.0, -1.4) 0.012

k=160(%)

(tipping point)

Brex.2mg vs Placebo -5.8 (-10.8, -0.9) 0.021

Brex.4mg vs Placebo -5.1 (-10.4, 0.2) 0.061

Statistical review では,申請者が実施したシナリオ 1 と 2 では tipping point が 100(%)を超

えていたこと,reviewer が実施したシナリオ 3 においても tipping point が 80(%)に届いていた

ことを受けて,「主解析の結果と感度分析の結果は一貫していた」と結論付けている.

3.1.3 大うつ病の補助療法 3.1.3.1 試験デザイン 「大うつ病の補助療法」に対しても,2 本の第 3 相試験が実施された(Trial 227,228).い

ずれの試験もランダム化二重盲検プラセボ対照並行群間比較試験であり,試験デザインについて

は,群の構成を除いて,ほとんどの部分で共通していた.群の構成は,Trial 227 がプラセボ,

Brexpiprazole 1 mg,3 mg の 3 群,Trial 228 ではプラセボと Brexpiprazole 2 mg の 2 群であ

った.

観察期間は,「既存の抗うつ治療で効果が不十分な患者」を選択するための 8 週間(プラセボ

単盲検,Phase A)と,有効性および安全性評価のための 6 週間(二重盲検,Phase B)から成

Page 253: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

11

っており,主要評価項目には Phase A 終了時から Phase B 終了時まで(6 週間)の MADRS total

score の変化量が設定された.主解析には MMRM,その感度分析には multiple imputation を

利用した pattern-mixture approach の他に,shared parameter model,random coefficient

pattern-mixture model,observed case における ANCOVA や,LOCF で欠測データを補完し

た ANCOVA が設定された.

3.1.3.2 試験結果 中止割合

いずれの試験も 10%に満たない中止割合であった.

主解析の結果

Trial 227 及び 228 の主解析の結果を表 3.1.7,表 3.1.8 に示す.

表 3.1.7 Trial 227 の主解析の結果

(Brexpiprazole FDA statistical review. (2015). p. 41. Table 5 より改変)

Variable 1mg Brex+ADT* 3mg Brex+ADT* Placebo+ADT*

MADRS Total Score, MMRM N=225 N=226 N=218

Mean (SD) End of Phase A 26.69 (5.61) 26.31 (5.24) 26.23 (5.27)

LS Mean (SE) Change At Week 14 -7.65 (0.50) -7.98 (0.51) -6.45 (0.51)

LS Mean Difference (95%CI) -1.19 (-2.58, 0.20) -1.52 (-2.92, -0.13) -

P-value 0.0925 0.0327 -

* ADT: Antidepressant treatment

表 3.1.8 Trial 228 の主解析の結果

(Brexpiprazole FDA statistical review. (2015). p. 48. Table 12 より改変)

Endpoint

Parameter

2 mg/day

Brex+ADT*

Placebo+ADT*

Primary Efficacy Endpoint

MADRS Total Score, MMRM by Randomized Treatment

Group (Efficacy Sample - Primary Analysis)

N=187 N=191

Mean (SD) end of Phase A (Week 8) 26.61 (5.79) 27.14 (5.60)

LS mean change (SE) at end of Phase B (Week 14) -8.27 (0.61) -5.15 (0.60)

LS mean difference (95%CI) -3.12 (-4.70, -1.54) -

P-value 0.0001 -

* ADT: Antidepressant treatment

Page 254: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

12

Trial 227 では,どちらの用量もプラセボに対する優越性を示すことはできなかった.

(Brexpiprazole 3 mg では多重性を調整しない場合 p=0.0327 であったが,事前に規定された

Hochberg の方法によって多重性を調整すると有意ではなかった.)一方,Trial 228 では

Brexpiprazole 2 mg のプラセボに対する優越性が示された.

感度分析の結果

「感度分析の結果は主解析と同様であった」と記載があったのみで,statistical review には,

感度分析の方法も含めて,詳細な記述がなかった.上記のように結論付けるにあたって,「中止

割合が小さく,欠測値による問題はわずかなものであった」との記述があった.

3.1.4 参考文献 [1] Brexpiprazole FDA statistical review. (2015).

http://www.accessdata.fda.gov/drugsatfda_docs/nda/2015/205422Orig1Orig2s000StatR.pdf

Page 255: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

13

3.2 Nintedanib(OFEV®) 3.2.1 背景

Nintedanib(商品名 OFEV®)は,特発性肺線維症(idiopathic pulmonary fibrosis,以下 IPF)の

治療薬として 2014 年 10 月に米国で承認され,2015 年 7 月に日本においても承認された.その

申請データパッケージの中で 2 つの第 3 相試験の結果が提出された.

1199.32 試験 (INPULSIS 1):IPF 患者を対象に,有効性及び安全性の検討

1199.34 試験 (INPULSIS 2):IPF 患者を対象に,有効性及び安全性の検討

INPULSIS 1,INPULSIS 2 試験は国際共同第 3 相試験として実施され,試験デザインが類似して

いる sister trial であった.試験デザインが類似していることより,本項では INPULSIS 試験とし

て記載を統一し,FDA の statistical review を基に内容を記載する.

3.2.2 INPULSIS 試験 3.2.2.1 試験デザイン

INPULSIS 試験は二重盲検ランダム化並行群間プラセボ対照比較試験であった.

主要評価項目は FVC(努力肺活量)の年間減少率(mL/year)が設定されており,図 3.2.1 にお

いて丸で囲まれた時点が測定時点であった.INPULSIS 試験は投与中止した場合でも,来院を依

頼し,データを収集するプロトコールであった.

図 3.2.1 INPULSIS 試験デザイン(Nintedanib statistical review (2014) p7. Figure 1 を改変)

Page 256: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

14

3.2.2.2 主解析 主解析にはランダム係数回帰モデルを用いたモデル解析が実施された.統計解析計画書に記載

されたモデル式は下記の通りである.

𝑌𝑖𝑖𝑖 = (𝛼 + 𝑎𝑖) + (𝛾 + 𝛽𝑠𝑇𝑖 + 𝑔𝑖)𝑡 + 𝛽𝑔𝐺𝐺𝐺𝐺𝐺𝐺𝑖 + 𝛽𝑎𝐴𝑔𝐺𝑖 + 𝛽ℎ𝐻𝐺𝐻𝑔ℎ𝑡𝑖 + 𝜖𝑖𝑖

Yitk: 被験者 i,治療群 k,時間 t(連続量)における応答値

Tk=0: プラセボ群,Tk=1: Nintedanib 群

βs: Nintedanib の効果

α, γ: 切片および傾き

ai, gi: 被験者 i の切片および傾き

βg, βa, βh: 被験者固有の背景係数

Gender i: 性別(男性を基準とする)

Age i: ベースライン時の被験者 i の年齢

Height i: ベースライン時の被験者 i の身長

εit: 被験者 i 時間 t におけるランダム誤差 ~ i.i.d N(0, σs2)

αi, gi は平均 0 ベクトル,分散共分散構造が無構造(UN)の 2 変量正規分布に従う.

仮説の設定は以下の通りであった.

H0: プラセボ群に比べ Nintedanib 群のベースラインから 52 週までの FVC の年間減少率に差

がない

H1: プラセボ群に比べ Nintedanib 群のほうがベースラインから 52 週までの FVC の年間減少

率が小さい(片側検定)

有効性の解析は一度でも投与された集団(treated set)を対象に観測されたデータに基づいて

実施された.投与中止後に得られたデータも主解析に使用した.

3.2.2.3 感度分析 INPULSIS 試験では以下のように 3 種類の感度分析が計画され,実施された.

A) on-treatment のデータ(治験薬投与中止前までのデータ)のみを使用する

B) 主解析のモデルに肺移植後のデータを含める

C) 利用可能なデータによって,被験者を異なるパターンに分ける

A)の感度分析では IPF 患者に対する薬剤の効果をもっとも反映しているという考えにより設

定され,解析モデルには主解析のモデルと同じものが適応された.

本項においては C)の感度分析について説明する.

Page 257: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

15

C)の感度分析では被験者を下記のように 4 つのパターンに分けた.

52 週のデータがある被験者のうち,

パターン 1: 完了例

パターン 2: 52 週までに投与中止した症例

52 週のデータがない被験者のうち,

パターン 3: 生存例

パターン 4: 死亡例

解析モデルは主解析と同じものを使用し,パターン 1,2 は観測データのみを使用しパターン 3,

4 については 52 週時のデータのみを multiple imputation (MI)によって補完し,52 週時よりも前の

データについては補完しないこととした.下記の表に感度分析 C)の 3 種類の補完ルール(C1~C3)

を示す.

表 3.2.1 感度分析 C)の補完ルール

感度分析 52 週時の欠測データの補完方法

(パターン 3)

52 週時の欠測データの補完方法

(パターン 4)

C1 パターン2の各群の傾きとSEに基

づいて MI(reg)で補完

パターン 2 のプラセボ群の傾きと SE に基づ

いて MI(reg)で補完

ただし,生存している被験者よりもより厳

しくなるように設定する.((-∞, ]の範囲で

切断分布 f(β)/2 を用いる)

C2 パターン 2 のプラセボ群の傾きと

SE に基づいて MI(reg)で補完

C3 主解析のプラセボ群の傾きと SE

に基づいて MI(reg)で補完

主解析のプラセボ群の傾きと SEに基づいて

MI(reg)で補完.ただし生存している被験者

よりも厳しい設定をする

((-∞, ]の範囲で切断分布 f(b)/2 を用いる)

死亡例(パターン 4)のデータの補完には様々な議論はあるが,本試験では生存例(パターン 3)

よりも多くのデータでより厳しいデータになるように切断分布を用いて設定している.

感度分析 C)の詳細な手順については参考文献[2]の supplementary Material の資料参照.

Page 258: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

16

3.2.2.4 試験結果 3.2.2.4.1 被験者の内訳 表 3.2.2 に INPULSIS 試験の被験者の内訳を示す.投与中止割合は 18%~25%で Nintedanib 群の

ほうがプラセボ群に比べ,わずかに高いという結果であった.

表 3.2.2 被験者の内訳(ランダム化された症例)

(Nintedanib statistical review (2014) p12. Table 2 を改変)

1199.32 試験 (N=515) 1199.34 試験 (N=551)

Nintedanib 群

(n=309)

プラセボ群

(n=206)

Nintedanib 群

(n=331)

プラセボ群

(n=220)

投与例数 309 204 329 219

投与完了例数 231 (75%) 168 (82%) 251 (76%) 175 (80%)

投与中止例数 78 (25%) 36 (18%) 78 (24%) 44 (20%)

早期投与中止理由

有害事象 65 (21%) 24 (12%) 62 (19%) 35 (16%)

プロトコール順守違反 2 (1%) 3 (2%) 2 (1%) 1 (1%)

追跡不能 0 0 0 1 (1%)

治験薬投与継続拒否 9 (3%) 7 (3%) 11 (3%) 6 (3%)

その他 2 (1%) 2 (1%) 3 (1%) 1 (1%)

試験完了例数 260 (84%) 174 (85%) 272 (83%) 179 (82%)

試験中止例数 49 (16%) 30 (15%) 57 (17%) 40 (18%)

試験中止理由

有害事象 25 (8%) 15 (7%) 42 (13%) 30 (14%)

プロトコール順守違反 0 2 (1%) 2 (1%) 0

追跡不能 0 0 2 (1%) 1 (1%)

有害事象以外の同意撤回 23 (7%) 12 (6%) 9 (3%) 7 (3%)

その他 1 (1%) 1 (1%) 2 (1%) 2 (1%)

3.2.2.4.2 主解析および感度分析の結果 表 3.2.3 および表 3.2.4 に主解析および感度分析 C)の結果を示した.FDA の reviewer による感度

分析も実施されている.なお FDA の reviewer による解析については ANCOVA model に共変量と

して性別,年齢,身長およびベースライン FVC スコアを加えたものであったが,statistical review

にそれ以上の詳細な記載はなかった.また FDA の reviewer は statistical review の中でレスポンダ

ー解析についても実施している.詳細については statistical review を参照.

Page 259: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

17

表 3.2.3 INPULSIS1(1199.32)試験の主要評価項目の解析結果(treated set)

(Nintedanib statistical review (2014) p18. Table 5)

治療群 N LS Mean* プラセボ群との差

LS Mean の差 95% 信頼区間 p 値

主解析

Nintedanib 309 -115 125 (78, 173) <0.001

プラセボ 204 -240

感度分析 C1

Nintedanib 309 -121 120 (76, 165) <0.001

プラセボ 204 -241

感度分析 C2

Nintedanib 309 -127 115 (70, 160) <0.001

プラセボ 204 -242

感度分析 C3

Nintedanib 309 -128 114 (69, 159) <0.001

プラセボ 204 -242

FDA reviewer による感度分析(Placebo MI による ANCOVA)

Nintedanib 309 -101 88 (45, 131) <0.001

プラセボ 204 -189

FDA reviewer による感度分析(Rank ANCOVA**)

Nintedanib 309 -- -- -- <0.001

プラセボ 204 --

*LS Mean: Least Squared Mean, **欠測データには最も低い rank で補完

Page 260: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

18

表 3.2.4 INPULSIS1(1199.34)試験の主要評価項目の解析結果(treated set)

(Nintedanib statistical review (2014) p19. Table 6)

治療群 N LS Mean* プラセボ群との差

LS Mean の差 95% 信頼区間 p 値

主解析

Nintedanib 329 -114 94 (45, 143) <0.001

プラセボ 219 -207

感度分析 C1

Nintedanib 329 -136 101 (52, 150) <0.001

プラセボ 219 -237

感度分析 C2

Nintedanib 329 -154 83 (33, 133) 0.001

プラセボ 219 -237

感度分析 C3

Nintedanib 329 -124 83 (38, 129) <0.001

プラセボ 219 -208

FDA reviewer による感度分析(Placebo MI による ANCOVA)

Nintedanib 329 -112 95 (50, 139) <0.001

プラセボ 219 -206

FDA reviewer による感度分析(Rank ANCOVA**)

Nintedanib 329 -- -- -- 0.005

プラセボ 219 --

*LS Mean: Least Squared Mean, **欠測データには最も低い rank で補完

FDA の reviewer は statistical review の中で次のように述べている.

治療脱落による欠測データは無視できる量ではなかったが,解析モデルは FVC が線形的に減少

することを仮定していたため,推定された傾きは保守的で妥当であった.解析計画にあった 4

つのパターンに分類して実施された感度分析(C1~C3)は,主解析の欠測データによる潜在的な

影響を調べるために有益な情報であったと考える.FDA の reviewer が実施した感度分析も含め

て有意かつ Nintedanib 群にとって好ましい結果であった.

3.2.3 参考文献

[1] Nintedanib FDA statistical review. (2014).

http://www.accessdata.fda.gov/drugsatfda_docs/nda/2014/205832Orig1s000StatR.pdf

[2] Richeldi, L., du Bois, R. M., Raghu, G., Azuma, A., Brown, K. K., Costabel, U et al.(2014). Efficacy

and safety of nintedanib in idiopathic pulmonary fibrosis. New England Journal of Medicine, 370(22),

2071-2082.

Page 261: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

19

3.3 Riociguat(ADEMPAS®) 3.3.1 背景 Riocigust(商品名 ADEMPAS®)は,慢性血栓塞栓性肺高血圧症(CTEPH),肺動脈性肺高

血圧症(PAH)の 2 つの適応に対する経口肺高血圧症治療薬として,2013 年 10 月 8 日に米国

で承認された.

Riocigust の米国での申請データパッケージとして,以下の計 2 本の第 3 相試験の結果が提出

された.

11348 試験(CHEST-1):慢性血栓塞栓性肺高血圧症(CTEPH)患者を対象とした試験

12934 試験(PATENT-1):肺動脈性肺高血圧症(PAH)患者を対象とした試験

この 2 つの試験は,当初欠測データの影響をみる解析を予定しておらず,専門家のアドバイ

スや盲検化レビューの結果からいくつかの感度分析を実施している.

以下,statistical review で記載された 12934 試験(PATENT-1)の結果及び投稿論文等の情報

をもとに申請者が実施した欠測のあるデータに関する取り組みを要約し,記載する.なお慢性血

栓塞栓性肺高血圧症(CTEPH)患者を対象とした試験(11348 試験[CHEST-1])は,PATENT-1

試験と同様の解析を実施している.

3.3.2 12934 試験(PATENT-1) 3.3.2.1 試験デザイン 12934 試験(PATENT-1)は,PAH 患者を対象とした,Riocigust の有効性及び安全性を検討

する目的で,プラセボ対照のランダム化二重盲検並行群間比較試験であり,日本を含む 30 ヶ国

で実施された国際共同試験である.

12 週間の治験薬投与期のうち,投与開始後 8 週間までが用量調節期とし,用量調節期終了後

の 4 週間の主治療期では,用量調節期終了時における用量が投与された.ただし,安全性上の理

由による減量は可能とされた.また,投与中止後の規定最終来院日までの継続はしていなかった.

PATENT-1 試験は,PAH 治療薬の併用の有無を層別因子として,Riociguat 1.0-2.5mg 群,プラ

セボ群,Riociguat 1.0- 1.5mg 群の割付比率を 4:2:1 とし,ランダム化は国/地域毎に実施された.

主要評価項目は,ベースラインから 12 週までの 6 分間歩行距離(6MWD)の変化量であり,

主解析は,ITT 集団(ランダム化され,治験薬を 1 回以上投与された被験者)を解析対象集団と

した ANCOVA が実施された.モデルには,ベースライン値を共変量,投与群,国/地域及び PAH

治療薬の併用の有無を主効果として設定されていた.もし ANCOVA による残差の正規性検定

(Shapiro-Wilk 検定)が有意であった場合,国/地域及び PAH 治療薬の併用の有無を層とした層

別 Wilcoxon 検定を行うことが事前に規定されていた.群間比較は,Riociguat 1.0-2.5mg 群とプラ

セボ群で実施された.

Page 262: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

20

3.3.2.2 試験結果 3.3.2.2.1 被験者の内訳

表 3.3.1 に PATENT-1 試験のランダム化された被験者の内訳を示す.各投与群の治験完了例の

割合は約 90%であった.なおプラセボ群及び Riociguat 1.0-1.5mg 群で治験薬を 1 回も投与されて

いなかったため ITT 集団から除外された被験者が各 1 名いた.

表 3.3.1 被験者の内訳(ランダム化された被験者) (Riociguat FDA statistical review. (2013). p. 9. Table 1 より改変)

プラセボ群

N=127

Riociguat 1.0-2.5mg 群

N=254

Riociguat 1.0-1.5mg 群

N=64

投与完了例数 111 (87.4 %) 237 (93.3 %) 57 (89.1 %)

投与中止例数 16 (12.6 %) 17 (3.1 %) 7 (10.9 %)

有害事象 7 (5.5 %) 8 (3.1 %) 1 (1.6 %)

死亡 2 (1.6 %) 0 1 (1.6 %)

有効性欠如 1 (0.8 %) 0 0

追跡不能 0 1 (0.4 %) 0

服薬付遵守 0 1 (0.4 %) 0

プロトコールからの逸脱 3 (2.4 %) 1 (0.4 %) 3 (4.7%)

同意撤回 3 (2.4 %) 6 (2.4 %) 2 (3.1%)

3.3.2.2.2 主解析の結果

表 3.3.2 に主要評価項目の主解析の結果を示す.なお最終評価時点(12 週時)の 6MWD の欠

測値は,治験完了又は投与中止した被験者は 12 週時までの最終測定値,死亡・臨床的悪化で中

止来院がなかった,あるいは中止来院時の測定値がなかった被験者は最悪値(0 m)で補完した.

ANCOVA による残差の正規性検定(Shapiro-Wilk 検定)が有意であったため,事前に規定し

ていた層別 Wilcoxon 検定で Riociguat 1.0-2.5mg 群とプラセボ群の群間比較を行い,有意差が認

められた(p<0.0001).

Page 263: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

21

表 3.3.2 主解析の結果(ITT 集団) (Riociguat FDA statistical review. (2013). p. 13. Table 7 より改変)

プラセボ群

N=126

Riociguat 1.0-2.5mg 群

N=254

Riociguat 1.0-1.5mg 群

N=63

Baseline

Mean (SD) 367.8 (74.6) 361.4 (67.7) 363.2 (66.6)

Median (Min : Max) 391.0 (150 : 450) 374.5 (160 : 468) 385.0 (158 : 448)

Change from baseline to last visit

Mean (SD) -5.6 (85.5) 29.6 (65.8) 31.1 (79.3)

Median (Min : Max) 8.5 (-400 : 204) 30.0 (-430 : 279) 32.0 (-415 : 190)

Treatment comparison:(Riociguat 1.0-2.5mg 群)-(プラセボ群)

LS mean difference 35.78

95% CI 20.06 to 51.51

p 値 (ANCOVA) <0.0001

p 値 (stratified Wilcoxon test) <0.0001

3.3.3 感度分析 PATENT-1 試験の主解析は,治験完了又は投与中止した被験者に対する最終評価時点の結果を

LOCF により補完している.NEJM の論文では,申請者は,LOCF を使用するときには投与中止

後の結果が一定である等の仮定が必要であることを考慮し,外部の専門家の協力のもと EMA ガ

イドラインを基に,事前に規定された欠測のあるデータの解析を感度分析として行ったと記載さ

れていた.

主解析から変更又は追加されたものは,中止来院の結果を次の予定来院の結果として使用する

こと,予定外来院の結果は解析に含めないこと,そして最悪値(0 m)による補完は行わないこ

とであった.また感度分析を行う前に中止理由の割合,カプランマイヤープロット(図 3.3.1),

中止時期別の 6MWD の平均変化量のプロット(spaghetti plot;図 3.3.2)を示している.

Page 264: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

22

図 3.3.1 中止時間に対するカプランマイヤープロット(安全性解析対象集団)

(Arno Fritsch. (2014).p.30. Kaplan-Meier plot for time to withdrawal (safety analysis set)より改変)

図 3.3.1 中止時期別の 6MWD の平均変化量の spaghetti plot(Riociguat 1.0-2.5mg 群)

(Arno Fritsch. (2014).p.17. Spaghetti plot 6MWD for Riociguat より改変)

申請者は以下の感度分析を行った.

1. MAR に基づく解析

MMRM

全ての被験者が治験完了したと仮定:Efficacy の評価

2. MNAR に基づく解析

Delta method(pattern-mixture model)[Carpenter & Kenward(2008)]

盲検化レビューの結果,脱落例は完了例に比べて 6MWD の変化量が低値であった.

特にプラセボ群ではそれが顕著であった.

6MWD が脱落後の来院ごとに一定量低下すると仮定する.

MAR に基づき multiple imputation を用いて投与中止後の欠測データを補完し,

シナリオ(fixed penalty, decreasing slope)ごとに設定されたペナルティ(δ)を加

Page 265: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

23

える .

補完したデータで ANCOVA を実施し,結果を併合する.

補完回数:50 回

ここで MNAR に基づく解析で使用したペナルティとは以下の 4 通りである(図 3.3.3 参照).

シナリオ1:両群とも補完した値から-60(m)する.

シナリオ2:両群とも-20(m)に投与中止来院からの時点数をかけた値を補完した値に足す.

シナリオ3:Riociguat 1.0-2.5mg 群のみ,補完した値から-60(m)する.

シナリオ4:Riociguat 1.0-2.5mg 群のみ,-20(m)に投与中止来院からの時点数をかけた値を補

完した値に足す.

図 3.3.3 NMAR に基づく解析に用いた 4 つのシナリオ(4 週時に投与中止)

表 3.3.3 に感度分析の結果を示す.

表 3.3.3 6MWD に対する感度分析(ITT 集団)

(Riociguat FDA Draft Briefing Document for CRDAC. (2013). p. 122. Table 43 より改変) Analysis Estimated treatment difference 95% CI

MMRM 30.02 16.11 to 43.94

シナリオ1 33.10 18.49 to 47.71

シナリオ2 35.03 20.49 to 49.57

シナリオ3 26.31 12.32 to 40.30

シナリオ4 27.16 13.36 to 40.96

Page 266: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

24

3.3.4 Reviewer の見解 FDA の reviewer の見解として,statistical review に以下の記載があった.

PAH 患者を対象にした臨床試験は,一般的に多くの欠測データを伴う傾向がある.そして欠

測しているデータの取り扱いは困難であり,最善策としては欠測データを出さないようにす

ることである.PATENT-1 試験と慢性血栓塞栓性肺高血圧症患者を対象とした試験(11348

試験[CHEST-1])は,欠測データが少数であった.さらに申請者は,欠測のあるデータに対

して異なる仮定のもと,多くの感度分析を実施した.それらの結果は主解析と同様の結果を

示していた.

承認に影響を与えるような統計的に重大な問題は特定されなかった.

3.3.5 参考文献 [1] Riociguat FDA statistical review (2013)

http://www.accessdata.fda.gov/drugsatfda_docs/nda/2013/204819Orig1s000StatR.pdf

[2] Riociguat FDA Draft Briefing Document for CRDAC. (2013)

http://www.fda.gov/downloads/AdvisoryCommittees/CommitteesMeetingMaterials/Drugs/Cardiova

scularandRenalDrugsAdvisoryCommittee/UCM363541.pdf

[3] Fritsch, A. (2014) Missing Data Sensitivity Analysis of a Continuous Endpoint - An Example from

a Recent Submission. November 21, 2014 - ASA NJ Chapter / Bayer Workshop, Whippany

http://www.amstat.org/chapters/newjersey/Documents/events/2011to2015/2014/Bayer/2%20NJ-AS

A-Bayer-Workshop-Fritsch.pdf

[4] Carpenter, J. R. and Kenward, M. G. (2008). Missing data in clinical trials - a practical guide.

National Health Service Coordinating Centre for Research Methodology: Birmingham.

http://missingdata.lshtm.ac.uk/downloads/rm04_jh17_mk.pdf

[5] Ghofrani, H. A., Galiè, N., Grimminger, F., Grünig, E., Humbert, M., Jing, Z. C. et al. (2013).

Riociguat for the treatment of pulmonary arterial hypertension. New England Journal of Medicine, 369(4), 330-340.

Page 267: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

25

3.4 Vedolizumab(Entyvio®) 3.4.1 背景

Vedolizumab(商品名 Entyvio®)は,成人の潰瘍性大腸炎(Ulcerative Colitis,以下 UC)及び成

人のクローン病(Crohn's Disease,以下 CD)に対する治療薬として,2014 年 5 月に米国で承認

された.

Vedolizumab の米国での申請データパッケージの一部として,以下の計 4 本の第 3 相試験の結

果が提出された.

C13006 試験:UC の導入療法及び維持療法

C13007 試験:CD の導入療法及び維持療法

C13011 試験:CD の導入療法

C13008 試験:UC 及び CD の長期安全性

このうち C13006 試験及び C13007 試験において,維持療法期で試験を中止した被験者の割合が

大きく(それぞれ 44%及び 52%),statistical review には FDA の reviewer が要求した感度分析の

結果,及び欠測データの取扱い方法に対する FDA の reviewer の見解が記載されている.

以下で記載した C13006 試験及び C13007 試験のデザイン,試験結果(被験者の内訳,並びに

維持療法期での主解析及び欠測データの取扱い方法に対する感度分析)及び欠測データに関する

議論の内容は,図表も含め,statistical review で記載された内容を日本語で要約したものである.

3.4.2 試験デザイン 3.4.2.1 C13006 試験

C13006 試験は,中等症又は重症の UC 患者を対象として,Vedolizumab の導入療法及び維持療

法における有効性及び安全性をプラセボを対照に検討する,第 3 相のランダム化二重盲検試験で

ある.Vedolizumab の有効性及び安全性は,導入療法期[投与開始(0 週)~6 週]及び維持療

法期(6 週~52 週)でそれぞれ評価した.

維持療法期では,導入療法期で Vedolizuman を投与され,6 週時点において改善がみられた被

験者を Vedolizumab の 4 週に 1 回投与(Q4W)群,Vedolizumab の 8 週に 1 回投与(Q8W)群又

はプラセボ群のいずれかに 1:1:1 の割付比でランダムに割付けた.Vedolizumab の投与量はい

ずれも 300 mg とした.

維持療法期の主要評価項目は 52 週時点での寛解割合とし,完全 Mayo スコアが 2 以下でかつ

すべてのサブスコアが 1 以下のときに寛解と定義した.

主解析では,Vedolizumab Q4W 群とプラセボ群,Vedolizumab Q8W 群とプラセボ群の比較をそ

れぞれ CMH カイ 2 乗検定により実施し,Hochberg の方法により多重性の調整を行った.また,

試験中止等により主要評価項目が欠測である場合は,「寛解なし」として取扱ったうえで解析を

実施した.

Page 268: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

26

3.4.2.2 C13007 試験 C13007 試験の試験デザインは,中等症又は重症の CD 患者を対象とし,Crohn's Disease Activity

Index(CDAI)スコアが 150 以下のときに寛解と定義している点以外は,C13006 試験と同様で

ある.

3.4.3 試験結果 3.4.3.1 被験者の内訳 3.4.3.1.1 C13006 試験

C13006 試験のフローチャートを図 3.4.1 に,また維持療法期における被験者の内訳を表 3.4.1

に示す.

維持療法期でプラセボ群において試験を中止した被験者の割合は 62%であり,Vedolizumab

Q8W 群(37%)及び Q4W 群(33%)と比較して大きかった.試験中止理由としては,有効性の

欠如が最も多く,プラセボ群,Vedolizumab Q8W 群及び Q4W 群でそれぞれ 48%,25%及び 26%

であった.また,プラセボ群における有害事象による試験中止例数の割合(12%)は,Vedolizumab

Q8W 群(6%)及び Q4W 群(5%)の約 2 倍であった.

図 3.4.1 フローチャート(C13006 試験)

(Vedolizumab FDA statistical review. (2014). p. 180. Figure 1 を改変)

Not randomizedAssigned to VDZ q 4 wk

N=330

Cohort 1 Cohort 2

RandomizedN=374

AssignedN=521

Induction StudyNon-ITT Population

VDZN=521

Induction StudyITT Population

VDZN=225

Induction StudyITT Population

PlaceboN=149

Withdrewprematurely

N=14

CompletedWk 6

N=135

Withdrewprematurely

N=36

Withdrewprematurely

N=7

CompletedWk 6

N=218

CompletedWk 6

N=485

Total VDZCohort 1 and Cohort 2

N=746

Total VDZCompleted Wk 6

N=703

Total VDZWithdrew prematurely

N=43

ResponseAssessment

Maintenance StudyNon-ITT Population

VDZ q 4 wkN=373

RandomizedN=373

Maintenance StudyITT Population

VDZ q 4 wkN=125

Maintenance StudyITT Population

VDZ q 8 wkN=122

Maintenance StudyITT Population

PlaceboN=126

ContinuedDB Placebo

N=135

Maintenance StudyNon-ITT Population

PlaceboN=149

Page 269: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

27

表 3.4.1 被験者の内訳(C13006 試験,維持療法期)

(Vedolizumab FDA statistical review. (2014). pp. 184-185. Table 9 を改変)

プラセボ群

Vedolizumab

Q8W 群

Vedolizumab

Q4W 群

ランダム化例数 126 122 125

試験中止例数(%) 78(62) 45(37) 41(33)

有害事象 15(12) 7(6) 6(5)

プロトコールからの逸脱 0 0 0

有効性の欠如 61(48) 31(25) 33(26)

依頼者による試験の中止 0 0 0

同意撤回 2(2) 5(4) 2(2)

追跡不能 0 2(2) 0

その他 0 0 0

3.4.3.1.2 C13007 試験 C13007 試験のフローチャートを図 3.4.2 に,また維持療法期における被験者の内訳を表 3.4.2

に示す.

維持療法期でプラセボ群において試験を中止した被験者の割合は 58%であり,Vedolizumab

Q8W 群(53%)及び Q4W 群(47%)と比較してやや大きかった.試験中止理由としては,有効

性の欠如が最も多く,プラセボ群,Vedolizumab Q8W 群及び Q4W 群でそれぞれ 42%,38%及び

31%であった.また,有害事象による試験中止例数の割合は,プラセボ群で 10%と最も高く,

Vedolizumab Q8W 群では 8%,Vedolizumab Q4W 群では 6%であった.

Page 270: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

28

図 3.4.2 フローチャート(C13007 試験)

(Vedolizumab FDA statistical review. (2014). p. 48. Figure 3 を改変)

表 3.4.2 被験者の内訳(C13007 試験,維持療法期)

(Vedolizumab FDA statistical review. (2014). p. 49. Table 10 を改変)

プラセボ群

Vedolizumab

Q8W 群

Vedolizumab

Q4W 群

ランダム化例数 153 154 154

試験中止例数(%) 89(58) 81(53) 72(47)

有害事象 15(10) 12(8) 9(6)

プロトコールからの逸脱 1(<1) 2(1) 3(2)

有効性の欠如 64(42) 58(38) 48(31)

依頼者による試験の中止 0 0 0

同意撤回 7(5) 6(4) 9(6)

追跡不能 1(<1) 3(2) 2(1)

その他 1(<1) 0 1(<1)

Not randomizedAssigned to VDZ q 4 wk

N=412

Cohort 1 Cohort 2

RandomizedN=368

AssignedN=748

Induction StudyNon-ITT Population

VDZN=747

Induction StudyITT Population

VDZN=220

Induction StudyITT Population

PlaceboN=148

Withdrewprematurely

N=11

CompletedWk 6

N=137

Withdrewprematurely

N=73

Withdrewprematurely

N=21

CompletedWk 6

N=199

CompletedWk 6

N=674

Total VDZCohort 1 and Cohort 2

N=967

Total VDZCompleted Wk 6

N=873

Total VDZWithdrew prematurely

N=94

ResponseAssessment

Maintenance StudyNon-ITT Population

VDZ q 4 wkN=506

RandomizedN=461

Maintenance StudyITT Population

VDZ q 4 wkN=154

Maintenance StudyITT Population

VDZ q 8 wkN=154

Maintenance StudyITT Population

PlaceboN=153

ContinuedDB Placebo

N=137

Maintenance StudyNon-ITT Population

PlaceboN=148

Page 271: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

29

3.4.3.2 主解析 3.4.3.2.1 C13006 試験

C13006 試験の維持療法期における主解析の結果を表 3.4.3 に示す.

維持療法期の主要評価項目である 52 週時点での寛解割合について,経口コルチコステロイド

の併用の有無,抗 TNFα 抗体による治療歴及び/又は免疫調節薬の併用の有無,及び導入療法期

におけるコホート(コホート 1:二重盲検下でプラセボ又は Vedolizumab を投与,コホート 2:

非盲検下で Vedolizumab を投与)を層別因子とした CMH カイ 2 乗検定により投与群間の比較を

実施した結果,Vedolizumab Q8W 群及び Q4W 群における 52 週時点での寛解割合はプラセボ群

と比較して有意に高かった(いずれも p<0.0001).

表 3.4.3 主解析の結果(C13006 試験,維持療法期)

(Vedolizumab FDA statistical review. (2014). p. 188. Table 11 を改変)

プラセボ群

(N=126)

Vedolizumab

Q8W 群(N=122)

Vedolizumab

Q4W 群(N=125)

寛解した被験者数(%) 20(15.9) 51(41.8) 56(44.8)

両側 95%信頼区間 [9.5, 22.3] [33.1, 50.6] [36.1, 53.5]

プラセボ群との寛解割合の差 26.1 29.1

両側 95%信頼区間 [14.9, 37.2] [17.9, 40.4]

p 値 <0.0001 <0.0001

3.4.3.2.2 C13007 試験 C13007 試験の維持療法期における主解析の結果を表 3.4.4 に示す.

維持療法期の主要評価項目である 52 週時点での寛解割合について,経口コルチコステロイド

の併用の有無,抗 TNFα 抗体による治療歴及び/又は免疫調節薬の併用の有無,及び導入療法期

におけるコホート(コホート 1:二重盲検下でプラセボ又は Vedolizumab を投与,コホート 2:

非盲検下で Vedolizumab を投与)を層別因子とした CMH カイ 2 乗検定により投与群間の比較を

実施した結果,Vedolizumab Q8W 群及び Q4W 群における 52 週時点での寛解割合はプラセボ群

と比較して有意に高かった(それぞれ p=0.0007 及び p=0.0042).

Page 272: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

30

表 3.4.4 主解析の結果(C13007 試験,維持療法期)

(Vedolizumab FDA statistical review. (2014). p. 56. Table 14 を改変)

プラセボ群

(N=153)

Vedolizumab

Q8W 群(N=154)

Vedolizumab

Q4W 群(N=154)

寛解した被験者数(%) 33(21.6) 60(39.0) 56(36.4)

両側 95%信頼区間 [15.1, 28.1] [31.3, 46.7] [28.8, 44.0]

プラセボ群との寛解割合の差 17.4 14.7

両側 95%信頼区間 [7.3, 27.5] [4.6, 24.7]

p 値 0.0007 0.0042

3.4.3.3 感度分析 C13006 試験及び C13007 試験において,主解析における欠測データの問題に対処するため,

申請者は FDA からの要求に応じて以下の感度分析を実施した.

observed case analysis:52 週時点での寛解の有無のデータが欠測である場合は当該被験者

を解析から除外した.

LOCF analysis:52 週時点での寛解の有無のデータが欠測である場合,最後に観測された

寛解の有無のデータで補完した.

worst case analysis:52 週時点での寛解の有無のデータが欠測である場合,プラセボ群の被

験者は「寛解あり」として取扱い,Vedolizumab Q4W 群及び Q8W 群の被験者は「寛解な

し」として取扱った(C13007 試験では statistical review に結果の記載はない).

multiple imputation による解析:SAS の MI プロシジャを利用して multiple imputation を実

施した.モデルには経口コルチコステロイドの併用の有無,抗 TNFα 抗体による治療歴及

び/又は免疫調節薬の併用の有無,及び導入療法期におけるコホート(コホート 1:二重

盲検下でプラセボ又は Vedolizumab を投与,コホート 2:非盲検下で Vedolizumab を投与)

を含め,補完回数は 10 回とした.

3.4.3.3.1 C13006 試験 C13006 試験の維持療法期における,主解析での欠測データの取扱い方法に対する感度分析の

結果を表 3.4.5 に示す.

Page 273: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

31

表 3.4.5 感度分析の結果(C13006 試験,維持療法期)

(Vedolizumab FDA statistical review. (2014). p. 207. Table 27 を改変)

プラセボ群 Vedolizumab

Q8W 群

Vedolizumab

Q4W 群

主解析

寛解した被験者数

(%)

20/126

(15.9)

51/122

(41.8)

56/125

(44.8)

プラセボ群との寛解

割合の差(p 値)

26.1%

(<0.0001)

29.1%

(<0.0001)

observed case

寛解した被験者数

(%)

20/48

(41.7)

51/77

(66.2)

56/83

(67.5)

プラセボ群との寛解

割合の差(p 値)

24.1%

(0.0079)

25.0%

(0.0042)

LOCF

寛解した被験者数

(%)

27/126

(21.4)

57/122

(46.7)

58/125

(46.4)

プラセボ群との寛解

割合の差(p 値)

25.4%

(<0.0001)

25.2%

(<0.0001)

worst case

寛解した被験者数

(%)

98/126

(77.8)

51/122

(41.8)

56/125

(44.8)

プラセボ群との寛解

割合の差(p 値)

-36.0%

(<0.0001)

-32.9%

(<0.0001)

multiple imputation

寛解した被験者数

(%)

67/126

(53.2)

91/122

(74.6)

88/125

(70.4)

プラセボ群との寛解

割合の差(p 値)

21.1%

(0.0004)

17.1%

(0.0039)

3.4.3.3.2 C13007 試験

C13007 試験の維持療法期における,主解析における欠測データの取扱い方法に対する感度分

析の結果を表 3.4.6 に示す.

Page 274: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

32

表 3.4.6 感度分析の結果(C13007 試験,維持療法期)

(Vedolizumab FDA statistical review. (2014). p. 77. Table 28 を改変)

プラセボ群 Vedolizumab

Q8W 群

Vedolizumab

Q4W 群

主解析

寛解した被験者数

(%)

33/153

(21.6)

60/154

(39.0)

56/154

(36.4)

プラセボ群との寛解

割合の差(p 値)

17.4%

(0.0007)

14.7%

(0.0042)

observed case

寛解した被験者数

(%)

33/63

(52.4)

59/72

(81.9)

56/81

(69.1)

プラセボ群との寛解

割合の差(p 値)

30.5%

(<0.0001)

17.2%

(0.0350)

LOCF

寛解した被験者数

(%)

45/153

(29.4)

67/154

(43.5)

71/154

(46.1)

プラセボ群との寛解

割合の差(p 値)

14.1%

(0.0090)

16.6%

(0.0023)

multiple imputation

寛解した被験者数

(%)

66/153

(43.1)

119/154

(77.3)

103/154

(66.9)

プラセボ群との寛解

割合の差(p 値)

34.2%

(<0.0001)

23.7%

(<0.0001)

3.4.3.4 reviewer 及び statistical team leader の見解 欠測データの取扱い方法,並びに主解析及び感度分析の結果に対する reviewer の見解を記載す

る.また,Vedolizumab の statistical review には,statistical team leader memorandum が添付されて

いる.statistical team leader memorandum には,reviewer の評価での統計的な論点について結論が

まとめられているとともに,試験結果に対する statistical team leader の見解が記載されており,

本内容についても以下で要約して記載する.

3.4.3.4.1 C13006 試験 3.4.3.4.1.1 reviewer の見解

52 週時点での寛解割合について,感度分析の結果,worst case analysis を除く全ての解析でプ

ラセボ群と比較して Vedolizumab Q8W 群及び Q4W 群で良好な結果であった.

プラセボ群では 60%以上,Vedolizumab Q8W 群及び Q4W 群では 30%以上の被験者において

52 週時点での寛解の有無のデータが欠測していた.主解析では欠測データを「寛解なし」とし

て補完しているため,得られた投与群間差は過大推定されている可能性がある点について注意が

必要である.しかしながら,試験中止理由の多くは「有効性の欠如」又は「有害事象」であった.

Page 275: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

33

3.4.3.4.1.2 statistical team leader の見解 主解析では,試験中止例は「寛解なし」として取扱った.reviewer は,プラセボ群における試

験中止例数の割合はVedolizumab Q8W群及びQ4W群の約2倍であり,このためVedolizumab Q8W

群又は Q4W 群の治療効果は過大推定されている可能性があると述べている.しかしながら,こ

の試験中止例数の割合の大きさは試験期間の長さから予想されていたものであり,また過去に実

施された UC の維持療法における試験と同程度であった.さらに,すべての投与群における主な

試験中止理由は「有害事象」又は「有効性の欠如」であった.

以上から,申請者が実施した主解析における欠測データの取扱い方法は擁護可能であり,また

主要評価項目の比較に関する適切な推測は,事前に規定された主解析に基づいてなされるべきで

ある.

申請者は,FDA の要求に基づき,主解析とは異なる補完方法を用いた広範な感度分析を実施

した.これらのすべての解析において,Vedolizumab Q8W 群及び Q4W 群でプラセボ群と比較し

て良好な結果であった.

3.4.3.4.2 C13007 試験 3.4.3.4.2.1 reviewer の見解

52 週時点での寛解の有無が欠測である被験者の割合が投与群間で異なっており,missing at

random の仮定は適切ではない可能性が考えられることから,multiple imputation による解析では

投与群間差を過大推定している傾向があるかもしれない.

さらに,52 週時点での寛解の有無が欠測である被験者の割合は,プラセボ群,Vedolizumab Q8W

群及び Q4W 群でそれぞれ 58%,53%及び 47%であり,観測された投与群間差は信頼できる値で

はない可能性がある.

試験中止例数の割合の大きさは同様のデザインの他の試験と同程度であるが,欠測データが多

いことによって試験結果の解釈が困難となっている.

3.4.3.4.2.2 statistical team leader の見解 reviewer は,試験中止例数の割合は投与群間で同程度であるものの,試験中止例数の割合が比

較的高かったと述べている.この試験中止例数の割合の大きさは試験期間の長さから予想されて

いたものであり,また過去に実施された CD を対象とした試験と同程度のようである.さらに,

すべての投与群における主な試験中止理由は「有害事象」又は「有効性の欠如」であった.

欠測割合が投与群間で同程度である場合には,欠測データを「寛解なし」として補完すること

によって治療効果が過大推定されることはないため,申請者が実施した主解析における欠測デー

タの取扱い方法は正当化される.また,主要評価項目の比較に関する適切な推測は,事前に規定

された主解析に基づいてなされるべきである.

申請者は,FDA の要求に基づき,主解析とは異なる補完方法を用いた広範な感度分析を実施

Page 276: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

34

した.これらのすべての解析において,Vedolizumab Q8W 群及び Q4W 群でプラセボ群と比較し

て良好な結果であった.

3.4.3.5 結論 C13006 試験及び C13007 試験の維持療法期では,主要評価項目である 52 週時点での寛解割合

について,Vedolizumab のプラセボに対する統計的に有意なベネフィットが示された.

3.4.4 参考文献 [1] Takeda Pharmaceutical Company Limited. (2014). The package inserts for Entyvio® injection

300 mg.

http://www.accessdata.fda.gov/drugsatfda_docs/label/2014/125476s000lbl.pdf [2] Vedolizumab FDA statistical review. (2014).

http://www.accessdata.fda.gov/drugsatfda_docs/nda/2014/125476Orig1s000StatR.pdf

Page 277: 欠測のある連続量経時データに対する 統計手法につ …...欠測のある連続量経時データに対する 統計手法について Ver2.0 2016年4月 日本製薬工業協会

35

日本製薬工業協会 医薬品評価委員会 データサイエンス部会 2015 年度タスクフォース 4

事例調査チーム

棚橋 昌也 興和株式会社(サブリーダー) 2 章,3.1 章担当

鵜飼 裕之 日本べーリンガーインゲルハイム株式会社 1 章,3.2 章担当

渡邊 大丞 サノフィ株式会社 3.3 章担当

黒田 晋吾 武田薬品工業株式会社 3.4 章担当

以上