1
創薬研究における統計学の活用について
田辺三菱製薬株式会社
研究本部 研究保証部 統計解析Gr
橋本 敏夫
2
1. 医薬品創製における統計学の役割
2. 統計解析の基礎
3. 要約値にだまされるな
4. 平均値が再現するとは限らない
5. 研究者の心得
Agenda
3
1.医薬品創製における統計学の役割
4
• 統計学とは申請用試験のための手続きではなく、
創薬のために有用な武器(ツール)• データを客観的に評価する「モノサシ」(検定、推定)
• 実験結果への誤差介入を防ぐ「防波堤」(偏りを小さくする実験計画法)
• 実験を成功させるための「指南書」(例数設計、検出力評価)
創薬研究における統計学の役割は?
Fisherの三原則(研究者の心得)
① 繰り返し 適切な例数
② ランダム化 適切な割付
③ 局所管理 変動因子を管理
本試験、予備試験、スクリーニング試験を問わず、統計学の基礎を理解して創薬に活用しよう
Sir Ronald Aylmer Fisherロザムステッド農事試験場 の研究員として,穀物量の変動に関する研究に従事していた
5
• 実験系の把握が不十分 (分布形、散布度、バイアス)• 不十分な予備試験• 例数の不足、不適切な用量設定• 思いつきの解析、後付の解析検定を14~15回やれば、もともと差がなくてもどこかで有意差がつく確率が50%を超える。たまたまの差は再現しない。 ⇒ 試験計画段階で特定された項目だったかどうかが重要
データの恣意的な除外 Publication bias雑誌に投稿されるのはpositiveなデータばかり社内報告書作成スピード positive study >> negative study
試験の再現性やデータの正当な評価を阻むもの
• 経験則にもとづく “大きな誤解”データ(試験結果)は試験ごとにばらつくのが当然!!再現性を確保するには特別な配慮が必要
6
① 統計の基礎を知る。
② 試験計画(書)が重要⇒しっかり考える• 試験の目的は?R&D計画中での当該試験の位置づけは?• 検証試験 : 当該試験で何を証明するか?
証明できる確率はどの程度か?• 探索試験 : 検証試験のためのどのような情報を得るのか?• 群構成、例数、評価項目、評価指標、統計手法
(⇒計画書必須記載項目)
• 群分け、ブロック化、等による系統誤差の排除
③ 試験報告書はありのままに簡潔・迅速に作成する。
試験の再現性やデータの評価のためには
7
2. 統計解析の基礎
実験データの分布を知って①適切なデータ変換②適切な要約統計量③適切な統計解析を活用しましょう
8
抽出が重要:標本は母集団を代表する必要がある
真実
母集団
標本
推測
抽出(サンプリング、群分け)
実験
平均値、S.D. , S.E.M.,
群間比較
9
母集団の分布
母平均μ
σ→ S.D.
標本平均の分布(n=8)
→ S.E.M.
μ
変動係数 (coefficient of variance;CV)
標準偏差を平均値で割ることにより、
ばらつきの程度を指標化したものである。
XDSCV /..
n
σ
標準偏差 (Standard deviation;S.D.)
ばらつきの程度(散布度)
標準誤差(S.E.M.)
平均値の精度サンプル数(例数)が多いほど平均値の精度が上がる。
10
幾何平均値は「対数変換による平均値」
①対数変換により正規化
Gm mean
mean U95
GU95GL95
L95
②Mean,L95, U95を算出
③逆変換によりGm,GL95,GU95を算出
nXiGmn
i
/loglog1
11
中央値は「順位変換による平均値」
変数の分布形によらないオールマイティな変換
①順位に変換
②順位のMean,L95, U95を算出n=100の時、平均順位は50.5
③逆変換(平均順位50.5に相当するデータ50番目と51
番目の平均値を算出)によりMedianを求める
mean U95L95
順位は左右対称な一様分布
Median①順位に変換
②順位のMean,L95, U95を算出n=100の時、平均順位は50.5
③逆変換(平均順位50.5に相当するデータ50番目と51
番目の平均値を算出)によりMedianを求める
mean U95L95
順位は左右対称な一様分布
mean U95L95
順位は左右対称な一様分布
Median
12
要約統計量(これだけは覚えてください!!)
③ 標準偏差 (standard deviation)
ばらつきの度合いを示す指標(散布度)である。VDS ..
④ 変動係数 (coefficient of variance;CV)
標準偏差を平均値で割ることにより、ばらつきの程度を指標化したものである。
XDSCV /..
⑤ 標準誤差(standard error of the mean; S.E.M )
平均値の精度を表す指標である。
平均値±S.E.M.×t(α /2,df)”は平均値の(1-α )%信頼区間を表す。
n
DSMES
.....
① 平均値(arithmetic mean)と幾何平均値(Gm)
nXiXmeann
i
/1
nXiGmn
i
/loglog1
分散:
1
2
1
n
XXi
V
n
i
② 中央値(median)
13
3. 要約値にだまされるな!!
14
Mean±S.E.M.だけで判断するのは危険
n=6 CV=30% S.E.M.=12%
Group1(一様分布)、Group2(外れ値あり)、Group3(二峰性)ともに平均値と標準誤差は等しい。
⇒ 重要な評価指標は、個別データも見てみましょう(報告書に記載しましょう)
%
Gro
up1
Gro
up2
Gro
up3
0
50
100
150
200
15
A
C
B
D
あなたならどの化合物を選択しますか?
0.01 0.1 1 10 100 1000 10000
0.01 0.1 1 10 100 1000 100000.01 0.1 1 10 100 1000 10000
0.01 0.1 1 10 100 1000 10000
16
A
C
B
D
非線形回帰によるフィッティング
0.01 0.1 1 10 100 1000 10000 0.01 0.1 1 10 100 1000 10000
0.01 0.1 1 10 100 1000 10000 0.01 0.1 1 10 100 1000 10000
17
公比:10,MAX:100 固定,MIN:0 固定
タイプ 推定値95%信頼区間下限
95%信頼区間上限
hill係数95%信頼区間下限
95%信頼区間上限
A 3.137 1.0175 9.6739 1.077 0.0590 2.0942
B 3.137 1.48×10-48 6.66×1048 0.179 -9.2495 9.6076
C 3.137 1.5112 6.5120 13.903 5.0697 22.7364
D 3.137 3.54×10-20 2.78×1020 0.754 -8.9004 10.4074
IC50(EC50)の推定値と95%信頼区間
外挿
0.001 0.01 0.1 1 10 100 1000 10000
18
A
C
B
D
0.01 0.1 1 10 100 1000 10000
0.01 0.1 1 10 100 1000 100000.01 0.1 1 10 100 1000 10000
0.01 0.1 1 10 100 1000 10000
IC50(95%C.I.):3.137(1.0175,9.6739 )
IC50(95%C.I.):3.137(1.48×10-48,6.66×1048)
IC50(95%C.I.):3.137(1.5112,6.5120)
IC50 : <100(外挿のため、3.137(3.54×10-20,2.78×1020)とは表記できません)
95%信頼区間も表示して評価しないと判断を誤ります!!
19
要約値だけで判断するのは危険です。95%信頼区間やグラフに着目しましょう。効力比較の際には以下に留意してください。
用量反応性の比較における留意事項(日本薬理学雑誌 2000)
物質間の用量反応性を比較する場合には,物質ごとの用量反応曲線の形状を十分評価する必要がある.用量反応曲線の傾きや,最大反応量の違いが物質の特性を最もよく表す場合もある.用量反応曲線が平行で最大反応量も同程度と考えられる場合には,D50等の要約値の比較が有用であり,効力比およびその信頼区間として表現することが可能である.各物質の用量反応曲線が平行でない場合には,要約値はあくまで一点における比較であることを認識し,試験報告書上の表現に留意する.用量反応曲線の要約値は,その信頼区間と共に示す.用量反応曲線の効力比は,その信頼区間と共に示す.
20
0.01 0.1 1 10 100 1000 10000
A
• A: 公比:10,MAX:100 固定,MIN:0 固定
• E: 公比:3,MAX:100 固定,MIN:0 固定
IC50(EC50)の推定値と95%信頼区間
推定値95%信頼区間下限
95%信頼区間上限
上限/推定値推定値/下限
Hill係数95%信頼区間下限
95%信頼区間上限
A 3.137 1.0175 9.6739 3.0834 1.077 0.0590 2.0942
E 3.137 2.8418 3.4630 1.1038 1.099 0.9637 1.2344
E
0.01 0.1 1 10 100 1000 10000
正しい信頼区間を求めるためには、用量設定を予想されるIC50
( EC50 )値の周りにほぼ左右対称に設定するのがポイント!
21
4.平均値が再現するとは限らない
前出のCV=30%のデータでシミュレーションしてみました
Gro
up1
0
50
100
150
22
母集団の分布 標本
母平均μ
サンプリング
サンプリング
μ
=標本平均
σ→ S.D.
標本平均の分布(n=8)
→ S.E.M.
μ
n
σ
平均値にはばらつきがあります
サンプリング
23
実験回数
平均値 (95%信頼区間)を表示 N=4
各実験の平均値は、母集団の平均値の95%信頼区間にほぼ収まる。各実験で算出された平均値の95%信頼区間に「母平均」が含まれる確率も95%である。
平均値の95%信頼区間(n=4、CV=30%)
95%信頼区間幅 (約100%)平均値は試験ごとに大きくばらつく
0
50
100
150
200
250
0 20 40 60 80 100
24
0
50
100
150
200
250
0 20 40 60 80 100
実験回数
平均値 (95%信頼区間)を表示
N=8
平均値の95%信頼区間(n=8、CV=30%)
各実験の平均値は、母集団の平均値の95%信頼区間にほぼ収まる。各実験で算出された平均値の95%信頼区間に「母平均」が含まれる確率も95%である。
95%信頼区間幅 (約50%)少し安心!!
25
平均値±S.E.M.の範囲に次回の平均値が含まれる確率は約50% ⇒ あたるも八卦あたらぬも八卦
0
20
40
60
80
100
120
140
160
180
0 5 10 15 20
実験回数
次試験の平均値はどうなる? 10000回のsimulation結果
平均値の95%信頼区間に次回の平均値が含まれる確率は約90%⇒ 再現性が必要であれば95%信頼区間を確認!!
26
パブリケーションバイアス
-100
-80
-60
-40
-20
0
20
40
60
80
0 1 2 3 4 5 6
• 良い結果のみを報告した場合には,正しい意思決定ができなくなる
• 正しい意思決定を行うには,結果に関わらず,実施したすべての結果を報告・評価することが重要
実験回数
群間差
Publication
bias
27
5.研究者の心得
実験結果への系統誤差介入を防ぐ「防波堤」
実験を成功させるための「指南書」
Sir Ronald Aylmer Fisherロザムステッド農事試験場 の研究員として,穀物量の変動に関する研究に従事していた
Fisherの三原則
① 繰り返し 適切な例数
② ランダム化 適切な割付
③ 局所管理 変動因子を管理
28
「検出力」 演習 n=6
“t検定”のシミュレーション n=6 有意差 64/100(64%)
対照群 : 母平均 100 母標準偏差 20
高用量群 : 母平均 70 母標準偏差 20
2群の母平均(と母標準偏差)がわかっていれば、試験を無限に繰り返していくときにそのうち、有意差を認める確率を評価することができます。試験の例数が変えると有意差を認める確率が変わります。 これが検出力です。
40.00
50.00
60.00
70.00
80.00
90.00
100.00
110.00
120.00
130.00
140.00
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
試験No
A群平均値 B群平均値
29
「検出力」 演習 n=10
“t検定”のシミュレーション n=10 有意差 89/100(89%)
対照群 : 母平均 100 母標準偏差 20
高用量群 : 母平均 70 母標準偏差 20
例数を増やすと、各群の平均値が落ち着いてくるので、2群の平均値の差も安定した値をとります。シミュレーションでは100回中89回で有意差を認めました。検出力が約90%であるといえます。
40.00
50.00
60.00
70.00
80.00
90.00
100.00
110.00
120.00
130.00
140.00
1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
試験No
A群平均値 B群平均値
30
差/S.D.に対応する検出力
定型的な薬理試験や一般毒性試験など例数が決まっている試験についても,検出力や最小検出差は確認しておきましょう.
差/S.D.
1.5S.D.の差を検出する確率(検出力)
は
例数 6例 ⇒ 約65%
例数10例⇒ 約90%
例数設計 2群 の場合対応のないt検定
例数 0.5 0.8 1.0 1.5 2.0
3 08 12 16 29 46
4 09 16 22 43 66
5 11 20 29 55 79
6 12 24 35 65 88
8 15 32 46 80 96
10 19 40 56 89 99
15 26 56 75 98 100 (単位:%)
31
差/S.D.に対応する検出力
定型的な薬理試験や一般毒性試験など例数が決まっている試験についても,検出力や最小検出差は確認しておきましょう.
差/S.D.
1.5S.D.の差を検出する確率(検出力)
は
例数6例 ⇒ 約50%
例数10例⇒ 約80%
例数設計 4群 の場合VC : 低用量、中用量、高用量(Dunnettの多重比較法)
例数 0.5 0.8 1.0 1.5 2.0
3 04 07 10 22 39
4 04 09 14 33 57
5 05 12 19 44 71
6 06 15 24 53 81
8 08 21 33 70 93
10 10 27 42 81 97
15 16 42 63 95 100 (単位:%)
32
変動因子の制御
• バラツキを「ばらつくもの」とあきらめず、ばらつく要因を特定し、制御を行えば成功確度は向上する。
1. 管理可能な系統誤差(実験環境、実験条件など)は実験内で一定にする。
2. 制御可能な系統誤差(投与前値、実験日・時間、実験者など)は、群間で偏らないように割付ける。
3. 制御可能な系統誤差を分母からも取り除く(前値との比・差を取る/分散分析の要因とする)ことで、試験の感度(成功確度)と再現性を上げることができる。
例数 ばらつき
薬効差 統計量=
例数 因のばらつき ばらつき +変動要
その他の変動要因の差 薬効差統計量=
33
① 試験の再現には特別な工夫が必要
② 要約値のみでの判断は危険
③ 試験計画が重要⇒しっかり考える
④ 試験報告書はありのままに簡潔・迅速に
まとめ