新医薬品の承認前に求められる安全性情報を考える...新医薬品の承認前に求められる安全性情報を考える資料作成者タスクフォース2

新医薬品の承認前に求められる安全性情報を考える

―安全性の社内標準と統合解析―

平成 17 年 3 月 17 日

日本製薬工業協会

医薬品評価委員会統計・DM 部会

タスクフォース 2

新医薬品の承認前に求められる安全性情報を考える

資料作成者タスクフォース 2 ファイザー株式会社小宮山靖 (担当推進委員兼リーダー)

PartⅠ：安全性情報と社内標準

有害事象

山之内製薬株式会社杵渕隆二#

明治製菓株式会社岩間康弘

ノバルティスファーマ株式会社大谷雅美

旭化成ファーマ株式会社小出俊彦

株式会社三和化学研究所清水保 (～平成 16 年 9 月) 三菱ウェルファーマ株式会社竹内久朗

キリンビール株式会社松永洋二

臨床検査値

ワイス株式会社関根恵理#

東レ株式会社岡田清伸

アベンティスファーマ株式会社加藤智子

グラクソ･スミスクライン株式会社鈴木正人

日本たばこ産業株式会社中水流嘉臣*

PartⅡ：安全性の統合解析－内容と手順

武田薬品工業株式会社岩本光司#

日本オルガノン株式会社河井浩 (～平成 16 年 4 月) 日本オルガノン株式会社田中薫 (平成 16 年 5 月～) 丸石製薬株式会社平岡毅彦

塩野義製薬株式会社平野勝也

藤沢薬品工業株式会社松川美幸

ヤンセンファーマ株式会社村本吉弘

#; 各パートのサブリーダー、*；編集

監修

統計・DM 部会部会長前田博藤沢薬品工業株式会社

同副部会長上坂浩之日本イーライリリー株式会社

同副部会長東宮秀夫住友製薬株式会社

同副部会長酒井弘憲三菱ウェルファーマ株式会社

以上の資料作成に当たり、医薬品評価委員会魚井委員長ならびに本資料の査読を実施

頂いた査読担当の諸氏に感謝致します。

目次

序文（新医薬品の承認前に求められる安全性情報とは） ...................................... 1 PartⅠ：安全性情報と社内標準 1. はじめに ..................................................................................................................... 3

1.1. 安全性情報の主な構成要素............................................................................... 3 1.2. 社内標準の必要性............................................................................................... 3

2. 安全性の社内標準 ..................................................................................................... 5 2.1. 安全性の社内標準の価値(社内標準がもたらすもの) .................................... 5 2.2. 安全性の社内標準がもつべき特徴................................................................... 6

2.2.1. デフォルトとオプション ............................................................................ 6 2.2.2. モジュール化(Data Class Definition)........................................................... 6

3. 有害事象に関する問題 ............................................................................................. 8 3.1. 収集における留意点........................................................................................... 8

3.1.1. 収集する項目 ................................................................................................ 8 3.1.2. 収集の対象とする期間 .............................................................................. 10 3.1.3. 有効性の評価項目に関連した事象の収集ルール ...................................11 3.1.4. 複合事象の収集ルール ...............................................................................11 3.1.5. 重症度の判定 .............................................................................................. 12 3.1.6. 因果関係の判定 .......................................................................................... 13

3.2. 集計・解析における留意点............................................................................. 20 3.2.1. MedDRA コード .......................................................................................... 20 3.2.2. アルゴリズム .............................................................................................. 21 3.2.3. 解析対象集団 .............................................................................................. 24 3.2.4. 頻度集計表 .................................................................................................. 25 3.2.5. 解析 .............................................................................................................. 37

4. 臨床検査値等の検査データに関する問題 ........................................................... 41 4.1. 臨床検査値等の検査データによる安全性評価............................................. 41

4.1.1. 評価の現状と問題点 .................................................................................. 41 4.1.2. 臨床検査値等の検査データによる安全性評価の構造 .......................... 44

4.1.2.1. 検査データの推移傾向........................................................................ 45 4.1.2.2. “極端な異常値”の評価.................................................................... 45

4.1.3. 臨床検査値異常等、検査値異常の判定基準 .......................................... 47 4.2. 集計解析における留意点................................................................................. 51

4.2.1. 臨床検査値等の検査データの要約 .......................................................... 51 4.2.2. 臨床検査値異常等、検査値異常の要約 .................................................. 55

PartⅡ：安全性の統合解析－内容と手順 1. はじめに ................................................................................................................... 59 2. 安全性の統合解析の目的 ....................................................................................... 59

2.1. 統合解析とは..................................................................................................... 59 2.2. 統合解析の目的................................................................................................. 60 2.3. メタ・アナリシスの適用場面......................................................................... 61

3. 統合解析の手順 ....................................................................................................... 62 3.1. 統合解析計画..................................................................................................... 63

3.1.1. 統合解析計画の事前作成のメリット ...................................................... 63 3.1.2. 統合解析計画に含まれる項目 .................................................................. 64

3.1.2.1. 安全性の統合解析の対象となる被験者の条件(解析対象集団) ..... 64 3.1.2.2. 解析目的に適した集計対象(試験)の選定 ......................................... 64 3.1.2.3. 集計項目と集計方法の明記................................................................ 65 3.1.2.4. 統合解析に組み入れるデータのカット・オフのタイミング........ 65

3.2. データベース(DB)併合計画 ............................................................................ 65 3.2.1. DB 併合計画の目的及びその内容............................................................. 65 3.2.2. 有害事象コード(MedDRA)の取扱い........................................................ 66 3.2.3. 有害事象の翻訳 .......................................................................................... 67

3.3. 統合解析のプロセス(例示) .............................................................................. 68 4. 結果の提示 ............................................................................................................... 68

4.1. 有害事象の要約................................................................................................. 68 4.2. 有害事象に関するその他の解析..................................................................... 70

4.2.1. リスク因子の探索 ...................................................................................... 70 4.2.2. 観察期間を考慮した解析 .......................................................................... 70

4.3. 臨床検査値の要約............................................................................................. 72 4.3.1. 臨床検査値の推移 ...................................................................................... 72 4.3.2. 臨床検査値異常 .......................................................................................... 72 4.3.3. 前後差の検定 .............................................................................................. 72

最後に ............................................................................................................................ 74

参考文献 ........................................................................................................................ 75

1

序文（新医薬品の承認前に求められる安全性情報とは）

薬が用いられる限り、副作用がなくなることはない。薬の安全性に対する関心は、歴

史的には“ヒポクラテスの誓い”1まで遡ることができる。医学の究極の目標は”do not harm(人を傷つけないこと)”であることが述べられている2。薬の臨床開発開始から、薬

の社会的な役割が終焉を迎えるまで、薬のライフサイクル全体を通じて、我々製薬企業

には薬のリスクおよびベネフィットに関する社会からのあらゆる質問に答える責務が

ある。そこで製薬企業に求められるモラルは”Know your drug”であり、偽りやごまかし

無く、常に良心の命ずるままに、情報の収集を行い、誤りなくタイムリーに報告するこ

とが求められる3。

医薬品の承認決定は、医薬品の添付文書に特定された条件下でベネフィットとリスク

のバランスが満足すべきものであるか否かに基づいて行われる。この決定は、承認時点

において入手可能な情報に基づいて行われる4。しかしながら承認時点において入手可

能な情報は、「リスク」すなわち安全性の観点から見れば、著しく限られた情報である。

Bert Spilker はその大著”Guide to Clinical Trials”の中で、承認時点に必要とされる安全性

情報について触れ、その限界について論じている5。承認時点まで、すなわち開発段階

の安全性情報は、主として有効性の確立を目的として計画された臨床試験の中で収集さ

れた情報に基づいているため、安全性の全体像を完全に記述するには到底至らない。

Spilker は、承認時点の安全性情報を不十分なものにする要因として・評価された症例数が、実際にその薬を使用される患者数に比べて圧倒的に少ない

こと・発現頻度が高くないあるいは稀な副作用については検討が不十分であること・臨床現場で安全性上の問題が稀に起こるかもしれない状況を、開発段階で予測す

るには限界があること・上市後の適応外使用の問題・画期的な新薬(Breakthrough medicine)を早く患者が利用できるようにしたいという

社会的な要求・開発段階の臨床試験で組み入れられなかったリスク集団への使用・過剰投与に関する情報不足

をあげている。市販後のファーマコビジランス活動は、承認時点までの不十分な安全性

情報を補うものであり、薬のリスク・ベネフィット・バランスをアップデートされた情

報に基づいて見直すために重要となる。ICH-E2E(ファーマコビジランス・プランニング)では、最初に

1) 重要な特定されたリスク(Important identified risk)、

2

2) 重要な潜在的リスク(Important potential risk)、 3) 重要な得られていない情報(Important missing information)

を検討することが求められている。つまり、承認時点までの安全性情報は、上市後のフ

ァーマコビジランス活動の「核」となる情報であり、上記３点を明らかにすることがフ

ァーマコビジランス活動の出発点となるのである。もちろん承認時点までと市販後の安

全性情報は、シームレスであることが重要であり、開発段階においても市販後を視野に

入れた安全性情報の収集、集計を行うことが今後ますます求められることになると考え

られる。一方、ICH の基本精神「日米 EU 三極の新医薬品の承認審査資料関連規制の整合化を

図ることにより、データの国際的な相互受け入れを実現し、有効性や安全性の確保に妥

協すること無く、臨床試験や動物実験等の不必要な繰り返しを防ぎ、承認審査を迅速化

するとともに、新医薬品の研究開発を促進し、もって、優れた新医薬品をより早く患者

の手元に届けること。」6を実現するための各種ガイドラインが整備されてきており、海

外で行われた臨床試験の結果を用いる機会が増えている。国際的にシームレスなデータ

交換が可能にならなければ、ICH の基本精神を本当の意味で実践することはできないで

あろうし、ファーマコビジランス活動の「核」となる情報として有効に用いることも困

難になってしまうだろう。我々はこのような昨今の環境を鑑み、承認時点までの安全性情報の総括たる「安全性

の統合解析」の向かうべき方向を検討してきた。その中で、安全性情報の収集、取り扱

い、集計が一貫した思想に基づいて行われることの重要性が認識され、市販後およびグ

ローバルな視点をも加味して社内標準*を整備することが非常に重要であるという結論

に達した。このような考えに基づき、本報告は２部構成とし、Part Ⅰでは「社内標準」

を、Part Ⅱでは「社内標準を前提とした安全性の統合解析」を取り上げることとした。

* 本来は、国際的に共通な業界標準を作ることができれば理想的ではあるのだが、欧米のグローバルカ

ンパニーではすでに社内標準を実装し、長きにわたり、その作成、IT インフラ構築、メンテナンスに多大

な投資を行ってきている。そのような企業間の協調を行おうとすれば、それはまさに ICH matter となり、

我々の守備範囲を超えた大きな問題となる。したがって本報告においては、各社がそれぞれ整備する社内

標準に焦点を絞ることにした。

3

PartⅠ：安全性情報と社内標準

1. はじめに 1.1. 安全性情報の主な構成要素

薬の安全性情報のなかで特に重要な構成要素は、副作用 Adverse Drug Reaction と臨床

検査値異常 Laboratory Abnormality である7。副作用の判定には薬との因果関係の判定が

必要であり、因果関係判定の困難さがあるため、因果関係を問わない有害事象が収集さ

れ、報告される。臨床検査値は患者の全身的な生理学的状態を調べるための客観的な検

査の記録であり、臨床試験では事前に定められた時点に全ての被験者から決められた検

査項目のデータが収集される。臨床検査値が有害事象の解釈を与えることも、有害事象

として認識されていない望ましくない状態を検出するのに役立つこともある 7。これら

の他に、バイタルサイン、心電図、体重なども一般的な健康状態を調べるためにしばし

ば収集される。

1.2. 社内標準の必要性

本報告で取り上げる「安全性の社内標準」とは、安全性と患者背景に関する例えば以

下の内容を網羅したものである。・治験実施計画書・症例報告書のモジュール・記入方法の指針・論理チェック・辞書の運用方法・データベース構造と構成要素のメタデータ・データ取り扱い方法・集計のアルゴリズム・図表・リスト(一覧表)の仕様・データ交換の仕様安全性の社内標準は、治療領域、治験の相、治験が行われた地域を問わず、常に収集・

報告すべき安全性情報のコアの部分を規定するものであり、治療領域や地域によって評

価の項目、報告の仕様が追加されることはあり得る。管理すべき薬剤プロジェクトの数

や規模にも依存するが、社内標準を実際に運用していくために、社内標準に準拠したデ

ータベースシステム、解析システム、文書管理システムなどのインフラ・ストラクチャ

ーが必要となる場合もあるであろう。また、社内標準が全社的に運用される段階になる

と、社内標準のメンテナンスが重要になる。確実に運用されていることを確認する仕組

み、科学的側面、規制当局からの要求、ビジネスの側面から必要性を検討した上でアッ

プデートしてゆくプロセスが必要となる8。臨床試験における有害事象、臨床検査値異常、あるいはその他の安全性検査情報も、

4

収集から最終的な集計までの道のりは長く、様々なツールを用い、様々な人(患者、医

師、CRC、検査技師、検査会社、モニター、データマネジメント、医学専門家、プログ

ラマー、統計家)が関与し、判断し、様々なプロセスを経る。この長いプロセスの中で、

細部にわたる共通の認識がなければ、最終的にまとめられた数字の意味は異なったもの

になってしまうかもしれない。このプロセスに関わる人々は、それぞれの良心に従い「良

かれ」と思い、様々な工夫を凝らす。しかし、個々の担当者が「良かれ」と思ってある

工夫をしたとしても、その意志がプロセス全体で共有され、それを受け入れるプロセス

ができあがっていなければ、中途半端に終わってしまうかもしれない。これは、最終的

に複数のポリシーが混在する危険性をはらんでいる。また、短期間に行われた試験であ

っても、実際に関与する人(担当者)が替わることも珍しくない。担当者が替わって、元

の担当者の意志がきちんと伝えられる保証はない。個人の能力や誠実さに頼った体制は

脆弱である。さらに、一つの試験の中で一貫性が保たれているだけでは不十分であり、

少なくともある薬の臨床開発全体(海外の試験結果も含めて)で一貫した考え方に基づ

いて、この長いプロセスが機能しなければ試験間の比較可能性、併合可能性は本当の意

味で確保したことにならない。臨床試験のあらゆる業務(治験実施計画書の作成から治験の準備、データ収集、SDV、

データクリーニング、データベース化、集計解析、報告)の中で、70-80%の労力が安全

性に関わる仕事に費やされるという状況は珍しいことではない9。安全性に関連するこ

れらの業務の効率が改善することは、臨床開発全体の生産性の向上につながると期待で

きる。安全性の社内標準について共通の理解があり、業務に関与する個々の担当者が「何を

すべきかわかっている」こと、様々なツールの共通化あるいは流用が可能なことは品質

の向上をもたらす。安全性の社内標準の整備は、安全性情報の品質とスピードに大きく寄与し、最終的に

は社会からの質問に対して、誠実に高品質でタイムリーな情報提供を行うための基盤を

与える10。

5

2. 安全性の社内標準 2.1. 安全性の社内標準の価値(社内標準がもたらすもの)

Gina Wood は、10 年以上にわたる社内標準運用の経験を踏まえ、社内標準の価値を

次のようにまとめている 8。・社内標準は臨床開発における業務の効率を高め、科学性を向上させる・研究者(治験に参加する医師、協力者)、スポンサー、規制当局のコミュニケーショ

ンを容易にする・効果的な環境の整備(例；トレーニングや解析ツール) を促し、１つのシステムに

統合することを促進する・グローバル・リソースの利用を可能にする・全フェーズを通して世界中の臨床データのシームレスな交換を可能にする・安全かつ有効な治療薬が上市するまでの時間を短縮する・症例の安全性を高め、コストを削減する

このメッセージに若干の補足を加える。社内標準の導入により、社内外でのトレーニ

ングを共通化でき、業務手順やその背景にある考え方を共有化できる。安全性情報の収

集から報告に至るプロセスの中で用いられる様々なツールを共通化できる。担当者は、

前の薬剤プロジェクトの経験が次の薬剤プロジェクトの仕事に役立つため、業務引継の

負担が大幅に減少する。担当者の経験蓄積が効果的なものになり、柔軟な人員配置が可

能になる。仕事の流れが見えているため、前倒しできる仕事が増える。複数試験の比較

や統合の妥当性が与えられ、複数試験のデータをいっしょに扱うことが技術的にも容易

になる 10。高品質でタイムリーな安全性情報の提供は、治験に参加する被験者、市販後

の患者の保護へとつながる。シームレスに利用可能な安全性情報が増えれば、より大き

な分母に対する発現率などを考えることができ、稀な事象を捉えるチャンスも増えるで

あろう。

社内標準の導入に際して、「決まったやり方を浸透させることで、実務者が考えなく

なる風土を作ってしまうのではないか」という危惧があるかもしれない。おそらく最初

から完全無欠の社内標準を作ることは困難であり、運用された社内標準は経験に基づき

改訂してゆく必要がある。ただし、その改訂は担当者レベルの好みであってはならず、

改訂すればあらゆる薬剤プロジェクトに(世界共同開発であれば世界中の薬剤プロジェ

クトに)影響を及ぼすことを考えた上で、科学的な判断と広い視野に立った判断によら

なければならない。「一つの社内標準をみんなで考え、改善してゆく風土」を創生する

ことができれば、それこそが望ましい姿である。

6

2.2. 安全性の社内標準がもつべき特徴

ここでは、新たに安全性の社内標準を作成しようとしたとき、あるいは既存の社内標

準を改訂しようとしたときに重要な論点について整理する。良い社内標準が備えるべき

特徴として Gina Wood は、・実際の経験に基づいていること・世界標準に準拠していること(例えば ISO 日付フォーマット yyyy-mm-dd) ・利用しやすいこと・理解しやすいこと・導入する力、サポートする力、変化してゆく力を持つこと

をあげている 8。また、新しい社内標準を作るときには、・業界標準を確認すること(例：CDISC、MedDRA) ・規制用件を確認すること(例：ICH、各地域のガイドライン) ・複数の会社が集まってひとつの標準を作成しても良い・作成にはデータマネージャ、統計家、臨床家、プログラマーが関与するべきであ

る・常に導入・運用を念頭におくこと(例：８文字の変数名) ・単純であることを大切にすること・過去のスタンダードからの良い事例を取り入れること・必須なもの(デフォルト)と選択的なの(オプション)を定義すること・薬剤・治療領域によらず頑健であること

に注意すべきであると述べている 8。

2.2.1. デフォルトとオプション

どんな治験でも必ず適用されるデフォルトと、治験によって追加あるいは変更可能な

オプションを区別することによって、社内標準に柔軟性が与えられる。例えば、患者背

景の性別はデフォルトで、喫煙歴はオプション、血液検査などの測定日はデフォルトで、

投与後の正確な経過時間や時刻はオプション、有害事象の集計において因果関係を問わ

ない有害事象の集計と、因果関係を否定できない有害事象の集計はデフォルトで、因果

関係が否定された有害事象はオプションというように項目ごとに明確に定義しておく。

2.2.2. モジュール化(Data Class Definition) 社内標準をモジュール化(関連のある情報・データのグループに分ける)し、アセンブ

リング(組み立て、組み替え)を可能にすることにより、管理がしやすくなり、社内標準

に柔軟性も与える。例えば、人口統計学的データ、既往歴、併用薬、バイタルサイン、

7

有害事象、臨床検査値、心電図などのグループ分けである。データベース構造あるいは

解析データセットをモジュール化することにより、その下流にあるデータ取り扱いのア

ルゴリズムや図表も、その上流にある症例報告書、症例報告書の記入指針、治験実施計

画書の記述などもモジュール化される。CDISC における Data Class Definition は、モジ

ュール化の考え方に沿ったものであり、新たに社内標準を作成する際に参考になるであ

ろう。

PartⅠの３章、４章では、有害事象や臨床検査値に関して、実際に社内標準を作成あ

るいは改訂するときにどのような論点について検討したらよいのかを解説する。一部提

案を含んでいるが、基本的にはどのような考え方があるのかを整理したものである。

8

3. 有害事象に関する問題 3.1. 収集における留意点 3.1.1. 収集する項目

有害事象情報を集計・解析に用いるためには、一貫性を持ったデータ収集が不可欠で

ある。 ICH-E2A においては、有害事象は「医薬品が投与された患者または被験者に生じた

あらゆる好ましくない医療上のできごと。必ずしも当該医薬品の投与との因果関係が明

らかなもののみを示すものではない。」と定義されている。また一方で、ICH-E3 ｢Structure and Content of Clinical Study Reports (治験の総括報告書

の構成と内容に関するガイドライン)｣においては、「試験治療の開始後に発現した全て

の有害事象(審査当局との間で、あらかじめ特定の事象は疾患に関連するものとして取

り扱うとの合意に達していないのであれば、基礎疾患に関連していそうな、又は合併症

を表していそうな事象を含む)」としている。これは、収集された有害事象についての

取り扱い方法を治験実施計画書中に記載していない限り、収集した全ての事象を有害事

象とみなすことを示唆している。しかしながら、全ての事象を対象にするとしても、具体的に詳細な部分で社内におけ

る申請品目の間あるいはそれらの各試験間に相違が生じないようにすることが重要で

あり、そのためには、収集する項目が、明確に定義されている必要がある。また、試験

間を通じて、共通の項目を一定のルールで収集することにより、統合解析時のデータの

質の向上を図ることができる。有害事象情報のうちデフォルトとして収集される項目を以下に挙げる。なお、これら

を収集してさえおけば良いというものではなく、これ以外にも治験薬の適応症や用法な

どにより、オプションとして追加収集する項目を検討することも必要である。

1) 有害事象名

有害事象は診断名で収集し、診断名がつかないものは徴候、症状で収集する。 ICH ガイドライン11において、有害事象としての症状、徴候、疾患は ICH 国際医薬用

語集(MedDRA)を用いて表示することとされている。収集に際しては、MedDRA 用語選

択の考慮事項を鑑み、診断に特徴的な徴候・症状が含まれれば、診断名を特定すること

も可能である。また、徴候や症状のみの場合でも、コード体系に沿った形での収集が可

能となるよう、CRF への記載ルールを事前に規定しておく方がよい。また、発現部位が特定できる場合は身体部位の情報を、原因(原発性疾患、原因菌、

感染源など)が特定できる場合はその情報を含めて収集する。

2) 重篤度

重篤度の定義については、ICH-E2A [Clinical Safety Data Management: Definitions and Standards for Expedited Reporting (治験中に得られる安全性情報の取り扱いについて) ]に

9

記載されており(下記参照)、これに従って分類しなければならない。

重篤な有害事象または副作用とは、医薬品が投与された(投与量にかかわらない)際に生

じたあらゆる好ましくない医療上のできごとのうち、以下のものを言う。 a. 死に至るもの b. 生命を脅かすもの c. 治療のため入院または入院期間の延長が必要となるもの d. 永続的または顕著な障害・機能不全に陥るもの e. 先天異常を来すものその他の状況、すなわち即座に生命を脅かしたり死や入院には至らなくとも、患者を

危機にさらしたり、上記ａ～ｅのような結果に至らぬように処置を必要とするような

重大な事象の場合には、緊急報告を必要とするか否かを医学的および科学的根拠に基

づいて判断する必要があり、通常、それらも重篤とみなすべきである。この例として

は、救急室等で集中治療を必要とする気管支痙攣、入院には至らないものの血液障害

または痙攣を来たした場合、薬物依存症または薬物乱用などが挙げられる。

3) 程度(重症度)

有害事象の重症度を判定する。治験実施計画書中にあらかじめ判定基準を記載し、こ

れに従って判定することが望ましい。なお、重症度の判定基準例は 3.1.5 を参照のこと。

4) 発現時期・消失時期

各有害事象の発現日/消失日。各時期を収集することにより、有害事象の持続期間を導出することができる。臨床検査値の異常を有害事象とする場合、発現/消失日は検体採取日とする。

5) 転帰

最終観察時における有害事象の転帰状況。転帰情報としては、有害事象の消失、軽快、未回復、死亡、不明が挙げられる。

6) 処置

有害事象に対し、最終観察日までに講じた処置の情報を収集する。処置の種類：

治験薬の投与状況変更(増量、減量、休薬、中止など) 併用治療(増量、減量、中断、中止など) 新たな治療開始/対症療法の実施(薬物治療、薬物治療以外の治療)の有無、など

7) 治験薬との因果関係

10

有害事象の発現理由などから、薬剤との関連性を検討する。関連性が否定できない、もしくは発現理由が治験薬投与によるものと判断できる場合、

治験薬との因果関係ありとする。

3.1.2. 収集の対象とする期間

収集期間はあらかじめ設定することにより、収集に対する均質性を保つことができ、

薬剤の安全性プロファイルをより適切に反映し、試験間で一貫性のあるデータを構成す

ることができる。以下に収集期間を設定する場合の考慮点を挙げる。

1) 治験期間中に生じた有害事象を全て収集することを前提とする。

治験薬投与開始前に、スクリーニング期、プラセボ run in 期、投与前 wash out 期等の

期間が治験期間として設定されている治験では、この期間の事象を有害事象として収集

するかどうかを規定しておく必要がある。また、治験薬投与中に wash out 期がある試験や、計画された未投与期間がある試験の

ように、治験薬を投与しない期間があらかじめ設定されている治験についても同様に、

この期間の事象を有害事象として収集するかどうかを規定しておく必要がある。

2) 治験薬投与終了後の有害事象の収集期間が被験者間で異ならないようにする工夫

治験薬投与を止めた後、薬剤の影響による有害事象が起こることを想定して、フォロ

ーアップ期間を設けることも必要である。このとき設定根拠として、薬物動態学的デー

タに基づいたラグタイム(体内で薬剤や代謝物が活性であると想定される期間)などを

用いることが考えられる。

治験薬投与終了後の収集ルール(例)

・投与終了日まで収集する・投与終了後１ヶ月まで収集する・投与終了後３ヶ月まで収集する・観察終了日まで収集する(投与終了後に一定の観察期間が設けられている治

験)

3) 収集期間外の情報収集について

収集期間外のフォローアップとして、可能な限り有害事象が回復するまで調査・収集

することも重要である。このような情報については、集計時には含められなくても個々

の事象に関する追跡情報として、別途一覧にするなどの整理をすれば有用であろう。

11

有害事象の関連情報の収集ルール(例)

規定した収集期間を超えても、既に起きた有害事象の関連情報は完全に(転帰を

確認するなどして情報が確定するまで)収集する [問題点]：CRF の固定まで時間を要する規定した収集期間で対応し、既に起きた有害事象の関連情報は、得られている情

報のみで収集を打ち切る [問題点]：得られていない関連情報については、CRF 上(及びデータベース上、集

計・解析上)では不明となる。そのため、CRF とは別の文書を用いて、可能な限り

情報を収集し、知り得た追加の情報を総括報告書に記載する等の対応が必要。

3.1.3. 有効性の評価項目に関連した事象の収集ルール

原疾患の悪化等の有効性評価項目に関連した事象は ICH-E3 において、「試験治療の

開始後に発現した全ての有害事象(審査当局との間で、あらかじめ特定の事象は疾患に

関連するものとして取り扱うとの合意に達していないのであれば、基礎疾患に関連して

いそうな、又は合併症を表していそうな事象を含む)」と記載されているように、それ

らを有効性の評価の中で取り扱い有害事象としない場合には、審査当局との事前合意が

必要である。

「原疾患の悪化」や「有効性の評価項目に関連した事象」は、薬剤の有効性に関する

情報であり、安全性情報とは異なる。しかし、「治験期間中に観察される好ましくない

徴候や症状」として情報を収集することも必要である。特に、原疾患が悪化し、重篤性

がある場合は、有害事象として収集すべきである。有害事象としない場合の根拠としては、有効性については有効性の評価項目を用いて

別途詳細に論じるためであり、仮に薬効の不発揮等の有効性に関する事象と安全性の事

象を一緒にしてしまうと、有効性と安全性のプロファイルが区別できなくなってしまう

ことが挙げられる。有効性に関連する情報は、有害事象として収集しない場合でも、検討する必要が生じ

たときのために、当該事象とその関連情報について情報収集を規定する等の対応を考え

る必要がある。

3.1.4. 複合事象の収集ルール

一連の関連した事象を複合事象とした場合、その収集ルールは、「3.1.1. 収集する項

目」の有害事象名の記載ルールの一部となる12。診断名と徴候・症状の双方を報告された場合には、双方を集積してもよいが、診断名

のみを収集しても、その診断に特徴的な徴候・症状であれば十分な情報を得ることがで

12

きると考えられる。しかし、通常、診断の一部として認識されない徴候又は症状に関す

るものであれば、それらを全て収集する必要がある。同時に起きた事象や連続的に起きた事象を総合的に判断して診断名を特定する場合

についても、同様のことが言える。

1) 同時に起きた事象(例)

・「発熱」＋「鼻汁」＋「嘔吐」＋「下痢」を「感冒」として捉える。・「ALT 上昇」＋「AST 上昇」を「肝機能検査値異常」として捉える。・「ALT 上昇」＋「AST 上昇」＋「黄疸」を「肝機能障害」として捉える。

2) 連続的に起きた事象(例)

・「真菌感染症」→「敗血症」→「DIC(汎発性血管内血液凝固症)」→「死亡」・「起立性低血圧」→「ふらつき」→「転倒」→「頭部外傷」→「首の痛み」それぞれの事象を有害事象として捉える。

また、複合事象とは異なるが、有害事象が発現と消失を繰り返す場合、その情報収集

方法について事前に規定しておく必要がある。

3) 発現と消失を繰り返した事象(例)

・以前発現した同じ事象の重症度よりも悪化している場合、新たな有害事象とす

る。

有害事象情報をデータベース上に集積する場合、徴候・症状の詳細までも収集するこ

とには限りがある。しかし、医学的に意義のある情報を集約して収集することにより、

評価がより理解しやすい安全性情報を十分に提供できるようになると考えられる。

3.1.5. 重症度の判定

有害事象の収集データの中で、重症度判定(例えば、軽症、中等症、重症)の判定基準

を作成するときには、以下の資料が参考になる。薬務局安全課長通知第 80 号(薬案第 80 号)｢医薬品等の副作用の重篤度分類基準につ

いて｣13

グレード 1：軽微な副作用と考えられるもの。グレード 2：重篤な副作用ではないが、軽微な副作用でもないもの。グレード 3：重篤な副作用と考えられるもの。すなわち、患者の体質や発現時の

状態等によっては、死亡又は日常生活に支障をきたす程度の永続的な機能不全に

陥るおそれのあるもの。

13

また、特に癌領域においては、JCOG「National Cancer Institute Common Toxicity Criteria

(NCI-CTC )」、[Common terminology Criteria for Adverse Event v3.0 (CTCAE)]も参考になる14,15。しかしながら、これらは事象の重篤度について視点を当てているため、特に事象

発現の程度にのみ関心がある場合は、留意して引用する必要がある。上記の他には、日常生活への支障、医学的処置の有無、治験薬の投与継続の可否等を

キーワードとして判定基準を作成することが考えられる。例えば、日常生活への支障を

キーワードとした場合は、以下のような基準が考えられる。

重症度の例

軽度：日常的活動が妨げられないもの中等度：日常的活動が妨げられるもの重度：日常的活動が不能となるもの

NCI-CTC や上述のように日常生活をキーにした基準は、治験薬投与の対象被験者が

比較的重症な疾患である場合にはベースとなる状態がもともと悪い状態であることを

考慮すべきである。一方で、状態が軽症な疾患の集団を対象とする場合は、治験薬の｢中

止｣やその後の何らかの｢処置｣をキーワードにして基準を作成することも考えられる。

いずれの場合も一薬剤内の複数試験間で一貫性が保てるように、理解し易く、該当領域

に対して適当な表現を含んだ基準を構築していくことが重要である。

3.1.6. 因果関係の判定

有害事象の情報として収集する中でも、因果関係の判定は特に重要視される。因果

関係の判定は、集計時には有害事象の中から副作用を抽出するために用いられるため

である。治験中のデータ収集時には被験者ごとの各有害事象について薬剤との因果関

係が判定され、リアルタイムで副作用かどうかが判断されている。薬剤全体の副作用

を評価する上で一貫したデータ収集を各企業内で実施することが必然的に要求される

が、その際の留意点として、因果関係の判定方法について触れる。 1) 判定方法

因果関係の判定方法については、現在日本国内の多くの企業で実施されている典型的

な例として、各被験者の各事象と治験薬との関連の程度を以下のように４段階あるいは

数段階で判定するものが挙げられる。

14

判定の分類例

例 1.) 明らかにあり、多分あり、可能性あり、なし例 2.) 明らかにあり、多分あり、あるかもしれない、ないらしい、なし、不明

WHO ICH-E2B ・ certain ・ probably/likely ・ possible ・ unlikely ・ conditional/unclassified ・ unasssessable/unclassifiable

・統制用語なし

また、WHO では上記の分類を用いている16。WHO の提示では、薬剤に対するいかな

る反応もADRとすることとしているが、後述するWHOの判定基準はglobal introspection method(GI)に基づき、主観的との批判もある17。判定方法の水準については 1970～1980年頃多くの議論がされている。 Karch & Lasagna18は個々の臨床の状況下で薬剤と反応

の関係を判断するのは困難かあるいは不可能なことが多いとしているが、その理由は複

雑な臨床判断を伴い、限られた情報の中で反応のメカニズムも判らない状況での解釈で

あるためである。しかしながら、一方で、治験薬投与の時期、投与の中止による影響、

再投与後の変化などの情報を基に、因果関係の水準を Definite, Probable, Possible, Conditional, Doubtful として判定する方法を提案している。その後、Kramer19,20,21は、因

果関係判定に関するアルゴリズムを紹介している。これはより客観的な判定となるよう

に、各事象について決定樹に基づいてスコアを与え、全スコアを合計した後カテゴリー

に分類して因果関係の程度を設定したものである。さらに、Naranjo22,23は、Kramer のア

ルゴリズムが複雑であるとし、もっと簡便にしたスコアリングアルゴリズムを提案して

いて、スコアの合計を分類した因果関係の水準を提示している。

表 3.1.6.1 Naranjo のアルゴリズム：ADR probability scale

To assess the adverse drug reaction, please answer the following questionnaire and give the pertinent score.

Yes No Do not

know

Score

1 Are there previous conclusive reports on this reaction? +1 0 0

2 Did the adverse event appear after the suspected drug was administered? +2 -1 0

3 Did the adverse reaction improve when the drug was discontinued or a

speclfic antagonist was administered?

+1 0 0

4 Did the adverse reaction reappear when the drug was readministered ? +2 -l 0

5 Are there alternative causes (other than the drug) that could on their own

have caused the reaction?

-l +2 0

15

6 Did the reaction reappear when a placebo was given? -1 +1 0

7 Was the drug detected in the blood (or other fluids) in concentrations

known to be toxic?

+1 0 0

8 Was the reaction more severe when the dose was increased, or less

severe when the dose was decreased?

+1 0 0

9 Did the patient have a similar reaction to the same or similar drugs in any

previous exposure?

+1 0 0

10 Was the adverse event confirmed by any objective evidence ? +1 0 0

Total score

スコアの合計は以下のように分類され、因果関係判定に対応している。

表 3.1.6.2 Probability of ADRs

Total score ≥9 5-8 1-4 ≤0

分類 Definite Probable Possible Doubtful

この他、判定の分類方法は現在まで種々提案されているが、下記のようにそれらを比

較した報告もされている 17。表 3.1.6.3 因果関係の判定分類(1)

提案者分類

Cornelli24 Definite risk Almost definite Probable Possible Very doubtful Unrelated

Hsu Stoll25 Definite High probable Probable Possible Remote Unrelated

WHO26 Certain Probable Possible Unlikely Conditional Unclassifiable

Irey27 Causative Probable Possible Coincidental Negative

Karch&Lasagna28 Definite Probable Possible Conditional Unrelated

Dangoumau29,30 Very likely Likely Possible Doubtful Excluded

Blanc31 Certain Probable Possible Coincidental Doubtful

Kitaguchi32 Definite Probable Possible Remote Unknown

Emanueli33,34 Definite Almost definite Probable Possible Unrelated

Venulet35,36 Definite Probable Possible Unlikely Unrelated

Kramer19,20,21 Definite Probable Possible Unlikely

Naranjo22 Definite Probable Possible Doubtful

Jones37 High probable Probable Possible Remote

Australian38 Certain Probable Possible General list

Weber39 Definite Probable Possible Unlikely

Stephens40 Almost Certain Probable Possible Doubtful

また、表 3.1.6.3 のように各分類間で対応はとれていないが、他にも判定分類として

16

の報告がある。

表 3.1.6.4 因果関係の判定分類(2)

提案者分類

ADRIAN41

Castle42

Evreux43

これらのアルゴリズムを用いた結果は数値で表現され､WHO の GI とは語句が異なる.

Bayesian44

Lagier45

Hoskins&Mannino46

病因学的尺度が必要とされる.

Maria V47 Definite Probable Possible Unlikely Excluded

Stricker48

Loupi49

RUCAM50

特定の有害事象に対するアルゴリズムを想定したもの.

Jain51

Taiwan52

CPMP53

WHO の GI が 6 段階であるのに対して､因果関係として 3 段階の水準しかない.

Belgium Certain Probable Possible Unlikely Unclassified Unclassifiable Deleted

Denmark Definite Probable Possible Unclassified Unlikely

France &

Luxemborg

Very Likely Likely Plausible Possible/

dubious

Unlikely

Germany Possible Not

Evaluated

Unclassifiable Unlikely

Greece Certain Probable Possible Not Possible

or unlikely

Unclassified

Ireland Certain Probable Possible Unlikely Unclassified Unclassiable

Italy Certain Probable Possible Doubtful

The Netherlands Certain Probable Possible Unlikely Unclassified

Portugal Probable Possible Unlikely Unclassified

Spain Definite Probable Possible Conditional Improbable

United Kingdom Probable Possible Unlikely Insufficient Unassessable

2) 判定の基準

スコアなどから因果関係を判定するアルゴリズムは他にも種々提案されているが、日

本国内では下記に示すような基準に従い、臨床現場で判断されているのが現状である。

程度の判定の根拠となる内容には、次のような例が考えられるが、実際の判定となると

医師の経験に左右される部分でもある。なお、企業によっては特に市販後の段階になっ

てから、治験期間中に報告された全ての有害事象について一定のアルゴリズムを用いて

検討の参考にしているところもある。

17

表 3.1.6.5 因果関係判定基準の例54

因果関係判定基準

多分あり投与と有害事象発生との時間的関連性に妥当性があり､薬剤の投与中

止により改善し､患者の疾患病態から予測される特質によっては合理

的に説明ができない場合。

あるかもしれない薬剤投与と有害事象発生との時間的関連性に妥当性はあるが､患者の

疾患病態や併用薬によっても発現する可能性がある場合。

ないらしい薬剤投与と有害事象の時間的関連性が乏しい場合。

なし基礎疾患､合併症などによるもので､薬剤との関連性はないと報告医師

が考えた場合。

不明薬剤との関連性が評価できない場合。

また、これに対して、WHO の分類では下記の基準が提示されている。

表 3.1.6.6 WHO の判定分類基準 26

Term Description Certain A clinical event, including laboratory test abnormality, occurring in a plausible time

relationship to drug administration, and which cannot be explained by concurrent disease or other drugs or chemicals. The response to withdrawal of the drug (dechallenge) should be clinically plausible. The event must be definitive pharmacologically or phenomenologically, using a satisfactory rechallenge procedure if necessary.

Probable/ Likely A clinical event, including laboratory test abnormality, with a reasonable time sequence to administration of the drug, unlikely to be attributed to concurrent disease or other drugs or chemicals, and which follows a clinically reasonable response on withdrawal (dechallenge). Rechallenge information is not required to fulfil this definition.

Possible A clinical event, including laboratory test abnormality, with a reasonable time sequence to administration of the drug, but which could also be explained by concurrent disease or other drugs or chemicals. Information on drug withdrawal may be lacking or unclear.

Unlikely A clinical event, including laboratory test abnormality, with a temporal relationship to drug administration which makes a causal relationship improbable, and in which other drugs, chemicals or underlying disease provide plausible explanations

Conditional/ Unclassified

A clinical event, including laboratory test abnormality, reported as an adverse reaction, about which more data is essential for a proper assessment or the additional data are under examination.

Unassessible/ Unclassifiable

A report suggesting an adverse reaction which cannot be judged because information is insufficient or contradictory, and which cannot be supplemented or verified.

3) 方法の問題点

上述した判定方法では、いずれも 1 つの事象に対して原因を治験薬１つに限定して判

定を実施している。Karch & Lasagna28の指摘にもあるように、因果関係の判定は困難を

伴うものであるが、このような判定方法を用いることには、下記のようにいくつかの問

題点が考えられる。

18

① 情報の範囲：原因を１つの事象が起きた 1 被験者のみの範囲内で判定するには情

報が限られていて不十分であり、当該治験が進行中にその場でリアルタイムに判定する

には限界がある。先述のように医師の習熟度にも左右されてしまうであろうし、未知な

有害事象、稀な有害事象ではさらに統一された判定は困難となる。 ② 状況の相違：仮に一人の医師が複数の被験者の事象を観察できたとしても、被験

者ごとに背景や状況(年齢、病態、既往歴、合併症、併用薬、･･･)が異なるため、正確

な判断をするのに十分な情報量とはいえないであろう。 ③ 副作用(関連性が否定されない有害事象)との分類：判定の程度から副作用として

取り上げる際に、因果関係「なし」以外の場合、あるいは「多分なし、なし」以外の場

合等、抽出する基準が試験、領域、企業ごとに一定していないため、臨床現場において

も混同・混乱を招いている可能性がある。これらの問題点が存在するため、情報収集時には｢有害事象｣という形式で全てを収集

し客観的な事実が集積された後に、それを基に当初推論していた因果関係を確認すると

いう手順が必要になってきていると考えられる。

4) 因果関係判定の他のアプローチ

因果関係を判定する別の方法として、事象の原因を複数挙げてから最も可能性が高い

原因を特定する、という方法がある。もともと事象に対する因果関係は Spilker55にある

ように、複数の原因が作用したり連鎖的な反応が引き起こすことも想定され(図 3.1.6.1、図 3.1.6.2)、現実的には即座に 1 例の情報から判定することは困難なことが多い。上述

の方法を用いれば、リアルタイムでの判定時には情報量不足として迷うことがあっても、

試験終了後など情報がさらに多く集められた後から振り返って因果関係を検討する際

に検討する視点が増える。即ち、因果関係の判定とは、当座に実施されるものは必ずし

も真の内容を示しているのではなく、事後的に確定していくものであり、他のアプロー

チによる検討とは、このような検討を視野に入れて情報を可能な限り多く収集しておこ

う、という考え方に基づいた判定方法である。従来の方法が 1 事象対 1 原因(治験薬)であるのに対して、1 事象対多原因として判定している。

Patient in Baseline

State

Patient’s

Clinical

Direct Cause A

Direct Cause B

Direct Cause C

Through Biological

Processes Leads to

●Potential Interactions Among Direct

Causes of Disease

図 3.1.6.1：Model to illustrate factors involved in cause-and-effect relationships

19

このような判定方法に基づき情報収集する場合には、治験現場では想定される全ての

原因を記録し、それらに順位をつけておくことになる。また、こうして収集された有害

事象の中から｢副作用｣を取り上げる際には、いくつか挙げられた原因の中で、最も可能

性が高い原因(Most likely Cause)が治験薬と判定された事象や、原因が全く不明である事

象を｢副作用｣として抽出すればよいであろう。ただし、この手順をとった場合、治験薬を含んだ個々の原因と事象の因果関係につい

て、従来のような「1 対 1」対応による情報、即ち関連性の程度を得ることはできない

ことに留意すべきである。また、その他に、治験時には副作用のプロファイルが明確ではないため、副作用の見

逃しや過少評価につながるのではないかという懸念もある。しかしながら上述のように、

因果関係の判定は治験時(リアルタイム)に確定するものではなく、情報が蓄積されるこ

とによって判定が変化しうるものであるとの立場にたてば、より多くの情報をフィルタ

ーなく収集し、ある程度データが蓄積された後から回顧的に判断が可能なような仕組み

を構築しておくことの方が重要であろう。この点について、Senn56は、因果関係の判定

には即座に判定する as judgementとデータが集積されてから判定する as evidenceがある

という概念を提示し、両者を区別することが重要と指摘している。究極の目的はどのよ

うな副作用、特に重篤な副作用が発現するか、予想されるか、ということであり、その

ためには様々な方法やアルゴリズムの長所短所を理解した上で用いることが必要であ

る。なお、回顧的に判定を見直すのは有害事象情報が収集された後に、企業側で医学専

門家が実施することが望ましい。

5) 有害事象の種類と因果関係

有害事象の種類を分類した場合に、それぞれの因果関係判定にどのようなことが影響

しているか、留意点の背景として捉えておくことは有用であろう。有害事象の分類は様々あるが、Kirby2は TYPE A (薬理作用から起こる予想可能な用量

反応的なもの)、TYPE B (薬理作用や用量には関係なさそうな、特異体質によるものや

C1

E2 E3

C2

E1

図 3.1.6.2：Example of cause-and-effect relationships

20

予想できないもの) といった分類を紹介している。また Spilker57は表 3.1.6.7 のように分

類している。TYPEⅠ、Ⅱなどは薬理作用で生じるものであり、Ⅳは Idiosyncratic なも

のであり、通常の被験者群では生じないものである。

表 3.1.6.7 有害事象の種類

TYPEⅠ：過剰な投与による

TYPEⅡ：過剰な効果による

TYPEⅢ：薬剤か他の要因との交互作用による

TYPEⅣ：Idiosyncratic な(特異体質による)効果

TYPEⅤ：有害事象情報を知ったことによる

これらの事象が発現した場合はその被験者 1 例の情報のみであっても再投与などに

より因果関係を評価することが可能である。しかしながらⅢのように薬剤が contribution factor として作用するような場合や治験薬に加えてその他の原因が考えられる場合には、

１被験者のみでは判定が困難である。こういう場合には FDA の Guidance58でも記載さ

れているように、ケースコントロール研究とか長期フォローアップを伴ったコホート研

究といった薬剤疫学の手法など、対照群との比較に拠らなければ因果関係が判明しえな

い。そのような状況は常に想定されるため、統合解析などで事後的回顧的に検討できる

ように調査をしておくことが必要であろう。なお、回顧的にしか因果関係が判明しない

事象と認識された場合には、治験実施中は不明と判定されることになる。

3.2. 集計・解析における留意点 3.2.1. MedDRA コード

試験を問わず一貫したデータ解析を行うためには、有害事象などの詳細を記録する際

に共通な用語を用いることが重要である。そのためには、標準的な共通辞書を用いるべ

きである。 ICH-E9 には辞書用語を用いた要約方法について、以下のような記載がある。

共通の有害事象の辞書の使用は特に重要である。有害事象の辞書は、器官分類、基

本語又は慣用語(用語集参照)という、三つの異なる水準で有害事象データを要約できる

ように構成されている。有害事象を要約する通常の水準は基本語であり、同一の器官

分類に属している基本語は、データの記述的提示の際にまとめることができる(ICH M1

参照)。

MedDRA(Medical Dictionary for Regulatory Activities)は、ヒトに用いられる医療用製品

に関する規制情報を共有するという特定の用途を目的に ICH で作成されたものである。

21

現在日本では承認審査資料において可能な限り日本語版 MedDRA を使用することが求

められている 11。 MedDRA は、以下の５つの階層で構成されている。どの階層の用語を用いて集計解

析を行うかについてはあらかじめ治験実施計画書や統計解析計画書に示す必要がある。

－器官別大分類 (System Organ Class；SOC) －高位グループ用語 (High Level Group Terms；HLGT) －高位語 (High Level Terms；HLT) －基本語 (Preferred Terms；PT)

－下層語 (Lowest Level Terms；LLT)

有害事象を集計する際に関連する事象をグループ化することは意味のあることであ

る。PT は発生頻度を報告するために用いられるものであり、治験責任医師の記述がコ

ード化される最下層の用語である LLT をグループ化するレベルのものである59。また、

高頻度で発生しない事象については、SOC レベルで集計する事により安全性の特徴を

理解する上で有用である。

有害事象情報の収集段階では、事象のコード化に際して、試験内あるいは試験間で一

貫性をとる必要がある。例えば、試験が長期に及ぶ場合であっても、試験開始時から終

了時まで一貫したルールに則ってコード化されなければならない。また、MedDRA は

頻繁にバージョンアップが行われ、コードの追加、変更などデータ管理が複雑になるた

め、標準的なルールを作りバージョン管理を行う必要がある。

3.2.2. アルゴリズム

一貫性のある集計解析を行うために、収集した有害事象の情報についてどの事象をど

のように集計するのかというアルゴリズムを規定することは重要である。特に、有害事

象の情報に対して人年法や生存解析手法による集計解析を行う試験については、その手

法に対応したアルゴリズムをそれぞれ取り決めておく必要がある。本節は、集計の対象とする事象(どの事象を集計の対象とするか)及びその集計方法(事

象をどのように集計するのか)について、規定する必要性が高いと考えられるアルゴリ

ズムの一例を記載する。

1) 試験治療下での発現(TE：Treatment Emergent)

発現した有害事象に対して、TE を対象とした集計方法がよく用いられる。ここでは、

TE の概念及び特徴について記載する。また、有害事象の収集期間についても簡単に触

れる。 ICH-E3及び ICH-E9には”治療により発現した徴候及び症状(TESS: Treatment Emergent

22

Signs and Symptoms)”及び”試験治療下での発現(TE: Treatment Emergent)”の概念がそれ

ぞれ記載されている。

TESS の概念(ICH-E3)

試験治療の開始後に発現した全ての有害事象(審査当局との間で、･･･(中略)･･･を含む)を要約表(14.3.1 項)に表示すること。表には、重篤な有害事象又は他の重

要な有害事象と考えられたバイタルサインの変化及び臨床検査値の変化を含め

ること。ほとんどの場合、このような表に「治療により発現した兆候及び症状」(TESS：治療前には見られなかった事象及び治療前からあったが治療中に悪化した事象)を記述することが役立つ。 ( ｢12.2.2 有害事象の表示｣より一部

抜粋 )

Treatment Emergent の概念(ICH-E9)

徴候や症状に相当の背景ノイズが存在する状況では(例えば、精神科での試験)、異なる有害事象に対するリスクの推定に背景ノイズを考慮する方法を考えるべ

きである。そのような方法の一つは、「試験治療下での発現」(用語集参照)とい

う概念を用いることである。「試験治療下での発現」では試験治療前の基準とな

る発現状況と比べて、新たに発現又は悪化した有害事象のみを記録する。 ( ｢6.3 評価される被験者集団とデータの提示｣より一部抜粋 )

試験治療下での発現 Treatment Emergent：試験治療前には存在しておらず試験治療期間に出現した事象、又は試験治療前

の状態に比べて悪化した事象。 ( 用語集より抜粋 )

集計の対象とする事象としてこれらの概念をアルゴリズムに適用することは、薬剤

(又は処置)に関係しない情報を除いて有害事象を集計できることから、薬剤(又は処置)の特性を明確にするためにも有用であると考えられる。TE のアルゴリズムを適用する

場合は、”試験前からの悪化”の定義や、その判断に用いるデータ(重症度など)の扱い方

を含めて「試験治療下での発現」を明確にルール化しておくことが必要となる。TE の

アルゴリズムについて、簡単な一例を次に示す。

<TE のアルゴリズム適用例>

・治験薬投与期間中に新たに生じた有害事象すべてを集計の対象とする。・治験薬投与期間中に生じた有害事象が治験薬投与前から存在する場合、その

有害事象の重症度が悪化したものを集計の対象とする。なお、治験薬投与前

及び治験薬投与期間中において”同じ有害事象が２件以上発生した場合”及び”

23

重症度が欠測”の場合は、程度が最も重い重症度を採用することとする(すなわ

ち、治験薬投与前の有害事象であれば｢軽症｣、治験薬投与期間中の有害事象

であれば｢重症｣を採用する)。

TE のアルゴリズムを適用する際には、収集期間(いつまでを治験薬投与前とするか)、

収集方法、情報の信頼性の確保などに留意しながら治験薬投与前の事象の情報を収集し

ておく必要がある。また、治験薬の投与終了後に発現した有害事象の情報についても、その事象を集計の

対象とするか否かをあらかじめ規定しておく必要がある。例えば、収集段階においては

投与終了後も情報を収集しておき、治験薬の性質(消失半減期やこれまでの試験で得ら

れた所見など)より定めたある一定期間内において発現した事象を集計の対象とするア

ルゴリズムも考えられる。ここで記載したアルゴリズムを収集の段階で適用し、有害事象とはならない事象を収

集しないとする方法も考えられる。しかしながら、TE の概念を有害事象情報の収集段

階に適用した場合は、薬剤(又は処置)が原因となって重症度が不変の状態が継続してし

まった有害事象情報を全く収集できないことに留意しなければならない。一方、収集段

階では全ての事象の有害事象情報を収集し、集計解析時に TE の概念を適応することに

しておくと、TE を対象とした集計解析以外にも必要に応じて、全ての有害事象(all AE)を対象として集計解析を行うことや、治療前の有害事象別に部分集団解析を行うことに

対応することが可能である。どのようなアルゴリズムを適用するにしても、データの収集段階における偏りやバラ

ツキを少なくするために、その方法をプロトコールにあらかじめ記載しておくことが望

ましい。

2) 集計方法のアルゴリズム

頻度集計表を作成する際、同じ被験者において複数回発現した同じ有害事象をどのよ

うにカウントするのかを規定しておくことは、結果の正確な解釈及び再現性の観点から

重要である。また、重症度や日付の情報に対する集計上の取り扱い方法についてもあら

かじめ取り決めておくとよい。件数及び被験者数のカウント･アルゴリズムの一例を例 1、例 2、再調査しても重症度

が欠測という不適切な状況の場合の取り扱いルールの一例を例 3、日付の取り扱いルー

ルの一例を例 4 にそれぞれ示す。なお、例 1～4 に示す内容はあくまで取り扱い方法の

一例である。また、例示の中の同じ有害事象の”同じ”とは、集計解析を行う用語レベル

で同じことを意味している。

24

例 1. 件数(Number of adverse events)のアルゴリズム例

・同じ被験者に同じ有害事象が複数回発現した場合、１件としてカウントする。・同じ被験者に異なる有害事象が発現した場合、それぞれの有害事象として１件

ずつカウントする。

例 2. 被験者数(Subjects with adverse events)のアルゴリズム例

・有害事象を発現した被験者数を集計する際、同じ有害事象を複数回発現したり、

２種類以上の有害事象を発現した被験者も“１つの有害事象のみを発現した被

験者”と同様に１回だけカウントする。・器官ごとに発現数を集計する際、被験者が同じ器官内で有害事象をいくつ発現

したかに関わらず、被験者は器官ごとに１回だけカウントする。・重症度の集計をする際、繰り返し発現する同じ有害事象の重症度は、その被験

者が発現した同じ有害事象の中で最も重症な判定だけをカウントする。

例 3. 重症度の取り扱いルール例

・治験薬投与前において、重症度のデータが欠測の場合は軽症として扱う。・治験薬投与期間中において、重症度のデータが欠測の場合は重症として扱う。・治験薬投与前及び投与期間中において、同じ有害事象が２件以上発生した場合、

最も重症と判断された重症度を用いる。ただし、同じ有害事象における重症度

が全て欠測の場合は、治験薬投与前は軽症、治験薬投与期間中は重症として扱

う。

例 4. 日付の取り扱いルール例

・全て西暦を使用する。(又は、全て和暦を使用する。) ・不完全な日付は次のように扱う。

○月頃→○月１日上旬→5 日、中旬→15 日、下旬→25 日春→4 月、夏→7 月、秋→10 月、冬→1 月

この他に、人年法や生存時間解析を実施するような試験においては、イベント発現日

や打ち切り日の定義や取り扱いなどを取り決めておく必要がある。

3.2.3. 解析対象集団

安全性の解析対象集団をどのように定めるかは、試験計画時に規定しておく必要があ

る。例えば、治験薬が全く投与されていない被験者や、規定の期間以上投与されていな

25

い被験者などをどのように扱うのかということは、あらかじめ規定しておかなければな

らない。通常、安全性評価に用いられる被験者集団は、治験薬を少なくとも一回服用し

た被験者の集団である 59。治験薬に曝露されたすべての被験者のデータを用いることは、

限られた試験のなかで可能な限り情報を収集するという観点からも重要である。無作為化比較試験において、実際に用いられた治験薬がどちらであっても、無作為化

という枠組みから考えたときに解析時には割り付けられた群として扱うべきとの議論

がある60。しかしながら、安全性評価においては、治験薬に対する安全性情報に興味が

あるため、実際に用いられた治験薬の群として扱うべきであろう。 ICH-E3 では安全性の解析対象集団について、以下の記載がある。

治療に組み入れられ、少なくとも 1 回は治療を受けた全ての患者が、安全性の分析に

含まれることが前提となる。そうでない場合には、説明が必要である。

3.2.4. 頻度集計表

本節では、頻度集計表に関する標準化について述べる。各社において目指す標準化の

程度には差があるが、どんな薬剤でもどんな試験デザインでも常に提示するデフォルト

の集計表と、薬剤の特性や試験デザインに応じて用いられるオプションの集計表に区分

して、標準化を検討すると良い。また、ICH-E3 に以下の記載があるが、ここでは有害事象の集計に関する部分(ICH-E3

における第 2、3 段階目)のみならず、治験からどの程度まで安全性を評価し得るのかを

確認するため情報分析(ICH-E3 における第 1 段階目)についても、集計表の標準化につい

て検討する。

「安全性に関するデータの分析は三段階に分けて考えることができる。まず、治験か

らどの程度まで安全性を評価し得るのかを確認するために、投与量・期間・患者数を検

討すること。次に、比較的よく見られる有害事象、臨床検査値の変化などを明確にし、

妥当な方法で分類し、治療群間で比較を行い、さらに時間依存性、人口統計学的特性と

の関係、用量又は薬物濃度との関係など、副作用又は有害事象の頻度に影響する可能性

のある因子について適切に分析すること。最後に、重篤な有害事象及び他の重要な有害

事象を明確にすること。これは、通常、薬剤との関連が明確であるかどうかにかかわら

ず、有害事象のために試験完了前に脱落又は死亡した患者を十分に調べることにより検

討される。」

なお、集計表と同様に一覧表に関する仕様についても標準化しておくことが望ましい。

例えば、被験者数が少ないフェーズⅠなどでは、集計表の替わりに様々な一覧表を作成

することがある。本書では論じないが、一般に一覧表の標準化が役に立つ場面は少なく

ないと思われるので、集計表の標準化と併せて検討しておくと良い。

26

1) 集計表の見栄え集計表を標準化する際には、その見栄えに関する検討を丁寧に行うことが重要である。

その際、試験デザインに依存して表の構成が大きく変わってしまうのは標準化の観点か

らは望ましくない。クロスオーバーデザインであっても、プラセボ run in デザインや投

与後経過観察デザインであっても、基本的には常に同じイメージの頻度集計表を作成す

ることが望ましい。一例を示すと、2 群の並行群間比較試験と次相の 4 群の用量反応検

証試験とで、投与群の並びが横だったり縦だったりと不統一であっては読み手に不親切

である。以下の観点を参考に、各社において標準化の際に適用させるルールを取り決め

ておくと良い。なお、本節では以降、最も一般的である 2 群の並行群間比較試験を想定

することとする。・縦に並べる項目、横に並べる項目を決める際には、例えば投与群は極力横に並べる

など統一性を持たせること。・一つの表にまとめて示した方が見やすいのか、いくつかの表に分割した方が伝わり

易いのかを良く考えて、表を構成すること。・「0(ゼロ)」と「．(欠測)」の意味を分けて表示すること。・欠測データがあった場合、表から除かずに欠測というカテゴリーで表示すること。・あるカテゴリーに該当する被験者被験者がたとえ 0 例であっても、当該カテゴリー

を必ず表示すること。・部分集団別集計表においてある層の評価被験者数が少ない場合など、割合で示すよ

り分数で示した方が適切な場合がある。・縦方向の小計又は合計の必要性、横方向の小計又は合計の必要性を吟味すること。

例えば、実薬対照の試験において互いに異なる薬剤群を合計することに意味がある

のか十分検討する。一方で、他の表との周辺和を確認する目的であえて表示するな

ら意義があるかもしれない。集計表ごとに合計欄の意義を考えて、余計な情報は表

示しないよう注意する。・集計表ごとに、表脚注として、アルゴリズムのうちの主要な部分を示すことは重要

である。どんなロジックで集計されているのか、読み手が容易に把握できるからで

ある。・統合解析で用いる集計表を特定しておき、試験の相(study No)という情報が加わっ

た際の集計表イメージを検討しておくことも大事なことである。

2) 集計表の種類

安全性帳票の種類については、「治験総括報告書作成の手引き日本製薬工業協会」61

が参考になる。整理すると、表 3.2.4.1 の変数を用いて、表 3.2.4.2 の情報の組み合わせ

で安全性帳票が作成されることになる。

27

表 3.2.4.1 安全性の解析に用いられる変数

投与群、投与期間、投与方法、投与量(ex. mg/kg or mg/m2)、最終投与量、総投

与量、服薬率、人口統計学的特性、血中濃度、器官分類、有害事象症状名、重

症度、因果関係、有害事象有無、重篤度、主な有効性の結果、発現時期、持続

時間、治験薬の減量・休薬・中止

表 3.2.4.2 安全性の解析に用いられる情報・要素

集計表のタイプクロス集計表 or 要約表症状の種類有害事象 or 副作用

頻度件数 or 被験者数

解析に用いる事象の定義 TE (Treatment Emergent)

or all AE (Adverse Event)

用語のレベル SOC or PT

上記の組み合わせにより様々な集計表が考えられるが、標準化を念頭にデフォルト

(常に提示する集計表)とオプション(必要に応じて提示する集計表)を区別しておくと良

い。デフォルトとオプションが決まれば、デフォルトと共に、オプションの中から当該

医薬品の特性を考慮して必要と判断した集計表を作成すれば良いことになる。また、表の構成(並び順)についてであるが、情報を大まかにまとめた表から順に詳細

な検討結果へと配置すると、読み手に対して理解のしやすいものとなる。例えば、全体

の事象発現割合→器官分類(SOC)別発現割合→基本語(PT)別発現被験者数→PT 別発現

件数、などといった具合である。

3) 集計表を用いて提示したいこと

これから市場に出る新しい薬剤に安全性情報という側面から、有益な付帯情報を如何

に多くもたせられるかが企業に求められている課題であり、企業の実力(努力)が反映さ

れる事項でもある。そのためには、集計表を用いて何を提示したいのかを明確にし、各々

の集計表が互いに関与し合い補完し合ってまとまった安全性情報となるよう、デフォル

ト及びオプションの各集計表を構成する必要がある。以下に、安全性帳票作成の目的と

して重要と思われる視点を先述した ICH-E3 における三段階ごとに挙げた。

(1) 治験からどの程度まで安全性を評価し得るのかを確認するために、投与量・期間・

患者数を検討すること。・安全性を集計解析する集団がどういう背景、治療状況、治験スケジュールだったの

かを示すことで、どの程度まで安全性を評価し得るのかを確認することができる。

(2) 比較的よく見られる有害事象、臨床検査値の変化などを明確にし、妥当な方法で分類

28

し、治療群間で比較を行い、さらに時間依存性、人口統計学的特性との関係、用量又

は薬物濃度との関係など、副作用又は有害事象の頻度に影響する可能性のある因子に

ついて適切に分析すること。・有害事象としての集計結果から何が導かれるか、それは副作用というまとめ方をす

るとより顕著に現れるか。・事象の発現割合において、当該治験薬と対照薬の差はどの程度なのか。・治験薬投与により頻度高い頻度で発現する事象はどういった類のものか。その発現

割合はどれ位と推定できるのか。・投与群ごとにレポートすることが有益な情報(医療現場で参考として使える情報)

と、対照群との差に意義がある情報(市場に出るまでに主に使われ医療現場では再

現されない情報)を分けて考えると、作表の目的が明確になる。・リスクの高い被験者集団とはどういった背景の被験者か。・件数で表示するのか被験者数で表示するのか、薬剤の特徴を鑑みて計画する必要が

ある。注射ごとに事象が生じるような場合には、件数表示も大変意味のあることで

ある。

・ (3) 重篤な有害事象及び他の重要な有害事象を明確にすること。・事象発現のために治療の中止を余儀なくされた被験者はどの程度いたか。その被験

者はその後どういった経過を辿ったか。

4) 主な集計表のイメージ

上述の目的を踏まえた視点から想定して、以下に、デフォルトとなり得る主な集計表

についてイメージを作成した。あくまでもデフォルトとして提示したい内容に対する表

の例示である。各社において以下の表の必要性及びイメージを検討し、デフォルトとオ

プションを決定することが望ましい。ここでは、副作用という括りで解析する項目は、発現件数、発現被験者数、器官分類

別発現被験者数、重症度別発現被験者数のみとした。なお表中の数値はサンプル表示に

て意味を持たない。

29

表 3.2.4.3 安全性採否

A 群 P 群合計

被験者数％被験者数％被験者数％

採用 99 98.0 98 99.0 197 98.5

不採用 2 2.0 1 1.0 3 1.5

合計 101 100.0 99 100.0 200 100.0

不採用になった被験者についてはその理由と共にリストしておくと良い。表 3.2.4.4 治験薬投与期間(要約)

投与日数 a)

被験者数最小値Ｑ1 中央値Ｑ3 最大値

A 群 99 1 14.0 14.0 15.0 16

P 群 98 2 14.0 14.0 15.0 15

合計 197 1 14.0 14.0 15.0 16

a) 投与日数＝投与終了日－投与開始日＋１

表 3.2.4.5 治験薬投与期間(頻度集計)

A 群 P 群合計

被験者数％被験者数％被験者数％

投与日数 a)

1～2 日 1 1.0 2 2.0 3 1.5

3～6 日 2 2.0 1 1.0 3 1.5

7～10 日 . . 3 3.1 3 1.5

11～14 日 95 96.0 88 89.8 183 92.9

14 日～ 1 1.0 4 4.1 5 2.5

合計 99 100.0 98 100.0 197 100.0

a) 投与日数＝投与終了日－投与開始日＋１

％は、四捨五入により小数点第一位

で示せば十分である。むやみに桁数

が多いと、見づらくなるだけでメリ

ットはない

治験では多くの症例が計画された

通りの投与期間を全うするため、

一般に左裾広がりのデータとな

る。そのため、「要約表」よりは

「頻度集計表」の方が、投薬状況

の表示には適している場合が多い

治験では多くの症例が計画された

通りの投与期間を全うするため、一

般に左裾広がりのデータとなる。そ

のため、「平均」「標準偏差」とい

う情報はあまり意味がなく、むしろ

「頻度集計表」の方が投薬状況の把

握に適している場合が多い

カテゴリーの数が多い場合

には、縦に展開させる等工夫

する

30

表 3.2.4.7 有害事象 a)発現状況

A 群 P 群

n ％ n ％

安全性評価被験者数 99 100 98 100

有害事象の発現件数 52 - 50 -

有害事象の発現被験者数 11 11.1 10 10.2

重篤な有害事象発現被験者数 5 5.1 1 1.0

有害事象のための治験薬中止 6 6.1 2 2.0

副作用の発現件数 26 - 25 -

副作用の発現被験者数 5 5.1 5 5.1

a) Treatment Emergent と定義された事象を集計対象とした

主な安全性情報をまとめた上記のような表が最初にあると分かりやすい。

表 3.2.4.6 安全性解析対象集団における人口統計学的及び他の基準値の特性

A 群 P 群合計

被験

者数％被験

者数％被験

者数％

男 55 55.6 50 51.0 105 53.3性別

女 44 44.4 48 49.0 92 46.7

～29 20 20.2 16 16.3 36 18.3

30～39 39 39.4 45 45.9 84 42.6

40～49 19 19.1 18 18.4 37 18.8

50～59 14 14.1 16 16.3 30 15.2

年齢

60～ 7 7.1 3 3.1 10 5.1

外来 99 100.0 98 100.0 197 100.0入院・外来

入院 0 0.0 0 0.0 0 0.0

・

・

. 1 1.0 2 2.0 3 1.5

無 53 53.5 44 44.9 97 49.2

合併症有無

有 45 45.5 52 53.1 97 49.2

合計 . 99 100.0 98 100.0 197 100.0

｢．｣ではなく、｢0｣を表示する

n=0 であっても、カテゴリー

は表示する

欠測のデータがある場合、欠

測のカテゴリーも表示する

31

表 3.2.4.8 重症度別有害事象発現被験者数

A 群(N=79) P 群(N=78)

軽度 a) 中等度重度合計 c) 軽度中等度重度合計

被験

者数％

被験

者数％

被験

者数％

被験

者数％

被験

者数％被験

者数％被験

者数％

被験

者数％

湿疹 . . 1 1.0 . . 1 1.0 1 1.0 . . . . 1 1.0

蕁麻疹 . . 1 1.0 . . 1 1.0 . . . . . . . .

そう痒感 1 1.0 . . . . 1 1.0 . . . . . . . .

発赤 1 1.0 . . . . 1 1.0 . . . . . . . .

発疹 1 1.0 1 1.0 . . 2 2.0 . . 1 1.0 . . 1 1.0

褥瘡 . . . . . . . . 1 1.0 . . . . 1 1.0

皮膚・皮膚付属

器障害

小計 b) 2 2.0 3 3.0 . . 5 5.1 2 2.0 1 1.0 . . 3 3.1

嘔気 1 1.0 . . . . 1 1.0 1 1.0 . . . . 1 1.0

嘔吐 1 1.0 . . . . 1 1.0 . . . . . . . .

下痢 . . . . . . . . 3 3.1 . . . . 3 3.1

便秘 4 4.1 1 1.0 . . 5 5.1 6 6.1 1 1.0 . . 7 7.1

消化管障害

小計 5 5.1 1 1.0 . . 5 5.1 8 8.2 1 1.0 . . 9 9.2

・

・

合計 11 11.1 8 8.1 1 1.0 11 11.2 10 10.2 6 6.1 1 1.0 10 10.2

a) 同一被験者に、同一事象で同一重症度のものが複数回発生した場合には、1 件としてカウントした

b) 同一被験者に、同一器官分類の中で複数の異なる有害事象が発現した場合は、事象ごとに 1 例として、

及び器官分類としても 1 例として計算した。すなわち、同一被験者で「そう痒感」｢発赤｣がそれぞれ

1 回ずつ発現した場合、列小計の計算は 1 例のカウントとなる

c) 同一被験者に、重症度の異なる同一の有害事象が発現した場合は、最も重い重症度を用いて 1 例とし、

合計も 1 例として計算した。すなわち、同一被験者で｢軽症｣、｢中等症｣の症状がそれぞれ 1 つずつ発

現した場合、｢中等症｣に１例を記載し、行合計は 1 例として計算した

＊表中の 0 例及び 0％を「0」で埋めてしまうと見難いので、「.」と表記した

上記コメントのように詳細な被験者数のカウントができない場合は、小計、合計の欄

を表示しないようにした上で小計、合計に関する情報のみを別表で示すか、重複被験者

を含んだ％であることを注釈するなどの留意が必要である。本表については、副作用を対象とした集計表も作成する。

同じ器官分類の中で複数の異なる有害事象が同一

被験者で発現している場合は、１被験者として計

算する。従って、同一被験者で「そう痒感」｢発赤｣

がそれぞれ１回ずつ発現した場合、列小計の計算

は１被験者のカウントとなる

重症度の異なる同一の有害事象が同一被験者

で発現している場合は、最も重い重症度を用

いて１被験者として計算する。従って、同一

被験者で｢軽症｣、｢中等症｣の症状がそれぞれ

１つずつ発現した場合、｢中等症｣に１被験者

が記載され､行合計も１被験者となる

32

表 3.2.4.9 重症度別有害事象発現件数

A 群 P 群

軽度 a) 中等度重度合計軽度中等度重度合計

湿疹 . 1 . 1 1 . . 1

蕁麻疹 . 1 . 1 . . . .

そう痒感 1 . . 1 . . . .

発赤 1 . . 1 . . . .

発疹 1 1 . 2 . 1 . 1

褥瘡 . . . . 1 . . 1

皮膚・皮膚付属器

障害

小計 3 3 . 6 2 1 . 3

嘔気 1 . . 1 1 . . 1

嘔吐 1 . . 1 . . . .

下痢 . . . . 3 . . 3

便秘 4 1 . 5 6 1 . 7

消化管障害

小計 6 1 . 7 10 1 . 11

・

・小計

合計 37 14 1 52 8 40 2 50

a) 同一被験者に、同一事象で同一重症度のものが複数回発生した場合には、1 件としてカウントした

本表については、副作用を対象とした集計表も作成する。

SOC は辞書のコード順に表示

する

33

表 3.2.4.10 重篤な有害事象の発現被験者数･件数

A 群 P 群

発現被験者数 5 1

発現割合(%) 6.3 1.3

発現件数 6 1

評価被験者数 79 78

表 3.2.4.11 重篤な有害事象発現件数

A 群 P 群

抹消神経障害 1 .神経系・感覚器系障害

小計 1 .

心筋梗塞 1 .心・血管障害

小計 1 .

気管支炎 1 .

肺水腫 1 .

呼吸困難 1 1

呼吸器系障害

小計 3 1

・

・

合計 6 2

副作用を対象とした集計表はオプションと位置付ける。

34

表 3.2.4.12 治験薬投与中止に至った有害事象 a)発現被験者数/件数

A 群 P 群

中止に至った有害事象発現被験者数 6 2

中止に至った有害事象発現(%) 6.1 2.0

中止に至った有害事象発現件数 8 3

評価被験者数 99 98

a) 有害事象欄の投薬が「中止」の事象

表 3.2.4.13 治験中止に至った有害事象 a)発現件数

A 群 P 群

抹消神経障害 2 .神経系・感覚器系障害

小計 2 .

心筋梗塞 1 1心・血管障害

小計 1 1

気管支炎 1 .

肺水腫 1 .

呼吸困難 1 1

呼吸器系障害

小計 3 1

・

・

合計 8 3

b) 有害事象欄の投薬が「中止」の事象


35

表 3.2.4.14 比較的頻度の高い a)有害事象の発現被験者数

A 群(N=79) P 群(N=78)

被験者

数％被験者

数％

皮膚・皮膚付属器障害発疹 2 2.0 1 1.0

筋・骨格系障害腰痛 1 1.0 2 2.0

精神障害不眠(症) 3 3.0 1 1.0

消化管障害便秘 5 5.1 7 7.1

・・・

a) 抽出条件は、どちらかの群において 2 例以上の発現が認められた事象

副作用については頻度に関係なく全ての事象を出力すべきであり、本表は作成しない。

表 3.2.4.15 背景因子別有害事象発現被験者数･件数

A 群 P 群

被験

者数 (％) 件数

評価被験

者数被験

者数 (％) 件数評価被験

者数

男 7 12.7 32 55 6 12.0 31 50性別

女 4 9.1 20 44 4 8.3 19 48

49 歳以下 1 5.0 1 20 1 6.3 2 16

50～59 歳 2 5.1 9 39 3 6.7 13 45

60～69 歳 4 21.1 19 19 2 11.1 12 18

70～79 歳 2 12.5 16 14 3 18.8 17 16

年齢(歳)

80 歳以上 2 28.6 7 7 1 33.3 6 3

・

・

. 0 0.0 0 1 0 . 0 0

無 2 3.8 4 53 7 15.6 40 45

合併症有無

有 9 20.0 48 45 3 5.7 10 53

合計 11 11.1 52 99 10 10.2 50 98

副作用を対象とした集計表はオプションと位置付ける。統合解析時に作成する場合、各試験時にも作成しておくことが望ましい。

部分集団別解析に必要な背景因子のみで良い

上記の違いは下記の通り

(左)「0／1」：「0.0」←計算可

(右)「0／0」：「．」計算不可

抽出条件は、下記のパターンに対応する △群何れかの群＋ ○％以上全群 ○例以上

36

表 3.2.4.16 発現時期別有害事象発現件数

A 群 0～1 日後 2～5 日後 6～9 日後・・・合計

湿疹 . . . 1

蕁麻疹 . 1 . 1

そう痒感 . . . 1

発赤 1 . . 1

発疹 . . 1 2

皮膚・皮膚付属器障

害

小計 1 1 1 6

嘔気 . . . 1

嘔吐 . 1 . 1

便秘 2 2 . 5

消化管障害

小計 2 3 . 7

・

・

合計 8 8 8 52

P 群 0～1 日後 2～5 日後 6～9 日後・・・合計

・

・

合計 5 9 9 50


上記はあくまでもデフォルトの考え方の一例を示したに過ぎない。各社における方針

に基づき、薬剤、試験デザイン、治験の相のよらない普遍的なデフォルトを決定すれば

良い。なお、最後に若干の留意点を記載しておく。一般に、複数の要因を組み合わせたクロ

ス頻度集計表(ex.重症度別因果関係別有害事象発現件数)は複雑な表形式となり、表の枚

数も多く、解釈も困難となりやすい。同様に、件数の表と被験者数の表の共存は似たよ

うな情報の繰り返しとなり、有用な資料となるのかどうか疑問が生じる。したがって、

これらをデフォルトとして規定する場合には、充分な検討が必要である。また、因果関

係別の集計を良く見かけるが、「関連無し」というカテゴリーの集計にはおおよそ意味

がない。欲しい情報は、因果関係別ではなく、因果関係を問わない全ての事象すなわち

有害事象としての集計と、因果関係が否定できない事象すなわち副作用としての集計で

ある。ただでさえ情報が多くなりがちな安全性帳票なので、必要な情報のみを整理して

提供できるようにすると良い。

37

このように、各社ともこれまでは数多くの集計表を作成し、多くの時間やコストを費

やしてきている一方で、現実には必要性の低いものも数々あったという現状があるが、

初めに記載したような安全性の解析を行う視点から、目的に合致した帳票を作成する計

画を十分にする必要があろう。

3.2.5. 解析 1) デフォルトの解析(標準的な解析)

有害事象の解析では、重篤なあるいは重要な有害事象、発生し得る有害事象を捕らえ

ることと、発現割合など定量的な情報を得ることの双方が求められる。まず、有害事象

の発生については、3.2.4 に示したような頻度表や一覧表をもとに、それぞれの投与群

における有害事象の発現状況を検討すればよいであろう。一方、定量的な情報を得るた

めの方法としては、さらにいくつかの解析方法が考えられる。ここではこのような解析

について記載する。デフォルトの解析として考えられるのは、頻度集計表に提示した事象発現割合の信頼

区間を算出することである。信頼区間を用いた推定結果の提示は、発現割合の点推定値

のみを示す場合に比較して情報量が多く有用である。このとき、デフォルトの解析とし

てどの事象の発現割合に信頼区間を提示するかを定めておく必要がある。例えば、有害

事象に関する一般的な頻度集計表(表 3.2.5.1)の他、器官別大分類の有害事象(表 3.2.5.2)、一定以上の発現割合の有害事象(表 3.2.5.3)等が考えられる。ただし、極端に被験者数が

少ない場合など、算出する意味が無い場合の検討は必要であろう。稀な事象については発現割合そのものの推定に主な関心があるが、よく起こる事象に

ついては、発現割合の推定に加えて投与群間の違いについても関心がある62。そこで、

投与群間の発現割合の差及びその信頼区間を提示することが考えられる(表 3.2.5.4)。こ

れについても同様に、デフォルトの解析としてどの事象について発現割合の差とその信

頼区間を提示するかを定めておく必要がある。また、発現割合について群間比較検定や用量依存性の検定を実施することも考えられ

るが、有効性評価を目的として計画された治験は、安全性評価のための仮説設定やサン

プルサイズ設計、検出力評価が行われていない場合が殆どである。したがって、安全性

の評価・考察は、検定結果のみに基づいて行うのは問題があり、有害事象一覧や要約結

果(発現頻度、発現割合)を中心とし、必要に応じて統計的評価を補助的に用いながら行

うのが妥当であると考えられる。

38

表 3.2.5.1 有害事象に関する事象発現割合と 95%信頼区間

項目名 A 群 B 群被験者数有害事象

%( , )

% ( , ) 重篤な有害事象

% ( , )

% ( , ) 因果関係が否定できない

有害事象

% ( , )

% ( , ) 投与中止に至った有害事象

% ( , )

% ( , ) 上段：発現被験者数、下段：発現割合（95%信頼区間）

表 3.2.5.2 器官別大分類の有害事象発現割合と 95%信頼区間

器官別大分類 A 群 B 群被験者数

皮膚・皮膚附属器官障害

%( , )

% ( , )

中枢・末梢神経系障害

% ( , )

% ( , )

消化管障害 % ( , )

% ( , )

… … % ( , )

% ( , )

一般的全身障害 % ( , )

% ( , )

上段：発現被験者数、下段：発現割合（95%信頼区間）

表 3.2.5.3 有害事象発現割合と 95%信頼区間

(A 群又は B 群の発現割合Δ%以上の有害事象)

事象名 A 群 B 群被験者数白血球増加

%( , )

% ( , ) めまい

% ( , )

% ( , ) … …

% ( , )

% ( , ) 発疹

% ( , )

% ( , ) 上段：発現被験者数、下段：発現割合（95%信頼区間）

39

表 3.2.5.4 事象発現割合と差の 95%信頼区間

投与群発現被験者数被験者数発現割合 (95%信頼区間)

発現割合の差 (95%信頼区間)

A 群 % ( , )

B 群 % ( , )

% ( , )

合計 - -

2) オプションの解析(選択可能な解析)

デフォルトの解析に加えて、状況に応じた適切な解析をオプションとして準備し、規

定しておく必要がある。オプションの解析は常に実施する解析ではなく、薬剤ごと或い

は治験実施計画書ごとに必要に応じて選択し実施する解析である。オプションの解析として考えられるのは人年法による解析である。人年法については、

ICH-E9 にも以下の記載があり、必要に応じて実施するオプションの解析として位置付

けられる。

ICH E9(VI.6.3 評価される被験者集団とデータの提示)

ある有害事象の発現は、通常有害事象を経験した被験者数とその有害事象を発

現する可能性のある被験者数との関係を示す割合の形で表現される。しかし、

発現の評価の仕方はいつも自明というわけではない。例えば状況に応じて、試

験治療が使用された被験者数、又は使用の程度(人年)を分母とすることが考え

られる。

人年法による評価が必要な状況としては、長期試験や高い死亡率の試験のように観察

打ち切りが多く発生する場合が考えられる。このような試験では、観察期間(有害事象

の収集期間)が充分でないために、事象発現頻度が見かけ上少なくなり、リスクの過小

評価を引き起こす可能性がある(絶対評価の問題)。さらに、観察打ち切りが多く発生し

た結果として、観察期間が比較群間で著しく異なった場合、公平な比較が行えない問題

も生じる(相対評価の問題)。このような状況では、観察期間を考慮した単位時間当たり

の発生率であるハザードやその群間比は有用な情報となり得る(表 3.2.5.5)63。

40

表 3.2.5.5 人年法による有害事象の解析

投与群発現被験者数総観察期間 (人年)

ハザード (95%信頼区間)

ハザード比 (95%信頼区間)

A 群 ( , )

B 群 ( , )

( , )

合計 - -

またオプションの解析として、観察の打ち切りを考慮した Kaplan-Meier 法を用いて、

生存曲線(生存関数)を提示することが有用である場合がある。例えば、初発の有害事象

をイベント、それ以外の観察中止を打ち切りとして扱うことが考えられる(図 3.2.5.1)。また、薬剤特異的に起こる特定の有害事象を選択しこれをイベントして扱うことも考え

られる。開発の初期の相では、特定の事象を選択するのは困難かもしれないが、開発ス

テージが進めば情報が蓄積され、このような事象も明確になってくる場合があるので、

オプションの解析として準備しておくことは有用であると考えられる。 Kaplan-Meier 法は基本的な生存時間解析手法の一つであり、イベントと時間の関係に

ついて有用な情報を与える。ただし、このような生存時間解析手法は、イベントと打ち

切りの厳密な定義、被験者のフォローアップ方法、多重イベントの取り扱いの定義、統

計モデルを用いる場合にはその妥当性等々、解析・結果解釈を適切に行うための前提条

件がある。したがって、生存時間解析を実施することを目的として治験を計画していな

い場合や、先に述べた様々な定義や解析方法について治験実施計画書や解析計画書に事

前かつ明確に記載されていない場合、誤った結論やバイアスのある結論を導く可能性が

あるため、解析の実施及び実施した場合の結果解釈には注意する必要がある。

図 3.2.5.1 有害事象をイベントとした Kaplan-Meier 曲線

41

4. 臨床検査値等の検査データに関する問題 4.1. 臨床検査値等の検査データによる安全性評価

4.1.1. 評価の現状と問題点臨床試験において治験薬の安全性は主に、有害事象、及び臨床検査値やバイタルサイ

ン(血圧、心拍数、呼吸数、体温)等の検査データに基づいて評価されている。これは実

際の医療現場で医師が薬剤の安全性を考慮しながら治療を行う時と同様の指標といえ

る。さらに臨床試験では、評価者内及び評価者間での評価の一貫性や統一性が常に求め

られているため、判定基準に従って評価することが望ましい。その点で個々の医師が各

症例の特性や医師自身の経験等を踏まえて臨床的総合的に評価していく医療現場とは

異なっている。

現在の臨床試験における有害事象の評価については 3 章に述べたとおりであるが、重

症度や治験薬との因果関係などは 3.1.5及び 3.1.6に示したような判定基準が設けられて

いる。これらの項目の性質上、数値等による完全に客観的な判定基準の設定は難しく、

医師の臨床的判断による重症度や治験薬との因果関係の程度に対して何段階かの区分

を設定したような判定基準となっている。評価は医師の臨床的判断が主体であり、医師

は判定基準で定義された各レベルに照らして評価する。

臨床検査値やバイタルサイン等の検査データについては、その性質上当然のことでは

あるが、データの収集から評価までの方法は有害事象とは異なっている。検査値による

安全性評価の現状と問題点について以下に述べる。

1) 収集するデータとその意味検査値に関連して収集しているデータには、以下のようなものがある。

・検査値・施設基準値に基づく ”High” or “Low” ・医師による異常変動有無判定・検査値から拾い上げた有害事象

この中で、「検査値」と「施設基準値に基づく”High” or “Low”」は客観的情報で

あるが、「医師による異常変動有無判定」は医師が検査値により臨床的に好ましくない

状況が発現したかどうかを判断したものであり、主体は医師の臨床的判断となっている。

医師が異常変動有無を臨床的に判断する際には、当該項目の検査データのみならず、関

連する検査項目や被験者の背景因子等を加味して評価する。しかし検査値そのものが数値で構成される客観的データであることを活かして「臨床

的に好ましくない状況」を判断する何らかの客観的な判定基準を設定できれば、評価者

内及び評価者間のみならず、試験間での評価の一貫性や統一性を保つことが可能となり、

42

複数の試験結果から治験薬の安全性を評価する場合にも優れた点となる。既に海外では

検査値の数値による客観的な判定基準を設定した臨床試験が主流となっており、一部の

国内臨床試験でも同様の判定基準が用いられてきている。

また、「医師による異常変動有無判定」と「検査値から拾い上げた有害事象」の違い

には曖昧な部分が多く、試験によっては、「医師による異常変動有無判定」が有の場合

にはその検査値の変動を「検査値から拾い上げた有害事象」として記載するよう治験実

施計画書中で規定しているものもある。その場合には症例報告書にある「医師による異

常変動有無判定」の記載欄は、「検査値から拾い上げた有害事象」を評価するために検

査値を眺めながらチェックするワークシート的な役割を果たしている64。

つまり、データ収集の過程から考えても、両項目は類似、あるいは場合によって全く

同一のものと言える。それにも関わらず、それぞれ異なる評価観察項目として取り扱わ

れ、別々に発現頻度が集計されることがある。またその際に、「医師による異常変動有

無判定」は臨床検査値やバイタルサインの評価ということで、各項目の検査が実施され

た症例を対象として集計されるが、「検査値から拾い上げた有害事象」は有害事象の評

価ということで、検査実施の有無に関わらず安全性解析対象となった症例を対象として

集計されるようなことが起こる。そのため、同一の結果を別項目の集計として示す無駄

や、集計のアルゴリズムや集計対象(分母)の設定の違いにより両項目の集計結果にわず

かな違いが生じ、結果の解釈が困難になるなどの不都合が生じている。

以上のように、現在の臨床試験で収集されている臨床検査値及びバイタルサインの関

連項目のうち「医師による異常変動有無判定」については、 ①「検査値から拾い上げた有害事象」との区別化 ② 数値を用いた客観的な判定基準の設定

の 2 点について見直す価値があるといえる。これについては、「4.1.2. 臨床検査値等の検査データによる安全性評価の構造」にお

いて詳細を示す。

検査項目

赤血球数

白血球数

ヘモグロビン

投与前２週後４週後

正異

正異

正異

正異

正異

正異

正異

正異

正異

異常変動無有(⇒有害事象に記載)

無有(⇒有害事象に記載)

無有(⇒有害事象に記載)

CRF上の臨床検査値記載欄の例

43

2) 多数の有意差検定

検査値の推移を評価するために、検査値の要約統計量に付随して有意差検定の結果が

提示されることがある。有意差検定には、症例内でベースラインからの変化をみるため

の 1 標本検定、薬剤群間でベースラインからの変化を比較するための 2 標本(あるいは

それ以上)検定などが用いられ、手法的にもパラメトリック、ノンパラメトリックと種

類も様々である。いずれにしても項目ごとに各検査時点で検定を実施すればその数は「項目数×検査時

点数」となり、膨大な数になることは明らかである。しかし一般には検査値に対する有

意差検定で検定の多重性や検出力は考慮されておらず、100 もの検定を実施すればその

うちのいくつかで意味なく有意な結果が出ても不思議ではない。また、検定により検査値の前後差が 0、あるいは治療群間差が 0 であることを帰無仮

説として棄却した場合、それが臨床的に何を意味するのか明確にせず慣習的に検定して

いる場合もある。さらに検査値には項目間で関連性のあるものが存在するが(AST と

ALT、BUN とクレアチニン等)、項目ごとの検定ではこの関連性についてなんら考慮さ

れていない。また時点間の相関も同様である。そのため、関連のある項目の一方のみで

有意差が認められることや、経時的な傾向なく有意差が認められることも起こり、この

ような場合には、臨床的な解釈が難しくなる65。統計担当者はもちろんのこと、臨床試験に関わる多くの人がこのような事情は理解し

ていながらも大量の検査データに対する見落としを防ぐためというような理由で、

Flagging Device として、あるいは有意差検定という位置付けではなく単に Informativeな統計量として多数の有意差検定が実施されている。安全性評価における統計的アプロ

ーチには限界があることも認識した上で利用する必要があるといえる66。この問題については、「4.2.1. 臨床検査値等の検査データの要約」でも取り上げる。

3) グラフの利用

検査値の推移を示すためにグラフも多く利用されている。グラフを用いることで検査

値の推移を視覚的に捉えることができるため、多数の項目の要約統計量を１つ１つ見て

いくより効率がよい印象もある。しかし、グラフもその目的や試験デザインを十分に考慮せずに作成すると利用価値の

低いものになりかねない。例えば以下のようなものである。・外れ値の多いデータでの平均値±標準偏差の推移グラフ・長期試験のように検査時点が多数ある試験で時点ごとに作成したベースラインと

の前後プロット・ 1 群 100 例の個別推移を同一グラフ上に示した個別プロット

多くの試験で慣習的に行われているグラフ作成ではあるが、その作成や確認に費やさ

44

れるリソースはかなり大きい。このリソースを十分に意味のあるものとするために、グ

ラフ作成の目的や意義をもう一度確認することは重要と思われる。この問題ついては、「4.2.1. 臨床検査値等の検査データの要約」でも取り上げる。

4.1.2. 臨床検査値等の検査データによる安全性評価の構造 4.1.1.で臨床検査値等の検査データによる評価の現状と問題点の１つとして「医師に

よる異常変動有無」の位置付けの曖昧さ(有害事象との区別)や判定方法の見直し(客観的

指標の設定)について挙げた。もちろん、医師による異常変動有無の判定を現状の方法

で行っても検査データによる安全性評価は可能である。しかしながら、各国共通で一貫

した評価を行うことが困難であり、現在のように世界同時開発の潮流が起っているよう

な状況の中で複数の地域で実施されたデータを統合して安全性の評価を行おうとした

場合に、治験薬の安全性プロファイルが十分に検討できなくなる恐れがある。また、国

内の試験に限っても、領域や評価する医師が異なることによって、試験間や評価者間で

評価のばらつきが大きくなり、結果的に解釈を難しくさせてしまうようなケースも想定

される。

ここでは一つの解決方法として、図 4.1.2 に示すような、客観的判定基準による検査

値異常判定を１つの評価の柱とした検査データによる安全性評価の構造を提案する。

図 4.1.2 で示した検査データによる安全性評価の構造の前提として、安全性評価とし

ての検査データの位置付けを確認しておく。検査データによる安全性の評価をする際に

は、「評価が可能なデータを用いて検査値の推移傾向をとらえること」、「異常値・異常

変動・有害事象の発現状況、すなわち“極端な異常値”を適切に評価すること」の 2 つ

が重要であるといえよう。ここでいう“極端な異常値”とは、ある検査値において、人

体にとって好ましくない変化を示す値、あるいは人体にとって好ましくない変化を引き

起こす可能性のある値の集合である。両者は互いに別方向から検査データを捉えて安全性を評価するものである。つまり、

判定(結果)：

行動：

検査データ

有害事象検査値異常分布の変化

検査データの推移傾向他の情報を加味した医師の臨床的な判断

検査データのみによる基準に基づいた判断

極端な異常値（異常値・異常変動・有害事象の発現状況）

図 4.1.2 検査データによる安全性評価の構造

45

検査データの推移傾向の評価により、個々の症例レベルでは問題視しないような基準範

囲内での変動であっても、集団としてある一定の方向へ推移していれば、それは重要な

安全性情報となる。また“極端な異常値”の評価により、集団の推移としては明確に検

出できない変動であっても、複数の症例で類似の“極端な異常値”が見つかれば、これ

も試験治療の安全性を評価する情報となる。どのような評価構造であってもこの 2つの観点は見逃してはならない。ICH-E9では、

表現は異なるものの、次のように同様な主旨の記載が含まれている。

検査データには、例えば試験治療ごとの平均の評価のような定量的な解析と、ある閾

値を超える又は下回る数を数える定性的な解析の両方を行うことが薦められる。

この 2 つの観点を踏まえた上で検査データによる安全性評価の構造について考えて

みる。図 4.1.2 で提案した構造は、上記 2 つの観点のうちの“極端な異常値”の評価を「検

査値のみによる基準に基づいた判断」と「他の情報を加味した医師の臨床的な判断」と

いった 2 つの異なるアプローチで評価するという構造になっている。つまり、検査デー

タから拾い上げた「有害事象」との区別が曖昧であった現状の「医師による異常変動有

無判定」を取りやめ、その代わりに「検査データのみによる基準に基づいた判断」によ

る「検査値異常」を設定した。これにより、医師の臨床的判断と、検査データに対する

客観的判断という双方からの評価が実施可能となるため、現状の「医師による異常変動

有無判定」を用いたときよりも統一的かつ多面的な安全性評価ができると考えられる。

以下に、図 4.1.2 で提案した安全性評価の構造について、その意味を詳細に示す。

4.1.2.1. 検査データの推移傾向

これは、検査データそのものの変化の傾向をみる定量的な評価である。集団としての分布のシフト、あるいは中心の値の動きを捉えることで、試験治療によ

る検査データの変化の傾向をつかむことが可能であり、それが安全性の評価をする上で

重要である。

4.1.2.2. “極端な異常値”の評価

これは、臨床的に問題となるような大きな(小さな)値の発現をみる定性的な評価であ

る。 “極端な異常値”、つまり異常値や異常変動の発現状況の評価は、国内臨床試験の大

部分ではこれまで医師の臨床的判断のみに委ねられていたといっても過言ではない。一

46

方、海外の多くの臨床試験もしくは日本の一部の臨床試験では、医師の評価に加え、検

査データの性質を活かし客観的判定基準を用いて“極端な異常値”を評価している。こ

こで前者は検査データから拾い上げた有害事象であり、後者は検査値異常である。

1) 検査データから拾い上げた有害事象

医師が検査データから有害事象の判定を行う際には、検査データ以外の情報や臨床的

判断が加味されている67。例えば、中性脂肪や血糖が基準値を超えていたとしても、食

事の摂取状況によっては有害事象と判定されないこともあり得るというのはその一例

である。また、診断という側面から考えてみると、医師は検査データを被験者の診断評

価の一部に使うというのが一般的である。さらにいえば、診断に至るまでには、様々な

背景(合併症や併用薬、性別、体重、患者の生活習慣など)も考慮されているはずである。

したがって、検査データからの有害事象は、検査データ以外の情報も加味した医師の臨

床的な判断の結果であるということがいえる。また、この点から考えれば、時間経過に

伴い医師の判断に変化とばらつきが生じる可能性がある。検査データからの有害事象のみならず有害事象全般に言えることであるが、相が進む

と試験治療に関する情報量が増える、あるいは、同一試験でも初めの被験者と最後の被

験者の時点では情報量は異なるため、有害事象の性質上、医師の判断が変化していく可

能性が考えられ、相や時期によって特定の有害事象の発現率が異なるかもしれない。し

かし、有害事象の判定が評価者によってできるだけばらつかないように基準を工夫する

ことも可能である。以下、いくつかの例を記載した。

①検査結果を見て、医学的な対応をした事象を有害事象とする方法ここでの「医学的な対応」は更なる検査、処置、治験薬の減量、休薬、中止などが該

当し、この方法であれば臨床的判断の根拠を得ることができる。また、「医学的な対

応」の有無を判断基準としているため、単に医師の臨床的判断に基づく場合と比べる

とばらつきがある程度抑えられる。

②医学的な対応の有無によらず、医師が有害事象と判断した事象を有害事象とする方法

③前の２つの中間的な位置付けであり、医学的な対応をした場合には必ず有害事象とす

るが、医学的対応がなくても医師が有害事象と判断した事象は有害事象とする方法

なお、これらの判定基準は「検査データから拾い上げた有害事象」のみではなく、全

ての有害事象に統一して用いられるべきである。

2) 検査値異常

検査値異常とは、検査データのみから判断する「極端に高い、あるいは低い値、及び

極端に大きな変化」であり、客観的判定基準による評価が可能であることを上で述べた。

47

ICH-E3 の「12.4.2.3 個々の臨床的に重要な異常」に「臨床的に重要な変化(申請者によ

り定義された)について考察すること」という一文があることも考慮すると、この判定

基準は申請者の責任において定めるべきものであり、このような客観的評価は治験薬の

安全性評価において必要なことであるといえる。また、一貫した基準を用いて検査値異常をピックアップすることにより、「評価者間

の差を無くすことができる」、「同一の基準を用いれば試験間での差を無くすことができ

る」、「多数の測定項目からの見落としを防げる」というようなメリットを得ることがで

きる。さらに、検査データに起因する治験の中止判断やモニタリングの際に利用できる

安全性マーカーの発見をより的確にできると考える。

4.1.3. 臨床検査値異常等、検査値異常の判定基準 1) 公表されている判定基準

前章で述べたとおり、検査値異常とは、検査値のみから判断する「極端に高い、ある

いは低い値、及び極端に大きな変化」である。したがって、全体の推移ではなく、一時

点の値あるいは前後差(すなわちベースラインと投与後の 1 時点の変化)を各検査項目で

評価する。判定基準として適用可能と思われる公表基準を以下に挙げた。

・医薬品等の副作用の重篤度分類基準68

・ Common Terminology Criteria for Adverse Events v3.0 (CTCAE)69

・ Lilly Reference Ranges70

・ Lilly Delta limits70

・抗菌薬による治験症例における副作用、臨床検査値異常の判定基準71

・ Definition of Abnormal Test Values72

上記の公表基準のうち、バイタルサインの基準が載っているのは副作用の重篤度分類

基準と CTCAE だけである。

このような基準の作成方法であるが、例えば Lilly Reference Ranges 及び Delta Limits

では、20,000 例を超える成人症例(18 歳以上)から採取された検査データを元に作成され

ている。検査データの分布の上下 1%を除外した 98%範囲が Reference Ranges であり、

性別、人種(白人とそれ以外)、年齢(50 歳未満と以上)別になっているほか、生活習慣と

して喫煙の有無と飲酒の有無別の計 4 種類に分けられた表もある。Reference Ranges で用いられたデータから、各症例・項目別に取り出された、1～4 週間隔の 2 ポイントの

データにおける変動(前後差)の分布の 98%範囲が Delta Limits であり、性別、人種、年

齢、喫煙、飲酒といった被験者背景因子による影響がないことが確認されている 70。

48

実際の適用にあたっては、こういった公表されている基準をそのまま用いるだけでな

く、年齢等の被験者背景因子や領域に応じて適した形に加工することが必要な場合もあ

るだろう73。そのまま用いる場合でも、判定基準の元になった検査データと検査方法や

施設基準値が異なる検査項目については、補正が必要となることもあるだろう。もちろ

ん、ICH-E3 に則り、申請者自身の手で判定基準を作成することも可能である。

検査値異常の判定基準として測定施設の基準範囲をそのまま用いることについては、

基準範囲から逸脱した値が必ずしも異常であるとはいえないため、安全性評価として適

切な指標となり得るかどうか疑問がある74,75。基準値や基準範囲はかつて「正常値」または「正常範囲」と呼ばれていたことから解

釈と使い方が誤解されがちであったが、近年ではその本来の意味をできるだけ正確に表

現できるように、「正常値」「正常範囲」とは呼ばず「基準値」「基準範囲」という用語

が浸透しつつある。これらはいずれも、得られた検査データを判断するための“物差し”

である。 “物差し”には２つの種類があり、１つは健康人集団から得られる集団基準値(基準

範囲)であり、もう１つはそれぞれの個人に特有な個人基準値(個人健常値)である。医療

現場において、ある患者から得られた検査データについて判断するためには、健常時の

パターンを念頭においてそれと比較するわけだが、その際に利用するのが個人基準値や

集団基準値(基準範囲)である。個々人が全ての検査項目について健常時の個人基準値を

持つことは不可能であるので、その代替として特に初回の検査では集団基準値(基準範

囲)が利用される 73。基準範囲にはある幅が設定されているが、これは基準範囲が変動の要因として、①測

定の技術的変動、②個人間変動、③個人内変動を含んでいるためである。個人基準値で

は、基準範囲がもつ変動の要因の 1 つである「②個人間変動」が無くなるため、基準範

囲よりは狭い幅となる 73。基準範囲は一般に、各施設での健常者群、あるいは病院外来患者を対象として検査値

を集め、その平均値±2SD 範囲が用いられている76。また正規性が得られない項目では

ノンパラメトリックな手法で 95%範囲を規定する場合もある。基準範囲の設定方法や変動の要因から考えれば正常な人であってもこの範囲から外

れる可能性があり、疾病患者であってもこの範囲内に含まれる可能性があると理解でき

る。また、例えば重疾患症例を対象とした治験で検査値異常判定基準に施設基準値を設

定してしまうと、試験治療の影響とは関係なく検査値異常が大部分の症例で発現してし

まい、結果的に無意味な集計となることも考えられる。基準範囲の性質や、試験治療の安全性評価とは「特定の対象疾病患者に薬剤を投与す

る下での安全性である」ということを考えると、基準範囲を検査値異常の判定に適用す

る際には注意が必要である。

49

2) 判定基準の種類 1)で示したような検査値異常の判定基準には、以下のように様々な種類があり、それ

ぞれ検査項目の特徴に合わせて設定されている。

・数値(絶対値)による判定赤血球などの血算やカリウムなどの電解質は、変動や施設間差が小さく、数値(絶

対値)による判定が可能である。

例：「副作用の重篤度分類基準」の赤血球数 (グレード１：350 万未満～300 万以上、G2：300 万未満～250 万以上、G3：250 万未満)

例：「CTCAE」のヘモグロビン (グレード１：＜LLN－10.0 g/dL、G2：＜10.0－8.0 g/dL、･･･)

・施設基準値の何倍という判定 GOT などの酵素や総ビリルビン、BUN などは、変動や施設間差が大きいので、

施設基準値を考慮の上、その何倍という判定が使われている。

例：「副作用の重篤度分類基準」の肝臓の LDH

(グレード１：1.5×ULN 以上)

・ベースラインとの比較(変化量もしくは相対値(%))による判定値の比較だけでなく、抗菌薬の基準のようにベースラインの正/異を考慮する方法

もある。ベースラインとの相対比較をすることで、その期間の治療の影響を考察す

ることができると共に、各被験者の背景因子による影響を排除できる。

例：「Lilly Delta limits」 (例えば Na の場合ベースラインから 8mmol/L の減少 or 8mmol/L の増加)

例：「Definition of Abnormal Test Values」

(例えばヘモグロビンでベースラインが Normal または欠測の場合、 Abnormality: 10%の減少、 Marked abnormality: 25%の減少)

・複数の判定方法の組み合わせによる判定複数の判定方法を組み合わせることで、より適切な判定を図っている。

例：「CTCAE」のフィブリノーゲン (グレード１：＜1.0－0.75×LLN または治療前値から＜25％の減少、 G2：0.75‐0.5×LLN または治療前値から 25～＜50％の減少、･･･)

・複数のランク(グレード)の有無副作用の重篤度分類基準や CTCAE にはグレードがあるが、Lilly Reference Ranges

や Delta limits などにはない。

50

また、検査値異常判定基準はその種類ごとにそれぞれ特徴があることも忘れてはなら

ない。例として、ここでは「ベースラインとの比較(絶対値)による判定」と「基準値か

らの一定の幅(e.g. 上限×1.5)による判定」の２つの特徴を考えてみる。

「ベースラインとの比較(変化量)による判定」では試験中の値とベースライン値の差

を基準に照らして判定するため、ベースライン値が施設基準値を超えていて試験中さら

に異常の方向へ変化した場合でも(図 4.1.3 (a))、ベースライン値は施設基準値内であっ

て試験中に施設基準値を超えた場合であっても(図 4.1.3 (b))、その変化量が同じであれ

ば同じ判定となる。しかし安全性評価の観点からみると、ベースライン値を考慮する必

要がある場合も考えられ、ベースライン値が施設基準値内の場合と施設基準値を超えて

いる場合では異なる基準を設定する必要があるかもしれない。

(a) (b)

図 4.1.3 検査値の変化

また、「基準値からの一定の幅による判定」では、検査値異常判定基準内の変動であ

れば、下限付近から上限付近まで値が上昇したとしても検査値異常としてピックアップ

されない。しかし、この変化は臨床的判断を加味すると問題となる動きかもしれない。

以上のように、検査値異常判定基準の種類によって捉えきれないものもある。したが

って、用いる検査値異常判定基準の特徴を理解するとともに各検査項目に対して適切な

判定基準を設定することが望ましい。いずれにしても、適用した判定基準に基づく判定結果が、医師の評価と大きく乖離し

ないよう注意することが必要である。

上限

下限

●

●

上限

下限 ●

●

上限

下限 ●

●

51

4.2. 集計解析における留意点

4.2.1. 臨床検査値等の検査データの要約 1) 目的

臨床検査値等の検査データを要約して提示する目的は、集団としての推移や中心傾向

を捉えることである。集団として検査値の推移や中心傾向を捉えていくことで、個々の症例では見逃してし

まうような基準範囲内の動きであっても集団としてみれば一定の傾向が捉えられるな

ど、試験治療が検査データに与える影響の評価が可能となる。

2) 要約方法 (1) 定量データの要約定量データとして得られた検査値に対してデフォルトの要約方法と位置付けられる

のは、安全性の解析対象集団(｢3.2.3 解析対象集団｣)を対象とした検査データの要約統計

量の算出である。ICH-E3 でも「群の平均値又は中央値、値の範囲」を示すよう要求さ

れている。投与群別に検査項目毎、時期毎の検査値、あるいはベースラインからの変化量を集団

の代表値である平均値、標準偏差、中央値、最小値、最大値等の要約統計量で示す。症

例数が十分にある場合には、25%点や 75%点も合わせて示すことも意味がある77。欠測、検体異常による測定不能、検出限界以下等の解析上の取り扱いは事前に定めて

おく必要がある。また、抗体価やホルモン関係等の一部の検査データには、その分布か

ら対数変換やノンパラメトリックな取り扱いが適切な項目もあるので注意する。

表 4.2.1.1【臨床検査値の推移の要約統計量(A 群)】

検査項目時期例数平均標準

偏差

最小値 25%点中央値 75%点最大値

BL

4W

8W

WBC(単位)

12W

表 4.2.1.2【臨床検査値のベーラインからの変化量の要約統計量(A 群)】

検査項目時期例数平均標準

偏差

最小値 25%点中央値 75%点最大値

4W

8W

WBC(単位)

12W

52

(2) 定性データの要約尿検査等の定性データに対するデフォルトの要約方法は、定性値の各カテゴリーの頻

度及び％の算出である。定量データの場合と同様、投与群別に検査項目毎、時期毎の頻度及び％の算出、ある

いはベースラインと試験治療開始後の各時点のシフトテーブル等を示す。定性データとして収集予定の検査項目であっても一部が定量データの形で収集され

るような場合には、測定施設に確認のうえ定性データに変換するなどの処理が解析上必

要となる。しかし試験計画段階から検査結果を定性値とするか定量値とするかを明確に

定め、計画に従ったデータ収集を行うことが重要である。

(3) グラフの利用検査データが定量値の場合には、その推移を視覚的に捉えるために各種のグラフが利

用されているが、グラフの表示に関してはあくまでもデフォルトで算出される要約統計

量から安全性を検討するための補助的な位置付けである。つまりグラフの作成は必須で

はなくオプションと考えてよい。グラフの種類には様々なものがあるが、検査データを要約する目的から考えれば、集

団としての推移や中心傾向が捉え易いものが適切と言える。試験デザイン、測定ポイン

トの数、症例数などを考慮して、Box-Whisker プロットや Scatter プロット(測定ポイン

トが少ない場合)等で適切なものを選択し、測定値の推移やベースラインからの変化量

を示すことが有用である。また、グラフの軸の設定も重要である。全データを同一グラフ上に表示する場合、大

きな外れ値が存在すると軸スケールもそれに合わせることとなり、集団としての推移が

分かりにくくなる場合がある。軸スケールによっては臨床的に意味のない大きさの変動

が必要以上に強調されてしまう可能性もある。また同一の検査項目で複数のグラフを作

成する場合にそれぞれが異なる軸スケールで作成されると結果の解釈を難しくするこ

ともある。以上のようなことを考慮し、試験治療の安全性を検討する際に有用なグラフを作成す

ることが望ましい。

(4) 有意差検定

検査データの解析では有意差検定が用いられることも多い。一般に検査値の前後差の

1 標本有意差検定や治療群間の有意差検定であるが、検査値の前後差が 0、あるいは治

療群間差が 0 であることを帰無仮説として棄却したとしても、その臨床的解釈は難しく、

あまり意味を持たない場合も多い。また、これらの検定は多項目検定になることから第

１種の過誤が増大し、さらに、症例数が大きな試験では検出力が大きくなりすぎ、臨床

的に意味のない差を検出してしまう場合がある。また、検査項目間の関連性、時点間の

相関などは考慮せずに検定を実施することにより、臨床的解釈が困難な結果が得られる

53

場合もある。このような統計的問題の存在や検査データを要約する目的から考えると、特定の検査

項目が特に重要な安全性評価項目であるような場合を除き、一般には臨床検査値の要約

において有意差検定は必須ではない。しかし現実には、多数の検査項目の要約統計量から１つ１つ安全性を評価するときの

見落としを防ぐ意味のフラッギングとして有意差検定を実施する場合もある。その場合

には上記の臨床的意味や統計的問題を考慮し、その結果の解釈には十分注意する必要が

ある。また、AST や ALT 等の正規性を仮定出来ない項目に関しては対数変換、又はノ

ンパラメトリックな手法を使用した方が良い場合があることも念頭におき、適切な手法

を選択する。

3) 測定施設や測定方法の違いへの対応 (1) 測定施設が異なる検査データの取り扱い検査データの施設間での互換性は乏しいため、多施設臨床試験では中央測定施設を設

置し 1 箇所の測定施設ですべての測定を実施するのがもっとも望ましい方法であるこ

とは明らかである。中央測定施設を設置したにも関わらずそれ以外の施設の検査値が混在する場合には、

中央測定による検査値を優先して集計解析に用いる。複数測定施設からの検査データを合わせて集計解析に用いなければならない場合に

は、各測定施設での測定方法や単位、施設基準値等を検査項目ごとに確認し、データの

併合が可能かどうかを判断する。測定方法や単位が同じで施設基準値が同様と判断でき

る場合には単純に併合可能と判断できるかもしれない。しかし、測定方法が異なる場合

や測定方法が同じであっても測定機器や検査キットが異なる場合などではそのまま併

合できない。そのような状況では、異なる測定施設の検査結果の併合を避けて別々に集

計解析するか、(2)に示したような単位変換や検査データの正規化等の調整方法を用い

て併合して解析する。併合した場合には、併合により集計解析結果に与える影響を考慮

した上で、その結果の解釈を行う。

(2) 測定方法の異なる検査データの調整検査データの調整方法としては、以下のような方法が提案されている 73。

① SI 単位(Systeme Internationale)への変換 SI 単位とは国際標準の単位であり、この単位へ変換することで同一単位上でのデー

タの併合が可能となる。しかし、検査項目によっては温度等の測定条件などに結果が依

存するため、単に共通単位を用いるだけでは併合に適さないものもある。

② 標準偏差指数(SDI；Standard Deviation Index)への変換標準偏差指数(SDI)は、

54

SDI＝（測定値－施設平均値）／施設標準偏差として算出される。正規分布を示さない項目では正規化したときの平均値と標準偏差を

用いる必要がある。

③ 臨床単位(CU;Clinical Unit)への変換臨床単位(CU)は、

CU＝100＋（測定値－施設中央値）×（120－80）／（基準値上限－基準値下限）として算出される。つまりこの単位では、基準値上限が 120CU、基準値下限が 80CU と

なり、検査データの分布型に依存せずに用いることができる。実際の測定値と併記して

用いるよう提案された。

その他には、事前に各施設での測定精度を確認する Proficiency Test の結果を用いた

Two-Stage Adjustment Procedure も提案されている 75。

(3) 同一施設内で測定方法が異なる検査データの取り扱い同一の測定施設であったとしても測定した時期が異なると測定方法、検査キットの変

更等により検査データをそのまた集計解析に用いられない場合がある。特に長期試験で

はこのような状況は起こりやすく、検査データの推移や変化量、前後差の評価に影響が

でる。そのような場合には、測定施設から提供される換算方法を利用する等の適切なデ

ータ処理を行い集計・解析する必要がある。

(4) 背景項目による施設基準値の違い施設基準値が性別で異なるような赤血球数や年齢で異なるような BUN のような項目

もある。これらの項目が試験治療で影響を受ける可能性がある場合などは、特に注意し

てそれらの背景因子で層別した集計を行うことも有用である。

4) 規定外のデータの取り扱いその症例だけ何らかの理由で測定したような治験実施計画書規定外の検査項目は少

数例のみでは評価が難しいため、基本的に一覧表で表示するが、集計には加えないこと

が望ましい。また治験実施計画書で規定された検査日以外の検査値は原則として事前に

規定した Visit Window の取り扱いに従って処理するが、集計に含まれなかったデータも

含め、全て一覧表には表示する。なお、中止時の検査値は他時点と同様に Visit Windowの取り扱いに従うが、最終評価時(中止時)という Visit Window を用いることも１つの方

法である。

55

表 4.2.1.3【Visit Window の定義(例)】

Visit -2週 0週 4週 8週 12週

各Visitの基準

(0週の検査日が起点)

-14日 0日 28日 56日 84日

Visit Window -28～-1 0 1～42 43～70 71～98

* 同じVisit Windowに測定値が 2つ以上ある場合は基準日に最も近い測定値をそのVisitの測定値とする。

4.2.2. 臨床検査値異常等、検査値異常の要約 1) 目的

検査値異常の要約の目的は、分布の裾を評価することにより「試験治療の安全性プロ

ファイルに関するより詳細な検討のためのシグナルを提供する」ことであると考えられ

る。その結果、必要であれば検査値異常の一覧などから個々の症例に戻って検討を行う

こととなる。 ICH-E3 では試験期間を通した検査値の中で「特定の範囲の異常値を示した患者数」

や個々の患者の変化として「検査値に事前に決めた大きさの変化のあった患者数または

患者の割合を示す表」の提示を要求している。

2) 要約方法要約に必要な情報としては以下の通りである。デフォルトの表示項目・検査項目(単位) ・検査値異常の方向(LOW、HIGH) ・薬剤群の情報(実薬/プラセボ、用量、等) ・解析対象症例数・測定実施症例数・異常を示した例数およびその割合(%)

オプションの表示項目・検査値異常判定基準・欠測症例数・検査値異常グレード・ベースライン値の正常／異常

56

(1) 解析対象症例数と測定実施症例数の考え方集計解析の対象となる症例は、あくまでも安全性解析対象集団である。しかし、実際

には何らかの理由による欠測症例が発生し、欠測症例は検査値異常の発現があったかど

うかを判定することができない。そのため、安全性解析対象集団から欠測症例を除いた、

「安全性解析対象集団のうち、検査値異常の判定を行うことができた症例」を分母とし

て検査値異常の発現割合を算出する。具体的には設定した検査値異常の判定基準に依存するが、例えばベースライン値から

の変動(前後差、変化率)が治療期間中に判定基準を超えた症例を検査値異常ありと判定

する方法の場合、総症例数はベースラインが評価可能であり、かつ治療期間中に少なく

とも一つの評価可能なデータがある症例数になる。また、検査値が観察される時期ごとに検査値異常を判定することも可能であり、この

場合は、検査値異常発現割合の分母は観察時期ごとに設定する。つまり各観察期間の分

母はベースラインが評価可能であり、かつ該当時期に評価可能なデータがある症例数に

なる。検査値異常は検査項目ごとに判定され、また症例によっては一部項目のみ検査結

果が得られないこともあるため、同じ試験の中であっても検査項目ごとに分母が異なる

可能性もある。ベースラインが欠測の症例については、そのままでは検査値異常の判定が行えないこ

とになるが、特別な取り決めを行っていない場合はベースライン値を正常とみなし、必

要であれば補完を行う(例えば ULN と LLN の中央の値を用いる)など、できるだけ判定

を行い、発現割合の分母に含めるべきである。

(2) 集計表の構成集計結果の代表的な表示方法は、表 4.2.2.1 に例示したようになるが、設定された検

査値異常判定基準によってはベースライン値が正常／異常別に分けて表示する方が解

釈しやすい場合もある。また、必要であればオプションの集計として性別、年齢などの

背景因子によるサブグループ集計を行うことも考えられる78。検査値異常の検討に関しては、検査項目毎に異常の発現した症例の推移図をプロット

して、その個々の変動を示すことも有用である。検査値異常発現例数に関するベースラ

インと投与後各時期とのシフトテーブルを作成することで、検査値異常の発現の傾向や

パターンを示すことも有用である。又、定性値である尿検査の場合も同様のシフトテー

ブルが有用である。しかしながら、シフトテーブルを作成する際に測定値を正常/異常

(低・高)の分類変数にすると、連続変数としての測定値と比べて重要な情報を失うこと

もあるので注意が必要である 77。

3) 一覧表の作成

個々の検査値異常について一覧表示することは有用である。一覧表を作成しておくこ

57

とにより、上述の要約表から得られた「シグナル」を個別に検討することが可能となる。

この一覧には以下の項目を示す79。

デフォルトの表示項目・被験者番号・薬剤群の情報(Active/Placebo、用量) ・異常と判定された検査項目名・測定値(ベースラインおよび最大(または最小)の値)

オプションの表示項目・検査値異常発現日(投与開始からの期間) ・性別・年齢(必要であれば、その他判定基準が変わってしまう背景情報) ・検査値異常判定基準・測定値(デフォルトで設定したもの以外) ・異常の方向(LOW、HIGH)

なお、表示方法については、上記項目を被験者ごとに提示すれば良いが、必要に応じ

て、検査項目ごとに提示することも可能である。また、測定値の表示についても、ベースラインおよび最大(または最小)の値に加え最

終時点の値を提示すること、または特に関心のある場合は経時的に全ての値を提示する

ことにより、解釈の助けになる場合がある。

表 4.2.2.1 検査値異常の集計 1)

実薬プラセボ

検査値異常検査値異常検査項目

（単位）

異常の方

向

検査値異常

判定基準対象例数 2) 発現例数 3) %

対象例数発現例数 %

○○○(g/dL) 増加＞○○

○○○(g/dL) 減少＜△△

1) ベースライン値が正常／異常に関わらず、一つの表にまとめる場合とベースライン値が

正常／異常別に表を分ける場合がある

2) ベースライン値と治療期間中の値の比較により検査値異常の判定を行う場合、ベースラ

インが評価可能であり、治療期間中に少なくとも 1つ以上の評価可能なデータがある症

例の数を示す。なお、ベースラインが欠側の場合、ベースライン値は正常であったもの

として対象例数に含める。

3) 治療期間中に少なくとも 1回以上判定基準を超えた症例の数

58

表 4.2.2.2【検査値の時期毎のシフトテーブル】

ベースライン低正高検査項目

時期例数低正高低正高低正高

4W

8W

WBC

12W

表 4.2.2.3 検査値異常一覧

検査値(異常の方向)3) 被験者

番号薬剤 1)

性別・

年齢 2)

検査項目

（単位）

検査値異常

判定基準投与前最大 or 最小最終

○○○(g/dL) ○○＜＜△△ ○○ □□ 高 ◇◇

1) 実薬／プラセボ、用量の情報など

2) 必要であれば、その他の背景情報(例えば検査値判定基準が変わる項目)

3) 経時的に全ての測定値を示す方法と必要なもののみ(ベースライン値、最大／最小の値、

最終値)を示す方法がある

59

PartⅡ：安全性の統合解析－内容と手順

1. はじめに

ICH-M4(CTD 作成要領に関するガイドライン)の 2.7.4 節「臨床的安全性の概要」は、

個々の総括報告書及び他の関連する報告書(例：一部地域にて通常提出されている安全

性に関する統合解析)の結果をまとめ、対象となる患者集団における申請医薬品の安全

性に関するデータを要約することを求めている。これは、申請時点までの安全性情報の

総括を行うものであり、他の情報(有効性・物性・非臨床)も勘案して承認の是非を決定

するための重要なソースであるとともに、市販後のファーマコビジランス活動への橋渡

しとしても重要な役割を担っている。申請時点までの安全性情報の総括においては、

様々な条件下(対象となる被験者の違い、試験デザインの違い、地域の違い、時期の違

いなど)で得られた安全性情報の定量的あるいは定性的な比較が行われる。PartⅠで述べ

た安全性の社内標準は、これら比較の基盤を与えるものであり、一貫したプロセスやア

ルゴリズムを用いてデータが生成されたことを保証するものである。言い換えれば、個

別の試験からの結果を並べたとき、一般的な比較可能性以前のもっと基本的な比較の妥

当性を与えるものである。開発段階の安全性情報の総括として「臨床的安全性の概要」

をどのような方向に導くべきかを考えたとき、社内標準が存在しない状況を前提とする

のではなく、あえて社内標準が整備された状況を前提とした方がよいと考えた。現在直

面しているデータベースやデータセット併合の困難さなどの技術上の問題(これに伴う

リソース上の問題)あるいは解釈上の問題の多くが、本来、安全性情報の総括に際して

考えるべき問題ではなく、安全性データが生成された過程を遡り、そのプロセスを整備

することによって解決されると考えたためである。したがって PartⅡでは社内標準が整

備され、全ての安全性情報が一貫した考え方に基づいて収集され、取り扱われ、集計さ

れた状況における「臨床的安全性の概要」のみを考える。 2. 安全性の統合解析の目的 2.1. 統合解析とは

本報告書では「統合解析」を、「臨床的安全性の概要」作成時あるいは「ファーマコ

ビジランス・プランニング」の際に、全ての臨床試験を用いて安全性データのレビュー

を行うために必要となる集計・解析全般を意味する用語として用いる。つまり、開発段

階の全ての試験を対象としたシステマティック・レビューのための集計・解析を意図し

たものであり、複数の試験の結果を併合して集約された結果を導く(併合できるか否か

の検討も含めた)解析、いわゆるメタ・アナリシスを必ずしも含むとは限らない。シス

テマティック・レビューSystematic review は様々な定義がなされているが、一例として

英国 National Screening Committee の定義80 を示す。

60

A review of a clearly formulated question that uses systematic and explicit methods to identify, select and critically appraise relevant research, and to collect and analyse data from the studies that are included in the review. Statistical methods (meta-analysis) may or may not be used to analyze and summarize the results of the included studies.

つまり、疑問点を明確にした上で、網羅的にレビューを行い、各試験のエビデンスの

質を批判的に評価し、必要であればメタ・アナリシスを適用してエビデンスを併合する

という Evidence Based Medicine(EBM；根拠に基づく医療)の手順に沿ったものである。

2.2. 統合解析の目的

序文でも述べたように、ICH-E2E(ファーマコビジランス・プランニング)では、1)重要な特定されたリスク (Important identified risk)、2)重要な潜在的リスク (Important potential risk)、3)重要な得られていない情報(Important missing information)を最初に検討

することが求められており、CTD の「臨床的安全性の概要」は、まさにこれらを整理

する場でもある。ICH-M4 の 2.7.4 節「臨床的安全性の概要」には、安全性情報要約の

３つのレベルが ICH-E3 を引用する形であげられている。

・曝露状況（投与量、投与期間、患者数、患者のタイプ）を検討し、データベースから

どの程度の安全性評価が可能なのかを決定すること。・比較的よくみられる有害事象や臨床検査値の変化を明確にし、妥当な方法で分類し、

それらの発現に関する要約を行うこと。・重篤な有害事象（ICH E2A による定義）及びその他の重要な有害事象（ICH E3 によ

る定義）を明確にし、それらの発現について要約すること。これら事象の頻度を、特

に長期にわたり使用される可能性がある医薬品については、経時的に検討すること。

これらの要約には、安全性の統合解析の目的が集約されている。上で述べた ICH-E2E

の 3 項目にこれらを関連づけるとすれば、1 番目の検討は、1)重要な特定されたリスク

や 2)重要な潜在的リスクがどのような条件下で得られたものか、そして 3)重要な得ら

れていない情報は何かを明らかにするものである。曝露状況のみならず、試験デザイン、

対象被験者集団、試験が行われた地域なども考え合わせ、安全性情報が全体としてどの

ような構成になっているのか、どのような部分集団(健常人・患者の別、盲検化の程度、

実薬対照群やプラセボ対照群の有無、試験が行われた地域、試験が行われた時期、特殊

な患者集団など)の検討が意味をもつかを考えるステップでもある。早期中止例の割合、

プロトコール逸脱の割合などを検討することにより、試験の質の評価に役立つだろう。

複数の試験をレビューすることにより、ある事象の発現頻度が(どのような条件下で)安定しているものなのか、条件によって揺らぐものなのかがわかる。これらのいずれの情

61

報も、一つの試験結果からは得られないものであり、他の試験と並べ、様々な角度から

検討してみて初めてわかることである。統合解析は個々の試験では得られない「価値」

を付加するものであると言える81。 2 番目の検討は、1)重要な特定されたリスクを整理することに相当する。比較的よく

みられる有害事象や臨床検査値の変動が、どのような条件下でどの程度発現するのか

(どのように分布が変化するのか)、またそれらは条件によって揺らぐものなのかの検討

が基本となる。ある程度高頻度に発現する事象であれば、用量反応関係の検討、各用量

における対照薬(プラセボ、実薬)とのリスク差(比)、あるいは時間反応関係の比較検討、

またこれらの試験間の均質性 homogeneity の検討が可能であろう。 3 番目の検討は、2)重要な潜在的リスクを整理することに相当する。 2 番目および 3 番目の検討において、メタ・アナリシスの手法が適用可能な場面もあ

るだろう。これについては次節で説明する。

2.3. メタ・アナリシスの適用場面

メタ・アナリシスとは、過去に行われた複数の独立な研究結果を併合するための(併合できるか否かの検討も含めた)統計解析である82。ICH-M4 では、「併合」という用語

を用いてメタ・アナリシスを表現している83。メタ・アナリシスの利点としては、複数

の試験を併合することにより、標本が大きくなる(部分集団の例数も増える)ため、１つ

の試験では十分な検討ができなかった問題の検討が可能になること(推定値の精度や差

に対する感度が増す)があげられる。また、Koch ら 81は複数の試験を並べることで、定

性的に試験の質やデザインの違いを評価できること、結果の一般化可能性の問題も扱う

ことができることをあげている。また彼らはメタ・アナリシスの問題点として、どの試

験を含めるかの決定にバイアスが混入する可能性があること、異なった結果を持った試

験を併合したときに特定の条件下でのみ得られた結果が薄められてしまうこと、メタ・

アナリシスが仮定している試験間の独立性が多くの場合怪しいこと(複数の試験に参加

した医師、治験協力者の存在、時間の経過に伴う情報のアップデートなどが原因)、試

験の重み付けに恣意性があることなどをあげている。

ICH-M4 では「2.7.4.2.1 有害事象の解析」において、メタ・アナリシスを意図した記

述があり、その有用性を認めてはいるものの手放しで推奨しているわけではない。基本

的には、記述しようとする安全性データが１つや２つといった少数の試験に基づく場合、

被験者集団の特徴が非常に異なる場合、有害事象の発現率や発現パターンが異なる場合

には併合することなく試験ごとにまとめるべきであり、併合が適切と考えられるのは記

述しようとする安全性データが少数試験によらない場合で、試験デザイン(投与量、投

与期間、有害事象の評価方法及び患者集団等)が類似している場合、有害事象の発現率

や発現パターンが大きく異ならない場合であると述べられている。

62

比較的よく見られる有害事象(用量反応性があるもの、被験薬とプラセボとの間で明

らかに発現率が異なるもの)に対してこのような併合を行ったとしても、類似したデザ

インの試験で得られた大きく異ならない結果の併合であるならば、そこからリスク・ベ

ネフィットの考量にインパクトを与えるような新たなメッセージが得られることは期

待薄であり、結果が安定していることを示すことによりエビデンスが強まること、推定

の精度や差に対する感度が上がること、単独の試験では十分にできなかった層別解析や

予後因子を追加したモデル化によりリスク集団の特定に役立つ可能性があるのみであ

る。

ただし、自然発生的な事象と治験薬と関連のある事象とを区別するために行われる、

全ての比較対照試験又は比較対照試験の部分集団を併合することの有用性は認めてい

る。つまり、全てのプラセボ対照試験、何らかの実薬対照を用いた試験、特定の実薬対

照を用いた試験、特定の適応症について検討した試験(異なる患者集団にて実施された

試験)を対象としたグループ化であり、発現率を対照薬群と被験薬群との間で比較する

ことを意図したものである。対照群との比較によってのみ因果関係の評価が可能な場合

がある。例えば ACE 阻害剤の空咳は周知の副作用であり、プラセボ対照の二重盲検試

験ではプラセボを投与した被験者の空咳であっても、なかなか治験薬との因果関係は否

定されないであろう。このような場合、その ACE 阻害剤と空咳との因果関係は対照薬

との評価によってのみ可能となる 84。しかし、発現率が見かけ上同程度だったとしても、

重症度や中止あるいは用量の変更に至った有害事象の頻度が違っているということが

あるかもしれない。発現の有無という二値化された情報だけでなく、さらに掘り下げた

検討を行うことが重要である。

一方、比較的稀な事象(個々の試験では頻度が低く十分な検討ができなかったが併合

することによって、発現率の推定やリスク差(比)の評価が可能になるかもしれない事象)については、併合が有用である場合がある。ICH-M4 でも健康被験者を対象とした短期

試験を除いた全ての試験を併合することは、比較的稀な事象を評価するのに最も適した

グループ化であると述べられている。たとえ試験デザインが異なったとしても、そのこ

とがもたらすエビデンスの弱さよりも、臨床的に問題となる事象について併合して得ら

れるかもしれないリスク因子の情報の価値が高いためである。 3. 統合解析の手順

統合解析の計画・実施を効率的に行うためには、社内において安全性の情報収集、デ

ータベース化などが標準化されていることが重要なことである。本章では、社内標準が

すでに導入されているとした上で、統合解析の計画から実施までのプロセスを考える。

63

まず、このプロセスは以下の４つに分けることができる。 ① 統合解析計画を立てる。 ② 統合解析計画に従って、試験間の比較や複数の試験を併合した解析などを効率的

に行うための DB 併合計画を立てる。 ③ 実際に DB を併合する作業を実施する。 ④ 統合解析を実施し報告する。

3.1. 統合解析計画

安全性の統合解析計画を事前に作成することは規制要件ではない。それでも我々は早

い時期(例えば、申請時に用いる全ての安全性データが出そろう１年前、あるいは探索

的な相から検証的な相への移行時など)に統合解析計画を作成することを推奨したい。

一般に、解析計画を事前規定する理由は大きく２つある85。一つは、科学的な理由であ

る。事前に(二重盲検試験の割り付け情報が明らかになる前、非盲検試験のデータベー

スが固定される前、最初のデータが入手される前など状況、解釈によって若干の幅はあ

るものの)解析方法を規定することにより、結果が得られた後で、スポンサーに都合の

よい集計・解析方法を選んだのではないことのある程度の保証が与えられるためである。

この意味での主な読者(顧客)は規制当局であり、解析計画が確定したタイミングおよび

そのタイムスタンプが重要になる。もう一つの理由は、実際的な理由である。プログラ

マー、メディカル・ライター、その他 CTD 作成に関わる人々の共通の理解を事前に得

ることによる重複した仕事の回避、仕事量の見積もりによる適切なリソース配分計画、

仕事の前倒しによる申請直前の作業軽減・作業時間短縮のためである。この意味での読

者(顧客)は社内関係者ということになる。安全性の統合解析の場合、最初の理由は二重

盲検試験の場合に比べるとそれほど厳格さは求められていない。統合解析の解析計画を

早期に作ることの主な動機付けは２番目の理由である。統合解析計画にどこまで詳細な内容を盛り込むかについては、意見が分かれるところ

である 85。重要なことは、どのデータに基づいて、どのような方法で集計・解析を行い、

集計・解析結果からどのように結論を導くかについて様々な職種の人々が共通の理解を

持つことができるということである。プログラマーのような特定の顧客を重視して、デ

ータ取り扱いや集計のアルゴリズムの詳細を示す、図表の仕様のイメージ図(Mock)を添

付するという運用の仕方もあるだろう。

3.1.1. 統合解析計画の事前作成のメリット統合解析の解析計画を早期に作ることにはいくつかのメリットがある。そのひとつは、

すべての臨床試験が終了してから統合解析を考え始めたとすると、目的とするデータが

得られていない、データの内容が異なるなどのデータ収集時に生じた問題を回避するこ

64

とができなくなる。早期に計画を立てることにより、個々の試験に対して、統合解析の

視点を取り入れることができ、これらの問題を回避できる。２つ目は、統合解析計画を

立てるのが遅くなると、当然、申請直前に DB 併合作業や統合解析作業が集中すること

になり、作業担当者の負荷が増大してプログラムミスなどのリスクが増えることになる。

統合解析計画を事前に立てることで、これらのリスクを回避することができる。３つ目

として、複数の試験を併合して解析を行う場合、統合解析計画の集計対象(試験)、集計

項目および集計方法を明らかにすることにより、DB 併合過程での必要な作業が明確に

なり、それぞれの作業分担及びそのスケジューリングを余裕をもって行うことが可能と

なる。最後に、統合解析の集計結果の出力サンプルを提示することで、担当者間で結果

イメージを共有することにより、担当者間の解釈の違いによる集計作業のやり直しなど

を避けることが期待できる。統合解析計画を早い段階で作成することには大きなメリットがあるが、安全性情報の

アップデートにより統合解析の内容が追加・変更せざるをえないこともある。統合解析

に組み入れる試験の実施中に準備を開始するということが、統合解析をダイナミックな

プロセスにする。

3.1.2. 統合解析計画に含まれる項目 3.1.2.1. 安全性の統合解析の対象となる被験者の条件 (解析対象集団)

安全性解析の対象集団について、開発計画全体で一貫した定義(例えば、「少なくとも

１回の投与を受けた症例」など)がなされているのであれば、その定義を蹈襲するのが

もっともわかりやすい。しかしながら、試験により若干の食い違いが見られる場合には、

その違いをどのように扱うのか、あるいはどのような統一化した定義を用いるかを明記

する。個々の試験の総括報告書と統合解析で異なった解析対象集団の定義を行った場合、

集計結果に若干の食い違いが発生する可能性がある。 3.1.2.2. 解析目的に適した集計対象 (試験) の選定

承認申請時点までに行われたあらゆる試験を集計対象にするのが基本姿勢である。シ

ステマティック・レビューの観点からも、もれなく網羅的に試験結果を並べることがス

タート地点となる。個々の試験における曝露状況、試験デザイン、対象被験者集団、試

験が行われた地域なども考え合わせ、データベース全体からどの程度の安全性評価が可

能なのかを決定するとともに、どのような試験のグループに対するまとめがどのような

意味を持つかを検討する必要がある。試験のグループ化の例としては、 (1) 健常人を対象とした全ての試験(単回投与、反復投与別) (2) 患者を対象とした全ての試験 (3) 患者を対象とした全てのプラセボ対照試験(投与期間共通または投与期間ごと) (4) 患者を対象とした全ての標準薬対照試験

65

(5) 患者を対象とした全ての固定用量試験あるいは可変用量の試験 (6) 患者を対象とした全ての長期投与試験

などが考えられる。それぞれのグループによるまとめが何を目的として行おうとしてい

るのか 2.2 節で述べた目的と照らし合わせ、グループを設定する。どのグループにどの

試験が含まれるのかを統合解析計画の中で図や表を用いて示すことは理解を助けるで

あろう。

試験が行われた地域は、上のようなグループ化をさらにサブ・グループ化する切り口

として重要であり、併合の是非については議論の多いところである。重篤な有害事象や

その他の重要な有害事象を発現した被験者に共通するリスク因子の探索では、併合が有

用な場合があるかもしれない。

3.1.2.3. 集計項目と集計方法の明記

統合解析計画時には、個々の試験と同様に集計項目および集計方法とともに、図表一

覧(table of contents)や集計結果の出力サンプルを提示することにより、統合解析に関わ

る担当者の理解が深まるとともに、担当者間の情報の共有ができる。

3.1.2.4. 統合解析に組み入れるデータのカット・オフのタイミング

承認申請を行う時点でも、長期間投与時の安全性を調べることを目的とした長期継続

試験などいくつかの試験が継続中である場合がある。いつの時点までのデータを統合解

析の対象とするかの詳細は、担当者間の認識のずれが起きやすい部分である。単純にデ

ータベース化された日付でカット・オフを行う(cut off date の指定)、一定の条件を満た

す時点(例えば、長期継続試験で 180 日以上、投与を継続した症例が xxx 例以上に達し

た時点など)など様々な考え方、状況があり得る。したがって、これを統合解析計画に

記述しておくことにより担当者間の混乱を避けることができる。

3.2. データベース(DB)併合計画

複数の試験データを統合する際には、事前に DB 併合計画を立てておくと、具体的な

作業とその実施時期が明確にすることができる。そして、これらの作業スケジュールを

管理することにより、統合解析関係の申請資料作成作業を円滑に進めることができる。 3.2.1. DB 併合計画の目的及びその内容

DB 併合計画の目的とは、上述のとおり、具体的に必要な作業内容、その作業量およ

び実施時期を明確にして、それぞれの作業に対する分担などを決めて、実際の作業を円

66

滑に進めることにある。 DB 併合計画を作成する際には、まず、統合解析計画に従って、試験間の比較や複数

の試験を併合した解析などを行うために必要な項目を抽出する。次に、それらの項目に

ついてデータ変換が必要かどうかを検討する。そして、最後に、データを併合するため

の DB の型式を検討する。ここでは、社内標準が既にあることを前提としているので、

項目の変数名などの属性の統一などの作業には言及しない。作業内容が明確になれば、

これらの作業について、作業量を見積もり、作業スケジュールを立てて、個々の作業の

責任者及び担当者を割り当てる。なお、CDISC Submission Data Standards Team は、規制当局へ提出する安全性に関する

標準的データセット一式として、DM(Demographics)、EX(Exposure)、CM(Concomitant Medications) 、 AE(Adverse Events) 、 DS(Disposition) 、 MH(Medical History) 、

IE(Inclusion/Exclusion Exceptions)、LB(Laboratory Tests)、VS(Vital Signs)の９つを提唱し

ている86。

3.2.2. 有害事象コード(MedDRA)の取扱い

有害事象は MedDRA によるコーディングが推奨されている87。個々の試験における有

害事象の MedDRA によるコーディングは、既に社内標準があり、MedDRA のバージョ

ンについては、それぞれの試験の実施時期に適したバージョンを使用しているものと思

われるので、統合解析を行う時には、下図に示したとおり、複数のバージョンの MedDRAコーディングが存在することになる。一方、承認申請資料において臨床試験資料の全体

をまとめる総括部分の MedDRA バージョンは、最新またはその１つ前のものを使用す

ることが望ましいとされており、用いたバージョンを明記することが求められている。

したがって、統合解析において、有害事象に関する試験間の比較や試験を併合した解析

を行う際には、１つのバージョンに統一する必要があるので、早期に実施された試験に

ついて新しいバージョンで再コーディングしなければならない。MedDRA 辞書のバー

ジョンは半年に１回更新されており、変更箇所は少なからず存在するので、コーディン

グ結果(読み替えを含む)を試験実施当時のバージョンと新しいバージョン間で比較し、

必要に応じて再コーディングする作業が発生する。また、この作業は、統一するバージ

ョンが決まる段階(申請前の最後の臨床試験で決まったバージョンなど)で実施するこ

とが予想されるので、開発期間が長く多くのバージョンが存在する場合や有害事象が多

い場合などでこの作業量が多くなることにより DB 併合のボトルネックとなる。したが

って、DB 併合計画を立てる際には、この点を十分に考慮しておくことが限られた期間

で効率的に作業を行う上で重要である。

67

3.2.3. 有害事象の翻訳統合解析において、国内データに加えて、海外データを利用する場合がある。国際的

な企業の場合は、既に社内標準として、英語で報告する場合と、日本語で報告する場合

の変換(翻訳)方法が確立されていると思われるが、ここでは、国内企業が海外データを

利用する際の参考として、有害事象の翻訳方法について簡単に紹介する。海外で実施さ

れた臨床試験において英語で記載された有害事象を利用する場合、日本語に翻訳する必

要がある。この場合には、下記の２つ方法が考えられる。１番目は CRF の英語事象名

を MedDRA 英語辞書でのコーディングしてから、MedDRA 日本語辞書の日本語事象名

を獲得する方法であり、２番目は CRF の英語事象名を医学専門家が日本語に翻訳した

後、MedDRA 日本語辞書でコーディングする方法である。前者は、英語辞書と日本語

辞書間で有害事象名が正しく対応しているかが問題となり、後者は、翻訳者により、解

釈が異なる可能性が問題となる。したがって、２つの方法を併用し、翻訳した結果が一

致することを確認することが理想ではあるが、現実の問題として、これらの作業を実施

するためには相当の時間を要することであり、どの方法を利用するかは、各社の判断に

委ねられるが、事前に作業量を十分に見積もり、作業スケジュールを立てることが重要

である。

方法①： CRF記載名（英）MedDRA用語（英）MedDRAコード

MedDRA用語（英）MedDRAコードMedDRA用語（日）

コーディング

方法②： CRF記載名（英） CRF記載名（日） MedDRA用語（日）

コーディング翻訳

方法①： CRF記載名（英）MedDRA用語（英）MedDRAコード

MedDRA用語（英）MedDRAコードMedDRA用語（日）

コーディング

方法②： CRF記載名（英） CRF記載名（日） MedDRA用語（日）

コーディング翻訳

NDAV5.0 V5.1 V6.0 V6.1 V7.0V4.1 V7.1 NDAV5.0 V5.1 V6.0 V6.1 V7.0V4.1 V7.1

68

3.3. 統合解析のプロセス(例示)

以下に、統合解析計画を第Ⅱ相試験の段階で作成した場合における統合解析のプロセ

スの例を示した。 4. 結果の提示結果の提示方法については、有害事象、臨床検査値あるいはその他の安全性評価指標、

いずれにおいても議論の多いところである。本章では有害事象および臨床検査値について

いくつかの結果の提示方法を紹介するが、これらは考え方の一例を示したものであり、別

の方法も考えられるかもしれない。今後、学会、ワークショップなどにおいて、さらなる

議論が進展することが望まれる。 4.1. 有害事象の要約

少数の臨床試験が国内で実施された薬では、発現した有害事象とその発現率を試験ご

とにリストするとともに、各臨床試験の総括報告書をレビューし要約することが、最も

分かりやすい方法である。一方、デザイン上の主な特徴が似ている臨床試験を多数実施

しているような場合には、それら臨床試験のデータを併合し解析することにより、より

精度の高い推定値(有害事象の発現率・リスク比・リスク差など)を求めることや有害事

象の発現に影響を及ぼす因子(リスク因子)を探索することが可能であろう。また、海外

で承認済み、あるいは海外に多くのデータがあり、少数の国内ブリッジング試験だけで

承認申請する場合には、国内と海外で有害事象の種類、発現率、発現時期などに特徴的

な相違があるかにも関心がある。つまり、申請前に行われた臨床試験の多さや構成に応

じて、有害事象の要約の仕方は異なる。ここでは、重篤もしくは重要な有害事象、比較

I IIa IIb III

統合解析計画

DB併合

統合解析

DB併合計画

I IIa IIb III

統合解析計画

DB併合

統合解析

DB併合計画

69

的よく見られる有害事象、特別な患者集団のリスクについて要約の方法を紹介する。 1) 重篤もしくは重要な有害事象

重篤もしくは重要な有害事象に関しては、各事象の発現率を推定すること、データに

基づいて有害事象と薬との因果関係を再考すること、そのような有害事象を発現した被

験者に共通のリスク因子を探索することを目的として要約する。個々の総括報告書をレ

ビューすることで、重篤もしくは重要な有害事象の種類と発現数は把握できる。有害事

象の発現率がある程度高い場合には、対照群(プラセボ、対照薬)との発現率の比較、用

量間の発現率の比較を通して薬との因果関係の再考、4.1.2 節の手順でリスク因子を探

索することができる。一方、有害事象の発現率が低い場合でも、症例一覧表をもとに、

臨床的な観点から薬との因果関係を再検討することや、リスク因子の候補を検討するこ

とは可能であろう。 2) 比較的よく見られる有害事象

比較的よく見られる有害事象については、各事象の発現率を推定すること、データに

基づいて有害事象と薬との因果関係を再考すること、リスク因子を探索すること、用量

反応関係を評価すること、時間反応関係を評価することを目的として要約する。プラセ

ボ対照試験のデータだけを併合し、プラセボ群との発現率の比較を通して、各事象が自

然発生的なものであるか否かを判断して、事象発現と薬との因果関係を再考する。薬が

投与された患者を対象として、用量別に事象発現までの日数(時期)別に有害事象の発現

頻度を集計することにより、用量反応関係や時間反応関係がおよそ把握できる。 3) 特別な患者集団のリスク

特別な患者集団(高齢者または小児、腎疾患患者、肝疾患患者、特定の合併症を有す

る患者、重症患者など)のリスクが高いか否か、他の集団に比してどれくらい高いかを

定量的に評価することができれば望ましい。そのためにも、有害事象の種類ごとに、特

別な患者集団での発現率とそれ以外の患者集団または全体での発現率を比較すること

(あるいはリスク比を求めること)に関心がある。有害事象の種類は多いことから、

SOC(器官別大分類)でグループ化した発現率を比較した後に発現率の異なる器官に注目

して種類別の発現率を比較するという二段階の手順も考えられる。患者集団間で有害事

象の発現率が異なることが示唆された場合には、その患者集団でのリスクの大きさを分

かりやすく提示するためにも、発現率とともにリスク比(または、リスク差)を提示する

ことが望ましい。逆に、リスク比(または、リスク差)がある値以上であるような有害事

象をリストすることにより、特別な患者集団でのリスクを明らかにできる可能性がある。

70

4.2. 有害事象に関するその他の解析

4.2.1. リスク因子の探索特定の有害事象に注目して、どのような因子が有害事象の発現に関係しているのか、

その因子をもつ患者集団ではどれくらいの確率で有害事象が発現するのかといったこ

とに関心のある場合がある。そのような場合には、人口統計学的特性や病態因子などの

種々の項目で層別し、項目カテゴリー間で有害事象の発現率が異なるか否かを確認する

ことで、有害事象の発現に影響を及ぼす因子を抽出することができる。次に、抽出され

た因子を共変量、有害事象の発現の有無を応答とするロジスティックモデルをあてはめ

ることにより、因子間の相関を考慮した上で、有害事象の発現に及ぼす各因子の影響度

(リスク比)を推定することも、高リスクの患者集団を抽出することも可能である。また、

抽出された患者集団において、治療因子(投与量、併用薬など)と有害事象の有無の関係

を調べ、発現率の低い治療因子の組み合わせを探索することにより、高リスクの患者集

団における低リスク治療を探索することも可能であろう。

4.2.2. 観察期間を考慮した解析観察期間(time at risk)を考慮した解析方法を用いることによって、観察期間がある程

度異なる試験を統合することができる。例えば、次のような指標を用いての解析方法が

考えられる。

1)「有害事象患者数／患者治療年数」

（「１患者治療年」=「１患者の１年間の治療」 = 「365 患者の１日の治療」）

2) 発現密度 81 ＝「全患者における総事象数」／「全患者における総リスク時間」

（「全患者における総リスク時間」= 「総投与患者数」×「観測時点数」）

延べ 10000 週の投与で 20 件の事象が生じた場合は、20/10000=0.002(件/週)と記述でき

る。また、発現がまれでポアソン分布に従うと考えられる場合、「期間中に生じるイベ

ントの数は投与と無連関である」という帰無仮説を検定することもできる。しかしここ

では、事象発現のリスクが時間によらず一定であるという暗黙の仮定を置くことに留意

する必要がある。この仮定のもとでは、薬剤投与に起因する多様な事象発現パターンま

では説明するには限界がある。例えば、長期の薬剤曝露後のみに見られるような有害事

象の発現リスクなどはこの方法では過小推定となる。

発現密度について、要因を考慮した解析を行いたい場合は、区分指数モデル(Piecewise

Exponential Model)の適用が考えられる。本モデル解析は、各時期区分での有害事象発現

71

がそれぞれ独立な指数分布に従うと仮定して、各時期区分内における各部分集団の有

害事象発現の発現密度(事象数／time at risk)を以下の構造で記述したものである。

λhis = exp (x’his β) ただし、x’hisは試験 h、投与 i、時期区分 s を含む予測変数のベクトル、βは推定した

いパラメータのベクトル。

3) 発現密度の拡張(複数発現を考慮)81

各患者が特定の有害事象を数回(１回以上)経験した場合で、この回数を考慮したい場

合は、発現密度を拡張した以下の式に示される比(ratio)を構成することで対応できる。

「有害事象発現数の総和」／「Time at risk の総和」

分子の「有害事象発現数」を「持続期間」、「重症度」(あるいはそれらの組み合わせ)に替えて同様な比を考えてもよい。

4) 生存時間解析

(1) 生命表法この指標により、時間とともに変化する patients at risk の数を考慮しながら、時期区

分ごとの有害事象発現率を推定できる。累積発現割合の SE は Greenwood の式により推

定でき、投与間の比較には Mantel-Haenszel 検定(ログランク検定)が適用できる。ここで

は、観察期間中に追跡不能または中止脱落を打ち切りとする。打ち切りは薬剤の効果と

は無関係に起こり、打ち切り患者と打ち切りを受けなかった患者の有害事象の発現率に

は差がないという仮定を置いている。さらに、打ち切りは区間中で一様に生じるものと

考えて、打ち切り患者は区間時間の半分だけリスクに曝されていたと仮定して、 time at risk として t/2 を割り当てる。一方、区間中に有害事象経験患者の time at risk には t を割り当てることが多いが、区間中で一様に起こると仮定して、t/2 を割り当ててもよ

い。治療群間の検定には、試験を層別因子とする場合としない場合の両方のアプローチが

考えられる。これは Mantel-Haenszel 統計量の算出にあたり、時間×試験で層化するか、

時間のみで層化するかの違いとなる。

(2) Kaplan-Meier 法各有害事象の発現時間が詳細に分かる場合は、各有害事象発現とともに新しい時期区

分が始まると考えて、Kaplan-Meier 積・極限法により累積割合を推定することが可能で

ある。生命表法と同様に累積発現割合の SE は Greenwood の式により推定でき、投与間

の比較にはログランク検定が適用できる。打ち切りの定義は上記と同様であるが、time at risk は実際の発現時間を割り当てる。

ただし、この方法は初発の有害事象までの時間に意味がある場合に限られる。

72

4.3. 臨床検査値の要約

ここでは、すべての試験を通して重要な臨床検査値の変動に関し、簡単に概括する。臨床検査値の要約に関しては、測定された検査値を要約すること(定量評価)、施設基

準値を用いて検査値をカテゴリー化して要約すること(定性評価)などが考えられる。定

量評価については、PartⅠの「4.2.1. 3) 測定施設や測定方法の違いへの対応」でも述べ

たように、単位変換や検査データの正規化等で調整して併合することも、検討すべきで

あろう。この場合は併合に用いた方法を記載する必要がある。なお、バイタルサイン(例：心拍数、血圧、体温、呼吸数)、体重及び安全性に関連す

るその他のデータ(例：心電図、X 線)を比較する方法は、基本的に臨床検査値と同じ方

法にて行うことと ICH-M4 ガイドラインに記載がある。

4.3.1. 臨床検査値の推移統合解析では、すべての臨床検査値について要約統計量及び投与前後の推移図/散布

図などを提示する必要はなく、重要な臨床検査値及び特定(薬剤の影響があらかじめ想

定される)の臨床検査値についてのみ提示することが有用である。ただし、症例数が多

くなるため、推移プロットや散布図が変動を把握しやすいグラフになるとは限らない。また、ある特定の集団に興味があるが(例えば、腎疾患など代謝に影響を及ぼすと考

えられる患者集団)、個々の試験において症例数が少なく、その集団についての十分な

評価が行えない時には、試験を併合したうえで、興味のある臨床検査値に対してその集

団における要約統計量及び投与前後の推移図/散布図などを提示することは有用である

かもしれない。

4.3.2. 臨床検査値異常臨床検査値異常に関しても、「臨床検査値の推移」と同様、すべての臨床検査項目に

ついて提示する必要は必ずしもない。重要な臨床検査値及び特定(薬剤の影響があらか

じめ想定される)の臨床検査値について、値の範囲及び異常値を示した被験者数、また

は特定の範囲の異常値を示した被験者数(例：シフトテーブル等、ICH-E3 参照)を提示す

ることが有用と思われる。併合することにより、これらの臨床検査値の変動についてそ

の重要性及び医薬品との関連性を評価することや、患者の特性など(例：疾患、人口統

計学的特性、併用療法)との関連についても検討することが可能となることもある。

4.3.3. 前後差の検定個々の試験においては、PartⅠの「4.2.1. (4) 有意差検定」で述べたように臨床検査値

に対する前後差の検定を薬剤の影響を検討するための Flagging Device として用いるこ

とも考えられる。しかし、統合解析においては併合により症例数が増加するほど、臨床

73

検査値に対する前後差の検定で臨床的に意味のない差を検出する機会が増大すること

から、通常の有意水準(P<0.05)では Flagging Device としての価値が低下するであろう。

有意水準を、例えば P<0.001 など、小さくするという方策も考えられるが、統合解析に

おいて、前後差の検定の適用の是非や適用した場合の解釈の仕方を CTD 作成に関わる

担当者間で認識を共有しておくことが重要である。

74

最後に

開発段階から市販後までの安全性データの概念図を示す。

横方向(時間の経過、そして開発段階から市販後へ)と縦方向(海外を含めたさまざまな

試験)の広がりがあり、社内標準は開発段階におけるあらゆるデータの繋ぎ目のないデ

ータ交換を可能にするための基盤となり、その基盤の上に集められた安全性データの統

合解析は、承認審査におけるリスク・ベネフィット・バランスを考量するために、ある

いはファーマコビジランス活動の核となる情報として、有用となるであろう。また、市

販後まで視野に入れた、あるいは市販後調査に関わる人々との共同作業で作られた社内

標準は、開発段階と市販後の繋ぎ目のないデータ交換をも可能にするであろう。

本タスクフォースが頂いた当初のテーマは「安全性の統合解析における統計的評価方

法の提案」であった。しかしながら、活動初期に行ったアンケート(タスクフォース２

に参加した１７社対象)により、外資、内資を問わず国内の製薬会社ではほとんどの場

合、安全性の社内標準が整備されていない、あるいは海外では整備されている社内標準

が日本には導入されていないという状況が明らかになり、CTD 作成時に直面するさま

ざまな技術的問題も、データの上流(データ収集のされ方、データ取り扱いのアルゴリ

ズムなど)に遡らずして根本的な解決を図ることはできないと考えられた。そのため本

報告書の前半(PartⅠ)では社内標準を大きく取り上げ、後半(PartⅡ)に社内標準を前提と

した統合解析の内容と手順を取り上げた。医師や患者にとって有用な安全性情報が高品

質でタイムリーな形で提供されることと、企業に求められる生産性を両立させることは

相反することであると考えられるかもしれないが、これらを両立するためにも社内標準

は有用である。どうか本報告書を参考に社内標準の構築に取り組んで頂きたい。また、

膨大な作業が発生する CTD 作成を効率よく行うために、開発段階で得られた安全性情

報を総括するために、本報告書が参考になればと願っている。

75

参考文献

序文

1 ヒポクラテスの誓い The Oath of Hippocrates, http://www.mmc.funabashi.chiba.jp/hp_folder/message/pdf/6-a-7).pdf

2 Deborah S. Kirby. Adverse Drug Event in Clinical Trials. In: Gene Sogliero-Gilbert, editor. Drug Safety Assessment in Clinical Trials, Chapter 2. Marcel Dekker, 1993.

3 Stephen Senn. Safety data, data monitoring, and pharmaco-epidemiology. In: Statistical Issues in Drug Development, Chapter 23. Wiley, 1997.

4 ICH E2E：医薬品安全性監視の計画（案）step 2. 5 Bert Spilker. Safety Data Required for a New Medicine at the Time of Initial Marketing. In: Guide

to Clinical Trials, Chapter 119. Raven Press, 1991. 6 日米ＥＵ医薬品規制調和国際会議(ICH)について；平成 10 年 2 月

http://www.nihs.go.jp/dig/ich/aboutich/altext2.html PartⅠ：安全性情報と社内標準

1．はじめに，2．安全性の社内標準

7 Gene Sogliero-Gilbert. Preface. In: Gene Sogliero-Gilbert, editors. Drug Safety Assessment in Clinical Trials. Marcel Dekker, 1993.

8 Gina Wood. 7. Safety Standards for Clinical Trials, 統計・DM 部会シンポジウム「医薬品の安

全性情報を考える」＜講演要旨集＞, 2004. 9 Christy Chuang-Stein, Noel R. Mohberg. A Unified Approach to The Analysis of Safety Data in

Clinical Trials. In: Gene Sogliero-Gilbert, editor. Drug Safety Assessment in Clinical Trials, Chapter 9. Marcel Dekker, 1993.

10 小宮山靖. 3. 安全性報告の社内標準について(概観), 統計・DM 部会シンポジウム「医薬

品の安全性情報を考える」＜講演要旨集＞, 2004.

3. 有害事象に関する問題

11 「ICH 国際医薬用語集日本語版（MedDRA/J）」の使用について(薬食安発第 0325001 号薬食審査発第 0325032 号平成 16 年 3 月 25 日).

12 ICH Points to Consider ワーキンググループ. MedDRA R 用語選択：考慮事項公表版 3.4（MedDRA V.7.1 対応）, 2004 年 11 月 18 日

13 医薬品等の副作用の重篤度分類基準について(薬務局安全課長通知第 80 号(薬案第 80 号)平成 4 年 6 月 29 日).

14 西條長宏,下山正徳,福田治彦他. National Cancer Institute - Common Toxcity Criteria(NCI-CTC Version2.0. April 30,1999). 癌と化学療法, 2001, 第 28 巻第 13 号. p.1993-2027

76

15 National Cancer Institute. Common Terminology Criteria for Adverse Events v3.0 (CTCAE).

December 12, 2003. 16 World Health Organization, the Uppsala Monitoring Center, 2000, Safety Monitoring of Medical

Products. 17 A.F.Macedo. Causality assessment of adverse drug reactions : comparison of the results obtained

from published decisional algorithms and from the evaluations of an expert panel, according to different levels of imputability. J Clin Pharm Ther, 2003, 28. p.137-143.

18 F.E.Karch. Adverse Drug Reactions : A Critical Review. JAMA,1975,234. p.1236-1241 19 M.S.Kramer. An Algorithm for the Operational Assessment of Adverse Drug Reactions I. JAMA,

1979, 242. p.623-632. 20 T.A.Hutchinson. An Algorithm for the Operational Assessment of Adverse Drug Reactions II.

JAMA, 1979, 242. p.633-638. 21 J.M.Leventhal. An Algorithm for the Operational Assessment of Adverse Drug Reactions III.

JAMA, 1979, 242. p.1991-1994. 22 C.A.Naranjo. A method for estimating the probability of adverse drug reactions.

Clin.Pharmacol.Ther, 1981, 30. p.239-245. 23 C.A.Naranjo. Difficulties in assessing adverse drug reactions is clinical trials. Prog.

Neutro-Psychopharmacol & Biol. Psychiat, 1982, 6. p.651-657. 24 Stephens MD . The diagnosis of adverse medical events associated with drug treatment. Adverse

Drug Reactions and Acute Poisoning Reviews, 1987, 1. p.1-35. 25 Hsu P-H, Stoll RW. Causality assessment of adverse events in clinical trials. II. An algorithm for

drug causality assessment. Drug Information Journal, 1993, 27. p.387-394. 26 World Health Organization causality assessment method. Available at http: //www.who-umc.org/

defs.html, January 2002. 27 N.S.Irey. Tissue reactions to drugs. American Journal of Pathology, 1976, 82. p.617-648. 28 F.E.Karch, L.Lasagna. Toward the operational identification of adverse drug reactions. Clinical

Pharmacology and Therapeutics, 1977, 21. p.247-254. 29 J.Dangoumau, J.C.Evreux, J.Jouglard. M'ethode D'imputabilit'e des effets ind'e sirables des

m'edica-ments. Therapie, 1978, 33. p.373-381. 30 B.Begaud, JLC.Evreux, J.C.Jouglard, G.Lagier. Imputabilit'e des effets inattendus ou toxiques des

m'edicaments: actualisation de la m'ethode utilis'ee en France. Therapie, 1985, 40. p.111-114. 31 S.Blanc, P.Levenberger, J.P.Berger, E.M.Brooke, J.L.Schelling. Judgements of trained observers

on adverse drug reactions. Clinical Pharmacology and Therapeutics, 1979, 25. p.493-498. 32 T.Kitaguchi, N.Tsutomu, S.Shigekazu, et al . Some assessment systems for industry post

marketing adverse drug reaction (ADR) information. IYAKU-HIN KENKYU, 1983, 14. p. 980-993.

77

33 A.Emanueli. A simple algorithm for assessing causality of adverse reactions. Special

Workshop-Industrial. Drug Information Journal, 1984, 18. p.303-306. 34 A.Emanueli. An Algorithm for the Classification of Untoward Events in large scale clinical trials.

Birkhauser Verlag, Basel, 1980, AAS7. p.318-322. 35 J.Venulet, A.Ciucci, G.C.Berneker. Updating of a method for causality assessment of adverse drug

reactions. International Journal of Clinical Pharmacological Therapy and Toxicology, 1986, 24. p.559-568.

36 J.Venulet. Standardized assessment of drug-adverse reaction associations – rationale and experience. International Journal of Clinical Pharmacology, Therapy and Toxicology, 1980, 18. p.381-388.

37 J.K.Jones. Adverse drug reactions in the community health setting: approaches to recognizing, counselling and reporting. Fam Community Health, 1982, 5. p.58-67.

38 M.L.Mashford. The Australian method of drug-event assessment. Drug Information Journal, 1984, 18. p.271-273.

39 J.C.P.Weber. Storage and Retrieval of Data on Adverse Reactions to Drugs. Brighton: Interphex Symposium. 1980.

40 Stephens MD. Assessment of causality in industrial setting. Special Workshop-Industrial. Drug Information Journal, 1984, 18. p.307-313.

41 W.M.Castle. Adverse drug reactions: scope and limitations of causality assessment and the use of algorithms. International Journal of Risk Safety Medicine, 1991, 2. p.185-192.

42 W.M.Castle. Assessment of causality in industrial settings. Drug Information Journal, 1984, 18. p.297-302.

43 J.C.Evreux, E.Loupi, J.Descotes, J.J.Ventre. Evaluation des dossiers d'effets ind'esirables d'origine m'edicamenteuse. Proposition.2. L'imputabilit'e. Therapie, 1982, 37. p.657-670.

44 M.Auriche. Approache Bay'esienne de 1' imputabilit'ees ph'enomenes ind'esirables aux m'edic-aments. Therapie, 1985, 40. p.301-306.

45 G.Lagier, M.Vicens. A.Castot. Imputabilit'e en pharmacovigilance. Principes de la m'ethode apreciative pond'er'ee (MAP) et principales erreurs 'a 'eviter. Therapie, 1983, 38. p.303-318.

46 R.E.Hoskins, S.Mannino. Causality assessment of adverse drug reactions using decision support and information tools. Pharmacoepidemiology and Drug Safety, 1992, 1. p.235-249.

47 V.Maria, R.Victorino. Development and validation of a clinical scale for the diagnosis of drug-induced hepatitis. Hepatology, 1997, 26. p.664-669.

48 B.H.Stricker. Diagnosis and causality assessment of drug-induced hepatic injury. In: Dukes MNG ed. Drug Induced Hepatic Injury. Amesterdan: Else-vier, 1989. p.1-13.

49 E.Loupi, A.C.Ponchon. J.J.Ventre, J.C.I.Evreux. Imputabilit'e d'un effet t'eratog-ne. Therapie, 1986, 41. p.207-210.

50 C.B'enichou, G.Danan. A new method for drug causality assessment: RUCAM. In: Christian B, ed.

78

Adverse Drug Reactions. A Practical Guide to Diagnosis and Management. Chichester: John Wiley & Sons Ltd, 1994. p.277-283.

51 K.K.Jain. A short practical method for triage of adverse drug reactions. Drug Information Journal, 1995, 29. p.339-342.

52 Anon . Taiwan (Triage Application for Imputologists Without An Interesting Name). In: Stephens MDB. Talbot JCC. Routledge PA, eds. Detection of New Adverse Drug Reactions, 4th edn. Macmillan Reference LTD. appendix 3, 2000.

53 R.H.B.Meyboom, R.J.Royer. Causality classification at Pharmacovigilance Centres in European Community. Pharmacoepidemiology and Drug Safety, 1992, 1. p.87-97.

54 清水直容,越川昭三,野村武夫,戸田剛太郎,有害事象の診断学.臨床評価, 2003;30: Suppl XVIII

55 Bert Spilker. Concept of Cause and Effect. In: Guide to Clinical Trials, Chapter 73. Raven Press, 1991.

56 Stephen Senn. Safety data, data monitoring, and pharmaco-epidemiology. In: Statistical Issues in Drug Development, Chapter 23. Wiley, 1997. p.348-50.

57 Bert Spilker. Collecting Adverse Event and Adverse Reaction Data in Clinical Trials. In: Guide to Clinical Trials, Chapter 26. Raven Press, 1991.

58 Guidance for Industry;Good Pharmacovigilance Practices and Pharmacoepidemiologic Assessment. FDA Draft Guidance, May 3,2004.

59 臨床試験のための統計的原則(医薬審第 1047 号平成 10 年 11 月 30 日). 60 椿広計,藤田利治,佐藤俊哉編. これからの臨床試験医薬品の科学的評価－原理と方法.朝倉書店, 1999.

61 日本製薬工業協会医薬品評価委員会臨床評価部会. 治験総括報告書作成の手引. 日本製

薬工業協会資料, 1997. 62 Shein-Chung Chow and Jen-pei Liu. Design and Analysis of Clinical Trial. Wiley, 1998. 63 大橋靖雄,浜田知久馬. 生存時間解析. 東京大学出版会, 1995.

4. 臨床検査値等の検査データに関する問題 64 日本製薬工業協会医薬品評価委員会臨床評価部会. 臨床試験の症例記録用紙作成上の

留意事項. 薬理と治療, 1991; 19(7). p.2423-2372. 65 Christy Chuang-Stein. Laboratory Data in Clinical Trials: A Statistician’s Perspective, Controlled

Clinical Trials, 1998, Vol.19. p.167-177. 66 Norman E. Pitts. Laboratory Parameters and Drug Safety. In: Gene Sogliero-Gilbert, editor. Drug

Safety Assessment in Clinical Trials, Chapter 8. Marcel Dekker, 1993. p.200-15. 67 Bert Spilker. Interpretation of Laboratory and Other Safety Data. In: Guide to Clinical Trials,

Chapter 81. Raven Press, 1991.

79

68 医薬品等の副作用の重篤度分類基準について(薬務局安全課長通知第 80 号(薬案第 80 号)

平成 4 年 6 月 29 日). 69 National Cancer Institute. Common Terminology Criteria for Adverse Events v3.0 (CTCAE).

December 12, 2003. 70 Thompson WL, Brunelle RL, Enas GG, Simpson PJ, Walker RL. Routine laboratory tests in

clinical trials. Indianapolis: Lilly Research Laboratories, Eli Lilly and Company; 1986. See also Cato AE, editor. Clinical trials and tribulations. New York: Marcel Dekker; 1988; and Routine laboratory tests in clinical trials supplemental tables - Update 1990.

71 Chemotherapy Vol.39 No.7,1991 及び日本化学療法学会雑誌 Vol.43 No.11, 1995. 72 Norman E. Pitts. Laboratory Parameters and Drug Safety. In: Gene Sogliero-Gilbert, editor. Drug

Safety Assessment in Clinical Trials, Chapter 8, Appendix 4-5. Marcel Dekker, 1993. p.222-24. 73 河合忠編. 基準値と異常値の間その判定と対策. 中外医学社, 2001. 74 大場康寛. 基準値・基準範囲. 治療 Vol.79 増刊号, 1997. 75 Lawrence K. Oliver, Christy Chuang-Stein. Laboratory Data in Multicenter trials: monitoring,

Adjustment and Summarization. In: Gene Sogliero-Gilbert, editors. Drug Safety Assessment in Clinical Trials, Chapter 6. Marcel Dekker, 1993.

76 How to define, determine and utilize reference intervals in the clinical laboratory. NCCLS Documents C28-P, 1992. p.1-42.

77 Stephen Senn. Safety data, data monitoring, and pharmaco-epidemiology. In: Statistical Issues in Drug Development, Chapter 23. Wiley, 1997. p.340-41.

78 FDA Reviewer Guidance. Conducting a Clinical Safety Reviewer of a New Product Application and Preparing a Report on the Review (DRAFT GUIDANCE), November 22, 1996.

79 Norman E. Pitts. Laboratory Parameters and Drug Safety. In: Gene Sogliero-Gilbert, editor. Drug Safety Assessment in Clinical Trials, Chapter 8, Appendix 6. Marcel Dekker, 1993. p.225-27.

PartⅡ：安全性の統合解析－内容と手順 80 http://www.nsc.nhs.uk/glossary/glossary_ind.htm 81 Gary G. Koch. Meta-analysis of Drug Safety Data. In: Gene Sogliero-Gilbert, editor. Drug Safety

Assessment in Clinical Trials, Chapter 11. Marcel Dekker, 1993. 82 椿広計, 丹後俊郎. メタアナリシス入門:エビデンスの統合をめざす統計手法, 第 1 章. 朝倉書店, 2002.

83 新医薬品の製造又は輸入の承認申請に際し承認申請書に添付すべき資料の作成要領につ

いて(医薬審発第 899 号平成 13 年 6 月 21 日), 別紙 5「2.7.4.2.1 有害事象の解析」. 84 Stephen Senn. Safety data, data monitoring, and pharmaco-epidemiology. In: Statistical Issues in

Drug Development, Chapter 23. Wiley, 1997. 85 Kevin W. Anderson et.al. Statistical Analysis Plan. ASA Biopharmaceutical Report volume10,

80

No.2, Winter 2002.

86 CDISC Submission Data Standards Team. CDISC study data tabulation model implementation guide: Human Clinical Trials. July 14, 2004. Available from: URL: http://www.cdisc.org/

87 「ICH 国際医薬用語集日本語版（MedDRA/J）」の使用について(薬食安発第 0325001 号薬食審査発第 0325032 号平成 16 年 3 月 25 日).

Documents

新医薬品の承認前に求められる 安全性情報を考える...新医薬品の承認前に求められる安全性情報を考える 資料作成者 タスクフォース2

新医薬品の承認前に求められる安全性情報を考える...新医薬品の承認前に求められる安全性情報を考える資料作成者タスクフォース2