診療ガイドラインとは：EBMの3原則より概念を理解する 6枚

2015/10/27

1

診療ガイドラインとは、病気に向き合う

医療者、患者・家族を力づけ、励ます情報源

（京都大学中山健夫先生）

独立行政法人国立病院機構豊橋医療センター歯科口腔外科湯浅秀道

Evidence-based medicine

なぜ、診療ガイドラインなの？

現在は、情報が多すぎる。

背景の疑問（疾患の病態生理など）は、教科書。

最新の臨床の判断に役立つ資料が欲しい。

↓

診療ガイドライン

診療ガイドラインの定義

「日米の防衛に関するガイドライン」などとの用語の混乱も多い。

「診療ガイドライン」という用語は、明確な定義がある。

米国アカデミー医学研究所（Institute of Medicine of the National Academies：IOM）による


「診療ガイドライン」は、「エビデンス」の「システマティックレビュー」と「複数の治療選択肢」の「利益と害の評価」に基づいて「患者ケアを最適化」するための「推

奨」を含む文書である。

この定義が、EBMの3原則に従っているため、この定義で作成された診療ガイドラインは、EBMを実践するために役立つ資料となる。

「診療ガイドライン」は、「エビデンス」の「システマティックレビュー」と「複数の治療選択肢」の「利益と害の評価」に基づいて「患者ケアを最適化」するための「推奨」を含む文書である。

「システマティックレビュー」は、世界中の論文を、系統的・客観的に再現性があるように検索・選択し、「エビデンス」をまとめ、その「エビデンスの確信性の程度」を評価してある論文

システマティックレビュー作成

PICOTS

アウトカム

アウトカム

アウトカム

アウトカム

重大

重要

重大

全体的なエビデンスの確信性(質)誤って、「エビデンスレベル」を研究デザインのみと誤解したり、違う因子を考慮する場合も、具体的なルールな

しで、雰囲気で行われていた。

推奨度の決定方法は、診療カイドラインの中の推奨文語とに違っていたりもした。

診療ガイドライン完成推奨度と推奨文の決定

推奨（例）：抗凝固療法の適応がない癌患者に対して、

非経口的抗凝固療法が有用とされている

↑文章では、推奨しているかわからないものもあった。

診療ガイドライン作成

Clinical Question(CQ)→Analytic Frameworks→Key Questions

診療ガイドラインパネル会議が開かれずあらゆるステークホルダーが参加する

6段階が多く、推奨しているのかしていないのか明確でない方法が多かった

1つの疑問の推奨に複数のSRが必要なことも多い

具体的な作成方法が複雑で、診療ガイドラインごとに、勝手に簡略化して解釈していたため、質の低い診療カイドラインが多かった･･･

？

2015/10/27

2

2005 2006 2007 2008 2009 2010 2011 2015

その状況を危惧して、GRADEアプローチが登場した

世界的に、EBMや診療ガイドラインで活躍の先生たちが集まり、複雑だった作成に対して最低限かつ具体的な作成方法を提示したもの。

2005 2006 2007 2008 2009 2010 2011 2015

世界で最も採用されているルールが、GRADEアプローチ

世界的に、EBMや診療ガイドラインで活躍の先生たちが集まり、ボランティアで作成方法を議論し統一見解を提示したもの。

ついに、2015年、AHAの救急蘇生のガイドラインも参加！

世界的に、EBMや診療ガイドラインで活躍の先生たちが集まり、複雑だった作成に対して最低限かつ具体的な作成方法を提示したもの。

「システマティックレビュー」の作成の全体的なルールは、これまで通りだが、その中の、エビデンスの確信性など混沌としていたルールも、GRADEアプローチによって明確になった。

「システマティックレビュー」は、世界中の論文を、系統的・客観的に再現性があるように検索・選択し、「エビデンス」をまとめ、その「エビデンスの確信性の程度」を評価してある論文

以前は、エビデンスをまとめ（メタ分析）のみだったが、現在は、確信性の程度

を必ず評価。

米国アカデミー医学研究所（Institute of Medicine of the National Academies：IOM）による


「診療ガイドライン」は、「エビデンス」の「システマティックレビュー」と「複数の治療選択肢」の「利益と害の評価」に基づいて「患者ケアを最適化」

するための「推奨」を含む文書である。

この定義に厳密に従っている診療ガイドラインは、質が高く信頼できると考えられるが、具体的な方法が複雑であり間違った方法が広まった。

この定義の診療ガイドラインの作成を、具体的に行いやすいように、最低限のルールをまとめたのが、GRADEアプローチです。

(まだまだ難しいと感じるかも知れませんが、それは、GRADEアプローチが難しいのでなく、診療ガイドラインは、それほど厳密な手順で、社会に対して真摯に行うものと考えて下さい）

GRADEアプローチでは、EBMの3原則に従っているので、このEBMの3原則を理解することが、質の高い診療ガイドラインを

見極めるポイントであるので、解説する。

システマティックレビュー作成

PICOTS

アウトカム

アウトカム

アウトカム

アウトカム

重大

重要

重大

Evidence Profile

全体的なエビデンスの確信性(質)（overall certainty of evidence across outcomes）

重大(critical) なアウトカムのみを検討原則として，重大なアウトカムに関するエビデンスの質の中で最も低いものとする（各アウトカムが同じ方向ならば最も高いもの）

A 「高」/B 「中」/C 「低」/D 「非常に低」

RCTは「高」から、観察研究は「低」から開始し、エビデンスを確信性の程度で紐付きにする

1.研究の限界（risk of bias）2.非一貫性（inconsistency）3.非直接性（indirectness）4.不精確さ（imprecision）5.出版ﾊﾞｲｱｽ（publication bias）

グレードを下げる5要因グレードを上げる3要因

1.大きな効果(large magnitude)

2.用量反応(dose response

gradient)

3.交絡因子(confounders)

アウトカム毎に集めた研究のrisk of biasを評価

効果推定値のアウトカムごとのエビデンスの確信性高(High)／中(Moderate)／低(Low)／非常に低(Very low)

推奨の作成:以下を考慮して判断エビデンスの質利益と害のバランス価値観と好み資源の利用（コスト）

パネル会議前に1回目投票パネル会議でディスカッション必要に応じてもう1回投票

診療ガイドライン完成

アウトカムごとのエビデンス(body of evidence)の確信性を評価

Risk of bias summaryRisk of bias graph

各アウトカムに関する効果推定値

と結果の要約＝メタアナリシス(Forest plot作成)

推奨度と推奨文の決定

推奨（例）：抗凝固療法の適応がな

い癌患者に対して、非経口的抗凝固

療法を行うことを提案する（GRADE

2B，推奨の強さ「弱い推奨」／エ

ビデンスの確信性「中」)

Summary of Findings(SoF)

様々な介入に対する推奨を盛り込む

診療ガイドライン作成

Clinical Question(CQ)→Analytic Frameworks→Key Questions

SRの結果の評価

1.ランダム割り付け順番の生成2.割り付けの隠蔽化3.研究参加者と治療提供者の盲検化4.アウトカム評価者の盲検化5.不完全なアウトカムデータ6.選択されたアウトカムの報告7.その他のバイアス

Evidence-to-Decisionテーブル

診療ガイドラインパネル会議あらゆるステークホルダーが参加する

推奨の強さと方向:強く・弱く/推奨する・推奨しない（しないことを推奨）Strong recommendation FOR an intervention：１ (・・・することを推奨する)Weak recommendation FOR an intervention：２(・・・することを提案する、条件付き)Strong recommendation AGAINST an intervention：１（・・・しないことを推奨する）Weak recommendation AGAINST an intervention：２

（・・・しないことを提案する、・・・しないことを条件付きで推奨する）

1つの疑問の推奨に複数のSRが必要なことも多い

GRADEアプローチによって、混沌としていた診療ガイドラインの作成方法が、たった、1枚

のスライドに収まるようになった

GRADEアプローチも採用している、

診療ガイドラインの基本である、EBMの3原則について、これから学ぼう！

http://whqlibdoc.who.int/hq/2003/EIP_GPE_EQC_2003_1.pdf


http://www.endo-society.org/


http://www.chestnet.org/


http://www.uptodate.com/service/editorial_policy.asp


http://asr.regione.emilia-romagna.it/wcm/asr/eventi/2006/20060504_sem_gradeprier.htm


http://www.health.gov.on.ca/english/providers/program/mas/mas_mn.html


http://www.aezq.de/?set_language=en&cl=en


http://www.survivingsepsis.org/


http://www.thoracic.org/


http://www.acponline.org/


http://www.cochrane.org/


http://www.kdigo.org/


http://www.ests.org/


http://resources.bmj.com/bmj/authors/article-submission/article-requirements


http://www.ahrq.gov/


http://www.sccm.org/


http://www.nice.org.uk/


http://www.kunnskapssenteret.no/index.php?show=38&expand=14,38


http://www.uphs.upenn.edu/cep/


http://www.medizin.uni-halle.de/pflegewissenschaft/index.php?id=346


http://www.provincia.bz.it/sanita/2305/weiterbildung/i/list_i.asp?kki=620000025


http://www.vascularweb.org/


http://www.clinicalevidence.com/


http://ebmg.wiley.com/ebmg/ltk.koti


http://ebm.org.pl/

http://ebm.org.pl/

http://ersnet.org/

http://ersnet.org/

http://wwwsoc.nii.ac.jp/jstmj/


http://www.socialstyrelsen.se/en/


http://cadth.ca/

http://cadth.ca/

http://www.idsociety.org/


http://www.semfyc.es/es/


http://www.childrensnational.org/EMSC/


http://www.sbu.se/en/


http://www.sign.ac.uk/


http://www.tbevidence.org/


http://eapps.ngha.med.sa/ebm/


http://www.asge.org/PublicationsProductsIndex.aspx?id=352


http://www.easl.ch/

http://www.easl.ch/

http://www.cdc.gov/hicpac/guidelineMethod/guidelineMethod.html


http://finohta.stakes.fi/EN/index.htm


http://www.nhshealthquality.org/


http://www.aasld.org/


http://www.ccs.ca/consensus_conferences/index_e.aspx


http://www.worldallergy.org/


https://www.kaiserpermanente.org/


http://www.emcdda.europa.eu/best-practice


http://www.winfocus.org/


http://www.springer.com/medicine/critical+care+and+emergency+medicine/journal/13089


http://asccp.org/

http://asccp.org/

http://www.cbo.nl/en/


http://www.systematic-reviews.com/


















































http://ebm.org.pl/

http://ebm.org.pl/

http://ersnet.org/

http://ersnet.org/





http://cadth.ca/

http://cadth.ca/

















http://www.easl.ch/

http://www.easl.ch/





















http://asccp.org/

http://asccp.org/





2015/10/27

3

1. 最適な臨床決断には入手可能な最適なエビデンス、理想的にはシステマティック・レビューのエビデンスを必要する。

2. EBMは、エビデンスが信頼できるものかどうか、すなわち、診断検査、患者の予後、治療選択肢についてどれほど確信をおけるものかを提供する。

3. エビデンスだけでは臨床決断をするのに決して十分ではない。

３原則EBMの3原則：第3版：Users‘’ Guides to the Medical

Literature: A Manual for Evidence-Based Clinical Practice, 3rd Edition(2015)

• 都合のよい論文と都合のよいアウトカムを使わないこと

• エビデンスの質を研究デザインのみで決定せずに、その研究が適切に行われたか、研究間に違いがなかったかなどを考慮すること

• 利益のエビデンスのみで推奨を決めずに、利益と害のバランス、患者の負担についても考慮すること

３原則 EBMの3原則と同じなので、一緒に勉強できる！

3原則を図示すると、以下のスライドになります。本日の説明は、このスライドに集約されるので、終了後に、このスライドをみて、思いだせるように頑

張って説明いたします！

最後に、このスライドがでてきます(^^)





世界中の研究・論文を検索して、丁寧に適格基準で選定したら、4論文がありました

大切なポイントであるので、X薬の虫歯予防の仮想研究例を使って解説する。たとえば、X薬の虫歯予防に4個の論文があったとする。

これを見ると、虫歯菌の抑制には効果がありそうだが、虫歯予防の効果はなさそうなことがわかる。

表：X薬の虫歯予防の仮想研究例―――――――――――――――――――――――

虫歯菌抑制虫歯予防―――――――――――――――――――――――Aihara論文効果あり効果なしNangou論文効果あり効果なしYuasa論文少し効果あり少し効果ありTange論文効果なし効果なし―――――――――――――――――――――――Yuasa 論文： Yuasa et. al. : Clinical CariesJournal 118. 2014. 30-38. （仮想例）

ランチョンセミナー：EBMに基づく虫歯予防リスクを選ばないX薬の有用性について

どこかの大学の虫歯（カリオロジー）の教授がランチョンセミナーで、「Yuasaの研究より、虫歯予防に効果があった。参考文献：Yuasa et. al. : Clinical Caries Journal 118. 2014. 30-38.」と、英語の論文で説明した場合、信用してしまうのではないだろうか。

表：X薬の虫歯予防の仮想研究例―――――――――――――――――――――――


2015/10/27

4

捏造、していません表：X薬の虫歯予防の仮想研究例―――――――――――――――――――――――


エビデンスに基づくと称して、都合の良い論文の都合の良い結果を恣意的に選んでないか？

システマティックレビュー

都合の良い解説

エビデンスに基づくと称して、都合の良い論文の都合の良い結果を恣意的に選んでないか？

いわゆる、システマティックレビューをしましょう。

２つのルールを守ると、都合の良い論文のみを選んでないという保証になります。

１．エビデンスを検索するための系統的な方法を用いる。検索式を決めて、何度検索しても、同じような検索結果になる！

２．エビデンスの選択基準を明確に記載すること。たくさん検索された場合、選択する必要があるが、適当に選ぶのではなく、ルールを決めておくということ！

意味は理解したけど具体的に、どうするのか？メタ分析で、各論文の効果（数字）より、統合した効果推定値（数字）を算出する

相対危険度 5.60 メタ分析・meta analysis点推定値より、信頼区間！点推定値にだまされるな

そうやって、選んだ論文から、

この2つの論文の効果の大きさを統合する。実は、単純に複数の結果を合計するだけでは、結果の方向が変わってしまう（シンプソンのパラドックス）。

論文１症例数改善数％

A治療 160 48 30

B治療 20 4 20

論文２症例数改善数％

A治療 40 24 60

B治療 80 40 50

統合症例数改善数％

A治療 200 72 36

B治療 100 44 44

メタ分析とは？よって、症例数とイベント数などを考慮して、各論文に重み付けを行って計算する。

メタ分析・meta-analysis

ちなみに・・・、このパラドックスを使って、逆にサブグループ解析で分類することで結果の方向を逆に結論することも可能である・・・（＾＾；。

各論文を単純に統合するのではない

各論文に重み付けして統合

2015/10/27

5





この、5.60という、効果推定値の数字は、真の値に対して、どの程度の確信があるか？

5.60

新薬なので、効くはずだ！頑張ろう！！

たとえば、同じランダム化比較試験という研究デザインでも、

次の治療を、封筒を透かして覗いたり・自分の治療を知っているので、頑張ったり、しているなど、偏りがあると（risk of biasと呼ぶ）、

その結果の信頼性が下がりますね

http://ideahack.me/article/309

たとえば、有名なジャーナルに掲載された研究でも、結果がばらついたら・・・

真の値に対する確信性の程度が大きいは？

0.0

メタ分析：5.60

0.0

メタ分析：5.60

もし、そのアウトカムの結果を構成する、いろいろな論文にバイアスが多く存在していたら・・・、

もし、論文間で、結果が異なっていれば・・・、

もし、最初に想定した臨床の疑問の患者層と、選択した論文の患者層が異なっていれば・・・、

もし、症例数の小さな、あまり精確でないデータを、メタ分析と称して、集めて症例数が大きくなって有意差がでただけだったら・・・、

もし、有意差がなかったからと報告されなかった論文や、都合が悪いので論文に書かなかったアウトカムが、たくさんありそうな状況だったら・・・、

上記の「５要因」などを使って（グレードダウンの5要因と言います）、利益のエビデンスの効果推定値の確信性の程度を評価するこの５要因の基準が明確でない診療ガイドライン作成方法は、良くないので注意！

もし、そのアウトカムの結果を構成する、いろいろな論文にバイアスが多く存在していたら・・・、

もし、論文間で、結果が異なっていれば・・・、

もし、最初に想定した臨床の疑問の患者層と、選択した論文の患者層が異なっていれば・・・、

もし、症例数の小さな、あまり精確でないデータを、メタ分析と称して、集めて症例数が大きくなって有意差がでただけだったら・・・、

もし、有意差がなかったからと報告されなかった論文や、都合が悪いので論文に書かなかったアウトカムが、たくさんありそうな状況だったら・・・、

毎回、これらの5つの要因をみるのは面倒。よって、その要因をまとめて１つのみを見てすぐに理解できる、4段階の判定をおこなうと便利。この判定の結果が

エビデンスの確信性- certainty of the evidence -エビデンスの質 ← 研究の質という用語との混乱を避けるため、使わないようになってきている。

高い A

中 B

低い C

非常に低い D

2015/10/27

6

メタ分析で算出した効果推定値という数字が一人歩きしないように、その数字には、必ず確信性の程度という評価という紐をつけておく

確信性の程度

5.60[4.42,6.77]

効果推定値の確信性の程度（グレード）を下げる５要因

グレードダウンの５要因を、傾けて・・・

エビデンスの確信性

これらの要因の一覧を横に並べて、表にしたのが、エビデンスプロファイルと呼び、メタ分析の結果とエビデンスの確信性（エビデンスの質）のみを、紐付きにして、抜粋したのが、SoF表と呼ぶ

これまで、多く書かれていたのが、「エビデンスレベル」という用語です。これは、厳密には、間違ってないのですが、ほとんどが、誤解されて使われているので、本邦では、99.9％が間違っていると思って良いでしょう。間違いのポイントは、2点あります。

1. 「研究デザイン」のみで分類して、たとえば、どれだけいい加減に作られたランダム化比較試験でも、RCTだからというだけで、エビデンスレベルを高くする間違いをしていました。

2.

• 試験間での不一致、または絶対的な効果量がきわめて小さいと、レベルは試験の質、不正確さ、間接性（試験のPICOが質問のPICOに合致していない）に基づいて下がることがある。効果量が大きいか、または極めて大きい場合には、レベルは上がることがある。

←こんなところに・・・

５要因と同じことが書かれている

2015/10/27

7

これまで、多く書かれていたのが、「エビデンスレベル」という用語です。これは、厳密には、間違ってないのですが、ほとんどが、誤解されて使われているので、本邦では、99.9％が間違っていると思って良いでしょう。間違いのポイントは、2点あります。

1. 「研究デザイン」のみで分類して、たとえば、どれだけいい加減に作られたランダム化比較試験でも、RCTだからというだけで、エビデンスレベルを高くする間違いをしていました。

2. エビデンスは、必ず、都合のよい論文のみにしないため、body of evidenceとして、まとめたエビデンスを利用すべきです。そして、そのエビデンスの確信性を評価します。

よって、個々の論文に、「エビデンスレベル」をつけません。たとえば、「Yuasa 2015（エビデンスレベル 1a）」などの書き方の多くは間違っています。もっとも、言葉を定義して、2015年で「Individual Study Level Quality: No.

of Studies With Each Quality Ratinga」として、risk of biasを示しているCPGもある。





確信性の程度（エビデンスの質）が大きい

5.60 Body of evidenceである利益に対するメタ分析の効果推定値が大きい

しかし、

「エビデンス」の「システマティックレビュー」と「複数の治療選択肢」の「利益と害の評価」に基づいて「患者ケアを最適化」するための「エビデンスの確信性の程度」と「推奨」を含む文書である。

もちろん、エビデンスに基づくのが原則ですが・・・

利益のエビデンスのみで判断して良いのか？

確信性の程度（エビデンスの質）が大きい

5.60 Body of evidenceである利益に対するメタ分析の効果推定値が大きい

しかし、害などがあれば・・・

Haynes RB, BMJ 2002;324:1350

想定する読者である医療者の臨床経験

エビデンスの確信性の程度

利益と害のバランス価値と好み

資源・コスト

いろいろな要因で、医療消費者も含めた議論を行い、推奨の程度を決定します

できれば、患者の好みなども、単なる意見でなく、好みを調査したエビデンスが望ましい

そして、本来は、連続している推奨度を、わかりやすくするため「強い・弱い」に、診療ガイドラインパネル会議で合議します。

EBMのコンセプトで考案されている診療ガイドライン作成方法• GRADE：GRADEアプローチ＜最も普及している＞• USPSTF：米国予防医学専門委員会＜予防系が一部採用か＞• AHA：米国心臓協会＜基本的に、AHAのみ＞• Minds 2014＜日本の一部のみ＞

EBMのコンセプトで考案されていない診療ガイドライン作成方法• Minds 2007（level of confidence は、私案）

Do not offer the

interventionQuality of evidence

GRADE

Strong Against

4 levels (high, moderate,

low, very low)

USPSTF

Grade D

USPSTF

Grade B

USPSTF

Grade A

3 levels (high, moderate,

low)

AHA

Class III

AHA

Class IIa

AHA

Class I

3 levels (A, B, C)

（JAMA-UG3eより改変）

Minds 2014 Minds 2014

行わないことを推奨する

Minds 2007

D　　　　　　　　C2 C1 B A

Level of Confidence

Individualized decisionsOffer the intervention to

all or almost all

GRADE

Weak Against

GRADE

Weak in Favor

GRADE

Strong in Favor

USPSTF

Grade I

USPSTF

Grade C

AHA

Class IIb

行うことを推奨する

行わないことを弱く推奨する

行うことを推奨する

Minds 2007：使用は望ましくないが、現在も同じコンセプトのCPGが多いので記載

2015/10/27

8

「強い」・「弱い」推奨の意味は？

推奨度定義臨床医にとって

強い推奨=推奨=

介入による望ましい効果（利益）が望ましくない効果（害・負担・コスト）を上回る、または下回る確信が強い

ほぼ全員が推奨される介入を受けるべきである。

弱い推奨=提案=

介入による望ましい効果（利益）が望ましくない効果（害・負担・コスト）を上回る、または下回る確信が弱い

意思決定支援は、患者が自身の価値観や好みに基づいて意思決定を行うのにおそらく有用だろう。

推奨文：○○患者に対して、A薬よりB薬を提案する。

これを、「A薬を使ってはいけない」と誤解しないで欲しい。ある臨床医・ある患者は、「B薬よりA薬を好む」かも知れない。推奨の強さは、より多くの方がエビデンスなどより、その介入・治療を選ぶと考えられるので、それを推奨するという程度を示していると考えるとよい！

推奨文：脳卒中の低リスク患者に対して、標準薬に対して新薬Ｄの実施をしないことを提案する。

（GRADE 2B：推奨度弱い/エビデンスの質中)

診療ガイドラインは、理解しやすい短文となっています

ポイント：この推奨文に対しての解説が、「Yuasaらの報告では、D薬が、血圧を20mmHg下げ、Nangoらの報告では、D薬が、死亡率低下が相対危険度2.3である」などのように、都合のよい論文とアウトカムをならべて書かれるのではなく、一つの「エビデンスプロファイル」というエビデンスをまとめた表などを利用して、

推奨文とそれを支持するエビデンス (body of evidence：複数のSRが必要なことも多い) との対応関係が明確である

ことが大切です。

EBM3原則！

エビデンスに基づくと称して、都合の良い論文の都合の良いアウトカム（結果）を恣意的に選んでないか？

表：X薬の高血圧治療の仮想研究例―――――――――――――――――――――――

血圧低下脳梗塞予防―――――――――――――――――――――――A論文効果あり効果なしB論文効果あり効果なしC論文少し効果あり少し効果ありD論文効果なし効果なし―――――――――――――――――――――――C論文：Yuasa: Clinical Hart Journal 118. 2015. 30-38.;仮想例

効果推定値の信頼区間を確信性の程度で紐付きにする

禁止：都合の良い解説と、その論文がいい加減なRCTでも、RCTだからエビデンスレベルが高いとするな！

0.0

メタ分析：1.60 =メタ分析：1.60

0.0

各論文から得られた値

システマティックレビュー・メタ分析：1.60

メタ分析の代表値のみを、安易に信頼して都合良く使ってないか？

1.60の確信性左＞右

1.60

利益のエビデンスだけで、臨床決断してないか？

エビデンスだけではない・集団として、

利益と害の最適なエビデンス(正味の利益と確信性の程度)

負担・好み・価値（バラツキ程度）

臨床的経験（プライマリケア医・

専門医）

コスト・リソース（個人・社会）

大切なアウトカムごとに結果を統合し、関係性・frameworkを確認

body of evidence

EBM３原則

Health & Medicine

診療ガイドラインとは：EBMの3原則より概念を理解する 6枚