DOCUMENT & TOOLS

ガイドライン作成者向け資料・ツール

診療ガイドライン作成FAQ

診療ガイドライン作成FAQ

診療ガイドライン作成に関する質問内容と、質問に対するMindsの専門チームによる返答内容について、必要な匿名化を行った上で公開しています。
※( )内の数字は『Minds診療ガイドライン作成マニュアル』(ver. 2.0)のページ番号です。ご確認いただく際は最新版をご参照ください。

診療ガイドライン総論

手引き2007と手引き2014とMindsの選定基準
改訂の場合に2007版のマイナーチェンジで継続するか、2014版に新たに準拠するよう変更するかは策定組織に任される事項とは存じますが、委員会で方針を協議する上で今後の展開を考慮して示唆いただけるご意見がございましたらお伺いしたく存じます。
ワークショップの内容は、Minds作成の手引き2007版の多くを踏襲していますが、内容の整備を進め、Minds作成の手引き2014年版としてまとめました。また、Mindsでは診療ガイドラインを系統的に検索し、AGREE IIに基づいた評価を実施し、作成プロセスから信頼性が高いと考えられる診療ガイドラインを選定していますが、この評価選定の基準を変更することはありません。今後、基準の変更を行う際には、事前に作成グループのご意見を伺うステップを踏みます。
診療ガイドラインのテーマとしての介入
多くの診療ガイドラインは特定の疾患をテーマとされていますが、介入をテーマとした診療ガイドラインを作成しても良いのでしょうか。
Mindsは診療ガイドラインを次のように定義しています。「診療上の重要度の高い医療行為について、エビデンスのシステマティックレビューとその総体評価、益と害のバランスなどを考量して、患者と医療者の意思決定を支援するために最適と考えられる推奨を提示する文書」。疾患ベースであることを診療ガイドライン作成の前提とはしておりません。特定の介入についてのエビデンスを評価、統合していく方向性の中で、患者にとって重要なアウトカムを考慮し、診療現場での患者と医療者の意思決定を支援することを目標とした推奨を作成するのであれば問題ないと考えられます。

準備

作成団体間の協定書 (2016年3月15日掲載)
作成母体を、3団体とすることに決定しました。そこで、今後の負担分担、版権等に関して、協定書を作成する必要が出てきました。その協定書の雛形や他のガイドラインの例などありますでしょうか?
協定書の雛形、他のガイドラインの協定書の例ともにMindsでは用意しておりません。
診療ガイドライン作成の準備の方法に関しては『Minds診療ガイドライン作成マニュアル』の第2章の中で次のような項目をガイドラインの中に記載されることを提案しています(p.11-29)。

  • 作成に参加する学会間の関係
  • 作成手順・スケジュールの方針
  • COIの管理の方針
  • 作成費用の準備の方針
  • 作成組織の編成の方針
これらをご参考に作成組織でご検討ください。
外部評価委員の構成 (2016年3月15日掲載)
学会でガイドラインを作る際に、作成に関与しない学会員を外部評価委員に入れてもよいのでしょうか?スコープの評価など、専門家でなければわからない部分も多いため、学会員を含んだ外部評価委員の構成を考えております。
外部評価を行う目的を決め、その目的に相応しい人を外部評価委員として選定することを推奨しています。第三者の立場での評価を目的とする場合などは学会員以外からの評価を受けることが望ましいですが、内容に関する専門的な観点からの評価を目的とする場合などは学会員を外部評価委員として選定しても良いと考えられます。

スコープ

臨床的特徴、疫学的特徴のシステマティックレビュー (2016年3月15日掲載)
CQ以外に教科書的記述が必要となります(例:疾患の定義、疫学など)。その場合も、システマティックレビューに関しては2人が独立で行う必要があるでしょうか?
臨床的特徴、疫学的特徴など、CQ以外の教科書的な内容をまとめる際にはSRをする必要はありませんが、SRを実施して推奨を提示する場合はCQとして取り上げることをお勧めします。
重要臨床課題作成における患者に関する情報源
現在、臨床的課題についてはアンケート調査や患者の会なども情報源にしていると考えてよろしいでしょうか。
CQを作成する前段階として、様々な資料を前提とした重要臨床課題を明確にします。重要臨床課題を作成するに当たって、予備的な文献検索(スコーピングサーチ)を実施して、課題の概略を把握する方法もあります。また、学会員の意見を広く求める方法をとることもあります。作成グループが重要と考える場合には、アンケート調査や患者会なども情報源にしてください。
重要臨床課題作成方法
重要臨床課題の作成方法についての詳細をお教えいただけないでしょうか。出典、Webでもマニュアルでも最新の基準資料をご教示いただければ幸いです。
重要臨床課題を含むスコープは、診療ガイドラインの作成プロセスが開始される前に、作成委員会の協議によって作成されます。その際、原案を作成した段階で、診療ガイドラインの利用が想定される医療者、患者や、診療ガイドラインによって影響を受ける行政、団体など、すべての利害関係者の意見を聞くプロセスを経て最終決定する方法がとられることもあります。
重要臨床課題を作成する際には、次の内容を記載することを推奨します。
①取り上げるトピックの背景を記述します。
②a.介入に関して患者と医療者が行う意思決定の重要ポイントを取り上げます。
②b.患者アウトカムの改善が強く期待できる課題を取り上げます。
③課題ごとに現状を記載し、可能な限り裏づけとなる統計データ等を示します。
CQにおける対象 (2016年3月15日掲載)
診療アルゴリズムを年齢によって分ける予定ですが、アルゴリズムごとに対応するCQを作る必要があるでしょうか?
診療ガイドラインのCQとその推奨は、臨床現場における意思決定を支援する目的で作成されるものであり、明確に定式化される必要があります。対象とする集団が異なる場合には別のCQとされることをお勧めします。
CQにおけるアウトカムの設定① システマティックレビュー中のアウトカムの変更 (2016年3月15日掲載)
スコープで設定するPICOのアウトカムは、後のシステマティックレビュー(SR)によって答えが見いだせなければ意味がないことになると考えられますが、場合によっては、設定したアウトカムに対する答えが論文中に見いだせない場合も生じうると思います。SRを行った結果、あるいはその途中でアウトカムの設定に間違いがあったと判明した場合には、どのようにすればいいのでしょうか。
スコープ作成を行なう際には、スコーピングサーチとして、診療ガイドライン、SR、RCTなどを対象とした文献検索による予備的な情報収集を実施することをお奨めしています。この情報収集を経て、推奨作成を行なうために必要な情報を含み、SRが実施可能であると考えられるCQを設定します。また、CQを確定する前に、ガイドライン作成グループとSRチームとが共同でCQの妥当性について検討するという方法もあります。
SRを実施する中で、当初設定した「患者にとって重要なアウトカム」に対する「代替アウトカム」を取り上げることが妥当であると判断し、そのことをSRチームがガイドライン作成グループに提案して、承認が得られた場合、アウトカムを入れ替えることも考えられます。その際は透明性の確保が求められます。ただし、原則として、CQで設定したアウトカムを検討した研究が見つけられなかった場合は、アウトカムを変更せず、見つけられなかったことを診療ガイドラインの中に明記してください。この情報は、将来的に研究が必要とされる内容をまとめる「Future Research Question」を作成する際の重要な情報になります。
CQにおけるアウトカムの設定② 同一の対象に対する介入ごとのCQの設定 (2016年3月15日掲載)
検討しようとしている介入Aは、疾患の症状改善を意味する3つのアウトカムに、また、介入Bは、先のアウトカムと重複する2つのアウトカムに対して有効だと想定されます。この場合、介入を中心にすえて、それぞれのCQにするということでよろしいでしょうか。
1)複数の介入・要因曝露の設定(p.39-40)
 1つのCQとして、患者・状況を特定し、複数の介入・要因曝露を挙げ、それらを比較し、どれが有用か、推奨されるかを検討します。
2)益と害を含んだ複数のアウトカムの設定(p.40-43)
 どの介入・要因曝露が有用か、推奨されるかを検討するための観点として、介入・要因曝露の結果として生じる患者アウトカムについて、益だけではなく、害も含めて複数のアウトカムを設定します。
 
 以上のことから、診療の流れの中で重要な課題となる患者・状況を明確に特定し、有用な介入・要因曝露を明らかにするために、益と害双方を含んだ複数のアウトカムを挙げて、1つのCQとして設定することが望ましいと考えられます。

システマティックレビュー

二次スクリーニング後の一覧表 (2016年3月15日掲載)
「二次スクリーニング後の一覧表」に挙げるのは二次スクリーニングで取捨選択され残った文献のみでしょうか?また、この一覧表は、二名のシステマティックレビュー担当者が独立してそれぞれ作成することになるでしょうか?
二次スクリーニング後に残った文献を挙げます。二次スクリーニング後に「バイアスリスクの検討などで後に除外された論文」について、「除外」の列に印を、そして、「コメント」の列にその理由を記載します。独立した二名以上で一次スクリーニングを行い、その結果を照合させて、一次スクリーニングのまとめを作ります。次に、独立した二名以上で、二次スクリーニングを行い、その結果を照合させて、二次スクリーニングのまとめを一つ作ることになります。
個々の文献のエビデンスレベル
今回のワークショップや意見交換会では、エビデンス総体という概念をご教示いただいたのですが、個々の文献にエビデンスレベルを明示しておくことは必要でしょうか?
エビデンス総体の評価を参考に推奨が作成されることを推奨します。個々の文献については、研究デザインやバイアスリスク等の評価を行うことが奨められます。エビデンス総体の評価とは別に、個々の文献の研究デザインやバイアスリスク等の評価につきましては、作成グループが必要と判断する場合には明示してください。
観察研究のエビデンス評価① 評価方法
観察研究のエビデンスの評価についてのやり方など、どこかにのっていませんでしょうか。インターネットなど、何か資料があれば幸いです。
あるアウトカムに対する個々の観察研究のエビデンスの評価につきましては、ワークショップで配布した資料集にありますように、RCTと同様にエビデンスの強さを下げる項目としてバイアスリスク(選択バイアス/実行バイアス/検出バイアス/症例減少バイアス/その他)や非直接性とあわせて、エビデンスの強さを上げる項目として用量-反応勾配、効果減少交絡因子、効果の大きさを評価することを推奨します。次に、あるアウトカムに対する観察研究を含んだエビデンス総体の評価としては、エビデンスの強さを下げる項目としてバイアスリスク、非一貫性、不精確、非直接性、その他のバイアスといったドメインと、エビデンスの強さを上げる項目として用量-反応勾配、効果減少交絡因子、効果の大きさの3つをまとめたドメインを検討することを推奨します。
これらの項目は、位置付けに多少の違いがあるものの、現在の標準的な評価項目と考えられます。
・IOM(Institute of Medicine)は、観察研究を含んだエビデンス総体に対する複数の評価方法を比較しており、どの方法でもほぼ同じ項目で評価していることが分かります。
http://www.iom.edu/Reports/2011/Finding-What-Works-in-Health-Care-Standards-for-systematic-Reviews.aspx
・IOMの中でも取り上げられているGRADE working groupのエビデンス評価の考え方・方法が示された論文リストがあります。
・IOMの中でも取り上げられているGRADE working groupのエビデンス評価の考え方・方法が示された論文リストがあります。
http://www.gradeworkinggroup.org/publications/JCE_series.htm
※観察研究からエビデンスの評価を上げる、という点については次の論文があります。
Guyatt GH, et al..GRADE guidelines: 9. Rating up the quality of evidence.J Clin Epidemiol. 2011 Aug 1 (http://www.jclinepi.com/article/S0895-4356(11)00184-3/fulltext)
観察研究の評価では特に、疫学専門家の助言を求めるのが望ましいと考えられます。
観察研究のエビデンス評価② エビデンスの強さを上げる尺度
RCTでエビデンスの評価を下げる項目は(-2)(-1)(0)と評価されますが、観察研究で評価を上げる項目は同様に(+2)(+1)(0)と記載して良いでしょうか?
エビデンスの強さを上げる項目として、0、+1、+2と記載することを推奨します。
観察研究のエビデンス評価③ エビデンスの強さを上げる基準
評価を上げる項目で、RR>2または<0.5はlarge, RR>5または<0.2はvery largeと評価されますが、mean difference で示される連続データ(continuous data)の場合、largeとvery largeは何を基準に判断すれば良いでしょうか?
提示しているのはGRADE working groupが考えている1つの目安です。前グループは、効果の大きさを基本的にRRで測っており、mean differenceの基準は示していません。何がvery large、largeになるかについては、作成グループでご判断ください。
観察研究のエビデンス評価④ エビデンスの強さを上げる基準
診療ガイドライン作成ワークショップ資料集に、「観察研究(2件以上)のエビデンスの強さの評価を中あるいは強にあげることもある」と記載されておりますが、観察研究が1件のみの場合は、弱と判定し、エビデンスの強さを中や強にあげないと考えてよいでしょうか。
エビデンスの強さを上げる項目に該当すると考えられる場合、内容によっては件数にかかわらずエビデンスの強さを上げることは可能です。
観察研究のエビデンス評価⑤ コホート研究
ガイドラインを作成する前に、コホート研究を行いました。これを、システマティックレビューの検索外の文献として、推奨文の作成に活用しようと考えております。その場合、この研究のエビデンスの強さはどのように考えればよろしいでしょうか。
コホートであれば、Cが初期評価であり、さらに内容の吟味が必要となります。ただし、文献の選定基準は文献の検索前に設定するのが望ましいと考えられます。また、推奨を出せるほどのエビデンスがないと判断される場合には、推奨を出さないということも検討されると良いでしょう。
観察研究のエビデンス評価⑥ 症例報告
システマティックレビューを行ったところ、作成したい診療ガイドラインのテーマに特化したデータを分析した研究が非常に少ない状況でした。エビデンスがなかったために、専門家の意見や、他の学会等でテーマに特化していない、一般集団を対象として推奨している介入を用いて、推奨文を作成せざるを得ないものがあります。その場合、推奨の強さは、1または2とだけ表現するのか(つまり、エビデンスの強さは判定しない)、あるいは、1Dまたは2Dのように表現してよいのか、いかがでしょうか。
「専門家の意見や、他の学会等でテーマに特化していない、一般集団を対象として推奨している介入」はエビデンスではありませんが、症例報告があれば1Dもしくは2Dにできます。
最終的には診療ガイドライン作成グループで協議して決定してください。
観察研究のエビデンス評価⑦ 対照群のない研究のみの場合 (2016年3月15日掲載)
いただいているCQの設定では、I/Cが治療あり(I)と治療なし(C)で予後を比較検討するように指示があるのですが、検索した文献には、治療なしとの比較はなく、治療後の再発群と非再発群の比較や、反応群と非反応群の比較などの文献しかありません。こういう場合どうしたらよいでしょうか?
治療群が検討される論文のみが収集された場合、治療群と治療なし群の比較はできません。ただし、定性的なシステマティックレビューにあわせて、CQで設定されたアウトカムが治療群でどのように観察されたかを検討し、推奨を作成することはできます。その際、治療効果に対する不確実性が大きいため、エビデンス総体の強さは「D」となります(p.104)。
また、収集された研究の中で設定した介入の比較がなく、推奨作成における重要な情報が得られなかったなど、将来的な研究が必要と判断される場合は、Future Research Questionにその内容を記載します(p.107)。
設定したCQに対して適切な論文が検索されなかった、検索されたすべての論文の質が高くなかったと判断される場合は、CQを取り下げることも可能です(p.107)。
非直接性の評価 ガイドラインの対象と研究の対象との違い
システマティックレビューを行ったところ、研究によっては対象者の平均年齢だけが論文に記載されており、年齢の範囲が記載されていないので、診療ガイドライン適用の対象としたい群を含んだデータなのかがわからないものもありました。著者に問い合わせても、海外の研究者の場合、返答がなかったものもいくつかあります。対象が含まれているのかどうかが全くわからないという場合は、「非直接性」の①研究対象集団の違いという観点から-2、研究対象者には取り上げたい対象が1名以上含まれていることが確認されたが、取り上げたい対象を含んだ集団であるというだけで、対象に特化したエビデンスではない場合は、「非直接性」の①研究対象集団の違いという観点から-1、というように判断してよいでしょうか。
検討されている通りで良いと考えます。最終的には診療ガイドライン作成グループで協議して決定してください。
統計パッケージと統合モデル (2016年3月15日掲載)
診療ガイドライン作成ワークショップで教わったRによる統計と別の統計パッケージで実行した統計の数字が微妙に異なっているのはどのような原因が考えられるのでしょうか?
ワークショップで紹介したRの関数は、特段の指定をしない場合、ランダム効果モデルの「分散逆数法」で計算していますが、様々なモデルを用いることができます。数値の差異はこの差に起因していると考えられます。「分散逆数法」はアウトカムが二分変数・連続変数のどちらの効果指標の統合にも用いることができます。実行したいメタアナリシスとモデルの特性を考慮し、利用するモデルを選択してください。
メタアナリシスができない論文しかない場合 (2016年3月15日掲載)
与えられたCQに対する検索論文で、メタアナリシスできない論文(症例集積や症例報告のような論文、またはレビューなど)しかない場合、どういう扱いにしたらよいでしょうか?
メタアナリシスが実施できない場合も、メタアナリシスが実施できる場合と同様に、個々の研究や、エビデンス総体を評価する定性的なシステマティックレビューを行います(p.73-75)。システマティックレビューをした結果、将来的な研究が必要であると判断される場合は、Future research questionとしてまとめることもあります(p.107)。

推奨

全体的なエビデンスの強さの評価
「ガイドラインパネルが検討する推奨草案」では「重大なアウトカム全般に関する全体的なエビデンスの強さ(いずれかに○)」という項目がありますが、「重大なアウトカム」とは、「重大なアウトカム:7-9点」を指しているのでしょうか。もしそうなら重要なアウトカム(4-6点)は含まないと解釈されますが、それで良いのでしょうか?もしそうなら「重大なアウトカム全般に関する全体的なエビデンス・・・」の「全般」とか「全体的」という言葉が不要のように思います。
CQ決定の際のアウトカムの重要性の評価を原則的に変更しません。ただ、推奨作成の段階で、さらにどのアウトカムを重視するかを決定しても構いません*。この重大なアウトカム全般のうち、特に推奨決定において重視したアウトカムのエビデンスの強さを全体のエビデンスの強さとして評価する、もしくは、重大な複数のアウトカム全般を見回してそれら全体でエビデンスの強さを評価する、という方法がとられています。これらを参考にして、作成グループで方針をご検討ください。

*ここでは重大なアウトカムが複数あることを前提にしています。
「推奨度」と診療ガイドライン
CQにエビデンスレベルは評価できますが推奨度のつけられないものがあります。推奨度無し/エビデンスレベルのみの表示はガイドラインの基本理念から逸脱するものでしょうか?
逸脱しないと考えられます。ただし、ワークショップで紹介したエビデンスの強さ*は、検索・収集・評価・統合されたエビデンスが(CQに対する)推奨を支持する強さを示す指標です。どのような方法でエビデンスの強さをつけるかについては、作成グループで協議の上で決定し、診療ガイドラインに記載すると良いと考えられます。

*新しい作成の手引きでは「エビデンスの強さ」と表現しています。
推奨度決定方法
推奨を決定する方法は委員会で独自に作成した疾患特異的な合意形成方法を用いる事も可能でしょうか。 もちろん評価が高い既存の方法に基本的に沿ったものを想定しております。
標準的・慣習的な合意形成法は、第三者から評価を受けた場合に方法の妥当性について比較的疑いを持たれにくい方法ですが、それらが唯一の方法ではないと考えられます。したがって、疾患特異的な方法を用いても良いと考えられます。どのような合意形成方法を採用する場合にも、作成グループで検討し、採用した方法を明示することが重要です。
部分改訂における推奨の強さの基準の並存
先行版では、個々の文献にエビデンスレベルを表記し、それにもとづいて推奨の強さを表記していましたが、新しいCQを追加して作成する部分改訂版では、エビデンス総体の考え方にもとづいたエビデンスの強さ、推奨の強さをつけようと考えています。そのために、1つの診療ガイドラインの中に複数の基準が並存することになってしまいますが、そのような場合の適切な対応方法はありますか。
具体的な記載事例についてまだ把握しておりませんが、①診療ガイドラインの部分改訂としての位置づけを明記し、②エビデンスの強さと推奨の強さの基準が推奨ごとに区別されていることが明確に記載できていれば問題ないと考えます。また、利用者によるレビューで検証する方法もあります。最終的には作成グループで方針を決定してください。

最終化

構造化抄録の公表
個々のエビデンス評価は当然必要と思いますが、構造化抄録の公表の要否についてご教示いただければ幸いに存じます。
構造化抄録の作成・公表は必須ではありません。ただし、構造化抄録を作成しない場合でも、文献の特性をまとめる表があると有用と存じます。
外部評価の結果の記載
ガイドラインの作成過程で外部評価委員にAGREEⅡで評価をいただいたのですが、この評価の合計点数等はガイドラインの本文に載せる必要はあるのでしょうか?
評価の合計点数等は、必要ではありませんが、記載しても良い内容です。
『Minds診療ガイドライン作成マニュアル』では、外部評価を行った場合は、「外部評価まとめ」として、その方法、評価者、ツール、経過、結果などを診療ガイドラインの中に記載することをお奨めしています。 最終的にどのような内容を診療ガイドラインに記載するか、作成グループでご検討ください。

診療ガイドライン公開後の取り組み

部分改訂における推奨の強さの基準の並存
先行版では、個々の文献にエビデンスレベルを表記し、それにもとづいて推奨の強さを表記していましたが、新しいCQを追加して作成する部分改訂版では、エビデンス総体の考え方にもとづいたエビデンスの強さ、推奨の強さをつけようと考えています。そのために、1つの診療ガイドラインの中に複数の基準が並存することになってしまいますが、そのような場合の適切な対応方法はありますか。
具体的な記載事例についてまだ把握しておりませんが、①診療ガイドラインの部分改訂としての位置づけを明記し、②エビデンスの強さと推奨の強さの基準が推奨ごとに区別されていることが明確に記載できていれば問題ないと考えます。また、利用者によるレビューで検証する方法もあります。最終的には作成グループで方針を決定してください。