有効性評価に基づく肺がん検診ガイドライン
VI.考察
1. 有効性評価
肺がん検診については、無作為化比較対照試験による死亡率減少効果が示されておらず、また公共政策として行っているのもわが国とハンガリーのみである。1970年代に米国を中心に行われた4報の無作為化比較対照試験の成績でいずれも検診の成績を否定する結果が報告されて以来、肺がん検診に関係する研究は諸外国からは報告されないようになり、また国内からの英文雑誌への投稿に関しても、困難な状況が続いた。その結果、死亡率減少効果を示す証拠についても限定されており、また研究の質について問題を残している。肺がん検診全般に関する系統的総括は1件行われているが92)、2000年までに報告された対照群を設けた比較試験を評価対象としており、その後にわが国から報告された多数の重要な研究が含まれていないため、今回の検討では、現在の国内の評価としては不適当と考えられた。
胸部X線検査と高危険群に対する喀痰細胞診併用法については、1970年代に行われた検診を評価した海外での研究と、1990年代に行われた検診を評価した国内の研究の二つに区分される。肺がん検診の従来の評価としてはこの70年代に行われた4報の無作為化比較対照試験の評価が主に行われてきた。しかしこれらの研究は、たとえ無作為化比較対照試験であっても、コンタミネーションやコンプライアンスなどの研究実施上の精度の問題が報告されていたり19)、あるいはこれらの精度指標が未報告である。また最も重要な割り付けについても詳細が未報告なものや、割り付け因子の分布上両群に差がない93)と報告されていながらも両群の罹患率や組織型割合から割り付けの不完全さが推定されている94),95)ものもある。また当時と現在の医療水準の格差の問題がある。肺がん外科治療成績に関する複数の時系列研究によると、過去30年間で手術関連死亡は3.8-14.3%から0.9-2.8%と大幅に減少し、I期のみならずIIIA期の生存率も向上している96),97),98),99),100)。術後管理に加えて、術前の十分な情報に基づいたより正確な病期診断により、適切な治療が行われるようになったためと解釈されており、70年代と現在との間には無視しがたい肺がん医療の格差が存在する。このように数々の問題点をはらんだ70年代の欧米での研究の結果を現在の日本に応用することには問題が大きいと考えられる。
一方、90年代に行われた検診を評価した日本の6報の症例対照研究に関しては、いずれも同じような研究結果が報告されている。症例対照研究には、セレクション・バイアスを初めとした様々なバイアスの混入が理論的には起こりうる。しかしこれらの研究については、症例の把握の仕方(死亡小票による把握と診療録レビューによる確認)や、症例と対照の検診受診機会の均等性(症例と対照が同一名簿の同一地区に存在)や、最大の交絡因子である喫煙の補正(喫煙歴でマッチングし、多変量解析で補正)、症状受診を除外する解析や、医療機関等での検診以外の胸部X線検査を変数に加えた解析、検診受診者を基本集団とすることでセルフセレクション・バイアスを制御するなど、さまざまなバイアスを補正する試みがなされている。もちろん一つの研究でこれらすべてが補正されている訳ではなく、これらの試みによりバイアスの混入を軽減できたとしても、完全に制御できるものでもない。しかしいずれも比較的近似したオッズ比を示しており、再現性を示している。したがって個々の研究に制御しきれないバイアスが混入していたとしても、そのために結果が覆るということは考えにくい。以上より、1990年代に行われた国内の研究の結果を重視すべきであると判断した。
低線量CT検診に関しては、死亡率減少効果に関する直接的証拠として1970年代に行われたMayo Lung Projectと比較した報告が1報だけで、信頼性の高い研究はいまだ報告されていない。間接的証拠についても、発見率・生存率・臨床病期に関する報告のみである。国内からの報告では、男性と女性における肺がん発見率があまり変わらない64)。このことは、罹患率の低い女性において、バイアスが強く働いていることを示しており、発見率や生存率での評価が危険で、直接的証拠による評価が不可欠であると考えられる。以上より、低線量CT検診に関しては、現状では証拠が不十分であると判断される。