研究論文における「瑣末なミス」があらわすもの

2018年9月13日

京都薬科大学 田中 智之

先日、Proc. Natl Acad. Sci. USA誌(PNAS誌)において日本の研究論文のcorrectionがあり、Retraction Watchにおいて記事として取り上げられました。それに関連してtwitterでコメントしました。文字数の関係もあって意を尽くせないので、改めて取り上げたいと思います。ここでは、特定の研究室のあり方を問うことではなく、論文の学術誌における評価、そしてそれを受け止める研究者コミュニティのあり方を議論することを目的としています。

冒頭の事例については以下のリンクが一次資料になります。

http://www.pnas.org/content/112/13/4086.long

http://www.pnas.org/content/115/33/E7883

Retraction Watchではいわゆるmega correctionの例として、今回の訂正を取り上げています。もとの論文(6ページ)に匹敵する分量のcorrection(4ページ)が受理されたことを記事のタイトルにしています。

https://retractionwatch.com/2018/08/07/a-2015-pnas-paper-is-six-pages-long-its-correction-is-four-pages-long/

訂正のきっかけとなったと想像されるPubPeerのポストは下記の通りです。

https://pubpeer.com/publications/C4D85860F12DA1F1B0F4A6D39A9F0D

不正の可能性についてはここでは議論しません。PubPeerにポストした方は疑いをもっている(一種の告発行為)と思いますが、研究機関が調査する可能性は低いと思います。訂正論文が海外の学術誌側に受理されたことをもって研究不正ではないと判断することは、いくつかの理由から必ずしも適当とはいえませんが、現状ではそのように取り扱うことが多いと思います。

Retraction WatchはPNAS誌の編集者にインタビューしていますが、「論文の主要な発見に実質的な影響を与えるものではない」というコメントが出されています。果たしてこのコメントは妥当なものと言えるでしょうか。

ライフサイエンスにおいてサポートデータがコアのデータと同様に重要であることは、研究者に共通した認識だと思います。ひとつの実験結果がストーリー全体を支えるという華麗なケースは限られます。一方で、逆に、素晴らしいストーリーと受け止められていた仮説が、ひとつの実験結果から見直されることがあります。これはライフサイエンスの研究対象が複雑であることに起因しており、一見してすっきりした仮説が、細かな条件の違いにより揺らいでしまうという経験をもつ研究者は多いと思います。

研究論文の審査ではしばしば査読者からの執拗な追加実験の要請があります。研究者がこの要請に懸命に対応するのは、自分の立てた仮説をできるだけ説得力ある形で示したいからです。査読者が不満をもつのは、論文のデータが十分ではないことを意味します。即ち、別の仮説も同時に成立する余地があるのでは?という合理的な問いかけが生じているということです。ひとつの仮説を多角的に検証することは、それだけ別の仮説が成立する可能性を減らすことにつながり、結果的にその研究の質を上げることにつながります。サポートデータはどうでも良いという態度は、こうした査読のプロセスを意味のないものにしかねません。

Mega correctionが許容される背景には、学術誌の編集部と査読者を含む研究者との認識の乖離がありそうです。堅実な研究よりも、目を引く研究をという傾向は、NatureやScienceをはじめとする有名誌で顕著です。論文の度重なる撤回や、真偽をめぐる論争が頻発することは学術的として望ましいことではないはずですが、有名誌にとってはむしろ読者の注目を集める機会として利用されています。

多角的な検証を経ていない研究は、たまたまそのときの条件によって生じた偶然の産物である可能性があります。そういうものには再現性は期待できません。研究者があっと驚くような、それでいて一旦主張されればもっともなような気がする、そんな研究を有名誌は望んでいるように思いますが、そういう成果の中には単なる偽陽性もしばしば含まれることになるでしょう。

Nature誌やScience誌に発表された社会科学研究に再現性はあるか?

「瑣末なミス」がたくさん起こる背景には何があるでしょうか。「瑣末なミス」がたくさんある論文の中で「正しい」とされる実験結果は信用しても良いのでしょうか。第三者が告発した重複した画像や、著者が修正した箇所のみが間違っていて、他のデータは注意深く点検されているということは信じて良いのでしょうか。

例えば、下記の論文は同じパネル内の画像の重複、あるいは誤りが二度にわたって訂正されています。画像の配置ミスはそれだけでも著者が注意深くないことを意味していますが、二回も同じ図で間違いをするということはありえるでしょうか。不注意という言葉では説明できない根深い問題があると思います。また、そのような訂正を受け入れる学術誌は、学術的な厳密性を軽く見ていると思います。この論文は日本語の国内誌で紹介されているのですが、著者はここでも、第三の間違いというべき取り違えをしています。

https://www.ncbi.nlm.nih.gov/pubmed/18981302

https://www.ahajournals.org/doi/10.1161/CIR.0000000000000225

Mega correctionの例をもうひとつ紹介します。こちらは、ディオバン事件において千葉大学からその責任を指摘されたものの、これを放置しているラボにおける基礎研究論文です。ここでは、提起された疑義を解消するために必要なオリジナルの実験記録がないこと、また、論文に記載した実験手法とは違う方法を用いて再現性を確認したことが述べられています。しかも、その追加実験はオリジナルの論文の著者ではなく、共著者ではない別の研究者が遂行したことが記されています。

https://www.nature.com/articles/nature07027

https://www.nature.com/articles/nature13003

同じ手法で当初の実験結果が得られないことは再現性がないことを意味します。また、再実験に主要な役割を果たした研究者が共著者ではないというオーサーシップの取り扱いも異常なものです。研究の再現性やオーサーシップに関するコンセンサスが、このグループでは共有されていないことが分かります。実験手法を変えてもとの実験結果のストーリーが正しいということを主張することが認められるのであれば、先陣争いの激しい分野であれば、サポートデータは適当に切り上げて投稿することを優先する方が良いということになってしまうでしょう。こうしたcorrectionを容認する学術誌の編集部もまた、一般の研究コミュニティとは異なる価値観を持っていることが推測されます。

こうした問題を取り上げると、PNAS誌の編集部の回答と同様に「重箱の隅をつつく」という批判があるのですが、科学研究といういとなみはそもそも小さなブロックを正確に積み上げるような地味な活動ではないのでしょうか。いくら魅力のある仮説であっても、再現されないような知見には意味がありません。

最大の問題は同業者である研究者が、こうした異常な状況を良しとしていることです。有力誌への掲載は、大きな研究業績として高く評価されますが、一方で後からこうした杜撰な問題が発覚したところで、研究費を返却する義務はありません。せめて拙い研究慣行を改めて欲しいと思いますが、実際のところはそのあたりが曖昧なまま、再び大きな予算を獲得するケースがしばしばあります。「些細なミス」が頻発するラボには明らかにデータの取り扱いに関する深刻な問題があります。これは再現性のある研究を遂行することを妨げているはずです。ミスコンダクトの調査は悪意のある不正に目が向きがちですが、当該ラボが質の高い研究を行うための再生の機会と捉えることもできるはずです。

ここまで議論して明らかとなったことは「研究の質を問う」機会が失われているということです。インパクトファクター(IF)を中心とした歪んだ数値主義(IFは学術誌に対する数値評価で、個々の論文の価値を示すものではありません)、獲得研究費による研究者の格付けといった新たな価値観の広がりが、「研究の質」を軽視するという問題を生んでいる可能性があります。誤解を招くといけませんが、ここでいう「研究の質」とは、学術的な深みや先見性といった高尚な話ではありません。実験データをノート等にきちんと記録、整理しているのか、再現性を確認することを怠っていないかといった基本的な品質管理のことを指しています。Retraction Watchが撤回論文やcorrectionに着目している理由のひとつはこの問題だと思います。わが国においても撤回やcorrectionを契機として研究グループが積極的に自らの研究慣行を見直すこと、そしてそれを監視、サポートする存在としてのアカデミックコートが必要であるといえるでしょう。