こちらは羊土社実験医学 2020年5号に掲載される「新型コロナウイルスSARS-CoV-2の比較ウイルス学と比較ゲノム解析」に関して、執筆に関するよもやま話のメモ書きです。基本重要なことはすべて記事に書いていますが、執筆の背景や、書こうかどうか迷って書かなかった話をいくつか取り上げます。
・このレビューのお話を頂いたのは2月の中旬でした。私はコロナウイルスの専門ではないので躊躇したのですが、電話で相談した宮沢孝幸先生に押されて引き受けることにしました(それ以外の理由は一番最後に記しています)。引き受ける際、私がぼんやり考えていたプランは、3月上旬に参加を予定していた、アメリカのウイルスメタゲノム解析関連のKeystoneシンポジウムで招待講演者の一人だったEdward (Eddie) HolmesにSARS-CoV-2に関する色々な話を聞いて、それらをベースに書いてみれば面白くなるのでは程度に考えていました。Eddieとは昨年、東京大学医科学研究所で河岡義裕先生が開催されたシンポジウム(Influenza and Other Infections 2019)で同席し、休憩時間に色々と話して、その後メールでのやりとりもあったので、彼に直接会って色々と話しも聞けるだろうという目論見でした。ただ、このあとCOVID-19が更に広がり、私自身の勤務先の大学の方針からもあり、出張を直前でキャンセルし、Keystoneシンポジウムに参加できなかったため、結局このプランは実現できませんでした(これは現在のアメリカの状況を考えると東海大学の英断だったのかもと思います)。
・SARS-CoV-2の遺伝子構造や変異そのものについて大きく触れていません。これは事態が刻々と変化することもあり、そういった即時的な情報は雑誌に掲載する内容としてはあまり向かないだろうということと(Nextstrainを見たほうが動的だし分かりやすいですよね)、SARS-CoV-2の遺伝子構造自体にまだ議論がいくつもあるからです(下にも少し書いていますが、論文によって表記が揺らいでいます)。SARS-CoV-2の遺伝子については、NYTに掲載されたCarl Zimmerの記事はさすがです、英語ですが、興味のある方はご覧ください。
・本総説のひとつのメッセージとしては、コロナウイルスは自然界にたくさん存在していて、私たちヒトだけではなくて、様々な哺乳類に感染しているということです。ヒトでは主に風邪症状を引き起こす4種、そしてSARS, MERS, 今回のSARS-CoV-2の3種が主に知られていますが、動物のものを含めると100種は超えます(系統樹でも全部は示していません)。そのため、SARS-CoV-2を調べるためにはヒトに感染するコロナウイルスだけではなくて、動物に感染するコロナウイルスについても研究することが、結局はSARS-CoV-2の性状の解明にもつながると信じています。
・私自身がこのウイルスについて初めて知ったのは、武漢の”海産市場”の関係者で広がっているウイルス性肺炎があるらしい、というのをtwitterで見てからでした。ちょうど魚などから様々な新規ウイルスが見つかっているという最近の研究を読んでいたので、魚のウイルスがヒトにも疾患を引き起こすのが出たのか、などと明後日の方向に考えていました。あとになってこの海産市場は海産物以外の生き物も取り扱っていたとのことですし、また直接は関係ないのかもという情報でした。
・どの研究groupが一番初めにSARS-CoV-2のゲノムを決めたのか、という点についてはいくつかニュース記事などをみると面白い指摘もあり、たしかにGISAIDなどを見てみると、そのとおりなのかもしれませんが、このあたりの議論はややこしいこともあって(すみません。。)、publishされた論文として初めて出てきたWu et al Nature 2020としました。
・SARS-CoV-2のゲノムの構造について、特に3’末端近くの短いORF由来の遺伝子のいくつかについては、その遺伝子の有無が論文によって異なります(本当に蛋白質を発現するかわかりません)。短いORFから発現した遺伝子が機能するのかどうかというは、今後の研究のkeyの一つだと思います。
・マレーセンザンコウという生き物から今回の新型コロナウイルスSARS-CoV-2様のコロナウイルスが見つかったという研究について、これも少なくとも4つの研究グループがほぼ同時期に発見しています。GISAIDに配列を載せている研究groupは3つ(1つはNature誌、1つはCurrent Biology誌、1つはまだbioRxivのみ)、GenBankに登録しているgroupは1つ(これは論文が見つかりませんでした)です。私が調べた時点では、マレーセンザンコウ由来のコロナウイルスの配列について、GenBankに登録されていた配列は部分配列しか読めておらず、GISAIDの別なgroup(Natureに投稿されていた論文)からdownloadしないと完全長は使えませんでした。ただ、これは現在はGISAIDのいくつかの配列がGenBankに登録されたようです。
・本文にも書きましたが、マレーセンザンコウは今回の直接のアウトブレイクには関係しないと考えられます。ただ、このようにコウモリ由来のコロナウイルスが他の生物の集団に拡散し、その生物集団内で保持され続ける可能性はあると思います。
・SARS-CoV-2が人工的に作られたウイルスかもという説が出ましたが(今でもあるのかも)、こちらはあまり真正面に取り組みませんでした(実験医学の読者でこれを信じている人は少ないだろうとも願い。。)。人工的につくられたことを否定するのは実は相当困難なので、また理屈を持って説明しても、納得してくれないんじゃないかと思い。。まあ、いいかと思っています。個人としてはほぼ100%人工的につくられたものではないと思っています。
・変異について、具体的に1年で24箇所くらいの変異を蓄積するという書き方ですが、これはどのくらいの変異があるのかを想像してほしくて具体的な数字を上げたものです。これは、ウイルス集団のなかで残っている株がそれぞれオリジナルと比較すると24程度の突然変異が残っているというだけで、集団中にはもっと多くの突然変異が存在します(これは集団サイズに依存します)。
・RNAウイルスなのにproofreading(複製時のミスを防ぐ)機能をもった酵素(nsp14)を持つのには驚きました。
・校正後に、SARS-CoV-2の組み換えについて詳細な解析を行った論文が出ました。組換え頻度が非常に多いウイルスのようです(Boni et al. bioRxiv 2020)。そのため、単純に系統樹を作成してSARS-CoV-2の起源について議論をすると間違うかもしれません、ご注意ください。そのため、本総説で示した図3についても組換えがたくさん入っている可能性のある配列を使っています。ただ、逆に組換えを起こしていない領域というのも分からず、とりあえず配列類似度でクラスタリングした程度になっています。また、アウトグループとしてシナミズトカゲ由来のコロナウイルスを使いましたが、これが本当にoutgroupとして適切なのかは議論があると思います(Shi et al Nature 2018を見て、まあ使えるかと思った程度です)。シナミズトカゲ由来のコロナウイルス以外はすべて哺乳類・鳥類が由来で、それ以外の生物に感染しているコロナウイルスは、このシナミズトカゲ以外に私が知る限りでは発見されていません。また、コウモリは哺乳類で最も多くの種が存在する生き物で、系統樹の説明で、本当は細かい種名も入れるべきだったのかなと後悔しています(細かくなりすぎるかと思って配慮しましたが、十分その他も細かい部分が多いですから、ここも細かくしていても良かったのかも)。
・ウイルスが”強毒化”した中国武漢を中心に広がったL型、オリジナルのS型というような表現がマスコミ等のニュースでもネットでも見ました。一方でこれに反対する意見もあります。本文でも触れましたが、現時点で言えるのは、特定の塩基変異・アミノ酸置換がウイルスの"強毒化"に関連するのかというのは実験結果も無いし、具体的には分からないということです。ただ、可能性を全く否定するものではありませんが、議論できるような実験結果もない状態のため断定はできず、とにかく分からない、というのが現時点での私の一応のスタンスです。ただ、本文で触れたように、初期に生じた変異ですので、その後の指数関数的な広がり方をした際に、それぞれ集団ごとに頻度の違いがあっても、ウイルスの性質の違いにということがなくても偶然起こり得るものだと思います。また、そもそも、なにをもって”ウイルスが強毒化した”というのかも難しいです。例えば、SARS-CoV-2よりもSARS-CoV(-1)やMERS-CoVのほうが感染した場合の致死率が高いですが、無症状なヒトも感染できるようになったSARS-CoV-2のほうが、大規模感染を引き起こして最終的な死者数などを見ると、ある意味” 強毒化”していますよね。この議論については時間があったら別途エボラウイルスの変異について研究したときの経験談をshareするかもしれません(しないかもしれません)。
・そのL型、S型の話で塩基がTとCに対応しているって、コロナウイルスはRNAウイルスだからUとCに対応じゃないの?という点に気づいたあなたは鋭い!これは論文の表記に合わせました。
・BCGの接種との関連の可能性についてはこの時点で情報がなかったため触れていません。個人的にはこの因果関係については、正直分かりません。ウイルスが入り込んだ時期なども異なり、またウイルスが広がった経路や各国の初期対応、検査体制や医療体制については国ごと、そして国内での地域差などもあり、とかく、様々な点が異なっているので、単純には議論できないかと思っています。
・いくつものSARS-CoV-2関連の論文がbioRxivなどのプレプリントサーバーに掲載されたり雑誌に投稿されたりしています。私もいくつか興味を持って読んだり、また査読を引き受けたりしますが、かなり粗悪なものが多いのも事実です。この判断は、多少この分野に詳しくないとわからないのですが、ではなぜ粗悪なのか、どこが誤っているのか、もしくは自明なのか、などをきちんと論証するのは結構大変で、時間もかかります。多少おかしな、と思う論文が拡散しているのを見る場合もあって、さてどうしたらいいのかと思うときはあります。それこそ学会などの有志groupの出番なのかもしれませんが、これは感染症の流行動態と密接には関わらないことが多いので、いまは最優先事項でもないのかもしれません(そういった意味では科学者コミュニティの今後の問題でもあると思います)。
長くなりましたが、いくつか補足的な内容を触れました。私の研究スタイルとしては、自分にできることを自分が分かる範囲で研究する、というほうが好きなのですが、今回の事態に関してはそういった話をしている場合でもないかと考えました。共著者の宮沢先生らのウイルス学研究者との共同研究を通して感染症分野にも携わり、また、2017年の第6回生命医薬情報学連合大会(IIBMP 2017)では「感染症研究とバイオインフォマティクス」というシンポジウムを伊藤公人先生と共同で開催し(本シンポジウムでは現在いまクラスター対策班の中心人物の一人の西浦博先生にもご講演いただきました)、2019年の日本進化学会年大会 第21回 北海道大会でも「大規模DNAシーケンス時代のウイルス進化研究」というシンポジウムを開催し(こちらでもクラスター対策班の大森亮介先生にご講演いただきました)、このように感染症研究に関して縁があって関係者が頑張っている姿を見て、自分が分かる範囲で情報発信するのは責務かと思い引き受けました。この原稿を引き受けてしまったために、他の件を色々と待ってもらって、しわ寄せをしてしまった関係者の方々に深く陳謝します。また、ウイルス学会の学会誌「ウイルス」にも新型コロナウイルスにも多少関連する内容を執筆する予定です。本総説を踏まえた上で、更に別な角度からSARS-CoV-2の話を取り上げようかと思います。そちらも公開予定です。また、総論執筆だけではなくて新型コロナウイルス関連の研究もはじめました、こちらも近い将来、お話ができるように頑張りたいと思います。
2020年4月6日
中川草