スウェーデン王立科学アカデミーは2024年のノーベル化学賞を以下の3名に授与することを決定した。
◯デビッド・ベイカー, ワシントン大学、ワシントン州シアトル、米国. ハワード・ヒューズ医学研究所、米国
「計算によるタンパク質設計」
◯デミス・ハサビス Google DeepMind、ロンドン、英国
◯ジョン・M・ジャンパー Google DeepMind、ロンドン、英国
「タンパク質構造予測」
以下は受賞理由(プレスリリース)の翻訳
彼らはタンパク質の驚くべき構造のコードを解読した
2024年のノーベル化学賞は、生命の巧妙な化学ツールであるタンパク質に関するものです。デビッド・ベイカーは、まったく新しい種類のタンパク質を構築するというほぼ不可能と思われる偉業を成し遂げました。デミス・ハサビスとジョン・ジャンパーは、タンパク質の複雑な構造を予測するという50年来の問題を解決するAIモデルを開発しました。これらの発見は、非常に大きな可能性を秘めています。
生命の多様性は、タンパク質が化学ツールとして持つ驚くべき能力を証明しています。タンパク質は、生命の基礎となるすべての化学反応を制御し、駆動します。また、タンパク質はホルモン、シグナル物質、抗体、さまざまな組織の構成要素としても機能します。
「今年認められる発見の1つは、素晴らしいタンパク質の構築に関するものです。もう1つは、50年来の夢である、アミノ酸配列からタンパク質の構造を予測するという夢の実現に関するものです。これら2つの発見は、大きな可能性を切り開きます」と、ノーベル化学委員会のハイナー・リンケ委員長は述べています。
タンパク質は一般的に20種類のアミノ酸から成り、生命の構成要素ともいえます。2003年、デイビッド・ベイカー氏はこれらのアミノ酸を使って、他のタンパク質とは異なる新しいタンパク質を設計することに成功しました。それ以来、同氏の研究グループは、医薬品、ワクチン、ナノマテリアル、小型センサーとして使用できるタンパク質など、想像力豊かなタンパク質を次々と生み出してきました。
2 つ目の発見は、タンパク質構造の予測に関するものです。タンパク質では、アミノ酸が長い紐状に連結され、折りたたまれて 3 次元構造を形成します。この構造がタンパク質の機能に決定的な影響を与えます。1970 年代から、研究者はアミノ酸配列からタンパク質構造を予測しようと試みてきましたが、これは非常に困難でした。しかし、4 年前に驚くべき進歩がありました。
2020年、デミス・ハサビス氏とジョン・ジャンパー氏は、AlphaFold2と呼ばれるAIモデルを発表しました。このモデルにより、研究者が特定した2億個のタンパク質のほぼすべての構造を予測することができました。この画期的な成果以来、AlphaFold2は190か国200万人以上の人々に利用されています。無数の科学的応用の中で、研究者は抗生物質耐性をより深く理解し、プラスチックを分解できる酵素の画像を作成できるようになりました。
タンパク質がなければ生命は存在できません。タンパク質の構造を予測し、独自のタンパク質を設計できるようになったことは、人類にとって最大の利益です。
プレスリリースの付属資料を以下に示した.
AlphaFold2 はどのように機能しますか?
AlphaFold2 の開発の一環として、AI モデルは既知のすべてのアミノ酸配列と決定されたタンパク質構造についてトレーニングされています。
1. データ入力とデータベース検索
構造が不明なアミノ酸配列が AlphaFold2 に入力され、データベースで類似のアミノ酸配列とタンパク質構造が検索されます。
2. 配列分析
AI モデルは、多くの場合異なる種の類似のアミノ酸配列をすべて整列させ、進化の過程でどの部分が保存されたかを調べます。
次のステップでは、AlphaFold2 によって、三次元タンパク質構造内でどのアミノ酸が相互作用する可能性があるかを調べます。相互作用するアミノ酸は共進化します。
一方が帯電している場合、もう一方は反対の電荷を持っているため、互いに引き付けられます。一方が撥水性 (疎水性) アミノ酸に置き換えられると、もう一方も疎水性になります。
この分析を使用して、AlphaFold2 は、構造内でアミノ酸が互いにどの程度近いかを推定する距離マップを作成します。
折りたたみ構造
+電荷を有するアミノ酸と−電荷を有するアミノ酸は互いに
引きつけられる.
疎水基を有するアミノ酸同士は疎水相互作用で引きつけられる.
アミノ酸同士の距離を濃淡で表したマップ
3. AI 分析
反復プロセスを使用して、AlphaFold2 は配列分析と距離マップを改良します。AI モデルは、トランスフォーマーと呼ばれるニューラル ネットワークを使用します。これは、注目する重要な要素を識別する優れた能力を備えています。他のタンパク質構造に関するデータ (ステップ 1 で見つかった場合) も利用されます。 neural betwork
ニューラルネットワーク(neural network)
人間の脳の神経回路の構造を数学的に表現した数理モデルで、機械学習やディープラーニング(深層学習)に関連する技術.
2024年度のノーベル物理学賞を受賞した.
4. 仮説的構造
AlphaFold2 は、すべてのアミノ酸のパズルを組み立て、経路をテストして、仮説的タンパク質構造を作成します。これは、ステップ 3 で再実行されます。3 サイクル後、AlphaFold2 は特定の構造に到達します。AI モデルは、この構造のさまざまな部分が現実に対応する確率を計算します。
タンパク質の立体構造を知るためには, X線結晶構造解析、NMR装置による解析、低温電子顕微鏡による解析などいくつかの方法を駆使し, たいへん骨の折れる作業が必要である. ところが, 数年前, 複数の研究グループが, AI技術である深層学習を用い, 実験で検証済みの構造を学習させることで, 構成アミノ酸からタンパク質の形状を予測するという研究を開始した. 2018年, 元々「囲碁ソフト」を作っていたGoogle DeepMindがタンパク質の形状を正確に予測するためのソフトウェア「AlphaFold」を開発中であることを明かにした. さらに, 2020年には「AlphaFold 2」が十分な精度の成果を生み出したことを公開し, 生物学研究に衝撃を与えた. その1年後には, AlphaFoldのオープンソース版を公開し, 誰でも使えるようにした, そこには人体に存在するほぼすべてのタンパク質を含む, 35万のタンパク質の予測構造が収録された. 2022年には, 200万以上のタンパク質構造が公開され. 現在は「拡散モデル」というアルゴリズムを組み込み. 更に進化させたAlphaFold 3が開発されている.
2024ノーベル化学賞を理解するには, 今年のノーベル物理学賞を同時に理解する必要がある. しかし, ニューラルネットワーク(人工知能)の部分は「ブラックボックス」として, ノーベル化学賞の概要が何となく分かればよいと思い, Googleの翻訳機能を利用して受賞理由を読んでみた.
読みながら, 41年前(1983)に「薬学部におけるコンピュータ教育の必要性」を説明した際の先生方の反応を思い出した. 1979年から大阪大学蛋白質研究所が蛋白質構造データ(PDB)の配布を開始していたので, 喜んで賛同してくれることを期待したが, 結果は意外なものであった. 学部の情報処理(講義, 実習)が必修科目として軌道に乗ったのは2003であった. その間, 「コンピュータは論文原稿執筆用のワープロ(WordやChemDraw)として利用できればよい. それ以上は必要ない」という意見が大勢を占めていた.
コンピュータが人間の脳に代わって今回のような仕事をしてくれるようになると予測できた分子生物学者はいなかったと言っても過言ではない. 今回の受賞が薬学領域のコンピュータアレルギーのショック療法になることを期待したい.
(2024.10.31)