セミナー予定

講師   高橋智栄氏(名古屋大情報)

題目 ベイズ学習による格子タンパク質模型のデザイン

日時 716(金) 16:00-   Zoomによるオンライン開催です。

参加申し込みはこちらからお願いします。自動返信メールでZoomの情報が送られます。

https://forms.gle/EQmQbAfZwyZWJttC7

要旨

タンパク質デザインとは、タンパク質立体構造予測の逆問題であり、基礎科学的には立体構造とアミノ酸配列の関係を通常とは逆のアプローチで解明するという意義を持つ。与えられた立体構造を低温で唯一の基底状態として実現する配列が、デザイン問題における正解となる。一般に、タンパク質デザインの計算は、配列をサンプルするごとにその平衡状態としての立体構造を探索するという2つのループを持つ。すなわち、タンパク質デザインは計算量的には立体構造予測よりも困難な問題なのである。この状況に対して今回我々は、代表的な統計的学習手法であるベイズ学習に基づき、上述した内側の構造探索を含まない新しい統計力学的なタンパク質デザイン手法を提案する。我々はタンパク質の進化に関する独自の仮説を考案し、配列の事前分布に反映する。さらに、タンパク質の表面の水の効果をグランドカノニカル分布を用いて導入する。結果として、2次元の格子HPモデルに対しては、我々の提案する手法は高い確率で唯一の基底状態をデザインすることに成功した。しかしながら、3次元格子HPモデルでの結果は2次元の結果に比べて低いパフォーマンスとなった。3次元の格子モデルは現実のタンパク質と同じ20種類のアミノ酸を用いた結果も含む。我々はさらに、水の化学ポテンシャルとタンパク質表面のアミノ酸残基(モノマー)数の間の強い線形性も発見した。我々の手法は、内側の構造探索を含まないことにより計算時間の圧倒的な短縮ができるという優位性を持つ。また我々の手法はベイズ学習と統計力学による一般的な形式に基づくため、格子タンパク質以外のモデルへの拡張も容易であると考えられる。またこの、構造探索を含まないデザインは、Rosettaなどの現実のタンパク質のデザインに成功している計算ソフトの方法に対応しており、それらの手法を原理的に説明しうる理論となっている。