遺伝子の配列情報を取得することができる
相同遺伝子の検索を行うことができる
遺伝子配列のアラインメントと系統樹の作成を行うことができる
タンパク質のドメイン構造を取得し、機能予測をすることができる
遺伝子について深く知るための第一歩はその配列を取得することです。配列を眺めているだけではなかなか機能はわかりませんが、種間の相同分子、あるいは同じ種の他の遺伝子と保存されている配列を調べることで、ある程度機能を予測することが出来ます。なぜなら、タンパク質において重要な機能を持つ部分というのは保存された立体構造を持っており、保存された立体構造を持っている領域は保存された配列を持っている、という、いわゆるAnfinsenのドグマという原理が多くの場合成り立つからです。
そこで、今回はまず、自分が選んだ遺伝子のヒトのアミノ酸配列の情報を、NCBI Geneを検索して取得します。次に、ドメイン構造に関する情報をInterProを使って取得します。各ドメインの機能に関する情報をリンク先から取得し、ドメイン構造からそのタンパク質の機能を説明してみましょう。
次に、そのタンパク質のorthologueが他の種にあるかBLASTを用いて検索してみましょう。
さらに、複数の種から取得したアミノ酸配列を比較してアラインメントと系統樹を作成してみましょう。
NCBI geneを検索して自分の遺伝子のページに飛ぶ。
ページの内容を見ていろいろな情報を得る。
代表的なアイソフォームのタンパク質配列のFASTAファイルを得る(Send to:のリンクからFileを選べば良い)。
InterProにFASTA形式の配列を投げてドメイン構造を調べる。
BLASTを用いて、ヒト(Homo sapiens)、ニワトリ(Gallus gallus)、ゼブラフィッシュ(Danio rerio)、ショウジョウバエ(Drosophila melanogaster)、線虫(Caenorabditis elegans)、分裂酵母(Schizosaccharomyces pombe)、出芽酵母(Saccharomyces cerevisiae)におけるorthologueの配列を検索する
orthologueが見つかった場合はmultiple fasta形式のファイルを作成し、Clustal Omegaを使ってそれらの配列とのアラインメントと系統樹を作成する。BLASTの結果と合わせ、それぞれのorthologueのドメイン構造について考察する。
AlphaFold Protein Structure Databaseを参照して、類似の配列が類似の構造を持っていることを確認する。
NCBI GeneのURLを貼ってください。
代表的なアイソフォームのアミノ酸配列のFastaファイルを添付してください。
ヒトにおいて最も発現量の高い組織を記入してください。
InterProで調べたドメイン構造のスクショを添付してください。
ドメイン構造からタンパク質の機能を簡潔に説明してください(単一のドメインからなるタンパク質の場合はそのドメインの特徴を記入してください)。
orthologueがどのような種で見られるか記述してください。一部のドメインのみ保存されている場合はそれについて記載してください。
アラインメントファイルを添付してください。
配列のアラインメントとドメイン構造を比べて気づいたことを簡潔にまとめてください。
AF2の構造を見ての感想を簡潔に述べてください。
課題の提出先はこちら