系統解析の前準備の話

タクソンサンプリング

系統解析をするメンバーを選ぶことは非常に難しく経験を要します。本来的にはメンバーのバランス、系統間の配列データのバランスなど複雑な要素が絡むことが多いです。一般的に菌類の研究ではLSU のみしか登録されていない場合や、配列が短いもの、ノイズが含まれているものが多いです。別の問題として分類学上ホロタイプやエピタイプに関連づけられたex-type culture の配列が系統解析に使われることが望ましいですが、結果としてex-type の配列はITS とBT のみで、それと同種であるとのちに同定された別標本由来の菌株が全体として配列が揃っていることも多いです。(匿名ですので無責任な発言ですけど、)私はその同定に問題が無ければ無理にex-type で貧弱な系統樹を作るよりも情報が充実している菌株由来の配列を使って解析することを推奨します。最近はゲノムから配列を抜き出すことも容易になりました。それは別の項目で説明しますがローカルにインストールしたBLAST を使うと容易にできますが、その配列のクオリティカバーに問題が無いことも確認して下さい。場合によっては菌株を購入し(ただし、菌株によっては輸入規制もあるため用意ではありませんが)、自前で配列決定することでクオリティの高い配列を得ることもできます。

以下に簡単ですが、配列の整理についてのTips を載せます。

メンバー選定と領域について

目的とする系統群のサイズをハッキリさせます。種レベル、属レベル、科レベルか、目レベルもしくはそれ以上の高次分類なのか。それに応じて外群や使用する領域も決まります。主に種レベルの系統関係を明らかにする場合はITS 領域に加えて他の領域が使われることが多いです。各系統群ごとの事情を調べるのが大切です。

example_of_accession

あらかじめ解析に使うメンバーをエクセルで管理すると良いです。上記の表はとある論文を執筆する際に作成したTable の改変したものです。つまるところ、論文で表示するTable を意識しつつエクセルで情報を管理すると管理が容易になります。作る樹形が科、目レベルであれば、科レベルのランクを表に加えると後々の確認の際にも有効に利用できると思います。私の場合は標本との紐付け情報やex-type か否か、宿主はなども加えています。

なお、後にFasta に変換するため、ラベルから "." や" "、"-" は排除した方が良いと思います。

結果としてこれからの工程を進める上で24時間ほぼノンストップで解析することになります。

前持ったタクソンサンプリングと検討、相談がスムーズな研究につながります。もし、管理を怠れば永遠とパソコンの前で枝を作り続けることとなります・・・