RAxML の使い方
2018/08/27
Configure Bootstrapping の項目を最新インターフェイスへ更新
ローカルで解析する場合
RAxML のファイルを準備します。ここでは「raxmlHPC-PTHREADS.exe」を使います。
まずはじめにKakusan4 のRAxMLフォルダにraxmlHPC-PTHREADS.exe をコピー&ペーストします。
PowerShell を起動して以下のコマンドを入力します(ここではKakusan4 の作業をC:\Kakusan4で行い、ファイル名をSSUphy_ver01_mafft.fas だった場合で書きます)
cd C:\Kakusan4\SSUphy_ver01_mafft.fas.kakusan\RAxML
※フォルダ名は解析に使ったfasta 名で変わるので臨機応変に対応してください。
PowerShell で以下のコマンドを入力します。
raxmlHPC-PTHREADS -T 4 --no-seq-check --no-bfgs -n whole_AICc4_nonpartitioned_singlesearch -s whole.phy -f a -p 1234 -x 5678 -m GTRGAMMA -# 1000 -n outfile
CPU のコア数 (-T 4)
解析に使うファイル名 (-s whole.phy)
ブートストラップ値をbesttree に入力するコマンド (-f a)
モデルはGTR+G(-m GTRGAMMA)
rapid bootstrap 1000 回 (-# 1000)
これでbest tree とBT をまとめて解析できます。
RAxML_bipartitions.outfile このファイルにBT 値とbest tree が保存されています。
2022/02/01 追記
Cipres で解析する場合
用意するもの
Kakusan4 で出力された以下のファイルを用意
必要なもの
・whole.fas
・whole_AICc4_*****_*****_singlesearch.bat (* は最適モデル)
・whole_AICc4_*****_*****_bootstrap.bat
(・whole_AICc4_*****_*****.partition; Kakusan4 の解析結果 ”whole_AICc4_comparemix.txt” を確認して連結データに対して分離モデルが挙げられた場(= Separate) なら使う、EqualRate ならつかわない)
私の研究ではAICc4 モデルを使うことにしているので、以下の説明はAICc4 の場合と考えてください。
目的によってはほかの推定をつかうべきであることもありえます。詳しくは田辺 (2015) 分子系統科学演習やKakusan4 Manual をご覧下さい。
この2つのファイルをCIPRES にアップロードする。
Task の追加
Input
Input にはアップロードしたwhole.fas を選択する
New Task 画面Input →Tool→Input Parameters の順番で設定する
Input ファイル選択画面、whole.fas を選択後、Select Data を入力。一度New Task 画面に戻るので、引き続きTool へ移動する
Tool
ここで解析に使うソフトを選択する。今回はRAxML だが...
解析につかえるソフトは20以上有る (バージョン違いも含めて)。今回はアライメントがfasta なのでRAxML-HPC2 on XSEDE (8.2.10) を使う。
Input Parameters
基本設定、おおよそDefault でOK
Maximum Hours to Run に注意しながらwhole_AICc4_*****_*****_singlesearch.bat (* は最適モデル)とwhole_AICc4_*****_*****_bootstrap.batに書かれている命令を入力していく。
大抵は以下の情報を入力
Outgroup [@@@] ;Nixon etr al. 1993 に従って複数のoutgroup を指定する場合はタクサ名を","で区切ることタクサ名の間にspaceは入れない. ちなみにFigTree やMesquite であとからoutgroup を変えることもできる。
→ Nixon KC et al. (1993). ON OUTGROUPS. Cladistics 9: 413-426.
Specify a random seed value for parsimony inferences (-p) ☑
Enter a random seed value for parsimony inferences (gives reproducible results from random starting tree) [@@@@→ see singlesearch]
Use a mixed/partitioned model? (-q) [whole_AICc4_partitioned_codonnonpartitioned.partition]; アップロードするときにファイル名をわかりやすくすると良い
Estimate individual per-partition branch lengths (-M) * □; これにチェックを付けると領域間の違いを枝長で示すようになるので欠けデータがあるととんでもない樹形ができる。理由が無い限り決してチェックを付けないこと。
詳細設定、目的に応じて入力内容は変わるが、系統樹を作るだけなら以下のやり方でOK
Nucleic Acid Options
Choose model for bootstrapping phase → GTRGAMMA
Protein Analysis Options
Protain がなければ無視する。アミノ酸をコードしている配列はProtain ではないので注意!
RNA Secondary Structure Options
二次構造の解析でなければ無視する。
Binary Matrix Options
関係なければ無視。CAT のときのみ使える。
Multiple State Morphological Matrix Options
関係なければ無視。
Select the Analysis
Don't use BFGS searching algorithm (--no-bfgs) ☑
Configure Bootstrapping
Rapid Bootstrapping (-x) ☑
Enter a random seed value for bootstrapping + [@@@@→see bootstrap]
Specify bootstrap protocol ☑Specify an Explicit Number of Bootstraps
Bootstrap iterations (-N) + [1000]
完了
コーヒーブレイク後には解析は終了している。
問題がなければ解析を開始し、解析後のデータをダウンロードする。
4000塩基ほどならすぐ終わります。