解析ソフト
解析で使っているソフトなどのメモです。注釈がない限り、Mac で使用しています。随時更新予定です。
※ご使用の際は、ご自身の責任としてください。
【配列整理】
AliView(https://ormbunkar.se/aliview/)
・アライメントビュワー。アライメント方法や外部ソフトの解析をコマンドで指定できるので、mafftでアライメント → fasttree で系統解析 → figtree で描画まで簡単にできる
SeaView(http://doua.prabi.fr/software/seaview)
Amplify4(https://engels.genetics.wisc.edu/amplify/)
・設計したプライマーのテスト用。Tm値、プライマーダイマー、縮重度、プライマーの配列と結合部位のマッチングが確認できる。preferences でプライマーダイマーの minimum overlap(デフォルトは3 bp)と quality が選べる。
PGDSpider(http://www.cmpg.unibe.ch/software/PGDSpider/)
・様々なファイル形式の変換ができる。集団遺伝用のインプットファイル多め。集団用の fasta を genepop 形式で出力して、同一な配列の確認をする。arp と hap を一つの arp にできる。
seqkit(https://bioinf.shenwei.me/seqkit/download/)
・コマンドライン。配列の操作に便利(指定した範囲の塩基配列の抽出 subseq、複数の塩基配列ファイルの結合 concat、該当する配列名の配列の抽出 grep、名前or配列が重複する配列の除去 rmdup など)
FASconCAT(https://www.zfmk.de/en/research/research-centres-and-groups/fasconcat)
・複数の塩基配列ファイルをコマンドで結合できる。データがないファイルの配列はNで埋めてくれる。
Batch Entrez(https://www.ncbi.nlm.nih.gov/sites/batchentrez)
GetOrganelle(https://github.com/Kinggerm/GetOrganelle)
・ミトゲノムのアセンブリができる。既存のミトゲノムのアセンブラ(NOVOPlasty など)より正確だが、palindrome や short repeats は read pair mapping かサンガーで確認する必要があるらしい (Jin et al. 2020; Genome Biology)。
mitoRNA(https://github.com/mozoo/mitoRNA)
・Bowtie2 と Trinity を用いて RNA-seq のリードからミトコンドリア遺伝子をアセンブリする。
SMART2 (https://neo.engr.uconn.edu/?tool_id=SMART2)
ARAGORN, ARWEN (http://www.ansikte.se/ARAGORN/)
・オンラインまたはローカル、Homebrew でインストールできる。tRNA とその二次構造を推定できる。MITOS だと見落とされる tRNA も検出される。
Hmmer (http://hmmer.org/)
・アミノ酸配列の相同性検索をする。Sun et al. (2021; MPE) が、 MITOSでは検出されないカンザシゴカイ類 Spirobranchus giganteus や Hydroides spp. の atp8 を "putative" atp8 として推定していた。nhmmer で塩基配列の検索。
EMBOSS (http://emboss.sourceforge.net/apps/release/6.6/emboss/apps/)
・オンラインまたはローカル。Homebrew でインストールできる。配列整理、重複する部分がある2配列の結合(短くても可能 merger)、距離計算 (distmat) 、アミノ酸配列に基づく塩基配列のアライメント(tranalign)、逆位反復配列の検索(palindrome)、などいろいろできる。
Mothur (https://mothur.org/)
gff3toddbj(https://github.com/yamaton/gff3toddbj/blob/main/README-ja.md)
・gff3とfastaからddbj登録のアノテーションファイルを作る。fastaだけでも、メタデータファイルを作ればCOMMONと、FEATUREのうちsourceを入力できる。anacondaでインストールしたが、依存のpysamのインストールがcondaだとうまく行かず、これだけpipでインストールし直した。
【系統解析】
AnnotationBustR(https://cran.r-project.org/web/packages/AnnotationBustR/vignettes/AnnotationBustR-vignette.html)
・Rパッケージ。アクセッション番号を用いて GenBank のミトゲノム配列から指定した遺伝子の配列を fasta で取得できる。少し時間がかかるのと、ネット環境やメモリ容量などで止まること多いですが。
DAMBE(http://dambe.bio.uottawa.ca/DAMBE/dambe.aspx)
・塩基置換の飽和を調べられる。
MAFFT (https://mafft.cbrc.jp/alignment/software/)
・オンラインまたはローカル。塩基配列のアライメントができる。RNAの二次構造を考慮してアライメントするQ-INS-iオプション(オンラインで可能)は、デフォルトオプションとだいぶ違う結果を出すので、どっちもやってみた方がいい場合があるかも(査読でQ-INS-iを試したか聞かれたことがある)
PAL2NAL(http://www.bork.embl.de/pal2nal/)
・オンラインまたはローカル。コーディング領域の配列について、アライメントしたアミノ酸配列を元に、塩基配列をアライメントできる。
trimAl(http://trimal.cgenomics.org/)
・コマンドラインでアライメントが怪しい箇所を削除できる。ただし、削除しないほうが良いという研究もある(Tan et al. 2015; Systematic Biology)
Gblocks(http://molevol.cmima.csic.es/castresana/Gblocks.html)
・オンラインまたはローカル。アライメントが怪しい箇所のトリミング。
FastTree(http://www.microbesonline.org/fasttree/)
・高速。決定した配列と手持ちの配列との関係をパッと知りたいときの予備解析に使う。
IQ-TREE(http://www.iqtree.org/)
・ML解析。様々なインプットファイル形式が使える。Ultrafast bootstrap はかなり早く終わるが、普通のbootstrapとは解釈が異なり、≥95% の分岐が信頼できるらしい(http://www.iqtree.org/doc/Frequently-Asked-Questions#how-do-i-interpret-ultrafast-bootstrap-ufboot-support-values)。
Phylobayes(http://www.atgc-montpellier.fr/phylobayes/)
・CAT-GTRモデルを使ってベイズ系統樹がかける。時間かかる。
Mesquite(https://www.mesquiteproject.org/)
・祖先形質推定ができる。
CIPRES Science Gateway(https://www.phylo.org/portal2/)
・サーバー上で系統解析ソフトが使える(MrBayes, BEAST, Phylobayes-mpiなど)。要登録。米国以外のユーザーが無料で使える計算時間が少なくなってしまった(2021年5月確認)。
TreeShrink (https://github.com/uym2/TreeShrink)
・tree file の外れ値的な long branch を検出できる。
QIIME(http://qiime.org/install/install.html)
・インストール手間がかかる。
【集団遺伝】
GenoDive(https://www.bentleydrummer.nl/software/software/GenoDive.html)
・SNPデータのFSTやGSTなどが計算できる。
DnaSP(http://www.ub.edu/dnasp/)
・Windows 用。塩基多様度などが計算できる。nexus のブロックで集団を指定をして(DnaSP 内でも指定できるが、面倒なので適当に nexus で出力した後、コピペして編集)、Arlequin のインプットファイルをエクスポートできる。Arlequin のインプットファイルの比較的簡単な作成方法な気がする。
Genepop(https://genepop.curtin.edu.au/)
・オンライン。Option 6 で Isolation by distance の計算ができる 。
Arlequin(http://cmpg.unibe.ch/software/arlequin35/)
・Windows 用。FST、TajimaD などが求められる。AMOVA もできる。
PopART(http://popart.otago.ac.nz/index.shtml)
・ハプロタイプネットワークが簡単にかける。
SAMOVA(http://cmpg.unibe.ch/software/samova2/)
・Windows 用。AMOVA は前もって解析する集団をグループ分けする必要があるが、SAMOVA は最適なグループ分けから検討できる。
stacks(https://catchenlab.life.illinois.edu/stacks/)
・RADやMIG-seqのlociをまとめる。Macだとclangのgccではコンパイルが失敗する。Homebrew等でgccのインストールと切り替えが必要。最新版ではないがcondaでもインストール可。
ベイズ法を用いたクラスタリング
STRUCTURE(https://web.stanford.edu/group/pritchardlab/structure.html)
Structure Harvester (http://taylor0.biology.ucla.edu/structureHarvester/)
・1→4の順に解析(4は描画)を行う。
【その他】
Homebrew(https://brew.sh/index_ja)
・mac用のパッケージ管理システム。ソフトをターミナルからコマンド1個でインストールできる。
Anaconda(https://docs.anaconda.com/)
・ツールのインストールに便利。詳しいことは分かりませんが Homebrew との共存は相性が悪いらしいです。
Docker(https://www.docker.com/)
・仮想環境の構築。mac で linux のバイナリを動かすために使っています。
GMT (https://www.generic-mapping-tools.org/)
・単純な白地図、等深線あり、深度ごとのグラデーションつきなど、様々な地図がかける。
vegan(https://cran.r-project.org/web/packages/vegan/index.html)
・Rパッケージ。群集生態の基本的な解析ができる。