NGS解析で用いるソフトウェアは、よく使うもの、source codeをコンパイル(開発者が作った呪文をコピペすること)する必要があるものなどは、AMIにインストールしておいた方が良いかも。コンパイル済みのbinaryファイル(ダウンロードしたらすぐ使えるもの)があるソフトウェアは都度落としてきた方が安上がりで良いかも。
なんでもかんでもAMIにインストールしていくのは賢明ではないとのこと。一度肥大化したAMIを小さくするのは非常に面倒くさいそうです。(インスタンスの削除も面倒くさかった。)
samtools のインストール
AMIはスタンダードなAmazon Linuxを使用。ただし、デフォルトではコンパイラとtviewに必要なncursesなどが入っていないので、次のおまじないを唱えておく(コンパイラがはいっていないAmazon OSは多いようです)。
sudo yum groupinstall "Development Tools"
sudo yum install ncurses-devel
sudo yum install bzip2-devel
sudo yum install xz-devel
あとはマニュアル通り。./configure -> make (-> make intall)。
htslib, bcftools はこれでインストールできた。
Trimmomaticのインストール
普通にダウンロードすればよい。
GATKのインストール
ver4になってから、一気に置き去りにされたGATK。Sparkの勉強してやる。
GATKはjdk1.8を使う。java のバージョン変更が必要なときのおまじない。
sudo alternatives --config java
以上のものが普段使いなので、AMI上にインストール。インストールしたら、イメージの保存。手順は以下の通り。
インスタンス → アクション → イメージ → イメージの作成。