AWS = Amazon web service
ビッグデータ解析はなにもビジネスだけの課題ではありません。最先端の選抜育種法でも大量のデータを扱うので、ビッグデータ解析が必要になります。まず、1)数百個体のサンプルから表現型(体重や耐病性など)と数千~数万の遺伝子多型情報(SNPs)を取得し、次に、2)その情報を使って1個体ずつの遺伝的能力を予測して、能力値の高いものを親として選抜します。予測には統計モデリング(線形モデルや機械学習)を利用します。このようなビッグデータ解析を効率よく行うには、高性能パソコンを必要としますが、研究費ではなかなか賄いきれません。とくに機械学習用に複数のGPUを積んだPCは価格の割に汎用性が低いので、購入するのには覚悟が必要になってきます。それよりも、そもそもどの程度の高性能さが求められているのかは、実際に解析してみないと分かりません。このようなとき、クラウドコンピューティングサービスは非常に便利です。準備された必要以上に高性能なコンピューターシステムを必要な分だけ使って、使った分だけお金を支払えば良いからです。
こんなに便利なサービスを使わない手はないのですが、導入にはそれなりの知識とスキルが必要です。これから勉強していきますが、学んだことを備忘録として残していきます。今のところ、これを読んだ人が真似をすれば導入できる、というのを目指してはいません。だって昨日始めたばかりですもの(2018/5/25現在)。