GC/MSでメタボロミクスをやってみようというユーザーにとって,AMDISはすごく役に立つツールですよね.サードパーティーのツールを使えば,AMDISのピーク検出・デコンボリューション結果を多サンプルデータ間でマージしてくれて,多変量解析用データテーブルを作ってくれたりします.キーワードは,「AMDIS」,「MSP」,「SpectConnect」ですかね.
今回,AMDISを使ってGCMS簡単ノンターゲット解析!をテーマに,数回の連載という形で紹介していこうと思います.
AMDIS:http://chemdata.nist.gov/mass-spc/amdis/downloads/
参考文献:Stein, S. E. An Integrated Method for Spectrum Extraction. Journal of American Society for Mass Spectrometry 10, 770-781 (1999).
「ピーク検出」と「デコンボリューション」のみをAMDISでやってもらいたい場合,ユーザーが設定するべきパラメーターはDeconv.タブのところだけで良いと思います.
1.Component width: 大きければ大きいほどピークが検出される(上限32まで)
2.Adjacent peak subtraction:普通twoで良いのでは.
3.Resolution:Highほどピークが検出される.(現バージョンは5段階)
4.Sensitivity:Highほどピークが検出される.(現バージョンは3段階)
5.Shape requirements: Lowほどピークが検出される.(現バージョンは3段階)
上記5つのパラメーターをいじって,自分が「少なくともこのピーク,ピーク群は検出,デコンボリューション分離してほしい」というものに対して,90点くらいの成績を出してくれるものを設定すれば良いのではないでしょうか.パラメーターの詳細が知りたい人は,説明書や文献を読んでください.
AMDISのピーク検出・同定結果は,読み込ませた解析ファイルと同じフォルダーに,「解析ファイル名.ELU」と「解析ファイル名.FIN」という形で保存されます.これらのファイルは,NotepadやTextpadなど,簡単なエディターで開くことができて,少しプログラムが書ける人ならサードパーティー(たとえばSpectConnectなど)のソフトウェアを使わずとも,簡単なアライメント・マージコードを書くことで多変量解析に必要なデータ行列を作ることだってできます.
netCDF等のraw dataを扱うのは難しくても,すでにASCII(人間が見れる形式)になっている.ELUファイルなら,学生でもちょっとがんばれば,楽しいことができたりするかも…「あるサンプルでピークが検出されてなかった場合,この欠損値はどうするの?」という質問には,ELUファイルだけでは解決が難しいかもしれないけど…(検出結果しか残ってないので).
そこまでやりたい場合は(検出されていないピークに対しては,その生データに立ち戻って欠損値処理を行いたい場合),netCDFにアクセスするためのJava,Fortran,CのライブラリがUnidataから提供されているので,がんばってみては!?
http://www.unidata.ucar.edu/software/netcdf/
話は変わり,AMDISは原則1ファイルのデータを見るために作られているソフトウェアです.解析したファイルも,「netCDF,.ELU,.FINの3つのファイル」を持ち歩けば,いつでもどこでも再解析ができます(.ELU等を消しちゃうと,最初からやり直し).
AMDISは,File->Batch Jobから,同一パラメーターで一挙に多サンプルのデータを解析できるので,パラメーターが決まったらBatch Jobで全サンプルの.ELUファイルと.FINファイルを作ってしまいましょう!
次回は,化合物同定に必須である.MSP,.MSLファイルを,現状でよく使われているスペクトル格納形式であるMassBank,Mascotと合わせて,NIST形式,MassBank形式,Mascot形式を見ていき,AMDISでの使い方を紹介したいと思います.
それでは!