前回まではAMDISにおけるデコンボリューション法+化合物同定法を見てきました.
今回は,多サンプルのAMDIS解析データの統合方法を紹介します.
AMDISそれ自体には,俗に言われる「ピークアライメント」の機能はついておらず,それはサードパーティーのソフトウェアに任せることになります.いろいろ方法はありますが,ここではSpectConnectを用いる方法を紹介します.
SpectConnect
Styczynski, M. P. et al. Systematic identification of conserved metabolites in GC/MS data for metabolomics and biomarker discovery. Anal. Chem. 79, 966–73 (2007).
第1回のコラムにも掲載しましたが,SpectConnectを使うためにはAMDISでの解析ファイルである.ELUファイルが必要です.つまり,SpectConnectでは,.FINファイル(化合物同定結果)は使いません.だからもっぱら,ピーク検出および保持指標計算だけさせておけば良いのですが,化合物同定メソッドを走らせたところでそこまで解析に時間を要さないので,ついでにやっておいても良いと思います.(あとで確認できますし.)
AMDISでのピーク検出・保持指標計算・化合物同定のバッチ処理
まず,Analyze→Settingから,ベストなパラメーターを決めておきましょう.
そして次に,AMDISのEXEファイルが入っているフォルダー(通常,Program File 86のNIST MSの中)から,ONSITE.INIを探しましょう.実はAMDISのパラメーターはすべてここに保存されています.このONSITE.INIをコピーして,解析したいGCMSファイルが入っているフォルダーに貼り付けて,かつ,INIのファイル名をわかりやすいものに変えます.この操作は必要ないかもしれないのですが,管理人はONSITE.INIを使っていたらたまに予期しない(ここでは説明しません)エラーに頻繁に会いはまったことがあるのでこうしています.
次に,化合物同定に使うMSPファイルも,同じデータフォルダーにコピーして入れてください.そして,拡張子をMSPからMSLに変更してください.MSLとMSPは,AMDIS上では区別されていませんが,本来,MSPに含まれるべきスペクトルは1つのみで,複数のスペクトル情報が含まれる場合はMSLという拡張子にする決まり(?)だったみたいです.もはや現状どちらでも良いのですが,少なくともSpectConnectはMSLの拡張子しか受け付けないので変更しておきましょう.
準備が終わればAMDIS上で,File→Batch job→Create and Run jobを選択します.
次に,左のAdd..ボタンから,解析したいGCMSデータを読み込みます.
次に,下にあるAdd INIから,上で準備したINIファイルを選択します.
Analysis typeはUse RI calibration data (CAL)を選択します.Settingの時点で,CALファイルを選んでおくこと!もしくはINIファイルを開いてファイルパスを通しておいてください.
Report all hitsのチェックは外し,Include only first 1 hitsにしておいてください.
そしてRunを押す.
これで終わりです.
しばらく待っておけば,解析が終わります.
続いてSpectConnectのサイトに移動します.
Number of Conditionsから,群数を,そしてMaximum number of samples per conditionから最大N数を選んでください.残酷なことですが,「1つ1つ」,ELUファイルを選んでいってください.嫌がらせかと思うのですが,仕方ありません.
次に,Click to show additional user options…をクリックし,
サンプル間のピーク一致の基準を選択してください.GCMSの場合,
・Elution threshold:Veryhigh(0.133 min)
・Support threshold: High (All samples),ここは意見がわかれるところ.管理人は欠損値がすごく嫌いなので,というか欠損値が出てくるとストレスにしかならないので,はじめからすべてのサンプルに出てくるピークのみを解析します.ただ,植物,たとえばRiceとArabidopsisでは検出される化合物自体が全く異なると思うので,それは適宜,自己判断で選んでください.
・Similarity threshold: Medium
・Library similarity threshold: Medium
・Matrix: Data matrix after run
で良いのではないでしょうか.
また.MSLファイルとして,先ほど作ったMSLファイルを選択してください.
そして最後,Email addressはちゃんと入力しておきましょう.解析終了するのは一週間を見越して置かなければならず,いつ結果が返ってくるかの正確な時間はわからないので…載せておけば,終わったら連絡してくれます.
最後,Click here to submitを押せば,上記ファイルがアップロードされます.
解析結果はしばらく待ちましょう.
たとえば企業さんとかは,アップロードすることが憚れるというかできないことがあるかと思います.
そういう方は,少々バグもあるかと思いますが(現在使ったことがないので,どこまで修正されているかわかりません),MetaboliteDetectorもおすすめします.
上記,AMDISおよびSpectConnectの操作が同一ソフトウェア上で可能です.パラメーターの設定もほとんど同じです.
Hiller, K. et al. MetaboliteDetector : Comprehensive Analysis Tool for Targeted and Nontargeted GC / MS Based Metabolome Analysis. 81, 3429–3439 (2009).
また,SpectConnectもMetaboliteDetectorも,データ統合自体は単純に,保持時間・スペクトル相関係数の類似度に基づいて結合していっているだけですので,少しプログラムがかける人なら自分でコーディングしたほうが,潰しが利くかも…
ELUファイルには,たまにスペクトル定量値として数値ではなく英語が入っていることがありますが,管理人自身詳しいことはわかりません(学ぶ気がない.笑).ただ,AMDISはデコンボリューション結果として「怪しい」m/zピークを判別する機能があるので,その「怪しい」ものを表しているのだと勝手に思っています.ですので,完全に読み飛ばしてスペクトル情報をParseして,それを持ってスペクトルシミラリティを計算すれば良いかと思います.(意見がある人は管理人まで.)
管理人は今日,2007年に取得した(Naamさんという先輩がやった研究)日本茶のGCMS分析データ
Pongsuwan, W. et al. Quality Prediction of Japanese Green Tea Using Pyrolyzer Coupled GC / MS Based Metabolic Fingerprinting. 744–750 (2008).
を,2014年10月20日にアップロードしました.
次回はこの結果を使って,統計解析してみたいと思います.