MS-DIALは,理化学研究所の有田正規先生と,UC Davisのオリバーフィーン先生のグループの共同研究成果として発表され,津川裕司先生がメインデベロッパーとして開発を進めているソフトウェアです.
MS-DIAL:http://prime.psc.riken.jp/Metabolomics_Software/MS-DIAL/index.html
H.Tsugawa et al. MS-DIAL: data independent MS/MS deconvolution for comprehensive metabolome analysis. Nature Methods, 12, 523-526, 2015
本ソフトウェアの本来の目的は,LC/MSもしくはLC/MS/MSの生データから統計解析に必要な「データ行列」つまり「サンプル情報と代謝物ピーク情報とその定量値が整理整頓されたエクセルファイル」を作成することにあります.MS-DIAL以外にも,たとえばMetAlign,MZmine,そしてXCMSのようなツールでも同様のことを行うことができると思います.管理人は,これらソフトウェアの「性能」をきちんと比べたことはありませんが,MS-DIALは「MS/MS情報の取り扱い」が得意な印象をうけます.
メタボロミクスやリピドミクスでは,QTOF,QExactiveといったLC/MS/MSによるノンターゲット解析が盛んに行われています.さらに近年,スキャンスピードの向上により,一度の分析でMS1だけでなくMS/MSも同時取得できるようになってきました.
少し前までは,MS/MSが取得可能かつ,スキャンスピードが早いQTOFでさえも,「一度の分析でMS/MSも同時に取得!」ということはせず,まずはサーベイスキャンと呼ばれる,
1.四重極は素通りさせて
2.コリジョンはさせずに
3.同時溶出してきたイオンをTOFですべて検出する
ということを行っていました.このサーベイスキャンという言葉は,時に「MS1」とか単に「スキャン」とか呼ばれたりします.このようにして得られるデータは,X軸を保持時間とY軸をm/z,そしてZ軸にイオン量をプロットすることで代謝物が「ピークとして」見えてきます.以下のMZmineのサイトがわかりやすいです.
http://mzmine.sourceforge.net/features.shtml
このような3次元空間のデータを,各プログラム独自のピーク検出法により代謝物情報を抽出後,サンプル間で差異のあるm/zピークを識別します.そして分析者は,この差異のあったm/z(つまりプリカーサーイオン)にフォーカスし,ぞくに言うプロダクトイオンスキャンを「別分析にて」行い,MS/MSを取得して化合物同定を行うというのが従来までの方法でした.しかしながら,この「興味のある」代謝物由来ピークと,そのMS/MSが同時取得できるならそれに越したことはないですよね.
そこで,スキャンスピードの問題から「全部」について行うことはできないけれど,「イオン量の大きい代謝物」のMS/MSだけでも同時取得しよう!という,つまりサーベイスキャンとプロダクトイオンスキャンを同時に行う試み,ぞくに言う「Auto MS/MS」が,近年主流になりつつあります.分析メーカーにより言葉は違いますが,AB SciexでいうところのInformation Dependent Analysis (IDA),ThermoでいうところのData dependent MSMS (ddMS)がこれに当たります.
原理的には,サーベイスキャンを一回行うにつき,強度が大きいm/zを(たとえば)10個選定し,その各々についてプロダクトイオンスキャンを実施する,という操作を重ねることになります(一つ前のサーベイスキャンで選定したm/zは,次のサーベイスキャンでは取らない.アイソトープだと考えられるものは取らないなど,細かな設定も可能).
このようなAuto MS/MSの生データは,先ほどの三次元展開図で検出されているピークのうち,いくつかのものに「MS/MSがタグ付けられている」というイメージのものになります.MetAlign,XCMS,MZmineは,このようなAuto MS/MSが主流になる以前に設計されたツールであり,(Auto MS/MSに対応はしているものの)Auto MS/MSに最適化してソフトウェアが設計されているわけではありません.
一方,MS-DIALは保持時間とMS1軸上で展開されているピークの海にてピーク検出アルゴリズムを適用した後,それにタグ付けられているMS/MS情報を利用することに長けている形でソフトウェアが設計されています.また,以前紹介したNISTフォーマットで記述されたMS/MSデータベースを読み込むことで,「保持時間」「m/z」「同位体比」「MS/MS」の4つの類似度指標をもとに化合物同定を行うことが可能になっています.NISTフォーマットって何?という方は,以下のコラムを参照してください↓
スペクトルの記述形式
https://sites.google.com/site/esitomonokai/jie-xi-bu-wu/amdis/2-supekutoruno-ji-shu-xing-shi
NIST MS Searchプログラムの紹介
脂質に至っては,すでにこのMS/MSライブラリーが実装されており,ユーザーは「見たい脂質分子種を選択するだけ」で生データの読み込み,ピーク検出,化合物同定,アライメントを容易に行うことが可能です.
MS-DIALが他のソフトウェアと決定的に違う点は,
1.SWATHのようなdata independent MS/MS acquisitionに対応している
2.分析化学者の要望に沿ったグラフィカルユーザーインターフェース(GUI)になっている
ということかと思います.実はこのグループは,前者のdata independent MS/MS acquisitionに対応するためのソースコードは公開していますが,後者のGUIコードやデータアクセス方法に関しては一切公開していません.おそらく,このあたりの技術が,どちらかというとデコンボリューションのような技術よりもノウハウが蓄積されていて付加価値が高いことから,独自技術として保有したいということかと思います.
次回からは,まず,MS-DIALにおいて使用するデータフォーマットと,各社メーカーのデータフォーマットをどのように変換するか?ということに焦点を当てていきたいと思います.それでは,今日はこのへんで.