前回はAMDISやその他のソフトウェアにて,化合物同定のための保持時間・スペクトルデータベースの「フォーマット」について解説しました.AMDISでは,NIST(.MSP)フォーマットを用いることは前回みてきましたので,ここではどのように使うかを見て行きたいと思います.
ちなみに,装置メーカー付属のソフトウェアに比べてAMDISを使う利点は何ですか?と聞かれたら,それは間違いなく「デコンボリューションができるから」と答えると思います.デコンボリューションは,共溶出しているピークのスペクトルを波形分離することによって「まるで標準品を分析したときのような」スペクトルを抽出するという目的で行われます.
また,おそらくデコンボリューションの必要性はメタボロミクス・リピドミクス・プロテオミクスの分野で違いがあり,
メタボロミクス>>リピドミクス>プロテオミクス
という感じかと思います.この理由は,スペクトルと化合物の関係が「体系化」できているかどうかに依存すると思います.たとえば,プロテオミクスでの主な分析対象であるペプチドは,b-y開裂として知られているように「ペプチド結合部位で順番に切れる」という知見,さらに原則測定対象アミノ酸はタンパク質構成アミノ酸20種類に限定されるということから,スペクトルそれぞれのm/z値が「数値」ではなく「〇〇配列ペプチド」と読み替えることができます.(プロテオミクスはプロテオミクスで,翻訳後修飾のスペクトルアノテーション等,難しさを含んでいますが…)
また,リピドミクスに関しても,よく知られているリン脂質や,グリセロ脂質,スフィンゴ脂質等は,low energy CIDを用いる限り基本的には同じ場所(たとえばアシル基の脱離)が開裂するので,フラグメンテーションがある程度体系化されています.(体系化が難しい脂質群もあります.)
一方メタボロミクスは,このようなフラグメンテーションはまったく体系化されておらず,m/z値がいったいどのようなフラグメント構造をしているのかがわからないという問題があるので,データベース依存的な「スペクトル形状の類似性」をもって化合物が同定されるという事情があります(整数質量を主に扱うGC/MSではなおさら).そのため,強度比を含めた「スペクトル形状」というものは,メタボロミクスでは同定の基準として重要視されているため,「ピュア」なスペクトル形状を取り出すアルゴリズムであるデコンボリューションは必須となってくるわけです.
話がだいぶそれてしまいましたが,AMDISでの化合物同定に話を戻します.
まず以下の文章は,「使用したいデータベースの分析条件とまったく同じ条件で」計測したデータを解析することを前提とします(これは必須).分析データを取得した後,用意するべきは
1.アルカンミクスチャーの保持時間データ
2.NIST (.MSP)ライブラリー
の2つです.今回は,大阪大学で取得したGC/MSデータを解析するので,大阪大学のNIST MSPファイルを使います.
https://dl.dropboxusercontent.com/u/12061578/20141008_OsakaUniv_GCMS.msp
また,アルカンのミクスチャーは,分析前後に分析するほうが「無難」です.それは感度チェックの意味もありますが,一番は「保持指標」による保持時間情報の標準化を行うためです.保持指標の必要性や説明はGL Scienceさんのホームページを参考にしてください.
http://www.gls.co.jp/technique/gc_technical_note/061.pdf
原則,C8からC40のアルカンのミクスチャーを分析します.偶数鎖のみのミクスチャーでも当然,RIの定義から計算できます.
基本的には,炭素数×100をインデックスとし,RIを計算したい化合物の保持時間をRTc,そして計算結果をRIcとし,その化合物を「挟む」アルカンのうち先に出てくるほうをRTa(炭素数はAとする),後のほうをRTb(炭素数はB)と考えたとき,
RIc = 100 * (A + (B-A)*(RTc-RTa)/(RTb-RTa))
と計算できるわけで,「カラムの組成,長さ等がすべて同じなら」たとえ分析日が異なろうと,カラムをカッティングしてしまい短くなってしまっていようと,いつでも(ほぼ)同じ結果になるということが一番のメリットであり,あとはデータシェアやデータベース検索にも必須の値になります.
購入は,
http://www.sigmaaldrich.com/catalog/product/fluka/04070?lang=ja®ion=JP
と
http://www.sigmaaldrich.com/catalog/product/fluka/04071?lang=ja®ion=JP
からして,あとは分析前と後に打つだけでできるので,やっておいて損はないと思います.GL Scienceでも同様なものが手に入ります.
また話がそれましたが,AMDISで検出されたピークの保持指標を計算してもらう方法は,.CALというフォーマットで以下のような形式(スペース区切り)で保存したものを,Analyze→Settingの中のLibr.タブの中で,RI Calibration Dataをアクティブにして,Select Newから選んでおくだけで,このリストを元にピークの保持時間情報から自動的にRIを計算してくれます.
4.20155 1000 100 999 C10_Alkane
5.328216667 1100 100 999 C11_Alkane
6.409883333 1200 100 999 C12_Alkane
7.413216667 1300 100 999 C13_Alkane
8.34155 1400 100 999 C14_Alkane
9.21655 1500 100 999 C15_Alkane
10.02238333 1600 100 999 C16_Alkane
10.79071667 1700 100 999 C17_Alkane
11.51905 1800 100 999 C18_Alkane
12.21321667 1900 100 999 C19_Alkane
12.86905 2000 100 999 C20_Alkane
13.49655 2100 100 999 C21_Alkane
14.09738333 2200 100 999 C22_Alkane
14.67321667 2300 100 999 C23_Alkane
15.22655 2400 100 999 C24_Alkane
15.75738333 2500 100 999 C25_Alkane
16.26821667 2600 100 999 C26_Alkane
16.76071667 2700 100 999 C27_Alkane
17.23658333 2800 100 999 C28_Alkane
17.69491667 2900 100 999 C29_Alkane
18.13825 3000 100 999 C30_Alkane
18.56991667 3100 100 999 C31_Alkane
18.98825 3200 100 999 C32_Alkane
19.42158333 3300 100 999 C33_Alkane
19.89575 3400 100 999 C34_Alkane
20.42741667 3500 100 999 C35_Alkane
21.02908333 3600 100 999 C36_Alkane
21.72575 3700 100 999 C37_Alkane
22.51408333 3800 100 999 C38_Alkane
23.44658333 3900 100 999 C39_Alkane
24.55158333 4000 100 999 C40_Alkane
一列目は保持時間,二列目は炭素数×100,三列目には100,四列目には999,最後の列の名前の表記はなんでもOKです.三列目と四列目は,アルカンミックスの生データをAMDIS上で同定して上記ファイルを作るときに出力されるのですが,このように手作業で作るときはこのようにしておけばとりあえずエラーはでません.AMDISの弱点は手作業でピークを検出できない点にあるので,しかも生データからAMDISにやらせると確実にいくつかミスるので,このように手作業で入力するほうが安全かと思います.
ちなみに,この化合物を見たい!AMDISじゃできない!という方は,装置メーカーさんの付属ソフトウェアでターゲット解析をやったほうが幸せになれると思います.ノンターゲット解析の最大の利点は「予期しなかった化合物」も検出できる点にあり,一方ある程度のご認識は許容しないと心がどんどん辛くなると思います.
ターゲット解析も一長一短で,「これはあるのか?ないのか?」というギリギリのところの判断等,悩み苦しむところが多々出てくるので,弱点を補うための解析SOPをノンターゲット・ターゲット両方において作っておくことをおすすめします.
また話がそれました.
アルカンミックスのデータ.CALファイルを読み込ませたら,次に同様のタブからTarget Compound Libraryをアクティブにし,Select NewからMSPライブラリーを読み込みます.これで準備は完了.
あとは,Identif.タブにおいて,
Minimum match factor: 60-80
チェックボックスはすべて外す.
Type of analysisからUse Retention Index Dataを選択
RI windowやペナルティの重み付け具合は自己判断(RI windowはだいたい10),ペナルティに関しては,RI windowに収まる限り気にする必要はないので,デフォルトで良いと思います.知りたい方は,AMDISの全般をすごくまとめてくれているこのページを参考にしてはいかがでしょうか.
ここまでくれば,あとはSaveボタンを押せば,勝手に解析が走ります.上記の情報で,閲覧した方々が幸せな同定結果が得られることを祈ります.
いつかデコンボリューションの原理とかも書いてみますが,そんなことに興味がある方は少ないと思うので,気が向いたら...
また,Unknownのピークの同定に関してですが,それはまた,いつかまとめて紹介します.GC/MSなら,すべての知識・手法を結集すれば7-8割は同定(正確には推定という言葉の域にとどまりますが)できるのではないでしょうか.
なにはともあれ,次回はAMDISのバッチ処理(RI Calibration済み)後の.ELUファイルをSpectConnectでデータ統合し,多変量解析に必要なデータ行列の作成手順等を紹介したいと思います.
それでは今日はこの辺で.