このコラム最初のお話は,Seven Golden Rulesです.
T. Kind & O. Fiehn: Seven Golden Rules for heuristic filtering of molecular formulas obtained by accurate mass spectrometry, 8:105, 2007
http://www.biomedcentral.com/1471-2105/8/105/
もう8年も前の論文ですが,非常に参考になります.
また,この論文を修正・改良を促した論文も複数存在しますが,今回はオリジナルを紹介します.
この論文は
「メタボロミクスで扱う低分子化合物において、精密質量から組成式を求める実用的な方法」
を紹介したものです.
「質量分析装置の最初にして最大の役目は,MSから得られたピークの組成式を決定すること」
ということで,この論文を最初に紹介しようと思いました.
Sevenと書いてあるので,7つのルールが表記されてはいますが,重要なのはこのうち4つだと思います.とりあず7つ全部書いてみます.
1. Restrictions for element numbers (質量範囲からして考慮しなければいけない原子の数)
2. LEWIS and SENIOR check (一種の原子価則)
3. Isotope pattern filter (同位体比)
4. Hydrogen/Carbon element ratio check (炭素・水素比)
5. Heteroatom ratio check (水素以外の,ヘテロ原子と水素の比)
6. Element probability check(組成式に含まれる元素各々の組み合わせの確からしさ)
7. TMS check (GCにおいて,TMS化していると過程した場合,TMSの数を推定しなさいということ)
このうち,1は当たり前です.1000 Daの質量を考える場合,考慮するべき炭素の最大値は1000/12=83であるということです.
3の同位体に関してですが,管理人は同位体比に関しては「組成式の確からしさの順位付け」に使ったほうが良いと思っていて,「候補から除外する」のは反対です.なぜなら,基本的にバルク・粗抽出物を分析するメタボロミクス分野では,「共溶出により同位体比が崩れるのはザラ」「質量分析の感度問題により,M+2のイオンがちゃんと定量できない」「ダイナミックレンジの問題により分子量イオンがサチュレートし,正確な同位体比を出せない」ことは余裕で起こりますので,あくまで「参考値」として,組成式から算出される理論的なM, M+1, M+2イオンの比と実測値を比べるべきだと思います.もちろん,順位付けに用いることもOKだと思います.ただ,理論値と異なるからといって,候補から除外するのはちょっと…って感じです.
2番目のルールですが,これは候補組成式を絞るのに,ものすごくパワフルな基準です(弱点もあります).基本的な考え方は,「炭素の原子価は4」「酸素の原子価は2」「水素の原子価は1」というような,「元素がとり得る最大原子価」を考慮した基準になります.有名な窒素ルールも,このルールに含まれることになります.
・構成元素の原子価の合計,もしくは奇数原子価を持つ原子の総数のどちらかは偶数値を取る
・原子価の合計は最大原子価の二倍以上である.
・原子価の合計は2×(構成元素数-1)以上である.
というルールです.じゃあ,硫黄(S)みたいな,複数原子価を取りうる元素はどう扱うの?(2,4,6の可能性がある)
という質問に対しては,すごくよく考えればわかるのですが,「最大原子価の数を考慮すればすべての可能性を考慮できる」ことになります.
ですので,窒素を考える場合,Nは4(ベタインとか),Sは6を考えます.
ただ,管理人は今のところ,Nは3で考えています.どちらが良いか,迷い中です.
SとかPもそうですが,「制約が強い」と「偽陽性」の可能性は減ります.「制約が弱い」というのはその逆となります.Nを4まで考えて,Pを5,Sを6とまで考えてしまうと,全部の可能性を考慮できることになると思うのですが,これだと,この2番目のルールの意味は半減する気がします.
最初は制約を強くして考えて,どうしても当てはまらなさそうな場合,制約を弱くするというのが,正しい使い方なのかもしれません.
また,これはマニアックすぎる話かもしれませんが,組成式を考える上で,
「今自分が考えているピークのアダクトイオンは何か?」
を正確に割り出すことは,LC-MSを用いたノンターゲットメタボロミクスを行う上で究極のテーマの1つだと思います.もっと言うと,究極的には,着目しているイオンが(ポジティブイオンモードの場合)
[M]+
なのか
[M+H]+
なのかを,客観的に決定する方法を開発することは,この分野の発展に欠かせないものかと思います.
何が言いたいかというと,Seven golden rulesの原子価則は,「アダクトイオン」の情報をはっきりさせた上で初めて能力を発揮するものです.Na+等のアダクトは,比較的に簡単に算出可能ですが,M+かM+H+かってなると…管理人は,仕方ないからとりあえず今のところ,プリカーサーイオンは基本的には
[M+H]+
[M-H]-
として,最初は考えるようにしています.
話は戻って,4,5,6番目のルールに関してですが,これらもすごくパワフルです.
「既存データベースにすでに存在している組成式情報から,統計的にもっともらしい元素の取りうる数の範囲」
を使います.有名な4番目のルールは,H/C比と呼ばれるもので,データベースに登録されている組成式の99.7%をカバーするには,H/Cの比は0.2-3.1を考えれば良い,ということです.
5番目のルールは,これを水素以外のヘテロ原子,F, Cl, Br, N, O, P, S, Siに対して統計量を取得したものです.これらの情報は,論文のTable 2にまとめられています.参考までに,99.7%の組成式を網羅するための範囲は,
H/C 0.2-3.1
F/C 0-1.5
Cl/C 0-0.8
Br/C 0-0.8
N/C 0-1.3
O/C 0-1.2
P/C 0-0.3
S/C 0-0.8
Si/C 0-0.5
となるそうです.99.99%範囲や100%を網羅するための範囲については,フリーで見れるのでぜひTable 2を御覧ください.
九州大学の割石先生・三浦先生のグループは,これに酸素・リンの比は3以下であるというAdditional ruleを加えて解析しています.
Nagao, T., Yukihira, D., Fujimura, Y., Saito, K., Takahashi, K., Miura, D., & Wariishi, H. (2014). Power of isotopic fine structure for unambiguous determination of metabolite elemental compositions: In silico evaluation and metabolomic application. Analytica Chimica Acta, 813, 70–76.
6番目のルールは,たとえば
「候補組成式の中にNとOとPとSが含まれているとするならば,N<10,O<20, P < 4, S < 3でなければならない」
というものです.このような絞り込み方は,データベース並びに統計値が威力を発揮する良い例ですね.これらの情報は,論文のTable 3にまとめられています.
最後の7番目のルールは,
「TMS化したGCMSの組成式はTMSを含んだものになっているので,これを除いた組成式を考慮しましょう」
ということです.簡単に言いますが,これはかなり難しいと思います.というのは,GCMSでEI法によるイオン化法を用いる場合,分子量イオンがほとんど見えないからです.
M-15(TMSのメチル基がひとつ外れたもの)は見えることが多いので,これを分子量イオンとして考えられる場合が多いです.
TMSの数は,分子量イオンが特定できれば,そのM+1とM+2の比率から(Siは天然存在比が,28Si, 92%; 29Si, 4.5%; 30Si, 3%と,比較的特徴的なので)求められることが多いです.
このことは,以下の論文に紹介されています.
Fiehn, O., Kopka, J., Trethewey, R. N., & Willmitzer, L. (2000). Identification of uncommon plant metabolites based on calculation of elemental compositions using gas chromatography and quadrupole mass spectrometry. Analytical Chemistry, 72(15), 3573–80.
ただ,いかんせん,GCMSを用いたメタボロミクスはほとんどの方が「ノミナル」すなわち「精密質量が取得できない」質量分析装置を用いますので…精密質量が取得できるGCMSをお持ちなら!ということで,ご理解ください.
さて,以上のルールを持って組成式を絞り込んでいこうということが,Seven Golden Rulesの主張です.
質量分析装置データから組成式を正確に割り出すには,このSeven Golden Rules以外にも考慮しなければいけないことが幾つかありますが,今回は取り上げません.
Seven Golden Rulesを使うためのエクセルマクロ自体は,以下のサイトからダウンロード可能です.
http://fiehnlab.ucdavis.edu/projects/Seven_Golden_Rules/Software/
また,質量分析の質量情報から候補組成式を(Seven Golden Rulesは適用せず,とりあえずひたすらに計算可能な組成式を出力)生成するプログラムは,以下のサイトからダウンロード可能です.
(Standalone software)
http://omics.pnl.gov/software/molecular-weight-calculator
(.NET DLL)
http://omics.pnl.gov/software/molecular-weight-calculator-net-dll-version
使い方についてですが,管理人はMolecular Formula GeneratorやSeven Golden Rulesは文献を参考にしただけで,自分で1から作って実装しているので,実際のソフトウェア自身は使ったことはないです.笑
たぶん簡単だと思うのですが,Seven Golden Rulesはマクロを走らせるために外部DLLを幾つか使ってそうなので,うまくライブラリーをインストールできるかがポイントかも…あとエクセル2003で走るっぽいので,近代のエクセル2010や2013では,いくつか互換性エラーが出るかも…その辺,がんばってグーグル先生に聞きながら,興味がある人は使ってみてください!
それでは,今日はこのへんで.