PubChemは有機化合物のデータベースの一つである.本システムは,アメリカ国立衛生研究所(NIH)の下の国立医学図書館(NLM)の一部門である国立生物工学情報センター(NCBI)によって収集,管理されている.現在の登録数は化合物数で1億2100万に達している。Webブラウザて自由に閲覧することができ,検索結果はダウンロードすることが可能である.
その概要を以下に示した.
検索法
1)構造式を描き検索
PubChemにアクセスすると,以下の画面(Explore Chemistry)が表示される.
検索枠【🔍】のDraw(六角形マーク)をクリックすると、構造式描画を促す画面があらわれる。以下はアゼピン誘導体の例である。
Accept Structureをクリック
右上のダウンロードからSDFとして保存すれば、Avogadroなどで表示、構造最適化することができる。
2)化合物名で検索
化合物名で検索しても同様の結果が得られる。
Summaryをクリックすると、詳細情報のページに遷移する。以下は関連情報の冒頭部分。
以下、下記項目の詳細情報が表示される。
【PubChemで得られる情報】
化学物質の構造情報
化学物質の物性値(LogP値など)
化学物質のスペクトルデータ
化学物質の毒性情報
化学物質の特許情報
化学物質の文献情報
化学物質のアッセイ結果
化学物質の類似化合物
化学物質のMeSH
化学物質の実験目的やデータ取得方法
物性、構造、安全性等が確立した化合物についてまとめられている点では、PubChemの情報は充実している。PubChemの場合.構造情報だけでも,平面構想,三次元構造(分子力場計算構造),結晶構造などが収載されている.三次元構造に関しては, 座標データ(molファイル)がダウンロードできるので,分子軌道計算の入力ファイル作成に利用可能である.X線解析されている化合物については結晶構造および格子定数が記載されている.原子座標等の詳細を知りたい場合は,Cambridge Crystallographic Data Centre(CCDC)の登録番号が記載されているので,CCDCにアクセスすればよい.
次図は、パセリの成分petroselinic acidの構造情報である。二次元情報(2D)、三次元配座(3D、分子力場法による計算構造)とは別に結晶構造(CCDCデータ)も記載されている。。
結晶構造の例 パセリの成分petroselinic acidのCCDCデータ
10項目に及ぶ情報の全体像については実際にアクセスして確認してみてほしい。クリック
PubChemがCAの代わりになるかと聞かれれば,求める情報によると言わざるをえない.私自身が合成した複数の化合物について調べてみたが,化合物の物性についての情報は得られるが,合成に関する論文までは遡ることはできなかった.CAS registry numberが記載されているので,CAで調べることができるが,大学の知人に頼まざるを得ない。
リタイアした者にとって、PubChemはオンラインに特化したフリーの化合物辞典として貴重な存在である。オリジナル論文の図なども掲載されている点は特徴の一つである。現在の登録数は、以下の通りである。
化合物 1億2141万3818 同じ化合物の場合、1個に集約される。
物質 3億3,379万6,385 異なる組織が同一の化合物を登録した場合、重複するため化合物数より多くなる。
バイオアッセイ 1,768,328
Chemical Abstracts(略称CA)との相違点
化合物情報の代表的なものとしてはChemical Abstracts(略称CA)がある.CAは,アメリカ化学会の下部組織であるCASが発行している化学領域の文献抄録誌である.1907年に創刊された巨大データベースであり,世界中で利用されている.1996年以降はCD-ROM版も発刊され, 次いで2008年にはSciFinderのウェブ版がリリースされたことで検索機能が強化され,世界のどこからでもCASデータベースのコンテンツへの迅速なアクセスができるようになった.理工系の大学図書館や企業の研究部門で幅広く利用されている.CAは大学,企業等の研究機関に所属していないと利用できない.
日常で広く使われている約500,000の化学物質については、無料で検索できるCAS Common Chemistry が提供されている。
次図はパセリの成分petroselinic acidの検索結果である。名称やCAS登録番号、分子式、構造式、融点、沸点、比重などが収録されている。
詳細は、有料のSciFinderを見るように設計されているので、一般人には中途半端な存在であると言わざるを得ない。
参考資料
図書館員のための薬学事始め
CAS Common Chemistry
日常で広く使われている約500,000の化学物質について、名称やCAS登録番号、分子式、構造式、配列が収録されている、CAS提供のデータベース。化合物名、SMILES、化学物質名、InChI、またはCAS Registry Numberから検索可能。
(2026.1.20)