CCDC(ケンブリッジ結晶学データセンター)

新Googleサイト移行のために自動変換されたファイルです.修正版をご覧ください.

久しぶりに,CCDC (Cambridge Structural Database System) にアクセスしたところ,トップページに以下のバナーが飾られていた.

1965年にケンブリッジ大学のグループによって始められた世界規模の結晶線解析データ収集作業は50年を迎えた.現在,化学,薬学,農学の分野だけではなく,製薬企業等においても不可欠の研究資源になっている.我国の場合は,1970年初頭から阪大蛋白研を窓口としてデータの提供を受けている.当時,九州大学大型計算機センターで本データベースの構築を担当していた河野重昭先生(当時教養部物理学教室)によると,データは磁気テープで送られてきていた.1965年といえば,インターネットは存在せず,計算機センターはカード入力方式が主流の時代である.一昨年,パソコン用のBASIC言語が誕生50年を迎えているので,ケンブリッジ大学のグループによるプロジェクトは,いち早くオンライン検索を意識した先見性のあるプロジェクトであったわけである.現在は大学から独立した非営利団体であるが,成長過程で国の資金援助を受けることによってシステムの改善,解析ソフトウエアの開発等も可能になり,研究者向けには無料で配布している.

データベースの構築が始まったのは,X線回折の強度データを銀写真像から集めていた時代からコンピュータ制御の四軸回折計に代わろうとしていた頃である.私がX線解析を始めた1972年までに解析された化合物数は全世界で2000個程度であった.解析された化合物の平均原子数は,1923-1964年では20個以下,1972年にようやく30原子の化合物の解析が可能になったことが分かる.ほとんどが重原子法による解析である.

登録数の推移をグラフにしたものが掲載されているので,そのまま紹介したい.

2015年,80万個を超えたとのことである.現在は,コンピュータ支援による直接法解析(1985ノーベル化学賞)が主流になり,X線回折装置とやる気があれば結晶学の専門家でない人でも解析ができる時代になった.そのため,毎年平均4万個の化合物が登録され,平均原子数も80を超えた.医薬品の場合,かなりの数の化合物(複合体等を含む)が解析され,構造活性相関や固体物性研究等に役たっている.

一方,現在,Chemical Abstractsに登録されている化合物数は,1日あたり約14,000の物質にのぼる.2012年12月時点で約71,000,000の無機および有機化合 物,約64,200,000の遺伝子配列が登録されている.X線解析や中性子解析で,構造が眼に見える形で確認されているのは,0.001%に過ぎないが,化学の学問領域に与えた影響ははかり知れない.

CCDCとの出会いは,私自身にとっては医薬品データベースの構築モデルとして位置付けできると確信したきっかけになった.オンラインによる医薬品情報(厚生省)の電話回線検索が実現したのは,昭和62 (1987) 年であり,インターネットで自由に検索できるようになったのは2000年になってからである.

参考資料

  • ケンブリッジ結晶構造データベース(CSD)は,ケンブリッジ結晶学データセンター(CCDC)が構築している有機化合物,有機金属化合物の結晶構造データベースである.検索ソフトウエアを含めて CSDSと呼ばれている.CSDの配布等のサービスについては,会社等営利機関は化学情報協会,大学等アカデミック利用者は大阪大学蛋白質研究所が窓口になっている.

  • 粉末X線回折像から三次元座標を得る方法も開発されているが,まだ数は少ない.

  • 論文投稿との関係について:X線解析データを含む論文を投稿する際には,投稿前に著者自身が解析データをCIF形式のファイルとしてCCDCに登録するようになっている.解析データとは,解析終了時に解析ソフトウエアが出力するサマリーファイルであり,登録後に辻褄が合っているかチェックされ,登録番号が付与される.投稿論文が公開される際は,登録番号を付記するように決められている.

2016.2.5