研究テーマ

天文学や気象学などのビッグサイエンス,深層学習をはじめとするAI技術,そして仮想通 貨の基盤を成すブロックチェーン技術が隆盛を極めている.これらの技術はいずれも大規模データに基づくため,それを管理する基盤技術が必要である.この基盤技術はデータシステムと呼ばれる.データシステムには伝統的なリレーショナルデータベースやファイルシステムから,特定用途に合わせられたグラフ・時系列データベースなど,様々なものがあり,多数のプロダクトが乱立している. そのように多様なデータシステムではあるが,実はそれらの要素技術は,問合せ処理とトランザクション処理のみしかない.問合せ処理とは,ユーザがシステムに「こんなデータをください」と問いかけた内容を解釈し,その処理結果を返す処理である.問合せ言語の例にはSQLがある.トランザクション処理とは銀行にお金を振り込んだり,コンピュータにデータを保存する時に行われる処理であり,ACIDという特性を有する. これら2つの技術を基礎から修得すれば,ビッグサイエンス・AI基盤・ブロックチェーンなどに関するいかなるデータシステムについて理解が可能となるだろう 

望遠鏡データ天文学

我々と共同研究する天文学者が用いるすばる望遠鏡は毎晩300GBものデータを生成します。この大規模データを処理して美しい画像を得るには天文パイプラインと呼ばれるデータ処理が必要になります。これにはトランザクションと呼ばれる処理の高速化が必要になり、我々はこれに取組んでいます。我々のトランザクション処理技術は市販システムの数十~数万倍の性能を示します。これは Kavli IPMU、統計数理研究所、NTT CS基礎研究所との共同研究です。JST CRESTによる御支援を頂いております。



リアルタイムデータカーネル

時々刻々と変動する流通システム、突如発現する重力波候補天体、そして震災後避難に必要な即時環境把握等を実現する各種のリアルタイム人工知能を実現するには、リアルタイムデータベースが必要になります。このシステムではトランザクション処理 (OLTP) とデータ分析 (OLAP) を密結合させる HTAP (Hybrid Transactional & Analytical Processing)アーキテクチャが必要になります。これはノーチラステクノロジーズ、NEC、パスコ、鬼塚真教授(阪大)、石川佳治教授(名大)との共同研究です。NEDOからの御支援を頂いております。




ブロックチェーン

ゲートレス改札やレジレスコンビニを実現するには、膨大数の課金処理が必要になります。この課金処理は高信頼性を求めるため、複数のマシンでデータの同期を行う分散合意技術が必要になります。この分散合意の高性能化に関して、高速通信機構 (Remote Direct Memory Access等)を用いた技術をデザインしています。このプロジェクトは、大手金融機関との共同研究になります。

Naofumi Murata, Hideyuki Kawashima, Osamu Tatebe: Accelerating read atomic multi-partition transaction with remote direct memory access. BigComp 2017: 239-246, 2016 (Best Paper Award on Big Data Processing)





不揮発メモリ

Intel Optane Persistency Memoryをはじめとする不揮発メモリ(電源を切られても内容が失われないメモリのこと)が世の中に出てきました。不揮発メモリは新しい技術であり、どのようなアプリケーションを支援できるのか、はたまたどのように設計をすればよいのか、未知数が膨大にあるデバイスです。我々は不揮発メモリを研究開発するある企業との共同研究において、新しいメモリアーキテクチャならびにそれを活用する新しいデータ基盤をデザインしています。 





人工知能基盤とデータ基盤の統合

様々な機械学習技術を提供するデータベースシステムの創出や、深層学習を用いた索引機構、深層学習を用いた問合せ最適化器の創出などを研究しています。ある企業との共同研究ならびに科学研究費補助金基盤研究B の支援を受けています。





大規模データ統合

膨大なデータが収集されたあと、それが一体どのような意味を持つのか、また、他のデータとの関連性はどうなっているのか、を知る必要性が高まっています。この問題を解決するためにデータプロファイリングに関する研究を進めています。この研究では、ある企業が保有するペタバイト規模のデータを対象にしています。