日本語 / English
研究概要
サイバーフィジカルシステム(CPS)は、物理的な現実世界(フィジカル空間)からセンサーやIoT機器を通じて収集した多種多様なデータを、サイバー空間で統合的に分析・処理・最適化を行い、価値の高い情報や知見を創出する仕組みです。その中で鍵を握る概念が「デジタルツイン」です。
デジタルツインとは
現実世界に存在する機械、施設、環境などの物理的対象を、仮想空間に精密に再現したデジタル上の双子(ツイン)を指します。
物理的な対象からリアルタイムで収集したデータを使い、デジタルツイン上でシミュレーションや予測、最適化などを実施することで、現実の運用に反映することが可能です。
製造業、物流、エネルギー、モビリティ(交通・移動)分野など幅広く応用可能であり、産業のスマート化や効率化を促進することが期待されています。
CPS構築における技術的要素
IoT(Internet of Things):各種センサーによるデータのリアルタイム収集
AI・ディープラーニング:高度なデータ解析・パターン認識
Big Data:大量データの蓄積・処理・最適化
クラウド連携:分散データの集約、共有、活用
FA(Factory Automation):自動制御システムによる現実世界へのフィードバック
これらの要素が一体化し、フィジカル空間とサイバー空間を循環することで、産業や社会全体に対して新しい価値を生み出すサイクルを形成しています。
交通ネットワーク, ソーシャルネットワーク, サイバーセキュリティ, バイオインフォマティクス(生物情報学), 脳科学, 防災計画策定
グラフ解析は、これらの分野において発生する大量で複雑なデータ(ノードと枝で構成されるネットワークデータ)の関係性を可視化し、分析するための重要な手段となっています。
並列グラフ探索(幅優先探索)
最適化手法(最短経路探索、最大フロー、最小費用フロー)
クラスタリング(グラフ分割、コミュニティ抽出)
これらの手法により、データ内に潜む複雑な関係性を分析し、より有益な知見を抽出します。
解析の流れとしては、
グラフ構造に基づく事象間の関係性を把握
高度なグラフ解析アルゴリズムにより関係を分析
得られた結果を元に、対象となる事象を深く理解し、問題解決や意思決定に活用
のステップを踏んで進めます。
グラフの大きさは一般的に点と枝の数で表現されるため、上図では各分野における代表的なグラフの規模をまとめている。図の横軸はグラフの点数を、縦軸はグラフの枝数を示している。これらのグラフは大きく以下の3つに分類できる。
交通系データ
ニューヨーク市の道路ネットワークデータは26万点(73万枝)で、全米道路ネットワークデータは2,400万点(5,800万枝)である。後者は一般的には非常に大きなグラフと言えるが、図2の分類内では比較的小規模である。この程度の規模であればスマートフォンレベル(数GB)のメモリに格納して、最短経路探索などの処理が可能である。
WebグラフおよびSNS系データ
交通系データと比較すると大規模であり、通常は数千万点から数十億点に達する。この規模のグラフ解析を行うには、数百GB以上のメモリを搭載した高性能計算サーバが必要となる。
脳神経回路(ニューロン)およびシミュレーション(Graph500など)用データ
これらの用途では点数・枝数ともに1兆を超える規模となるため、グラフ解析にはスーパーコンピュータなどの大規模計算環境が必須となる。また、データ量が非常に膨大なため、グラフデータをファイル形式で保存することは困難である。そのため、後述するGraph500ベンチマークのように、解析時に動的にメモリ上でグラフを生成して処理を行う手法が取られる。
高性能計算(HPC)における大規模グラフ処理の最新動向
従来の高性能計算(HPC)分野では数値計算が主流だったが、近年では大規模データ処理を主体としたデータ・インテンシブアプリケーションが増えている。
Graph500は、並行探索や最短経路探索を含む最適化処理、極大独立集合など複数のグラフ解析手法を用いて計算機の性能評価とランキング付けを行う国際的なベンチマークである。サイバーセキュリティ、創薬、データマイニング、ネットワーク解析など、幅広い分野でグラフ解析は重要な計算処理として位置付けられている。
特にGraph500ベンチマークの「Hugeクラス」では、1兆点以上の大規模グラフを扱うため、データを複数計算機ノードに分散配置する必要がある。
藤澤らのJST CREST研究チーム(2011〜2017年)は、次世代スーパーコンピュータ上での大規模グラフの高速探索処理ソフトウェア開発に取り組んできた。具体的には以下の高度なソフトウェア技術を組み合わせ、世界最高性能のグラフ探索ソフトウェア開発を実現した。
効率的なグラフ隣接行列の分割技術(複数ノード間)
冗長なグラフ探索を削減する最適化アルゴリズム
大規模並列計算環境における通信性能の最適化(数千〜数万ノード規模)
マルチコアプロセッサ向けのメモリアクセス最適化
これらの技術革新により、京コンピュータを活用したGraph500ベンチマークでは2014年〜2019年の間、9期連続(通算10期)で世界第1位を達成した。特に2015年には、1兆点・17.59兆枝のクロネッカーグラフに対する幅優先探索(BFS)をわずか0.56秒で完了し、31,302.4 GTEPS(約31.3兆TEPS)という世界最高記録を樹立した。この結果は、大規模グラフ解析における通信時間の圧倒的な比重を示している。
さらに2020年から2024年にかけては、スーパーコンピュータ富岳を用いて再びGraph500ベンチマークの世界記録を更新した。
2020年6月: 約70.9兆TEPS
2023年11月: 約138.86兆TEPS
最新記録(2024年11月): 約204.06兆TEPS
これらの成果により、大規模かつ複雑なデータ処理分野での日本のスーパーコンピュータの技術的優位性が証明されている。
当チームでは最適化問題の高速計算および実社会への応用に積極的に取り組んでいる。特に注目しているのが、近年最も関心を集めている最適化問題の一つである「半正定値計画問題(Semidefinite Programming: SDP)」である。
SDPは以下のような多岐にわたる分野で活用されている。
組合せ最適化, システムと制御, データ科学, 金融工学, 量子化学
これらの幅広い応用可能性から、SDPは現在最適化分野において最も重要視される課題の一つとなっている。
SDPを解くためには「内点法アルゴリズム」と呼ばれる高速かつ安定した反復解法が広く使われている。しかし、この手法においては巨大な線形方程式系の計算、特に以下の2つの処理が計算のボトルネックとなっていた。
行列要素の計算
行列のCholesky(コレスキー)分解
我々は、東京工業大学のスーパーコンピュータ「TSUBAME 2.5」を活用し、次のような技術を駆使することでこのボトルネックを解消し、世界最大規模のSDP問題を高速に解くことに成功した。
GPUの並列活用(多数のGPUによる並列計算)
計算と通信のオーバーラップ技術(並列処理効率の向上)
その結果として、線形方程式系のCholesky分解において最大で1.774 PFlopsという卓越した性能を達成し、世界的にも先進的な成果を挙げた(上図参照)。
近年、世界中で最新技術を組み合わせ融合することで、安全・安心かつ利便性の高い「超スマート社会(Society 5.0)」を実現するための多様な取り組みが推進されている。特に、ICT(情報通信技術)の急速な進展により、現実社会で起きているさまざまな現象を計算機上でモデル化し、環境変化に対するシミュレーションや最適化を行うことで、サイバーフィジカルシステム(CPS)をビジネスモデルとして実現できるようになった。
現在、私たちは多くの民間企業と協力し、CPSを用いた大量のセンサーデータ(人や物の移動など)やオープンデータ(Wi-Fiの移動履歴など)を活用して、サイバー空間上での最適化およびシミュレーションを行う「CPSモビリティ最適化エンジン(CPS-MOE)」の開発を進めている。この取り組みは、新産業の創出、コストや廃棄物の削減、交通機関の最適な制御スケジュール策定など、多様なサービス群の構築を目指している。
CPS-MOEの実現に向けて、以下の3つのモビリティを表現・予測・最適化・制御するための数理・情報技術の開発を推進している(上図参照)。
1. 情報(人の興味・意思)のモビリティ
Webアクセス履歴やユーザーの潜在的興味度に基づいたユーザークラスタリング技術
2. ヒト・モノのモビリティ
深層学習を用いた位置情報の検出・追跡
混雑検知、流動の最適化および可視化技術(下図参照)
3. 交通(最適運転)のモビリティ
経路および配送の最適化
MaaS(Mobility as a Service)の導入・最適運用(バイクシェアリングなど)