主な研究テーマは以下の通りです
主な研究テーマは以下の通りです
ネットワーク化制御システムにおける通信リソースに配慮した制御系設計及び学習
感染症拡大の抑制に向けたフィードバック制御理論の構築(阪大 小蔵正輝先生との共同研究)
AI集約型サイバーフィジカルシステム (AI-CPS) のための形式的制御系設計(JST CREST の研究プロジェクトの一環.京大 末永幸平先生,国立情報学研究所 岸田昌子先生,阪大 潮俊光先生,阪大 小蔵正輝先生,California Univ. Adnane さんらとの共同研究)
月極域および火星探査に向けた未知環境下での経路計画(JAXA 井上博夏さんとの共同研究)
また,今年度主に行う研究テーマはこんな感じにしようと思っています。
ネットワーク化制御システムにおける通信リソースに配慮した制御系設計及び学習
研究概要
情報・通信技術の発展に伴い,様々な制御システムの「ネットワーク化」が盛んに行われています。ネットワーク化された制御システムの具体例として,ロボットやドローンの遠隔制御,無線通信を用いた化学プロセスの制御,車間通信による車の隊列走行などが挙げられます。ネットワーク化された制御システム(ネットワーク化制御システム)は,制御対象(物理システム)とコントローラ(情報システム)が通信のやり取りを行うことから,サイバーフィジカルシステムの代表例です。
図1に,ネットワーク化制御システムにおける制御対象とコントローラとの通信のやり取りを示します。具体的には,制御対象がセンサデータをコントローラに送り(図1:Step1),コントローラはその情報からアクチュエータに印加する制御入力を計算し,それを制御対象にフィードバックします(図1:Step2)。この手順を繰り返すことで,例えばドローンを目的地に到達させるといった所望の制御目的を達成します。ここで,ネットワーク化制御システムにおいて特に留意するべき点と言われているのが,制御対象とコントローラとの通信頻度です。すなわち,制御対象からコントローラ,あるいはその逆方向の通信が頻繁に行われると,通信の帯域や通信機器の消費電力が著しく増加してしまいます。一方で,通信頻度を少なくしすぎると,制御対象が所望の制御目的を達成できなくなる可能性が高くなります(例えば,通信を行わない間に,ドローンが障害物にぶつかってしまうなど)。したがって,所望の制御目的と通信頻度の低減化の両方を達成するためにも,制御入力を決定する制御方策と,「いつ制御対象とコントローラが通信するか」という通信のタイミングを決定する通信方策を同時にかつ適切に設計していくことが重要となります。
そこで本研究では,ネットワーク化制御システムにおける制御と通信方策の同時設計法の開発を行っています。具体的には,事象駆動制御や自己駆動制御と呼ばれる枠組みを用いて,制御するべき必要な時のみ通信を行いながら制御目的を達成するアルゴリズムの開発を行っています。さらに,ガウス過程や強化学習といった学習理論を用いて,未知のダイナミクスを持つ制御対象にも適用できる設計法の確立も目指しています。
図1 ネットワーク化制御システムの概念図
感染症拡大の抑制に向けたフィードバック制御理論の構築
研究概要
COVID-19パンデミックに代表されるように,感染症の拡大を抑制することは世界的にも極めて重要な課題です。 近年,感染症の拡大を数理モデル化し,感染者がどう増加するか,どう抑制できるかを分析する研究が盛んに行われています。例えば,「ヒト同士の接触を8割減らすことにより感染症拡大を抑えられる」というよく知られた見解は,SIRモデルと呼ばれる数理モデルから得られた解析結果です。
現状のコロナ社会を鑑みるに,政府や各自治体は,感染者の割合がどう変化しているかを観察し,それに応じて感染者抑制のための方策(例えばロックダウンや緊急事態宣言)を打ち出しています. これは,図2に示すような,ある種の「事象駆動型」フィードバック制御系とみなすことができます。 すなわち,感染者の割合が「ある程度大きくなった」,あるいは「ある程度小さくなった」という事象が発生した時のみに,制御入力(緊急事態宣言を出すか否かなど)の切り替えを行っています。 一方,以上のような対策の中で,どれぐらい感染者が増えればこの切り替えを行えばよいかなどの具体的な指針は現状得られていません。
そこで本研究では,最適制御や事象駆動制御などの制御工学に基づくアプローチにより,感染症の拡大を抑制する方策の設計を目指しています。これより,例えば「どれぐらい」感染者が増えれば「どのような」方策を出せばよいか,そしてその方策によりどれぐらい感染拡大が抑えられるかなど,既存研究に比べより具体的な社会的戦略を得る手がかりになります。さらに,コロナの感染拡大をより模倣した数理モデルに対し方策設計を行うことで,より現実的な問題に対し適用できることを目指します。
図2 感染症の抑制を表したフィードバック制御の図
図3. 感染症の抑え込みに成功した数値シミュレーション例(x は各地域における感染者の割合)
AI集約型サイバーフィジカルシステムのための形式的制御系設計
研究概要
自動運転に代表されるような複雑なサイバーフィジカルシステムでは,車両の運動力学といった連続ダイナミクスで記述される「連続的」機構と,センサやカメラなどから得られたデータから(ニューラルネットワークなどの)機械学習,すなわち AI により離散的に意思決定を行う「離散的」機構が混在したハイブリッドシステムとなります。このような複雑な制御システムにおいて,制御システムの安全性を保証することは極めて困難であり,解決するべき重要課題となっています。
そこで本研究では,形式手法と呼ばれる概念に基づき,AI による意思決定機構を含む制御システムに対し,安全性といった設計仕様を満たすかどうかの検証や制御系設計の構築を行っています。具体的には,図4に示すように,検証したい項目を時相論理式(Linear Temporal Logic, Signal Temporal Logic など)で記述し,機械学習により学習されたモデル(図4: Xの部分)が含まれるシステムが論理式を満たしているかどうかを,形式手法の枠組みに基づき網羅的に検証(モニタリング)します。時相論理は,制御システムの安全性や可到達性など様々な設計仕様を表現できる論理体系です。そして,制御仕様が満たされていない場合は,制御仕様を満たすようなコントローラの設計及び学習を,最適制御理論や強化学習の枠組みを用いることで行います。
本研究は,JST CREST 日仏共同提案「AI 集約型サイバーフィジカルシステムの形式的解析設計手法」(研究代表者:京都大学 末永幸平先生)の支援を受けたものです。
図4. 形式的検証,制御系設計のイメージ図
月極域の探査に向けた未知環境下での経路計画
研究概要
月極域(月の南極,北極域)には,水氷といった揮発性物質の存在が示唆されています。揮発性物質は,将来資源としての利用が見込まれることから,世界各国で月極域探査の検討が進んでおり,日本でもJAXA がローバによる月極域探査ミッションの検討を進めています(図5)。
月極域において,水氷の存在が特に示唆されているのは永久影領域です。永久影とは,太陽が一年中照らされない領域のことを表わしており,深いクレータなどがその一例です(図6)。永久影では太陽が常に照らされないことから,極低温となり水が凝固している,つまり揮発性物質が存在する可能性が極めて高くなります。
しかしながら,永久影は太陽光が一切照らされないため,ローバの太陽光発電による充電が不可能です。そのため,ローバの充電率を常に考慮したうえでの探査が必要不可欠となります。そこで本研究では揮発性物質の探査に向けたローバの充電率制約下での経路計画法の検討を,JAXA と共同で開発しています。まず,揮発性物質を検出するセンサを,ベイジアンネットワークと呼ばれる確率モデルを用いて数理的に表現します。ベイジアンネットワークを用いることで,確率変数同士の因果関係やセンサの誤検出を考慮することができます。そして,得られたセンサモデルに基づき,充電率といった制約条件に対応できる経路計画法(例えばRRT*など)を適用することで,永久影のどの領域に揮発性物質が存在するかを効率的に見つける探査方法の確立を目指しています。本研究は経路計画手法と機械学習を組み合わせた興味深い研究テーマとなっており,将来的には実機実験も計画しています。
図5. (c) JAXA 月極域探査を表した図
図6. (c) JAXA 月の南極地域における永久影の例