Sim to Real Gap,動的環境に対する強化学習の基盤研究
Offline Policy Learning with Simulations and Online Policy Tuning for Real Systems
限られたデータでの環境適応を念頭に,オフラインで学習する方策としてどのようなアーキテクチャを採用すればよいかなどを検討.
Online Policy Tuning における Online Learning の応用
逐次的意思決定AIのプロセス制御への応用研究
プラント制御の知識を埋め込んだ帰納バイアス入り方策モデルの研究
ダイナミックシミュレータづくりやサロゲートモデル構築
2025年9月現在,池本は強化学習やオンライン学習の研究者という立ち位置で,課題解決の上で使えそうな制御理論,制御理論内の概念は積極的に導入するという立場をとっています.理論と応用のバランスはできるだけとろうと心がけています.
Scope:「第一原理でそれなりに忠実度の高いシミュレータが構築できる」or「データから信頼性の高いサロゲートモデルが構築できる」というドメインを対象としています.
学生さんと取り組みたい研究テーマ例は以下のスライドの通りです.
注意:私自身に研究室受け入れの権限はないので,学部研究室配属や大学院試験合格後に,まずは高井研究室に配属される必要があります.