深層学習技術の発展や実務応用が加速し、深層学習モデルの解釈可能性は以前にも増して重要視されています。一方で、これらの技術は信頼可能な利用を妨げるいくつかの問題点を抱えています。本研究室では、深層学習モデルの推論における視覚的説明やメカニズム的説明の問題解消に取り組んでいます。最近の研究では、ディープビジョンモデルの説明を悪化させる長年の問題を回避する方法を発見し、トップ国際会議であるCVPRにて論文が採択されました。
3D言語フィールドとは、3D空間とテキストを対応付けた表現で、言語クエリを与えた時に、対応する3次元領域の抽出(ローカリゼーション)を可能にします。近年、高解像度の3D空間再構成技術や、3D言語場技術の研究が進んでいますが、3D言語フィールドを都市規模化することや、ローカリゼーション以外のタスク(3D空間内の計数、測量、比較、編集、空間推論)への拡張には課題があります。本研究室では、これらの課題に対応した技術開発を進めております。
三次元の再構成は、二次元では欠落していた深度の情報を提供することで、物体の詳細な形状解析や立体構造の把握を可能にします。本研究室では、断層画像、Point Cloud等の3Dデータに対して深層学習を適用し、飛跡検出や稀な事象の探索をおこなっています。また、医療データや生命神経科学のデータ解析でも三次元物体検出を活用して研究を進めています。