名古屋工業大学
工学研究科工学専攻 情報工学系プログラム メディア情報分野
工学部 情報工学科 メディア情報分野
私たちは動画像理解を中心に,計算機が実世界を理解するための研究を幅広く行っています.動画というメディアは,映像だけでなく音声やテキスト,さらには状況や文脈までも含むマルチモーダルな情報源です.スポーツ映像,医用画像,監視カメラ映像など,多種多様な分野への応用を考えて,AI技術の可能性を拡げています.
Vision Transformer (ViT)や注意機構 (Attention) を活用し,映像の空間的および時間的情報を統合的に学習することで,人物の行動や意図を深く解析する技術を探究しています.
先進的なデータ拡張手法を開発し,学習データの不足を補完.また,未知の動作クラスにも対応可能な柔軟で汎用性の高いzero-shot学習モデルの構築にも取り組んでいます.