物体認識
画像・映像中に映る物体を識別する技術について,特に環境変動やラベルに含まれるノイズに頑健なアプローチに焦点を当てて基本技術の開発・拡張を行っています.
予測結果の不確実性推定(メタ認知機能を持つ画像認識)
予測結果だけではなくその不確実性を提示する技術
機械学習モデルにとって未知入力はゼロにならないため,予測を完璧に行うことは現実的ではありません.そのため,予測の結果を用いて人が意思決定を行う場合などは,予測結果に加えてその不確実性を提示することが求められます.本研究では,予測結果の不確実性を高精度に推定するための基本技術の開発・拡張を行うとともに,予測結果が不確実なサンプルをクラウドソーシングを活用して人手で検証することで,予測の信頼性を向上させることを試みます.
関連文献:
松永直輝,斎藤奨,中野鐵兵,小川哲司,``予測の不一致に基づく深層学習モデルの不確実性推定とクラウドソーシングを用いた映像監視への応用,'' 第24回画像の認識・理解シンポジウム (MIRU2021),XX-XX,pp.1-4,July 2021. (to appear)
映像検索
インターネット上に存在する膨大な映像情報からユーザが求めている映像を抽出する技術
映像検索は,インターネット上に存在する膨大な映像情報からユーザが求めている映像を抽出する技術です.パターン認識・機械学習技術を活用し,基本技術の開発・拡張を行っています.なお,米国国立標準技術研究所(NIST)が主催する評価ベンチマークTRECVIDにおいて世界1位の精度を達成しました.
関連文献:
Kotaro Kikuchi, Kazuya Ueki, Tetsuji Ogawa, Tetsunori Kobayashi, ``Video semantic indexing using object detection derived features,’’ Proc. The 2016 European Signal Processing Conference (EUSIPCO2016), pp.1288-1292, Aug. 2016. [DOI] [Scopus](映像検索のための特徴表現学習)
Kazuya Ueki, Koji Hirakawa, Kotara Kikuchi, Tetsuji Ogawa, Tetsunori Kobayashi, ``Waseda Meisei at TRECVID2017: Ad-hoc video search,’’ Notebook paper of the TRECVID 2017 Workshop, Gaithersburg, Nov. 2017. [Scopus] [1st place at TRECVID 2017 Ad-hoc Video Search task](TRECVID2017の成果)
Kazuya Ueki, Yu Nakagome, Koji Hirakawa, Kotaro Kikuchi, Yoshihiko Hayashi, Tetsuji Ogawa, Tetsunori Kobayashi, ``Waseda Meisei at TRECVID2018: Ad-hoc video search,'' Notebook paper of the TRECVID 2018 Workshop, Gaithersburg, Nov. 2018. [Scopus](TRECVID2018の成果)