動作認識

動作認識について,最新の手法,データセット,様々なタスクについて解説しました.

複数のドメインからなる動作認識データを学習するマルチドメイン学習において,モデルに依存しないアダプタを利用する手法を提案しました.


アテンションマップを可視化する手法であるABNを動作認識に拡張子,インスタンスセグメンテーションで抽出した領域にアテンションを近づけるObject-ABNを提案しました.

動作認識用のデータ拡張手法はほとんどありません.そこで物体領域をセマンティックセグメンテーションで抽出しmixするObjectMixを提案しました.また従来手法であるVideoMixよりも性能が高いことを示しました.


動画像を認識するときに,動画像がどれだけ劣化するとどれだけ性能に影響が与えるのかを調査し,0.5%〜1%程度の性能低下に抑えるための圧縮率を見出しました.


動作認識のための特徴量シフト

Vision Transformerを用いた動作認識のために,特徴量をシフトするのではなく,アテンションを前後の時刻のフレームに適用する相互アテンション機構を提案しました.



動作区間検出:Temporal Action Localization


VQA

Kento Terao, Toru Tamaki, Bisser Raytchev, Kazufumi Kaneda, Shin’ichi Satoh. An Entropy Clustering Approach for Assessing Visual Question Difficulty, IEEE Access, vol. 8, pp. 180633-180645, 2020, doi: 10.1109/ACCESS.2020.3022063, 2020/Sept/07. [PDF] [Data on GitHub] 

Kento Terao, Toru Tamaki, Bisser Raytchev, Kazufumi Kaneda, Shun'ichi Satoh, Which visual questions are difficult to answer? Analysis with Entropy of Answer Distributions, Visual Question Answering and Dialog Workshop at CVPR 2020, online, June 14 2020.

Kento Terao, Toru Tamaki, Bisser Raytchev, Kazufumi Kaneda, Shin'ichi Satoh. Rephrasing visual questions by specifying the entropy of the answer distribution, IEICE TRANSACTIONS on Information and Systems, Vol.E103-D, No.11, pp.2362-2370, Nov. 2020. DOI: 10.1587/transinf.2020EDP7089 [PDF]

人物の移動軌跡解析

平川翼, 山下隆義, 玉木徹, 藤吉弘亘, 動画像を用いた経路予測手法の分類, 電子情報通信学会論文誌D, Vol.J102-D, No.2, pp.53-67, Feb. 2019.  DOI:10.14923/transinfj.2018JDR0003 [paper PDF] 

Tsubasa Hirakawa, Takayoshi Yamashita, Toru Tamaki, Hironobu Fujiyoshi, "Survey on Vision-based Path Prediction," International Conference on Human-Computer Interaction (HCII2018), Jul. 2018 [paper PDF]