センシングした画像や映像・音声を直接的に計算機上で見ても意味を持たない数字の羅列にしか見えません.しかし,それを画像や音声で表現することで我々は何が写っているか・何が聞こえるかといった,情報を理解することができます.これは,意味のない数字の羅列に何らかの高次の情報が埋め込まれており,我々人間がそれを獲得できているということと同値と考えられます.また,近年では,深層学習の発展によって計算機も人間に比肩する高次の情報獲得能力を得ようとしています.ただし,人間や計算機の情報獲得における原理は未だ解明されていません.さらに,人間と計算機は情報獲得においてどのような類似性があるのか・あるいは相違性があるのかといった部分も分かっていないことが多数です.
このあたりの解明を大きな研究の軸にしようとしています.直近では,信号処理・神経回路学・コンピュータビジョンといった観点から情報獲得の根源を研究しようとしており,より具体的には,様々なノイズ等の分布外のデータ表現に対して人間はそれなりにロバストなのに深層学習はどうしてロバストでは無いのか?という点に興味を持って研究しています.
[Keyword]
Deep Neural Network
コンピュータビジョン
医用画像識別・解析
映像符号化