コンピュータビジョン

テキスト検出

画像内のテキスト(文字列)を検出する技術であり、意味のある文のまとまりで検出できる手法を目指している。
検出後、言語認識技術にて意味を理解することで、リアルタイム翻訳や自動運転の補助情報提供に応用できる。
図1(中央)において赤枠が正解の検出結果であり、(右)の赤枠のように単語だけ検出したり、不必要に広く検出、未検出などがしばしば発生する。

図1 (左) 入力画像、(中央) 正解の検出結果、(右) 従来手法で起こる検出結果ミス

スーパーピクセル分割

画像をスーパーピクセルと呼ばれる小領域に分割する技術であり、物体境界に沿った小領域の境界で分割できる手法を目指している。
分割後、画像サイズの変更や物体の検出などに応用する前処理として用いられる。
図2(中央)において赤線がスーパーピクセルの境界であり、(右)のように物体の検出を簡単に実現できる。

図2 (左) 入力画像、(中央) 分割結果、(右) 物体検出に応用した結果

物体検出

画像内の物体を検出しその認識をする技術であり、近年では応用を踏まえて物体を囲ったボックスで検出するか画素単位で検出できる手法を目指している。
一般的に、ボックスでの検出を物体検出、画素単位での検出をインスタンスセグメンテーションと呼ぶ。
物体の位置とその属性が取得できるので、様々な応用が考えられ、特にインスタンスセグメンテーションでは運転画像に特化した手法が自動運転のナビゲーションに応用できる。

図3(左) 入力画像、(中央) 物体検出結果、(右) インスタンスセグメンテーション結果

重要物体検出

人の注目度を推定する技術であり、
物体の全体が同一の重要度となり境界がはっきりしている確率マップを生成する手法を目指している。
自動運転の危険物体アラームなどに応用できる。
図4(右)において白に近い方が重要度が高い領域である。

図4 (左) 入力画像、(右) 重要度マップ