チュートリアル
本会議前日に下記チュートリアル講演を行います.今年のチュートリアルは【基礎】【先端】【実践】という三つのセッション構成を企画しています。
【基礎】を学ぶ
先端の研究をキャッチアップするためには、何よりも基礎をしっかりと学ぶことが大事です。そこで本セッションでは、パターン認識の礎となる特徴抽出について産業技術総合研究所の小林匠様に、また今日の高度なコンピュータビジョンにおいてもはや必須のツールと言える凸最適化について東京工業大学の小野峻佑先生にご講演頂きます。
【先端】を知る
日進月歩のこの分野においては、トップカンファレンスで発表される論文をいち早くキャッチアップし、幅広く先端の動向を知ることが肝要です。そこで、近年ホットな話題である画像キャプションの自動生成について東京大学の牛久祥孝先生に、また一人称視点映像解析について東京大学の米谷竜先生に、それぞれ最先端の動向をご紹介頂きます。
【実践】を積む
理論を実際に応用・実践するためには、基礎研究とはまた異なった困難が伴います。そこで本セッションは若手プログラム(研究に役立つツール・ノウハウ習得)と共催の特別講演企画として、深層学習フレームワーク Chainer のリード開発者である株式会社Preferred Networksの得居誠也様をお招きし、ご講演頂きます。
日時:
2016年8月1日(月)
場所:
MIRU2016会場にて
参加費:
本会議費用に含まれます。
タイムテーブル
11:00~12:20【基礎】を学ぶ1 「ヒストグラム特徴抽出と特徴変換」小林匠(産業技術総合研究所)
<概要>
画像認識において用いられる特徴量は,HOGやSIFTに代表されるようにその多くが頻度ヒストグラムの形式で定義されている.特徴量を構成する基礎事象さえ決めてしまえば,後はその生起頻度を数え上げるだけで容易に特徴を抽出することができるため,画像認識に限らず幅広い分野で適用されている枠組みである.生起頻度の考えをさらに推し進めることでより高次の共起頻度へと自然に拡張でき,判別力の高い共起特徴量を構成できる.ここでは,画像や動画像認識に有効な共起特徴を中心にヒストグラム特徴抽出について解説する.さらにヒストグラム形式の特性を生かした特徴変換手法についても言及する.適切な特徴変換を施すことで,容易に認識性能を高めることができる.
<略歴>
平成17年東京大学大学院情報理工学系研究科知能機械情報学専攻を修了。同年、株式会社東芝研究開発センターに入社。平成18年に独立行政法人産業技術総合研究所に入所し今に至る。平成21年に筑波大学において博士号取得。大学時代よりパターン認識の理論と応用に関する研究を行い、画像・動画蔵を含む様々な入力信号からの特徴抽出手法やその識別法などを研究対象とする。
13:30~14:50【基礎】を学ぶ2 「明日から使える凸最適化~近接分離最適化を中心に~」小野峻佑( 東京工業大学)
【講演スライド】
<概要>
近接分離原理に基づく凸最適化技術(以下,近接分離最適化)が画像処理・コンピュータビジョン分野で注目を集めている.近接分離最適化は,L1ノルムや核型ノルムのような微分できない関数を含む凸最適化問題を効率的に解くことができる技術であり,スパース/低ランク正則化を必要とするアプリケーションをはじめとして幅広く用いられている.本チュートリアルでは,近接分離最適化の応用が広がった背景と基本的な定義を説明した後に,代表的かつ応用範囲の広いアルゴリズムである交互方向乗数法(ADMM)と主-双対近接分離法(primal-dual splitting method) を,応用事例やサンプルコード(MATLAB)を紹介しながら解説することで,明日からでも使えるようになることを目指す.
<略歴>
2010 東工大・工・情報工卒.2014 同大学 大学院理工学研究科 博士課程修了(集積システム専攻).博士(工学).2012~2014 日本学術振興会特別研究員(DC1).現在,東工大 像情報工学研究所 助教.主として画像処理,信号処理,数理最適化の研究に従事.電子情報通信学会学術奨励賞(2013),電子情報通信学会論文賞(2014),IEEE SPS Japan Chapter Outstanding Student Journal Paper Award(2014),丹羽保次郎記念論文賞(2015),手島精一記念研究賞博士論文賞(2016)各受賞.
15:05~15:45【先端】を知る1 「画像キャプションの自動生成」牛久祥孝( 東京大学)
【講演スライド】
<概要>
画像の内容を言葉で表現する画像キャプション自動生成技術は、2010年代に研究が始まった萌芽的な研究課題である。計算機のより柔軟な画像理解を実現する重要な取り組みだが、コンピュータビジョン分野と自然言語処理分野それぞれでのチャレンジングな課題を内包する複合的な研究課題でもある。本講演では、この課題に対する一連の取り組みについて、その歴史的な流れとアプローチを整理しながら概説する。また、派生研究として動画へのキャプション生成や視覚的チューリングテストなど、言語と視覚を融合する新たな取り組みについても紹介する。
<略歴>
2013年 東京大学 大学院情報理工学系研究科 博士課程修了。博士(情報理工学)。2013年 日本学術振興会特別研究員(DC2)および米国 Microsoft Research Redmond Intern。2014年 日本電信電話株式会社 コミュニケーション科学基礎研究所 入所。2016年より東京大学 情報理工学系研究科 講師、現在に至る。主として画像キャプション生成や画像認識、クロスメディア理解の研究に従事。2011年 ACM Mutlimedia Grand Challenge Special Prize on the Best Application of a Theoretical Framework、MIRU インタラクティブセッション賞、2012年 電子情報通信学会パターン認識・メディア理解研究会 PRMU研究奨励賞、各受賞。
15:45~16:25【先端】を知る2 「一人称視点映像解析の最先端」米谷竜( 東京大学)
【講演スライド】
<概要>
GoPro HEROやGoogle Glassといった頭部装着型のカメラを用いることで,撮影者の視点から見た外界の映像(一人称視点映像)を記録することができる.このような一人称視点映像には,撮影者の(1)頭部運動(2)手元(3)対話相手を詳細に観測可能,さらに(4)視線情報と自然に組み合わせることが可能といった特性があり,動作認識,インタラクション認識,映像要約などの課題においてその利用が注目されている.本チュートリアルでは,ICCV,CVPR,ECCVといったトップカンファレンスにおいて近年発表された関連研究を上述の四点に基づいて整理,紹介するとともに,今後取り組むべき方向性について議論する.
<略歴>
2013年 京都大学情報学研究科 博士後期課程修了.博士(情報学).2012年~2014年 日本学術振興会特別研究員(DC2/PD).2014年より東京大学生産技術研究所 助教.一人称視点映像の解析,視覚的注意のモデル化に興味を持つ.2010年 ICPR2010 IBM Best Student Paper Award,2012年 MIRU優秀学生論文賞,2014年 電子情報通信学会パターン認識・メディア理解研究会 PRMU研究奨励賞,2014年 電子情報通信学会 情報・システムソサイエティ論文賞,2015年 MIRU Outstanding Reviewers,2016年 情報処理学会 山下記念研究賞,各受賞.
16:40~18:00【実践】を積む 「深層学習フレームワーク Chainer の開発と今後の展開」得居誠也 (株式会社Preferred Networks)
【講演スライド】
<概要>
画像認識を筆頭に、機械学習が応用される様々な分野で深層学習が適用され、予測性能のめざましい発展に寄与している。深層学習を様々な問題に適用するにあたっては、ニューラルネットをユーザ自身が設計する必要があり、またそれに合わせて学習手法をカスタマイズすることもある。そこで、ニューラルネットの設計と実装を素早く行うために様々なフレームワークが開発されてきた。これらのフレームワークのほとんどはオープンソースで開発が進められ、特に研究者自身による貢献が大きなウェイトを占めている。本チュートリアルでは、その中でも特に研究・開発自体の高速化に焦点を当てている Chainer を紹介し、一般的な使い方から、開発がどのように進められているかや、今後の展開について述べる。
<略歴>
株式会社Preferred Networksリサーチャー。2012年に東京大学大学院情報理工学系研究科数理情報学専攻において修士号を取得後、株式会社Preferred Infrastructureに入社。分散機械学習フレームワーク Jubatus の OSS 開発に参加する。2014年より現職。2016年に社会人として同研究科コンピュータ科学専攻の博士課程に進学。現在は深層学習フレームワーク Chainer の開発をリードしている。