「フカヨミCLIP」の執筆を担当しました。現在様々なシーンで利用されている基盤モデルCLIPについてフカヨミしました。CLIPが画像の局所情報の扱いを苦手にしている点に焦点を当て、CLIPを目利きに育てる対照学習の工夫について解説しています。もちろん単独で読んでもOKですが、CVIMチュートリアル1(もしくはコンピュータビジョン最前線Winter2021)の「ニュウモンVision and Language」とセットで読むのがおススメです。
「フカヨミCLIP」の執筆を担当しました。現在様々なシーンで利用されている基盤モデルCLIPについてフカヨミしました。CLIPが画像の局所情報の扱いを苦手にしている点に焦点を当て、CLIPを目利きに育てる対照学習の工夫について解説しています。もちろん単独で読んでもOKですが、CVIMチュートリアル1(もしくはコンピュータビジョン最前線Winter2021)の「ニュウモンVision and Language」とセットで読むのがおススメです。
「ニュウモンVision and Language」の執筆を担当しました。本書は過去のコンピュータビジョン最前線の各チュートリアル記事の再録となっています。「ニュウモンVision and Language」はコンピュータビジョン最前線の誤字の修正の他、キーワードの索引が追加され検索性が向上しています。
Vision and Language初学者の方向けの知の高速道路としてご利用いただけると幸いです。
正誤表(ダウンロード)