Delving Deep Into the Generalization of Vision Transformers Under Distribution Shifts

Information

2022년 09월 02일 (금) | 발표자: 이민섭

Slide

Download the slide

Overview

ViT 가 computer vision 분야에서 널리 사용되고 있는데 실제 문제를 풀고자 한다면 OOD data 에 대한 robustness 가 매우 중요하다.

허나 ViT 의 generalization 성능에 대해서는 아직 많이 알려지지 않았다.

따라서 이 논문에서는 distribution shift 를 총 4가지 category 로 분류하고 ViT 의 generalization 성능을 CNN 과 비교하여 어떠한 점이 다른가를 알아본다.

그리고 generalization 성능이 강화된 ViT 구조를 제안한다.

Replay on YouTube

Page updated

Google Sites

Report abuse