Delving Deep Into the Generalization of Vision Transformers Under Distribution Shifts
Delving Deep Into the Generalization of Vision Transformers Under Distribution Shifts
Information
2022년 09월 02일 (금) | 발표자: 이민섭
Overview
ViT 가 computer vision 분야에서 널리 사용되고 있는데 실제 문제를 풀고자 한다면 OOD data 에 대한 robustness 가 매우 중요하다.
허나 ViT 의 generalization 성능에 대해서는 아직 많이 알려지지 않았다.
따라서 이 논문에서는 distribution shift 를 총 4가지 category 로 분류하고 ViT 의 generalization 성능을 CNN 과 비교하여 어떠한 점이 다른가를 알아본다.
그리고 generalization 성능이 강화된 ViT 구조를 제안한다.
Replay on YouTube