Vision Transformer를 처음 발표한 Google Research의 논문 "An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale"를 리뷰해보자
VAE의 수학적 설명