📌 Attention is all you need (2017, 구글)📌 RNN 구조를 사용하지 않고 Attention만으로 구현한 모델 📌 기존의 seq2seq 모델에서 인코더는 입력 시퀀스를 하나의 벡터 표현으로 압축하는데 이 과정에 서 입력 시퀀스의 정보