💭 (입력값, 직전까지 계산된 히든벡터)를 기반으로, 개별 또는 순차 데이터를 처리하여 예측을 수행하는 "재귀적" 모델
📑 Attention Is All You Need : Self-Attention, Scaled-dot product, Multi-head Attention