유튜브: 기초부터 수식까지 | Attention Is All You Need 논문 설명지금 우리가 많이 쓰는 ChatGPT, BERT, T5 등 대부분의 모델은 이 논문에서 소개된 Transformer 구조를 기반으로 만들어졌어요.RNN이나 LSTM처럼 순차적으로 처리
본 글은 자연어처리(NLP)에서 널리 쓰이는 Transformer 구조를 간단하게 정리한 글입니다.복잡한 수식보다 '핵심 개념' 위주로 정리해봤어요!2017년 구글 논문 "Attention Is All You Need" 에서 처음 등장한 모델입니다.기존의 RNN, LS