[batch_size, sequence_length]
sequence_length
는 각 데이터(예: 문장) 내의 토큰 수모든 단어에 대해 미리 정의된 차원의 벡터를 저장하는 행렬을 포함
합니다. 이 행렬의 각 행은 사전의 하나의 단어를 나타내며, 각 단어는 고유한 벡터로 표현됩니다.입력으로 주어진 정수 인덱스
에 해당하는 벡터를 embedding 행렬에서 검색(lookup)[batch_size, sequence_length, embedding_dim]
embedding_dim
은 embedding 벡터의 차원이며, 사전에 정의된 값embedding_dim
이 4라고 하면, "cat"에 해당하는 embedding 벡터는 4차원 벡터가 됩니다. [0, 3, 1]
(여기서 3은 "and"의 인덱스)에 대해 embedding lookup을 수행하면, [1, 3, 4]
가 됩니다(여기서 batch_size
는 1로 가정).