[부스트캠프 AI Tech] 공부 정리 (D+20)

Becky's Study Lab·2023년 12월 3일
0

Boostcamp

목록 보기
20/42

자연어 처리 과제 중 [과제 2. "RNN_based_Language_Model"]를 하면서 의문이었고, 찾아본 내용을 정리하였다.
PyTorch 함수에 대해서 추가로 찾아보았고, 여기에 정리하려고 한다.
기본적인 RNN, Vanilla RNN 구현을 했고, 그 과정에서 코드적인 의문점을 정리하였다.

nn.Embedding()

임베딩을 해주는 함수인데, 의문이 드는 점이 있다.

🤔 그냥 token2id로 int(scalar) 값으로 표현한 것을 쓰면 되지, 왜 임베딩을 해야하나?

🤔 만약 I love you에서 token2id 의 결과로, I = 1, love = 2, you = 3으로 표현하게 된다면?
: I < you 이런 의미를 가지게 되는데, 의미상 말이 안된다. 느낌 자체가 이상한 느낌이다. 단어간에 대소 비교를 하게 되는 거다...

profile
배우고 공부하고 기록하는 것을 멈추지 않는다.

0개의 댓글