인코딩과 임베딩에 대해서 얘기가 계속해서 나오는데 솔직하게는 아직까지 정확한 차이는 모르겠다.. 그래도 얼추 비슷한 개념으로써 적어보면
인코딩 : 단어의 고유 성질을 표시하는 것
임베딩 : 특정 단어를 기계가 알아 들을 수 있는 방법으로 수치화 한 것
좀 더 자세히 보면
인코딩은 벡터를 활용해서 A라는 사람이 [소심함, 잘생김, 통통함] 등의 특징을 갖고 있다면 이를 [0.61, 0.24, 0.78] 이런식으로 특징에 대한 수치 데이터를 말한다.
Auto Encoder는 이러한 특징 들에 대해 자동적으로 학습하여 인간이 찾지 못하는 특징조차 활용하기 위한 모델이라고 생각하면 된다.
반면 임베딩은 단순하게 A라는 사람을 표현할 수 있는 벡터를 의미하며 [0.32] 라는 수치를 임베딩 사이즈에 맞게 끔 표현하는 것 뿐이라고 생각하면 된다.
결론적으로 굳이 분류하자면 인코딩은 정보의 분별을 위한 상대성을 파악하는 것이 목적이고, 임베딩은 수치벡터화가 보다 주된 목적이라고 보인다..
참고 블로그는 https://wiserloner.tistory.com/1185 이걸 확인해보자..