NLP란 머신러닝, 딥러닝에 한 분야로 인간의 언어(한국어, 일본어, 중국어, 영어 등)를 기계가 이해하고 생성할 수 있게 하는 기술이다.
전처리란 모델이 데이터를 이해하기 쉽게 가공하는 과정입니다.
단어 임베딩은 단어를 숫자로 바꾸어 주는 기술이다.
특징으로는 단어의 의미를 고려하여 의미가 비슷하면 백터공간에서 가깝게 위치합니다.
단어 임베딩이 가져다 준 이점으로는 모델을 처음부터 학습할 필요없이 사전 훈련된 임베딩을 가져와 사용할 수 있다는 것입니다. 또한 단어를 벡터로 표현함으로써, 모델은 단어가 나타나는 문맥이나 배경 등을 더 잘 포착하고 다음에 나올 단어를 더 정확한 예측을 할 수 있습니다.
백터만 붙임
순서가 있는 데이터를 다루는 신경망이다.
hidden layer에 전에 왔던 정보를 다시 입력으로 되돌려보내는 구조이다.
단점으로는 RNN기반 모델들은 순차적처리를 해 병렬처리가 안되어 학습 속도가 느립니다. 또한 문장이 길어질수록 앞쪽 정보가 뒤에까지 전달이 안됩니다.
Transformer는 순환(RNN)이나 합성곱 없이 어텐션(Attention)만으로 시퀀스를 처리하는 모델이다.
이러한 설계로 문장 내에 모든 토큰들을 한번에 고려할 수 있게 되었고 병렬처리가 가능해져 학습 속도가 훨씬 빨라졌다.
출처:
https://datasciencebeehive.tistory.com/188#google_vignette
https://www.elastic.co/kr/what-is/word-embedding
https://www.ibm.com/kr-ko/think/topics/word-embeddings
https://www.ibm.com/kr-ko/think/topics/natural-language-processing