시퀀스-투-시퀀스 구조

박경민·2023년 3월 20일

[ChatBot Project]

목록 보기

9/11

단어가방의 예시와 같은 경우 Yes/No 대답만 제시하여 응답이 부족하다.

BOWs 모델의 한계
1. 고정된 사이즈의 인풋.
2. 어순 고려 X
3. 고정된 사이즈의 아웃풋 (Yes/No)

위의 사진은 RNNs 의 도식화이다.

구체적인 문장으로 돌아가서,
다음과 같은 문장에 쉼표, 마침표를 포함하여 모든 단어를 취합하자. 그리고 각각에 코드를 부여하자. 'hello' 는 5번, 'Kirill' 은 영어 단어가 아니라 0번, ',' 는 9번을 부여하자. SOS는 1이고, EOS 는 2이다.

모든 입력단계가 끝나면 예측을 시작한다. (푸른색 단계)
가지고 있는 선택 사항에 대한 확률 점수를 산출한다.
2만 개의 단어 중 가장 높은 확률 선택 > 잔여정보 다음 레이어 > 선택 > 전달 > 전택 > 전달 > 선택.

이때 입력을 받으며 계속해서 정보를 업데이트하는 부분을 인코더, 이를 바탕으로 예측하며 전 단어에 기반에 다음 단어를 출력하는 것을 디코더라고 한다.
EOS 지점까지 인코딩, 그 이후에 디코딩을 진행한다.

Mathematics, Algorithm, and IDEA for AI research🦖