일반적인 nn와 RNN구조 차이
RNN의 구조
Ht = A2 = tanh(X1·Wx + Ht-1·Wh + bn)
Yt = f(A2·Wy +bo)
forget gate
input gate
Cell update
output gate
RNN을 어떻게 조립했느냐 따라서 Seq2Seq 구조가 만들어진다.
두개의 RNN 셀로 이루어져 있다.
모든 정보를 내포하고 있는 인코더 RNN 셀의 마지막 시점의 은닉 상태를(context vector) 디코더 RNN셀의 첫 은닉 상태로 넣어준다.
실제 context vector는 수백 이상의 차원을 가지고 있다.
context vector를 Decoder의 초기 은닉상태 사용 할 수도, 디코더가 단어를 예측하는 매 시점마다 input으로 넣어 줄 수도 있다.