ht = wx * x + wrec * ht-1
문제 : short term dependency
보충
다음으로 전해질 hidden
Ot(output)*tanh(c)(현재 cell state 얼마나 반영)
cell state가 없다. output gate가 없다.
LSTM 보다 GRU가 좋은 경우가 많다. -> 파라미터수가 더 적기 때문에
이해가 안됌 이걸 굳이 해줘야되나?
output나올때 cell state 안쓰이네..? 왜 힘들게 cell state 만듬?