[딥러닝] RNN #2

SSOYEONG·2022년 6월 10일

Deep Learning

목록 보기

11/14

Long-short term memory
Separate memory into several types.
The cell stores long-term information
The LSTM can erase, write and read information from the cell.
Hidden state의 memory cell에 입력 게이트, 삭제 게이트, 출력 게이트를 추가하여 불필요한 기억을 지우고, 기억해야할 것들을 정한다.
즉, LSTM은 hidden state를 계산하는 식이 RNN보다 조금 복잡해졌으며 cell state라는 값을 추가함
Cell state 또한 t-1시점의 cell state가 t시점의 cell state를 구하기 위한 입력으로 사용됨
Hidden state와 cell state의 값을 구하기 위해서는 새로 추가된 3개의 게이트를 사용함. forget / input / update

Update, scaled by how much we decide to update.
forget gate와 input gate를 통해.
forget gate에서 일부 기억을 잃은 상태
input gate에서 선택된 기억 + forget gate의 결과값
-> 이 값을 t 시점의 cell state라고 하며, 이 값은 t+1 시점의 LSTM 셀로 넘겨짐
forget gate : 이전 시점의 입력을 얼마나 반영할지 의미
input gate : 현재 시점의 입력을 얼마나 반영할지 결정

The output will be based on our cell state, but will be a filltered version.

LSTM은 gate를 통해 vanishing grate 문제를 개선. 그러나 완벽히 해결한 것은 아님
Long term을 잘 학습
Resnet처럼 정보를 잃어버리지 않게 전달
cell state는 addition and multiplication 연산으로만 이루어져 있음
-> vanishing gradient is small.