경사 소멸(W요소가 1보다 작을 때)
경사 폭발(W요소가 1보다 클때)
RNN은 DMLP,CNN보다 심각하게 발생 - 긴 입력 샘플이 자주 발생하기 때문 - 가중치 공유 때문에 같은 값을 계속 곱함
LSTM은 가장 널리 사용되는 해결책