이전 시퀀스의 정보를 가지고 앞으로 발생할 데이터의 확률분포를 다루기 위해 조건부확률을 이용할 수 있음
시퀀스 데이터를 다루기 위해선 길이가 가변적인 데이터를 다룰 수 있는 모델이 필요
잠재변수 를 신경망을 통해 반복해서 사용하여 시퀀스 데이터의 패턴을 학습하는 모델
가장 기본적인 RNN 모형은 MLP와 유사한 모양
RNN은 이전 순서의 잠재변수와 현재의 입력을 활용하여 모델링
역전파를 일정 길이로 끊음으로서 문제 해결
lstm, gru 설명 : https://excelsior-cjh.tistory.com/185
기울기소실, 발산 설명 : https://it-ist.tistory.com/27
rnn에서 tanh 활성화함수 사용 이유 : https://brightwon.tistory.com/10