i.i.d.
) 가정을 잘 위배하기 때문에 순서를 바꾸거나 과거 정보에 손실이 발생하면 데이터의 확률분포도 바뀌게 된다
=
=
- 시퀀스 데이터를 다루기 위해선 길이가 가변적인 데이터를 다룰 수 있는 모델이 필요
- 고정된 길이 만큼의 시퀀스만 사용하는 경우 ( Autoregressive model ) 자기회귀모델이라고 부른다
- 또 다른 방법은 바로 이전 정보를 제외한 나머지 정보들을 라는 잠재변수로 인코딩해서 활용되는 잠재 AR 모델
- 잠재변수 를 신경망을 통해 반복해서 사용하여 시퀀스 데이터의 패턴을 학습하는 모델이 RNN
H
: 잠재변수- ` : 활성화함수
W
: 가중치행렬b
: bias
💡 이 모델은 과거의 정보를 다룰 수 없다
RNN은 이전 순서의 잠재변수와 현재의 입력을 활용하여 모델링한다
- 잠재변수인 를 복제해서 다음 순서의 잠재변수를 인코딩하는데 사용
RNN의 역전파는 잠재변수의 연결그래프에 따라 순차적으로 계산