cnn은 convolutoin layer를 통해 필터연산을 하는것이기 때문에 위치정보에 따른 특징을 잘 뽑아낼수 있습니다. 한편 rnn은 recurrent layer를 통해 시계열데이터, 시퀀스 데이터를 특징을 잘 뽑아낼수 있습니다. 시계열 데이터 특성상 서로의 시간에 따른 데이터가 연관성이 높으며 단어와 단어간의 관계를 나타낸 문장도 시퀀스데이터라 할수있습니다. 따라서 문장에 대한 빈칸을 추론할때 rnn 계열이 더 잘 맞습니다.
이것은 또한 조건부 확률론과 밀접한 관계를 보이는데 그 이유는 현재 일어날 확률을 계산할때 그전것이 일어났다는 가정하에 반드시 다음것이 일어나는 마르코프 가정이 포함되어 있기 때문입니다. 이 가정을 통해 시간에 대한 또 하나의 가중치를 두어 그전에 일어났던 특징을 학습시킵니다.