Long sequence [11-3]

Sung.K·2021년 8월 23일
0

모두를 위한 딥러닝2

목록 보기
22/25

기존 'hihello'와 'charseq'예제에서는 문장 전체를 하나의 셈플로 보고 진행했었다.
하지만 정말 쓸모잇는 RNN을 만들려면 긴 문장의 dataset을 가지고 해야될 것이다.
하지만 아주 긴 문장을 하나의 input으로 사용할 수 없다.
그래서 이번 long sequence에서는 아주 긴 문장이 있으면 특정 size로 잘라서(fixed size siquence) 사용한다.


위 사진의 긴 sentence 문장을 fixed size로 자르려고 한다.
특정 사이즈의 윈도우가 있고, 그 윈도우를 하나씩 오른쪽으로 움직이면서 하나의 chunk를 input x로, 그리고 한charator만큼 오른쪽으로 옮긴 chunk를 y로 반복해서 dataset을 만든다.


forward()는 x라는 input을 넣고 네트워크를 계산할 때 어떻게 계산할지에 대한 정의를 내려준다.

profile
Towards the goal 👀

0개의 댓글