1 Day 1 Commit Project (github repository)
Today I Learned
written by 602
seq2seq regression(text2keypoing)에서 zero-padding된 프레임의 영향을 줄이기 위해
Masking을 도입하여, 패딩된 프레임은 손실함수 계산 등의 학습 과정에서 제외되도록 해준다.
Pytorch에서 구현된 코드는 여러 번 보았지만 Tensorflow는 상대적으로 자료가 적다.
Tensorflow 공식문서 를 참고하여 tacotron 모델에 masking 추가하기 완료!
layers.Embedding
에서 mask_zero=True
만 추가하면 된다.layers.Embedding(input_dim=5000, output_dim=16, mask_zero=True)
비슷한 시퀀스 길이의 데이터끼리 mini batch를 구성하도록 하는 방법
불필요한 zero padding을 줄여 연산의 비효율 방지
tf.data.experimental.bucket_by_sequence_length
으로 dataset을 새롭게 생성Dataset
are grouped together by length and then are padded and batched