# Tobigs1516-voice-seminar

1개의 포스트

[Audio] PARALLEL WAVEGAN

PARALLEL WAVEGAN : A FAST WAVEFORM GENERATION MODEL BASED ON GENERATIVE ADVERSARIAL NETWORKS WITH MULTI-RESOLUTION SPECTROGRAM 논문 본문 이동 Abstract 논문이 제시하는 Parallel WaveGAN은 distillation 과정이 없고 빠르며 메모리 소비가 적은 GAN 기반 보코더이다. Generator non-autoregressive WaveNet multi-resolution STFT loss + adversarial loss 단순한 구조이지만 높은 퀄리티의 speech가 생성된다. (MOS: 4.16) Introduction 기존의 Deep Generative model들은 좋은 퀄리티의 speech를 생성한다. 하지만 WaveNet 같은

2022년 1월 21일
·
0개의 댓글
·