profile
투빅스 15&16 음성세미나 입니다.

[7주차] Unsupervised Singing Voice Conversion

본 논문은 텍스트, 음계 등에 구애 받지 않고 한 가수의 목소리를 다른 가수의 목소리로 변환하는 비지도형 네트워크를 제안한다.

2021년 12월 8일
·
2개의 댓글
·
post-thumbnail

[7주차] LPCNET: IMPROVING NEURAL SPEECH SYNTHESIS THROUGH LINEAR PREDICTION

작성자 : 권오현

2021년 12월 8일
·
2개의 댓글
·

[6주차] PARALLEL WAVEGAN

PARALLEL WAVEGAN : A FAST WAVEFORM GENERATION MODEL BASED ON GENERATIVE ADVERSARIAL NETWORKS WITH MULTI-RESOLUTION SPECTROGRAM 논문 본문 이동 Abstact 논문이

2021년 11월 30일
·
1개의 댓글
·

[5주차] SLU survey

작성자: 투빅스 15기 조효원 Background 인간의 언어를 처리하는 모든 딥러닝 연구들의 최종적인 목표는 사람에 버금가는, 다른 말로는 "사람과 자유롭게 소통이 가능한 artificial agent"를 만드는 것이다. 즉, 음성 언어 처리의 궁극적 목표는 음성

2021년 11월 26일
·
1개의 댓글
·

[4주차] 딥러닝 기반 음성합성(2)

작성자: 이성범

2021년 11월 15일
·
3개의 댓글
·
post-thumbnail

[3주차] 딥러닝 기반 음성합성(2) Deep Learning, Tacotron2, Transformer

Text를 DT를 활용해 Cluster로 나누면 DT의 독립성, 공간의 이진분할을 바탕으로한 feature 생성 때문에 맥략적인 의미 파악이 어렵게 된다.이에 따라 비선형성을 활용할 수 있는 Deep Learning을 활용해 End to End 구조로 TTS Task를

2021년 11월 13일
·
6개의 댓글
·

[3주차] 딥러닝 기반 음성합성(3)

음성 합성의 경우 주어진 Text를 Speech로 변환해 주는 System

2021년 11월 10일
·
4개의 댓글
·

[2주차] 딥러닝 기반 음성합성(1)

이번 주차에서는 지난 주차의 디지털 신호처리에 이어 음성 모델링 방식인 Source Filtering 모델을 살펴본 후, 딥러닝 이전에 많이 사용된 음성 합성 모델인 Unit-Selection과 HMM 모델을 살펴보고자 합니다.

2021년 11월 5일
·
3개의 댓글
·
post-thumbnail

[2주차] 딥러닝 기반 음성인식 기초

Audio Autio Tagging (음향 이벤트 인식)은 오디오 신호에서 발생하는 이벤트 종류를 찾는 문제이다. 아기의 웃음이나 기타의 소리가 동시에 있는 소리는 독특해서 즉시 인식됩니다. 하지만 전기 톱 소리와 믹서기 소리처럼 유사한 소리가 동시에 포함된 오디오는

2021년 10월 30일
·
5개의 댓글
·
post-thumbnail

[1주차] 디지털신호처리(DSP) 기초

투빅스 음성 세미나 1주차: DSP 기초 스터디 자료입니다.

2021년 10월 9일
·
5개의 댓글
·