# mfcc
총 2개의 포스트

디지털 신호 처리(DSP) 기초
화자 인식voice agent wake음성을 input으로 받아 디바이스 제어명령을 실행한 결과 음성 합성을 통해 출력TaskSoundSpeech ClassificationAuto-taggingSpeechSpeech-to-Text(음성 인식; STT) = ASR(Aut
2022년 7월 5일
·
0개의 댓글·
0
[7주차] 음성 합성 개념 - 20220121
참고 논문 : HifiGAN이제까지 이미지 도메인에서 GAN을 다뤄보았다.이제부터 음성 데이터로 진행해서, 목표까지 도달해보려고 한다.이미지는 기본적으로 2차원의 픽셀로 이루어져있고, RGB 등의 색 채널이 추가되어 3차원으로 이루어져있기도 하다.음성 데이터의 경우에는
2022년 1월 21일
·
0개의 댓글·
0