회사에서 일을 하다가 회의 녹음 파일을 stt기능을 이용하여 회의록을 만드는 걸 보며 너무 놀랐고, 파파고를 숨쉬듯이 돌리고, 갤럭시에 내장된 번역 기능에 놀라던 저는 음성 번역 기능이 생각보다 쉬울 수도라는 생각을해서 만들기로 하였습니다.
pip install googletrans
pip install SpeechRecognition
pip install gTTS
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
print("-- 듣는 중 --")
audio = r.listen(source)
try:
text = r.recognize_google(audio, language='ko-KR')
print(text)
except sr.UnknownValueError:
print('인식 실패')
except sr.RequestError as e:
print('요청 실패: {0}'.format(e))
from gtts import gTTS
from playsound import playsound
text = '스피치 테스트'
ttsk = gTTS(text, lang='ko')
file_name = 'sample.mp3'
ttsk.save(file_name)
playsound(file_name)
파일도 생성이 된다.
https://github.com/jaeeunjeong/Speech2Text2Speech