!pip install SpeechRecognition
import speech_recognition as sr
r = sr.Recognizer()
import librosa
import IPython.display as ipd
import matplotlib.pyplot as plt
plt.style.use('seaborn-white')
fig = plt.figure(figsize=(14, 4))
korean_wav, rate = librosa.core.load('data.wav')
plt.plot(korean_wav)
plt.xlabel('Sample')
plt.ylabel('Amplitude')
plt.title('Waveform')
plt.show()
ipd.Audio(korean_wav, rate=rate)

korean_audio = sr.AudioFile('data.wav')
with korean_audio as source:
audio = r.record(source)
r.recognize_google(audio_data=audio,language='ko-KR')

recognize_google() 모델을 사용하여 음성 인식을 진행했는데 1분 미만의 음성파일만 가능했다. 음성 파일의 대부분을 정확하게 인식하여 텍스트로 변환했다.