충분한 데이터를 가져왔니?
그럼 시작함
딥러닝 데이터를 만들기 전에 모아온 음원 파일은 wav파일로 만드는 게 좋다. 인터넷에 올라온 파일들은 mp3, mp4 파일이 대부분이니 wav파일로 먼저 만들자.
import os
import torchaudio
필요한 거 가져오자
folder_path = "/Users/seong-gyeongjun/Downloads/muse"
file_list = os.listdir(folder_path)
모아온 파일을 하나의 폴더에 넣어서 경로 지정을 해주자.
for file_name in file_list:
file_path = os.path.join(folder_path, file_name)
if file_name.endswith('.mp3'):
waveform, sample_rate = torchaudio.load(file_path)
wav_file_paht = os.path.splitext(file_path)[0] + '.wav'
torchaudio.save(wav_file_paht, waveform, sample_rate)
print(f'{file_name}을 wav파일로 저장')
반복문과 torchaudio을 이용해 wav파일로 바꿔준다.
torchaudio는 pytorch와 연동되는 오디오 전용 라이브러리다. 오디오 데이터 가공에 대한 많은 기능이 있고 gpu와 연동가능 하기 때문에 여러 기능을 익히는 걸 추천한다.