멜 스펙토그램을 dct 처리하면 얻게되는 연관계수를 mfcc라고 한다. 즉 mel scale로 변환한 스펙토그램을 더 적은 값들로 압축하는 과정이라고 할 수 있다. 이미지를 압축하는 과정에서도 쓰이는 변환이다.
wav 파일을 불러와서
y: 음원의 파형 데이터 sr: sampling rate(주파수 분석 및 파형의 시간 간격을 결정)
if sr == 16000
1초당 16000개의 데이터를 샘플링한다는 것