MFCC에 대하여 2

행동하는 개발자·2022년 12월 19일
0

PHM

목록 보기
16/43

1. Mel Filter Bank

달팽이관의 특성을 고려해서 낮은 주파수에서는 작은 삼각형의 필터를 가지고, 고주파 대역으로 갈수록 넓은 삼각형의 필터를 가진다고 생각하면 된다.

그래서 위와 같은 삼각형 필터 n개를 모두 적용한 필터를 멜 필터 뱅크라고 부른다. 그래서 멜 스펙토그램이라는 특징이 만들어 진다.

MFCC 와 Mel-Spectogram

기존의 컴퓨팅 파워가 부족할 때에는 연산량이 적인 MFCC를 무조건적으로 선호하였다면, 최근에는 학습에 GPU 이용이 가능해짐에 따라 Mel-Spectogram을 특징으로 뽑아서 쓰는 경우도 많다.

둘의 차이점은 Correlate와 De-Correlate이다. Mel Spectogram의 경우 주파수끼리 연관하기 때문에 도메인이 한정적인 문제에서 더 좋은 성능을 보이고 MFCC는 연관하지 않기 때문에 일반적인 상황에서 더 좋은 성능을 보인다.

mfcc의 파라미터

librosa.feature.mfcc

y나 s 둘 중 하나만 들어가면 됨.

y: time domain audio signal

sr: sampling rate

S: log mel-spectogram

n_mfcc: mfcc coefficient 개수

dct_type: 1 or 2 or 3

norm: if dct type == 1 -> ortho else, 없어도 됨

mfcc는 음성데이터를 특징벡터화 해주는 알고리즘으로 머신러닝에서 어떤 데이터를 벡터화하는 것은 곧 학습이 가능하다는 의미이기 때문에 상당히 중요한 부분이라고 할 수 있다.

출처: https://m.blog.naver.com/sooftware/221661644808

profile
끊임없이 뭔가를 남기는 사람

0개의 댓글