신호 처리

응큼한포도·2023년 11월 10일
0

푸리에 해석 왜 함?

앞에 시리즈에서 푸리에 해석 진짜 길게도 써놨다. 물리와 수학에 관심 없는 사람을 위해서 다 빼고 결과만 간단하게 썼는 데 이거 왜 쓸까?

클로바 같은 음성인식 인공지능이나 음악 딥러닝 같은 거에 쓰이는 데이터는 당연히 음원 파일이다. 보통 wav파일을 mel-spectrogram이나 MFCC로 가공해서 딥러닝 모델에 적용해서 클로바를 만드는 것이다.

wav파일을 가공하는 과정이 바로 푸리에 해석이다. 실제 음원에서 우리가 주파수와 시간에 대한 데이터를 뽑아내는 게 중요하다.

물론 앞의 푸리에 해석에서 설명하듯이 파동의 무한한 경우의 수를 고려해야 되는 데 컴퓨터는 무한한 파동을 고려 못한다. 무한한 거 고려하면 고장나서 적당히 갯수로 푸리에 해석을 만들어서 파동을 표현해야 한다.

그걸 바로 이산 푸리에 변환이라고 부른다. 음악, 음성 딥러닝은 이산 푸리에 해석에서 시작하여 시간을 고려한 SFTF (단시간 푸리에 변환)을 얻고 그걸 mel-scale을 적용해서 데이터를 얻는 다. 앞으로 mel-spectrgram을 얻는 방법을 차근차근 설명하겠다.

profile
미친 취준생

0개의 댓글