
[Audio processing] Audio data feature 추출 이해하기 (2)
·
Audio
Audio data feature extraction을 위한 대표 방법 중 하나인 MFCC에서, 푸리에 변환을 통해 스펙트럼을 얻는 과정까지 살펴보았다. 이제 그 다음 단계인 Mel spectrum부터 차근차근 알아보자.~ 입력 신호를 Mel scale로 변환 : Mel filter bank 적용 로그를 취하여 로그 Mel spectrogram 얻기 DCT 수행 MFCC 계수 추출 Audio 신호는 시간에 따른 음압, 즉 time-domain의 표현이다. 여기에 FFT를 적용하여 frequency-domain의 표현이 가능해지며, 이를 spectrum이라고 했다. spectrum의 강점은 주파수의 대역별 분석이 용이하다는 것이다. 주파수 대역별로 가진 고유의 특징을 추출할 수 있다. 그리고 그 정보를 추..