이 글은 논문을 읽고 정리하기 위한 글입니다.
내용에 오류가 있는 부분이 있다면 조언 및 지적 언제든 환영입니다!
간단한 개념 위주로 정리할 예정입니다.
개인적으로 Audio & Speech 분야의 Sound Classification 에서 중요하다고 생각하는 논문을 정리해보았습니다.
Consistent Teaching
Data Augmentation
방법 각각 적용하여 학습하는 방법입니다.Architecture
Comment
->
기호를 Teacher -> Student로 KD 하는 것
으로 사용하겠습니다.Teacher 모델이 가벼운 경우
(EffNet-B0, DenseNet-121, AST-Tiny)가 성능이 더 좋았습니다.Multi-Loss
Ensemble
결과 분석