๋ฐํ์ฉ ์ฌ๋ผ์ด๋: https://docs.google.com/presentation/d/1ysadmKWzAK9TvJ8QxTdkTegd7T5-nAVor1_x6cmYPDI/edit#slide=id.p
์์ฑ๋ฐ์ดํฐ์์ ํน์ง์ ์ถ์ถํ์ฌ ๊ธฐ์จ, ๋นํฉ, ๋ถ๋ ธ, ๋ถ์, ์ฌํ ์ด 5๊ฐ์ ๊ฐ์ ์ ๋ถ๋ฅํ๋ ๋ชจ๋ธ์ ์ค๊ณ
-> ๊ณผ์ ํฉ ๋ฐ์ !
๋๋ค์ผ๋ก ์ด์ด๋ถ์ธ ์์ฑ๋ฐ์ดํฐ์์ mfcc์ mel spectrogram์ ์ด์ฉํ์ฌ ํน์ง ์ถ์ถ
LSTM, ResNet, Efficient Net, Random Forest ๋ชจ๋ธ์ ์ฌ์ฉ
๋ชจ๋ธ๋ช | train accuracy | test accuracy | top-2 accuracy |
---|---|---|---|
LSTM | 0.6087 | 0.4073 | 0.7120 |
ResNet | 0.6213 | 0.4653 | 0.6967 |
EfficientNet | 0.5170 | 0.4487 | 0.6947 |
RandomForset | -- | 0.4107 | -- |
https://github.com/taeho8271/speech_data_emotions_recog/blob/master/final_project_for_paper.ipynb