
๋ฐํ์ฉ ์ฌ๋ผ์ด๋: https://docs.google.com/presentation/d/1ysadmKWzAK9TvJ8QxTdkTegd7T5-nAVor1_x6cmYPDI/edit#slide=id.p

์์ฑ๋ฐ์ดํฐ์์ ํน์ง์ ์ถ์ถํ์ฌ ๊ธฐ์จ, ๋นํฉ, ๋ถ๋ ธ, ๋ถ์, ์ฌํ ์ด 5๊ฐ์ ๊ฐ์ ์ ๋ถ๋ฅํ๋ ๋ชจ๋ธ์ ์ค๊ณ


-> ๊ณผ์ ํฉ ๋ฐ์ !

๋๋ค์ผ๋ก ์ด์ด๋ถ์ธ ์์ฑ๋ฐ์ดํฐ์์ mfcc์ mel spectrogram์ ์ด์ฉํ์ฌ ํน์ง ์ถ์ถ
LSTM, ResNet, Efficient Net, Random Forest ๋ชจ๋ธ์ ์ฌ์ฉ
| ๋ชจ๋ธ๋ช | train accuracy | test accuracy | top-2 accuracy |
|---|---|---|---|
| LSTM | 0.6087 | 0.4073 | 0.7120 |
| ResNet | 0.6213 | 0.4653 | 0.6967 |
| EfficientNet | 0.5170 | 0.4487 | 0.6947 |
| RandomForset | -- | 0.4107 | -- |


https://github.com/taeho8271/speech_data_emotions_recog/blob/master/final_project_for_paper.ipynb