ClovaCall: Korean Goal-Oriented Dialog Speech Corpus for Automatic Speech Recognition of Contact Centers (Interspeech 2020)
https://github.com/clovaai/ClovaCall
결국 논문에서 사용은 못했지만, 음성인식 관련해서 구현해야되는 부분에서 많은 도움을 받았다.
사실 데이터 구하는게 젤 어려웠는데, 열심히 구글링해본결과 한국어 음성-자막 데이터셋은 이 세개가 구할 수 있는 거의 전부였음.
데이터 구하는게 일이다. 머신러닝 쪽으로 나가지 않길 잘했다.