Text data augmentation
Synonym replacement: 특정 단어를 유의어로 교체
Random insertion: 임의의 단어를 삽입
Random deletion: 임의의 단어를 삭제 *
Random swap: 문장 내 두 단어의 위치를 random하게 변경 *
Wei, J., & Zou, K. (2019). Eda: Easy data augmentation techniques for boosting performance on text classification tasks. arXiv preprint arXiv:1901.11196.
논문 한글 번역: https://catsirup.github.io/ai/2020/04/21/nlp_data_argumentation.html
한국어 적용 github: https://github.com/catSirup/KorEDA
https://sooeun67.github.io/data%20science/text-data-augmentation/
참고논문:
1) 조진욱, 정민수, 이정훈, & 정윤경. (2020). 한국어 텍스트 데이터를 위한 변형적 데이터 증강 방법론. 한국정보과학회 학술발표논문집, 592-594.
2) Wei, J., & Zou, K. (2019). Eda: Easy data augmentation techniques for boosting performance on text classification tasks. arXiv preprint arXiv:1901.11196.