[자연어처리]Text data augmentation1

Jae Gyeong Lee·2022년 9월 23일
0

Easy Data Augmentation

  • Text Augmentation - Text Modification

Text data augmentation

  1. Synonym replacement: 특정 단어를 유의어로 교체

  2. Random insertion: 임의의 단어를 삽입

  3. Random deletion: 임의의 단어를 삭제 *

  4. Random swap: 문장 내 두 단어의 위치를 random하게 변경 *

참고논문:
1) 조진욱, 정민수, 이정훈, & 정윤경. (2020). 한국어 텍스트 데이터를 위한 변형적 데이터 증강 방법론. 한국정보과학회 학술발표논문집, 592-594.
2) Wei, J., & Zou, K. (2019). Eda: Easy data augmentation techniques for boosting performance on text classification tasks. arXiv preprint arXiv:1901.11196.

profile
안녕하세요 반갑습니다. 공부한 내용들을 기록하고 있습니다.

0개의 댓글