230202 NLP 3. 텍스트 분류

문소정·2023년 2월 2일
0

1. 텍스트 분류(Text Classification)

  • 주어진 텍스트를 사전 정의된 클래스(Pre-defined Class)들로 분류하는 자연어 처리 태스크
  • ex) 스팸 메일 자동 분류', '사용자의 리뷰로부터 긍정, 부정을 판단하는 감성 분류', '포털 사이트가 언론사의 뉴스들을 문화, 정치 등으로 자동 분류하여 보여주는 뉴스 카테고리 분류' 등
  • 사용하는 딥러닝 모델 : RNN, CNN, BERT 모델로 클래스를 예측
    • 문서 벡터화 : 워드 임베딩을 사용

2. 머신러닝 알고리즘을 사용한 텍스트 분류

1) 이진 분류(Binary Classification)

  • ex) 스팸 메일 분류기

2) 다중 클래스 분류(Multiclass Classification)

0개의 댓글