강의 소개
3강에서 배운 BERT를 가지고 자연어 처리 Task를 해결해 봅니다. 🧐
단일 문장 분류 모델은 주어진 문장에 대하여 특정 라벨을 예측하는 것입니다.
활용 분야로는 리뷰의 긍정/부정 등의 감성 분석, 뉴스의 카테고리 분류, 비속어 판단 모델 등이 있습니다.
Reference
사용할 데이터셋
**참고로, KLUE 중 의존 구문 분석 task란?
- 단어 사이의 관계를 분석하는 task
- 의존소와 지배소를 구분하는 task
- 지배소 : 의미의 중심이 되는 요소
- 의존소 : 지배소가 갖는 의미를 보완해주는 요소
- e.g.) 충무공 이순신 => 이순신:지배소, 충무공:의존소
- 분류 규칙
- 지배소는 후위언어이다. 즉 지배소는 항상 의존소보다 뒤에 위치한다
- 각 의존소의 지배소는 하나이다.
- 교차 의존 구조는 없다.
- 분류 방법
- sequence labeling 방식
- 각각을 토큰으로 바라보고 모델 입장에서 토큰이 의존소인지 지배소인지 분류
- 의존구문 분석은 자연어 형태의 그래프로 구조화하여 각 대상에 대한 정보를 추출 가능!!
문장 분류 task
단일문장분류학습