1장 - 처음 만나는 자연어 처리

Park·2022년 7월 7일

자연어처리

목록 보기

1/1

핵심 키워드 : 모델, 딥러닝, 레이블, 학습,

입력 → 모델 → 출력
- 입력 : 자연어
- 모델 : 입력에 대해 특정 범주일 확률 반환하는 함수
- 출력 : 확률 (후처리 후 자연어)
- 학습 : 정답과 가까운 출력을 할 수 있게 모델 update 하는 일련의 과정

그림에서 Task 1에 해당함
특징
- 자연어의 풍부한 문맥(context)를 내재화
- 다음 단어 맞추기, 빈칸 채우기 등 대규모 말뭉치 이해하는 과정
  - 다음 단어 맞추기 : GPT 계열 모델 (티끌 모아 __ ) ⇒ 이전 문맥을 고려한 자기회귀 방식으로 빈 칸 예측
  - 빈칸 채우기 : BERT 계열 모델 (티끌 __ 태산) ⇒ 앞 뒤 문맥을 고려해서 빈칸 채우기
  - 둘 다 해당하는 단어의 확률은 높이고 나머지 단어는 낮추는 방식으로
pretrain : upstream task를 학습하는 과정
장점
- 자기지도학습(self-supervised learning) : 데이터 내에서 정답을 만들고 이를 바탕으로 모델을 학습하는 방법 ⇒ 수작업 없이도 다량의 학습 data modeling

안녕하세요!