언어 모형(Language Model)

wandajeong·2023년 1월 14일

NLP/Text Data Analysis

목록 보기

6/12

인과적 언어 모형(=언어모형) : 조건부 확률 형태의 언어 모형

$P(x_n|x_1, x_2, …, x_{n-1})$
- 인공신경망 등의 모형으로 구현하기 쉬움
- 단어를 순서대로 생성할 수 있음
n-gram 언어 모형 : 텍스트에서 최대 n개까지의 단어 조합의 빈도를 세서 언어 모형을 간단히 구현할 수 있음
- storage problem : n이 커질 수록 조합이 폭발적으로 증가하여 많은 저장 공간 필요
- sparsity problem : 텍스트가 충분히 많지 않으면 대부분의 조합은 빈도가 0
신경망 언어모형 (NNLM, Neural Network Langauge Model)
- 원핫 인코딩의 문제점: sparsity, 의미 무시
- 비슷한 단어는 비슷한 임베딩을 갖게 됨
- NNLM은 임베딩의 크기가 $e$ , 은닉층의 크기가 $h$ 일 경우 $we + eh + hw$ 의 파라미터만 필요
  (↔ n-gram은 어휘의 종류가 $w$ 개면 $w^n$ 개의 조합을 저장)
- NNLM의 한계
  - n-gram과 마찬가지로 n개의 단어까지만 반영됨
  - 단어의 위치에 따라 가중치가 달라짐

ML/DL swimmer