언어 모델 (Language Model)

김회정·2023년 7월 14일

머신러닝

목록 보기

5/7

이 글은 "밑바닥부터 시작하는 딥러닝 2"의 내용을 정리한 글입니다.

1. 언어 모델

언어 모델(Language Model, LM)은 언어라는 현상을 모델링하고자 단어 시퀀스(문장)에 확률을 할당(assign)하는 모델이다. 이러한 특징으로 인해 언어 모델은 단어 순서의 자연스러움을 확률적으로 평가할 수 있다. 특정 문장이 주어졌을 때 주어진 확률분포에 따라 다음 순서에 적합한 단어의 확률을 언어 모델은 알려줄 수 있다. 예를 들어 "nice to meet"이라는 문장이 컨텍스트로 언어 모델에 주어졌을 때, 언어 모델은 다음에 올 단어에 대한 확률을 계산해 "you"라는 단어가 확률상 가장 적합한 단어라는 결론을 내릴 가능성이 높다.

2. 언어 모델의 수식 표현

언어 모델을 수식으로 표현하기 위해 $w_{1}, w_{2}, ..., w_{n}$ 이라는 n개 단어로 구성된 문장을 생각해보자. 이때 단어가 $w_{1}, w_{2}, ..., w_{n}$ 의 순서로 출현할 확률을 $p(w_{1}, w_{2}, ..., w_{n})$ 로 나타낼 수 있다. 이 확률은 여러 단어가 동시에 일어날 확률로 해석할 수 있다.