**언어 모델(Language Model, LM)**은 **단어 시퀀스(문장)에 확률을 할당(assign)**하는 모델입니다.
쉽게 말해, 어떤 단어들이 가장 자연스럽게 이어지는지 판단하는 모델입니다.
언어 모델을 만드는 방법은 크게 두 가지입니다.
최근에는 인공 신경망 언어 모델이 압도적으로 높은 성능을 보여주고 있습니다.
언어 모델은 주어진 문장에서 다음에 올 단어를 예측하거나,
빈칸을 채우는 방식으로 문장의 적절성을 판단합니다.
NLP 연구에서 "언어 모델링(Language Modeling)"은
주어진 단어로부터 아직 모르는 단어를 예측하는 작업을 의미합니다.
언어 모델은 확률 계산을 통해 더 자연스러운 문장을 선택합니다.
예시:
기계 번역
P(나는 버스를 탔다) > P(나는 버스를 태운다)
오타 교정
P(달려갔다) > P(잘려갔다)
음성 인식
P(나는 메론을 먹는다) > P(나는 메롱을 먹는다)
언어 모델은 조건부 확률로 다음 단어를 예측합니다.
예를 들어 다섯 번째 단어의 확률은:
전체 문장의 확률은 각 단어의 조건부 확률을 곱하여 계산합니다.
예:
"비행기를 타려고 공항에 갔는데 지각을 하는 바람에 비행기를 [ ? ]"
검색 엔진은 사용자가 입력한 단어 시퀀스를 기반으로
다음에 올 가능성이 높은 단어를 예측하여 추천 검색어를 제공합니다.
📌 정리