Maximum Entropy Model
NLP에서는 다항 로지스틱 회귀를 최대 엔트로피 모델이라고 부른다. 단어 x가 주어졌을 때 범주 c가 나타날 확률은 다음과 같이 계산된다.
P(c∣x)=∑exp(wT⋅f)exp(wcT⋅f)
위의 식에서 f는 단어 x의 feature vector이다. 이 벡터는 연구자의 언어학적 사전지식을 반영할 수 있다는 점에서 초기값 설정에만 개입할 수 있는 이전의 모델들과 비교하여 가장 크게 나타나는 차이점이라고 할 수 있다.
다음 문장을 보자.
SecretariatNNP isBEZ expectedVBZ toTO race tomorrow.
위 문장에서 x=race이다. 연구자의 언어학적 지식에 따라 C={VB,NN}라고 판단했으며, f를 다음과 같이 정의했다고 가정하자.
위 함수에 따라, f는 다음과 같다.
f( VB , race )=[0,1,0,1,1,0]f( NN , race )=[1,0,0,0,0,1]
w가 모두 학습이 끝났다고 가정하면, 위의 식을 이용하여 'race'의 범주를 계산할 수 있다.
참고 자료
[1] ratsgo, 최대엔트로피모델(Maximum Entropy Models)[online]