logit과 sigmoid
logit과 sigmoid 함수는 서로 역함수의 관계이다.
logit은 logist + probit의 합성어로, 오즈에 자연로그를 취한 것이다.
여기서 오즈(odds)란, 클래스 C1,C2가 있을 때 C2로 분류될 확률에 대한 C1으로 분류될 확률을 의미한다.
odds(p)=P(C2)P(C1)=1−pp
이는 실패에 대한 성공의 비율이기도 하다.
이에 대해 자연로그를 취하면 logit 함수가 된다.
logit(π)=log1−ππ
sigmoid는 logit과 역함수 관계이다.
log(1−ππ)=t
1−ππ=et
(1+et)⋅π=et
∴sigmoid(t)=π(t)=1+etet
Softmax
softmax는 logit으로부터 유도될 수 있다.
C1,C2,...,Ck인 클래스 k개를 생각하자.
i번째 클래스 Ci와 k번째 클래스 Ck의 비율은 다음과 같다.
ti=logP(Ck)P(Ci)
P(Ck)P(Ci)=eti
여기에 1부터 k−1까지 합을 구하면,
∑i=1k−1P(Ck)P(Ci)=P(Ck)1−P(Ck)=∑i=1k−1eti
이를 다시 쓰면,
P(Ck)=1+∑i=1k−1eti1
이다. 여기서
P(Ck)P(Ck)=etk=1
이고
P(Ci)=P(Ck)⋅eti 이므로,
∴P(Ci)=etk+∑i=1k−1eti1⋅eti=∑i=1ketieti
이다.