출처: 모두를 위한 딥러닝 강좌 시즌 1 by Sung Kim
Multinomial Classification에서는 각각의 class에 대한 선형 회귀 예측값에 Softmax 함수를 적용한다.
이 함수의 특징은 다음과 같다
1. 0과 1 사이의 값을 반환한다.
2. 각각의 class에 대한 예측값들의 합은 1이다.
- 즉, 각각의 값을 확률로 볼 수 있다는 것이다.
이렇게 반환된 예측값들을 'one-hot' encoding 기법을 이용해서, 가장 큰 값만 1로, 나머지는 0으로 만든다.
그럼 해당 데이터가 여러 class중 어디에 속할 지 예측할 수 있다.
즉, classification이 이루어지는 것이다.
Sofmax Classification에서는 Cost Function으로 Cross-entropy를 사용한다.
Cross-entry cost function 또한 로지스틱의 회귀의 비용 함수와 마찬가지로 예측을 제대로 하는 경우 cost를 적게, 예측을 잘못 하는 경우 cost를 크게 주는 방식으로 작동한다.
로지스틱 회귀의 비용 함수와 Softmax에서의 비용 함수는 달라 보이지만, 본질적으로는 매우 비슷한 함수이다.
cross entropy에서 class의 개수를 2개라 가정하고, 을 , 를 , 그리고 을 에, 를 에 대입해 생각해보면 왜 그런지 알 수 있다.