Sigmoid, Softmax, Logit 개념 정리

김민준·2025년 9월 16일

1. Sigmoid 함수

Sigmoid 함수는 입력값을 0과 1 사이의 실수 값으로 변환하는 비선형 함수다.
수식은 다음과 같다.

\sigma(x) = \frac{1}{1 + e^{-x}}

활용 예시

Softmax 함수는 다중 클래스 분류 문제에서 각 클래스에 속할 확률을 계산할 때 사용된다.
출력값을 확률로 정규화하여 전체 합이 1이 되도록 만든다.

\text{Softmax}(z_i) = \frac{e^{z_i}}{\sum_{j=1}^{K} e^{z_j}}

여기서

특징

Logit은 확률을 log-odds 형태로 변환한 값이다.
수식은 다음과 같다.

\text{logit}(p) = \ln\left(\frac{p}{1-p}\right)

즉, logit은 아직 확률로 변환되지 않은 모델의 점수(score)이며, 이를 Sigmoid나 Softmax 함수를 통해 확률 값으로 해석할 수 있다.

결국, 딥러닝 분류 문제에서는 logit → (sigmoid/softmax) → 확률이라는 흐름을 통해 모델의 예측 결과를 해석한다.

딥러닝에서 logit은 모델이 직접 산출하는 값이며, 이 값은 그대로는 확률로 해석하기 어렵다.
Sigmoid는 이 값을 이진 분류 문제에서 확률로 변환하는 역할을 하고, Softmax는 다중 분류 문제에서 확률 분포로 변환하는 역할을 한다.

지금까지 해온 여러 활동들을 간략하게라도 정리해보고자 합니다.