[딥러닝] Sigmoid function, Cost function of Logistic regression

zzwon1212·2023년 12월 15일

목록 보기

1/34

1. Sigmoid function

binary 사건 Y의 발생 확률
- $P(Y=1) = p$
- $P(Y=0) = 1-p$
오즈(odds): 성공 확률과 실패 확률의 비율
- $odds = {p \over 1-p}$
로짓(logit): odds의 로그 변환
- $logit(p) = \log({p \over 1-p})$
- 0에서 1까지의 확률을 실수 전체의 범위로 변환하는 역할

위의 logit에 선형 회귀 모형을 적용한 것을 Logistic regression이라고 한다.
- $\log({p \over 1-p}) = \beta_0 + \beta_1x_1 + \cdots + \beta_kx_k$
여기서는 독립변수 $X$ 가 1개인 simple logistic regression으로 식을 전개해보자.

\log({p \over 1-p}) = \beta_0 + \beta_1x \\ \, \\ e^{\log({p \over 1-p})} = e^{\beta_0 + \beta_1x} \\ \, \\ {p \over 1-p} = e^{\beta_0 + \beta_1x} \\ \, \\ p = (1-p)e^{\beta_0 + \beta_1x} \\ \, \\ p = e^{\beta_0 + \beta_1x} - pe^{\beta_0 + \beta_1x} \\ \, \\ p + pe^{\beta_0 + \beta_1x} = e^{\beta_0 + \beta_1x} \\ \, \\ p = {e^{\beta_0 + \beta_1x} \over 1 + e^{\beta_0 + \beta_1x}} \\ \, \\ p = {{e^{\beta_0 + \beta_1x} \over e^{\beta_0 + \beta_1x}} \over {1 + e^{\beta_0 + \beta_1x} \over e^{\beta_0 + \beta_1x}}} \\ \, \\ p = {1 \over 1 + e^{-(\beta_0 + \beta_1x)}} \\

위의 수식 전개를 통해 구한 p에서 $z = \beta_0 + \beta_1x$ 로 치환하면 sigmoid function을 아래와 같이 나타낼 수 있다.

Logistic regression
- $\hat{y} = \sigma(w^Tx + b)$ , where $\sigma(z) = {1 \over 1 + e^{-z}}$

$J(w, b) = {1 \over m} \sum_{i=1}^{m} L(\hat{y}^{(i)}, y^{(i)}) = -{1 \over m} \sum_{i=1}^{m}[y^{(i)} \log{\hat{y}^{(i)}} + (1-y^{(i)}) \log{(1-\hat{y}^{(i)})}]$

JUST DO IT.