[Python] 머신러닝 완벽 가이드 # 15. 로지스틱 회귀

sun4_you·2023년 4월 30일

파이썬 머신러닝 완벽 가이드

목록 보기

15/20

로지스틱 회귀는 선형 회귀 방식을 분류에 적용한 알고리즘이다. 즉, 로지스틱 회귀는 분류에 사용된다.
로지스틱 회귀가 선형 회귀와 다른 점은 선형 함수의 회귀 최적선을 찾는 것이 아니라 시그모이드(𝜎) 함수의 최적선을
찾고 이 시그모이드 함수의 반환 값을 확률로 간주해 확률에 따라 분류를 결정한다는 것이다.

로지스틱 회귀는 주로 이진 분류(0과 1)에 사용된다.
다중 분류에도 사용이 될 수 있다.
로지스틱 회귀에서 예측 값은 예측 확률을 의미하며 예측 값(예측 확률)이 0.5 이상이면 1로, 0.5 이하이면 0으로 예측한다.
로지스틱 회귀의 예측 확률은 시그모이드 함수의 출력값으로 계산된다.
단순 선형 회귀 𝑦 = 𝑤1𝑥 + 𝑤0가 있다고 할 때
로지스틱 회귀는 0과 1을 예측하기에 단순 회귀식에 적용할 수는 없다.
하지만 Odds(성공확률 p)을 통해 선형 회귀식에 확률을 적용한다. 성공확률이 p이면 실패 확률은 1-p이다.

𝑂𝑑𝑑𝑠(𝑝) = 𝑝/(1 − 𝑝)
하지만 확률 p의 범위가 0 ~ 1 사이이고, 선형 회귀의 반환값인 −∞ ~ + ∞값에 대응하기 위해서
로그 변환을 수행하고 아래와 같이 선형 회귀를 적용한다. 이를 로짓 변환(Logit)이라고 한다.

log(𝑂𝑑𝑑𝑠(𝑝)) = 𝑤1𝑥 + 𝑤0
해당 식을 데이터 값 x의 확률 p로 정리하면 다음과 같다.

𝑝(𝑥) =1/1 + 𝑒-(𝑤1𝑥+𝑤0)
로지스틱 회귀는 학습을 통해서 시그모이드 함수의 𝑤를 최적화하여 예측하는 것이다

My path to becoming contributor from user