로지스틱 회귀

조권휘·2022년 7월 10일

Codeit_머신러닝

목록 보기

7/13

분류를 하기 위해 사용되는 데 왜 로지스틱 '회귀'인가?

시그모이드 함수도 y의 값이 continuous하기 때문에 회귀라고 볼 수 있다. 분류를 할 때는 주로 0.5보다 큰지 작은지를 확인하고 분류한다.

특징 : 0~1 사이의 return 값을 가진다.
→ 결과 값이 0~1 사이이기 때문에 분류를 할 때 유용하고, 예외값에 크게 영향을 받지 않는다.

→ 이러한 성질을 이용하여 최적의 시그모이드 모양의 곡선을 찾아낸다.

각 옵션에 대한 가설함수를 구하고, 데이터의 입력 변수를 가설함수에 넣는다. 이 때 각 옵션에 대한 확률이 나오는데, 이 중 가장 높은 확률의 옵션을 선택하면 된다.

선형 회귀는 정규 방정식을 이용하여 단순 행렬 계산으로 최적의 값을 구할 수 있다.
로지스틱 회귀에서는 정규 방정식과 같은 단순 행렬 연산만으로는 손실 함수의 최소 지점을 찾을 수 없다.

로지스틱 회귀에서는 손실함수 J에 대한 편미분 원소들이 선형식이 아니다. 지수로 포함된 식은 일차식으로만 표현하기 불가능하기 때문이다.

본 포스트는 코드잇 강의를 공부하며 정리한 내용입니다! 자세한 설명은 "코드잇 머신러닝 강의를 참고해주세요!

안녕하세요 :) Data/AI 공부 중인 한국외대 컴퓨터공학부 조권휘입니다.