3eung_h10n.log
로그인
3eung_h10n.log
로그인
데이터과학 - 4(Logistic_regression)
박승현
·
2023년 9월 25일
팔로우
0
0
데이터과학
목록 보기
5/12
Logistic Regresison
이진 분류 문제(Binary Classification)
Y가 0또는 1인 경우의 회귀 분석
앞의 일반적인 regression에서는 y의 값이 자유로움
이진 분류의 활용
이메일 필터링(스팸, 정상 메일의 분류)
고양이 분류(이 사진이 고양이 사진인가 아닌가)
Instagram feed(이 피드를 보여줄 것인가)
주식 시장 예측(지금 팔아야하는지 사야 하는지)
분류 문제와 선형 회귀
멀리 떨어진 데이터가 있는 경우에는 선형 회귀 분석이 잘 동작하지 않을 수 있음
Sigmoid 함수(로지스틱 함수)
S형태의 모양이 나오는걸 sigmoid함수라고 함
점대칭 함수, x가 발산하면 1로 수렴 0으로 수렴하면 y도 0으로 수렴
Logistic Regression
선 대신 sigmoid 함수를 사용
빨간글씨 : MSE(선형 회귀에서 사용하는 경사 하강법의 코스트 함수)
logistic에서 기존의 코스트 함수는 평평한 구간이 생겨 경사하강법이 잘 동작 하지 않는다
새로운 cost function
새로운 함수 C의 평균을 사용
빨간선 : 기존 함수의 코스트 값(기존 함수는 실제 값과의 차이의 제곱이기 떄문에 최대 1정도에 불과함
파란선 : 새로운 코스트 함수를 적용한 값
코스트 함수는 항상 미분 가능해야함
구간에 따라 나눠진 함수를 하나로 합침
y가 0또는 1만 있기 때문에 가능함
경사 하강법
코스트가 최소가 되는 w,b를 찾는 과정은 동일함
입력이 2차원일때
박승현
KMU SW
팔로우
이전 포스트
데이터과학 - 3.1(Linear Regression Practice)
다음 포스트
데이터 과학 - 5(Softmax Regression)
0개의 댓글
댓글 작성