데이터과학 - 4(Logistic_regression)

박승현·2023년 9월 25일
0

데이터과학

목록 보기
5/12
post-thumbnail

Logistic Regresison


이진 분류 문제(Binary Classification)

  • Y가 0또는 1인 경우의 회귀 분석
    • 앞의 일반적인 regression에서는 y의 값이 자유로움
  • 이진 분류의 활용
    • 이메일 필터링(스팸, 정상 메일의 분류)
    • 고양이 분류(이 사진이 고양이 사진인가 아닌가)
    • Instagram feed(이 피드를 보여줄 것인가)
    • 주식 시장 예측(지금 팔아야하는지 사야 하는지)

분류 문제와 선형 회귀

  • 멀리 떨어진 데이터가 있는 경우에는 선형 회귀 분석이 잘 동작하지 않을 수 있음

Sigmoid 함수(로지스틱 함수)

  • S형태의 모양이 나오는걸 sigmoid함수라고 함
    • 점대칭 함수, x가 발산하면 1로 수렴 0으로 수렴하면 y도 0으로 수렴

Logistic Regression

  • 선 대신 sigmoid 함수를 사용
    • 빨간글씨 : MSE(선형 회귀에서 사용하는 경사 하강법의 코스트 함수)
  • logistic에서 기존의 코스트 함수는 평평한 구간이 생겨 경사하강법이 잘 동작 하지 않는다
  • 새로운 cost function
    • 새로운 함수 C의 평균을 사용
      • 빨간선 : 기존 함수의 코스트 값(기존 함수는 실제 값과의 차이의 제곱이기 떄문에 최대 1정도에 불과함
      • 파란선 : 새로운 코스트 함수를 적용한 값
  • 코스트 함수는 항상 미분 가능해야함
    • 구간에 따라 나눠진 함수를 하나로 합침
      • y가 0또는 1만 있기 때문에 가능함

경사 하강법

  • 코스트가 최소가 되는 w,b를 찾는 과정은 동일함
  • 입력이 2차원일때
profile
KMU SW

0개의 댓글