[AIVLE SCHOOL] 머신러닝(7) - Support Vector Machine

춤추는 머쉬룸·2024년 10월 17일

AIVLE SCHOOL 6기

목록 보기
51/80
post-thumbnail

10/17 2, 3세션

A. SVM (Support Vector Machine)

  • 분류를 위한 기준선, 즉 결정 경계선을 찾는 알고리즘
  • 성능을 높이기 우해 정규화 작업 필요
  • 분류와 회귀에 모두 사용 가능

A-1. 용어

  • 결정 경계 : 서로 다른 분류값을 결정하는 경계
  • 벡터 : 2차원 공간 상에서 나타나는 데이터 포인트
  • 서포트 벡터 : 결정 경계선과 가장 가까운 데이터 포인트
  • 마진 : 서포트 벡터와 결정 경계 사이의 거리. 마진을 최대로 하는 결정 경계를 찾는 것이 SVN 의 목표임

A-2. 비용 (C)

  • 비용을 낮게 잡음 : 이상치들이 있을 가능성을 크게 봄
  • 비용을 높게 잡음 : 이상치들이 있을 가능성을 작게 봄

B. 커널 트릭

  • 매핑 함수 : 저차원 데이터를 고차원 데이터로 옮겨주는 함수
  • 커널 트릭 : 데이터를 실제로 고차원으로 옮기지 않지만, 옮긴 것과 같은 효과를 냄

B-1. 선형 커널

  • 데이터가 선형 적으로 분리 가능한 경우에 사용

B-2. 다항 커널

  • 두 벡터 간의 관계를 다항식 형태로 확장해 비선형 테이터 분류 가능

B-3. RBF 커널

  • 비선형 데이터를 고차원 공간으로 변환해 복잡한 패턴 학습
  • cost 와는 다른 gamma 를 줄 수 있음


C. SVM 함수

  • from sklearn.svm import SVC 사용

0개의 댓글