[머신러닝 스터디] SVM (Support Vector Machine)

guns.velog·2020년 3월 10일
0

위와 같은 그림이 있을 때, 데이터를 잘 나누려면 어떻게 하는것이 좋을까?

  • 그림에서 보는것과 같이 선을 긋는것이 좋을것 같아!
  • 그 사이의 공간을 margin이라 부름
  • margin이 최대가 될수록 좋다!

위 그림에서는 조금 다른 경우다. 빨간색의 데이터가 초록색 데이터의 범주에 껴있기도 하고, 초록색 데이터가 빨간색 데이터와 너무 가깝기도 하다. 즉 저런 데이터를 기준으로 위와같이 선을 긋는다면, 분류가 별로 좋지 않을것이란 얘기다.

그럼 어떻게해~? 어느정도의 오차를 허용함으로써 (위 그림과 같이 어느정도 어긋난 데이터는 허용한 상태로 margin의 최대값을 구함) 좋은 분류를 이끌어낼 수 있다는거~


더 자세한 내용들이 있지만 (아주 많지만) 이후 포스팅에 올릴 예정

0개의 댓글