위와 같은 그림이 있을 때, 데이터를 잘 나누려면 어떻게 하는것이 좋을까?
위 그림에서는 조금 다른 경우다. 빨간색의 데이터가 초록색 데이터의 범주에 껴있기도 하고, 초록색 데이터가 빨간색 데이터와 너무 가깝기도 하다. 즉 저런 데이터를 기준으로 위와같이 선을 긋는다면, 분류가 별로 좋지 않을것이란 얘기다.
그럼 어떻게해~? 어느정도의 오차를 허용함으로써 (위 그림과 같이 어느정도 어긋난 데이터는 허용한 상태로 margin의 최대값을 구함) 좋은 분류를 이끌어낼 수 있다는거~
더 자세한 내용들이 있지만 (아주 많지만) 이후 포스팅에 올릴 예정