삼각형과 원을 나누는 선
아래 두 경우 중 원과 삼각형을 더 잘 나눈 경우는 어디일까.

잘 나눈다는 정의 필요
• 정확히 나누었는가? (빨강, 파랑)
• 일반화가 잘 되었는가? (파랑)
왜 파란색이 더 일반화가 좋다고 했을까?
파란 분류 선의 경우
• 원과 삼각형을 잘 나누고 있을 뿐 아니라,
• 각 클래스의 데이터 샘플로부터 가장 멀리 위치해 있음
• 그렇기 때문에 일반화 성능이 좋음
• 샘플로부터 분류 선까지의 거리를 마진(margin)이라고 함

• 이 샘플은 학습 데이터 중 일부에 해당하며
• 마진을 구성하는 이 데이터(원, 세모)를 서포트 벡터(support vector)라고 함
SVM은 두 데이터를 나누는 직선(고차원의 경우 초평면) 을 찾고자 함
이때, 찾고자 하는 직선(혹은 초평면)과 평행한 두 개의 직선(초평면)을 만들 수 있고
이 두 직선 사이의 거리를 마진이라 함
SVM의 경우 마진을 최대화 하는 최적 직선을 만드는 것이 목적
최대 마진 초평면의 선형 방정식 수식은 아래와 같음


---
## 최적화 문제 1
이제 위에서 말한 w와 b를 찾아보자.

## 최적화 문제 2

---
앞선 예시 데이터는 모든 데이터가 이쁘게 나뉘어 있음
따라서 어떠한 오분류도 허용하지 않고 완벽한 선형 모델로 분리가 가능
이를 하드 마진 SVM 이라고 함
하지만, 일반적으로는 어느 정도 데이터가 섞인 경우가 흔함
• 따라서 완벽한 선형 분리가 불가능한 경우가 ↑

슬랙 변수란?
소프트 마진 SVM에서 사용하는 개념으로
완벽하게 선형 분리되지 않는 데이터에 대해 SVM을 적용할 수 있도록 함
