1. SVM(Support Vector Machine)

SVM 이란?

데이터를 분리하기 위해 직선이 필요하지만, 직선이 한쪽으로 치우쳐져 있을 경우 데이터에 변동이나 노이즈가 있을 때 구분을 못하는 경우가 발생하게 된다.

이를 해결하기 위해 Margin을 이용하게 된다.

하지만, 일반적인 데이터의 경우 결정경계(boundary)를 넘어서 다른 집단의 데이터가 분포하는 경우가 매우 많이 존재한다.

이 경우 SVM은 적당한 Error를 허용해 최소화하는 Margin을 결정한다.

이때 오분류 에러를 허용하는 파라미터는 C 이다.

$f(x) = x^TB + B_0$ 의 초평면을 정의
- $B와 B_0$ 를 유일하게 만들기 위해 $|B|=1$ 의 조건이 필요
- 만약 $B$ 가 다르면 다른 경우마다 다른 해가 발생

Dicision Rule 정의
- $if(x_i^TB + B_0) > 0 \quad$ $then \quad y = 1 \brace otherwise \quad y = -1$
- $y_i(x_i^TB + B_0)$ 가 항상 양수가 되도록 만들기 위한 Rule을 정의
- 즉, 초평면이 양수이면 y=1 일때, 수식이 양수 반대로 초평면이 음수이면 y=-1일때, 수식이 음수
Margon을 최대로 만다는 계수를 정의
- $max_{B,B_0,|B|=1}M, \quad where \; y_i(x_i^TB+B_0) \ge M$
- 즉, 초평면이 M보다 클때, $B,B_0,|B|=1$ 인 상황에서 M을 최대화 하는 것
|B|를 최소화 하는 문제로 치환 가능
- $min_{B,B_0}|B|,\quad where \; y_i(x_i^TB+B_0) \ge 1, \quad M = 1/|B|$
- |B|를 최소화 하는 것이 곧 M을 최대화 하는 것

$f(x) = x^TB + B_0$ 의 초평면을 정의
Error 발생 시 Margin을 최대화
- $max_{B,B_0,|B|=1}M, \quad where \; y_i(x_i^TB+B_0) \ge M(1-ξ_i)$
  $ξ \ge 0, \sum ξ_i \le constant$
- ξ가 1을 넘길 경우는 boundary를 넘어 다른 집단에 속하는 경우
- constant(일정 상수)는 Error 허용 범위를 지정
- 즉, constant가 커지면 Error가 커지는 것
|B|를 최소화 하는 문제로 치환 가능
- $min_{B,B_0}|B|,\quad where \; y_i(x_i^TB+B_0) \ge 1-ξ _i,\quad M = 1/|B|$
- |B|를 최소화 하는 것이 곧 M을 최대화 하는 것