3-2. Maximal Margin Classifier

Bard·2023년 3월 26일

Advanced Mathematics for AI

목록 보기

12/20

본 글은 K-MOOC의 인공지능 수학 고급(Advanced Mathematics for AI) 강의를 듣고 요약한 글입니다.

다음과 같이 Blue / Pink 로 구분된 이차원 상의 점들이 있다.

새로운 점이 들어왔을 때 Blue인지, Pink인지 예측하는 문제이다.

이러한 예측을 위해 구분자를 찾아내야 하는 데, 이를 decision boundary라고 하며

다음과 같은 직선 방정식으로 정의해보자.

\beta_0 + \beta_1 X_1 + \beta_2 X_2 = 0

이때 생기는 문제는 가능한 decision boundary가 너무 많다는 것이다.

이때 어떤 decision boundary가 적합한 것인지를 찾아내는 문제가 추가로 발생한다.

다음과 같이 생각해보자.

$i$ 번째 데이터를 $(X_1^{(i)},X_2^{(i)},y^{(i)})$ 라 하자. ( $y^{(i)} ∈ {-1, 1}$ )

이때, $i$ 번째 데이터부터 boundary까지의 거리는 다음과 같다.

y^{(i)}(\beta_0 + \beta_1 X_1^{(i)} + \beta_2 X_2^{(i)})

(단, $\beta_1^2 + \beta_2^2 = 1$ )

Recently broke up with FE engineering