[GD-P2] 나이브 베이즈 분류, F1-score

[AIFFEL 대전 1기] 학습일지

목록 보기

34/42

조건 확률은 2가지 종류 존재
두 사건이 독립적일 때(두 사건이 서로 영향을 끼치지 않음)
$P(A \cap B) = P(A) * P(B)$
$P(A|B) = P(A)$
$P(B|A) = P(B)$
두 사건이 종속적일 때
$P(A \cap B) = P(A) * P(B|A)$

조건 확률의 정의를 사용해서 나이브 베이즈 정리를 증명할 수 있다.

$P(B|A) = \frac {P(A|B)P(B)}{P(A)}$

증명: $P(B|A) = \frac {P(A \cap B)} {P(A)} =\frac {P(B \cap A)} {P(A)} =\frac {P(A|B)P(B)}{P(A)}$

다항일 경우....

$P(A|w_0, w_1, ... ,w_n)=\frac {P(w_0, w_1, ... , w_n|A) * P(A)}{P(w_0, w_1, ... , w_n)}$

나이브 베이즈 정리를 사용한 스팸 메일 필터를 구현했다고 하자. 이메일 10개, 스팸 메일이 3개, 'free'라는 단어가 들어간 메일이 4개가 있다고 하자. 이제 'free'가 들어간 이메일이 스팸 메일인지 아닌지 판단하자.

$p(spam) = \frac {3}{10}$
$p(free) = \frac {4}{10}$
$P(free|spam) = \frac {2}{3}$ (스팸 메일 중 free가 들어간 이메일의 확률)

답: $P(spam|free) = \frac {P(free|spam)P(spam)}{P(free)}$ $= \frac {{\frac {2}{3}} * {\frac {3}{10}}}{{\frac {4}{10}}} = 0.5$

(Precision) = $\frac {TP}{TP + FP}$

(Recall) = $\frac {TP}{TP + FN}$

Precision과 Recall은 trade-off 관계이고 두 지표가 높을수록 좋은 모델이다.

Accuracy
True를 True로, False를 False로 옳게 예측한 경우. 가장 직관적으로 모델의 성능을 나타내는 평가 지표. 그러나 data의 domain이 불균형하면 예측 성능이 낮아진다.

(Accuracy) = $\frac {TP + TN}{TP + FN + FP + TN}$

F1 Score
Precision과 Recall의 조화 평균. 데이터 label이 불균형할 때 모델의 성능을 정확히 평가할 수 있고 성능을 하나의 숫자로 표현한다.

(F1-score) = 2 x $\frac {Precision x Recall}{Precision + Recall}$

AI 초심자