P(Y|X)를 계산할 수 있으면 우리가 원하는 프로그램을 만들 수 있다.
하지만 P(Y|X) 직접 구하기 어려울 때 이용한다.
베이즈 정리 공식

베이즈 정리란 조건부 확률을 구하는 공식이다.
베이즈 정리 공식 P(A|B) = P(B|A)P(A)/P(B)

사후 확률(posterior)을 직접 계산하기 어렵기 때문에 가능도를 이용한다.
하지만 가능도만으로 사후 확률을 완전히 근사할 수 없다.
P(Y|X) = P(X|Y)P(Y)/P(X)
posterior ∝ likelihood X prior
만약 prior가 uniform distribution을 따르지 않는다면?
- 전체 메일 중에서 스팸 메일의 수 자체가 적다고 하자
- P(Y = 스팸) = 1/3, P(Y = 햄) = 2/3
- 분포는?
- X>= 6일때 스팸으로 분류하면 된다.

정리