데이터 분포를 학습해 결정경계(Decision boundary)를 만들어 데이터를 분류(classification)하는 모델
사후확률 우도확률 * 사전확률
사후 확률값을 가장 크게 만들어주는 클래스로 분류하는 것
사전 확률 : 데이터가 k번째 클래스에서 뽑혔을 확률
Density funciton:
우도 확률 P(X|Y): 각 샘플이 i.i.d할 때, PDF(probability density function)의 곱과 동일
데이터 X=x를 분류하기 위해 판별 함수를 정의해야 함
판별 함수는 에 대한 값을 뱉는 함수
=
=
=
두 번째 가정에 따라 quadratic 항을 삭제할 수 있어 선형 판별 함수를 갖게 됨
판별 함수
데이터를 통한 추정값 사용 --> 표본을 뽑아서 사용
판별함수
--> 데이터가 선형이나 비선형이냐에 따라서 QDA ,LDA의 성능이 다르기 때문에 데이터에 따른 알맞은 모델을 사용하는 것이 중요
--> 따라서 모든 모델의 개념을 알고 상황에 따라서 골라서 쓰는 능력이 중요하다.