개요 Naïve Bayes는 $n$개의 특성을 지닌 샘플 데이터 $\mathbf{x}$가 주어졌을 때, 이 샘플 데이터가 $K$개의 클래스 $y1, y2, \dots y_k$ 중 하나에 속할 확률을 결정한다. 즉, 각 클래스에 대해 $$ P\left(yk|\mathbf
개요 SVM (Support Vector Machine)은 클래스 별 데이터를 가장 잘 구분하는 최적의 Hyperplane을 찾는 알고리즘이다. 최적의 하이퍼플레인은 하이퍼플레인에 의해 양분된 두 공간 내에 있는 가장 가까운 데이터 포인트 간의 거리 (Margin)이
개요 Decision Tree Classifier는 트리 모양의 순차형 다이어그램을 통해 주어진 데이터를 분류한다. 데이터를 기반으로 조건을 자동 생성 및 판단하고, 이를 통해 최종 결과에 이른다. 대표적인 트리 생성 알고리즘에는 CART가 있다. 트리 분할 기본적으
Logistic Function (=Sigmoid Function) 입력된 값에 0과 1 사이 값을 할당한다. $$ y(z)=\frac{1}{1+\exp(-z)} $$ Logistic Regression Feature 변환 Logistic Regression에서 Lo
Linear Regression Feature와 연속형 결과값 사이의 관계를 설명하는 선형 방정식을 찾는 알고리즘 Input Feature Vector $\mathbf{x}=\left(x1,x2,\dots,x_n\right)$에 대응되는 결과값 $y$가 있을 때, $y
모델이 과도하게 복잡해져 일반화 성능이 떨어지는 문제를 완화하기 위하여 모델의 파라미터나 구조에 인위적을오 패널티를 부과하는 기법이다. Overfitting을 방지하고, 모델 복잡도를 제어한다. LASSO (Least Absolute Shrinkage and Sele