3장 분류모델(4) KNN, K-Nearest Neighborhood

TaeJong Kim·2024년 1월 6일

머신러닝 교과서

목록 보기

4/10

KNN 알고리즘은 분류알고리즘 중 가장 직관적인 알고리즘이다.
또한 KNN알고리즘은 전형적인 lazy learner(게으른 학습모델)이다.

parameter를 학습하여 저장하는 모델(parametic model)과 달리 훈련세트 자체를 전부 저장하는 방식으로 작동하는 모델(non-parametic model)을 말한다.
학습과정에서 cost가 0이다.

이때 적절한 K를 선택해야 과대/과소 적합을 피할 수 있다.

$d(\mathbf{X}^{(i)}, \mathbf{X}^{(j)}) = \sqrt[p]{\Sigma_k |x^{(i)}_{k} - x^{(j)}_{k}|^p}$

p에 따라 어떤 거리측정 기준을 선택할지 결정할 수 있다.
ex) p=1 -> 맨하튼 거리, p=2 -> 유클리디안 거리(피타고라스 공식)

AI 엔지니어 김태종입니다. 추천시스템, 이상탐지, LLM에 관심이 있습니다. 블로그에는 공부한 기술, 논문 혹은 개인적인 경험을 올리고 있습니다.