Classification
: 데이터의 정보를 이용하여 분류하는 모델
KNN
: K개의 데이터를 이용하여 분류하는 모델
- K : 데이터의 수
- Overfitting : K의 값이 너무 적은 경우, 데이터 양이 적어 모델이 제대로 분류하지 못하는 문제
- Underfitting : K의 값이 너무 큰 경우, 모델이 너무 세밀화되어 제대로 분류하지 못하는 문제
Clustering
: 데이터의 레이블없이 훈련하여 군집화하는 모델
K-means Clustering
: 평균값을 이용하여 군집화하는 모델
- K : 군집을 만드는 개수
- 임의로 평균값을 잡기 때문에 모델을 돌릴때마다 결과값이 달라질 수 있음