K Nearest Neighbors
- kNN : 가장 가까운 k개의 점
- 가까운 점의 특성을 알고있을때 이를 활용해 새로운 점의 특성을 파악하는 방법임
- 특징
- 데이터 기반 분석
- 데이터 분포를 가정하지 않음
- 데이터가 가까이 있으면 비슷할 것이다라고만 가정함
- 회귀문제, 분류문제등에 적용 가능
- 1등이 여러개일 경우
- 데이터가 균일하지 않으면
- 적절한 k값 찾기
- k를 1부터 증가시켜가면서 가장 오류가 적은 k값 선택
- 거리(가까운 점에서 사용할 거리는 어떻게 구하는지)
- 인덱싱
- 먼저 그룹을 지어놓고 가까운 점을 그룹내에서만 찾는 것
- KD-Tree
- VP-Tree
- KNN-Graph