데이터 과학 - 10(KNN)

박승현·2023년 11월 20일
0

데이터과학

목록 보기
11/12
post-thumbnail

K Nearest Neighbors

  • kNN : 가장 가까운 k개의 점
  • 가까운 점의 특성을 알고있을때 이를 활용해 새로운 점의 특성을 파악하는 방법임

  • 특징
    • 데이터 기반 분석
    • 데이터 분포를 가정하지 않음
      • 데이터가 가까이 있으면 비슷할 것이다라고만 가정함
    • 회귀문제, 분류문제등에 적용 가능
  • 1등이 여러개일 경우
  • 데이터가 균일하지 않으면

  • 적절한 k값 찾기
    • k를 1부터 증가시켜가면서 가장 오류가 적은 k값 선택

  • 거리(가까운 점에서 사용할 거리는 어떻게 구하는지)

  • 장,단점

  • 인덱싱
    • 먼저 그룹을 지어놓고 가까운 점을 그룹내에서만 찾는 것
  • KD-Tree
  • VP-Tree
  • KNN-Graph
profile
KMU SW

0개의 댓글