[MLstudy] KNN - Q&A

juyeon lee·2023년 5월 9일

MLstudy

목록 보기
7/8
post-thumbnail

주 2회 ML & DL Study & Q&A 피드백 진행
해당 포스트
📗 KNN
스터디원🙎‍♀️ @dbswls6685

2023-03-16

❓ 질문 1

Q. K를 정할 때, '계산을 이용할 때에는 데이터 수의 제곱근 값으로 정하기도 한다.'라고 했는데, 계산을 이용한다는게 어떤 의미인지?
A.

❓ 질문 2

Q. K의 크기가 작으면 무조건 좋은건가?
A. K값이 작을수록 주변에 가장 가까운 1개의 케이스를 참조하기 때문에 더 민감하여 정교하게 분류할 것이다. 그러나 분류의 정확도가 높다고는 할 수 없다. 이 경우 학습 데이터는 매우 좋은 결과를 보이지만 테스트 데이터는 과대적합이 발생할 수 있다.

❓ 질문 3

Q. 왜 다른 훈련 데이터가 있는데 모델은 없는가?
A. 기존 데이터와 단순 비교이기 때문에 분류기가 필요없다는말

  • 다른 머신러닝 알고리즘의 경우에는 학습 데이터를 가지고 훈련을 통해 모델을 생성하지만 knn은 그대로 훈련 데이터를 가지고 있을 뿐 모델(분류기)을 생성하지는 않는다. 별도 모델 생성과정 없이 각각의 관측치(instance)만을 이용하여 분류/회귀 등 과업을 수행한다.
  • 학습 절차가 없어, 모델을 별도로 구축하지 않고, 새로운 데이터가 들어왔을 때 그제야 기존 데이터 사이의 거리를 재서 이웃들을 뽑기 때문에 게으른 모델(Lazy model) 또는 Instance-based Learning 이라고도 부른다.

0개의 댓글