미지의 데이터의 라벨을 분류하는 과정은 다음과 같다.
예시
- 학습 데이터(레이블 데이터): 사과 이미지(레이블: 사과), 바나나 이미지(레이블: 바나나)
- 미지의 데이터 입력: 모르는 과일 이미지
- 라벨 예측: 모델은 이미지를 분석하여 사과 또는 바나나로 라벨을 예측한다.
kNN 알고리즘은 데이터 포인트의 라벨을 예측하기 위해 다음 과정을 거친다.
예시
- 데이터 포인트: 새로운 고객의 구매 성향 예측
k개의 가까운 데이터 포인트: 가장 유사한 구매 이력을 가진 기존 고객 5명- 다수결 투표: 이 5명 중 3명이 '고가 제품 구매자', 2명이 '저가 제품 구매자'일 때, 새 고객은 '고가 제품 구매자'로 예측된다.
# KNeighborsClassifier 불러오기
from sklearn.neighbors import KNeighborsClassifier
y = churn_df["churn"].values # 타겟 변수(이탈 여부)
X = churn_df[["account_length", "customer_service_calls"]].values # 특성 변수(계정 기간, 고객 서비스 호출 횟수)
# 이웃의 수가 6인 KNN 분류기 생성
knn = KNeighborsClassifier(n_neighbors=6)
# 데이터에 분류기를 적합시키기
knn.fit(X, y)
# X_new에 대한 레이블 예측
y_pred = knn.predict(X_new)
# 예측값 출력
print("예측값: {}".format(y_pred))
output
Predictions: [0 1 0]