더 자세히 볼까요???
N은 파랑과 녹색 중 어디 일까?
2번째 거리에 가깝게 설정 ; 세모 그룹
3번째 거리에 가깝게 설정 ; 동그라미 그룹
from sklearn.datasets import load_iris
iris = load_iris()
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
iris.data, iris.target, test_size=0.2, random_state=13, stratify=iris.target
)
# 1) kNN 학습
from sklearn.neighbors import KNeighborsClassifier
# n_neighbors= : 몇개 까지 가까운걸 찾을래?
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)
# 2) accuracy 확인
from sklearn.metrics import accuracy_score
pred = knn.predict(X_test)
print(accuracy_score(y_test, pred))
0.9666666666666667
# 3) 간단한 성과 (?)
from sklearn.metrics import (classification_report, confusion_matrix)
print(confusion_matrix(y_test, pred))
print(classification_report(y_test, pred))
간단한 ㄷ이터를 다룰 때 kNN은 큰 두각을 나타내지 못합니다...
다음 언젠가 실습 시 두각을 나타내는 결과를 보길 기대하며..