참고 서적 🖇
라이브러리 및 용어 정리 🧐
데이터 시각화 - 산점도(scatter plot)
import matplotlib.pyplot as plt
- Matplotlib은 파이썬에서 매트랩과 유사한 그래프 표시를 가능케 하는 라이브러리다.
plt.scatter(bream_length, bream_weight)
plt.scatter(smelt_length, smelt_weight)
- scatter 두 개 쓰면 하나의 산점도로 다른 색깔로 표현해 줌.
sklearn.neighbors 클래스
- 지도(supervised) or 비지도(non-supervised) 이웃-기반(neighbor-base) 학습 방법과 관련된 기능을 제공.
from sklearn.neighbors import KNeighborsClassifier
- sklearn.neighbors 패키지 안에 KNeighborsClassifier를 import 할 수 있다.
KNeighborsClassifier()
- K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용
사이킷런(scikit-learn) KneighborsClassifier 간단 정리 🧐
Parameter
- n_neighbors : 이웃의 개수를 지정(기본값 5)
- p : 거리를 재는 방법, 1은 맨허튼 거리, 2는 -유클리디안 거리(기본값 2)
- n_jobs : CPU 코어 지정 (기본값 1, -1은 모든 CPU 코어 사용)
Method
- fit() : 모델을 데이터로 훈련시킴
- predict() : 모델을 데이터로 훈련하고 예측함 (주어진 값을 가지고 모델이 판단)
- score() : 훈련된 모델의 신뢰도 측정
- kneighbors() : 입력한 데이터에 가장 가까운 이웃 중 n_neighbors 개의 거리와 인덱스를 반환
Function
- train_test_split() : 훈련 데이터 셋과 테스트 데이터 셋으로 나눔.
numpy.arange()
- 주어진 간격 내에서 균일 한 간격의 값을 반환
np.random.shuffle()
index=np.arange(49)
np.random.shuffle(index)