마켓과 머신러닝 🧐

홍정완·2021년 10월 8일
0

Machine Learning

목록 보기
1/3
post-thumbnail

참고 서적 🖇

라이브러리 및 용어 정리 🧐



데이터 시각화 - 산점도(scatter plot)


import matplotlib.pyplot as plt

  • Matplotlib은 파이썬에서 매트랩과 유사한 그래프 표시를 가능케 하는 라이브러리다.

plt.scatter(bream_length, bream_weight)
plt.scatter(smelt_length, smelt_weight)

  • scatter 두 개 쓰면 하나의 산점도로 다른 색깔로 표현해 줌.

sklearn.neighbors 클래스

  • 지도(supervised) or 비지도(non-supervised) 이웃-기반(neighbor-base) 학습 방법과 관련된 기능을 제공.

from sklearn.neighbors import KNeighborsClassifier

  • sklearn.neighbors 패키지 안에 KNeighborsClassifier를 import 할 수 있다.

KNeighborsClassifier()

  • K-Nearest Neighbors 이른바, 최근접 이웃 분류 알고리즘을 활용


사이킷런(scikit-learn) KneighborsClassifier 간단 정리 🧐


Parameter

  • n_neighbors : 이웃의 개수를 지정(기본값 5)
  • p : 거리를 재는 방법, 1은 맨허튼 거리, 2는 -유클리디안 거리(기본값 2)
  • n_jobs : CPU 코어 지정 (기본값 1, -1은 모든 CPU 코어 사용)

Method

  • fit() : 모델을 데이터로 훈련시킴
  • predict() : 모델을 데이터로 훈련하고 예측함 (주어진 값을 가지고 모델이 판단)
  • score() : 훈련된 모델의 신뢰도 측정
  • kneighbors() : 입력한 데이터에 가장 가까운 이웃 중 n_neighbors 개의 거리와 인덱스를 반환

Function

  • train_test_split() : 훈련 데이터 셋과 테스트 데이터 셋으로 나눔.


numpy.arange()

  • 주어진 간격 내에서 균일 한 간격의 값을 반환

np.random.shuffle()

  • 배열 순서 섞기

index=np.arange(49)

  • 0~48까지 배열 만듬

np.random.shuffle(index)

  • 배열 섞기

profile
습관이 전부다.

0개의 댓글