bream_length = [...]
bream_weight = [...]
smelt_length = [...]
smelt_weight = [...]
import matplotlib.pyplot as plt
plt.scatter(bream_length, bream_weight)
plt.scatter(smelt_length, smelt_weight)
plt.xlabel('length')
plt.ylabel('weitht')
plt.show()
지도 학습
: 입력 특성에 대한 타깃으로 훈련 시킴
k-최근접 이웃 알고리즘
: 기본 5개의 주변 샘플들과 비교하여 가장 많은 클래스를 정답 클래스로 채택
bream_length = [...]
bream_weight = [...]
smelt_length = [...]
smelt_weight = [...]
# 리스트로 주어진 데이터 연결
length = bream_length + smelt_length
weight = bream_weight + smelt_weight
# [길이, 무게] 묶어서 2차원 리스트로
fish_data = [[l, w] for l, w in zip(length, weight)]
# 도미 = 1, 빙어 = 0 으로 정보를 주기
fish_target = [1]*35 + [0]*14
from sklearn.neighbors import KNeighborsClassifier
kn = KNeighborsClassifier() # 모델 생성
kn.fit(fish_data, fish_target) # 데이터 적용
kn.score(fish_data, fish_target) # 정확도 측정(확률 0~1)
TEST )
predict(data) 함수 -> array로 예측 결과 반환
If )
kn = KNeighborsClassifier(n_neighbors=49) 로 하면 전체 데이터 49개 중 35개가 도미이므로 결과는 무조건 도미.
정확도 = 35/49 = 0.7