AI가 너무 핫하게 떠오르고 있는 것 같다.
AI는 더더욱 발전해서 우리 생활에 더 녹아들 것으로 생각되는데
안그래도 AI에 관심이 요즘 많아진 상황
혼공학습단이라는 기회가 생겨 개인적으로 공부하고 있는
자바스크립트와 같이 신청하게 되었다.
여기서는 구글 코랩이란 것을 사용하는데 쉽게 말하면
웹에서 파이썬 프로그램을 무료로 실행 가능한 서비스이다.
예제로 도미 데이터를 산점도 그래프로 그려보았다
bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 650.0, 575.0, 685.0, 620.0, 680.0, 700.0, 725.0, 720.0, 714.0, 850.0, 1000.0, 920.0, 955.0, 925.0, 975.0, 950.0]
import matplotlib.pyplot as plt
plt.scatter(bream_length, bream_weight)
plt.xlabel('length')
plt.ylabel('weight')
plt.show()
정답 : 1 - 지도 학습 알고리즘은 훈련하기 위한 데이터와 정답이 필요하다
- 지도 학습 2. 비지도 학습 3. 차원 축소 4. 강화 학습
훈련 세트와 테스트 세트가 잘못 만들어져 전체 데이터를 대표하지 못하는 현상은?
- 샘플링 오류 2. 샘플링 실수 3. 샘플링 편차 4.샘플링 편향
정답 : 4 - 샘플링 편향은 훈련 세트와 테스트 세트가 골고루 섞이지 않아 샘플링이 한쪽으로 치우쳤다는 의미. 즉 전체 데이터를 대표할 수 없음
사이킷런은 입력 데이터(배열) 가 어떻게 구성되어 있을 것으로 기대하는가?
- 행:특성, 열:샘플 2. 행:샘플, 열:특성 3. 행:특성, 열:타깃 4. 행:타깃, 열:특성
정답 : 2 - 사이킷런은 입력 데이터에서 샘플=행, 특성=열로 가정