[Boostcourse] ML (1)

BBakHye·2022년 10월 31일
0

🦁 AI SCHOOL 7기

목록 보기
8/52
post-thumbnail

Scikit-Learn Cheetsheet

지도(Supervised Learning): 정답 O
비지도(Unsupervised Learning): 정답 X

Classification

clf = RandomForestClassifier()

# 문제 (X_train)와 정답 (y_train)을 fit에 넣어 학습시킨다.
clf.fit(X_train, y_train)

# 학습한 것을 바탕으로 실전 문제 (y_pred) 풀어보기
y_pred = clf.predict(X_test)

# 모의고사와 답 비교해서 채점하기
clf.score(X_test, y_test)
  • Decision Tree 알고리즘은 숫자만 인식할 수 있다.

공식문서 따라 실습해보기

# Decision Tree 알고리즘은 숫자만 이해할 수 있기 때문에 0, 1, 2와 같이 카테고리로 구분
from sklearn.datasets import load_iris
from sklearn import tree
X, y = load_iris(return_X_y=True)

# 모델 선언
clf = tree.DecisionTreeClassifier()

# 모델 학습시키기
clf = clf.fit(X, y)

# Desision tree 시각화
t = tree.plot_tree(clf.fit(X, y), filled=True)   # filled=True: 색 구분

조건에 따라 True => 왼쪽, False => 오른쪽으로 타고 내려간다.


부스트코스 - 프로젝트로 배우는 데이터사이언스
✅ 오늘까지 수강 완료한 섹션:
오리엔테이션 ~ 분류모델 기초 (1.1.3)

profile
데이터 분석가가 되기 위한 기록 ✏️

0개의 댓글