독립 변수의 조건에 따라 종속 변수를 분리하는 모델
기본 구현 방식
from sklearn.tree import DecisionTreeClassifier
# 객체생성
tree = DecisionTreeClassifier()
# 학습
tree.fit(x, y)
# 새로운 데이터 예측
print(tree.predict(new_data))
데이터 셋 분할 및 결과 평가
from sklearn.model_selection import train_test_split
# 분할
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2,
stratify=y,
random_state=0)
# 학습
tree = DecisionTreeClassifier()
tree.fit(x_train, y_train)
# 예측
pred_train = tree.predict(X_train)
pred_test = tree.predict(X_test)
# 평가
acc_train = accuracy_score(y_train, pred_train)
acc_test = accuracy_score(y_test, pred_test)
print(acc_train, acc_test)
혼동 행렬을 통한 평가
from sklearn.metrics import confusion_matrix
print(confusion_matrix(y_train, pred_train))
print(confusion_matrix(y_test, pred_test))
복잡도 제어