: multinomial logit regression 함수를 사용하던 중, 이와 비슷한 방식인 Random-tree-classifier(decision tree classifier)을 찾았고 이 글은 이 방법에 대해 서술하려한다. 간단시로하게
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
## 세상에서 제일 만만한 iris data
iris = load_iris()
data = iris.data
target = iris.target
iris_df = pd.DataFrame(data, column = iris.feature_names)
iris_df['target'] = target
X = iris.data
y = iris.target
# 데이터를 훈련 세트와 테스트 세트로 나누기
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 랜덤 트리 분류기 생성
random_forest = RandomForestClassifier(n_estimators=100, random_state=42)
# 모델 훈련
random_forest.fit(X_train, y_train)
# 테스트 세트에 대한 예측
y_pred = random_forest.predict(X_test)
# 정확도 출력
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.2f}")