[Orange] mushroom_tree

tpids·2024년 6월 24일

Orange3

목록 보기
4/9

목표

  • kaggle 제공하는 독버섯/식용버섯 분류 데이터를 활용해서 분석을 진행해보자
  • Tree 모델 이해해보자
  • Tree 모델이 선택한 중요한 특성을 확인해보자
  • https://www.kaggle.com/datasets/uciml/mushroom-classification
  • 문제데이터: 특성, 피처, feature, 독립변수, 설명변수, x
  • 답데이터: 레이블, label, 라벨, 종속변수, 반응변수, y
  • 2개의 클래스를 분류하는 것: 이진분류(binary classification)

  • 머신러닝 모델은 수치형태의 데이터만 이해할 수 있음!

  • 그리고 결측치가 있으면 학습이 안됨!

  • 예측값 != 실제값

  • 예측에는 불확실성이 있기에 확률이 높은 값이 최종 클래스 예측값으로 출력됨

데이터 전처리 (preprocess)

profile
개발자

0개의 댓글