사이킷런은 BaseEstimator를 상속받으면 Customized 형태의 Estimator를 개발자가 생성할 수 있다.생성할 MyDummyClassifier 클래스 : 학습을 수행하는 fit() 함수는 아무것도 수행하지 않으며, 예측을 수행하는 predict() 함수
붓꽃 데이터 생성 : load_iris()머신러닝 알고리즘 : Decision Tree학습,테스트 데이터 분리 : train_test_split()train_test_split()의 구조 : (피처 데이터 세트, 레이블 데이터 세트, 테스트 세트의 비율, 난수 발생 값
지도학습 : 명시적인 정답이 있는 데이터가 주어진 상태에서 학습하는 머신러닝 방식→ 학습 데이터로 주어진 데이터의 피처와 레이블 값(결정 값, 클래스 값)을 머신러닝 알고리즘으로 학습해 모델 생성, 생성된 모델에 새로운 데이터 값이 주어졌을 때 미지의 레이블 값을 예측
여러 개의 분류기를 생성하고 그 예측을 결합 -> 보다 정확한 최종 예측을 도출하는 기법보팅 (Voting)배깅 (Bagging)부스팅 (Boosting)스태킹일반적으로 서로 다른 알고리즘을 가진 분류기의 결합을 통해 최종 예측 결과를 결정함보팅 유형하드 보팅 : 예측
정의 \- 매우 많은 피처로 구성된 다차원 데이터셋의 차원을 축소해 새로운 차원의 데이터셋을 생성하는 것.차원 축소를 하는 이유차원이 증가할수록, 데이터 포인트 간의 거리가 멀어지고 희소한 구조를 가짐.수백개 이상의 피처로 구성된 데이터의 경우, 상대적으로 적은 차원