2.4 Model Selection 모듈 소개
np.round 반올림 함수
stratufied: 균등하게 나눠주는 함수
cross_val_score() 교차검증을 간단하게
기존에 폴드 세트를 지정하고, for 루프에서 반복으로 학습 및 테스트 데이터의 인덱스를 추출하고, 반복적으로 학습과 예측을 수행하는 일련의 과정을 한번에 수행해주는 API입니다.
특히 classifier 학습을 진행하는 경우 자동으로 stratified KFold 방식을 진행
https://coding-potato.tistory.com/15
n_iter
for loop시 몇번 반복했는지 확인하기 위해서 만든 변수입니다
랜덤포레스트:
중복된 데이터를 가지고 올때 랜덤하게 가지고옴
앙상블
하나의 모델이 아니라 여러개의 모델
Leaf-wise tree vs level-wise tree
성능이 부족한 부분에 가지를 침. 옆으로 모델들을 하나씩 더 만드는 방식
level-wise tree 아래로 가지를 침
앙상블
Gradient Boosting:
오차: 모집단 전체를 예측해서 전체와 차이
잔차: