약 분류기를 순차적으로 학습하는 앙상블 기법
- 예측을 반복하면서 잘못 예측한 데이터에 가중치를 부여해서 오류 개선
간단한 약 분류기들이 상호 보완되도록 순차적 학습
- underfitting된 학습 데이터의 가중치를 높이면서 (Adaptive)
새로 학습된 모델이 학습하기 어려운 데이터에 더 잘 적합되도록 하는 방식
전체 학습 데이터를 이용해 모델 생성
잘못 예측된 데이터의 가중치를 상대적으로 높임
가중치를 반영하여 다음 모델을 학습
2~3 과정을 반복
학습 전 단계 모델에서의 잔여 오차 (Residual Error)에 대해 새로운 모델을 학습
- 잔여 오차를 예측하여 발전하는 약 분류기
모델을 학습 후 예측 값 계산
잔여 오차 계산
잔여 오차를 트리 모델 생성
Learning rate를 이용해 기존 예측값 수정
2 ~ 4 반복
Gradient Boost 기반 모델
- 트리를 만들 때 병렬 처리를 가능하게 해서 Gradient Boosting의 속도를 개선
병렬 / 분산 처리
Split 지점을 고려할 때 일부를 보고 결정
Sparsity Awareness