다수결 투표 분류기: 앙상블에 포함된 개별 분류기 중 가장 뛰어난 것보다도 정확도가 높을 경우가 많다.
weak learner: 랜덤 추측보다 조금 더 높은 성능을 내는 분류기
각 분류기가 weak learner일지라도 충분히 많고 다양하다면 앙상블은 string learner가 될 수 있다.
Ensemble할 때 다양한 분류기를 만드는 것이 중요
① 각기 다른 훈련 알고리즘 적용
② Training 데이터의 서브셋을 무작위로 구성하여 분류기를 각기 다르게 학습
Bagging (Bootstrap aggregating)
: Training 데이터에서 중복을 허용하여 샘플링하는 방식
Pasting: 중복을 허용하지 않고 샘플링하는 방식