앙상블 개념 자체는 여러모델의 조합이라는 뜻이기 때문에 꼭 트리를 사용한 것이 아닌 다른 모델을 사용해도 앙상블이라 할 수 있음
가장 많이 쓰이는 Random Forest, Boosting은 Tree 기반 모델!
앙상블 종류를 알아보면서 좀 더 깊게 이해해보도록 하자.
(나누는 기준을 명확히 몇개, 이렇게 나누기는 힘든 것 같다. 랜덤포레스트를 배깅의 종류로 보아 포함시키는 사람과 합치는 사람이 있고, 또 보팅을 아에 언급하지 않는 경우도 많고, 스태킹은 앙상블의 한 개념이긴 하나 설명하지 않는 경우도 있어서, 아무튼! 명확하게 몇개다! 라고 나누지 않고 그냥 공부한 내용을 업로드 할 예정!)
voting은 말 그대로 투표를 통해 결정한다는 의미. Bagging과 비슷하지만 차이점이 있다.(Bagging은 밑에서 다시 다룰 예정!)
- Voting은 다른 알고리즘 model을 조합해서 사용
- Bagging은 같은 알고리즘 내에서 Sample을 조합하여 사용
즉, voting은 서로 다른 알고리즘이 도출해 낸 결과물에 대해 투표하는 방식!
voting은 두가지로 나눌 수 있는데,
대개 Soft Vote의 방식이 더 합리적이라고 함!
Bagging부터는 설명이 많아질 것 같아서, 각 게시물로 올릴 예정이다!