다양한 머신러닝 모델
SVM(Support vector machine)
구분하는 문제를 푸는것은 분류 문제(Classification Problem) 이고,
분류 문제를 푸는 모델을 분류기(Classifier)라고 한다.
각 그래프의 축을 Feature(특징)이라고 부르고,
빨간색으로 그어진 선(벡터)를 Support vector라고 하며,
그 벡터의 거리는 Margin이라고 한다.
Margin이 넓어지도록 모델을 학습시키는것이 중요.예외로, Feature가 다른 분류에 해당하는 경우가 발생하면, Feature의 개수를 늘려서 학습시키는것이 일반적이다.
KNN(k-Nearest Neighbors
비슷한 특성을 가진 개체끼리 군집화하는 알고리즘
Decision tree(의사결정나무)
예, 아니오를 반복하며 추론하는 방식.
Decision tree(의사결정나무)
의사결정나무를 여러개 합친 모델
의사결정나무는 한 사람이 결정하는 것이라고 한다면,
랜덤 포레스트는 자유민주주의라고 할 수 있다.
각각의 의사결정나무들이 결정을 하고 마지막에 투표(Majority voting)을 통해 최종 답을 결정한다.