머신러닝을 배울 때 가장 먼저 접할 수 있는 분류 알고리즘에 대해 정리해 보았습니다.분류 알고리즘은 학습 데이터로 주어진 데이터의 피쳐와 레이블값을 머신러닝 알고리즘으로 학습해 모델을 생성하고, 모델에 새로운 데이터가 주어졌을 때 미지의 레이블 값을 예측하는 것입니다.
지난 번에 이어서 결정트리 모델의 특징에 대해서 알아보겠습니다.결정모델의 장점은 쉽고 직관적이라는 점 입니다. 룰이 명확하고 시각화로 표현까지 가능합니다. 또한 균일도만 신경쓰면 각 피처의 스케일링과 정규화 같은 전처리 작업의 영향도가 크지 않습니다.단점으로는 과적합으
분류 알고리즘 앙상블 앙상블이란? 여러개의 분류기(Classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법을 말합니다. 앙상블의 유형으로는 일반적으로 보팅(Voting) 배깅(Bagging) 부스팅(Boosting) 으로 구분
이번에는 좋은 머신러닝 모델을 만들기 위한 피쳐 엔지니어링에 대해 리뷰 해보겠습니다.좋은 알고리즘을 사용한 모델일 수록 하이퍼 파라미터 튜닝보다는 피쳐 엔지니어링을 건드려 보는 것이 더 효율적이라고 합니다.피쳐 엔지니어링의 방법으로 다음과 같은 방법을 사용할 수 있습니