공모전에 참가하게 되어 분류데이터 분석하고 있는데 필요한 머신러닝 내용 정리해보았습니다~!정밀도(from sklearn.metrics import precision_score)positive로 예측한 것 중 실제값이 positive인 것중요한 지표인 경우ex) 스팸메일
많은 피처로 구성된 데이터세트의 경우, 상대적으로 적은 차원에서 학습된 모델보다 예측 신뢰도가 떨어진다. 또한 개별 피처간에 상관관계가 높을 가능성도 크다. 선형회귀와 같은 선형 모델에서는 입력 변수 간의 상관관계가 높을 경우 이로 인한 다중공선성 문제로 모델의 예측