교차 검증은 데이터의 편중을 막기 위해 데이터를 여러 부분으로 나누어 각각의 부분을 학습 및 검증에 사용하는 방법이다.Scikit-Learn에서는 cross_val_score() 함수를 이용해서 교차 검증 기법을 활용해서 정확도를 측정할 수 있다. y가 이진 클래스 또
혼동 행렬을 이용해서 모델을 평가할 수 있다.혼동 행렬을 계산하려면 모델이 예측한 값들과 실제 값들이 필요하다. 테스트 세트에서 예측할 할 수 있긴 하지만 보통 테스트 세트는 프로젝트의 마지막 단계에서 최종 평가용으로 이용한다. 개발 과정 중에 테스트 세트를 사용하면
Receiver operating characteristicROC Curve는 이진 분류기에서 성능을 평가하는 데 자주 사용되는 도구다. 정밀도/재현 커브와 유사하지만, 여기서는 참 양성 비율(TPR)과 거짓 양성 비율(FPR)을 사용하여 그래프를 그린다.거짓 양성 비
1. 다중 분류🔥 2개 이상의 클래스로 분류하는 것을 다중 분류라고 한다. Random Forest classifiers와 Bayes classifiers = multinomial classifiers의 경우, 다중 분류가 가능하다. 하지만 Support Vector Machine classifiers와 Linear classifiers는 이진 분류...
Hands-On-Machine Learning에서 머신러닝 시스템을 분류하는 기준에 대해 다루었었다. 특별히 따로 글을 작성해서 제대로 정리하려고 한다. 종류가 많으면 항상 분류하는 기준이 존재한다. 1.4.1 ) 훈련 지도 방식 (학습하는 동안의 지도 형태나 정보량에
회귀의 한 종류인 다중 라벨 분류에 대해 정리하려고 한다 분류기가 샘플마다 여러 개의 클래스를 출력해야할 때가 있다, 이럴 때 사용되는 것이 바로 다중 레이블 분류다! 다중 레이블의 예시를 찾아보면 아래와 같다! 생각보다 다양하다. 음악 장르 분류 한 곡이
선형 SVM 모델 → 단순히 결정 함수를 계산해서 새로운 샘플 x의 클래스 예측결정 함수 : $\\boldsymbol{\\theta}^T \\textbf{x} = \\theta_0 +\\theta_1 x_1 + \\cdots + \\theta_n x_n$ | 결과 >