
머신러닝
분류(Clasification)특강
알고리즘의 종류

+)
머신러닝의 지도학습과 비지도학습의 가장 큰 특징은
입력으로 받는 데이터의 차이에 있다.
Supervised Learning은 '지도 학습'이라는 말처럼
Input Data와 Input Data에 대한 정답에 해당하는
Label(또는 class) 정보를 입력으로 받는다.
주어진 데이터와 label로부터 모델을 학습시켜
새로운 데이터를 입력으로 받았을 때 label을 예측하는 방식
Unsupervised Learning은 오직 Input Data를 기반으로
군집을 찾는 학습을 진행한다.
머신러닝 모델을 평가하는 방법
분류 : 정확도, 정밀도, 재현율, F-1점수
회귀 : MSE, R^2 등
교차 검증 : 모델의 성능을 평가할 때 사용하는 방법
학습 세트와 테스트 세트로 나누고,
학습 세트에서 모델 학습, 테스트 세트에서 모델 평가
혼동 행렬 - 분류 모델

성능 평가 지표 Evaluation Metrics
정확도 Accuracy :
(True Positive +True Negative) / Total
민감도 Precision (positive) :
(True Positive) / (Predicted Positive) = TP / (TP+FP)
민감도 Precision (negative) :
(True Negative) / (Predicted Negative) = TN / (TN+FN)
재현율 Positive Recall (Sensitivity) :
True Positive Rate = Sensitivity = TP / (TP+FN)
특이도 Negative Recall (Specificity) :
True Negative Rate = Specificity = TN/(TN+FP)
F 스코어 F-measure (positive) :
2 x Precision x Recall = 2 x TP
Precision + Recall 2 x TP + FP + FN



