머신러닝
분류(Clasification)
특강
알고리즘의 종류
+)
머신러닝의 지도학습과 비지도학습의 가장 큰 특징은
입력으로 받는 데이터의 차이에 있다.
Supervised Learning
은 '지도 학습'이라는 말처럼
Input Data와 Input Data에 대한 정답에 해당하는
Label(또는 class) 정보를 입력으로 받는다.
주어진 데이터와 label로부터 모델을 학습시켜
새로운 데이터를 입력으로 받았을 때 label을 예측하는 방식
Unsupervised Learning
은 오직 Input Data를 기반으로
군집을 찾는 학습을 진행한다.
머신러닝 모델을 평가하는 방법
분류 : 정확도, 정밀도, 재현율, F-1점수
회귀 : MSE, R^2 등
교차 검증
: 모델의 성능을 평가할 때 사용하는 방법
학습 세트와 테스트 세트로 나누고,
학습 세트에서 모델 학습, 테스트 세트에서 모델 평가
혼동 행렬 - 분류 모델
성능 평가 지표 Evaluation Metrics
정확도
Accuracy :
(True Positive +True Negative) / Total
민감도 Precision (positive) :
(True Positive) / (Predicted Positive) = TP / (TP+FP)
민감도 Precision (negative) :
(True Negative) / (Predicted Negative) = TN / (TN+FN)
재현율
Positive Recall (Sensitivity) :
True Positive Rate = Sensitivity = TP / (TP+FN)
특이도 Negative Recall (Specificity) :
True Negative Rate = Specificity = TN/(TN+FP)
F 스코어
F-measure (positive) :
2 x Precision x Recall = 2 x TP
Precision + Recall 2 x TP + FP + FN