대부분 다양한 모델, 파라미터를 두고 상대적으로 비교

회귀 모델은 실제 값과의 에러치를 가지고 계산함

분류 모델의 평가 항목

이진 분류 모델의 평가

Accuracy: 전체 데이터 중 맞게 예측한 것의 비율

Precision: 양성으로 예측한 것 중에서 실제 양성의 비율

Recall(= TPR:True Positive Rate): 참인 데이터들 중에서 참이라고 예측된 것

Fall-out(=FPR: False Positive Ratio): 실제 양성이 아닌데, 양성이라고 잘못 예측한 경우

분류 모델은 그 결과를 속할 비율(확률)을 반환
-> Threshold = 0.4



-> 완벽 분류

-> 분류가 잘 된 경우

-> 분류성능이 나쁜 경우



-> 여기서 test_train_split은 Pipeline 내부가 아님
비용 함수를 최소화할 수 있으면 최적의 직선을 찾을 수 있음


비용함수의 최솟값 구하기
1) 랜덤하게 임의의 점 선택

2) 임의의 점에서 미분(편미분) 값을 계산해서 업데이트

3) 목표점의 오른쪽/왼쪽 일 경우


Learning Rate

-> 학습률이 작을 때

-> 학습률이 클 때

이 글은 제로베이스 강의 자료 일부를 발췌하여 작성되었습니다