221123 TIL 분류 평가지표 다시 이해하기

hyemin·2022년 11월 23일

TIL

목록 보기
34/51

221124 WED

사실(Fact) : 부스트 3대장을 실습하고, 분류 평가지표를 공부하기 시작했다!
느낌(Feeling) : 그래도 미니 프로젝트와 월화 복습을 하고 다시 들으니 차근차근 따라갈 수 있었다.
분류 평가지표는 공부를 할 때마다 헷갈리니 열심히 다시 봐야겠다.
교훈(Finding) : 나만의 해석 방법으로 기억해보자!


fit, score, predict

fit할 때 train, score 구할 때 valid, predict할때 test 늘 헷갈렸는데, 오늘은 제대로 보자고 해서 집중하고 보니 좀 흐름이 이해가 된다. train, test 데이터셋만 나누는게 아니라 다시 쪼개서 train, valid, test라고 쪼개는 것도 감이 좀 잡힌다.

cross_val_predict, cross_val_score

늘 헷갈려서 자기주도복습 시간에 공부도 한 적 있는데, 여전히 어렵다. 재잘팀에서 cross_val_score 가 사용하는 기본 측정 지표는 회귀일 때는 R2, 분류일 때는 정확도 라고 엄청 자세히 설명해줘서, 일단 이것만은 기억하고 가야겠다고 생각했다. (cf. scoring 매개변수를 사용하여 다른 지표로 바꿀 수 있다.)

Confusion Matrix

나름 으쌰복습 때 이 주제를 내가 담당해서 공부했어서, 1종 오류, 2종 오류 구분이랑, 무슨 제시어가 주어졌을 때 Negative, Positive, True, False는 잘 구분한다고 자신했었다.
그런데 오늘 Precision, Recall까지 들어가니까 사례가 너무 헷갈렸다. 다행히 분모에 있는 FP, FN에 집중해서 보자고 나름의 방법을 찾기는 했는데, 계속 연습해봐야겠다.

profile
아직 고쳐나가는 중.

0개의 댓글