ML) 모델 평가 - confusion matrix / 혼동행렬

dothouse·2024년 2월 8일
0

ML

목록 보기
9/9

1. confusion matrix / 혼동행렬

  • 지도학습 중 분류모델의 성능을 표현하는 표
  • 예측 성능을 확인하는데 예측 값과 실제 값의 비교
  • 쉽게 이야기 해서 분류모델에서 클래스를 판단하는데, 얼마나 잘 평가하는지를 확인 할 수 있다.

1) 정확도

정확도(accuracy)는 전체 샘플 중 맞게 예측한 샘플 수의 비율을 뜻한다. 높을수록 좋은 모형이다. 일반적으로 학습에서 최적화 목적함수로 사용된다.

2) 정밀도

정밀도(precision)은 양성 클래스에 속한다고 출력한 샘플 중 실제로 양성 클래스에 속하는 샘플 수의 비율을 말한다. 높을수록 좋은 모형이다. FDS의 경우, 사기 거래라고 판단한 거래 중 실제 사기 거래의 비율이 된다.

3) 재현율

재현율(recall)은 실제 양성 클래스에 속한 표본 중에 양성 클래스에 속한다고 출력한 표본의 수의 비율을 뜻한다. 높을수록 좋은 모형이다. FDS의 경우 실제 사기 거래 중에서 실제 사기 거래라고 예측한 거래의 비율이 된다. TPR(true positive rate) 또는 민감도(sensitivity)라고도 한다.

4) F점수

정밀도와 재현율의 가중조화평균(weight harmonic average)을 F점수(F-score)라고 한다. 정밀도에 주어지는 가중치를 베타(beta)라고 한다.

2. 1종오류 / 2종오류

🔴 사회과학 통계를 나름의 지식으로 정리한 내용입니다.
🔴 쉬운 이해를 위해 정리한 내용이라 정확한 용어, 정확한 예시가 아닐수도 있습니다.

1) 1종오류

  • 귀무가설(H0H_0)이 참인데 기각 (기각하지 못하지만 기각)
  • aa (유의수준) - 연구모형이 통계적의미가 없지만 통계적으로 유의미하다고 판단
  • ex) 효과가 없는 약을 효과가 있다고 판단

2) 2종오류

  • 귀무가설(H0H_0)이 거짓인데 채택(기각을 해야하지만 참으로 판정)
  • bb (검정력 - statical power) - 연구모형이 얼마나 실제 예측에서 얼마나 잘 판단할지
  • ex) 효과가 있는 약을 효과가 없다고 판단.

3. 예시를 통한 혼동행렬

✅ 추가예정

profile
새로운 길

0개의 댓글