Confusion Matrix

Kevin Lee·2020년 6월 30일
0

스트라드비젼 인턴

목록 보기
5/12

코딩테스트가 끝나고, 이미지 데이터 분류 작업을 했다. 이미 False Positive로 classified된 이미지들을 확인해서 진짜 맞는지 분류하는 작업이 었다.

여기서 False Positive라는 생소한 단어가 나오는데 이걸 한번 간단하게 이야기해보자.

Confusion Matrix

  • True Positive (TP) : Observation is positive, and is - predicted to be positive.
  • False Negative (FN) : Observation is positive, but is predicted negative.
  • True Negative (TN) : Observation is negative, and is predicted to be negative.
  • False Positive (FP) : Observation is negative, but is predicted positive.

여기서 보면 False Positive (FP)는 실제 False인 정답을 True라고 말하는 케이스이다. 예를 들자면 컴퓨터가 어떤 소프트웨어를 바이러스라고 말하지만 사실 그 프로그램은 그냥 아무것도 아닌 경우다.

그래서 Confusion Matrix를 왜 쓰냐 라고 물어본다면, 모델의 성능을 검증하기 위해서라고 말 할 수 있다. 흔히 우리가 머신러닝하면서 보는 Precision, Recall, Accuracy를 위 Matrix value를 사용해서 계산을 한다.

이 FP, TP 애들이 처음보면 이해는 되는데 계속 생각하다 보면 엄청 헷갈린다. (그래서 이름이 Confusion Matrix 인가보다 ㅋㅋㅋ😵)

그래서 이미지 분류를 하면서 False Positive라고 분류된것들은 거의 대 부분 True Positive였다. 여기 모델 성능이 엄청 좋은듯. 그냥 학교에서 튜토리얼 수준으로 했던 수준이 아니구나 라는 것을 느꼈다...

제대로 이해나 할 수 있으려나.

profile
🧠🦾❤ https://github.com/to2915ny

0개의 댓글