코딩테스트가 끝나고, 이미지 데이터 분류 작업을 했다. 이미 False Positive로 classified된 이미지들을 확인해서 진짜 맞는지 분류하는 작업이 었다.
여기서 False Positive라는 생소한 단어가 나오는데 이걸 한번 간단하게 이야기해보자.
Confusion Matrix
여기서 보면 False Positive (FP)는 실제 False인 정답을 True라고 말하는 케이스이다. 예를 들자면 컴퓨터가 어떤 소프트웨어를 바이러스라고 말하지만 사실 그 프로그램은 그냥 아무것도 아닌 경우다.
그래서 Confusion Matrix를 왜 쓰냐 라고 물어본다면, 모델의 성능을 검증하기 위해서라고 말 할 수 있다. 흔히 우리가 머신러닝하면서 보는 Precision, Recall, Accuracy를 위 Matrix value를 사용해서 계산을 한다.
이 FP, TP 애들이 처음보면 이해는 되는데 계속 생각하다 보면 엄청 헷갈린다. (그래서 이름이 Confusion Matrix 인가보다 ㅋㅋㅋ😵)
그래서 이미지 분류를 하면서 False Positive라고 분류된것들은 거의 대 부분 True Positive였다. 여기 모델 성능이 엄청 좋은듯. 그냥 학교에서 튜토리얼 수준으로 했던 수준이 아니구나 라는 것을 느꼈다...
제대로 이해나 할 수 있으려나.