컴퓨터 비전 분야는 빠르게 발전하고 있으며, 모델의 성능을 평가하는 것은 그 효율성과 신뢰성을 보장하는 데 필수적입니다. 다양한 메트릭스는 분류 정확도부터 객체 탐지 정밀도에 이르기까지 모델 성능의 여러 측면을 평가하는 데 도움을 줍니다. 이 가이드는 다양한 컴퓨터 비전 메트릭스에 대해 상세한 설명과 적용 및 중요성에 대한 통찰을 제공합니다.
혼동 행렬은 분류 모델의 성능을 이해하는 기본 도구입니다. 실제 분류와 예측 분류를 표 형식으로 요약하여, 참 긍정(TP), 거짓 긍정(FP), 참 부정(TN), 거짓 부정(FN)을 명확하게 시각화할 수 있습니다.
정확도는 올바르게 예측된 사례의 비율을 전체 사례의 수로 나눈 값입니다. 간단한 메트릭스이지만, 데이터셋이 불균형할 경우 오해를 불러일으킬 수 있습니다.
정밀도는 예측된 긍정 결과 중 실제로 긍정인 결과의 비율을 측정합니다. 높은 정밀도는 낮은 거짓 긍정 비율을 나타냅니다.
재현율은 실제 긍정 사례 중 모델이 올바르게 식별한 비율을 평가합니다. 긍정 사례를 놓치는 것이 중요한 상황에서 중요합니다.
특이도는 실제 부정 사례 중 모델이 올바르게 식별한 비율을 측정합니다. 부정 사례를 식별하는 모델의 성능을 이해하는 데 유용합니다.
F1 점수는 정밀도와 재현율의 조화 평균으로, 두 측면을 균형 있게 고려한 단일 메트릭스를 제공합니다.
수신자 조작 특성 곡선 아래 영역 (AUC-ROC)은 다양한 임계값에서 참 긍정률과 거짓 긍정률 간의 균형을 평가합니다. 높은 AUC는 더 나은 모델 성능을 나타냅니다.
IoU는 예측된 경계 상자와 실제 경계 상자의 겹치는 부분을 측정합니다. 객체 탐지 모델을 평가하는 데 중요한 메트릭스입니다.
이 메트릭스는 객체 탐지에 맞게 조정되며, 겹침 임계값(IoU > 0.5) 이상을 참 긍정으로 간주합니다.
PR 곡선은 다양한 임계값에서 정밀도와 재현율을 플로팅하여 다양한 신뢰 수준에서 이들 간의 균형을 시각화합니다.
AP는 PR 곡선 아래 영역으로, 정밀도-재현율 균형을 단일 메트릭스로 요약합니다. mAP는 여러 클래스의 AP의 평균으로, 전체 성능을 평가합니다.
PA는 올바르게 분류된 픽셀 수를 전체 픽셀 수로 나눈 값으로, 세분화 성능을 간단히 측정합니다.
MPA는 각 클래스에 대해 PA를 계산한 후 평균을 내어, 클래스 불균형을 고려합니다.
객체 탐지와 유사하게, 세분화를 위한 IoU는 예측된 세분화 마스크와 실제 세분화 마스크 간의 겹침을 평가합니다.
Dice 계수는 세분화 작업에 특히 유용한 겹침을 측정하는 또 다른 메트릭스입니다.
이러한 메트릭스를 이해하고 효과적으로 사용하는 것은 컴퓨터 비전 모델을 개발하고 평가하는 데 필수적입니다. 각 메트릭스는 고유한 통찰을 제공하며, 적절한 메트릭스를 선택하는 것은 특정 작업과 요구 사항에 따라 달라집니다. 이 가이드는 컴퓨터 비전에 관여하는 모든 사람에게 초보자부터 전문가까지 포괄적인 자료로서의 역할을 합니다.