yolo metrics 해석 관련

승주·2024년 8월 27일

객체 탐지와 같은 작업에서 분류 성능을 평가할 때 사용하는 다양한 곡선이 있습니다. 질문에서 언급된 곡선들은 모두 모델의 성능을 특정한 측면에서 나타냅니다. 각각의 커브가 제공하는 정보가 다르기 때문에, "가장 잘 나타낸다"는 표현은 목적에 따라 다를 수 있습니다. 그래도 일반적인 분류 성능 평가에 대해 말씀드리면:

  • Mask F1-Confidence Curve:

F1 스코어는 Precision과 Recall의 조화 평균입니다. 따라서, 이 곡선은 모델의 전반적인 분류 성능을 잘 나타냅니다. Confidence 값을 변경할 때 Precision과 Recall이 어떻게 균형을 이루는지 보여주기 때문에, 분류 성능을 종합적으로 평가하기 좋은 곡선입니다.

  • Mask Precision-Confidence Curve:

이 곡선은 Confidence 값에 따라 Precision이 어떻게 변하는지를 보여줍니다. 분류기의 정밀도(잘못된 양성 결과 없이 얼마나 잘 분류하는지)를 평가하는 데 유용하지만, Recall은 고려되지 않으므로 전반적인 분류 성능을 나타내기엔 부족할 수 있습니다.

  • Mask PR Curve (Precision-Recall Curve):

이 곡선은 모델의 전반적인 분류 성능을 평가하는 데 매우 유용합니다. 특히 클래스 간 불균형이 있는 데이터셋에서 유용합니다. Precision과 Recall 사이의 상호작용을 잘 보여주기 때문에, 다양한 임계값에 따른 모델의 성능을 종합적으로 평가할 수 있습니다.

  • Mask Recall-Confidence Curve:

이 곡선은 Confidence 값에 따라 Recall이 어떻게 변하는지를 보여줍니다. 분류기의 민감도(실제 긍정인 것 중에서 얼마나 잘 찾아내는지)를 평가하는 데 유용하지만, Precision이 고려되지 않기 때문에 전반적인 성능을 평가하기에는 한계가 있습니다.
결론:
Mask PR Curve (Precision-Recall Curve)가 일반적으로 분류 성능을 가장 잘 나타내는 곡선입니다. 이 곡선은 모델이 다양한 Confidence 임계값에서 Precision과 Recall의 균형을 어떻게 유지하는지를 보여주며, 특히 클래스 불균형이 있을 때 매우 유용합니다.

Mask F1-Confidence Curve도 전반적인 성능 평가에서 유용할 수 있지만, Precision-Recall Curve가 보다 종합적입니다.

0개의 댓글