주제: 시각지능 공부
- Localization : 단 하나의 Object 위치를 Bounding Box로 지정하여 찾음
- Object Detection : 여러개의 Object들의 위치를 Bounding Box로 지정하여 찾음
1. Bounding Box : 하나의 Object가 포함된 최소 크기 박스(즉, 위치 정보)
2. Class Classification : Object가 Bounding Box안에 있는지 확신의 정도
3. Confidence Score
4. IoU : 두 박스의 중복 영역 크기를 통해 측정 -> 겹치는 영역이 넓을수록 좋은 예측
- 0~1 사이 값이 클수록 좋은 예측
5.NMS : 동일 Object에 대한 중복 박스 제거(동일 사물에 대해 중복하는거 다 제거)
- 일정 Confidence Score 이하의 Bounding Box 제거
- 남은 Bounding Box들을 Confidence Score 내림차순으로 정렬
- 첫 Bounding Box와의 IoU값이 일정 이상인 박스들을 제거
- Bounding Box가 하나 될때까지 반복
- 정리 : 상대적으로 Confidence Score가 낮은 Bounding Box를 제거하는 것
6. Precision, Recall, AP, mAP
- Precision(정밀도)와 Recall(재현율)은 모델의 성능을 측정하는 중요한 지표입니다. 정밀도는 모델이 식별한 것 중 실제로 해당하는 비율을 나타내며, 재현율은 전체 실제 해당하는 것 중 모델이 식별한 비율을 나타냅니다. 따라서 높은 정밀도는 거짓 양성의 비율이 낮음을 의미하고, 높은 재현율은 거짓 음성의 비율이 낮음을 의미합니다.
- Average Precision(AP)는 모든 클래스에 대해 개별적으로 계산되며, 이는 정밀도-재현율 곡선 아래의 면적을 나타냅니다. 평균 정밀도(mAP)는 모든 클래스의 AP의 평균을 취한 값이며, 모델의 전반적인 성능을 측정하는 중요한 지표 중 하나입니다.
7. Annotation
- Annotation(주석)은 학습 데이터셋에서 객체의 위치와 클래스에 대한 정보를 제공하는 과정을 의미합니다. 주석은 일반적으로 사람이 직접 수행하며, 이는 모델이 올바른 예측을 수행하기 위한 핵심적인 데이터입니다. 주석 작업은 보통 Bounding Box의 위치와 그 안에 있는 객체의 클래스를 지정하는 작업을 포함합니다.