Localization: 단 하나의 object 위치를 찾아 bounding box로 지정하여 찾음
Object Detection: 여러 개의 object들에 대한 위치를 bounding box로 지정하여 찾음
Segmentation: Detection보다 더 발전된 형태로 피셀 레벨 detection 수행
-> 모두 object(s)의 위치를 찾아내는 것

영역 추정
: Region Proposal
딥러닝 네트워크 구성
: Feature Extraction, FPN, Network Prediction
기타
: IOU, NMS, mAP, Anchor Box

classification과 regression을 동시에 해야함. 즉, classification의 loss 값과 regression의 loss 값을 동시에 만족해야 함. -> 복잡
다양한 크기와 유형의 object가 섞여 있음
실시간 적용을 위한 detect 시간
명확하지 않은 이미지에 대한 detection & 전체 이미지에서 detect할 object가 차지하는 비중이 높지 않음(=background가 대부분인 경우)
데이터 세트의 부족