가장 단순한 딥러닝 형태로 주어진 이미지 안의 물체가 무엇인지 알아내는 것이다.
cats_vs_dogs 데이터셋의 경우 고양이의 이미지가 들어오게되면 학습된 모델이 고양이로 classification하는 것을 예로 들 수 있다.
주어진 이미지 안의 물체가 어느 위치에 있는 것인지 찾아내는 것이다. 바운딩 박스라는 사각형 형태로 위치를 나타낼 수 있다.
바운딩 박스를 표시하는 방법들
1) (x_center
,y_center
,width
,height
)
2) (min_x
,min_y
,width
,height
)
이외에도 LRTB, QUAD 등 여러가지 방법이 있다.
주어진 이미지 안의 물체가 무엇인지, 어디에 있는지 모두 알아내는 것이다. 여러 물체를 찾아내는 것이 가능하다.
주어진 이미지 안의 물체의 영역을 알아내는 것이다. 물체를 있는 그대로 파악하기때문에 사각형으로 나타내는 바운딩 박스와는 다르다. 이렇게 표현된 영역을 object mask라고 하며 물체의 종류가 같은 경우 별도로 구분하지 않는다.
Semantic Segmentation과 동일한 역할을 하지만 물체의 종류가 같아도 별도로 구분하여 mask한다.