세그멘테이션 모델은 다양한 분야에서 활용되고 있다. 자율주행 카메라에 적용되어 이미지의 의미를 해석하기도 하고 의료 이미지에서 병이 있는 영역을 판별하기도 한다.
크게 두가지 방식이 있으며 semantic segmentaion, instance segmentation이 있다.
시맨틱 세그멘테이션의 대표적인 모델로는 U-Net 구조가 있다.
입력으로 572x572크기인 이미지가 들어가고 출력으로 388x388의 크기에 두가지의 클래스를 가진 세그멘테이션 맵(segmantation map)이 나온다.
두 가지 클래스는 가장 마지막 레이어의 채널 개수가 2라는 점에서 확인할 수 있다.
세그멘테이션을 위해서 이미지의 각 픽셀에 해당하는 영역의 클래스별 정보가 필요하다.
인스턴스 세그멘테이션은 같은 클래스 내에서도 각 개체(instance)들을 분리하여 세그멘테이션을 수행한다.
이런 방식 중 대표적인 모델로는 Mask-R-CNN이 있다.
Mask R-CNN은 2-stage object detection의 가장 대표적인 Faster R-CNN을 계승한 것으로 Faster-R-CNN의 아이디어인 Region of Insterst Pooling Layer(RoIPool)개념을 개선하여 정확한 Segmenataion에 유리하게 한 RoIAlign 그리고 클래스별 마스크 분리라는 단순한 두 아이디어를 통해 클래스별 Object Detection과 시맨틱 세그멘테이션을 사실상 하나의 Task로 엮어낸 것으로 평가받는 중요한 모델이다.
자세한 사항은 다음 단계로....>>>>>