CV Applications

홍찬우·2023년 7월 22일
0

Semantic Segmentation

이미지의 모든 픽셀이 어떤 분류에 속하는지 판단


Fully Convolutional Network

  • Dense layer를 없애고 convolution layer만 사용

  • input size와 동일한 크기의 convolution을 이용해 flatten 시킴

Convolutionalization

  • 이미지가 커지면 fully convolutional network를 이용해(convolutionalzation) 단순 classification 뿐만 아니라 semantic segmentation이 가능
    • coarse(드문드문한) heatmap을 얻을 수 있음
    • output dimension이 줄어들어 원래의 dense pixel로 늘리는 과정이 필요

Deconvolution (convolution transpose)

  • 엄밀히 convolution의 역은 아니지만, parameter의 수와 in/output size 관점에선 역임




Detection

→ 물체의 위치를 bounding box로 뽑아냄

  • R-CNN : AlexNet을 2000번 수행해서 feature map extract

  • SPPNet : CNN을 1번 수행

  • Fast R-CNN : SPPNet과 유사

  • Faster R-CNN : bounding box를 뽑는 방법을 network 학습

  • Region proposal : bounding box에 물체가 있을 것 같음을 판단

Region proposal Network

  • 해당 영역에서 어떤 bounding box를 사용할 것인지, 안 할 것인지를 판단



YOLO

→ bounding box 추출과 class 예측을 동시에 해 매우 빠름

  1. image안에 내가 찾고 싶은 물체의 중앙이 해당 grid안에 들어가면, 그 grid cell이 해당 물체에 대한 bounding box와 물체가 무엇인지 같이 예측


  1. 각 cell은 B개의 bounding box를 예측
    • B개의 bounding box의 x, y, width, height와 confidence(쓸모있는지, 없는지)를 예측


  1. 동시에 각각의 grid cell의 중점에 속하는 object가 어떤 class인지 예측
    • Faster-CNN에서는 bounding box를 찾은 후 network에 넣어 무엇인지 예측


  1. 각각의 channel에 맞는 정보가 끼워 들어갈 수 있도록 학습이 됨









※ 모든 이미지의 출처는 네이버 커넥트재단 부스트캠프 AI Tech 5기입니다. ※

profile
AI-Kid

0개의 댓글