1) 내가 하고 싶은 분야 논문 찾아보기
컴퓨터 비전을 공부하시면서 AlexNet, VGG, ResNet부터 오늘 다룬 DenseNet, SENet, NASNet, EfficientNet 등 다양한 아키텍처를 접하셨을 것입니다. 이렇게 유명한 네트워크들은 앞으로 이미지를 다루게 된다면 즐겨 사용하게 될 기법들이 하나씩 담겨있습니다. 세부사항을 모두 기억할 필요는 없지만, 지금까지 어떤 아이디어들이 제안되었는지 기억하면 새로운 모델을 만드는데 도움이 됩니다. 앞으로 세부 분야를 정해 배우고 공부하실 때에도 필요할 때 알맞은 논문과 방법을 찾고 이를 활용하는 것은 매우 중요한 능력이 될 것입니다.
그런 점에서 이번에는 컴퓨터 비전의 주요 태스크 중 관심 있는 논문을 직접 찾아보는 시간을 갖도록 하겠습니다. 딥러닝과 컴퓨터 비전을 접한 지 얼마 되지 않으셨다면 이미지를 분류(classification task)하기 위해 최적화된 모델의 아키텍처를 다룬 논문을 주로 보셨을 것입니다. 이 다음으로 물체 검출(detection), 그리고 물체의 영역을 분리해내는 세그멘테이션(segmentation) 등의 다양한 태스크(task)를 딥러닝으로 푸는 논문들을 읽어보실 수 있습니다.
Q7. 자신이 이미지로 해보고 싶은 분야(예: object detection, segmentation 등)를 선택한 후, 그 분양에서 관심이 가는 논문을 찾아 목록으로 정리해 보세요.
저는 최근에 Few shot object detection이라는 분야에 관심이 생겨 Few-Shot Object Detection and Viewpoint Estimation for Objects in the Wild를 읽고 싶습니다.
2) 간단히 요약해보기
조사를 하면서 너무 많은 논문이 있다고 생각하셨을 수 있습니다. 우선 하나를 뽑아 요점을 정리해보는 시간을 갖도록 하겠습니다. 오늘 소개된 네트워크들은 각자 블로그의 자세한 리뷰나 정리된 자료를 볼 수 있었습니다. 그 정도로 자세하게 정리하기 위해서는 논문을 여러 번 읽어야 하고 시간이 많이 드니 우리는 논문 내용을 딱 두 줄로 정리해보도록 하겠습니다.
Q8. 고른 논문 또는 네트워크의 주요 내용을 요약해 보세요.
예시) ResNet
해결하고자 하는 것: 모델의 레이어가 깊어지더라 성능이 증가하지 않고 학습이 되지않는 Gradient descent 문제를 해결하고자 합니다.
적용한 방법: 블록의 Input을 skip connection을 통해 output에 더해줌으로써 정보가 소실되지 않고 깊은 레이어까지 전달되도록 합니다.