제가 데이터 과학자, ML 엔지니어로 현업 일을 하면서 조사하고 정리한 AI & ML 컴퓨터 비전 2015년 이후 주요 논문 또는 SOTA급 리스트입니다. 따라서 리서치에서 바라보는 기준과는 다를 수 있습니다. 혹시 제가 놓친, 관련 분야의 중대한 논문이 있다면 댓글로 부탁드리겠습니다. ☺️
- 논문 인용 횟수는 2022년 7월 기준입니다. 주기적으로 업데이트합니다.
- (제가 TF 밖에 모르는 바보라서...) 구현물은 우선 TensorFlow나 TF 호환 라이브러리 기준으로 찾았고 없는 경우 공식 코드 리포지토리 등을 링크했습니다.
1. 공통
- Cosine Decay Schedule with Restarts
- Grad-CAM
- Stochastic Depth
- AdamW & AdamWR
- MixUp
- Bag of Tricks
- DropBlock
- Group Normailzation
- SWA
- CutMix
- Label Smoothing
- Lookahead
- RAdam
- RandAugment
- SAM
2. 이미지 인식 Image Recognition
- DenseNet
- MobileNet
- SENet
- MobileNet V2
- BiT
- EfficientNet
- MobileNet V3
- ViT
- DeiT
- EfficientNet V2
- ResNet-RS
- ConvNeXt
3. 객체 탐지 Object Detection
- Faster R-CNN
- YOLO
- 논문: You Only Look Once: Unified, Real-Time Object Detection (2015년, 26,506회 인용)
- 구분: 1 스테이지, GoogLeNet (백본)
- 1줄 요약: 실시간 추론 달성, 그러나 작은 크기의 객체 검출 능력 떨어짐
(1) 추론 단계: 이미지를 7 × 7 그리드로 나누고 백본의 FC 통과한 최종 레이어 피쳐 맵도 동일한 크기로 구성 → 각 그리드 셀마다 2쌍의 BB 좌표와 신뢰도(= 객체가 포함될 확률 × IoU), 1쌍의 클래스 확률 출력하고 NMS 적용
(2) 훈련 단계: 다중 손실(= 객체 중심 좌표 존재하는 그리드 셀, ∀ BB의 좌표 + 신뢰도 + 클래스 확률 오차에 객체 존재하지 않는 ∀ 그리드 셀, ∀ BB의 신뢰도 오차 추가함) 구해서 학습
- SSD
- 논문: SSD: Single Shot MultiBox Detector (2015년, 22,926회 인용)
- 구분: 1 스테이지, VGG (백본)
- 1줄 요약: (1) 추론 단계: 컨볼루션 레이어 거치면서 6개의 멀티 스케일 피쳐 맵 추출 → 각 피쳐 맵의 그리드 셀마다 복수 개의 디폴트 박스 (≂ 앵커 박스) 배정하고 BB 오프셋과 클래스 확률 출력하고 NMS 적용
(2) 훈련 단계 ① 디폴트 중 IoU 0.5 이상이면 양성, 미만이면 음성 클래스 할당 ② HNM + 양성과 음성 비율은 1:3 ③ 다중 손실(= 클래스 분류 손실 + BB 회귀 손실) 구해서 학습
- 구현물: TensorFlow 2 Detection Model Zoo (TF2 OD API)
- YOLO V2
4. 영상 분할 Segmentation, 그 외
5. 이미지 생성 Image Generation
- CLIP
6. 파이썬 라이브러리 모음
- Albumentations: Github Star 10.6k, 데이터 증강, PyTorch, TensorFlow
- Augmentor: Github Star 4.8k, 데이터 증강
- Detectron2: Github Star 21.5k, 객체 탐지, 영상 분할, PyTorch
- EinOps: Github Star 5.3k, 딥러닝 연산, PyTorch, TensorFlow
- imgaug: Github Star 12.8k, 데이터 증강
- LabelMe: Github Star 8.8k, 객체 탐지와 영상 분할 어노테이션
- OpenMMLab: 이미지 인식, 객체 탐지, 영상 분할 등, PyTorch
- PyTorch Image Models: Github Star 19.7k, 이미지 인식, PyTorch
- Segmentation Models: Github Star 4k, 영상 분할, TensorFlow
- Segmentation Models PyTorch: Github Star 6k, 영상 분할, PyTorch
- TensorFlow 2 Object Detection API: 객체 탐지, TensorFlow
- TTAch: Github Star 0.7k, TTA, PyTorch