You Only Look Once: Unified, Real-time Object Detection (CVPR 2016) 최대한 간결한 문장으로 최대한 자세하게 정리하기 위해 노력했다. 사실 번역본이다.^^;;
SSD는 2016년 ECCV에 발표된 논문이다. SSD: Single Shot MultiBox Detector, Keywords : Real-time Object Detection, Convolutional Neural Network
Mask R-CNN은 2017년 ICCV에 발표된 논문이다. Object Detection에 Segementation까지 가능하다. Mask R-CNN은 이미지 내에서 각 instance에 대한 segmentation mask를 생성한다.
YOLO9000은 YOLO 시리즈의 두 번째 논문이다.논문은 크게 3가지 부분으로 나뉜다. Better : 정확도를 올리기 위한 방법 Faster : 속도 개선을 위한 방법 Stronger : 더 많은, 다양한 클래스를 예측하기 위한 방법
ResNet, MobileNet-V2, EfficientNet 핵심 요약
An Overview of Multi-Task Learning in Deep Neural Networks 논문 리뷰
Adashare 논문 리뷰
Multimodal Learning with Transformers: A Survey 논문 리뷰
A Systematic Survey of Prompt Engineering on Vision-Language Foundation Models 논문 리뷰
(CVPR 2023) image, text, audio, depth, thermal, IMU data 등 6가지 다른 modality의 joint embedding을 학습하는 모델인 ImageBind
(CVPR 2022) 각 입력 인스턴스에 따라 조건이 지정되는 조건부 프롬프트 학습이라는 새로운 개념을 도입하여 일반화에 강한 모델을 제안한 CoCoOp