과거에 사용된 CNN 구조들은 Fully Connected Layer에 넣어야 하기 때문에 고정된 이미지 크기의 입력을 필요로 한다. cropping 과정이 들어가면서 이미지 전체를 담지 못하거나, 아니면 warping이 되면서 이미지가 왜곡이 됐다.
심층 신경망 모델(Deep Convolutional Neural Network)인 Alexnet이 어떻게 기존 CNN의 단점을 보완했을까?
This writing is a summary for the paper Focal Loss for Dense Object Detection.
Reading Clova AI's CRAFT Paper
Transfer Learning with Custom Dataset on Keras ResNet50 Base Model Pretrained on ImageNet Dataset
VGGNET은 Layer 개수가 19개이다. CNN 망이 깊고 넓을 수록 성능이 더 좋아지지만, 문제는 학습이 어려워진다.
Inception Module과 GoogleNet