본 글에서 요약할 논문은 "ImageNet Classification with Deep Convolutional
Neural Networks"입니다.
논문 출처: ImageNet Classification with Deep Convolutional Neural Networks
AlexNet이라고 불리는 심층 신경망 모델로, 2012 ILSVRC(ImageNet Large-Scale Recognition Challenge)에서 'top 5 test error rate of 15.4%'의 주목할 만한 성과를 발표했습니다.
첫번째로 Abstract를 보면 ImageNet LSVRC-2010 대회에서 120만개의 고해상도 이미지를 1000개의 서로 다른 클래스로 분류하기 위해 Deep Convolution Neural Network(이하 CNN)을 시켰다고 하며, 2010년 대회에서는 top1, top5의 에러율이 각각 37.5%, 17.0%으로 당시의 State-of-the Art(이하 SOTA)보다 상당히 우수했다고 합니다.
6천 만개의 파라미터와 65만 개의 뉴런이 있는 신경망은 5개의 합성곱 신경망 레이어로 구성되어 있으며, 그 중 일부는 max-pooling layer와 final 1000-way softmax를 가진 3개의 fully-connected layer로 구성되어 있다고 합니다.
훈련을 가속시키기 위해서 non-saturating neurons를 사용했으며, Convolution 연산에 효과적인 GPU를 사용했습니다. 또한 과적합(Overfitting)을 방지하기 위해서, Dropout을 사용했습니다.
기존 모델에서 변형된 버전의 모델을 통해 ImageNet LSVRC-2012 컨테스트에서 2위 기록인 26.2% 대비 top-5 에러율 15.3% 기록하며 우승 하였다고 합니다.
a final 1000-way softmax 📊
saturating nonlinearities, non-saturating nonlinearity 🏹
Reference: What does the term saturating nonlinearities mean?
multinomial logistic regression 📚
Reference: R - Multinomial Logistic Regression (다중 로지스틱 회귀분석)
log-probability 📌
Reference: Wikipedida - Log probability
weight decay 🔨
Reference: 딥러닝 용어 정리, Weight decay 설명과 이해
infero-temporal 🗿
Reference: Scholarpedia - Inferior temporal cortex