[CV] CNN 모델 알아보기

최원석·2026년 2월 28일

군대에서 살아남기

목록 보기

8/8

AlexNet

영상 데이터를 기반으로 한 대회인 ILSVRC2012에서 우승한 CNN 구조이다. Alex Krzhevsky의 이름을 따서 AlexNet이라고 부른다. Convolution Layer 5개와 Fully Connected Layer 3개로 구성되어 있다.

AlenNet 구조

특징

ReLU Activation Function

tanh 활성화함수를 사용하였을 때보다 ReLU활성화 함수를 사용하였을 때 Error rate를 매우 빠르게 0.25에 도달시켰다.

max pooling

maxpooling을 사용해 이미지의 특징을 추출했다. 이때 stride값을 kernel size보다 작게하여 overrapping이 발생되도록 하였다. → non-overrapping 모델보다 정확도 상승

overrapping?
kernel을 겹치게하여 뉴런들이 중복되게 풀링을 진행하는 것을 말한다.

Mulitple GPUs

2개의 GPU를 사용해 병렬적으로 학습할 수 있도록 구조를 설계하였다.

논문

proceedings.neurips.cc

[CNN] AlexNet 논문리뷰 (velog.io)

[DL][CNN] AlexNet 개념 및 Pytorch 구현 (tistory.com)

딥러닝 CNN 모델 살펴보기(1) : AlexNet 논문 리뷰 : 네이버 블로그 (naver.com)

VGGNet

VGGNet은 네트워크의 깊이가 성능에 미치는 영향을 분석하기 위하여 설계된 CNN 모델이다. 기존 모델보다 깊은 계층을 가지기위해 합성곱의 Kernel을 3x3으로 통일 시켰다.

VGGNet 구조

VGG16과 VGG19는 성능을 비교하기위해 계층을 16개 19개 다른 구조를 만들었다.

A에서 D → E 점차 계층의 깊이가 깊어질 수 록 Error rate이 점차 감소하여 성능이 좋아지는 것을 알게되었다.

VGG16의 계층 구조이다.

[CNN 알고리즘들] VGGNet의 구조 (VGG16) by bskyvision.com

[DL][CNN] VGGNet 개념 및 Pytorch 구현

ResNet

CNN 모델들이 단순하게 Layer을 깊게 쌓을 수록 성능이 더 좋아질 것 이라고 예상했지만 20층 이상부터는 성능이 낮아지는 현상이 발생 “Degradation” (VGG는 19층까지만 쌓았다) 하지만 ResNet은 Residual Learning을 통해 152층까지 쌓아 모델을 만들었다.