LeNet-5는 1998년 Yann LeCun이 발표한 손글씨 숫자 인식(MNIST)을 위한 합성곱 신경망(CNN) 모델이다. 오늘날 CNN의 원형이 된 모델로, 이후 등장한 AlexNet, VGG, ResNet과 같은 딥러닝 모델의 기반이 되었다.
plot_model()
함수를 활용해 모델 구조를 시각화할 수 있다.합성곱층 (Convolutional layer)
- 이미지를 작게 나눈 영역에 커널(필터)을 적용해 중요한 특징을 찾아내는 과정
- 합성곱 계산을 통해 만들어지는 출력은 특성 맵(feature map)이라고 부르며, 입력 이미지 속 의미 있는 패턴(모서리, 윤곽선, 질감 등)을 부각시킨다.
- 사람이 일일히 특징을 설계한 기존 머신러닝과는 달리, CNN은 학습을 통해 데이터에서 스스로 특징을 찾아낸다.
풀링층 (Pooling layer)
- 특성 맵을 더 작고 간결하게 요약해 계산량을 줄이는 단계
- 이미지 크기를 줄여 계산 속도를 높이고, 모델이 더 중요한 부분에 집중할 수 있도록 돕는다.
- 이미지 내 객체의 위치가 조금 달라져도 모델이 잘 인식할 수 있게 만들어준다. (Spatial invariance)
밀집층 (Dense layer)
- 앞 단계에서 추출된 특징을 모두 모아, 최종 예측을 수행하는 단계
- 분류나 회귀 등 모델의 목적에 따라 결과를 출력