
본 내용은 인하대학교 정보통신공학과 홍성은 교수님의 인공지능응용 강의내용을 기반으로 작성한 내용입니다.


CONV : 3x3 filter(stride 1, pad 1)
MAX POOL : 2x2 filter(stride 2)
모든 Layer가 같은 구조인 것이 매우 깔끔하다.
왜 이렇게 작은 filter(3x3)을 사용할까?
3개의 3x3 CONV의 Stack = 1개의 7x7 CONV의 Stack

3개의 3x3 CONV를 거친 상황이다.
A3의 저 한 칸은 Input의 파란색 field(7x7)의 정보가 담겨있음을 알 수 있다.
즉, 효과적으로 반영된 field를 가지게 하는데,
더 깊고(3 layers vs 1 layer) → 비선형적
paramter 수가 적어진다. (3 * (3^C^) vs 7^C^)
C : Channel per layer







