AlexNet 구현해보기 (1)

CTF수상까지...!!·2025년 3월 24일

CNN Output Size 계산.

출력 크기(Height 또는 Width)는 다음 공식으로 계산됩니다:

output=inputkernel_size+2×paddingstride+1\text{output} = \left\lfloor \frac{\text{input} - \text{kernel\_size} + 2 \times \text{padding}}{\text{stride}} \right\rfloor + 1

요소설명예시
커널 크기 (kernel_size)몇 칸을 한 번에 볼 건지2×2, 3×3 등
스트라이드 (stride)얼마나 건너뛸지2 → 2칸씩 이동
패딩 (padding)경계 처리를 어떻게 할지VALID vs SAME
채널별 적용 여부채널마다 따로 적용됨RGB 각 채널별 max 값 추출

왜 마지막 output 값이 1000인가..?
=> ILSVRC 2012 대회용 모델에서 제출한 클래스가 1000개 이기 때문이다.

flatten이 사용된 이유는... 다차원 텐서를 1차원 벡터로 평탄화 하는 레이어다.
=> 최근 구조들에서는 Global Average Pooling(GAP)으로 대체되기도 한다.

profile
보안 공부...내 공부...

1개의 댓글

comment-user-thumbnail
2025년 10월 3일

잘지내십니까

답글 달기