
이미지 입력을 벡터로 변환
입력 벡터에 가중치 행렬 W를 곱.
공간적 구조를 유지
컨볼루션 레이어는 이미지의 공간적 구조를 보존하면서, 필터를 사용하여 국소적인 특징을 추출
필터를 이용해 이미지의 중요한 (에지,텍스처 등)을 학습한다.
필터를 이미지에 적용하여 공간적으로 슬라이딩
필터가 이미지의 각 위치 위를 슬라이드 하면서, 필터와 이미지 패치 간의 내적을 계산
필터는 입력 이미지의 모든 채널을 고려해야 한다
필터가 이미지 위를 슬라이딩하며 내적을 계산한 결과를 활성화 맵이라고 합니다 .
이 맵은 각 위치에서 필터가 얼마나 잘 특징을 찾았는지를 보여주는 데이터입니다.
스트라이드는 필터가 이미지 위에서 얼마나 멀리 이동하는지를 나타냅니다
패딩은 입력 이미지의 가장자리에 추가로 픽셀 값을 넣어주는 과정입니다. 이렇게 하면 필터가 이미지의 가장자리에서도 특징을 추출할 수 있습니다.
풀링 레이어는 CNN에서 이미지의 공간적 크기를 줄이면서 중요한 특징을 유지하는 역할을 합니다
즉, 데이터를 요약하여 더 작은 데이터로 만듭니다.
Max Pooling: 각 패치에서 가장 큰 값을 선택합니다. 예를 들어, 2x2 패치에서 최대값만 선택하여 더 작은 맵을 생성합니다.
Average Pooling: 각 패치의 평균값을 선택하여 새로운 맵을 생성합니다
필터는 이미지를 통해 특징을 추출하고, 활성화 맵은 이러한 특징을 저장합니다. 스트라이드는 필터의 이동 간격을 조정하고 패딩은 이미지의 가장자리에서 정보 손실을 방지하며, 풀링 레이어는 크기를 줄여 계산 효율성을 높이고 중요한 정보를 유지합니다. 이러한 과정이 결합되어 CNN은 이미지 인식 및 처리에서 뛰어난 성능을 발휘할 수 있게 됩니다.