CNN 기초 개념

문호준·2022년 12월 8일

Convolution(합성곱) : 이미지 상의 어떠한 특징이 어느 부분에서 나타나는지를 찾는 방법

conv2D

parameter 종류

1. filters

2. kernel_size

n×m 크기의 행렬
높이(height) × 너비(width) 크기의 이미지를 처음부터 끝까지 겹치며 훑으면서 n×m 크기의 겹쳐지는 부분의 각 이미지와 커널의 원소의 값을 곱해서 모두 더한 값을 출력으로 하는 것을 말합니다
이미지의 가장 왼쪽 위부터 가장 오른쪽 아래까지 순차적으로 훑습니다.

커널(kernel)은 일반적으로 3 × 3 또는 5 × 5를 사용합니다.

3. stride

커널의 이동 범위가 위의 예제에서는 한 칸이었지만, 이 또한 사용자가 정할 수 있습니다. 이러한 이동 범위를 스트라이드(stride)라고 합니다.
스트라이드의 연산

input의 사이즈: n x n

output의 사이즈: m x m

kernel_size: k x k

stride 값: s

4. padding

5. activation function

Activation function의 기능

Linear or Identity Activation Function

함수의 도함수는 상수이고 입력과 관련이 없습니다. 그렇기 때문에 돌아가서 어떤 가중치가 더 나은 예측을 제공할 수 있는지 이해하는것은 불가능합니다.

선형 활성화 함수를 사용하면 신경망의 계층수에 관계없이 마지막 계층은 첫 번째 계층의 선형 함수가 됩니다.

**Non-linear Activation Function**

비선형 활성화 함수는 미분 함수를 가지고 있기 때문에 역전파를 허용합니다.
이를 통해 여러 계층의 뉴런을 ‘stacking’하여 심층 신경망을 만들 수 있습니다. 높은 수준의 정확도로 복잡한 데이터 세트를 학습하려면 여러 숨겨진 뉴런 계층이 필요합니다.

고수