Tensor (텐서) : 다차원의 배열, 데이터의 배열
Channel (채널) : 이미지는 (높이,너비,채널)이라는 3차원 텐서인데,
높이는 이미지의 세로 방향 픽셀수, 너비는 이미지의 가로 방향 픽셀 수, 채널은 색성분으로 입력되는 이미지 데이터가 단일 색상인 경우 채널은 1, RGB인 경우 채널은 3이다.
Covolution operation (합성곱 연산) :
Feature map (특성 맵) : 위의 합성곱 연산을 통해 나온 결과(=모두 더한 값)를 말한다.
이 특성맵에서 숫자가 높으면 그 위치가 필터와 유사하다는 것을 말한다!
Stride (스트라이드) : 커널의 이동범위
Padding (패딩) : 합성곱 연산 전 입력의 가장자리에 지정된 개수의 폭만큼 행과 열을 추가 해주는 것
편향
합성곱 신경망에도 편향(bias)를 추가할 수 있는데, 커널을 적용한 뒤에 더해진다.
Pooling (풀링) : 데이터의 크기를 줄이는 다운샘플링의 일종으로, 특성 맵을 다운샘플링 해 특성 맵의 크기를 줄임
풀링을 하는 이유는?
데이터의 차원 감소를 통해 학습에 필요한 비용을 줄이는 것이 풀링 계층을 사용하는 이유이다!
1. 숫자 2가 input으로 들어온다.
2. 이렇게 총 6개의 필터를 합성곱 연산해준다.
3. 그럼 서로 다른 패턴을 뽑아낸 6개의 특성 맵이 나오게 된다.
4. (맥스) 풀링으로 특성 맵의 크기를 줄인다.
5. 다음 층에서 17개의 필터로 합성곱 연산과 (맥스) 풀링을 해준다.
(=> 상위 층으로 올라갈수록 사람은 이해하기 힘든 고차원적인 특징으로 변한다.)
6. 특성 맵의 출력을 쭉 일렬로 이어 붙여서 완전연결 신경망으로 최종 클래스를 분류하게 된다!
( 출력은 0~9까지의 원핫인코딩 형식이기 때문에 숫자2가 00100000000 👈 이런식으로 표시된다.)