사진 데이터를 fully connected layer로 학습시키는 경우 3차원 사진 데이터를 1차원 으로 평면화시키는 과정을 거친다. 이때 공간 정보가 손실되는데, 이러한 손실은 정보 부족으로 이어져 인공신경망이 특징을 추출하고 학습하는 데에 한계를 가질 수 있다. 따라서 이미지 공간 정보를 유지한 채로 학습이 가능하도록 하는 모델이 등장했는데 이것이 CNN이다.
Fully connected layer와 차이점
1. 각 레이어의 입출력 데이터의 형상 유지
2. 이미지 공간 정보를 유지하면서 인접 이미지와의 특징을 효과적으로 인식
3. 복수의 필터로 이미지의 특징 추출 및 학습
4. 추출한 이미지의 특징을 모으고 강화하는 Pooling layer
5. 필터를 공유 파라미터로 사용하기 때문에 일반 인공신경망과 비교해 학습 파라미터가 매우 적음
gradient descent를 통해서 기울기를 학습할 시 깊은 레이어에 다달아 데이터에 따른 차이를 충분히 반영하지 못함. 이렇게 gradient가 매우 작아져 레이어를 학습시킬 수 있을 만큼의 충분한 값을 표현하지 못한 경우를 들어 기울기 소실(vanishing gradient)라고 함
ResNet
에서 사용한 방법. 레이어의 입력을 다른 곳에 이어서 gradient가 깊은 곳까지 이어지게 함정리
- CNN: 합성곱 신경망, 이미지를 분류하는 여러 모델에 쓰이는 레이어
- VGG: CNN을 사용해 만든 모델 중 하나, 3*3 커널을 이용해 이미지의 비선형적 특징을 잘 잡아내며, 계산량을 현저히 줄임
- ResNet: CNN을 사용해 만든 모델 중 하나, Skip connection을 이용해 vanishing gradient 문제를 해결함
참고
예전에 접하고 정리한 적 있던 거 같은 개념도 까먹어서 자꾸 다시 찾아보고 이랬었지, 하고 읽게 된다. 상반기 목표를 이루려면 복습을 더 해야할 거 같다.
알고리즘 문제를 꾸준히 풀어보려고 한다. 그동안은 마구잡이로 풀었는데 이제부터는 목표를 가지고 할 것이다. 우선 이번 달 안에 프로그래머스 레벨 1을 모두 푸는 것이 목표다.