현재 Computer Vision분야에서 딥러닝을 활발히 활용하고 있습니다.
image 데이터를 다룰때의 가장 큰 문제점은 학습 파라미터가 너무 많아진다는 점인데요. 이를 해결하기 위해 Convolutional Neural Network라는 개념이 도입 되었습니다.
위의 그림에서 볼 수 있듯이, 3x3 필터를 적용한 결과 이미지에서 세로 방향의 특징이 강조되어, 해당 부분이 높은 값을 받아 흰색으로 표시된 것을 확인할 수 있습니다.(세로 특징 추출)
이것 외에도 다양한 필터들이 있지만 실제로는 위와 같이 Machine 스스로 weight들을 학습하게 합니다.
Padding을 안한채 필터를 거치면 이미지의 사이즈가 줄어들고 가장자리부분의 정보가 소실되기 때문에 패딩을 해줍니다.
stride는 몇 칸씩 뛰어넘을지 결정해주는 파라미터이다.
대부분의 CNN은 3차원의 형태로 이루어진다.
개채행렬로 외우도록하자 (개수x채널x행x열)
Pooling layer의 특징도 정리해보았다.
Maxpooling이 주로 쓰인다는 것만 takeaway로 들고가자.