Convolution의 의미
Convolution의 파라미터 수
filter의 크기와 개수만큼 파라미터가 있다.
ex. 5 5 3 의 filter가 4개 -> 553*4 개
참고로, filter의 수만큼 convolution 후의 image의 수가 결정된다.
CNN의 구성
Stride
Padding
Convolution은 Dense layer보다 파라미터 수가 훨씬 적다
1*1 convolution
네트워크가 2개로 나뉘어져 있다.
input이 11113로, 크기가 크다
5 convolution layer, 3 dense layer로 당시 기준으로는 Deep 하다.
Key ideas
지금엔 당연한 것들이지만 당시엔 획기적인 것들이었다.
Network in Network 구조
block 중간중간에 1x1 convolution 활용
네트워크가 커짐에 따라 학습이 잘 안되는 문제가 있었다.
skip connection
Batch normalization 사용
Bottleneck architecture 사용(1x1 convolution)
네트워크를 더 깊이 쌓아도 되는 가능성을 열어준 모델.
residual block에서, ResNet에선 skip connection한 값과 해당 위치의 output을 더했다면, DenseNet에선 concatenation했다.
concatenation하면 채널이 점점 커짐 -> 파라미터 숫자가 많아짐
Dense block, Transition block
이미지 내에서 물체를 분류해내는 것(이미지 내 모든 pixel이 어떤 label에 속하는 지 판별)
Fully Convolutional network
Fully Convolutional network의 특징
Deconvolution
R-CNN
SPPNet
Fast R-CNN
Faster R-CNN
YOLO
Mixture Density network에 대해 조사한 내용을 팀원들에게 발표하였다.
다른 팀원들이 조사한 Vision Transformer, Adversarial Auto-encoder에 관한 발표를 들었다.
다른 팀원이 조사한 부분을 내일까지 각자 공부하여, 이해가 안가는 부분을 질문하며 이해하기로 했다.