➡️ 여러 operation 가능
➡️ position invariant한 값을 추출하는 역할
➡️ Reduces computation and parameters ( weights )
➡️ Receptive field ( local feature가 커버하는 영역 ) 크기가 커짐
A.k.a. "fractionally-strided conv", "deconvolution"
➡️ Feature upsampling ( size가 커짐 )
Ex_ 3 x 3 ➡️ 5 x 5
➡️ 대표적으로 Mobile net
➡️ in classfication, Max Pooling > Avg Pooling
➡️ ADAM은 길이 뿐아니라 방향성에 대해서도 moving avg를 취함
➡️ 대부분 ADAM or RMSProp 사용
➡️ 1x1 conv : feature maps # ⬇️
➡️ Overfitting ⬇️
➡️ for Classification ( Detection, Segmentation X )
➡️ 성능저하 없이 Layer를 계속 쌓을 수 있음➡️ 다양한 길이의 Path
➡️ 1000개 이상일 경우 죽게되는데, Activatioin Scaling을 통해 0.1 ~ 0.3을 곱해주면 된다
➡️ cf. ResNet : DenseNet은 Concat operator라서 vector의 차원이 변하지만, ResNet은 더하기 operator라서 차원 변화 X
➡️ ResNet + DenseNet
➡️ 충분한 Batch # 필요
➡️ Batch 확보가 어려울 때
➡️ Classifier + Detection
➡️ 시간이 오래걸림
➡️ x9 Faster than R-CNN