Preserves properties of linear models
Easy to optimize
Overcom the vanishing grad problem
Increasing depth with 3x3 filters
1x1 conv for fc layers
Dropout 0.5
파리미터 수 측면에서 이득
더 깊게 쌓을 수 있음