ImageNet Challenge에서 좋은 선능을 보여 검증된 CNN 모델들을 말함.
CNN 기반의 네트워크의 backbone이 됨
backbone이란?
https://en.wikipedia.org/wiki/Backbone_network
Data Augmentation이란?
데이터의 label을 유지한 채로 상하좌우 반전, 회전, 노이즈 삽입 등등
왜 3x3 Convfilter만 사용?
단순하게 생각하면 위의 아이디어처럼 많이 하면 좋지 않을까?
3x3이 5x5, 7x7과 비교했을때 좋다
결국 동일한 효과를 내는 과정에서 레이어 수가 더 많고
파라미터의 수는 더 적다
최종적으로 인간보다 더 좋은 성능을 보이게 됨.
Residual block이란?
Residual은 출력값과 입력값의 차이(잔차)
많은 layer들이 겹치다보니 값이 뭉게지는 문제를 skip connection을 이용하여 이전 layer의 feature를 직접 받아옴.
주로 여기에 쓰는 예가 identity function
=> layer를 한차례 점핑해서 넘김.
Bottleneck Block
1x1 convolution을 활용하여 학습 parameter수와 연산량을 줄이는 구조
=> 뭔가 1x1 convolution을 추가해 넣으니 효율이 좋아짐. 왜인지는 모르겠다!!!!!!!!!!!!!!!!!!!!!!!!!!(?)
그 외 다른 CNN Model