네트워크가 optimaization하는 과정에서 gradients의 정보 중복
연산 bottleneck을 없애고
cross-channel pooling이 feature 피라미드 작업을 압축
전체 image-level에서 critical한 information을 찾기 힘들다