
기존의 Bottleneck Block는 projection phase → 연산 → expansion phase 단계를 통해 연산 효율성을 추구
반면, Inverted Bottleneck Block은 expansion phase → 연산 → projection phase를 통해 더 높은 표현력을 추구

위 그림에서 입력 텐서를 (spatial 크기 : 32x32, channel 수 : 12)라고 한다면,
Expansion phase
Conv filter(spatial 크기 : 1x1, channel 수 : 12)수는 72개가 되고, 그 둘을 convolution 하게 되면, 텐서가 된다.
이때, 사용된 filter수가 72인 이유는 위 그림에서 알 수 있듯이 expansion factor를 6으로 두었기에 인 것이다
Depth-wise Conv phase
그 텐서를 의 필터 72개로 depth-wise Conv하게 되면, 의 텐서가 나온다.
Projection phase
이를 다시 의 필터 12개로 convolution하게 되면, 결과 텐서 텐서가 나오게된다.
block에서 채널을 늘리기 위해서는 pointwise(1x1) convolution이 사용되었고,
경량화된 convolution 연산을 위해 depthwise separable convolution을 사용한 것을 확인하면 기존의 mobilenet과 유사한 것을 알 수 있습니다.