MobileNet V2

Seungyun Lee·2026년 1월 27일

AI HW Paper

목록 보기

7/14

등장 배경: MobileNet V1은 가벼웠지만, 채널을 너무 많이 줄이다 보니 정보가 손실되는 문제가 있었습니다. V2는 이를 해결하기 위해 구조를 뒤집었습니다.

기존의 ResNet과는 정반대의 구조를 가집니다.

구조: Wide -> Narrow -> Wide (모래시계 모양)
과정:
1. 채널을 줄여서(Compression) 연산량을 낮춥니다.
2. Convolution 수행.
3. 다시 채널을 늘립니다(Expansion).
문제: 모바일 환경에서는 이미 채널이 적은데, 여기서 더 줄이면 정보가 너무 많이 사라집니다.

구조: Narrow -> Wide -> Narrow (배불뚝이/방추형 모양)
과정:
1. Expansion: 먼저 채널을 뻥튀기(보통 6배)해서 늘립니다. (1x1 Conv)
2. Depthwise Conv: 넓어진 공간에서 여유롭게 특징을 추출합니다. (3x3 Depthwise)
3. Projection: 다시 채널을 줄여서 필요한 정보만 압축합니다. (1x1 Conv)
비유: 좁은 방에서 작업하기 힘드니까, "넓은 작업실로 물건을 꺼내서(Expand) 작업을 마치고, 다시 압축해서(Project) 저장"하는 방식입니다.

마지막 단계에서 ReLU(활성화 함수)를 제거한 것입니다.

차이점은 ReLU대신 ReLU6를 사용하는 점 입니다.
ReLU는 입력값이 양수일 때 입력된 값을 그대로 반환하지만, ReLU6는 6보다 큰 값을 6으로 고정하여 반환합니다. 그래프로 나타내면 아래와 같습니다.

ReLU는 0보다 작은 값을 가차 없이 0으로 만듭니다. ( $f(x) = max(0, x)$ )
채널이 많을 때는 괜찮지만, 채널이 적은 곳(Bottleneck)에서 ReLU를 쓰면 정보가 0이 되어 영영 사라지는 현상이 심각해집니다.

MobileNet V2의 기본 단위인 Bottleneck Residual Block의 순서입니다.

Design Verification engineer