Xception

인화·2025년 10월 14일

논문 리뷰

목록 보기
6/9

Xception

  • Inception 모듈 : 일반적인 합성곱 연산-Depthwise Separable Convolution의 중간 단계
  • Depthwise Separable Convolution : 매우 많은 수의 tower를 가진 Inception 모듈
    • tower : Inception에서 각기 다른 필터 크기를 적용하는 하나의 병렬 경로
  • Xception : 기존의 Inception 모듈을 Depthwise Separable Convolution으로 대체함.
    • 이때, “합성곱 신경망의 Feature map 내에서 채널 간 상관관계(cross-channel correlations)와 공간적 상관관계(spatial correlations)는 완전히 분리하여 학습할 수 있다.”는 가정에 기반함.
    • 기존 Inception 모듈은 1x1 → 채널 간 상관관계, 3x3, 5x5 → 공간적 상관관계 학습의 구조로 부분적으로 연산을 분리하는 구조였다면, 이를 채널 간 상관관계와 공간적 상관관계를 완전히 분리한 Depthwise Separable Convolution 구조 기반으로 바꾼 것이 Xception. ⇒ 이를 통해 Inception 모듈을 완전히 대체함.
    • 가정이 Inception에서보다 더 강하므로 Extreme Inception의 약자 = Xception.
    • depthwise separable convolution 층을 잔차 연결로 쌓은 선형 구조

참고 )

  • 일반 convolution이 채널과 공간을 동시에 처리한다면, Depthwise Separable Convolution은 채널과 공간을 분리해서 처리하므로 파라미터 수가 적음.
  • depth multiplier = 1, 하나의 입력 채널 당 몇 개의 depthwise 필터를 사용할 것인가?
    -> depth_multiplier는 입력 채널 하나당 몇 개의 depthwise 필터를 적용할지를 결정하는 하이퍼파라미터로, 입력 채널이 3개이고, depth_multiplier = 1이면 각 채널당 하나의 필터가 적용되어 총 3개의 출력 채널이 생성된다. 반면 depth_multiplier = 2이면 각 채널에 2개의 필터가 적용되어 총 6개의 출력 채널이 생성된다.
     일반적으로 Xception에서는 depth_multiplier = 1을 사용하며, 이는 각 입력 채널마다 하나의 필터만 적용한다는 의미이다. (Depthwise Separable Convolution은 입력 채널별로 필터를 독립적으로 적용함)
profile
얼렁뚱땅 바보 학부생...

0개의 댓글