SENet

Xpert·2024년 3월 13일
0

모델 아키텍쳐

목록 보기
4/7

SENet에서 SE는 Squeeze, Excitation 을 의미한다.

Squeeze

Squeeze = Global Average Pooling
말 그대로 피쳐를 1차원 벡터로 압축한다.
(7x7x512) 피쳐맵이라고 하면 GAP를 적용하여 (1x1x512) 형태가 된다.

Excitation

위에서 Squeeze된 벡터의 크기가 C라고 하면, 여기에 FC Layer와 Relu를 거쳐서 r (reduction ratio) 만큼을 나눈 출력을 만든다.
다시 FC Layer와 sigmoid를 거쳐서 C로 크기를 키워서, 최종적으로 각 입력 노드에 대한 확률 값을 얻게 된다.

확률 값을 다시 원래의 피쳐맵에 곱해주어, 어떤 피쳐에 집중해야 할지를 학습할 수 있게 된다.
이를 통해 Channel relationship 을 고려할 수 있게 되고, 각 피쳐 맵에 대한 가중치를 다르게 둘 수 있다.

SE Block

위에서 설명한 네트워크는 하나의 Block으로서 다른 네트워크에 결합시킬 수 있다.

인셉션 네트워크에 결합시키거나

ResNet에도 결합시킬 수 있는데,

결과적으로는 ResNet과의 결합 성능이 더 좋았다고 한다.

profile
Python, CV, ML, Backend

0개의 댓글

관련 채용 정보