ASPP (Atrous Spatial Pyramid Pooling)

하는·2025년 1월 17일
0

컴퓨터 비전

목록 보기
5/10

요즘 multi-scaling 공부가 필요함

1. Atrous convolution (= Dilated Convolution)

dilation이 적용된 합성곱
dilation이란 아래 사진과 같이 픽셀 사이에 빈 공간을 사이사이에 넣는 것을 말한다.


수용 영역(Receptive Field)가 확장되어 더 넓은 범위의 정보 학습이 가능.

2. SSP (Spatial Pyramid Pooling)

입력 크기에 상관없이 고정된 크기의 특징 벡터를 만들 수 있는 풀링 기법.

ssp 필요한 이유

일반적인 CNN 구조에서 FC Layer를 사용하려면 고정된 크기의 입력이 필요하다. 하지만 입력 이미지 크기가 다르면 FC Layer에 입력할 수 없기 때문에 일반적으로 CNN에서는 고정된 크기로 Resizing을 해야 한다. 하지만 Resizing을 하려면 이미지 비율이 깨지거나 중요한 정보 손실될 수 있음.

따라서 다양한 크기의 풀링 윈도우를 사용하여 다중 스케일 정보를 유지하면서 고정된 크기의 출력 벡터 생성함.

다양한 크기의 풀링을 수행하여, 다중 스케일 정보를 하나의 벡터로 병합한다.
1x1 풀링 → 전체적인 정보 (전역 정보)
2x2 풀링 → 중간 크기의 정보
4x4 풀링 → 더 작은 영역의 정보
8x8 풀링 → 매우 작은 국소적(local) 정보

3. ASSP (Atrous Spatial Pyramid Pooling)

다중 스케일 정보를 효과적으로 캡쳐하기 위해 설계된 합성곱 연산 기법.

SPP(Spatial Pyramid Pooling)의 atrous 버전.

ASSP는 Pooling 대신 Atrous Convolution을 사용 → 공간 해상도를 유지하면서도 다중 스케일 정보를 추출할 수 있다.

출처: https://blog.naver.com/h22hyeon/222247290992

profile
천천히 꾸준히 취미처럼 냐미😋

0개의 댓글