오리지널 데이터셋
ADE20K scene parsing dataset
수량: 20,210 / 2,000 / 있는데 몇장인진 모르겠음.
150개의 categories
https://github.com/CSAILVision/semantic-segmentation-pytorch (4700 *)
오리지널 데이터셋보다 더 범용적으로 사용되는 것으로 보인다.
첫 번째 높은 빈도수 구간: (233.3 ~266.7, 233.3 ~266.7)
두 번쨰: (666.7 ~ 700, 500 ~533.3)
width 범위: 130 ~ 2100
height 범위: 96 ~ 2100
(width+height) 범위 : 226 ~ 4200
평균 width & height : (516, 417)
height > width
인 경우와, height < width
인 경우를 나눠서, 둘 중 batch_per_gpu
가 먼저 차는 경우 -> sub_batch로 가져옵니다.imgSizes
가 (300, 375, 450, 525, 600) 으로 주어짐.imgMaxSize
가 1000으로 주어짐self.padding_constant
의 배수가 되게끔(여기서는 8), padding을 붙여줍니다.self.segm_downsampling_rate
)self.segm_downsampling_rate
의 배수가 되도록 변경해줍니다.self.segm_downsampling_rate
)