ucTransNet → input 파일 이미지 224 외에 안 되는문제

boingboing·2024년 9월 16일

으아아악 살려줘! 너무 어려워!

GPT 도움

입력 레이어 수정
UCTransNet 의 입력 레이어가 224x224 크기로 고정되어 있는지 확인필요.
만약 그렇다면, 다양한 크기의 이미지를 처리할 수 있도록 수정해야 함.

예시

nn.Conv2d와 같은 특정 레이어가 고정된 입력 크기를 기대하고 있는지.
이미지 크기를 224x224로 강제 조정하는 리사이즈 또는 인터폴레이션 단계가 있는지.

현상

에러 메세지

ucTransNet → input 파일 이미지 224 외에 안 되는문제

가설 : patch size가 전체 이미지 배수와 안 맞음.

발생한 곳

class UCTransNet(nn.Module):
    def __init__(self, config,n_channels=3, n_classes=1,img_size=224,vis=False):
        super().__init__()
        self.vis = vis
        self.n_channels = n_channels
        self.n_classes = n_classes
        in_channels = config.base_channel
        self.inc = ConvBatchNorm(n_channels, in_channels)
        self.down1 = DownBlock(in_channels, in_channels*2, nb_Conv=2)
        self.down2 = DownBlock(in_channels*2, in_channels*4, nb_Conv=2)
        self.down3 = DownBlock(in_channels*4, in_channels*8, nb_Conv=2)
        self.down4 = DownBlock(in_channels*8, in_channels*8, nb_Conv=2)
        self.mtc = ChannelTransformer(config, vis, img_size,
                                     channel_num=[in_channels, in_channels*2, in_channels*4, in_channels*8],
                                     patchSize=config.patch_sizes)
        self.up4 = UpBlock_attention(in_channels*16, in_channels*4, nb_Conv=2)
        self.up3 = UpBlock_attention(in_channels*8, in_channels*2, nb_Conv=2)
        self.up2 = UpBlock_attention(in_channels*4, in_channels, nb_Conv=2)
        self.up1 = UpBlock_attention(in_channels*2, in_channels, nb_Conv=2)
        self.outc = nn.Conv2d(in_channels, n_classes, kernel_size=(1,1), stride=(1,1))
        self.last_activation = nn.Sigmoid() # if using BCELoss

    def forward(self, x):
        x = x.float()
        x1 = self.inc(x)
        x2 = self.down1(x1)
        x3 = self.down2(x2)
        x4 = self.down3(x3)
        x5 = self.down4(x4)
        x1,x2,x3,x4,att_weights = self.mtc(x1,x2,x3,x4)
        x = self.up4(x5, x4)
        x = self.up3(x, x3)
        x = self.up2(x, x2)
        x = self.up1(x, x1)
        if self.n_classes ==1:
            logits = self.last_activation(self.outc(x))
        else:
            logits = self.outc(x) # if nusing BCEWithLogitsLoss or class>1
        if self.vis: # visualize the attention maps
            return logits, att_weights
        else:
            return logits


    if model_type == 'UCTransNet':
        config_vit = config.get_CTranS_config()
        logger.info('transformer head num: {}'.format(config_vit.transformer.num_heads))
        logger.info('transformer layers num: {}'.format(config_vit.transformer.num_layers))
        logger.info('transformer expand ratio: {}'.format(config_vit.expand_ratio))
        model = UCTransNet(config_vit,n_channels=config.n_channels,n_classes=config.n_labels)

ConvBatchNorm 부분은 그냥 batch normalization.
downblock은 그냥 이미지 사이즈 줄이는 부분.
channel Transformer 부분은.. 어 근데 왜 init에서 img_size가 224임?-> UCTransNet 초기화부분에서 이 img size값 지정함.

해결

-> UCTransNet 의 img_size를 256으로 고치고, Load_dataset부분의 224 fix된값도 고치니 해결됨!


class UCTransNet(nn.Module):
    #def __init__(self, config,n_channels=3, n_classes=1,img_size=224,vis=False):

class UCTransNet(nn.Module):
    def __init__(self, config,n_channels=3, n_classes=1,img_size=256,vis=False):

으로 수정.

boingboing

이전 포스트

GPU - 메모리 너무 꽉채우면

다음 포스트

ucTransNet → input 파일 이미지 224 외에 안 되는문제

GPT 도움

입력 레이어 수정

예시

현상

발생한 곳

해결

GPU - 메모리 너무 꽉채우면

pytorch] sequence argument must have length to input rank

0개의 댓글