이번학기 캡스톤에 활용하는 모델에 관한 논문이라, 기억할 겸 레퍼런스를 남길 겸 정리해두었다
논문 링크
옷 이미지 를 사용자의 신체에 맞게 변형하여 최종적으로 정확하게 정렬된 Segmentation Map 과 변형된 옷 이미지 를 생성함
Clothing Encoder (): 옷 이미지 와 옷 마스크 에서 Feature Pyramid 를 추출
→ 옷의 모양과 패턴 정보를 분석하여 이후 단계에서 사용할 수 있도록 준비함
Segmentation Encoder (): Clothing-Agnostic Segmentation Map 와 Pose Map 에서 Feature Pyramid 를 추출
→ 인체의 형태와 자세 정보를 분석하여 옷과 정확히 정렬할 수 있게 함
Feature Fusion Block:
Condition Aligning:
misalignment를 방지하기 위해 의 채널과 간에 겹치지 않는 부분을 제거하여 최종 를 얻음
: 최종 Segmentation Map.
: Occlusion(신체 부위에 의해 가려진 부분)을 처리한 후 변형된 옷 이미지.
→ 최종 Segmentation Map 는 로 정의 됨, 여기서 는 depth-wise softmax
→ ReLU 활성화를 적용하여 가 음수가 되지 않도록 함
Body Part Occlusion Handling : Occlusion(가려짐) 상황을 처리하여 pixel-squeezing 아티팩트를 제거
<참고>
질적 결과
양적 결과