Cartoon-StyleGAN:Fine-tuning StyleGAN2

suhan cho·2022년 9월 12일

Abstract

기존 모델은 사실적인 대상 이미지를 생성할 수 있지만 소스 이미지의 구조를 유지하기 어렵다
여러 도메인의 대용량 데이터에 대한 생성 모델을 학습하려면 많은 시간과 자원 필요

Method

베이스라인

StyleGAN2-ADA + Freeze D

사실적인 이미지를 생성하지만 소스 도메인의 구조는 유지 하지 않는다.

FreezeSG

소스 이미지의 구조를 유지하는데 효과적
Generator의 초기 레이어뿐만 아니라 스타일 벡터의 초기 레이어도 구조를 유지하는데 중요
-> freeze styleVector & Generator

Layer Swapping

LS 적용 시 생성 이미지는 FreezeG or Freeze+ADA 보다 소스 이미지에 더 높은 유사성 갖는다.
단) generator의 저해상도 레이어의 가중치를 고정시켰기에 저해상도층 레이어를 swapping했을 경우 의미있는 결과를 내기 힘들다

Structure Loss

이미지의 구조는 저해상도 이미지에서 결정된다
생성 된 이미지가 소스 도메인의 이미지와 유사하도록 저해상도 레이어의 값에 Sturcture Loss 적용
-> 소스 Genrator의 RGB 출력이 훈련 중에 target Generator의 RGB출력과 유사한 값을 갖도록 미세 조정

Application: Change Facial Expression/Pose

SaFa
StyleCLIP
StyleMixing

출처: https://github.com/happy-jihye/Cartoon-StyleGAN

안녕하세요

이전 포스트

Toonify

다음 포스트

StyleGAN3

0개의 댓글