논문 링크:링크텍스트
고화질 이미지 생성에 적합한 아키텍처
생성자와 판별자 두 개의 네트워크 활용한 생성 모델
목적 함수를 통해 생성자는 이미지 분포 학습 가능
AdaIN이용 시 다른 원하는 데이터로부터 스타일 정보 가져와서 적용
학습시킬 파라미터가 필요하지 않음
정규화 후 별도의 스타일 데이터를 받아 feature상에 적용
다양한 스타일이 반영되게 만든 후 합성을 한다
feed-forward방식의 style transfer 네트워크에서 사용되어 좋은 성능 보임
테크닉
Removing Traditional Input
Stochastic Variation(노이즈)
다양한 확률적인 측면 컨트롤
주근깨, 머리카락의 배치
Noise 벡터를 인풋으로 이용
Coarse noise: 큰 크기의 머리 곱슬이나 배경
Fine noise: 세밀한 곱슬머리, 배경
경우의 수
a: 모든 레이어에 노이즈 적용
b: 노이즈 적용안함
c: Fine layer적용
d: Coarse layer적용
메인 아이디어
한계점
고화질 이미지 생성에 적합한 아키텍처
512차원의 z 도메인에서 w도메인으로 매핑 수행
가우시안 분포에서 샘플링한 z벡터 직접 사용X
A: PGGAN 베이스 라인
B: Bilinear up/downsampling operations
C: Mapping Network+AdaIn
D: Input 레이어로 학습된 4 4 512 상수 텐서 사용
노이지 입력
Mixing Regularization
인접한 레이어 간의 스타일 상관관계 줄인다
구체적인 Mixing Regularization 방법
Path Length: 두 벡터를 보간, 얼마나 급격하게 이미지 특징 바뀌는지 확인
Separability: latent space에서 attributes가 얼마나 선형적 분류되는지 평가
CelebA-HQ: 얼굴마다 성별등의 40개의 binary attributes가 명시되어 있는 데이터셋으로 분류 모델을 학습한다
하나의 속성마다 200,000개의 이미지 생성 및 분류 모델에 넣기
매 속성마다 linear SVM모델 학습
각 linear SVM모델 활용하여 다음값 계산 (i= 각 속성의 인덱스)
W공간이 Z공간보다 이상적이다
동일한 세팅으로 추가 실험
Coarse styles 변화
Middle styles 변화
Fine styles 변화