Introduction

Image to Image Translation
- 한 이미지의 domain을 다른 domain으로 변환하는 것을 목표로 하는 생성 모델의 한 분야
- 흑백이미지를 컬러 이미지, 낮 사진을 밤 사진으로 변환
- 기존 Image to Image Translation은 paired data를 가지고 수행해야 결과가 좋았음
- Unpaired data를 가지고 GAN의 loss function 하나로 진행할 경우 ModeCollapse가 발생하는 문제가 있음
- 위 두가지 문제를 해결하기 위해 기존 GAN에 Cycle Consistency를 도입


- Adversarial Loss
GminDmaxV(D,G)=Ex pdata(x)[logD(x)]+Ez pz(z)[log(1−D(G(z))]
- 위 loss를 통해 Generator가 실제 데이터 분포와 비슷한 데이터를 생성하도록 학습할 수 있음
- Pix2Pix(cGAN)
- CoGAN
- 문제점: 모델이 사전 정의된 유사성 함수에 의존하거나 입력과 출력이 동일한 low-dimensional embedding space에 있다는 가정을 만족해야함
- Cycle Consistency

- Translation is cycle consistent??
- 어떠한 데이터 x를 가지고 translation한 결과값 y^라면 y^를 다시 x로 translation할 경우 x가 나오는 것
- 영어로 된 문장을 한국어로 번역했을 때 해당 한국어를 다시 영어로 번역 시 본래의 영어 문장에 도출되는것을 말함
Adversarial Loss

- 정방향
G:x→yLGAN(G,DY,X,Y)=Ey pdata(y)[logDY(y)]+Ex pdata(x)[log1−DY(G(x))]
- 역방향
F:y→xLGAN(F,DX,Y,X)=Ex pdata(x)[logDX(x)]+Ey pdata(y)[log1−DX(F(y))]
Cycle Consistency Loss

Lcyc(G,F)=Ex pdata(x)[∣∣F(G(x))−x∣∣1]=Ey pdata(y)[∣∣G(F(y))−y∣∣1]
Results
