StyleGAN Truncation

조성운·2022년 11월 16일

Truncation trick in WW

Truncation trick은 실제 학습 데이터의 전반적인 부분을 densitiy가 낮은 부분까지 고려하여 반영할 것인가 결정하는 수치이다.

wˉ=EzP(z)[f(z)]\bar{w} = E_{z\sim P(z)}[f(z)]
w=wˉ+ψ(wwˉ)w' = \bar{w}+\psi(w-\bar{w})

training set으로 훈련하여 이미지를 생성하다보면, desnitiy가 낮은 부분의 경우 학습 후 표현이 잘 되지 않을 수 있다.(학습이 불안정하다.) 즉 ww로 이미지를 생성하게 되면 density가 높은 이미지만을 생성할 가능성이 높다. 이때 평균 wˉ\bar{w} 값을 참고해 desnity가 낮은 부분의 feature도 반영하는 방법이 Truncation trick이다.

학습 중에 적용하지 않으며, 학습이 완료된 네트워크의 input을 제어하는 식으로 진행된다. space WW에서 임의로 추출된 wwwˉ\bar{w}을 통해서 ww'로 trucation trick을 사용하게 된다.

  • wˉ\bar{w} : 평균 wˉ\bar{w}
  • ψ=1\psi=1 : w=ww'=w truncation을 사용하지 않는다.
  • ψ<1\psi < 1 : truncation을 사용한다.
  • ψ=0\psi = 0 : w=wˉw'=\bar{w} 이므로 모두 같은 평균 사진이 생성된다.

ψ\psi 값이 작으면 작을 수록 wˉ\bar{w}의 영향이 커진다.

  • 값이 높을 수록 더욱더 다양하고 극단적인(extreme) 이미지를 생성한다. (퀄리티는 줄어든다.)
  • 값이 작을 수록 더욱더 다양성이 낮아지고 이미지의 퀄리티는 올라간다.
profile
DL 관련 공부 중입니다

0개의 댓글