PGGAN ๊ตฌ์กฐ์์ Style transfer ๊ฐ๋ ์ ์ ์ฉํ์ฌ G(์์ฑ์) ์ํคํ ์ณ๋ฅผ ์ฌ๊ตฌ์ฑํจ
style์ scale-specific control ๊ฐ๋ฅํ๊ฒ ๋จ
VGG ์ ๊ฒฝ๋ง(์ด๋ฏธ์ง๋ฅผ ์ ๋ถ๋ฅํ ์ ์๊ฒ ํ์ต๋ ์ ๊ฒฝ๋ง)
PGGAN์ ์ ํด์๋๋ถํฐ ๊ณ ํด์๋๊น์ง ์ ์ง์ ์ผ๋ก ์์ฑํ๋ ๋ํ์ ์์ฑ ๋ชจ๋ธ
latent vector z ๊ฐ Normalize์ ๊ฑฐ์ณ ๋ชจ๋ธ์ ๋ฐ๋ก ์ ๋ ฅ์ด ๋๋ ํํ๋ก ํ์ต ์งํ
z๊ฐ Generator์ ๋ฐ๋ก ์ ๋ ฅ์ผ๋ก ๋ค์ด๊ฐ๋ฉด GAN์ latent space(์ ์ฌ๊ณต๊ฐ)๊ฐ ๋ฌด์กฐ๊ฑด ํ์ต ๋ฐ์ดํฐ์ ์ ํ๋ฅ ๋ถํฌ์ ๋น์ทํ ํํ๋ก ๋ง๋ค์ด ์ง๋๋ก ํ์ต์ ํ๊ฒ ๋ฉ๋๋ค.
์ด๋ ๊ฒ ๋๋ฉด latent space๊ฐ entangleํ๊ฒ ๋ง๋ค์ด ์ง๊ฒ ๋ฉ๋๋ค.
entangle
์๋ก ์ฝํ ์๋ ์ํ์ฌ์ ํน์ง ๊ตฌ๋ถ์ด ์ด๋ ค์ด ์ํ. ์ฆ, ๊ฐ ํน์ง๋ค์ด ์๋ก ์ฝํ์์ด์ ๊ตฌ๋ถ์ด ์๋จ
disentangle
๊ฐ style๋ค์ด ์ ๊ตฌ๋ถ ๋์ด์๋ ์ํ์ฌ์ ์ด๋ ๋ฐฉํฅ์ผ๋ก ๊ฐ๋ฉด A๋ผ๋ ํน์ง์ด ๋ณํ๊ณ B๋ผ๋ ํน์ง์ด ๋ณํ๊ฒ ๋์ด์ ํน์ง๋ค์ด ์ ๋ถ๋ฆฌ๊ฐ ๋์ด์๋ค๋ ์๋ฏธ.
์ ํ์ ์ผ๋ก ๋ณ์๋ฅผ ๋ณ๊ฒฝํ์ ๋ ์ด๋ค ๊ฒฐ๊ณผ๋ฌผ์ feature์ธ์ง ์์ธกํ ์ ์๋ ์ํ.
๊ฐ์ฐ์์ ๋ถํฌ์์ ์ํ๋งํ z ๋คํธ์ํฌ๋ฅผ ์ง์ ์ฌ์ฉํ์ง ์๊ณ , ๋งคํ ๋คํธ์ํฌ๋ฅผ ๊ฑฐ์ณ์ w๋ฒกํฐ๋ก ๋ฐ๊ฟ์ฃผ๊ณ , w๋ฒกํฐ๋ฅผ ๋คํธ์ํฌ์ ๋ฃ์ด์ค์ ์ด๋ฏธ์ง๋ฅผ ์ํ๋ง ํ ๋ ํจ์ฌ **๊ฐ ํน์ง๋ค์ด ์ ์ ํ ์ ํ์ **
์ผ๋ก ๊ตฌ๋ถ๋จ
์ด์งํผ ๋๋คํ ์ ๋ณด๋ W์ ๋ค ๋ค์ด๊ฐ์์ผ๋ ์ ๋นํ ๋ณํ์์ผ์ ์ฌ๋ฌ ์ค์ผ์ผ์ ์ง์ด๋ฃ์ด์ฃผ์
**์ํ๋ ์คํ์ผ์ ์ ์ฉ**
ํ ์ ์๋ค๋์ ์ด ์ฅ์ StyleGAN์ ์ด์ฉํ๋ฉด ์ค์ ๋ก๋ ์กด์ฌํ์ง ์์ง๋ง, ๊ต์ฅํ ๊ทธ๋ด์ธํ 1024 x 1024์ ๊ณ ํด์๋ ์ผ๊ตด ์ด๋ฏธ์ง๋ฅผ ๋ง๋ค ์ ์์ต๋๋ค.
์ค์๊ฐ ์ผ๊ตด ์์ฑ
https://thispersondoesnotexist.com/
StyleGAN์
**์ด๋ฏธ์ง ์์ฑ ๋ถ์ผ**
์์ ์ ๋์ํ๋ค๊ณ ์๋ ค์ง**๋ง์ ํ ํฌ๋๋ค์ ํฌํจ**
ํ๊ณ ์๋ ๋ ผ๋ฌธ์ด๋ผ ์ ๋ฌธ์๋ถ๋ค๊ป๋ ๋์ด๋๊ฐ ๋์ต๋๋ค. StyleGAN์ ์จ์ ํ ์ดํดํ๋ ค๋ฉด ๋ฅ๋ฌ๋์์์**Deep Convolutional GAN**
,**Style Transfer**
,**Feature Extracting**
,**Instance Normalization**
๋ฑ์ ๊ฐ๋ ์ ๋ชจ๋ ์๊ณ ์์ด์ผ ํฉ๋๋ค.
-๋๋น๋
GAN์์๋ input space(Z) โ latent space๋ก ๊ธฐ์ ๋จ
ํน์ง ๋ถ๋ฆฌ : StyleGAN์์๋ ํน์ง(์์ธ, ๋์ ๋ชจ์, ๊ฐ์ธ์ ํน์ด์ ๋ฑ) ์ ๋ถ๋ฆฌํ ์ ์๋ค.
์ฌ๋ ์ผ๊ตด ํน์ง์ ๋ํ ๋ผ๋ฒจ๋ง์ ์ปดํจํฐ๊ฐ ์์์ ์ฐพ๊ฒ ๋ง๋๋๊ฒ.
(a) ๋น ๊ณต๊ฐ์ ์ฌ๋์ ํน์ง์ ํด๋น๋์ง ์๋ ๋ถ๋ถ
(b) (a)๋ฅผ ์ด๊ฑฐ์ง๋ก ๋ง๋ค๋ค ๋ณด๋๊น w์ผ๊ทธ๋ฌ์ง ์ํ์ด ๋จ (๋งค์ฐ ์์ธกํ๊ธฐ ํ๋ ๋ฐ์ดํฐ๊ฐ ๋จ)
Latent z๊ฐ ์๋๋ถํฐ (a)์ ๊ฐ์ ๋ชจ์์ด ์๋ ์ด์ ์์ฃผ ์ด๋ ค์ด ์์ ์
(c) StyleGAN์ ๋ณธ์ง์ ์ผ๋ก z๊ฐ ์ด๋ค ๋ชจ์์ผ ์ง ๋ชจ๋ฅด๋๊น (a)์ ๋น์ทํ ํ๊ฒฝ ๋ถํฌ๋ฅผ ๊ฐ์ง๋๋ก ๋ฏธ๋ฆฌ ๋ํ์ ํ๊ณ ๋ค์ด๊ฐ์.
๋ฏธ๋ฆฌ non-linearํ๊ฒ ํ๋ฅ ๊ณต๊ฐ์ ์ฐฐํ์ฒ๋ผ ์ ๋ง์ ธ์ฃผ๊ณ (c)๋ฅผ ํตํด์ ํ๋ฅ ๋ถํฌ๋ฅผ ํ์ต์ํค๊ฒ ํ๋ฉด ์ต์ข ์ ์ผ๋ก ํจ์ฌ ์ฝ์ง ์์๊น?
์๋ ๊ณต๊ฐ์(a) ์๋ ์ ํ์ ์ธ ๊ตฌ์กฐ๋ ์๋์ ์ผ๋ก ์ ๋ณด์กด๋์ง ์๊ฒ ๋?
**๋งคํ ๋คํธ์ํฌ**
๋ฅผ ์จ์ ๋ณํ์ํจ๊ฒ ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌ๋ฅผ ํ๋ค!
W ๊ณต๊ฐ์ ์ด์ฉํด์ ํ์ต์ ํจ.
AdaIN ์ ์ ์ํคํ ์ฒ์ ์ ์ฉํ๊ธฐ ์ ๋นํ normalization ์ด๋ค
W๊ฐ ์ํฅ๋ ๋ฏธ์น๋ฉด์ normalization ํ ์ ์๋ ๋ฐฉ๋ฒ
ํน์ง๊ฐ์ ์ํฅ์ ๋ฏธ์น์ง ์๊ณ ๊ฐ ์ค์ผ์ผ์์๋ง ์ํฅ์ ๋ผ์น ์ ์๋๋ก ๋ถ๋ฆฌํด์ฃผ๋๊ฒ์ด ํ์ํ๋๋ฐ
๋ง์นจ AdaIN์ด ํน์ง ๋ถ๋ฆฌ์ ์ข์ ์ญํ ์ ๋ผ์ณค๋ค
mixing regularization (z1, z2, ...) ๊ฐ๊ฐ์ ์ค์ผ์ผ์ ๊ฐ๊ฐ์ z๋ฅผ ๋ฃ์ด์ ํ์ตํ๋ฉด ๋๋ช ์ ๋ค๋ฅธ ์ฌ๋ ์ผ๊ตด ํ์ตํ ๊ฒ์ฒ๋ผ ๋ ๊ฒ์ด๋ค.
์๋ก ๋ค๋ฅธ ๋ z1, z2๋ฅผ ์์ด์ ์ฌ์ฉํ๊ณ , ์ธ์ ํ ์ค์ผ์ผ์ ํน์ง ์ฌ์ด์ ์ฐ๊ด์ฑ์ ๋ฎ์ถ๋ค.
์ฅ์ : Latent z ์ ์๋ ํน์ง๋ค์ ๋ ๋ฆฝ์ผ ์ ์์ง๋ง ๊ณ์ฐ์ ํตํด ๋์จ W๋ค์ ๋ ๋ฆฝ์ด ์๋ ์ ์๋ค(๋๋คํ๊ฒ ์์์ผ๋๊น)
๋จธ๋ฆฌ๊ฐ ๊ฒ์ ์ฌ๋์ ํญ์ ์๊บผํ์ด ๋์ค๋๋ก ํน์ง์ด ์ฐ๊ด๋ ํ๋ฅ ์ด ๋๋ค.
**single Latent z๊ฐ W ํ๋๋ง ํ์ต**
ํ ๋ ํ์ต ๋ฐ์ดํฐ์
์์ ๋๋ฌผ๊ฒ ๋๋จธ๋ฆฌ์ธ ์ฌ๋์ ํญ์ ์ ๊ธ๋ผ์ค๋ฅผ ์ฐฉ์ฉํ๊ณ ์๋ ๋ฐ์ดํฐ๊ฐ ์๋ค.
์์ฑ์(G)๊ฐ ํ์ตํ๋ค๊ฐ **์ ๊ธ๋ผ์ค == ๋๋จธ๋ฆฌ**
๋ผ๋ correlation ์ด ๋ฐ์ํ์ฌ ์ค๋ฒํผํ
์ด ์ผ์ด๋ ๊ฐ๋ฅ์ฑ์ด ๋ง์์ง
๊ทธ๋์ ํน์ง๋ค๋ผ๋ฆฌ ์ ๋ถ๋ฆฌ๊ฐ ๋๊ฒ ๋ ๋ง๋ฆ
์์ ์ค์ผ์ผ์ ์ ๋ณด : ๊ณฑ์ฌ๋จธ๋ฆฌ, ๋จธ๋ฆฌ์นด๋ฝ ์์น, ์ฃผ๊ทผ๊นจ ๋ฑ๋ฑ
ํฐ ์ค์ผ์ผ์ ์ ๋ณด : ํผ๋ถ์, ์์ธ, ์ผ๊ตด ๊ฐ๋ ๋ฑ๋ฑ
Coarse styles(4^2 - 8^2) : ์๊ฒฝ๊ณผ ๋จธ๋ฆฌ์นด๋ฝ, ๋, ์นด๋ฉ๋ผ ๊ตฌ๋
Middle styles(16^2 - 32^2) : ์ผ๊ตด ํํ, ํน์ ๊ฐ๊ตฌ
Fine styles(64^2 - 1024^2) : ์ฃผ๋ก ์๊น์ ์์ญ, ์ธ๋ฐํ ์์, ์ฌ์ง๋ฑ
StyleGAN Latent ๋ฒกํฐ z๊ฐ ๋ด๋ด๋คํธ์ํฌ(ํ๋ฆฌ์ปค๋ฅํฐ๋FC)๋ฅผ ํ๋ฒ ๋น์ ํ์ ์ผ๋ก ๋งตํ์ด ๋ W๋ผ๋ ๊ฒ์ ์ฐ๊ณ ์๊ณ ํ ๊ณผ์ ์ด ์งํ๋ ๋ ๋ง๋ค ์ ์ํ๋ง์ด ์งํ๋๋๋ฐ (์ฒ์๋ถํฐ ํฐ ์ด๋ฏธ์ง๋ฅผ ๋ง๋๋๊ฒ ์ฝ์ง ์์ผ๋๊น ์์ ์ด๋ฏธ์ง๋ถํฐ ๋ง๋ค์ด์ ์ ์ฐจ ํฐ ์ด๋ฏธ์ง๋ฅผ ๋ง๋ค์ด ๋๊ฐ๋ ๋ฐฉ์ - ์์ ์ด๋ฏธ์ง๋ฅผ ํฝ์ 4๋ฐฐ๋ก ํด์ ์ ํ ์ํค๋ฉด ์ด๋ฏธ์ง๊ฐ ๊นจ์ ธ ์์ํ ๋ ๊ทธ๊ฑธ ๋ค์ ๋ด๋ด๋คํธ์ํฌ์ ๋ฃ๊ณ ๋๋ฆผ)
๊ธฐ์กด G(์์ฑ์)๋ ๋๋ค ์ธํ์ด ์ด๊ธฐ Z ํ๋ ๋ฟ์ด๊ธฐ์, ๋ ํฐ ์ค์ผ์ผ์์ ๋๋ค ๋๋ฒ๊ฐ ํ์ํ๋ฉด ์ด์ ์ ๊ฐ์์ ์ด๋ฅผ ์ถ์ถํด์์ผ ํ๋ค.
๋๋ฌธ์ ๊ฐ ์ฑ๋๋ง๋ค ๋ค๋ฅธ ๋ ธ์ด์ฆ๋ฅผ(B) ๋ฃ์ด์ฃผ๋ฉด ๊ทธ๋ด ํ์๊ฐ ์๋ค!
๊ฐ์ฐ์์ ๋ ธ์ด์ฆ๋ค๋ ๋ฐ๋ก ๋ง๋ค์ด์ ๊ฐ ๋ ์ด์ด์ ๋ณํํด์ ์ง์ด๋ฃ๊ณ ์๋ค.
๊ฐ ์ค์ผ์ผ์ด ์ฌ๋ผ๊ฐ๋๋ง๋ค ์คํ์ผ๊ณผ ๋ ธ์ด์ฆ๋ฅผ ์ง์ด๋ฃ์ด์ ํ์ต์ํจ๋ค
ํ๊ณ : ๋ฌผ๋ฐฉ์ธ ํํ์(blob) ๋ฒ์ง๋ฏํ ๋๋์ด ์์ฃผ ๊ด์ธก์ด ๋์๋ค.
์ด ๊ฒฐ๊ณผ๋ค์ด ์ด๋์ ๋์ค๊ณ ์ ๋์ค๋์ง์ ๋ํ StyleGAN2๊ฐ ๋์๋ค
๋ฌผ๋ฐฉ์ธ์ด ์์๋ ์ด๋ฏธ์ง์ ํ๋ฆฌํฐ๊ฐ ๋๋น ์ง๋ ๊ฒฐ๊ณผ๊ฐ ๋์๋ค
์ด๋ฅผ ๊ฐ์ ํด์ StyleGAN2๋ฅผ ๋ง๋ค์๋ค.
๊ฐ style์ ๋ด๋นํ๋ layer์ styleย w์ AdaIN์ ํตํด์ ์ ๋ ฅํด์ฃผ๋ ๋ฐฉ๋ฒ์ผ๋ก ํ์ต ํจ์ผ๋ก ์จ ์ํ๋ style๋ก ๋ณํ์ ์์ผ์ค ์ ์๋ ๋ชจ๋ธ์ด๋ค.
๊ธฐ์กด 1์ ๋ฌธ์
Droplet artifacts
conv ๋ ์ด์ด ์ฌ์ด์ ์๋๊ฒ๋ค์ ๋ฐ์ผ๋ก ๋นผ๋ด์ด conv์ conv ์ฌ์ด feature์ ๊ด๊ณ์ ์ํฅ์ ์์ฐ์ผ๋ก์ ํผํฌ๋จผ์ค๋ฅผ ์ฆ๊ฐ ์์ผฐ๋ค
AdaIn(adaptive instance normalization)
PPL์ด ๋ฎ์ ์ฌ์ง์ด ๋ ํ์ง์ด ์ข๋ค.
E. Phase artifacts
F . ๋คํธ์ํฌ ํฌ๊ธฐ๋ฅผ ํค์ ๋ค
alias-free ํ ๋คํธ์ํฌ ์ ์