๐Ÿ“Œ StyleGAN์˜ ๋ณ€์ฒœ์‚ฌ

๊น€๋‹น๊ทผยท2022๋…„ 3์›” 6์ผ
0

AIFFEL

๋ชฉ๋ก ๋ณด๊ธฐ
12/14

StyleGAN1

PGGAN ๊ตฌ์กฐ์—์„œ Style transfer ๊ฐœ๋…์„ ์ ์šฉํ•˜์—ฌ G(์ƒ์„ฑ์ž) ์•„ํ‚คํ…์ณ๋ฅผ ์žฌ๊ตฌ์„ฑํ•จ

style์„ scale-specific control ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋จ

VGG ์‹ ๊ฒฝ๋ง(์ด๋ฏธ์ง€๋ฅผ ์ž˜ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•™์Šต๋œ ์‹ ๊ฒฝ๋ง)

1. PGGAN(ProGAN - progressively : ์ ์ง„์ )

PGGAN์€ ์ €ํ•ด์ƒ๋„๋ถ€ํ„ฐ ๊ณ ํ•ด์ƒ๋„๊นŒ์ง€ ์ ์ง„์ ์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ๋Œ€ํ‘œ์  ์ƒ์„ฑ ๋ชจ๋ธ

latent vector z ๊ฐ€ Normalize์„ ๊ฑฐ์ณ ๋ชจ๋ธ์— ๋ฐ”๋กœ ์ž…๋ ฅ์ด ๋˜๋Š” ํ˜•ํƒœ๋กœ ํ•™์Šต ์ง„ํ–‰

z๊ฐ€ Generator์— ๋ฐ”๋กœ ์ž…๋ ฅ์œผ๋กœ ๋“ค์–ด๊ฐ€๋ฉด GAN์€ latent space(์ž ์žฌ๊ณต๊ฐ„)๊ฐ€ ๋ฌด์กฐ๊ฑด ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹์˜ ํ™•๋ฅ ๋ถ„ํฌ์™€ ๋น„์Šทํ•œ ํ˜•ํƒœ๋กœ ๋งŒ๋“ค์–ด ์ง€๋„๋ก ํ•™์Šต์„ ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์Šคํฌ๋ฆฐ์ƒท 2022-02-15 ์˜คํ›„ 3.20.37.png

์ด๋ ‡๊ฒŒ ๋˜๋ฉด latent space๊ฐ€ entangleํ•˜๊ฒŒ ๋งŒ๋“ค์–ด ์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

entangle

์„œ๋กœ ์–ฝํ˜€ ์žˆ๋Š” ์ƒํƒœ์—ฌ์„œ ํŠน์ง• ๊ตฌ๋ถ„์ด ์–ด๋ ค์šด ์ƒํƒœ. ์ฆ‰, ๊ฐ ํŠน์ง•๋“ค์ด ์„œ๋กœ ์–ฝํ˜€์žˆ์–ด์„œ ๊ตฌ๋ถ„์ด ์•ˆ๋จ

disentangle

๊ฐ style๋“ค์ด ์ž˜ ๊ตฌ๋ถ„ ๋˜์–ด์žˆ๋Š” ์ƒํƒœ์—ฌ์„œ ์–ด๋Š ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐ€๋ฉด A๋ผ๋Š” ํŠน์ง•์ด ๋ณ€ํ•˜๊ณ  B๋ผ๋Š” ํŠน์ง•์ด ๋ณ€ํ•˜๊ฒŒ ๋˜์–ด์„œ ํŠน์ง•๋“ค์ด ์ž˜ ๋ถ„๋ฆฌ๊ฐ€ ๋˜์–ด์žˆ๋‹ค๋Š” ์˜๋ฏธ.

์„ ํ˜•์ ์œผ๋กœ ๋ณ€์ˆ˜๋ฅผ ๋ณ€๊ฒฝํ–ˆ์„ ๋•Œ ์–ด๋–ค ๊ฒฐ๊ณผ๋ฌผ์˜ feature์ธ์ง€ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํƒœ.

๋ฉ”์ธ ์•„์ด๋””์–ด

  • ํ•™์Šต ๊ณผ์ •์—์„œ ๋ ˆ์ด์–ด ์ถ”๊ฐ€
  • ๊ณ ํ•ด์ƒ๋„ ์ด๋ฏธ์ง€ ํ•™์Šต ์„ฑ๊ณต

ํ•œ๊ณ„์ 

  • ์ด๋ฏธ์ง€์˜ ํŠน์ง• ์ œ์–ด๊ฐ€ ์–ด๋ ค์›€
  • ํŠน์ง•์ด ๊ตฌ๋ถ„๋˜์–ด ์žˆ์ง€ ์•Š์•„์„œ ํŠน์ • ๋ถ€๋ถ„์„ ์ˆ˜์ •ํ• ๋•Œ ์—ฌ๋Ÿฌ ํŠน์ง•์ด ๊ฐ™์ด ๊ฐœ์ž…๋˜๋Š” ํ˜„์ƒ์ด ๋ฐœ์ƒ

์Šคํฌ๋ฆฐ์ƒท 2022-02-15 ์˜คํ›„ 3.15.57.png

StyleGAN

ํ•ต์‹ฌ ์•„์ด๋””์–ด : ๋งคํ•‘ ๋„คํŠธ์›Œํฌ(Mapping Network)

๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ์—์„œ ์ƒ˜ํ”Œ๋งํ•œ z ๋„คํŠธ์›Œํฌ๋ฅผ ์ง์ ‘ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ , ๋งคํ•‘ ๋„คํŠธ์›Œํฌ๋ฅผ ๊ฑฐ์ณ์„œ w๋ฒกํ„ฐ๋กœ ๋ฐ”๊ฟ”์ฃผ๊ณ , w๋ฒกํ„ฐ๋ฅผ ๋„คํŠธ์›Œํฌ์— ๋„ฃ์–ด์ค˜์„œ ์ด๋ฏธ์ง€๋ฅผ ์ƒ˜ํ”Œ๋ง ํ•  ๋•Œ ํ›จ์”ฌ **๊ฐ ํŠน์ง•๋“ค์ด ์ ์ ˆํžˆ ์„ ํ˜•์ **์œผ๋กœ ๊ตฌ๋ถ„๋จ

์–ด์งœํ”ผ ๋žœ๋คํ•œ ์ •๋ณด๋Š” W์— ๋‹ค ๋“ค์–ด๊ฐ€์žˆ์œผ๋‹ˆ ์ ๋‹นํžˆ ๋ณ€ํ˜•์‹œ์ผœ์„œ ์—ฌ๋Ÿฌ ์Šค์ผ€์ผ์— ์ง‘์–ด๋„ฃ์–ด์ฃผ์ž

Style Transfer + GAN= StyleGAN ์Šคํƒ€์ผ ๊ฐœ๋…์„ ์ด๋ฏธ์ง€๋ฅผ ๋งŒ๋“œ๋Š” GAN์— ์ ์šฉํ•œ๊ฒƒ

Style Transfer๋Š” CNN์„ ํ™œ์šฉํ•ด ์ด๋ฏธ์ง€์˜ ์Šคํƒ€์ผ(style)์„ ์ „์†กํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค

Style ์€ ์„œ๋กœ ๋‹ค๋ฅธ ํŠน์ง•(ํ”ผ์ณ) ๊ฐ„์˜ ์ƒ๊ด€๊ด€๊ณ„(correlation)์ด๋‹ค

๋‹ค์–‘ํ•œ ์Šคํƒ€์ผ์„ ๋ถ„๋ฆฌํ•ด์„œ **์›ํ•˜๋Š” ์Šคํƒ€์ผ์„ ์ ์šฉ**ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š”์ ์ด ์žฅ์ 

๊ฐ์ž์˜ ํŠน์ง•์ด disentangle ๋˜์–ด์žˆ๊ธฐ์— ๊ฐ€๋Šฅํ•œ๊ฒƒ

StyleGAN์„ ์ ์šฉํ•˜๊ณ ์ž ํ•œ ์ด์œ ๊ฐ€ ๊ฐ ํŒŒ๋„์˜ ํŠน์ง•์„ ๊ฐ€์ ธ์™€์„œ ๊ธฐ์กด์— ์—†๋˜ ์ƒˆ๋กœ์šด ํŒŒ๋„์˜์ƒ์„ ๋งŒ๋“ค๊ธฐ ์œ„ํ•œ ํˆด๋กœ ์ ํ•ฉํ–ˆ๊ธฐ ๋•Œ๋ฌธ

๋ชจ๋ธ์—์„œ ๋‚˜์˜จ ์ •๋ณด๋“ค์„ ๋‹ค๋ฅธ ์Šค์ผ€์ผ์— ๋„ฃ์–ด์„œ ์„ธ๋ถ€์ ์ธ ์Šคํƒ€์ผ๋ถ€ํ„ฐ ๋„“์€ ์Šคํƒ€์ผ๊นŒ์ง€ ํ•™์Šต์ด ๋œ๋‹ค๋Š”๊ฒŒ StyleGAN์˜ ๋ฉ”์ธ ํฌ์ธํŠธ

StyleGAN์„ ์ด์šฉํ•˜๋ฉด ์‹ค์ œ๋กœ๋Š” ์กด์žฌํ•˜์ง€ ์•Š์ง€๋งŒ, ๊ต‰์žฅํžˆ ๊ทธ๋Ÿด์‹ธํ•œ 1024 x 1024์˜ ๊ณ ํ•ด์ƒ๋„ ์–ผ๊ตด ์ด๋ฏธ์ง€๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์‹ค์‹œ๊ฐ„ ์–ผ๊ตด ์ƒ์„ฑ
https://thispersondoesnotexist.com/

StyleGAN์€ **์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ถ„์•ผ**์—์„œ ์ž˜ ๋™์ž‘ํ•œ๋‹ค๊ณ  ์•Œ๋ ค์ง„ **๋งŽ์€ ํ…Œํฌ๋‹‰๋“ค์„ ํฌํ•จ**ํ•˜๊ณ  ์žˆ๋Š” ๋…ผ๋ฌธ์ด๋ผ ์ž…๋ฌธ์ž๋ถ„๋“ค๊ป˜๋Š” ๋‚œ์ด๋„๊ฐ€ ๋†’์Šต๋‹ˆ๋‹ค. StyleGAN์„ ์˜จ์ „ํžˆ ์ดํ•ดํ•˜๋ ค๋ฉด ๋”ฅ๋Ÿฌ๋‹์—์„œ์˜ **Deep Convolutional GAN**, **Style Transfer**, **Feature Extracting**, **Instance Normalization** ๋“ฑ์˜ ๊ฐœ๋…์„ ๋ชจ๋‘ ์•Œ๊ณ  ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
-๋™๋นˆ๋‚˜

GAN์—์„œ๋Š” input space(Z) โ†’ latent space๋กœ ๊ธฐ์ˆ ๋จ

stylegan.png

์žฅ์ 

  1. ํŠน์งˆ ๋ถ„๋ฆฌ : StyleGAN์—์„œ๋Š” ํŠน์งˆ(์ž์„ธ, ๋ˆˆ์˜ ๋ชจ์–‘, ๊ฐœ์ธ์˜ ํŠน์ด์ ๋“ฑ) ์„ ๋ถ„๋ฆฌํ•  ์ˆ˜ ์žˆ๋‹ค.

    ์‚ฌ๋žŒ ์–ผ๊ตด ํŠน์ง•์— ๋Œ€ํ•œ ๋ผ๋ฒจ๋ง์„ ์ปดํ“จํ„ฐ๊ฐ€ ์•Œ์•„์„œ ์ฐพ๊ฒŒ ๋งŒ๋“œ๋Š”๊ฒƒ.

    (a) ๋นˆ ๊ณต๊ฐ„์€ ์‚ฌ๋žŒ์˜ ํŠน์ง•์— ํ•ด๋‹น๋„์ง€ ์•Š๋Š” ๋ถ€๋ถ„

    (b) (a)๋ฅผ ์–ด๊ฑฐ์ง€๋กœ ๋งŒ๋“ค๋‹ค ๋ณด๋‹ˆ๊นŒ w์ผ๊ทธ๋Ÿฌ์ง„ ์›ํ˜•์ด ๋จ (๋งค์šฐ ์˜ˆ์ธกํ•˜๊ธฐ ํž˜๋“  ๋ฐ์ดํ„ฐ๊ฐ€ ๋จ)

    Latent z๊ฐ€ ์›๋ž˜๋ถ€ํ„ฐ (a)์™€ ๊ฐ™์€ ๋ชจ์–‘์ด ์•„๋‹Œ ์ด์ƒ ์•„์ฃผ ์–ด๋ ค์šด ์ž‘์—…์ž„

    (c) StyleGAN์€ ๋ณธ์งˆ์ ์œผ๋กœ z๊ฐ€ ์–ด๋–ค ๋ชจ์–‘์ผ ์ง€ ๋ชจ๋ฅด๋‹ˆ๊นŒ (a)์™€ ๋น„์Šทํ•œ ํ™˜๊ฒฝ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง€๋„๋ก ๋ฏธ๋ฆฌ ๋ž˜ํ•‘์„ ํ•˜๊ณ  ๋“ค์–ด๊ฐ€์ž.

    ๋ฏธ๋ฆฌ non-linearํ•˜๊ฒŒ ํ™•๋ฅ  ๊ณต๊ฐ„์„ ์ฐฐํ‘์ฒ˜๋Ÿผ ์ž˜ ๋งŒ์ ธ์ฃผ๊ณ  (c)๋ฅผ ํ†ตํ•ด์„œ ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ํ•™์Šต์‹œํ‚ค๊ฒŒ ํ•˜๋ฉด ์ตœ์ข…์ ์œผ๋กœ ํ›จ์”ฌ ์‰ฝ์ง€ ์•Š์„๊นŒ?

    ์›๋ž˜ ๊ณต๊ฐ„์—(a) ์žˆ๋˜ ์„ ํ˜•์ ์ธ ๊ตฌ์กฐ๋„ ์ƒ๋Œ€์ ์œผ๋กœ ์ž˜ ๋ณด์กด๋˜์ง€ ์•Š๊ฒ ๋‚˜?

    **๋งคํ•‘ ๋„คํŠธ์›Œํฌ**๋ฅผ ์จ์„œ ๋ณ€ํ™”์‹œํ‚จ๊ฒŒ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๊ธฐ์—ฌ๋ฅผ ํ–ˆ๋‹ค!

    W ๊ณต๊ฐ„์„ ์ด์šฉํ•ด์„œ ํ•™์Šต์„ ํ•จ.

  2. AdaIN ์€ ์œ„ ์•„ํ‚คํ…์ฒ˜์— ์ ์šฉํ•˜๊ธฐ ์ ๋‹นํ•œ normalization ์ด๋‹ค

    W๊ฐ€ ์˜ํ–ฅ๋„ ๋ฏธ์น˜๋ฉด์„œ normalization ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•

    ํŠน์ง•๊ฐ„์— ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€ ์•Š๊ณ  ๊ฐ ์Šค์ผ€์ผ์—์„œ๋งŒ ์˜ํ–ฅ์„ ๋ผ์น  ์ˆ˜ ์žˆ๋„๋ก ๋ถ„๋ฆฌํ•ด์ฃผ๋Š”๊ฒƒ์ด ํ•„์š”ํ–ˆ๋Š”๋ฐ

    ๋งˆ์นจ AdaIN์ด ํŠน์งˆ ๋ถ„๋ฆฌ์— ์ข‹์€ ์—ญํ• ์„ ๋ผ์ณค๋‹ค

  1. mixing regularization (z1, z2, ...) ๊ฐ๊ฐ์˜ ์Šค์ผ€์ผ์— ๊ฐ๊ฐ์˜ z๋ฅผ ๋„ฃ์–ด์„œ ํ•™์Šตํ•˜๋ฉด ๋‘๋ช…์˜ ๋‹ค๋ฅธ ์‚ฌ๋žŒ ์–ผ๊ตด ํ•™์Šตํ•œ ๊ฒƒ์ฒ˜๋Ÿผ ๋  ๊ฒƒ์ด๋‹ค.

    ์„œ๋กœ ๋‹ค๋ฅธ ๋‘ z1, z2๋ฅผ ์„ž์–ด์„œ ์‚ฌ์šฉํ•˜๊ณ , ์ธ์ ‘ํ•œ ์Šค์ผ€์ผ์˜ ํŠน์งˆ ์‚ฌ์ด์˜ ์—ฐ๊ด€์„ฑ์„ ๋‚ฎ์ถ˜๋‹ค.

    ์Šคํฌ๋ฆฐ์ƒท 2022-02-15 ์˜คํ›„ 6.07.01.png

    ์žฅ์  : Latent z ์— ์žˆ๋Š” ํŠน์ง•๋“ค์€ ๋…๋ฆฝ์ผ ์ˆ˜ ์žˆ์ง€๋งŒ ๊ณ„์‚ฐ์„ ํ†ตํ•ด ๋‚˜์˜จ W๋“ค์€ ๋…๋ฆฝ์ด ์•„๋‹ ์ˆ˜ ์žˆ๋‹ค(๋žœ๋คํ•˜๊ฒŒ ์„ž์˜€์œผ๋‹ˆ๊นŒ)

    ๋จธ๋ฆฌ๊ฐ€ ๊ฒ€์€ ์‚ฌ๋žŒ์€ ํ•ญ์ƒ ์Œ๊บผํ’€์ด ๋‚˜์˜ค๋„๋ก ํŠน์ง•์ด ์—ฐ๊ด€๋  ํ™•๋ฅ ์ด ๋†’๋‹ค.

    **single Latent z๊ฐ€ W ํ•˜๋‚˜๋งŒ ํ•™์Šต** ํ•  ๋•Œ ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋“œ๋ฌผ๊ฒŒ ๋Œ€๋จธ๋ฆฌ์ธ ์‚ฌ๋žŒ์€ ํ•ญ์ƒ ์„ ๊ธ€๋ผ์Šค๋ฅผ ์ฐฉ์šฉํ•˜๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋‹ค.

    ์ƒ์„ฑ์ž(G)๊ฐ€ ํ•™์Šตํ•˜๋‹ค๊ฐ€ **์„ ๊ธ€๋ผ์Šค == ๋Œ€๋จธ๋ฆฌ** ๋ผ๋Š” correlation ์ด ๋ฐœ์ƒํ•˜์—ฌ ์˜ค๋ฒ„ํ”ผํŒ…์ด ์ผ์–ด๋‚  ๊ฐ€๋Šฅ์„ฑ์ด ๋งŽ์•„์ง

    ๊ทธ๋ž˜์„œ ํŠน์งˆ๋“ค๋ผ๋ฆฌ ์ž˜ ๋ถ„๋ฆฌ๊ฐ€ ๋˜๊ฒŒ ๋” ๋งŒ๋“ฆ

    ์Šคํฌ๋ฆฐ์ƒท 2022-02-15 ์˜คํ›„ 7.01.10.png

    ์ž‘์€ ์Šค์ผ€์ผ์˜ ์ •๋ณด : ๊ณฑ์Šฌ๋จธ๋ฆฌ, ๋จธ๋ฆฌ์นด๋ฝ ์œ„์น˜, ์ฃผ๊ทผ๊นจ ๋“ฑ๋“ฑ
    ํฐ ์Šค์ผ€์ผ์˜ ์ •๋ณด : ํ”ผ๋ถ€์ƒ‰, ์ž์„ธ, ์–ผ๊ตด ๊ฐ๋„ ๋“ฑ๋“ฑ

    Coarse styles(4^2 - 8^2) : ์•ˆ๊ฒฝ๊ณผ ๋จธ๋ฆฌ์นด๋ฝ, ๋ˆˆ, ์นด๋ฉ”๋ผ ๊ตฌ๋„
    Middle styles(16^2 - 32^2) : ์–ผ๊ตด ํ˜•ํƒœ, ํŠน์ • ๊ฐ€๊ตฌ
    Fine styles(64^2 - 1024^2) : ์ฃผ๋กœ ์ƒ‰๊น”์˜ ์˜์—ญ, ์„ธ๋ฐ€ํ•œ ์ƒ‰์ƒ, ์žฌ์งˆ๋“ฑ

    ์Šคํฌ๋ฆฐ์ƒท 2022-02-15 ์˜คํ›„ 3.15.57.jpg

    StyleGAN Latent ๋ฒกํ„ฐ z๊ฐ€ ๋‰ด๋Ÿด๋„คํŠธ์›Œํฌ(ํ’€๋ฆฌ์ปค๋„ฅํ‹ฐ๋“œFC)๋ฅผ ํ•œ๋ฒˆ ๋น„์„ ํ˜•์ ์œผ๋กœ ๋งตํ•‘์ด ๋œ W๋ผ๋Š” ๊ฒƒ์„ ์“ฐ๊ณ  ์žˆ๊ณ  ํ•œ ๊ณผ์ •์ด ์ง„ํ–‰๋  ๋•Œ ๋งˆ๋‹ค ์—…์ƒ˜ํ”Œ๋ง์ด ์ง„ํ–‰๋˜๋Š”๋ฐ (์ฒ˜์Œ๋ถ€ํ„ฐ ํฐ ์ด๋ฏธ์ง€๋ฅผ ๋งŒ๋“œ๋Š”๊ฒŒ ์‰ฝ์ง€ ์•Š์œผ๋‹ˆ๊นŒ ์ž‘์€ ์ด๋ฏธ์ง€๋ถ€ํ„ฐ ๋งŒ๋“ค์–ด์„œ ์ ์ฐจ ํฐ ์ด๋ฏธ์ง€๋ฅผ ๋งŒ๋“ค์–ด ๋‚˜๊ฐ€๋Š” ๋ฐฉ์‹ - ์ž‘์€ ์ด๋ฏธ์ง€๋ฅผ ํ”ฝ์…€ 4๋ฐฐ๋กœ ํ•ด์„œ ์ ํ•‘ ์‹œํ‚ค๋ฉด ์ด๋ฏธ์ง€๊ฐ€ ๊นจ์ ธ ์žˆ์„ํ…Œ๋‹ˆ ๊ทธ๊ฑธ ๋‹ค์‹œ ๋‰ด๋Ÿด๋„คํŠธ์›Œํฌ์— ๋„ฃ๊ณ  ๋Œ๋ฆผ)

    • Style์„ ํ•œ๋ฒˆ์— ๋‹ค ์ง‘์–ด ๋„ฃ๋Š”๊ฑด ๋งค์šฐ ์–ด๋ ต๊ณ  ๋‰ด๋Ÿด ๋„คํŠธ์›Œํฌ๊ฐ€ ๊ทธ๊ฑธ ๋ถ„๋ฆฌํ•ด์„œ ์ดํ•ดํ•˜๋Š”๊ฒƒ๋„ ์–ด๋ ค์šธ๊ฒƒ์ด๋‹ค
    • W๋Š” A(์•„ํ•€๋ณ€ํ™˜)์„ ํ†ตํ•ด์„œ AdaIN์— ๋“ค์–ด๊ฐ€๋Š” ์Šคํƒ€์ผ์˜ ์ •๋ณด๊ฐ€ ๋  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“ค์–ด ์คŒ
    1. ๋ถ€๋ถ„ ๋ณ€ํ™” ์ƒ˜ํ”Œ๋ง

    ๊ธฐ์กด G(์ƒ์„ฑ์ž)๋Š” ๋žœ๋ค ์ธํ’‹์ด ์ดˆ๊ธฐ Z ํ•˜๋‚˜ ๋ฟ์ด๊ธฐ์—, ๋” ํฐ ์Šค์ผ€์ผ์—์„œ ๋žœ๋ค ๋„˜๋ฒ„๊ฐ€ ํ•„์š”ํ•˜๋ฉด ์ด์ „์˜ ๊ฐ’์—์„œ ์ด๋ฅผ ์ถ”์ถœํ•ด์™€์•ผ ํ•œ๋‹ค.

    ๋•Œ๋ฌธ์— ๊ฐ ์ฑ„๋„๋งˆ๋‹ค ๋‹ค๋ฅธ ๋…ธ์ด์ฆˆ๋ฅผ(B) ๋„ฃ์–ด์ฃผ๋ฉด ๊ทธ๋Ÿด ํ•„์š”๊ฐ€ ์—†๋‹ค!

    ๊ฐ€์šฐ์‹œ์•ˆ ๋…ธ์ด์ฆˆ๋“ค๋„ ๋”ฐ๋กœ ๋งŒ๋“ค์–ด์„œ ๊ฐ ๋ ˆ์ด์–ด์— ๋ณ€ํ™˜ํ•ด์„œ ์ง‘์–ด๋„ฃ๊ณ  ์žˆ๋‹ค.

    ๊ฐ ์Šค์ผ€์ผ์ด ์˜ฌ๋ผ๊ฐˆ๋•Œ๋งˆ๋‹ค ์Šคํƒ€์ผ๊ณผ ๋…ธ์ด์ฆˆ๋ฅผ ์ง‘์–ด๋„ฃ์–ด์„œ ํ•™์Šต์‹œํ‚จ๋‹ค

    • ์ค‘์š”ํ•œ ํŠน์ง•์€ ๋ณด์กดํ•œ ์ฑ„ ์„ธ๋ถ€์ ์ธ ๋ถ€๋ถ„(๋จธ๋ฆฌ์นด๋ฝ์˜ ์œ„์น˜, ์ฃผ๊ทผ๊นจ ๋“ฑ)์˜ ๋ณ€ํ™”๋งŒ ์ฃผ๋Š” ์ƒ˜ํ”Œ๋ง ๊ฐ€๋Šฅ

    ํ•œ๊ณ„ : ๋ฌผ๋ฐฉ์šธ ํ˜•ํƒœ์˜(blob) ๋ฒˆ์ง„๋“ฏํ•œ ๋Š๋‚Œ์ด ์ž์ฃผ ๊ด€์ธก์ด ๋˜์—ˆ๋‹ค.

    ์ด ๊ฒฐ๊ณผ๋“ค์ด ์–ด๋””์„œ ๋‚˜์˜ค๊ณ  ์™œ ๋‚˜์˜ค๋Š”์ง€์— ๋Œ€ํ•œ StyleGAN2๊ฐ€ ๋‚˜์™”๋‹ค

    ๋ฌผ๋ฐฉ์šธ์ด ์—†์„๋•Œ ์ด๋ฏธ์ง€์˜ ํ€„๋ฆฌํ‹ฐ๊ฐ€ ๋‚˜๋น ์ง€๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์™”๋‹ค

    ์ด๋ฅผ ๊ฐœ์„ ํ•ด์„œ StyleGAN2๋ฅผ ๋งŒ๋“ค์—ˆ๋‹ค.

    ๊ฒฐ๋ก 

    ๊ฐ style์„ ๋‹ด๋‹นํ•˜๋Š” layer์— styleย w์„ AdaIN์„ ํ†ตํ•ด์„œ ์ž…๋ ฅํ•ด์ฃผ๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ํ•™์Šต ํ•จ์œผ๋กœ ์จ ์›ํ•˜๋Š” style๋กœ ๋ณ€ํ˜•์„ ์‹œ์ผœ์ค„ ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์ด๋‹ค.


StyleGAN2

๊ธฐ์กด 1์˜ ๋ฌธ์ œ

  1. Droplet artifacts

    1. ๋ฌผ๋ฐฉ์šธ ๋…ธ์ด์ฆˆ๋ฅผ ์ œ๊ฑฐํ•˜๊ฒŒ ๋˜๋ฉด ์ด๋ฏธ์ง€์— ์†์ƒ์ด ์ƒ๊น€

    conv ๋ ˆ์ด์–ด ์‚ฌ์ด์— ์žˆ๋Š”๊ฒƒ๋“ค์„ ๋ฐ–์œผ๋กœ ๋นผ๋‚ด์–ด conv์™€ conv ์‚ฌ์ด feature์˜ ๊ด€๊ณ„์— ์˜ํ–ฅ์„ ์—†์•ฐ์œผ๋กœ์„œ ํผํฌ๋จผ์Šค๋ฅผ ์ฆ๊ฐ€ ์‹œ์ผฐ๋‹ค

    style-gan2-droplet.jpeg

  1. AdaIn(adaptive instance normalization)

    1. AdaIN์„ ์ด์šฉํ•˜๋ฉด ํ”ผ์ณ๋งต๋งˆ๋‹ค ๊ฐ ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ์œผ๋กœ normalization ํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰ ์ž…๋ ฅ๊ฐ’์˜ ํ†ต๊ณ„๋Ÿ‰์„ ์ด์šฉํ•˜๋Š” ๊ฒƒ์ด์ง€์š”. ๊ทธ๋Ÿฐ๋ฐ ์ด ๋ฐฉ์‹์€ ํ”ผ์ณ๋งต๋“ค ์‚ฌ์ด์— ์ƒ๋Œ€์ ์ธ ํฌ๊ธฐ ์ฐจ์ด๊ฐ€ ์žˆ์„ ๊ฒฝ์šฐ, ์ด ์ •๋ณด๋ฅผ ์™œ๊ณกํ•ฉ๋‹ˆ๋‹ค.
    2. StyleGAN2์—์„œ๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์—ˆ๋˜ AdaIN๋ฅผ ์ˆ˜์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์•„ํ‚คํ…์ณ์™€ ํ•™์Šต ๋ฐฉ์‹์—๋„ ๋ณ€ํ™”๋ฅผ ์ฃผ์–ด ์ƒ์„ฑ ์ด๋ฏธ์ง€์˜ ํ’ˆ์งˆ์ด ๋”์šฑ ํ–ฅ์ƒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.
  2. PPL์ด ๋‚ฎ์€ ์‚ฌ์ง„์ด ๋” ํ’ˆ์งˆ์ด ์ข‹๋‹ค.

E. Phase artifacts

  • ๊ธฐ์กด์˜ MSG-GAN ๊ตฌ์กฐ๋ฅผ ๋ณ€ํ˜•
  • ๋ˆˆ์ด๋‚˜ ์ด๋นจ์˜ ๋ชจ์–‘์€ ์ž˜ ์ƒ์„ฑ ๋˜์ง€๋งŒ ์ž์„ธ๋ฅผ ๋ฐ”๊ฟ”๋„ ์น˜์•„์˜ ์œ„์น˜๊ฐ€ ๊ณ ์ •์ด ๋˜์ง€ ์•Š๋Š” ํ˜„์ƒ์ด ์ƒ๊ฒจ
  • StyleGAN2 ์—์„œ๋Š” ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž progressive growing ํ•™์Šต๋ฐฉ๋ฒ•์„ ์ฑ„ํƒํ•˜์ง€ ์•Š์Œ

F . ๋„คํŠธ์›Œํฌ ํฌ๊ธฐ๋ฅผ ํ‚ค์› ๋‹ค

  • 1024*1024์˜ contribution์ด ํฌ๊ฒŒ ์ฆ๊ฐ€ํ–ˆ๋‹ค
  • FID ์Šค์ฝ”์–ด๋„ ๋‚ฎ์•„์ง€๋Š” ๊ฒฐ๊ณผ

StyleGAN3

alias-free ํ•œ ๋„คํŠธ์›Œํฌ ์ œ์•ˆ

  • StyleGAN3๋Š” FID๋„ ๊ดœ์ฐฎ์œผ๋ฉฐ equivarince๋„ ์ข‹๋‹ค๊ณ  ๋ณด๊ณ , training ์†๋„ ๊ฐœ์„  + ์—ฐ์‚ฐ ์ตœ์ ํ™” ์ง„ํ–‰ํ•˜์˜€์œผ๋ฉฐ, unaligned image์— ๋Œ€ํ•ด ์‹คํ—˜ํ–ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.
  • Fourier feature๋ผ๋Š” ์ƒˆ๋กœ์šด ์ขŒํ‘œ๊ณ„์—์„œ ์ด๋ฏธ์ง€ ์ƒ์„ฑ์„ ์‹œ์ž‘ํ•˜๊ธฐ ๋•Œ๋ฌธ์— signal๋ฟ๋งŒ ์•„๋‹ˆ๋ผ phase ์ •๋ณด๋„ encodingํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ๊ณ , positional encoding ์ •๋ณด๋„ explicitํ•˜๊ฒŒ ์ค„ ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.
profile
ํ™”์„ฑ์— ๊ฐ€๊ณ ํ”ˆ AI ๊ฐœ๋ฐœ์ž uni ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€