StyleTransfer

suhan cho·2022년 8월 17일

Introduction

한 이미지를 다른 이미지로 전환하는 것은 텍스트 전환 문제로 여겨진다
텍스처 전송에서 목표는 소스 이미지에서 텍스처를 합성하는 것이다.

하나의 content이미지의 벡터로스와 스타일이미지의 벡터로스를 줄이는 방식을 통해 노이즈 벡터 x를 업데이트를 한다

각각의 컨볼루션레이어의 서로 다른 필터들은 각각의 적절한 특징을 추출한다
Ex) 어느 필터는 뾰족한 부분을 추출한다던가 동그라미를 뽑아내던가

Contentloss

l은 몇번째 레이어를 사용할지를 i는 채널을 의미 j는 실제 feature값의 위치
컨텐트 이미지 p와 업데이트하고 있는 노이즈 x를 유사하게 만들기 위해서 각각의 이미지를 cnn에 넣어서 나온 featuremap을 유사하도록 한다
즉 동일한 위치에서의 featuremap이 동일한 값을 갖을 수 있도록

StyleLoss

두 이미지의 feature의 상관관계가 있다
예로 앞의 레이어가 activation이 높으면 다음 레이어도 activation이 높다
GramMatrix으로 둘의 상관관계를 구할 수 있다.
i와 j는 서로 다른 채널을 의미 각각의 위치를 k이다 상관관계가 클 수록 값이 크게 나온다
GramMatrix하나를 스타일이라고 볼 수 있고, StyleLoss는 그램메트릭을 통해 값을 줄여 상관관계가 있도록 하는 것이다.

스타일로 부터 얻은 GramMatrix A와 노이즈 벡터x로 부터 얻은 GramMatrix을 구해 그 차이를 감소 할 수 있도록 한다. 유사해질 수 있도록 업데이트를 한다
앞에 곱한거는 너무 클 수 있어 정규화를 한 것
각각의 El값을 구하고 레이어마다 가중치와 곱한 값의 로스를 줄이기 위한 것

그램메트릭스가 일치할 수 있도록 각각의 레이어를 업데이트를 한다
이미지 로스와 스타일 로스를 모두 줄일 수 있는 방향으로 업데이트 하도록 한다

안녕하세요

이전 포스트

타워레벨시스템

다음 포스트

StyleGan

0개의 댓글