코드:링크텍스트
특징
조건이 없는 생성모델
내가 원하는 종류의 이미지를 바로 생성하지 못함
목적함수
Generator :
Discriminator :
Feed forward
Generator
Discriminator
특징
목적함수
Feed forward
Generator
Discriminator
한 이미지의 픽셀에더 다른 이미지의 픽셀 형태로 변환한다는 의미
이미지를 입력으로 하여 원하는 다른 형태의 이미지로 변환 시키는 GAN모델
Image to Image Translation형식
입력이미지를 변화된 이미지로 출력하는데 이용된다.
입력이미지와 변환된 이미지의 크기는 동일해야하므로 Encodr-Decoder구조를 가진다.
Convolution Layer에서 진행이 된다.
Encoder: 입력 이미지(x)를 받아 단계적으로 이미지를 down-sampling하여 중요 representation을 학습한다. 최종 출력은 bottleneck라고 불리고 입력 이미지(x)의 가장 중요한 특징을 담고 있다.
Decoder: 이미지를 up-sampling하여 입력 이미지와 동일한 크기의 변환된 이미지(y)를 생성한다.
각 레이어마다 Encoder 과 Decoder가 연결되어있다
입력이미지의 파란색 점선: 여러 개의 출력 중 하나의 출력을 계산하기 위해 receptive field영역을 나타내고, 전체가 아닌 일부 영역만 T/F를 판별하는 확률값 도출하는 것으로 이 방식을 여러 번하여 서로 다른 확률값을 계산할 수 있고 이 값의 평균을 최종 출력값으로 생성합니다.
PatchGAN: 이미지의 일부 영역을 이용하는 것
sigmoid사용: 최종 출력에서 진짜 및 가짜 이미지 판별
C64
C64 하이퍼파라미터의 레이어: 64개의 4X4필터에 stride=2인 Convolution->0.2 slope의 LeakyReLU
CD512 하이퍼파라미터의 레이어: 512개의 4X4필터에 stride=2적용한 Convolution ->BatchNorm -> 50%-> Dropout -> ReLU