딥러닝 (11)

Myeongsu Moon·2025년 1월 20일

제로베이스

목록 보기

65/95

Generative: 생성적
Adversarial: 적대적
기계 학습 역사상 가장 독창적인 아이디어로 평가받는 생성 기법
인공지능이 비로소 예술적인 결과물을 만들기 시작한 효시
영상을 출력하는 다양한 기존 네트워크에 적용되어 시각적 성능 향상
GAN의 원리: 최대한 진짜처럼 “위조”하는 Genearator와 가짜/진짜를 구분하는 Discriminator의 경쟁 구도로 학습
Mini-Max 문제
Mini-Max 최적화의 구현: Mini-Max 문제는 두 문제를 반복해서 풀이하는 방법으로 구현
GAN의 잠재 변수
-> 𝐳 벡터는 잠재 변수(latent variable)로, 생성을 위한 random seed라고 볼 수 있음
-> 학습 시 임의의 값을 샘플링하여 넓은 domain을 커버하도록 함
손실 함수 트릭: 𝐆의 성능이 좋지 않을 때 학습이 빠르게 이루어지도록 손실 함수에 트릭 적용
GAN의 학습
GAN의 활용: DCGAN(Deep Convolutional GAN)
cGAN (Conditional GAN)
Cycle GAN

오픈 소스 이미지 생성 프로젝트로, text-to-image방식의 서비스 제공
Diffusion Model: 임의의 시작점으로부터 목표로 하는 도메인으로 확산(diffusion)된 것을 역추적하는 모델
-> 확산 모델: 순차적으로 노이즈가 추가되는 확산 프로세스를 역으로 추정하여 원본 데이터를 추정하는 모델
Stable Diffusion(Latent Diffusion) Model
-> 영상에서 직접 확산 모델을 구현 시 복잡도가 너무 높음
-> 이를 해결하기 위해 잠재변수(latent variable)에서 확산 모델을 구현
Stable Diffusion Model 구조
-> 단순 하나의 모델이 아닌, 다양한 모델을 결합하여 전체 시스템 구성
-> Transformer, U-Net, VAE, Attention Module 활용

이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다