CNN과 GAN

윤일권·2022년 12월 29일
0

현재 프로젝트 주제선정을 진행 중이다. 
굳혀지고 있는 주제에서 'text to image'과정이 필요했고, 
이를 위해 VQGAN 모델이라는 개념에 대해 공부하게 되었다.
VQGAN모델에서 GAN이 쓰인다는 사실을 알게 되었고, 기존 CNN을 사용해봤지만 GAN은 처음이라
GAN이 어떤 것인지, CNN과 차이점은 무엇인지 알아보려 한다.

짧은 설명
VQGAN 모델
'The Vector Quantized Generative Advesarial Network'의 약자로
벡터 양자화된 생산석 적대 신경망이라는 뜻이다.
이는 VQ(Vector Quantized) + GAN(Generative Advesarial Network)으로
간단하게 말해서 진품에 가까운 이미지를 만들어내고 또 그 가짜를 구를 구별할 수 있는 모델이다.

자 그러면 여기서 쓰이는 GAN이란 무엇일까?

  • Generative
    • '생산하는' 이라는 뜻으로 이미지를 생산한다는 의미이다.
  • Adversarial
    • '적대적인' 이라는 뜻으로 이미지를 경쟁하면서 좋게 만드는 의미를 지녔다.

결론적으로 서로 경쟁하며 가짜 이미지를 진짜 이미지와 최대한 비슷하게 만들어내는 네트워크를 뜻한다.

그렇다면 CNN은 무엇인가?

이때, 딥러닝 학습 모델에 CNN, GAN, DNN 등 여러가지가 존재하지만 
CNN을 비교 설명하는 이유는 VQGAN에서 CNN을 활용할 수 있지만,  
GAN을 사용하면 더 뚜렷한 시각적 부분을 합성할 수 있고, 
CNN이 딥러닝 학습 모델에서 많이 사용되는 것 중 하나이다.

CNN은 합성곱 신경망으로 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조이다.
때문에 사물을 인식하고 구별하는 과정에서 많이 쓰인다.
Convolution과 Pooling과정을 반복하며 진행된다.

간단하게 이런거다~ 라고만 알아보았다. 두 모델에 차이는 CNN은 이미지 인식에 주로 사용되고,
GAN은 창작물을 만드는데 주로 사용된다.

profile
생각하는 개발자가 되겠습니다!!

0개의 댓글