Generative AI 생성인공지능의 이미지 생성 총정리

김관우·2023년 6월 26일

Generative AI 생성인공지능 스테이블 디퓨전

GenerativeAI

목록 보기

2/4

안녕하세요, 브라이언트입니다 😊

이번에는 Generative AI, 특히 생성인공지능의 이미지 생성 분야에 대해 알아보도록 하겠습니다.

이미지 생성 패러다임

위의 이미지가 보이시나요?

해당 이미지는 '콜로라도 주립 박람회 미술대회’의 디지털아트 분야에서 1위를 한 스페이스 오페라 극장이라는 작품입니다.
미드저니(Mid Journey)라고 하는 인공지능으로 제작되었습니다.

이 작품이 우승을 한 후, 미술 대회에서 인공지능을 사용하는 것이 옳은가에 대해 갑론을박이 있었으나 한가지 확실한 게 있습니다.
인공지능이 사람이 할 수 없는 것들을 하기 시작한다는 것입니다.

스페이스 오페라 극장은 광활한 풍경을 섬세하게 잘 그려냄과 동시에 인공지능 특유의 모호함이 섞이며 사람이 도저히 그려낼 수 없는 것들을 그려냈다는 평가를 받아 우승했습니다.
이는 미드저니에 프롬프트를 입력한 후 몇 분에서 몇십 분 사이에 얻어낸 이미지라는 것이 중요합니다.

기존에는 디자인 작업과 일러스트를 만들 때 비싼 값에 거래되며 작업 기간 또한 긴 편이었습니다.
게다가 특정 작가의 작업물을 원하면 그 가치는 더욱 더 희소해졌죠.

그러나 다른 세상이 도래했습니다.

인공지능이 사람과 비슷한 수준의 이미지를.. 아니 어쩌면 훨씬 높은 수준의 이미지를 만들어 내기 시작합니다.
그것도 순식간에 말입니다.
사용자가 원하는 고화질의 이미지를 단 몇분이면 만들어 낼 수 있게 되었습니다.

가장 중요한 것은 기존에는 10시간 걸리던 일을 1시간으로 줄일 수 있게 되었다는 것입니다.
그럼 앞으로의 10시간은 100시간의 가치를 지니게 될 것입니다.
이것이 바로 핵심입니다.

이것이 생성인공지능 Generative AI의 이미지 생성 분야의 패러다임입니다.

이미지 생성의 큰 흐름을 이해하셨나요?
그렇다면 한 단계 더 나아가보도록 하겠습니다.

이미지 생성에는 3가지 선두주자가 있습니다.
ChatGPT를 만든 OpenAI의 Dalle-2
2023년 6월 기준 가장 뜨거운 미드저니(Midjourney)
오픈소스(무료)로 소스코드가 공개되어 다양한 커스터마이징이 가능한 스테이블 디퓨전(Stable Diffusion)

Dalle-2

자 그렇다면, Dalle-2부터 알아보도록 합시다 :)

🙌 An astronaut riding a horse in photorealistic style.

Dalle-2에게 위의 프롬프트를 전달해 이미지를 그린 결과입니다.

프롬프트를 전달하면 매우 빠른 속도로 이미지를 생성해주는 것이 특징입니다.
Dalle가 2021년 1월 등장하고, Dalle-2는 2022년 4월 출시되었습니다.
달리2가 출시되자마자 예술, 패션, 건축, 마케팅에 이르기까지 거의 모든 업계에 걸쳐 혁신성을 폭발시켰다고 합니다.

제가 사용해 본 바로는 학습한 데이터가 예술작품들이다 보니 관련 이미지를 생성하는 것에 특화되어 있는 듯 싶습니다.
실물과 비슷한 이미지를 얻기는 어려웠던 경험이 있네요 ㅎㅎ

50번까지는 무료로 사용하실 수 있으니 한번쯤은 사용하시는 걸 추천드립니다

미드저니 Mid Journey

다음은 미드저니입니다!

미드저니의 특징을 가장 잘 나타내는 이미지라 생각됩니다.
사자의 얼굴에 꽃과 식물들이 자연스럽게 어울리는 것을 확인할 수 있습니다.

실제로 촬영한 시계 화보같지 않나요? ㅎㅎ
이런 디테일한 생성도 가능합니다.

위 사진은 베트맨과 아이언맨이 섞인 생성 이미지입니다.
저도 미드저니 써본 결과 이런 MIX된 이미지들이 무척 자연스럽게 나오던 게 인상적이었습니다.

이전에는 한 계정 당 25회 무료 생성이 가능해서, 여러 계정으로 이용하곤 했었는데
2023년 3월 30일 기준으로 무료 사용을 잠정 중단하였습니다.

요금제는 다음과 같으며 가격이 부담되실 수 있으나
구독료보다 더 많은 가치를 창출할 수 있다 여겨지면 구독을 추천드립니다.
현재 존재하는 이미지 생성 서비스 중 가장 퀄리티가 좋으며 사용하기 쉽습니다.

미드저니 위주의 작업을 하시는 분을 추천드리겠습니다.
https://www.instagram.com/jae_hong__ahn/
제 지인분이신데, 매일 랜덤한 주제로 미드저니 이미지 생성을 하고 계십니다 😺

스테이블 디퓨전 Stable Diffusion

다음은 이미지 생성의 혁명을 일으킨 스테이블 디퓨전입니다.
인공지능을 학습시키는 데는 수많은 데이터와 자본이 필요합니다.
아무리 못해도 몇백억은 필요한데요, Stability AI에서는 Stable diffusion이라는 인공지능 모델을 오픈소스로 공개했습니다.

그로 인해 정말 많은 익스텐션(확장), 관련 서비스, 비슷한 스타일의 이미지를 생성할 수 있게 하는 로라(LoRa)등 혁신적인 발전이 이루어지기 시작했습니다

스테이블 디퓨전은 보다 실사 이미지를 생성하는데 적합합니다.
원하는 포즈로 이미지를 생성하는 기능도 있어 커스터마이징이 다른 모델들에 비해 자유로운 것이 특징입니다.

얼굴을 학습하여 이미지를 생성하는 것도 가능합니다

더 많은 이미지는 CIVIT AI 에서 스테이블 디퓨전 관련 모델들과 이미지 등을 공유하고 있으니 참고하시면 됩니다.

마치며

여러분은 생성인공지능 Generative AI의 이미지 생성에 대해 알게되셨습니다.
왜 혁신적인지, 어떤 모델들이 인기있는지 등을 알고 있으며
Dalle-2, 미드저니 Midjourney, 스테이블 디퓨전 Stable Diffusion의 각각의 특징들을 알고 있습니다!

인공지능으로 이미지를 생성하는 것은 엄청난 장점을 가지고 있음과 동시에 악용의 소지도 다분합니다.
기본적으로 성적인 이미지를 생성하는 것을 제재하기는 하지만, 생성해 낼 방법이 있다는 것이 문제입니다.
사용자의 프롬프트에 맞는 이미지를 그리는 생성 인공지능이기 때문이죠.
또한, 딥페이크와 성 착취등의 문제들도 존재하고 있습니다.

보다 세상에 이로운 방향으로 공부하시고 사용하셨으면 좋겠습니다 :)

다음은 Stable Diffusion 스테이블 디퓨전으로 이미지 생성에 대해 다루어보겠습니다!
감사합니다.

김관우

ChatGPT에 관심있고 웹 개발 프리랜서 경험이 있습니다. 솔직한 제 이야기를 전하고 있습니다.

Generative AI 생성인공지능의 이미지 생성 총정리

GenerativeAI

이미지 생성 패러다임

Dalle-2

미드저니 Mid Journey

스테이블 디퓨전 Stable Diffusion

마치며

Generative AI 생성인공지능과 ChatGPT 총정리

Stable Diffusion 스테이블 디퓨전으로 CivitAI 이미지 만들어보기

0개의 댓글