[TIL] Stable Diffusion

김연찬·2024년 9월 29일

Stable Diffusion?

Stable Diffusion은 텍스트 및 이미지 프롬프트에서 고유한 실사 이미지를 생성하는 생성형 인공 지능(생성형AI)모델이다. 2022년에 출시되었다. 이미지 외에도 모델을 사용하여 비디오 및 애니메이션을 만들 수 있다. 이 모델은 확산 기술을 기반으로 하며 잠재 공간을 사용한다. 따라서 처리 요구 사항이 크게 줄어들며, GPU가 장착된 데스크톱 또는 노트북에서 모델을 실행할 수 있다.

Stable Diffusion이 중요한 이유

Stable Diffusion은 접근 용이하고 사용하기 쉽기때문에 중요하다. 소비자 등급 그래픽 카드에서 실행할 수 있다. 누구나 모델을 다운로드하고 이미지를 생성할 수 있다.

Stable Diffusion으로 할 수 있는 일

txt2img

Stable Diffusion은 텍스트 프롬프트를 사용하여 이미지를 생성한다. 랜덤 생성기의 시드 번호를 조정하거나 다양한 효과에 대한 노이즈 제거 일정을 변경하여 다양한 이미지를 만들 수 있다.

img2img

입력 이미지와 텍스트 프롬프트를 사용하여 입력 이미지를 기반으로 이미지를 만들 수 있다. 일반적인 경우는 스케치와 적절한 프롬프트를 사용하는 것이다.

그래픽, 아트워크, 로고 제작

다양한 프롬프트를 사용하여 다양한 스타일의 아트워크, 그래픽 및 로고를 만들 수 있다. 물론, 스케치를 사용하여 로고 제작을 가이드할 수는 있지만 출력을 미리 결정할 수는 없다.

이미지 편집 및 수정

Stable Diffusion을 사용하여 사진을 편집하고 수정할 수 있다. AI Editor를 사용하여 이미지를 로드하고 지우개 브러시를 사용하여 편집하려는 영역을 마스킹한다. 그런 다음 원하는 작업을 정의하는 프롬프트를 생성하여 그림을 편집하거나 다시 칠한다.

비디오 제작

GitHub의 Deforum과 같은 기능을 사용하여 Stable Diffusion을 통해 짧은 비디오 클립과 애니메이션을 만들 수 있다. 또 다른 응용 방식은 비디오에 다양한 스타일을 추가하는 것이다.

참고 문서: Stable Diffusion이란 무엇인가요?

김연찬

이전 포스트

[TIL] ComfyUI 개발일지

다음 포스트