열다섯번째 수업 | Stable Diffusion

Faithful Dev·2024년 10월 1일

MS AI School

Microsoft Korea 5th AI School

목록 보기

18/59

강명호 강사님

생성 AI (Generative AI)

생성 AI는 컴퓨터가 새로운 콘텐츠를 만드는 기술이다. 텍스트, 이미지, 음악, 비디오 등이 포함된다.

응용 분야: 프로그램 코드 작성, 의료 이미지 생성, 데이터 증강 등
중요한 점
- 학습 데이터의 품질이 좋아야 함
- 저작권 및 윤리적 문제를 고려해야 함

Stable Diffusion 실습

Stable Diffusion이란?

Stable Diffusion은 텍스트를 이미지로 변환해주는 기술로, 사용자가 글로 설명하는 내용을 바탕으로 AI가 그에 맞는 이미지를 만들어주는 인공지능 모델이다.

Stable Diffusion의 기술적 동작 원리

확산 모델(Diffusion Model)의 원리

확산 모델은 아주 많은 노이즈(무작위 점들)가 있는 이미지에서 시작해 점차 그 노이즈를 제거해가며 원래의 깨끗한 이미지를 찾아가는 방식이다.
1. 순방향 과정(Forward Process): 이 과정에서 AI는 실제 이미지에 계속해서 노이즈를 추가한다. 노이즈가 추가될수록 이미지의 세부 사항이 점점 사라져 결국 무작위의 잡음으로 변한다.
2. 역방향 과정(Forward Process): 이 과정은 노이즈를 점차 제거하면서 원래의 이미지를 되찾는 과정이다. 이때 AI는 학습된 데이터를 바탕으로 노이즈를 제거하는 패턴을 학습하며, 최종적으로 사용자가 입력한 텍스트에 맞는 이미지가 만들어진다.

실습 과정: AI로 그림 만들기

Text to Image 메뉴 사용하기 - 프롬프트 입력

프롬프트는 사용자가 AI에게 요청사항을 설명하는 글로, 자세하게 설명할수록 AI가 더 구체적으로 그림을 그려준다.
부정 프롬프트(negative prompt) 는 불필요한 요소를 제외하고 싶을 때 사용하는 프롬프트이다.

세부 설정

Sampling Method: AI가 이미지를 생성하는 방식을 결정하는 옵션이다.
Steps: AI가 몇 번의 과정을 거쳐서 이미지를 완성할지 설정하는 옵션으로, 스텝 수가 맣ㄴ을 수록 이미지는 정교해지지만 시간이 오래 걸린다.
Batch Size: 한 번에 몇 개의 이미지를 만들지 설정할 수 있다. GPU 메모리에 따라 배치 크기가 클수록 더 많은 자원을 사용하므로 적절하게 설정해야 한다.