2025.03.18
이미지 생성 AI
툴
- 파이어플라이(어도비) : 포토샵 툴과의 연동이 강점
- 레오나르도 AI : 게임 디자인 작업에 특화
- 아이디오그램 : 텍스트를 포함한 이미지 생성에 강점
- 빙 이미지 크리에이터 : DALL E 기반 이미지 생성기
- 렉시카 : 스테이블 디퓨전 기반 이미지 생성
기술
1. 미드저니
2. DALL E
- 빙 이미지 크리에이터 / OpenAI API
- 텍스트 기반 이미지 생성 (텍스트 ⇔ 이미지 연관성 좋음, 구체적 문장 잘 해석)
- OpenAI API 연동 가능, 의미 전달력 굳
- 무료 사용량 제한적, 추가 비용 발생
- 스타일 커스터마이징 어려움
3. SDXL (스테이블 디퓨전 확장판..?)
- 텍스트 프롬프트를 기반으로 이미지를 생성하는 딥러닝 모델
- 비용 절감
- 커스텀 스타일 조정 (프롬프트 엔지니어링 필요)
- 특정 이미지 스타일 유지 가능
프롬프트 스타일러 예시
-
간단한 스타일
⑴ Minimalist style
⑵Cartoon style
⑶ Watercolor
→ 시각적 분위기를 연상시킴
-
세부적 스타일
⑴ In the styel of Van Gogh
⑵ In the style of 1950s comic book
⑶ In the style of digital painting
→ 스타일의 특징을 반영하여 이미지 생성 (붓터치, 색상, 형태 등)
-
스타일과 요소의 결합
A serene landscape in the style of Japanese ink painting
→ 장면의 주제와 스타일을 함께 지정
모델
ControlNet
- 스테이블 디퓨전에서 '제어' 기능을 추가 확장한 모델
- 단독 사용 불가 (다른 스테이블 디퓨전 모델과 함께 사용해야 함 ex.SDXL)
ControlNet 입력 형태 (모드)
- ⑴ Canny
기존 이미지 형태 유지하면서 다른 스타일로 변경
실사 사진을 만화 스타일로 변환
- ⑵ Scribble
단순 스케치를 기반으로 이미지 생성
기본적 형태만 유지하고 새로운 이미지 생성
심플한 일러스트 스타일 만들 때 적합
🔗 ControlNet 설치 및 사용법
일관된 스타일 유지
1. LoRA (ow-Rank Adaption)
- 스타일을 고정하고 일관된 스타일을 유지
- 모델의 특정부분을 미세 조정해, 여러 이ㅣ미지를 생성할 때 동일한 스타일을 유지하도록
- 특정 스타일을 반복적으로 생성할 때 적합
- 세부 조정이 가능해 원하는 스타일 정밀 유지 (정밀한 스타일 고정이 필요한 경우 사용)
- 다양한 이미지에서 스타일 일관성 보장
모델 학습 및 경량화
- LoRA는 모델을 학습 시키는 방식을 사용하여 스탕리을 고정할 수 있다.
- 기존 모델에 새로운 피사체를 학습시키는 추가 학습 기법의 일종 (기존 모델을 목표로 한 캐릭터가 나오도록 조정)
- 학습 방법 ⑴ DreamBooth 방식 ⑵ 파인튠 방식
🔗 로라(LoRA) 설명&학습방법 등
그냥 써도 되고 학습 시켜 써도 된다나
2. Flat Illustration 체크포인트 모델
: 일관된 플랫 일러스트 스타일 유지 (특정 스타일 적용)
- 체크포인트 모델을 사용하여 스타일을 고정한다.
- 일관된 비주얼 유지 가능 (스탕리 통일성 유지에 강력하다.)
LoRA or Flat Illustration 둘 중에 하나 골라 쓰면 될듯 . . .
✔ 정리하자면
▪ SDXL : 단순 텍스트 기반 이미지 생성 (스타일 프롬프트 사용)
▪ ControlNet (Scribble) : 일러스트 스타일 유지하며 생성 (구도, 형태 유지)
▪ LoRA : 일관된 스타일 적용
▪ Flat Illustration : 일관된 스타일 적용 (플랫 일러스트에 적용)
⇒ SDXL + ControlNet + LoRA (or Flat Illustration) 요렇게 사용하면 될듯