250910

H·2025년 9월 10일

AI 기반 크리에이티브 디자인

3-7 --sw

Style Weight: 스타일 참조의 강도를 조절하는 기능.
style Reference가 스타일의 종류를 정하는 것이라면, Style Weight는 그 스타일을 살짝 첨가할지, 강하게 덮어버릴지 조절하는 버튼.

형식
[/imagine][cute cat] [--sw 100][--sref] [image url]
기본값: 100 | 범위: 0~1000
--sw 100 작동 모델: v 6.0, v 6.1, v 7, niji 6

--sw는 단독으로 쓸 수 있는 파라미터가 아니고, --sref와 함께 써야 함. sref의 강도를 조절하는 것이기 때문에 순서 상관없이 --sref와 image url는 반드시 같이 써야 함.
-스타일 참조할 때 처음 본인이 생각하는 스타일의 정도가 있을 것. (있어야 한다. 디자이너는 계획이 늘 있어야 함!)
-실험해보고 그 정도를 이해하는 것도 중요하지만, 그때그때 스타일참조할 때 여러 버전으로 이미지를 생성해보고, 의도에 딱 맞는 이미지를 선택하는 습관이 필요.
-스타일 참조는 n개까지 가능하지만 너무 많은 스타일을 혼합 참조하는 것은 권장하지 않음.(강사님 의견) 이도저도 아닐 확률이 높고, 컨셉을 날카롭게 모아주기가 매우 어려워짐.
-그치만 필요에 따라 여러가지 스타일을 참조해볼 수 있음. 2-3가지 정도 서로 충돌하지 않는 스타일을 혼합 참조해서 시너지를 내는 것이 중요.
-배우는 단계에선 다양한 시도를 해보며 감을 익히는 것도 중요.

-풍성해진 기술을 활용할 수 있는 풍성한 래퍼런스가 내 머릿속에 있어야 요청을 잘 할 수 있음. 가능하면 미술사, 회화기법, 미술 기법 등을 많이 알고 있는 게 중요.
-콜라주, 실크 스크린 등 기법, 작가 이름, 회화 사조가 등장하면 꼭 한번씩 리서치해보자.
-url 입력 순서가 스타일 반영하는데 영향을 미치진 않음. 그치만 참조하는 스타일 이전에 프롬프트를 표현하기 적합한 스타일을 우선적으로 반영하는 것 같다고 느낌.
-실크스크린으로 사진을 사실적으로 표현하는 것은 어려움. 앙리마티스 그림처럼 색면을 표현하기에 적합한 기법임. 그래서 앤디워홀의 실크스크린 작품을 보면 인물을 굉장히 단순화하여 표현. 콜라주도 마찬가지. 잡지를 오려붙여서 인물을 표현하려면 섬세한 인물 표현이 안 됨.
-피카소처럼 그로테스크해지지 않고 미드저니는 소품이나 옷에만 실크스크린 느낌을 적용함. Style Weight값이 커질수록 콜라주 기법을 많이 반영함. 기본적으론 실크스키린 기법을 압도적으로 많이 반영함.

-구도적 측면까지 많이 반영해줌.

--sref가 스타일의 정체성이라면, --sw는 그 스타일의 존재감이다.
-창의력이 좋은 것은 재해석, 재탄생을 잘하는 것임.

[실습] --sw로 스타일 강도 조절

이미지 생성
(1)본인이 원하는 특정 스타일의 참조용 이미지 생성 (url 생성)
(2)imagine: street fashion lookbook photo 프롬프트--sref로 (1)스타일 참조하여 이미지 생성
(3)이미지 생성 시 아래 4가지 style weight 값으로 각각 생성해 보시기 바랍니다.
--sw 0  |  --sw 350  |  --sw 700  |  --sw 1000
직접 참조할 스타일을 찾아보는 연습과 함께 sW 값 조절에 따른 스타일 강도 변화를 확인해 보시기 바랍니다.

prompt: festivities painted in the style of Claude Monet

3-8 --cref

캐릭터 래퍼런스 파라미터. 캐릭터의 일관성을 유지할 수 있는 파라미터.
미드저니에서 특정 인물의 외형을 일관되게 유지하면서 다양한 포즈, 배경, 상황을 그릴 때 사용하는 핵심 기능.

Character Reference
미드저니 파라미터 중에 --sref에 이어서 아주 중요하고 강력한 파라미터임.
여러장의 이미지에서 동일한 캐릭터가 계속 등장해야할 때 --sref가 캐릭터의 외형을 고정시켜줌.

형식
[/imagine][prankster boy] [--cref][character reference image url]
--cref 작동 모델: v 6.0, niji 6

-미드저니가 참조한 이미지 속 캐릭터에 얼굴, 헤어스타일, 체형, 옷 스타일 등을 학습함.
-단 하나의 캐릭터에만 작동함.
-sref처럼 롬프트+1개 이상의 참조할 이미지가 필요.
-v7에선 호환 X

-배경이 완전 달라진 이미지는 캐릭터 아웃핏을 잘 유지하지 못함. 배경의 파란색을 압도적으로 사용하면서 미드저니가 알아서 가방을 노란색으로 바꿈.(미드저니의 미학적 선택)
-배경이 원본 이미지와 흡사한 이미지는 아웃핏 유지를 잘 함. 신발, 가방, 옷색깔 디테일 등 배경 간섭이 없어서 미드저니가 미학적 판단을 할 필요가 없는 것.
-조금 다른 디테일은 포토샵같은 전문 디자인툴로 조금씩 수정하면서 충분히 일관된 캐릭터로 웹툰 제작도 가능해보임.

portrait : 초상화. 인물을 가슴 언저리까지 설정하고 싶을 때 넣는 키워드. 증명사진보다 조금 더 아래까지 보여줌.
photography 넣은 이유는 이 키워드를 뺐을 때 그림으로 그려줌.
--stylize는 200 줬을 때 너무 꾸며줘서 기본값으로 함.
-헤어스타일과 이목구비는 상당수 유지했다고 느껴지지만 엄밀히 보면 미묘하게 다른 얼굴.
-캐릭터 유지는 실사보다 일러스트가 더 잘 구현함.

캐릭터 유지가 어려운 이유
-미드저니는 고정된 모델이 아니라 확률 기반 생성
-참조 이미지의 시각적 feature(얼굴형, 헤어, 비율)를 기반으로 일관성 유지
-완벽한 복제는 불가하며, 배경 복잡도가 높으면 캐릭터 디테일 깨짐.

-실사 이미지의 경우, 얼굴이 제일 유사한 이미지를 선택해 계속 베리하면서 프롬프트 수정하면서 포토샵 보정도 거치면서 공을 많이 들여야 함.

--cref = 캐릭터의 정체성을 지키는 파라미터
-실무에선 시리즈 작업할 때 유용함.
-동일 모델로 SNS 캠페인을 하거나 스토리텔링 디자인에서 같은 캐릭터로 다양한 상황 연출이 필요할 때 적용 가능.
-캐릭터 래퍼런스는 동일 캐릭터의 확장 가능성을 제공하는 도구

[실습] --cref로 캐릭터 유지
이미지 생성
(1)/imagine: cute anime style, young female warrior, full body, white background --ar 3:4--niji 6 프롬프트로 캐릭터 이미지 생성 (+url 생성)
(2)/imagine: young female warrior in the forest, full body --ar 3:4 --niji 6 --cref
파라미터로 (1)의 캐릭터를 참조하여 이미지를 생성해 보자.
참조용 캐릭터 생성 시, 본인이 원하는 캐릭터 특성이 있다면 반영해봐도 좋다.
원본 캐릭터가 얼마나 어떻게 반영되었는지 확인 및 비교해 보자.

3-9 --cw

style Reference(--sref)에 Style Weight(--sw)가 있듯이, Character Reference(—cref)에도 Character Weight(--sw)가 있음.
캐릭터 참조에도 강도 조절이 가능.

형식: [/imagine][prankster boy][--cw 100][--cref] [image url]
기본값: 100 | 범위: 0~100
작동 모델: v 6.0, niji 6

--cw도 마찬가지로 --cref 파라미터와 함께 쓰임.
기본값이 100이면 100 이하의 값은 왜 필요한가? = 같은 캐릭터에 다른 옷을 입히고 신발, 소품 달라질 수 있음. --cw값이 0이면 얼굴만 집중적으로 반영함. 값이 커질수록 얼굴 이외의 특징, 헤어, 의상 소품 등을 추가로 유지함.

[실습] --cw로 캐릭터 강도 조절

이미지 생성
--cref 실습에서 생성한 원본 캐릭터 참조하여 아래 프롬프트로 이미지 생성
/imagine: young female warrior at the market, full body --ar 3:4 --niji 6
--cw 0  |  --cw 35  |  --cw 75  |  --cw 100  |  --cref url
cw 값을 0부터 100까지 4가지로 생성하여, Cw 값에 따른 캐릭터 반영 정도가 어떻게 달라지는지 확인 및 비교해 보시기 바랍니다.

3-10 --tile

반복 패턴을 제작할 때 쓸 수 있는 파라미터.
엄청 중요하진 않지만 알아두면 재밌게 사용할 수 있는 파라미터.

Seamless Pattern: 벽지, 포장지 패턴처럼 무한 반복이 가능한 이미지는 테두리가 없어야 함. 그렇게 이미지 테두리가 자연스럽게 이어지는 반복 패턴을 심리스 패턴(이음새가 없는 패턴)이라 함. tile 파라미터를 사용하면 사방연쇄 이미지를 만들 수 있다. 텍스타일, 배경, 웹용 패턴 등에 두루두루 사용할 수 있음.

형식: [/imagine][flower, simple, plat graphic] [--tile]
tile 작동 모델: v 5.0 이후

-이 타일 이미지 만들 땐 실사 이미지는 적합하지 않음. 프롬프트에 simple, plat graphic 또는 simple line 이런 식으로 선이나 단순한 그래픽으로 해달라고 요청하는 게 좋음.
-진짜 사방연쇄 이미지일까?=4개의 이미지를 반복해서 붙였더니 사방이 깔끔하게 붙음. 사방의 잘린 이미지들이 정확히 깔끔하게 붙음.

prompt: 16-bit pixel art, stars and moons, dark blue background --tile
16비트 픽셀 아트 프롬프트도 패턴 이미지를 생성하기 적합.

-패턴을 생성할 때는 상대적으로 간단한 형태, 실사보다는 그래픽, 선이 좋음. 너무 복잡한 오브젝트는 경계에서 어색해질 수 있기 때문에 심플하게 한다고 생각하고 프롬프트를 작성하면 됨.

무한 확장 패턴 도구
-tile 파라미터는 이미지 한장을 끝없이 이어붙일 수 있는 무한 확장 패턴 도구이다.
-브랜딩 작업, 패턴 디자인할 때 아주 유용하게 쓰일 수 있다.
-또 브랜드 스타일 패턴을 제작할 때는 --sref 파라미터와 함께 조합하면 굉장히 다양한 작업들을 해낼 수 있을 것.

**[실습] --tile로 나만의 패턴 제작**
이미지 생성
--tile 파라미터를 사용해, 나만의 패턴 이미지를 생성해보자.
본인이 원하는 주제, 형태, 색상으로, 프롬프트를 직접 작성해서 생성해보자.
생성한 이미지를 사방으로 붙여서 패턴을 완성해라.

Prompt: puppy, 16-bit pixel art, yellow background --tile
다른 요소로 많이 생성해봤는데 머리가 두개가 되고 엉덩이에 얼굴이 달리고.. 너무 기괴해져서 포기.. puppy로 생성하니 참 쉽군아..

04 프롬프트 기본 Basic Prompt(프롬프트의 이해와 기본 작성법)

4-1 프롬프트의 이해

Prompt
-미드저니가 이미지를 생성하기 위해 해석하는 짧은 텍스트 구문
-미드저니 봇은 프롬프트의 단어와 구문을 토큰이라고 하는 작은 조각으로 분해하여, 학습 데이터와 비교한 다음, 이미지를 생성하는 데 사용한다.

-AI에게 전달하는 명령문이자 설명문
-자연어(Natural Language)를 기반으로 이미지 생성의 핵심 입력 값
-단순 텍스트가 아닌 이미지를 구상하는 설계도 역할

프롬프트가 어떻게 작동하는지 살펴보자.
[/imagine][puppy oil painting abstract] 로 생성
강아지 | 유화 | 추상화

이 이미지는 무엇을 표현했는지 자세히 분석해보자.

-많이는 아니지만 추상표현도 함.(붓터치가 강렬한 표현, 배경에 면분할 등)
-4장 모두 얼굴 표현에 집중 되어 있음. 얼굴을 그려달라고 주문하진 않았지만, 이런 부분은 미드저니가 알아서 해줌.
ar로 비율을 정하지 않아서 기본 1:1 비율로 이미지를 생성해줌. 그럴 땐 얼굴을 표현하는 것이 가장 이상적이라고 미드저니가 판단.
-구도, 색상, 배경, 디테일, 기타 등등 역시 프롬프트로 입력하지 않은 것들임.
-이렇게 프롬프트로 입력하지 않은 요소들도 미드저니가 판단하고 채워줌.
이 외에도 어떤 속성들이 반영되었는지 살펴보자.
사용자가 따로 입력하지 않아도 비율(ar 1:1), stylize 100, chaos 0, wired 0, 기타 등등의 파라미터의 디폴트값, 그 속성들을 포함해서 이미지를 생성.
핵심은 내가 입력하지 않은 속성들도 미드저니가 표현함. 그래서 나의 통제력을 높이고 싶다면 속성 조절을 세세하게 해야 함. 표현에 있어서도 내가 입력하지 않았지만 미드저니가 판단하는 부분들이 무엇이 있는지 파악해서 그 부분들을 일일히 지정해주면 내가 지정한대로 생성할 수 있음. 그렇게 해야 프롬프트를 통제할 수 있는 것.

제일 잘 반영한 이미지를 챗gpt한테 보여주고 프롬프트로 다시 작성해달라고 요청.

prompt: a black Labrador puppy portrait, expressive eyes, oil painting style, thick textured brushstrokes, vibrant abstract background, splashes of yellow, red, blue and white, highly detailed rich color palette --ar 1:1 --v 7

-3개의 프롬프트로 생성한 이미지가 이렇게 길어짐. 이것이 의미하는 바는 강아지는 막연했는데, 검은색 레브라도 강아지는 구체적이고, 내가 이미지를 구체적으로 통제하고 싶으면 구체적으로 프롬프트를 작성해야 한다는 것을 의미함.
-근데 반대로 내가 강아지 이미지를 생성하고 싶은데 구체적으로 어떤 종류의 강아지가 좋은지 결정을 못했다면 프롬프트를 간결하게 작성해서 미드저니의 제안을 반대로 받을 수도 있음. 미드저니의 제안으로부터 영감을 받아 구체적으로 이미지를 생성할 수 있는 것.
-일단 미드저니에서는 프롬프트를 영어로 작성해야 하니까 프롬프트를 잘 작성해야 한다는 부담이 있을 수 있다. 근데 프롬프트는 미드저니와 대화를 하는 것. 머릿속에 있는 이미지를 밖으로 끌어내는 것이고 그 과정에서 법칙에 너무 구애받지 않고 좀 유연하게 생각을 해도 된다는 뜻

puppy라는 하나의 키워드 프롬프트로 반복해서 이미지를 생성함.
-압도적으로 리트리버 강아지를 많이 생성함. 미드저니가 가진 스테레오타입은 리트리버인 것.

미드저니 봇의 목표: 예쁘고 완벽한 이미지를 만든다(프롬프트 맥락에 충실한)
AI는 사람과 다르다. 사람은 ‘내키는 대로 만들어봤어’가 가능하지만 AI는 목표를 설정해줘야 그 목표에 맞게 결과물을 산출함.

sitting textured edges: 배경이 깨끗하게 끝나지 않음

puppy 프롬프트 10번 돌려서 강아지를 생성했고 모두 예쁘고 완벽한 이미지를 만든다는 목표로 전부 다른 강아지를 생성했는데 공통점은 다 달라도, 강아지라는 것. 결국 프롬프트 맥락에 충실하게 생성한다는 것이 중요.

미드저니가 프롬프트는 해석하는 작동 원리 도식화
텍스트 분석(Language Parsing) > 의미 매핑(Semantic Mapping) > 이미지 합성(Image Synthesis) > 파라미터 적용(Post Processing)

언어가 곧 디자인 도구이다.
-AI는 감정이나 창의적 직관이 없으므로 사용자의 지시가 곧 결과임.
-미드저니의 자체 판단은 창의적 직관이 아닌 AI가 하는 임의적인 해석임.
-명확하고 구체적인 지시를 하면 내가 원하는 이미지에 가깝게 생성하고, 모호하고 짧은 지시를 하면 AI가 임의 해석을 해서 그 지시의 빈공간을 채우는 것(그동안 미드저니가 학습한 데이터를 바탕으로 임의해석)

[실습] Text to Image, Image to Text

이미지 생성
/imagine: panda
해당 프롬프트로 이미지를 생성해 보세요. Regenerate 또는 여러 번 프롬프트를 입력해서 동일한 프롬프트로 최소 40장 이상의 이미지를 생성해 보세요.
그 중 가장 마음에 드는 이미지를 선택하고, 반대로 그 이미지를 텍스트로 변환해 보시기 바랍니다.

-panda가 cat, puppy처럼 다양성 있게 생성해주진 않을 것.
-가능하면 이미지를 다 다르게 다양하게 생성해보길 바람.
-처음엔 AI 도움 없이 직접 이미지를 보고 텍스트로 한번 서술해보기. 쉽지 않더라도 한번 해보자. 그 다음 챗지피티에 이미지를 업로드 후 프롬프트로 작성해달라고 요청. 만들어준 프롬프트를 내가 서술한 텍스트와 비교해보자.
-->내가 텍스트로 묘사해보고 챗지피티한테 물어봐서 내가 찾아내지 못한 키워드들을 샅샅히 찾아내는 용도로 활용해보자.

ㄴ 판다 생성. 미드저니는 쿵푸를 좋아하는 듯하다..

ㄴ 맘에 드는 이미지.

AI 도움 없이 직접 서술
프롬프트 직접 작성: Panda wearing sunglasses, Soft fur, 3D rendering, Drinking strawberry smoothie, pink background

ㄴ 결과(나름 비슷하게 나온 것 같은데..)

챗gpt 프롬프트 작성 요청
챗지피티 작성: a cute fluffy panda, 3D render, wearing oversized round sunglasses, holding a glass jar with a pink smoothie, drinking through a striped straw, realistic soft fur, plain pastel pink background, playful and adorable style --ar 1:1 --v 6

ㄴ 전신이 전부 나옴.(흠 내가 만든게 더 비슷한 것 같은데ㅎ)

수정을 해보자.. (요청사항: 상체만 보여줘)

챗지피티 수정1: cute fluffy panda, 3D render, wearing oversized round sunglasses, bust shot, upper body, holding a glass jar with pink smoothie, sipping through striped straw, soft realistic fur, pastel pink background --ar 1:1 --v 6.0

ㄴ>털이 너무 징그러움.

원인을 찾아보자..

털이 너무 과해서 계속 질문을 해보니..
텍스처 강조 키워드의 비율 문제일 가능성이 높다고 함.
soft realistic fur을 지워보자

챗지피티 수정2: cute fluffy panda, 3D render, wearing oversized round sunglasses, bust shot, upper body, holding a glass jar with pink smoothie, sipping through striped straw, soft realistic fur, pastel pink background --ar 1:1 --v 6

ㄴ> 좀 비슷해지긴 했는데 털이 보송보송 인형같진 않는군..

4-2 기본 프롬프트 이해하기 (1)

-기본 프롬프트 이해하기란 결국엔 미드저니 시각언어 이해하기
-AI말고 디자인도 테크닉을 먼저 학습하면 창의성이 성장하기 어려움. 자꾸 테크닉에 의존하게 되고 내가 새로운 것을 만들어내는 시도를 안하게 됨.
그래서 먼저 미드저니의 시각언어를 광범위하게 이해하자.

Prompt Stereo type
Stereo type: 고정관념

여러 상황에서 많이 쓰는 어휘인데, 미드저니의 관점에서 보면 puppy로 10번 생성했더니 리트리버를 많이 생성했는데, 미드저니가 puppy에 대해 가진 스테레오 타입이 리트리버종인 것.
주요 컬러 몇가지, 아트 스타일, 화가 등에 대해 미드저니가 가지고 있는 프롬프트 스테레오 타입을 알아보자.

단순하게 컬러로만 프롬프트를 입력해서 생성

-색은 실체가 아니라 빛에 반응하는 시각적 속성이라고 디자인 개론에서 설명했는데, 즉 -실체가 없는 키워드를 프롬프트로 입력했는데, 미드저니는 이렇게 해석. 
-색상 키워드에 여성이 많이 등장. 어떤 컬러 이름이라도 단독으로 프롬프트를 입력하면 남성보다는 여성이 많이 등장함. 
-레드는 강렬, 에너지를 떠올리게 되는데 미드저니는 서정적으로 표현함. 
-블루는 차가움보다는 사람 얼굴을 등장시켜서(사람 얼굴 자체가 감성적인 느낌이 있음) 블루도 역시 감성적으로 표현. 
-그린은 특히 스테레오타입이 강하게 작용하는 색. ‘그린=자연’이라는 연상은 인간도 마찬가지지만 미드저니도 많이 학습이 되어있는 것. 그림으로 생성한 모든 이미지에 식물이 등장.
-노랑은 마지막에 어린 소녀의 뒷모습 이미지인데, 노란색이 상징하는 심상들이 어린이와 관련이 되어있음. 그것 역시 미드저니가 학습한 것. 역시 색은 여성의 이미지가 많이 등장함. 
-블랙은 민감한 논란의 이미지를 생성함. ‘블랙=까마귀’ 까마귀가 두번 등장.

-화이트는 두번째 이미지를 보면 여성이 눈을 아래로 깔고 있음. 이 이미지가 내뿜는 분위기가 엄숙하고 성스러운 느낌. ‘흰색=순결=종교, 성스러운 이미지’, 흰색이 가지고 있는 보통의 상징적인 이미지가 미드저니의 스테레오타입에도 반영됨.
-오렌지는 색 이름이면서도 동시에 과일 이름이기도 해서 오렌지만 프롬프트로 넣으면 오렌지 색도 등장하고 오렌지 자체도 등장. 사과와 달리 실사 이미지도 여성을 다수 등장시킴. 꼭 하나는 여성이 등장. 그래서 과일 오렌지만 생성하고 싶으면 오른쪽 사진처럼 ‘orange on the plate’ 이렇게 연관 프롬프트를 넣어주면 과일 오렌지를 보여줌. 

여러가지 컬러 프롬프트를 동시에 제시하면 어떻게 우선순위를 보여줄지 궁금해서 생성한 이미지(컬러만 넣지 않고 구체적인 대상도 함께 입력해봄)

orange, green tree, blue sky:  오렌지는 과일, 색이 있어 오렌지색 단풍과 함께 그린이 함께 있는 나무, 파란 하늘을 보여주는 이미지와 과일 오렌지 나무 이미지도 생성해줌. 
red apple, green tree, blue sky: 컬러보단 apple, tree, sky에 주력해 해석함. 사과, 오렌지 둘다 나무에서 열리는데 사과는 작은 사과가 주렁주렁 달린 이미지가 아니고, 하나의 사과를 가까이서 보여주는 형식을 말이 안되지만 보여줌. 아마 미드저니가 사과가 단독으로 있는 이미지를 많이 학습했을 것. 
재밌는 건 오렌지, 사과 그 어떤 경우에도 blue sky를 먼저 보여주지 않는다는 것. blue sky는 무조건  배경이 됨.
배경이라는 말을 썼지만 원근법할 때 근경, 중경, 원경이 있으면, red apple이 근경이 되고, green tree가 중경이 되고, blue sky가 원경이 되는 것이다. 이런 분류와 해석도 미드저니가 하는 것. 
그래서 blue sky가 앞에 있고 green tree가 뒤에 있는 이미지는 보여주지 않는 것. 당연한 얘기같지만 AI는  사람이 아니기 때문에 나름 로직이 있어야 함. 그동안 학습한 데이터 바탕으로 이런 판단을 미드저니가 한다는 것.

회화기법 키워드로 이미지를 생성.(대상=flower)

-flower, oil painting: 유화는 한없이 정교하게 그릴 수 있음. 그래서 앞서 강의에서 oil painting과 Abstract을 같이 프롬프트에 포함시켰는데 그 이유가 Abstract 키워드를 넣지 않으면 굉장히 정교하고 사실적인 유화 스타일을 많이 보여줘서 Abstract 키워드를 넣어야 유화 터치를 과감하게, 거칠게 표현해줘서 유화 느낌이 많이 나보임.
-flower, water color: 수채화도 마찬가지, Abstract을 함께 넣으면 물번짐 효과를 굉장히 과감하게 보여줌. 특히 꽃은 수채화가 상당히 섬세한 표현으로 보여줌. 왜냐하면 꽃을 세밀화로 그릴 때 수채화를 많이 사용함. 그래서 미드저니가 그런 이미지를 많이 학습함. 그래서 다른 대상을 수채화로 표현하는 것보다 꽃을 수채화로 하면 훨씬 섬세한 수채화를 보여준다는 차이가 있음. 
-flower, pen drawing: 실제 펜 많이 등장. 
-flower, graffiti: 꽃이 그래피티와 어울리지 않는 주제인데, 최대한 그래피티처럼 꽃을 표현함. 

유럽 옛날 성당가면 많이 볼 수 있는 기법
-flower, mosaic: 모자이크는 입체적인 표현을 해줌.
-flower, stained glass: stained glass는 교회나 성당 창문에 많이 사용하는 건축용 장식 기법. 
모자이크나 스테인 글라스는 특정 장소와 관련이 있고 종교적 이미지를 가지고 있기 때문에 그런 이미지나 상징성을 표현해야할 때 이런 키워드들을 사용해서 이미지를 생성할 수 있음.

사진관련 기법(cyanotpe, X-ray 둘다 사진관련 기법이기도 하고 회화 기법이기도 함.)
-flower, cyanotpe: 감광지(사진 찍을 때 필름 비슷한 종이)에 꽃같은 것을 올려놓고 햇빛을 쫴면 꽃을 올려둔 부분만 빛이 들어오는 것을 막아서 이런 느낌의 그림이 완성됨.(빛의 투과로 그린 그림) 실제로 작업하면 환경 통제가 어려워 멋진 cyanotpe 그림을 얻는 게 굉장히 어려움. 그것을 미드저니가 생성해줌. 
-flower, X-ray

수작업 기법
(앞의 회화 기법도 원래는 다 수작업으로 해야 하는 건 맞음. 그래도 수채화, 유화 느낌 이런 재료적 측면의 기법들은 포토샵, 아이패드로 그리는 툴들이 엄청 발전하면서 전문 그래픽 프로그램이 돼서 비슷하게 구현을 많이 해줌. 그런데 papercraft나 embroidery 자수는 포토샵이 느렇게 느낌을 내주기 어려움. 자수의 경우 일부 그런 cg가 가능하지만 미드저니에 프롬프트를 입력하면 잘 표현해줌.)
-flower, papercraft 
-flower, embroidery

그래서 이런 회화 기법을 다양하게 알고 있으면 필요한 적재적소에 프롬프트로 활용 가능.

아티스트, 작가 이름 프롬프트 생성

(저작권 이슈 민감하고, 인지해야 한다고 말했는데, 더불어 사후 70년 이상 지난 작가들의 경우는 스타일에 대한 저작권이 열려있는 경우가 많다. 상업적 사용을 할 때는 저작권 확인은 반드시 필요함. 그러나 연습해보는 것에는 이슈가 없으니 자유롭게 해도 됨.)

-cute cat, Vincent van Gogh
-cute cat, Claude Monet
-cute cat, Edvard Munch
-cute cat, Gustav Klimt
-cute cat, Pablo Picasso
-cute cat, Jean Michel Basquiat

이번 기회에 언급한 작가들도 한번씩 리서치를 해보자. 지금 보여준 이미지들은 그 작가의 아주 대표적인 작품 위주로 선택해 보여주는 것. 다른 작품도 많으니 리서치를 각각해서 그 작가의 다른 작품들도 보고 작품의 일부, 기법의 일부, 표현의 일부도 래퍼런스에 활용할 수 있기 때문에 광범위하게 리서치해보는 것을 추천.

화각(앵글) 키워드 프롬프트
-화각, 앵글은 사진을 찍을 때 대상, 피사체의 각도를 말함.
-이미지를 생성할 때 특정 앵글을 지정해야 하는 경우가 많을 것. 왜냐하면 화각이나 앵글은 이미지의 의미를 형성하는데 중요한 요소이기 때문. 어떤 장면에서 피사체가 오른쪽을 바라보고 있는지, 뒤를 보고 있는지에 따라서 의미가 달라짐. 그래서 내가 프롬프트에서 지정을 해야 함.

정면: front view
측면: side view | right, left 방향 지정
정측면: full side view(이렇게 입력해도 완전히 정측면 이미지를 잘 생성해주진 않음)
반측면: half side view
후면: rear view, back side view
평면도, 위에서 본 시점: top view, high/top angle, drown view
아래에서 본 시점: botton view, low angle
저각도 광각: low wide angle(코 겁나 큰 앵글)

신체 부위 키워드
얼굴(얼굴만 꽉찬): extreme close up
얼굴(여백이 있는): close up
얼굴+상체 일부: medium close up
상체(허리 위쪽, 허리보다 약간 아랫쪽까지 포함): medium shot, upper body
몸통(얼굴 제외 목-허리까지): torso(패션 사진에서 많이 사용)
하체: lower body
상체+하체 일부(무릎까지): medium full shot
전신: full shot, full body, full length, long shot

4-3 기본 프롬프트 이해하기(2)

Subject [주제]
인물 person: girl, boy, man, woman
동물 animal: panda, cat, dog, fox
장소 location: NY, Seoul, Paris, London
사물 object: car, perfume, teapot, laptop

-주제의 형식은 아무래도 명사의 형식이 압도적으로 많음.
-이미지 생성의 주된 대상임.
-형용사를 덧붙이더라도 주제는 명사가 중심이 된다.

-키워드만 넣어서 단순한 키워드를 미드저니가 어떻게 표현해내는지, 이런 연습도 시간날 때 해보자.

Medium [매체]
photography: 사진
painting: 회화, 아트웍, 그림
illustration: 일러스트레이션 (상업미술)
sculpture: 조각
tapestry / ceramics / craft: 공예

-매체는 어떤 정보나 메시지를 전달하는 수단. (뉴스를 전달한다면 매체는 신문, 유튜브 등이 됨.)
여기선 전달의 수단이라기보단 표현의 수단, 표현의 형식을 말함.
어떤 형식으로 표현하느냐, 이에 대한 키워드를 프롬프트에 지정을 해줘야 함. 지정을 딱 해주지 않으면 미드저니가 프롬프트에 적합하다고 판단하는 매체를 랜덤으로 생성해줌. 주제를 어떤 형식으로 생성하면 좋겠는지 미리 생각해서 프롬프트에 지정을 해주는 것이 좋음.
-그림은 페인팅, 일러스트레이션, 드로잉, 두들 등 다양, 전부 그림이지만, 미묘하게 의미가 다름.
페인팅-회화, 일러-상업미술(좀 더 목적성이 분명한), 드로잉-스케치에 가까운 드래프트(밑그림), 두들-낙서같은 손그림

Environment [환경]
indoors, interior(실내 꾸며놓은 것)
outdoors, exterior(실외의 건물 외부를 꾸며놓은 것)
on the moon / space
underwater / sea
in the city
in the woods

-주제가 어디에 놓여지는 배경, 장소를 말하기도 하고, 어떠한 것들은 장소 자체가 주제가 되기도 함.
-space 키워드로 이미지를 생성하면 실제 우주 모습보다는 우주복을 입은 사람 모습을 많이 생성함. 그래서 만약 행성이 있는 우주 공간을 표현하고 싶으면 구체적으로 행성 이름을 붙이거나 블랙홀 등 설명해야 함.

Lighting [조명]
ambient(은은한 조명, 직접 조명보단 간접 조명, 주변광, 간접광 등) / natural light(자연광)
overcast(구름이 하늘을 덮고 있을 때 자연스럽게 생기는 빛을 말함. 그림자가 덜지고 밝진 않지만 어둑하면서 부드러운 빛)
cinematic(영화같은 조명을 말함. 반사조명, 색 온도와 같은 조명 기술 등등)
lens flare(카메라 렌즈에 빛이 산란돼서 이펙트가 원으로 강렬하게 생기는 걸 말함. 이미지의 분위기를 더하기 위해 포토샵에서 합성으로 많이 만들었음.)
back light(역광 느낌. 뒤에서 조명을 강하게 쏘면 실루엣에 따라 빛이 아른거리게 살아나는 느낌.)
neon light / UV light(특정 조명을 사용했을 때 강렬하게 피사체에 덮여나오는 느낌)

-이미지에서 빛의 역할이 얼마나 중요한지는 수백번 말해도 부족.
이미지의 분위기를 결정하기도 하고, 조명 자체가 의미를 갖는 경우가 굉장히 많음.
-빛은 이미지의 명도, 즉 어둡고 밝고를 조절하면서 이미지에 풍부한 깊이감을 표현하기도 함. 컨셉 표현에 영향을 많이 미치기 때문에 조명과 관련된 키워드들은 많이 알면 알수록 좋으니 탐구를 많이 하길 권장.
-조명 키워드들은 활용도가 매우 높기 때문에 인물이나 장소, 사물 키워드와 함께 프롬프트를 꼭 포함해서 한번씩 이미지를 생성해보길 바란다.

Color [색상]
vibrant
bright
monochromatic / black and white
colorful
pastel
muted(저채도 색감)

-vibrant, bright, colorful 이런 키워드로 이미지를 생성할 때, 특정 색을 지정하지 않으면 총천연색으로 화려하게 이미지를 생성해줌.

Mood [분위기]
sedate / calm: 진정된, 차분한
raucous: 소란스러운
energetic / dynamic: 활기찬, 역동적
cozy: 아늑한
majestic: 웅장한
melancholic: 우울한

-이미지 분위기 키워드는 주로 형용사가 됨.
-분위기 형용사에 따라서 어떻게 달라지는지 확인해보는 연습도 꼭 하기
-분위기를 서술하는 키워드의 경우 무궁무진한 형용사들이 가능해지는데, 중요한 건 미드저니가 이미지를 생성하는 AI이다보니 시각적인 표현이어야 함. 추상적인 표현으로 분위기를 지정해주면 미드저니가 창의성을 발휘한다는 것.

[추가적으로 도움되는 키워드]
그래픽 스타일
3D rendering (입체 표현)
holography (3차원 입체 영상 효과를 말하는데, 미드저니가 학습을 많이 하진 않은듯)
pixel art
plat line graphic

-이미지로 보면 많이 본 스타일이고 아는 건데, 막상 텍스트로 표현하려면 어떤 키워드로 써야 정확히 표현이 되는지 알아야 함.

사진 스타일
-Landscape photography
장소를 지정하면 풍경의 스타일을 생성해주긴 하지만 Landscape photography라고 입력하면 좀 더 자연색의 광활함을 보여주는 웅장함이 표현됨. 사진의 한 장르임, 쓰는 렌즈도 다름.

-Astrophotography
원래는 천체 사진을 말함, 망원경같은 특수 장비를 이용해서 우주 공간이나 천체 현상을 촬영하는 사진 장르를 말하는데, 보통은 특수 장비없이 밤하늘이나 별 등을 사진에 담는 것을 포함해 말함
행성 이름+Astrophotography를 넣어주면 우주인 말고 천체 이미지를 생성해줌

-Macro photography
접사. 근접 촬영, 피사체가 실제보다 더 크게 보이도록 특수 렌즈를 사용해서 찍는 사진을 말함.

-Portrait photography
인물사진을 말함. 증명사진도 Portrait이지만 보통 인물의 내면과 개성을 담아내는 예술사진의 한 장르를 말함.

[미드저니의 프롬프트 공식/치트키]
X-ray double exposure of
X-ray double exposure of car
X-ray double exposure of laptop

-그냥 ‘X-ray’만 입력해도 이미지를 생성해주지만, ’double exposure of’라고 덧붙이면 더 확실하게 이미지를 생성해줌.

ASCII art
banana, ASCII art / zebra, ASCII art

-문자와 기호를 사용해서 그림을 만드는 측정 예술 형식.
-생성한 이미지를 확대해보면 진짜 명확한 문자는 아님. 문자같아보이는 작은 요소들을 깨알같이 조합한 형식의 그림을 생성해주는 것.

retrowave / synthwave
a retrowave portrait of a sheep with glasses
an asian woman with long hair, synthwave

-1980년 대 영화 비디오 게임 사운드 트랙에서 영향을 받은 장르.
-복고, 네온사인, 야자수, 특정 네온틱한 색조합, 배경에 원이 있고 수평선 그어진

freeze frame
fight club, freeze frame, sport action photography
angel is about to take flight from water, freeze frame

-물 튀기는 것이 생동감있게 순간포착된 사진을 의미.
-실사 이미지 생성할 때 유용하게 사용 가능한 키워드.

background motion blur
fashion model, background motion blur, people
racing car, background motion blur, autobahnbackground motion blur

-피사체 외에 배경을 모션 블러로 날리는 공식

[실습] Keyword Prompt 연습

이미지 생성
아래 제시하는 키워드를 포함한 프롬프트로 각각 이미지를 생성해 보세요. (이미지 총 10장 이상)
-야간사진: moonlit landscape(달이 비치는 풍경) / long exposure(장시간 노출)
-분위기: hyper-realistic(초현실적인) / twisted(뒤틀린) / mystical(신비한)
-조명: painted light(채색된 빛) / soft blue ambient(일몰 푸른 빛) / volumetric lighting(볼륨 조명) / bokeh effect(배경에 빛 효과) / low key lighting(그림자 강조 조명)
생성한 이미지들로 milanote에서 무드보드를 제작해 보시기 바랍니다.

-주제어는 별도 제시X, 어떤 걸 야간 사진으로 표현하면 좋을지, 무엇을 이런 분위기로 표현하면 좋을지 각자 상상
-프롬프트는 길 필요없고 주제어 하나 정도에 키워드로 생성
-야간 사진이나 조명같은 경우는 사진으로 생성되어야 그 느낌을 알 수 있기 때문에 포토그래피 정도 프롬프트에 포함해주면 좋음.


이미지 생성 해보기 전에 키워드가 어떤 느낌인지 구글링해서 감을 익힌 다음, 이미지를 생성하면 4장 중 어떤 이미지를 선택해야 할지 판단이 설 것.

무드보드: milanote 

4-4 프롬프트 기본 문법

-프롬프트를 작성하는 데 특별한 문법이 있는 건 아니지만, 지키면 용이한 간단한 규칙.

Prompting based on Keywords

Prompting은 키워드에 기반해서 작성해야 함.
AI는 자연어를 그대로 그리는 것이 아님. 단어 단위로 의미를 개선해서 생성. 그래서 불필요한 문법은 오히려 생성 모델을 혼란스럽게 함.

예시 프롬프트

prompt: show a beautiful fox sitting under the tree in a lush forest during golden hour in 8k quality, with a mysterious atmosphere, ultra realistic photo style
해석
황금 시간대에 울창한 숲 속 나무 아래에 앉아 있는 아름다운 여우를 신비로운 분위기로 보여주도, 8K 화질의 극 사실적인 사진 스타일로 보여주세요.

-미드저니는 결국 단어 단위로 분해함.
-golden hour는 시간대인데 여러 의미가 있지만 이 맥락에선 대략 조명을 말함. = 햇빛 비추는 오후 정도의 조명

Prompt
-문장보다 키워드 중심으로 프롬프트 작성
-show, create, generate, drew(보여줘, 그려줘, 생성해줘) : 의미없는 표현(/imagine)
-조사, 접속사 필요 없음
문법에 맞게 쓰려고 애쓰지 않아도 됨.

기본 규칙
-기본적으로 영어로 작성(영어를 잘해야 잘 작성할 수 있는 건 아님. 콩글리쉬처럼 미드저니식 영어가 있음. 키워드 중심으로 나열하는 것. 근데 이런 프롬프트 테크닉에 너무 연연해하지 않아도 괜찮다고 생각하는 편. 많이 생성하고 시행착오하면서 프롬프트 작성도 창의적으로 익혀가는 것이 좋다고 생각. 그래서 딱 기본 알려줄 것임. 확장, 응용할 수 있는 감각을 어떻게 학습하는지 그런 걸 설명 많이 해줄 것임.)
-최소: 문자 1개, 이모지 1개(디스코드니까 이모지도 넣을 수 있음.)
-최대: v5 50 단어, v6 350 단어(권장)
-대소문자 구분 안함(못함)
-특수 기호 작동 안함(parameter에 사용되는 일부 제외)
프롬프트에 ,(콤마)를 쓰는 것도 미드저니는 인식 못함. 쓰는 이유는 사람이 단어와 단어를 눈으로 구분하기 위해서 편의상 쓰는 것.
콤마와 파라미터에 쓰이는 -(하이픈)외에는 왠만하면 특수기호는 입력하지 않는 것 추천.(에러를 발생시킬 수 있음.) 가급적 안쓰는 것이 좋다고 기억하자.

Basic Prompt Anatomy(기본 프롬프트 해부학, 구성)

[/imagine] [매체 of 주제] [주제의 특성] [배경과 관계] [세부 배경 요소] [색감과 조명] [특정 스타일] [기술적 요소]

=이런 순서로 기술하면 이상적임.

매체 of 주제: 매체 앞에 쓰고 of 붙여서 주제 뒤에 쓰지 않아도 됨. 전치사는 중요하지 않음. 근데 미드저니 프롬프트 작성할 때 키워드 순서는 중요.
짧고 간단한 프롬프트에서는 키워드의 순서가 생성 이미지의 영향을 미치진 않지만, 프롬프트가 좀 길어지고 복잡해지면 순서의 영향을 반드시 받음. 그래서 일반적으로 주제와 매체는 앞단에 적는 게 좋음. 중요하게 표현되어야 하는 키워드는 앞으로 몰아서 작성해야 하는 것을 기억해야 함.

다른 측면에서 프롬프트를 분해해서 보자.

[/imagine][prefix][scene][suffix][parameters]
명령어 | 접두사 | 장면 | 접미사 | 파라미터

-Basic Prompt Anatomy는 어떤 내용을 어떤 순서로 쓰느냐로 카테고리를 구분했다면, ‘접두사, 장면, 접미사, 파라미터’ 이런 형식으로 구분한 것.

[실습] Image to Text, Text to Image

![](https://velog.velcdn.com/images/lwlgus17/post/a1fba86f-360d-489b-bb82-9a2aeccd0ef8/image.png)

이미지 생성
이미지를 보고 프롬프트로 작성해 보세요.
작성 시, 접두사 + 장면 + 접미사 + 파라미터 구조로 작성해 보세요.
작성한 프롬프트로 다시 이미지를 생성해 보세요.

(!실습은 9/12일 진행!)

ㄴ원본 이미지

ㄴ1차 시도(완전 실패)

High Resolution photo, / The center of the crosswalk, the man in the suit, looking at his phone, side view, / hyper-realistic, back light

파파고로 열심히 만든 프롬프트..
너무 외국인, 이게 사이드 뷰..?

ㄴ2차 시도

High Resolution photo, | morning rush hour, Asian man, suit, looking at his phone, side view, right, | hyper-realistic, back light, soft lighting, sunlight | --v 7.

ㄴ3차 시도

High Resolution photo,
side view, right, morning rush hour, crosswalk, an Asian man wearing a suit and backpack, looking at his phone, cars waiting for a signal, 
hyper-realistic, back light, soft lighting, sunlight

비슷한 느낌으로 시도를 계속 해봤는데 신호등 방향을 계속 다른 방향으로 생성해줌..
이쯤 시도하니 드는 생각.. 비율 설정을 까먹었네..?
정리해보면,,신호등 방향 다름, 남자가 센터에 있지 않음, 원본에 밝고 청량한? 느낌이 안나오고 빛바랜 느김..

ㄴ 다시 시도해봤지만..
차 왜 이렇게 많아.. 우리나라가 아니야.. 무슨 인간이랑 차랑 같이 가고 있어..
또 다시 떠오른 사실.. 동양인으로 입력했음

ㄴ 마지막 Korean men으로 다시해봤지만 비슷하다ㅎ 그래도 배경은 좀 비슷해진 것 같기도

/describe의 도움을 받자
4개 중 비슷한 느낌의 이미지와 프롬프트

a young korean man in business attire, holding his phone and looking at the crosswalk on an urban street corner during sunset. 
he is walking with cars passing by. the city lights create a warm glow as he turns to look behind him while waiting for the traffic light. 
a backpack hangs from one shoulder, adding character to the scene. in the background, there are people crossing the road, adding depth to the composition. --ar 128:71

look behind him while waiting for the traffic light -> 이런 식으로 작성해야 저런 느낌이 나오는군아.. 근데 옆모습인디 왜 자꾸 얼굴을 보여주거나 정면이 나오는건데.
미드저니가 횡단보도는 모르는 것 같다.

0개의 댓글