
Stable Diffusion, ComfyUI 학습 순서와 Stability Matrix 활용법을 공유합니다.
국비 AI 프로젝트에 참가한 후, Stable Diffusion으로 AI 이미지 생성을 공부하면서 느낀 점들을 정리해보고자 글을 쓰게 되었다. 처음엔 Stable Diffusion, ComfyUI, Stability Matrix 같은 도구들이 복잡하게 느껴졌지만, 하나씩 익히면서 점점 재미를 찾았다. (양념게장은 밥도둑 comfyui는 시간도둑) 특히 어떤 순서로 배우는 게 효율적인지 고민이 많았는데, 저처럼 초보자분들께 도움이 될까 싶어 제 경험을 담아봤습니다. 깔끔하고 솔직하게, 제가 배운 과정을 풀어볼것임.

사진은 현재 Stable Diffusion의 UI다. 수많은 노드가 아닌 깔끔하게 정리된 느낌이다.
Stable Diffusion을 먼저 배우는 게 왜 좋을까? 경험상 이건 AI 이미지 생성의 기초를 다지는 데 정말 중요하다. Stable Diffusion은 텍스트를 이미지로 바꾸는 AI 모델로, 프롬프트만 입력하면 바로 결과를 볼 수 있어 초보자도 쉽게 시작할 수 있다. 예를 들어, "미래 도시, 상세한 배경" 같은 프롬프트를 넣으면 GPU 사양에 따라 이미지가 생성되는데, 이 과정에서 프롬프트 작성법이나 설정값(CFG 스케일, 샘플링 스텝 등)을 자연스럽게 익힐수 있다..
Automatic1111 같은 Stable Diffusion WebUI를 썼는데, 인터페이스가 직관적이어서 복잡한 지식 없이도 바로 사용할 수 있다. 프롬프트로 시작해서 LoRA, ControlNet 같은 기능까지 점차 배우다 보니 AI 이미지 생성의 전체 흐름이 머릿속에 잡히는 순간이 온다.
이 기본기가 나중에 ComfyUI 같은 고급 도구를 배울 때 큰 도움이 됐습니다. Stable Diffusion을 먼저 익히면 내가 뭘 만들고 싶은지, 어떤 결과가 가능한지도 명확해져서 개발 하는데에 있어서 재미가 붙기 시작한다.
게임을 좋아하지 않지만 내가 개발을 통해 이미지를 만드는것이 얼마나 재미가 있는지 게임처럼 재미가 붙는다. 해보지 않은 사람은 모를것이다. 자, 이제 !

ComfyUI는 사진과 같이 복잡한 노드들로 인하여 이해가 필요하다. 앞에 stable diffusion 사진과 비교하면 꽤 복잡해 보인다.
특정 노드에서 케이블이 4개 6개를 쓰는 경우도 업스케일등 퀄리티를 올리는 노드에서 많이 쓰이기 때문에 차근차근 이해가 필요하다.
ComfyUI는 노드 기반으로 Stable Diffusion의 워크플로우를 세밀하게 조정할 수 있는 도구. 하지만 솔직히 처음부터 ComfyUI를 잡으면 좀 부담스러울 수 있다. 사진에서 벽을 느끼게 해주는 아우라를 풍기고 있다.
comfyui의 인터페이스에서 노드 연결 방식이 처음엔 낯설수 있다.
Stable Diffusion으로 기본 개념을 익히라고 하는 이유가 여기에서 나온다.
기본을 익히지 않고 ComfyUI로 건너뛴다면, 되감기 해야한다.
모가 뭔지 아무것도 모른다.
ComfyUI는 단순한 텍스트-이미지 생성뿐 아니라 이미지 변환, 업스케일링,SD1.5, SDXL, Flux 모델 등등 통합 같은 복잡한 작업을 효율적으로 처리할 수 있어서 편리할 수 있음.
보통 Stable Diffusion WebUI로 1~2주 정도 실험해본 뒤 ComfyUI를 시작하는 걸 추천한다. 급하다면 1주일 정도 수면을 포기하고 헬스를 포기하고 진행하면 된다.
ComfyUI의 기본 워크플로우를 따라 하면서 노드 하나하나가 뭘 하는지 파악하려 했고, 이 과정에서 Stable Diffusion의 동작 원리를 더 깊게, 아니 조금이라도 파악할 수 있어야 다음으로 진행이 된다. 즉, 음식을 꼭꼭 씹어서 먹어야 소화가 잘되는것처럼 이해 하는것도 동일하다.
Stability Matrix는 Stable Diffusion WebUI, ComfyUI 같은 인터페이스를 한 번에 설치하고 관리할 수 있는 도구라고 생각하면 쉽다.
나중에 시간이 지나고 나서 느낀 바 초보자 입장에선 환경 설정의 복잡함을 덜어주는 초 강력 도구이다.
Python이나 CUDA 설치로 머리 아플 필요 없이 클릭 몇 번으로 시작할 수 있으니, Stability Matrix로 배우면서 정리한 학습 순서를 공유하겠음.
Automatic1111로 기초 다지기
Stability Matrix에서 Automatic1111을 설치하고 텍스트-이미지 생성을 연습해보세요. 프롬프트 입력하고 CFG 스케일(7~12)이나 샘플링 스텝(20~50)을 조정하면서 결과를 확인하는 게 시작했다고 볼 수 있다.
기능 확장해보기
Automatic1111에서 ControlNet, inpainting 같은 기능을 사용해보자. 우선 컨트롤넷과 인페이팅 기능은 GPU 사양이 좋아야 한다. 아끼지 않던 본체에 힘내라 힘. 응원해야 한다. 이유는 단순하다. 최신 GPU가 아니라면 최신 GPU와 2배, 3배 4배 늦게 만들어진다.
(기능 설명은 나중에 하겠음.)
Stable Diffusion과 ComfyUI를 배우는 과정은 처음엔 막막하다, 살면서 본인이 잘하는것과 좋아하는것을 생각해보자.
헬스를 좋아하고 전 직업이 헤어디자이너 였기때문에 처음 배배우는 스타일링은 처음부터 잘했고 메이크업과 헬스는 답이 없었다. 모르면 배워야 한다. 그러면 없던 근육이 생기고 메이크업 요령도 생긴다.
그럼 그다음은 다 알지 않나? 어떻게 하면 더 좋아질지, 어떻게하면 더 발전할지에 대한
마인드가 생긴다.
이거면 된다 우선 검색하고 찾고 영상도 보고 내가 ai라고 생각하고 학습하면 comfyui 별거 아니게 될수 있다.
왜냐하면 백엔드와 워크플로우 연동이 어렵기 때문에 노드따위는 흐름만 알면된다
그러니 이제 화이팅.