No A100 Needed Alibaba Tong's Z-Image Creates Photorealistic Images with a 16GB GPU

autherrs·3일 전

최근 새로운 이미지 생성 모델들을 테스트하다가 Z-Image라는 모델을 발견했는데,
60억 파라미터 모델임에도 불구하고 16GB GPU에서 무난하게 돌아가는 것이 꽤 인상적이었습니다.
속도도 빠르고, 결과물 품질도 실사용 수준이라 공유해봅니다.

빠르게 체험해보고 싶다면 여기에서 바로 사용해볼 수 있습니다:
Z-Image"와 끝 부분의

🔍 Z-Image 특징 정리

Z-Image는 효율적인 S3-DiT 구조 기반의 이미지 생성 모델로,
“적은 VRAM + 빠른 속도 + 실사용 퀄리티”를 목표로 만들어진 느낌입니다.

제가 직접 사용해본 기준으로 좋았던 점은 아래와 같습니다.

특히 “전혀 무리 없는 속도 + 높은 활용도” 조합이 괜찮았습니다.

Velog에는 직접 따라 할 수 있는 실습형 글이 많아서,
바로 실행해볼 수 있는 최소한의 세팅만 정리해봤습니다.

Python 3.10+
CUDA 11.8+
PyTorch 2.1+

git clone https://github.com/Z-Image-AI/z-image

cd z-image

pip install -r requirements.txt

python scripts/download_models.py --model zimage-base

python generate.py \ --prompt "hyper realistic portrait with cinematic lighting" \ --output output.png

생성 속도가 꽤 빠르고, 결과물 디테일도 사진 느낌이 강합니다.

이미지를 하나 넣고 프롬프트를 살짝 수정하면,

이런 작업들이 전반적으로 안정적으로 작동했습니다.
특히 제품 이미지나 인물 구조를 잘 유지해서 실무 용도로도 충분해 보였습니다.

포토리얼 계열에서는 꽤 강력한 선택이라고 느꼈습니다.

직접 설치하기 번거롭거나,
바로 다양한 버전을 테스트해보고 싶다면 여기 온라인 버전을 추천드립니다:
Z-Image Editor

추가로 Velog에 올릴 심화 튜토리얼 / 더 기술적인 버전 / 비교 리뷰도 필요하시면 만들어드릴게요.

waqar@3733