AI 시대라고 하며 인공지능은 이제 너무 익숙한 말이 되었다. SNS나 유튜브에서도 쉽게 AI 그림과 동영상을 볼 수 있다. 인공지능으로 그림을 그리고 동영상, 음성, 코딩 등 많은 것을 만들어낸다. 이 글에서는 이미지 생성을 위한 Stable Diffusion 설치를 알아보자.
내 머릿속 이미지를 생성
블로그나 유튜브 썸네일
게임 캐릭터 디자인
ppt에 사용할 주제에 꼭 알맞은 사진
다양한 분야의 사진 생성

AI 이미지 생성툴은 여러 가지가 있다. 그중에서 stable diffusion을 사용해 보려고 한다. 스테이블 디퓨전은 오픈소스이며, 여러 모델들을 쉽게 적용해 볼 수 있고, 사용에 따라 높은 수준의 결과물을 얻을 수 있다. 또한 local 설치를 해서 인터넷이 없이도 사용할 수 있다.
스테이블 디퓨젼 webui local(로컬) 설치
스테이블 디퓨젼을 사용하는 방법은 크게 3가지가 있다. web 서비스, 구글 코랩(google colab)을 이용해서도 사용할 수 있지만, 여기서는 local(자기 컴퓨터에 설치)에 설치해서 사용해 보려고 한다.
stable diffusion webui는 웹 브라우저에서 복잡한 코딩 없이도 사용하게 해주는 설정이다.
1. 권장 사양
✅ 권장 사양 (2024년 기준)
항목 | 권장 사양 | 최소 사양 (기본 txt2img만) |
---|---|---|
GPU (그래픽카드) | NVIDIA RTX 3060 이상 (VRAM 12GB 이상) | GTX 1060 이상 (VRAM 6GB 이상) |
VRAM (GPU 메모리) | 12GB 이상 | 최소 6GB (512×512 해상도만 가능) |
CPU | AMD Ryzen 5 / Intel i5 이상 | Intel i3, 저전력 CPU도 가능은 함 |
RAM (메모리) | 16GB 이상 | 8GB 이상 (버벅임 있을 수 있음) |
스토리지 | SSD 50GB 이상 여유 공간 | 최소 30GB 여유 공간 |
운영체제 | Windows 10 64bit / Linux | 동일 |
CUDA 지원 | CUDA 11.7 이상 | 필수 (NVIDIA GPU 사용하는 경우) |
높은 해상도의 이미지, 복잡한 이미지를 생성하기 위해서는 컴퓨터의 사양이 어느 정도 뒷받침되어야 한다. 높은 해상도나 복잡한 이미지의 경우 생성 시간이 굉장히 오래 걸리게 된다. 설치하고 테스트를 진행하고 사용함에 있어서 실패와 생성 시간을 기다리는 과정을 거치면 그래픽 카드 업그레이드 욕구가 샘솟아 그래픽 카드를 알아보고 있을 것이다.
2. 파이썬 설치
파이썬은 3.10.6 버전을 설치 (다른 버전보다는 해당 버전을 설치하는 게 여러모로 매끄러운 실행이 가능합니다.)
https://www.python.org/downloads/release/python-3106

windows라면 둘 중에 맞는 걸로 설치 (요즘에는 웬만하면 64-bit)
3. git 설치
web ui를 설치하기 위한 도구
https://git-scm.com/downloads/win

windows라면 둘 중에 맞는 걸로 설치 (요즘에는 웬만하면 64-bit)
4. Automatic 1111 설치
윈도우 – 검색 -> cmd -> 아래 명령어 입력
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git stable_diffusion/webui

위 명령어는 c/users/<사용자>/stable_diffusion/webui 위치에 stable diffusion을 설치한다는 것이다.
5. webui.bat 실행
윈도우 cmd에서 해당 명령어를 실행
stable_diffusion\webui\webui.bat
브라우저 -> 127.0.0.1:7860 검색

6. 실행 테스트
stable diffusion은 영어로 프롬프트를 작성하고 generate를 누르면 결과가 생성된다.
예시 프롬프트
masterpiece, best quality, ultra-detailed, fantasy forest, glowing mushrooms, soft light, magical atmosphere, vivid colors, lush trees, fog
Negative prompt
blurry, lowres, bad perspective, unrealistic, distorted

예시 프롬프트를 작성하고 generate를 누르면 위와 비슷한 이미지가 생성될 것이다. (위와 비슷한 느낌으로 생성될 것이다. 또한 같은 프롬프트를 입력해도 매번 다른 이미지가 생성된다.)
프롬프트는 굉장히 중요하다. 프롬프트를 어떻게 작성하느냐에 따라 이미지의 퀄리티가 굉장히 차이가 많이 나게 된다. 그러나 몇 번 작성해 보면 금방 감을 잡고 자기 생각을 그려나가게 될 것이다.
프롬프트 작성은 영어로 작성해야 하는데 이 부분은 어렵게 생각하지 않아도 된다.
chat gpt를 이용해서 자기가 생각하는 이미지를 구체적으로 설명하고 “stable diffusion prompt로 생성해 줘” 라고 입력하면 잘 만들어준다. 생성된 프롬프트로 이미지를 생성해 보고 이상한 부분이나 자기 생각에 맞지 않은 부분들은 프롬프트를 조금씩 수정하면서 이미지를 생성하면 된다.
마무리
블로그 상단의 그림은 다른 모델을 사용해서 생성한 이미지다. 자연, 인물, 캐릭터, 애니, 실사, 일러스트 등 여러 스타일의 다양한 이미지가 생성이 가능하다. 이미 많은 사용자들이 다양한 이미지들을 학습 시키고 모델들을 공유하고 있어 자기가 원하는 스타일의 모델을 찾아 적용해 이미지를 생성하면 된다.
블로그 썸네일, 유튜브 썸네일, 웹툰, 게임, 업무용 이미지 등 자기가 원하는 모델을 찾아 자기가 생각하는 이미지를 손쉽게 생성할 수 있다.
stable diffusion을 사용하면서 좋은 결과를 얻기 위해서 smapling method, sampling steps, CFG Scale 등 몇몇 설정들에 대해서 알아야 할 순간이 오겠지만, 이 또한 금방 학습하고 익히게 될 것이기 때문에 너무 어렵게 생각하지 않았으면 한다. 우리는 해당 기능들을 연구하는 게 아니라 우리 입맛에 맞춰 잘 사용하기만 하면 되기 때문이다. (모르면 그냥 모르는 대로 사용하면 된다.)
모두들 화이팅!