
Stable Diffusion
스테이블 디퓨전
소개
Stability AI가 2022년 8월 공개한 오픈소스 이미지 생성 모델로, 코드와 가중치가 전부 공개되어 로컬 PC에서 직접 실행할 수 있습니다. 초기 버전(SD 1.x~XL)은 VAE·U-Net·CLIP 구조를, SD 3.0부터는 MMDiT(Multimodal Diffusion Transformer)와 Rectified Flow 기반으로 전환해 품질과 프롬프트 충실도가 향상되었습니다. txt2img, img2img, 인페인팅, 아웃페인팅, ControlNet 기반 제어 등 다양한 작업을 지원하며, AUTOMATIC1111·ComfyUI 등 서드파티 UI와 수천 개의 LoRA·Checkpoint 커뮤니티 생태계가 방대합니다. 연매출 100만 달러 미만 조직은 Community License로 비상업·상업 용도 모두 무료로 사용할 수 있습니다.
장점
- 코드와 가중치가 공개된 오픈소스라 로컬 실행 시 API 비용 없이 무제한 생성
- 연매출 100만 달러 미만 조직은 Community License로 상업적 사용까지 무료
- LoRA·Checkpoint·ControlNet 등 수천 개의 커뮤니티 확장으로 스타일과 제어 자유도 최상
- 최적화 버전은 VRAM 2.4GB GPU에서도 실행 가능해 하드웨어 진입 문턱이 낮음
- 이미지가 외부 서버로 전송되지 않아 프라이버시·보안에 유리
단점
- LAION-5B 영어 캡션 위주로 학습돼 한국어 프롬프트 정확도와 한국 문화 재현이 떨어짐
- 로컬 실행 시 Python·CUDA 등 환경 설정이 필요해 비개발자 진입 장벽이 존재
- 연매출 100만 달러를 넘는 조직은 Enterprise License로 별도 계약이 필요
주요 활용 사례
- 이커머스 상품 이미지 대량 일괄 생성
- 특정 화풍·캐릭터에 맞춘 LoRA 파인튜닝
- 인페인팅으로 기존 이미지의 특정 영역만 수정
- ControlNet으로 포즈·구도를 고정한 캐릭터 시안 생성
- 게임·웹툰 배경·에셋 대량 생산
- 개인 PC 기반 AI 아트 실험 및 연구
핵심 기능
오픈소스 모델 공개
코드와 가중치를 GitHub에 전부 공개해 로컬 PC에서 직접 실행할 수 있습니다.
Latent Diffusion / MMDiT 아키텍처
SD 1.x~XL은 VAE·U-Net·CLIP 구조, SD 3.0부터는 Multimodal Diffusion Transformer(MMDiT)와 Rectified Flow로 전환되어 품질이 향상되었습니다.
img2img·인페인팅·아웃페인팅
기존 이미지의 일부 또는 경계를 확장하거나 부분 수정하는 편집 기능을 지원합니다.
ControlNet 지원
깊이 맵, 엣지, 포즈 스켈레톤 등 조건 이미지로 구도와 형태를 정밀하게 제어합니다.
커뮤니티 모델·UI 생태계
LoRA·Checkpoint·Textual Inversion 등 수천 개의 커스텀 모델과 AUTOMATIC1111·ComfyUI·Fooocus 등 서드파티 UI로 자유롭게 활용할 수 있습니다.
낮은 하드웨어 요구사항
최적화 버전은 VRAM 2.4GB GPU에서도 동작하며 10GB 이상을 권장합니다.
세대별 모델 제공
SD 1.5, 2.0, SDXL(3.5B), SD 3.0/3.5(2024-10)까지 용도별로 선택할 수 있습니다.
공식 사이트 2026-04-19 검증
영상 가이드
💰 요금제 (2026-04-19 기준)
Community License
Free
- · 연매출 100만 달러 미만 조직 대상 무료 사용
- · 비상업·상업 용도 모두 허용
- · SD 3.5 Suite, SDXL Turbo, Stable Audio Open, Stable Fast 3D 포함
Enterprise License
Custom (문의)
- · 연매출 100만 달러 이상 기업·API 제공자 대상
- · 상업적 사용 권리 및 구현 지원 포함
- · 커스텀 모델 학습·컨설팅 옵션 제공
🇰🇷 한국 사용자 안내
- 한국어 UI:
- ❌ 한국어 UI 미지원
- 결제:
- 확인 필요
- 환불:
- Community License는 무료이므로 환불 개념이 없고, Enterprise License는 Stability AI와 직접 계약을 통해 조건이 결정됩니다.
❓ 자주 묻는 질문
스테이블 디퓨전은 무료로 쓸 수 있나요?
한국어 프롬프트가 잘 동작하나요?
실행에 어떤 GPU가 필요한가요?
생성한 이미지를 상업적으로 써도 되나요?
Midjourney, DALL-E와 무엇이 다른가요?
어떤 버전을 선택해야 하나요?
학습 데이터는 무엇인가요?
2026-04-19 검증 · 변경 가능


