AI 순위 AI 추천 AI 직업 AI 도구 시리즈 프롬프트 블로그

Stable Diffusion

스테이블 디퓨전

🎨 이미지 생성오픈소스로컬실행커스터마이징

Stable Diffusion 사이트 방문

소개

Stability AI가 2022년 8월 공개한 오픈소스 이미지 생성 모델로, 코드와 가중치가 전부 공개되어 로컬 PC에서 직접 실행할 수 있습니다. 초기 버전(SD 1.x~XL)은 VAE·U-Net·CLIP 구조를, SD 3.0부터는 MMDiT(Multimodal Diffusion Transformer)와 Rectified Flow 기반으로 전환해 품질과 프롬프트 충실도가 향상되었습니다. txt2img, img2img, 인페인팅, 아웃페인팅, ControlNet 기반 제어 등 다양한 작업을 지원하며, AUTOMATIC1111·ComfyUI 등 서드파티 UI와 수천 개의 LoRA·Checkpoint 커뮤니티 생태계가 방대합니다. 연매출 100만 달러 미만 조직은 Community License로 비상업·상업 용도 모두 무료로 사용할 수 있습니다.

장점

코드와 가중치가 공개된 오픈소스라 로컬 실행 시 API 비용 없이 무제한 생성
연매출 100만 달러 미만 조직은 Community License로 상업적 사용까지 무료
LoRA·Checkpoint·ControlNet 등 수천 개의 커뮤니티 확장으로 스타일과 제어 자유도 최상
최적화 버전은 VRAM 2.4GB GPU에서도 실행 가능해 하드웨어 진입 문턱이 낮음
이미지가 외부 서버로 전송되지 않아 프라이버시·보안에 유리

단점

LAION-5B 영어 캡션 위주로 학습돼 한국어 프롬프트 정확도와 한국 문화 재현이 떨어짐
로컬 실행 시 Python·CUDA 등 환경 설정이 필요해 비개발자 진입 장벽이 존재
연매출 100만 달러를 넘는 조직은 Enterprise License로 별도 계약이 필요

주요 활용 사례

이커머스 상품 이미지 대량 일괄 생성
특정 화풍·캐릭터에 맞춘 LoRA 파인튜닝
인페인팅으로 기존 이미지의 특정 영역만 수정
ControlNet으로 포즈·구도를 고정한 캐릭터 시안 생성
게임·웹툰 배경·에셋 대량 생산
개인 PC 기반 AI 아트 실험 및 연구

핵심 기능

오픈소스 모델 공개

코드와 가중치를 GitHub에 전부 공개해 로컬 PC에서 직접 실행할 수 있습니다.

Latent Diffusion / MMDiT 아키텍처

SD 1.x~XL은 VAE·U-Net·CLIP 구조, SD 3.0부터는 Multimodal Diffusion Transformer(MMDiT)와 Rectified Flow로 전환되어 품질이 향상되었습니다.

img2img·인페인팅·아웃페인팅

기존 이미지의 일부 또는 경계를 확장하거나 부분 수정하는 편집 기능을 지원합니다.

ControlNet 지원

깊이 맵, 엣지, 포즈 스켈레톤 등 조건 이미지로 구도와 형태를 정밀하게 제어합니다.

커뮤니티 모델·UI 생태계

LoRA·Checkpoint·Textual Inversion 등 수천 개의 커스텀 모델과 AUTOMATIC1111·ComfyUI·Fooocus 등 서드파티 UI로 자유롭게 활용할 수 있습니다.

낮은 하드웨어 요구사항

최적화 버전은 VRAM 2.4GB GPU에서도 동작하며 10GB 이상을 권장합니다.

세대별 모델 제공

SD 1.5, 2.0, SDXL(3.5B), SD 3.0/3.5(2024-10)까지 용도별로 선택할 수 있습니다.

공식 사이트 2026-04-19 검증

영상 가이드

정말 쉽고 간단하게 알려드립니다. 스테이블디퓨전 설치 후 실제사진 만드는 방법

정말 쉽고 간단하게 알려드립니다. 스테이블디퓨전 설치 후 실제사진 만드는 방법

타이탄

2026 스테이블 디퓨전 초보자 가이드｜설치부터 이미지 생성까지 한 번에

2026 스테이블 디퓨전 초보자 가이드｜설치부터 이미지 생성까지 한 번에

크립토메이지

전문가의 스테이블 디퓨전 사용법 | Stable Diffusion Korea 최돈현

전문가의 스테이블 디퓨전 사용법 | Stable Diffusion Korea 최돈현

패스트캠퍼스

💰 요금제 (2026-04-19 기준)

Community License

Free

· 연매출 100만 달러 미만 조직 대상 무료 사용
· 비상업·상업 용도 모두 허용
· SD 3.5 Suite, SDXL Turbo, Stable Audio Open, Stable Fast 3D 포함

Enterprise License

Custom (문의)

· 연매출 100만 달러 이상 기업·API 제공자 대상
· 상업적 사용 권리 및 구현 지원 포함
· 커스텀 모델 학습·컨설팅 옵션 제공

🇰🇷 한국 사용자 안내

한국어 UI:: ❌ 한국어 UI 미지원
결제:: 확인 필요
환불:: Community License는 무료이므로 환불 개념이 없고, Enterprise License는 Stability AI와 직접 계약을 통해 조건이 결정됩니다.

🔄 대안 도구

❓ 자주 묻는 질문

스테이블 디퓨전은 무료로 쓸 수 있나요?

연매출 100만 달러 미만 조직이라면 Community License에 따라 비상업·상업 용도 모두 무료로 사용할 수 있습니다. 그 이상은 Enterprise License 계약이 필요합니다.

한국어 프롬프트가 잘 동작하나요?

모델이 LAION-5B의 영어 캡션 위주로 학습되어 한국어 프롬프트는 정확도가 낮고 한국 문화 표현도 제한적입니다. 영어 프롬프트 또는 한국어 파인튜닝 모델 사용을 권장합니다.

실행에 어떤 GPU가 필요한가요?

최적화된 경량 버전은 VRAM 2.4GB부터 동작하지만, SDXL·SD 3.5 같은 최신 모델을 원활히 쓰려면 VRAM 10GB 이상을 권장합니다.

생성한 이미지를 상업적으로 써도 되나요?

Community License 범위 안에서는 생성 이미지에 대한 상업적 사용 권리를 사용자가 보유합니다. 조직 연매출이 100만 달러를 넘으면 Enterprise License로 전환해야 합니다.

Midjourney, DALL-E와 무엇이 다른가요?

Midjourney·DALL-E는 호스팅형 폐쇄 서비스인 반면, 스테이블 디퓨전은 오픈소스 모델이라 로컬 실행·파인튜닝·커스텀 LoRA가 자유롭습니다.

어떤 버전을 선택해야 하나요?

최신 공식 버전은 2024년 10월 공개된 SD 3.5이며, 커뮤니티 확장(LoRA, ControlNet 등)은 여전히 SDXL과 SD 1.5 기반이 풍부합니다. 목적에 따라 병행 사용합니다.

학습 데이터는 무엇인가요?

대규모 오픈 이미지-텍스트 데이터셋인 LAION-5B를 기반으로 학습되었으며, 영어권·서구 문화 이미지 비중이 높습니다.

2026-04-19 검증 · 변경 가능