Stable Diffusion

作者:mpoll.top 发布时间:2026-04-13 0 次浏览

产品概述

Stable Diffusion 是由 Stability AI 开发的开源 AI 图像生成模型，于 2022 年 8 月首次发布。作为首个向公众开放的高质量文生图模型，Stable Diffusion 彻底改变了 AI 艺术创作领域，让每个人都能在自己的设备上生成精美图像。

---

基本信息

| 项目 | 详情 |

|------|------|

| 开发商 | Stability AI |

| 首次发布 | 2022 年 8 月 |

| 模型类型 | 潜在扩散模型 (Latent Diffusion Model) |

| 开源协议 | CreativeML Open RAIL-M |

| 官方网站 | https://stability.ai/ |

| GitHub | https://github.com/Stability-AI |

---

核心功能

文生图 (Text-to-Image)

输入文字描述，生成对应图像：

提示词示例：
"A majestic castle on a hill at sunset, 
fantasy art style, highly detailed, 
golden hour lighting, 8k resolution"

图生图 (Image-to-Image)

基于现有图像进行创作和修改：

风格转换
内容编辑
细节增强

图像修复 (Inpainting)

智能填充图像中的缺失区域：

移除不需要的物体
修复损坏部分
扩展图像边界

图像扩展 (Outpainting)

将图像扩展到原始边界之外：

创建更宽的场景
添加上下文环境
无缝衔接

技术特点

潜在扩散模型

Stable Diffusion 采用创新的潜在空间扩散技术：

┌─────────────────────────────────────────┐
│           文本编码器                      │
│  (CLIP Text Encoder)                    │
└─────────────┬───────────────────────────┘
              ↓
┌─────────────────────────────────────────┐
│          潜在空间扩散                     │
│  (Latent Diffusion Process)             │
│  - 在压缩的潜在空间中操作                │
│  - 大幅降低计算需求                      │
└─────────────┬───────────────────────────┘
              ↓
┌─────────────────────────────────────────┐
│           图像解码器                      │
│  (VAE Decoder)                          │
└─────────────┬───────────────────────────┘
              ↓
┌─────────────────────────────────────────┐
│           输出图像                        │
│  (512x512 或更高分辨率)                   │
└─────────────────────────────────────────┘

开源优势

完全开源：模型权重和代码公开
本地运行：可在个人电脑上运行
社区驱动：全球开发者共同改进
可定制：支持微调和扩展

使用方式

在线服务

DreamStudio (官方)：

URL: https://dreamstudio.ai/
免费额度 + 付费使用
最新版本模型
简单易用的界面

本地部署

硬件要求：

GPU: NVIDIA RTX 3060 或更高（推荐）
显存：8GB 最低，12GB+ 推荐
内存：16GB+
存储：50GB+ 可用空间

流行工具：

Automatic1111 WebUI - 最流行的本地界面
ComfyUI - 节点式工作流
Fooocus - 简化版，易于上手

第三方集成

Photoshop 插件
Blender 插件
Discord 机器人
API 服务

版本演进

版本 | 发布时间 | 主要改进

|------|----------|----------|

SD 1.4 | 2022.08 | 初始公开发布

SD 1.5 | 2022.10 | 质量提升，社区广泛采用

SD 2.0 | 2022.11 | 支持 768px，新文本编码器

SD 2.1 | 2022.12 | 改进的人体生成

SDXL 1.0 | 2023.07 | 重大升级，1024px，更好质量

SDXL Turbo | 2023.11 | 实时生成，1 步出图

SD 3 | 2024.06 | 多模态，更好文字渲染

应用场景

艺术创作

概念艺术
插画设计
风格探索

商业设计

广告素材
产品可视化
品牌设计

游戏开发

角色设计
场景概念
贴图生成

教育科研

教学素材
科学可视化
研究演示

提示词技巧

基本结构

[主体描述], [环境/背景], [艺术风格], [质量修饰词], [技术参数]

示例

正面提示词：
portrait of a young woman, long flowing hair, 
ethereal lighting, fantasy art style, 
highly detailed, sharp focus, 8k, masterpiece

负面提示词：
ugly, blurry, low quality, deformed, 
bad anatomy, extra limbs, watermark

常用修饰词

质量：masterpiece, best quality, high resolution, 8k
风格：oil painting, watercolor, digital art, photograph
光照：cinematic lighting, golden hour, studio lighting
构图：rule of thirds, centered, wide angle

社区生态

模型资源

Civitai - 最大的模型分享平台
Hugging Face - 官方模型仓库
Tensor.Art - 在线模型库

学习资源

官方文档：https://stability.ai/learn
Reddit：r/StableDiffusion (50 万 + 成员)
Discord：Stability AI 官方社区

衍生项目

ControlNet - 精确控制构图
LoRA - 轻量级微调
AnimateDiff - 视频生成
IP-Adapter - 图像提示

优缺点分析

优点 ✅

开源免费，可本地运行
社区活跃，资源丰富
高度可定制
隐私保护（本地运行）
持续更新和改进

缺点 ❌

需要一定学习成本
本地运行需要较好硬件
生成结果需要调试
官方支持有限
版本众多，选择困难

定价信息

免费选项

本地部署：完全免费（自备硬件）
DreamStudio：25 次免费生成

付费选项

DreamStudio：

$10 = 约 1000 次生成
按需购买，无订阅

Stability AI API：

按使用量计费
企业定制方案

总结

Stable Diffusion 作为开源 AI 图像生成的先驱， democratize 了 AI 艺术创作。无论是专业设计师还是业余爱好者，都能利用这个强大的工具实现创意。

适合人群：

数字艺术家和设计师
游戏和影视概念艺术家
内容创作者
AI 技术爱好者
预算有限的创作者

入门建议：

先试用 DreamStudio 在线版本
学习基本提示词技巧
如有合适硬件，尝试本地部署
加入社区，学习最佳实践

本文属于「AI 导航」系列专题
最后更新：2026 年 4 月

本文标签：AI 导航 , AI 生图 , 图像生成 , 开源

上一篇: Gemini Ultra Google 旗舰模型

下一篇: [AI 开源] Meta 开源 Llama 3.1：4050 亿参数模型开放使用

关于作者

OpenClaw技术团队

专注AI Agent技术分享

首页

AI导航

AI技术

AI资讯

AI模型