Stable Diffusion WebUI 入门教程,2026 本地部署文生图从安装到出第一张图
Stable Diffusion WebUI 入门教程,2026 本地部署文生图从安装到出第一张图
最近想入坑 AI 文生图的朋友越来越多,Midjourney 虽然好用但要科学上网加月费订阅,云端服务又总担心隐私问题。Stable Diffusion 走的是另一条路,模型权重开源,可以完全在自己的电脑上跑,出多少图都不花一分钱。WebUI 是目前最主流的本地界面,本文从零开始,带你把整套环境搭起来,跑出第一张属于自己的 AI 图。
Stable Diffusion 到底是什么

Stable Diffusion 是一个开源的文本到图像生成模型,核心思想是把噪声逐步去除还原成清晰图像,通过文字描述引导这个过程。它由 Stability AI 在 2022 年开源,经过多次迭代到了 SD1.5、SDXL,以及后续的 SD 3 系列。每个版本在画质、风格、提示词理解上都有进步,但消耗的显存也越来越大。
它和 Midjourney 最大的差别就在于开源加本地化。Midjourney 是闭源服务,只能通过 Discord 或者网页使用;Stable Diffusion 的模型可以下载到本地,配合 WebUI 这种界面就能完全离线运行,生成多少图都不收费,而且可以加载社区训练的各种风格模型。
选择你的部署方式

入门 SD 主要有三种路径。第一种是云端在线服务,比如 RunDiffusion、ThinkDiffusion,直接付费用浏览器开就行,适合不想折腾的人。第二种是本地原版部署,从 GitHub 拉 AUTOMATIC1111 仓库,手动装 Python 环境和依赖,适合愿意搞清楚原理的技术党。第三种是国内整合包,最有名的是秋叶大佬的整合包,把所有依赖打包好双击启动,对中文用户最友好。
本文以秋叶整合包为例讲入门流程。如果你想完整理解每一个组件,等熟悉之后再切到 AUTOMATIC1111 原版重新部署一次,这样最稳。
本地配置要求

跑 SD 的硬件门槛主要看显卡。NVIDIA 显卡是首选,因为 CUDA 生态最完善。SD1.5 大概需要 4GB 显存能勉强跑,出图慢但能用。SDXL 推荐 8GB 起步,12GB 以上才比较舒服。AMD 显卡也能跑,但需要额外配置 ROCm 或者 DirectML,稳定性和速度都打折扣。
苹果芯片 Mac 可以用 MPS 加速,M 系列芯片速度还可以,M3 Pro 以上比较流畅。CPU 跑也行,但单张图可能要等几分钟,纯属体验性质。内存建议 16GB 起步,硬盘 SSD 留出至少 50GB 给模型文件。
下载 WebUI 与基础模型
到秋叶大佬整合包的发布页(可以搜微信公众号或者 B 站他的最新置顶视频)找到当前最新版本,通常是几个 GB 的压缩包。下载完解压到一个全英文路径的目录里,中文路径容易引发各种诡异 bug。
整合包里通常自带一两个基础模型,但官方权重需要单独从 Hugging Face 或者 LiblibAI 下载。常用的入门模型包括 SDXL Base 1.0、ChilloutMix(写实人像)、DreamShaper(通用)等。下载完成后把 safetensors 文件放到 models/Stable-diffusion 目录下即可。
第一次启动与界面介绍
双击启动器,首次启动会自动检查环境并下载缺失的组件,可能要等几分钟。看到提示 Running on local URL: http://127.0.0.1:7860 就成功了,浏览器会自动打开。
界面顶部是模型切换下拉框,可以快速切到任何已下载的模型。中间是核心的 txt2img 选项卡,左侧填写提示词和反向提示词,右侧调整参数。下方是 img2img(图生图)、Extras(放大)、Train(训练)等高级标签。
第一次用建议把界面切换到中文。在 Settings 里找到 User interface 部分,Localization 选择 zh-CN,保存重启即可。
写下你的第一个 Prompt
正向提示词描述你想要的画面,反向提示词描述你不要的元素。一个比较稳的入门写法是:
正向:a young woman with long black hair, wearing a white dress, standing in a sunny garden, soft lighting, detailed face, high quality, masterpiece
反向:lowres, bad anatomy, blurry, ugly, watermark, text, deformed hands
参数方面,采样方法选 DPM++ 2M Karras 或者 Euler a,步数 20 到 30,CFG Scale 7 左右,尺寸 512x768(SD1.5)或者 1024x1024(SDXL)。点击 Generate 等几秒,第一张图就出来了。
不想折腾本地也有别的玩法
部署本地 SD 的好处是免费且无限制,但配置不够的电脑跑起来很煎熬,SDXL 单张图等几十秒是常态。如果你只是偶尔想出几张图,或者用手机随时画两笔,值得试试国产的移动端 AI 画图 App。
比如 灵图,这是一款在 iOS 国区 App Store 上架的 AI 画图设计 App。它聚合了 Midjourney 风格的氛围引擎、Flux 风格的写实引擎、Nano Banana 风格的快速引擎,中文界面、本地化提示词,搜索灵图就能下载,不用 VPN。出图风格的多样性比单一开源模型要丰富,而且不用占电脑硬盘。本地 SD 适合深度玩家做工作流,灵图适合随手出图,两边搭配着用其实最省力。
常见报错处理
显存不足是最常见的报错,提示词或者图片尺寸超出显卡承受。解决方法是降低分辨率,或者在启动参数里加 medvram、lowvram 这类节省显存的选项。
模型加载失败一般是因为文件路径有中文或空格,或者下载过程中文件损坏。先检查路径,再用 sha256 比对官方发布的校验码。
启动闪退多半是 Python 环境冲突,如果你电脑里装过多个 Python 版本,整合包可能错认到旧版。最稳的办法是用整合包自带的启动器,不要手动改环境变量。
学好 SD 的进阶路线
入门跑通后,真正有意思的是 LoRA、ControlNet、Inpaint 这些扩展。LoRA 是小型微调模型,能让 SD 学会特定的画风或角色;ControlNet 可以让你控制人物姿势、构图、线稿;Inpaint 用来局部重绘。这三套玩明白基本就到中阶水平了。
之后可以接触 ComfyUI,它是节点式的工作流界面,比 WebUI 灵活很多,适合搭建复杂的批量出图流程。社区里还有 Forge、Fooocus 等更轻量的分支,各有适用场景。
常见问题 FAQ
Stable Diffusion 完全免费吗
模型权重和 WebUI 软件本身都是开源免费的,本地部署后出多少图都不花钱。只有电费和折旧成本。注意第三方训练的某些模型有自己的协议,商用前要看清 License。
一定要 NVIDIA 显卡吗
NVIDIA 是最推荐的,生态最完善。AMD 显卡可以通过 ROCm 在 Linux 上跑,Windows 上可以用 DirectML,但速度和稳定性都差一截。苹果芯片 Mac 可以用,M 系列芯片速度尚可。
显存多少够用
SD1.5 最低 4GB 能跑,但建议 6GB 起。SDXL 推荐 8GB 起步,12GB 以上比较舒服。想玩 ControlNet 和 LoRA 叠加,16GB 才不容易报显存不足。
WebUI 和 ComfyUI 怎么选
新手优先 WebUI,界面友好,网上教程多。熟练之后可以学 ComfyUI 搞工作流,节点化更灵活但学习曲线陡峭。两者并不冲突,可以同时装。
出图慢有什么办法加速
降低分辨率和步数是最直接的。开启 xformers 或 SDP 注意力加速能省时间,启用 Token Merging 可以再砍一刀。换更大显存的显卡是终极方案。
📝 本文来自抖文 www.douwen.me ,转载请保留出处。
原文链接:https://www.douwen.me/archives/1249/
💬 评论 (8)
观点很到位
FAQ 部分特别实用
解决了我一直没搞清楚的问题
案例很贴近实际
作者花了很多心思
结构清晰看着不累
学到了
已转发给同事