Stable Diffusion学习记录

文章目录

  • 前言
  • 电脑配置推荐
  • 环境搭建
    • 下载地址
    • 安装步骤
      • 步骤一,打开下载的秋叶整合包,路径秋叶整合包/sd-wenui-aki
      • 步骤二,打开下载好的sd-webui-aki-v4.8.7解压包
  • Stable Diffusion软件配置,插件安装,模型下载
    • Stable Diffusion Web UI文件夹作用
      • embeddings文件夹
      • extensions文件夹
      • models文件夹
    • 大模型下载
  • Stable Diffusion提示词
    • 提示词原理
      • 提示词基础
      • 符号解释
        • 权重控制
        • Lora文件触发
        • 提示词连接
    • 进阶语法
    • 提示词推荐格式
      • 画质
      • 画风
      • 反向提示词
    • prompt-all-in-one插件
  • Stable Diffusion 采样器
    • 老派采样器
    • DPM采样器
    • 新派采样器
  • 相关链接

前言

Stable Diffusion是一个开源免费能生成以假乱真的图片、有着强大可控性不能制作视频光影文字的AI软件,可以说是有必要学习的东西了,这里是基于秋叶大神整合的Stable Diffusion Web UI进行接触和学习。

电脑配置推荐

系统要求:Win10 or Win11
显卡:RTX2060以上,6GB显卡显存
内存:8GB,推荐16GB
硬盘:预留20-100GB硬盘空间

环境搭建

下载地址

这里使用秋叶aaaki整合包:链接:https://pan.baidu.com/s/1Q2k5nkPCFIWPpDOG6WJThg
提取码:3kg0

安装步骤

步骤一,打开下载的秋叶整合包,路径秋叶整合包/sd-wenui-aki

打开启动器运行依赖安装教程.docx文件
在这里插入图片描述
复制下载链接:
https://dotnet.microsoft.com/en-us/download/dotnet/thank-you/runtime-desktop-6.0.25-windows-x64-installer?cid=getdotnetcore

下载为Microsoft Windows Desktop Runtime启动器运行依赖,下载好进行安装
在这里插入图片描述

步骤二,打开下载好的sd-webui-aki-v4.8.7解压包

解压这个文件,注意解压的路径不能包含任何中文路径
解压密码:bilibili@秋葉aaaki
在这里插入图片描述
解压完成后,解压的主目录里面点击A绘世启动器.exe就能启动了。
等待加载后启动完成。
在这里插入图片描述
再点击一键启动,等待程序加载…
在这里插入图片描述
弹出以下网页界面就是启动完成了
在这里插入图片描述
在文生图输入a cat,就会生成一直一张猫的图片。
这是 anything-v5模型下生成的猫图片
在这里插入图片描述
到这里Stable Diffusion就安装完成了。

Stable Diffusion软件配置,插件安装,模型下载

Stable Diffusion Web UI文件夹作用

embeddings文件夹

embeddings是嵌入的意思,意识是一个物体映射到另外一个物体,就是一个关系的桥梁。
主要是用来存放pt格式和safetensors格式的嵌入式像量文件的,比如Easy Negative和bad hands5。

extensions文件夹

放置插件的文件夹,所有Stable Diffusion下载的插件都是放置到这个文件夹下的。

models文件夹

下载的大模型都是放置到这个文件夹下的。

大模型下载

进行civitai下载模型。
主页面选择Models
在这里插入图片描述
然后右边Filters点开,在Model Types里面选择Checkpoint
在这里插入图片描述

然后选择自己喜欢的风格模型下载,等待下载完成即可。
在这里插入图片描述
在这里插入图片描述
把下载好的safetensonrs文件放到主目录的models/stable-diffusion下面
在这里插入图片描述
刷新一下模型就处来了。
在这里插入图片描述
切换模型。

关闭掉后台程序,删掉extensions文件夹下的所有插件,为了保持干净的插件环境。

安装好中文插件后,进入设置/用户界面,选择zh-Hans(Stable),然后再需要下一个主题美化的插件lobe
在这里插入图片描述再重启一下后台程序和重新进入一下界面即可

在这里插入图片描述

Stable Diffusion提示词

提示词原理

提示词基础

1.提示词之间需要使用英文逗号分隔开
2.提示词是可以进行换行的
3.每个提示词的权重默认为1,权靠前权重越高
4.数量控制在75个单词以内

例如提示语输入,girlish,Blonde hair,Blue pupils
就是说生成一个少女,金色的头发,蓝色的眼瞳即可。尽量使用英文作为提示语,使用中文的时候AI有些提示语会无法识别出来。
在这里插入图片描述

符号解释

权重控制

()使用括号括起来的提示词权重会变成原来的1.1倍率,最多套三层
red = 1 ,(red) = 1.1 ,(((red))) = 1.331

{}符号也是添加权重的,{red} = 1.05

[]符号是减少权重的,[red] = 0.9

直接设置权重的方式可以如下
(red:1.5)
(greed:0.3)

如下我们输入
Noodles,Meat,Vegetables,Scallions,Eggs,Fish。然后对鸡蛋的权重进行不同的控制会生成如下不一样的
在这里插入图片描述

Lora文件触发

使用尖括号<>调用Lora
女孩穿着汉服 1GIRL,IN HandFu < LORA:Hanfu:0.6 >
在这里插入图片描述

提示词连接

使用_下划线进行连接
比如一个提示语Coffee Cake,Stable Diffusion会理解成咖啡和蛋糕
但是输入 Coffee_Cake会理解成咖啡蛋糕

进阶语法

[提示语:0-1数值]
FOREST ,LOTS OF TREES AHO STOHES ,[FLOWERS: 0.7]

这里一张图片在生成采样70%以后,才开始计算Flowers的采样
在这里插入图片描述
如果是使用[提示语::0-1数值]双冒号后
FOREST ,LOTS OF TREES AHO STOHES ,[FLOWERS:: 0.7]
意思是计算到70%的采样之后,不在进行Flowers的采样计算,下图
在这里插入图片描述
[提示词1:提示词2:0-1数值]
[STOHES : FLOWERS : 0.70],这句话的意思是前面70%的计算中STOHES生效, FLOWERS则只在后面的30%生效。
在这里插入图片描述

[提示语1|提示语2],则为提示语1和提示语2交替使用采样
输入1Girl,[Red|Blue] Hair,这样就生成一个红蓝交替发色的女孩了

在这里插入图片描述

提示词推荐格式

填写顺序
1,画质+画风词
2,画面主体描述
3,环境、场景、灯光、构图
4,Lora
5,负面词语

画质

画质词如下有:
[masterpiece:1.2),best qualityhighres,extremely detailed CG,perfect lighting,8k wallpaper

画风

真实系:photograph,photorealistic
插画风:lllustration,painting,paintbrush
二次元:anime, comic, game CG,
三维场景:3D,C4D render unreal engine,octane render

画风词:
Cyberpunk 赛博朋克
8bit/16bit pixel 像素风
studio ghibli 宫崎骏风格
pixel style 皮克斯风格
Chinese ink style 水墨画

反向提示词

负面词:NSFW,[worst quality:2),[low quality:2[normal quality:2],lowres, normal quality[[monochrome)),[[grayscale]],skin spots,acnes,skin blemishes, age spot,[ugly:1.331],[duplicate:1.331],[morbid:1.21),[extra legs:1.331],[fused fingers:1.5,(too many fingers:1.5](unclear eyes:1.331],lowers, bad handsmissing fingers,extra digit,bad handsmissing fingers,[llextra arms and legs]]],

上面的负面提示词为通用的,NSFW是告诉Stable Diffusion不要生成适合公共场合的图片,还有就是告诉SD不要生成角色缺手臂,缺一条腿的图片

在这里插入图片描述
这些直接复制到下面的反向提示词即可

prompt-all-in-one插件

下载链接,https://github.com/Physton/sd-webui-prompt-all-in-one

安装这个插件后在红框处输入想要的提示词中文,按一下回车就可以自动生成了英文输入此时写入正向了。
在这里插入图片描述
在这里插入图片描述
对英文不太好的朋友非常的友好。

在这里插入图片描述
而下面又可以找到不同的人物,装饰,服饰等词语。

Stable Diffusion 采样器

采样器主要划分成三大类型
1.老派采样器
2.DPM采样器
3.新派采样器

采样器名单如下
在这里插入图片描述
上面有很对采样器都不好用,而有很多采样器也有升级版本后被淘汰的。
我们只需要使用一些好用采用的采样器即可。

老派采样器

DDIM和PLMS是SD最早的采样器算法,不再进行使用
Euler和Euler a渲染画面简单直接,不容易出错,Eluer后面的a代表这收敛的意思
Heun 画质更好,但速度慢一倍
LMS和MSKarras 线性多步法,速度和Euler差不多,实测没Euler稳定,容易出色块

老派采样器中仅仅使用
Euler,Euler a,Heun

DPM采样器

在这里插入图片描述
DPM fast很不稳定,DPM adaptive算法是时间不可控。
DPM二代算法消耗高
因为Karras结尾的是优化算法,Heun是更清晰化的算法,a是收敛化,2S和2M的区别是2M的算法增加了色块直接的通讯,2M是2S的进阶版本。

剩下推荐的算法为如下
在这里插入图片描述

新派采样器

在这里插入图片描述
在这里插入图片描述

相关链接

CGMI.Com:https://cgmi.com/
ChatGPT-4白给:https://cgmi.com/archives/677
模型下载C站:https://civitai.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/597011.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

四川易点慧电子商务抖音小店:潜力无限的新零售风口

在当今数字化浪潮中&#xff0c;电子商务已经成为推动经济发展的重要引擎。四川易点慧电子商务有限公司凭借其敏锐的市场洞察力和创新精神&#xff0c;成功在抖音小店这一新兴平台上开辟出一片新天地。本文将探讨四川易点慧电子商务抖音小店的潜力及其在新零售领域的影响力。 一…

C#知识|如何在WinForm窗体中实现分割线绘制?

哈喽&#xff0c;你好啊&#xff0c;我是雷工&#xff01; 在上位机UI设计中经常会用到分割线&#xff0c;用来分割界面区域。 像在KingSCADA、杰控、昆仑通态、WinCC、组态王、力控、易控等组态软件中非常简单&#xff0c;有现成的划线操作&#xff0c;选中相关工具直接绘制即…

Python接口自动化测试之【测试函数、测试类/测试方法的封装】

前言 在pythonpytest 接口自动化系列中&#xff0c;我之前的文章基本都没有将代码进行封装&#xff0c;但实际编写自动化测试脚本中&#xff0c;我们都需要将测试代码进行封装&#xff0c;才能被测试框架识别执行。 例如单个接口的请求代码如下&#xff1a; import requests …

高效转化,智能私信软件策略揭秘

在数字营销的浪潮中&#xff0c;智能私信软件策略正成为提升转化率的重要工具。这种软件以其个性化、自动化的特点&#xff0c;正在重新定义与客户的互动方式&#xff0c;让企业能够更加高效地吸引并留住潜在客户。 智能私信软件的核心在于其高度的定制化和人性化设计。通过大数…

【LLama】Llama3 的本地部署与lora微调(基于xturn)

系列课程代码文档&#xff08;前2节课可跳过&#xff09;&#xff1a;https://github.com/SmartFlowAI/Llama3-Tutorial 课程视频&#xff1a;https://space.bilibili.com/3546636263360696/channel/series XTuner &#xff1a;https://github.com/InternLM/xtuner/blob/main/R…

[C++]VS2022配置cplex12.8过程中出现ext未声明标识符语法错误:标识符“ImplClass“

这个时候&#xff0c;主要的是看报错&#xff0c;根据报错&#xff0c;去网上寻找解决办法。因为这个时候&#xff0c;代码可能并没有任何错误&#xff0c;只不过你是VS2022&#xff0c;老师是VS2017或者其他版本。不同的版本之间代码运行问题&#xff0c;如果你换成cplex12.10…

全网详细的PostgreSQL数据库详细的安装步骤教学

安装 PostgreSQL 数据库的步骤因操作系统的不同而有所差异。以下是在 Windows、Linux 和 macOS 上安装 PostgreSQL 的详细步骤&#xff1a; Windows 上安装 PostgreSQL 下载安装程序&#xff1a; 访问 PostgreSQL 官方网站&#xff08;https://www.postgresql.org/&#xff09…

Linux服务器常用巡检命令

在Linux服务器上进行常规巡检是确保服务器稳定性和安全性的重要措施之一。以下是一些常用的巡检命令和技巧&#xff1a; 1. 查看系统信息 1.1 系统信息显示 命令&#xff1a;uname -a ​​​​ [rootlinux100 ~]# uname -a Linux linux100 4.15.0-70-generic #79-Ubuntu SMP…

激发创新活力,泸州老窖锻造人才“铁军”(内附长江酒道短评)

执笔 | 姜 姜 编辑 | 古利特 刚刚站上300亿元新台阶&#xff0c;泸州老窖再次传来喜讯。 <<<左右滑动查看更多>>> 4月28日&#xff0c;四川省庆祝“五一”国际劳动节大会在成都召开。泸州老窖股份有限公司工业4.0项目秘书长赵丙坤、泸州老窖酿酒有限责任公…

Leetcode—387. 字符串中的第一个唯一字符【简单】

2024每日刷题&#xff08;127&#xff09; Leetcode—387. 字符串中的第一个唯一字符 实现代码 class Solution { public:int firstUniqChar(string s) {int count[26] {0};for(char c: s) {count[c - a];}for(int i 0; i < s.length(); i) {if(count[s[i] - a] 1) {re…

Partisia Blockchain 生态zk跨链DEX上线,加密资产将无缝转移

在 5 月 1 日&#xff0c;由 Partisia Blockchain 与 zkCross 创建合作推出的 Partisia zkCrossDEX 在 Partisia Blockchain 生态正式上线。Partisia zkCrossDEX 是 Partisia Blockchain 上重要的互操作枢纽&#xff0c;其融合了 zkCross 的 zk 技术跨链互操作方案&#xff0c;…

【简单介绍下7-Zip】

&#x1f3a5;博主&#xff1a;程序员不想YY啊 &#x1f4ab;CSDN优质创作者&#xff0c;CSDN实力新星&#xff0c;CSDN博客专家 &#x1f917;点赞&#x1f388;收藏⭐再看&#x1f4ab;养成习惯 ✨希望本文对您有所裨益&#xff0c;如有不足之处&#xff0c;欢迎在评论区提出…

分享几个副业,一天搞100~200不成问题,一不小心收益比你主业还多

每次家庭聚会&#xff0c;总是那些老掉牙的话题在耳边萦绕&#xff1a;“孩子&#xff0c;你工资多少啊&#xff1f;买车买房了吗&#xff1f;”仿佛只有按部就班地上班、结婚生子&#xff0c;才是人生的唯一出路。 然而&#xff0c;在这个充满机遇的时代&#xff0c;谁说“不上…

【go项目01_学习记录03】

学习记录 1 路由http.ServeMux1.1 查看HandleFunc方法源码1.2 查看ListenAndServe方法源码1.3 重构&#xff1a;使用自定义的 ServeMux1.4 http.ServeMux 的局限性1.4.1 URI 路径参数1.4.2 请求方法过滤1.4.3 不支持路由命名 1.5 http.ServeMux 的优缺点 1 路由http.ServeMux …

Docker重启容器失败

Bug描述 [rootVM-12-15-centos ~]# docker restart ca1008fbdf25 Error response from daemon: Cannot restart container ca1008fbdf25: driver failed programming external connectivity on endpoint nginx_java (aded2fc7cbfa784b2e6a39e08d3ae2e7d00c13af88879a8fe7c5007…

Python安装以及环境配置

目录 一、下载安装包二级目录三级目录 一、下载安装包 方式网址Python官网python.org镜像下载地址Download pythonpycharmDownload PyCharm https://blog.csdn.net/sun80760/article/details/135256627 二级目录 三级目录

TypeScript学习日志-第二十天(模块解析)

模块解析 一、ES6之前的模块规范 前端模块化规范是有很多的&#xff0c;在es6模块化规范之前分别有一下的模块化规范 一、Commonjs 这是 NodeJs 里面的模块化规范 // 导入 require("xxx"); require("../xxx.js"); // 导出 exports.xxxxxx function() …

Linux学习笔记(3)---- Debian测试网速指令及查看是否千兆网卡

测试网速指令 在Debian系统中&#xff0c;测网速的指令主要有以下几种方法&#xff1a; 使用speedtest-cli工具&#xff1a; speedtest-cli是一个常用的网络速度测试工具&#xff0c;可以通过命令行进行安装和运行。首先&#xff0c;需要安装speedtest-cli&#xff1a; sud…

(Arxiv,2024)Mind the Modality Gap:通过跨模态对齐建立遥感视觉语言模型

文章目录 相关资料摘要引言相关工作对比语言图像预训练遥感域专用 CLIP 模型遥感中的多模态 CLIP 启发模型 方法模型算法输入阶段&#xff1a;输出阶段&#xff1a;步骤说明&#xff1a; 第一阶段&#xff1a;通过权重插值修补CLIP将遥感图像模态与自然图像和文本对齐 实验 相关…

【微信小程序开发】程序开发(微信登录前后端流程)

简单开发 程序开发微信小程序的目录结构开发简单入门 微信登录流程小程序发布 程序开发 微信小程序的目录结构 一个小程序主体部分由三个文件组成&#xff08;必须放在项目的根目录&#xff09; 文件作用app.js小程序逻辑app.json小程序公共配置app.wxss小程序公共样式表 小…