Stable Diffusion教程——常用插件安装与测试(一)

前言

随着Stable Diffusion不断演进,越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程,但它们通常零散分布,逐个学习和查找非常耗时,使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。

prompt-all-in-one ——提示词翻译补全

插件地址:https://github.com/Physton/sd-webui-prompt-all-in-one

prompt-all-in-one提示词翻译补全是一个功能全面的工具,旨在帮助英文能力有限的用户快速克服语言障碍。其主要功能包括:

  1. 中文输入自动转英文:自动将中文输入转换为英文,方便用户在Stable Diffusion中使用英文提示词。

  2. 自动保存使用描述词:自动保存用户使用过的描述词,方便用户查阅和再次使用。

  3. 描述词历史记录:记录用户使用过的描述词历史,以便用户随时查看和管理。

  4. 快速修改权重:提供快速修改描述词权重的功能,帮助用户调整描述词对生成图像的影响程度。

  5. 收藏常用描述词:允许用户收藏常用的描述词,方便以后再次使用。

  6. 翻译接口多种选择:提供多种翻译接口选择,满足用户不同的翻译需求。

  7. 一键粘贴删除描述词:提供一键粘贴和删除描述词的功能,简化用户操作流程,提高使用效率。

在这里插入图片描述

SixGod——提示词插件

插件地址:https://github.com/thisjam/sd-webui-oldsix-prompt

SixGod提示词插件旨在帮助用户快速生成逼真且富有创意的图像。其主要功能包括:

  1. 清空正向提示词和清空负向提示词:方便用户快速清除已输入的正向和负向提示词。

  2. 提示词起手式:包含人物、服饰、人物发型等各个维度的提示词,帮助用户快速启动创作过程。

  3. 一键清除正向提示词与负向提示词:提供一键清除所有正向和负向提示词的功能,方便用户重新开始或调整创作方向。

  4. 随机灵感关键词:提供随机生成灵感关键词的功能,帮助用户拓展创作思路。

  5. 提示词分类组合随机:随机组合不同类别的提示词,产生多样化的创作灵感。

  6. 动态随机语法:提供动态生成随机语法的功能,进一步丰富创作内容。

在这里插入图片描述

After Detailer——人脸及手部修复插件

插件地址:https://github.com/Bing-su/adetailer
在使用SD绘图的时候,默认的分辨率大小是512*512,这样设置的好处是出图效率高。但是如果涉及到人全身照的时候,经常会出现一个问题:脸部崩。主要原因是在一个比较低的像素画布上,绘制一个全身图,脸部能分配到的像素不够了。
After Detailer是一款功能强大的图像编辑工具,专为修复和编辑图像而设计。它能够自动检测并修复图像中的瑕疵,无论是2D图像还是真实的人脸和手部图像。该工具能够识别面部、人物或手部,并自动为其创建遮罩(mask)并进行重绘。用户可以通过调整参数来改变识别的对象以及识别区域的大小和位置等,以获得更精确的编辑效果。
在这里插入图片描述

Tagger——提示词反推

插件地址:https://github.com/pythongosssComfyUI-WD14-Tagger?tab=readme-ov-file
当得到一张由AI绘制的精美图片,但却不知道生成这幅图片所用的提示词,导致在尝试实践时无从下手。在这种情况下,我们需要想办法获取这些提示词。Tagger是一些可以快速获得提示词的方法。
Tagger提示词反推是一项功能强大的工具,能够从任意图片中提取关键提示词。它有助于用户理解图像的内容,创作创意图像,以及分析图像数据。通过识别和提取图像中的关键特征和元素,Tagger提示词反推可以为用户提供灵感和指导,帮助他们更好地理解图像内容,并在创作过程中获得更多的创意和想法。

Inpaint Anything——局部重绘

插件地址:https://github.com/Uminosachi/sd-webui-inpaint-anything.git
Inpaint Anything 是一款功能强大的图像编辑工具,能够轻松删除和替换图像中的任何元素。它利用人工智能技术自动识别和修复图像中的瑕疵,无需手动创建遮罩。该工具可快速删除图像中不需要的对象或缺陷,修复损坏或受损的图像区域,替换图像中的对象或背景,并创造出各种创意图像效果。

1.安装与下载模型

安装插件并重启之后,可以在导航栏面板中看到Inpaint Anything组件,此时还需要安装SAM模型。SAM 提供三种模型,显存高的下载 sam_vit_h,识别度更精准。显存 8G 左右的下载 sam_vit_l,显存低于 8G 的下载 sam_vit_b。选择对应模型后,点击“下载模型”,下载后的模型会存放在 Inpaint Anything 插件目录中的 models 文件夹内。
在这里插入图片描述
其实IA功能很多,但又比较简单。你可以把插件划分成三个区域。
在这里插入图片描述
首先是分离目标以及调整区,位于左上方。

  1. 将要编辑的图像拖放到输入图像区域。
  2. 点击按钮运行“Segment Anything”,模型将自动识别参考图,并进行元素分离。
  3. 如果图像识别难度较高,可以选择勾选动漫模式,以提高识别度,但这可能会降低蒙版的分离质量。
  4. 填充选项勾选后,你可以修改参考图的模式,通常默认设置即可。

语义分割显示区和选择被分离的蒙版区位于编辑界面的右侧。

  1. 等待几秒钟后,右上方会显示根据模型分离出的不同区块。你可以使用鼠标选择需要的蒙版区域。(由于已经进行了分离,所以只需单击需要重新绘制的区域即可。)
  2. 将鼠标悬停在图像上方,按住 S 键可进入全屏模式,按下 R 键可重置缩放,这有助于更精细地处理图像。
  3. 选择完毕后,点击“创建遮罩”按钮。
  4. 下面两个复选框的功能很容易理解:一个用于反选,另一个用于确定是否包含黑色区域(可能是无法识别的区域)。
  5. 然后,遮罩将以高亮显示的方式出现。
  6. “展开蒙版区域”按钮用于扩充蒙版的大小,这是之前 Segment 工具中也有的功能,可以帮助你向外扩展蒙版,直到满意为止。
  7. 旁边的按钮用于减去手动绘制的区域,以便更精确地定义蒙版。
  8. 最后的按钮用于将手动绘制的区域添加至蒙版中,整个过程相当直观易懂。

在这里插入图片描述

Ultimate SD upscale——图片放大

插件地址:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111.git
Ultimate SD Upscale 是一款功能强大的图像超分辨率工具,它能够将低分辨率的图像提升至高分辨率,并同时减少图像中的噪点和模糊效果。这一工具采用了基于深度学习的超分辨率模型,因此能够提供较高水准的图像处理准确性。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/393282.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

搭建智能调度系统:同城代驾小程序的开发教学

当下,同城代驾服务越来越受到人们的青睐。为了满足市场需求,许多企业开始开发智能调度系统,以提高服务效率和用户体验。本文将介绍如何搭建一个智能调度系统,并以同城代驾小程序的开发为例进行详细教学。 第一步:需求…

科技守护大唐遗宝,预防保护传承千年

​ 一、“大唐遗宝——何家村窖藏出土文物展” 陕西历史博物馆的“唐朝遗宝——何家村窖藏出土文物展”算得上是博物馆展览的典范。展览不仅在于展现了数量之多、等级之高、种类之全,更在于对唐朝历史文化的深入揭露。 走入大唐财产展厅,好像穿越千年前…

The Captainz NFT 概览与数据分析

作者:stellafootprint.network 编译:cicifootprint.network 数据源:The Captainz NFT Collection Dashboard The Captainz 是 Memeland 的旗舰系列,由 9,999 个实用性极强的 PFP 组成。持有者在 Memeland 宇宙中展开了一场神…

【Python】测量WAV文件播放时长

问题 windows播放WAV音频文件,一般使用API函数,如PlaySound。实际使用发现,从调用PlaySound到实际开始播放存在200ms以上的延时,在游戏编程中音效实时性是个需要解决的问题。 本文主要讨论,windows播放WAV文件的衍生…

2024 VNCTF----misc---sqlshark sql盲注+流量分析

流量分析 wireshark 可以看到很多 any/**/Or/**/(iF(((((Ord(sUbstr((sElect(grOup_cOncat(password))frOm(users)) frOm 1 fOr 1))))in(80))),1,0))# P any/**/Or/**/(iF(((((Ord(sUbstr((sElect(grOup_cOncat(password))frOm(users)) frOm 1 fOr 1))))in(104))),1,0))#…

基于springboot智慧外贸平台源码和论文

网络的广泛应用给生活带来了十分的便利。所以把智慧外贸管理与现在网络相结合,利用java技术建设智慧外贸平台,实现智慧外贸的信息化。则对于进一步提高智慧外贸管理发展,丰富智慧外贸管理经验能起到不少的促进作用。 智慧外贸平台能够通过互…

Vue3

目录 一、 Vue3简介 1. 性能的提升 2. 源码的升级 3. 拥抱TypeScript 4. 新的特性 二、 创建Vue3工程 1. 基于 vue-cli 创建 2. 基于 vite 创建(推荐) 3. 一个简单的效果 三、Vue3核心语法 1. OptionsAPI 与 CompositionAPI (1)Options API …

前端vue金额用逗号分隔

实现效果 代码 template部分 <el-input v-model"state.val"></el-input><div>{{ priceFor(state.val) }}</div> js部分 const state reactive({ val: });const priceFor (val)> {if(!val){return }else if(val.length<4){return…

IP定位技术助力网络安全保护

随着网络技术的不断发展&#xff0c;网络安全问题日益凸显&#xff0c;如何有效保护网络安全已成为亟待解决的问题。IP定位技术作为一种前沿的网络安全防护手段&#xff0c;正在逐步成为网络安全保护的重要工具。 首先&#xff0c;我们要明确什么是IP定位技术。IP定位技术是一…

Instagram 账号被封如何申诉?ins账号解封经验分享

不知道各位在玩转海外社媒平台时有没有遇到过Instagram账号异常的情况&#xff0c;比如会出现账号受限、帖子发不出去、账号被封号等情况?Instagram账号如果被封不用马上弃用&#xff0c;我们可以先尝试一下申诉&#xff0c;看看能不能把账号解封。所以今天将会出一篇Instagra…

OpenAI视频生成模型Sora背后的技术及其深远的影响

前言 Sora的视频生成技术在保真度、长度、稳定性、一致性、分辨率和文字理解等方面都达到了当前最优水平。其核心技术包括使用视觉块编码将不同格式的视频统一编码成Transformer可训练的嵌入向量&#xff0c;以及类似于扩散过程的UNet方法进行降维和升维的加噪与去噪操作。通过…

19.Qt 组合框的实现和应用

目录 前言&#xff1a; 技能&#xff1a; 内容&#xff1a; 1. 界面 2.槽 3.样式表 参考&#xff1a; 前言&#xff1a; 学习QCombox控件的使用 技能&#xff1a; 简单实现组合框效果 内容&#xff1a; 1. 界面 在ui编辑界面找到input widget里面的comboBox&#xff…

Cesium 问题——加载 gltf 格式的模型之后太小,如何让相机视角拉近

文章目录 问题分析问题 刚加载的模型太小,如何拉近视角放大 分析 在这里有两种方式进行拉近视角, 一种是点击复位进行视角拉近一种是刚加载就直接拉近视角// 模型三加载 this.damModel = new Cesium.Entity({name: "gltf模型",position:</

【HarmonyOS】鸿蒙开发之TextInput组件——第3.3章

textInput属性 代码展示 Column(){Row(){Text("默认类型").margin({right:10})TextInput().width(60%).height(45)}.margin({bottom:10})Row(){Text("自定义样式").margin({right:10})TextInput().width(60%).height(45).fontColor(Color.Brown).enterKe…

LabVIEW轨道交通列车牵引制动试验平台

LabVIEW轨道交通列车牵引制动试验平台 概述 面对城市轨道交通领域对于高效、准确牵引制动系统的迫切需求&#xff0c;开发了一套基于LabVIEW软件与硬件相结合的试验平台。该平台模拟列车的牵引、制动等工况&#xff0c;通过高精度的数据采集与实时图形化展示&#xff0c;提升…

网页文档编写

工具 sphinx 推荐主题 &#xff1a;html_theme "sphinx_rtd_theme" html_theme_options {navigation_depth: -1, }效果如下图 参考文章 [ sphinx的安装与使用 — 野火]sphinx文档规范与模版 文档 (ebf-contribute-guide.readthedocs.io) Sphinx 文档目录 — Sphi…

反转一个单链表

反转一个单链表 题意&#xff1a;反转一个单链表。 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2->1->NULL 思路 需要虚拟节点么&#xff1f; 答&#xff1a;不需要&#xff0c;因为没有删除节点&#xff0c;只是改变了节点的指向。 遍…

OPENAI SORA一键60秒视频,沃卡AI全功能AI网站将及时更新支持

大家可以通过收藏网页www.woka.chat 直接进行访问&#xff0c;也可通过关注新公众号实现微信端使用~ 注册赠送大量额度&#xff0c;可用于网站全部功能&#xff08;问答和绘画&#xff09;&#xff01;每天签到也可领取充足使用额度&#xff01; 废话不多说&#xff0c;我们现…

【Git】Java 使用 JGit 创建 Git 代码仓库

引 JGit 是一个用 Java 实现的 Git 版本控制工具。它是由 EGit 项目发展而来的&#xff0c;EGit 是 Eclipse 基金会的一个开源项目&#xff0c;旨在为 Eclipse IDE 提供 Git 支持。 JGit 提供了一个完整的 Git 实现&#xff0c;包括存储库、索引、对象数据库、命令行客户端和…

基于Java+SpringBoot+vue+elementui 实现即时通讯管理系统

目录 系统简介效果图源码结构试用地址源码下载地址技术交流 博主介绍&#xff1a; 计算机科班人&#xff0c;全栈工程师&#xff0c;掌握C、C#、Java、Python、Android等主流编程语言&#xff0c;同时也熟练掌握mysql、oracle、sqlserver等主流数据库&#xff0c;能够为大家提供…