探索【Stable-Diffusion WEBUI】的图片超分辨插件:StableSR

文章目录

  • (零)前言
  • (一)图片放大
  • (二)图片超分辨率放大脚本插件(StableSR)
    • (2.1)下载组件
    • (2.2)使用
    • (2.3)实例对比(放大)
    • (2.4)实例对比(修复)
  • (三)总结

(零)前言

本篇主要介绍WEBUI的插件:StableSR:图片超分辨放大的使用,以及和WEB UI附加功能图片放大功能的对比。
更多不断丰富的内容参考:🔗《继续Stable-Diffusion WEBUI方方面面研究(内容索引)》

(一)图片放大

之前通过《探索【Stable-Diffusion WEBUI】的附加功能:图片缩放&抠图》了解到,由于Stable-Diffusion并不适合生成很大的图片,所以我们可以先生成适合的正常尺寸图,再通过附加功能页的放大功能,放大图片。

同时介绍了好些缩放模型,其中有些效果挺好的。

特别是LDSR(潜在扩散超分辨率模型)照片表现非常好,不仅脑补的细节多,还加入了很多噪点显得真实。
但模型体积巨大+速度超级慢。放大一张512x512的图,几乎需要20分钟(其它放大算法都是20秒内……)。

所以,有没有其它放大选择呢?

(二)图片超分辨率放大脚本插件(StableSR)

参考:🔗插件StableSR
可以从WEB UI中直接安装,它是一个图生图的脚本。
安装后会在图生图最下面的脚本下拉框中出现StableSR。

由于官网有中文说明,不需要细讲了吧:)
简单列举下重点,细节请看官网(仓库)的中文说明。

对了:SR = Super-Resolution ,写出来以防忘记。。。

(2.1)下载组件

安装后需要下载模型才能使用(⚠️细节请看官网介绍):

  1. Stable Diffusion V2.1 512 EMA 模型(约 5.21GB)->放基础模型目录。
  2. 官方的 StableSR 模块 (约400MB)->放插件自己的模型目录。
  3. 可选使用官方提供的 VQGAN VAE(约750MB) ->放VAE模型目录。
  4. 可选配合 Tiled Diffusion & VAE 扩展,也就是分区扩散(Multi Diffusion)插件使用。
    说是可选,咱普通显存只能必选,否则稍大的图就显存不够了。

(2.2)使用

基本使用很简单,在图生图下面启用脚本就可以了。
主要步骤如下,官网还给出了具体参数配置的建议(⚠️细节请看官网介绍)。

  • 基础模型选择刚才下载的v2-1_512-ema-pruned模型。
  • 切换到 img2img 标签。在页面底部找到 “脚本” 下拉列表,选择StableSR脚本。
    点击刷新按钮,选刚才下载的 StableSR 模块。
  • 如果生成图像尺寸 > 512,推荐使用 Tiled Diffusion & VAE(也就是Multi Diffusion upscaler)。
  • 上传图像并开始生成。

我试了一下速度还不算太慢(比一般算法慢多了)。
一张512²的图大概5-6分钟吧(还是比LDSR快不少啊)。

💡 不过需要注意:

  • 中低显存下,不能打开Channels Last内存格式优化,否则报错。
  • 不要尝试放大特别小的图片(48x48一类?)😄 。
  • 纹理类可以脑补的细节很不错。但文字类需要“原样放大”的效果很差,看不出原文。
    这种情况请对比4x-UltraSharpR-ESRGAN 4x+等附加功能页图片放大的效果。
  • 使用SD2.1的基础模型时,嵌入式(embeddings)模型可能会暂时看不见,正常的,因为那些是给SD1.5用的。
  • 注意版权问题,目前由于版权协议,生成的图片不能商用。

(2.3)实例对比(放大)

下面这张图(请忽略AI生成导致不合理的部分),我们来把它放大4倍。
在这里插入图片描述

放大后实在是太大了,就给个局部裁剪吧。
局部:原图直接缩放(传统图像编辑软件,对比组)
请添加图片描述


局部:StableSR
请添加图片描述


局部:StableSR(纯噪声选项开)
纯噪声适合脑补肌肤纹理,植物人群,各种不太需要和原图一致的细节。细节多,显得更加清晰。
但是改变原图较多,不适合文字之类。有时也会生成莫名奇妙的东西。
请添加图片描述


局部:LDSR(最强对比组)
噪点多显得真实,但噪点真的太多了。而且没有色彩修复选项(关键是太慢,其它可以忍)。
请添加图片描述

(2.4)实例对比(修复)

下面这张是比较早时自己拍的照片,那时相机不行,即使缩小看也很模糊。
我们不放大它的分辨率,处理看看。
请添加图片描述

局部100%:座机拍的原图
在这里插入图片描述


局部100%:StableSR
整体清晰了不少,文字,栏杆,树叶等。
不过截图外远处人的样子已经没法看了。
在这里插入图片描述


局部100%:StableSR(纯噪声选项开)
AI生成(脑补)的细节更多,已经明显改变原图了,比如牌匾字体破损的位置,而且整体有点卡通化。
草地上有个蓝色的牌子(虽然看不清写的啥),彻底被弄没了。
在这里插入图片描述


(三)总结

插件非常适合可以脑补细节的图片放大,相对LDSR来说不算太慢。
但操作相对复杂,还需要配合分区扩散插件(不然就爆显存,参数设不对也爆显存)。

总之它给了我们一个新的选择,期待持续改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/23292.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

网上学影视后期靠谱吗 影视后期剪辑需要学什么

影视后期如果有人手把手当面教的话,当然是最好的。但很多人都没有这么好的条件,实际上,网上也有很多教程可以学习利用。不过,小伙伴们可能会有疑问,网上学影视后期靠谱吗,影视后期剪辑需要学什么&#xff1…

Java API 基础

Java API 基础 一、相关知识学习 Java程序员在开发Java程序时,只需要安装有JDK,就可以在程序中使用import关键字导入Java API 中指定的包并在自己的程序中使用这些包中定义的各种类和接口。 1、 Java API 包 Java API 包 说明 java.accessibility 接…

【服务器】支付宝SDK接口调试

​ 文章目录 1.测试环境2.本地配置3. 内网穿透3.1 下载安装cpolar内网穿透3.2 创建隧道 4. 测试公网访问5. 配置固定二级子域名5.1 保留一个二级子域名5.2 配置二级子域名 6. 使用固定二级子域名进行访问 转发自cpolar内网穿透的文章:Java支付宝沙箱环境支付&#…

物联网通信协议-MQTT及使用python实现

MQTT概念及其原理 简述 MQTT(Message Queuing Telemetry Transport,消息队列遥测传输协议),是一种基于发布/订阅(publish/subscribe)模式的"轻量 级"通讯协议,该协议构建于TCP/IP协议上,由IBM在…

御剑WEB指纹识别系统教程,图文教程(超详细)

「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 御剑WEB指纹识别 一、基本使用二、内置字典三、自定义字典四、扫描原理 御剑WEB指纹识别系…

基于DDSRF正负序分离方法的不平衡电网PQ控制策略_平衡电流控制

0.前言 对于并网逆变器而言,电网会存在不平衡的情况。在这种情况下,不平衡的电网电压可以分解成为正序、负序和零序分量。并网逆变器通常期望能够实现单位功率因数并网,向电网注入对称的正弦电流,所以此时的微电网逆变器控制策略显…

rollup打包react组件

这次主要简单实现用rollup打包react组件,组件的话简单写了一个弹窗组件,效果如下: 点击打开弹框,点击关闭按钮关闭弹框 首先创建react项目,这边还是用mfex-project脚手架创建 mfex-project create react-demo 然后编…

财务共享领先实践,看看他们是怎么做的

随着信息技术的快速发展,由于创新商业模式的出现,金融结构、操作策略和流程正在发生变化。大数据、云计算、人工智能、机器人流程自动化(RPA)等新兴技术正在应用于金融及财务领域,以优化财务管理流程并提高运营效率。财…

信号完整性分析基础知识之传输线和反射(七):带负载传输线、感性不连续引起的反射

带负载传输线 如果在传输线上有一个小的容性负载,信号会出现失真,上升时间也会降低。每个分立电容都会降低信号在其附近看到的阻抗。如果传输线上分布有多个容性负载(例如一个总线上每隔1.2inch有一个2pF的连接器残桩,或者一个内…

学习【菜鸟教程】【C++ 类 对象】【C++ 类的静态成员】

链接 1. 教程 可以使用 static 关键字来把类成员定义为静态的。当我们声明类的成员为静态时,这意味着无论创建多少个类的对象,静态成员都只有一个副本。 静态成员在类的所有对象中是共享的。如果不存在其他的初始化语句,在创建第一个对象时…

windows环境下安装RabbitMQ(超详细),

windows环境下安装RabbitMQ(超详细) 注:安装路径,用户名均为英文 一、RabbitMq简介 1.1消息队列中间件简介 消息队列中间件是分布式系统中重要的组件,主要解决应用耦合,异步消息,流量削锋等问题…

Python中模块的使用3

在运行Python程序时,总会用到Python的标准库模块。一些标准库模块被内嵌到Python解释器中,通过调用这些模块提供的函数,可以实现特殊的功能。sys模块就是Python的一个标准库模块,该模块被被内嵌到Python解释器中。 1 sys模块的导…

SpringCloud 性能优化

文章目录 Springcloud的性能问题应用服务组件调优Servlet 容器 优化Feign 配置优化 Gateway组件调优Zuul配置 优化hystrix配置 优化ribbon 优化 Springcloud的性能问题 Springcloud 原始的配置,性能是很低的,大家可以使用Jmeter测试一下,QPS…

深度学习编译器

1.为什么需要深度学习编译器 深度学习编译器主要为解决不同框架下训练的模型部署到指定的某些设备上时所遇到的一系列复杂的问题,即将各种深度学习训练框架的模型部署到各种硬件所面临的问题; 首先深度学习领域,从训练框架看,当前…

考研C语言第四章

4.1 关系表达式与逻辑表达式 ps&#xff1a; 算术运算符&#xff1a;加减乘除等 关系运算符&#xff1a;比大小的 逻辑与逻辑或 非&#xff01;的运算级别&#xff08;应该&#xff09;最高 4.2 if-else #include <stdio.h> //上课这个写while的原因是方便一次一次…

springWEB搭建

概述 SpringWEB就是spring框架里得一个模块* SpringWeb的前身是SpringMVC springMVC介绍 在之前的后端三大架构: Controller: 控制层, 包含了servlet, 对数据的接收, 处理, 响应 Model: 数据模型, dao, model VIew: 视图, jsp, 用于将数据添加到html中进行响应 工作流程: 主要…

Java:mybatis-plus-generator-ui 基于Mybatis-Plus的代码自助生成器

引用官方文档上的简介&#xff1a; 提供交互式的Web UI用于生成兼容mybatis-plus框架的相关功能代码&#xff0c;包括Entity,Mapper,Mapper.xml,Service,Controller等 &#xff0c;可以自定义模板以及各类输出参数&#xff0c;也可通过SQL查询语句直接生成代码。 文档 githu…

安卓基础巩固(四):设计原则、安卓主流技术框架MVC/MVP/MVVM、设计模式

文章目录 架构设计为什么要进行技术框架的设计 六大设计原则一、单一职责原则二、开闭原则三、依赖倒置原则四、接口分离原则五、迪米特法则&#xff08;又称最小知道原则&#xff09;六、里氏替换原则案例诠释 安卓主流开发技术框架MVC模式MVP模式MVVMMVP模式详解 设计模式构造…

27 VueComponent 计算属性的实现

前言 这是最近的碰到的那个 和响应式相关的问题 特定的操作之后响应式对象不“响应“了 引起的一系列的文章 主要记录的是 vue 的相关实现机制 呵呵 理解本文需要 vue 的使用基础, js 的使用基础 测试用例 用例如下, 我们这里核心关注 counterPlus100 这个计算变量 问…

java 社区人口管理系统Myeclipse开发mysql数据库web结构jsp编程计算机网页项目

一、源码特点 java 社区人口管理系统是一套完善的java web信息管理系统&#xff0c;对理解JSP java编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为 TOMCAT7.0,Myeclipse8.5开发&#xff0c;数据库为Mysql5.0…