SUPIR图像放大模型介绍与实际测试

✨背景

正如,最顶级的料理只需要最简单的烹饪方法一样,图像放大,是设计领域里边最常面对的一个问题,在AI绘画里边也是很常见的一个课题。虽然现在放大算法、放大模型有很多,但是真的能实现的比较好的,并不多。

所以SUPIR这个放大模型的出现,让不少关心“图像无损放大/高清放大”这个课题的朋友又开心了一下,所以这里做一篇简单的介绍。

🍤简要介绍

首先,SUPIR这个模型的论文地址是:https://arxiv.org/abs/2401.13627

感兴趣的朋友也可以自行阅读。

以下部分是结合论文阅读工具给出的一些片段,辅助了解下论文大概含义:

在这篇论文中,作者们介绍了 SUPIR 模型的主要特点和优势,包括:

  1. 模型扩展:通过模型扩展显著增强了图像恢复的能力,展示了图像恢复的新潜力。
  2. 数据集:收集了包含2000万张高分辨率、高质量的图片的数据集,每张图片都有描述性文本注释,用于模型训练。
  3. 文本提示引导的恢复:SUPIR 提供了根据文本提示指导图像恢复的能力,扩大了其应用范围和潜力。
  4. 负面质量提示:引入负面质量提示以进一步提高感知质量。
  5. 恢复引导的采样方法:开发了一种恢复引导的采样方法,以抑制基于生成的恢复中遇到的保真度问题。

在这篇论文中,作者们提出了一种称为“恢复引导的采样方法”(Restoration-Guided Sampling),旨在提高图像恢复的质量。这种方法特别针对生成模型在图像恢复任务中可能出现的过度生成问题,导致恢复的图像与原始低质量输入图像的保真度降低。为了解决这个问题,作者们采取了以下步骤:

  1. 修改EDM采样方法:作者们对现有的EDM(Euler Discrete Method)采样方法进行了修改,以引入恢复引导的采样策略。这种方法的目的是在扩散过程的每一步中,有选择性地引导预测结果更接近于低质量(LQ)图像。

  2. 控制生成过程:通过在扩散采样过程中施加额外的控制,以确保生成的图像恢复结果对原始LQ图像保持较高的保真度。这是通过在算法中引入一个额外的超参数τr(restore guidance hyper-parameter)来实现的,该参数控制着每一步中对生成结果的调整程度。

  3. 平衡保真度和感知质量:通过调整τr的值,可以在恢复图像的保真度和感知质量之间进行权衡。较小的τr值会使结果更偏向LQ图像,强调保真度;而较大的τr值则允许更多的生成自由度,强调感知质量,但可能会降低保真度。

  4. 算法实现:在算法1中,作者们详细描述了恢复引导采样的具体实现步骤。这个过程包括从高斯分布中采样、计算权重、更新预测结果以及调整生成内容以接近LQ图像。

通过这种方法,SUPIR模型能够在保持与原始输入图像高度一致的同时,生成具有高感知质量的图像。这在图像恢复领域是一个重要的进步,因为它提供了一种在不牺牲图像内容真实性的前提下,提高图像质量的有效手段。

论文中的实验结果表明,这种恢复引导的采样方法能够显著提高图像恢复的视觉效果,尤其是在处理复杂和具有挑战性的现实世界场景时。此外,通过用户研究,作者们还证明了该方法在感知质量上相比于现有技术有显著提升。

🎡Comfyui中对比测试

首先,插件地址是:GitHub - kijai/ComfyUI-SUPIR: SUPIR upscaling wrapper for ComfyUI

大家可以按照自己喜欢的方式安装这个插件,安装方面并不复杂;

其次:需要下载两个SUPIR的模型,之前的版本比较大,每个模型5G多,两个就是10G多,最近有了优化模型,每个只有2G多,给硬盘减负了属于是。

 网盘地址:https://pan.quark.cn/s/8a17372a97aa

模型下载后放在大模型目录下就可以,可以建立二级目录,方便自己查找。

第三步,工作流的话,插件作者直接放在了插件里边,大家自己安装完插件到这个目录下找到拖进comfyui里边就好了,记得更改下模型的地址和选择supir模型;

至于两个模型的选择,根据描述来看,选择其一就好,效果不好的话,可以换另外一个看看:

  • SUPIR-v0Q:百度网盘、谷歌云端硬盘

    使用默认训练设置。大多数情况下通用性高,图像质量高。

  • SUPIR-v0F:百度网盘、谷歌云端硬盘

    使用光衰减设置进行训练。SUPIR-v0F当面对光衰减时,Stage1 编码器保留更多细节。

 工作流本身相对比较好理解,红箭头的两个地方改一下模型,红框框为了防止图片形变,我稍微改动了下这个节点,大家也可以不改,不影响效果,注意大模型的部分要选择sdxl 或者sdxl-lighting的模型:

原图是从https://pixabay.com/zh/photos/pug-dog-sunglasses-pink-glasses-8632718/这里下载的共享图片:

放大3倍之后的图像:

emm,还是很不错的:

换一张人物的:

原始图像:

放大图像:

原始:

放大:

甚至是卡通图像:

放大之后:

总的来说,画面保真度还可以,但总有一点锐化过度的感觉,如果要解决这个问题,可以考虑使用正常的sdxl模型而不是lightning模型,比如说同样是放大三倍,下图1是用了lightning模型,而图2用了正常sdxl模型,画面效果会更细腻一点:

图1:

图2:

好,这篇的分享就到这里,如果对你有帮助,记得帮忙点个赞哦~

🎉写在最后~

去年的时候写了两门比较基础的Stable Diffuison WebUI的基础文字课程,大家如果喜欢的话,可以按需购买,在这里首先感谢各位老板的支持和厚爱~

✨StableDiffusion系统基础课(适合啥也不会的朋友,但是得有块Nvidia显卡):

https://blog.csdn.net/jumengxiaoketang/category_12477471.html

​​​🎆综合案例课程(适合有一点基础的朋友):

https://blog.csdn.net/jumengxiaoketang/category_12526584.html

​​​

这里是聚梦小课堂,就算不买课也没关系,点个关注,交个朋友😄

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/579040.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

语义分割——json文件转shp

前言 在用labelme标注遥感图像后会生成json文件,如果我们想要shp文件,下面给出了具体实现流程。 一、依赖配置 import json import geopandas as gpd from shapely.geometry import Polygon from osgeo import gdal import argparse import glob import…

【论文解析】笔触渲染生成 前沿工作梳理

最近的一些工作梳理 2023年 Stroke-based Neural Painting and Stylization with Dynamically Predicted Painting Region 2022年Im2Oil: Stroke-Based Oil Painting Rendering with Linearly Controllable Fineness Via Adaptive Sampling 文章目录 1 Stroke-based Neural P…

【海博】雅思该怎么考?

文章目录 考试类型 考试内容 考试形式 备考资源 考试报名 考试成绩 考试类型 学术类(A类)适用于:出国留学申请本科,研究生及以上学位,或获得专业资质。学术类考试评估考生的英语水平是否满足进行大学或研究生学习…

【C语言】文件操作(1)

为什么使⽤⽂件? 如果没有⽂件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运⾏程序,是看不到上次程序的数据的,如果要将数据进⾏持久化的…

Sylar C++高性能服务器学习记录07 【协程模块-知识储备篇】

早在19年5月就在某站上看到sylar的视频了,一直认为这是一个非常不错的视频,由于本人一直是自学编程,基础不扎实,也没有任何人的督促,没能坚持下去,每每想起倍感惋惜。恰逢互联网寒冬,在家无事&a…

vim 插件01:插件管理神器pathogen

1、pathogen简介 Vim 插件 pathogen 是一款历史比较悠久的 Vim 插件管理器。Pathogen 的主要功能是提供一种模块化的方式来管理和加载 Vim 插件。说人话:vim是一款管理各类插件的插卡,使用它会让插件的安装和使用非常方便。 以下是 Pathogen 的主要特点…

【大模型应用篇5】应对裁员潮,突发奇想,打造“收割offer”智能体.......

前段时间飞书大裁员, 不禁让人感到危机四伏,加上《【大模型应用篇4】普通人构建智能体的工具》之前文章介绍了普通人打造智能体的工具, 这节课就带大家利用字节产品coze构建“程序员智能体”, 方便应对裁员,随时做好找工作的准备.打造一款面试智能体,方便各位程序员面试, 这个智…

错误代码126:加载d3dcompiler_43.dll失败,分享多种解决方法

在正常使用电脑的过程中,当我尝试启动并运行一款心仪的游戏时,系统却突然弹出一个令人困扰的错误提示“错误代码126:加载d3dcompiler_43.dll失败”,它会导致游戏无法正常运行。为了解决这个问题,我经过多次尝试和总结,…

22年全国职业技能大赛——Web Proxy配置(web 代理)

前言:原文在我的博客网站中,持续更新数通、系统方面的知识,欢迎来访! 系统服务(22年国赛)—— web Proxy服务(web代理)https://myweb.myskillstree.cn/114.html 目录 RouterSrv …

OGG extract进程占据大量虚拟内存导致服务器内存异常增长分析

现象 oracle服务器一节点内存,一个月来持续升高,近一月上涨10%左右。 问题分析 OS内存使用情况 使用内存最大的10个进程如下,PID为279417占用最大的内存。 查询279417,发现是ogg相关进程。 发现ogg的extract进程占用了大量的虚拟内…

软件测试(Web自动化测试)(二)

一.Selenium WebDriver的基本应用 (一)安装浏览器驱动 1.关闭浏览器的自动更新功能 以Windows7(64位)操作系统为例,讲解如何关闭Chrome浏览器的自动更新。首先按下快捷键“WinR”,打开运行对话框&#x…

【备战软考(嵌入式系统设计师)】02-计算机指令

指令集 我们计算机要执行程序,本质上是执行一条条的指令,而指令是从指令集中取出的,目前常见的指令集有CISC(Complex Instruction Set Computer,复杂指令集)和RISC(Reduced Instruction Set Co…

2024最新智慧医疗智慧医院大数据展示,医院数据采集概况、医院指标分析、医院就诊趋势分析等。源代码免费下载。

系列文章目录 【复制就能用1】2分钟玩转轮播图,unslider的详细用法 【复制就能用2】css实现转动的大风车,效果很不错。 【复制就能用3】2分钟自己写小游戏:剪刀石头布小游戏、扫雷游戏、五子棋小游戏 【复制就能用4】2024最新智慧医疗智慧医院大数据…

c++并查集

文章目录 前言一、并查集1、并查集原理2、并查集实现3、并查集应用1.省份数量2.等式方程的可满足性 前言 一、并查集 1、并查集原理 在一些应用问题中,需要将n个不同的元素划分成一些不相交的集合。开始时,每个元素自成一个单元素集合,然后…

应急行业的智能安全帽(高端)

前面介绍了低端、中端安全帽,接着再讲讲高端安全帽。做高端安全帽的企业非常少,估计一只手都数的出来。确实也和智能安全帽这个领域体量有关系,并且他有一个新的“劲敌”——智能眼镜从其他领域瓜分原属于他的市场,这些都是题外话…

SpringBoot引入Layui样式总是出现404

一般出现Layui样式文件如css,js404的错误 解决方案 (1)首先将其中的静态资源下载resources/static中 (2)在启动类中重写方法 package com.gq.booksystem;import org.mybatis.spring.annotation.MapperScan; import …

【ETAS CP AUTOSAR工具链】RTE层基本概念与开发流程

本篇文章续接上篇文章【ETAS CP AUTOSAR工具链】基本概念与开发流程,继续按上篇文章描述的ETAS CP工具链进行开发的基本框架,讲述了“RTE集成与配置”这部分的基本概念与开发流程。 RTE(Runtime Environment)处于应用层与基础软件…

【Godot4.2】自定义Todo清单类 - myTodoList

概述 在写myList类的时候,就想到可以写一个类似的Todo清单类。 基础思路 本质还是在内部维护一个数组,在其基础上进行增删改查操作的封装为了方便存储数据,编写一个自定义内置类TodoItem,内部数组就变成了Array[TodoItem]类型的…

Git | 远程操作

Git | 远程操作 文章目录 Git | 远程操作0、分布式版本控制系统概念1、创建远程仓库2、克隆远程仓库https方式ssh方式 3、推送至远程仓库4、本地拉取远程仓库5、配置Git忽略特殊文件给命令配置别名 6、标签管理创建标签操作标签 0、分布式版本控制系统概念 Git是一个分布式版本…

Git--分布式版本控制系统

目录 一、理解分布式版本控制系统二、远程仓库三、克隆远程仓库四、向远程仓库推送五、拉取远程仓库六、配置Git七、给命令配置别名八、创建标签九、操作标签 一、理解分布式版本控制系统 我们⽬前所说的所有内容(⼯作区,暂存区,版本库等等&a…