CV论文--2024.2.19

1、Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generation

中文标题:自我对弈微调扩散模型,用于文本到图像生成

简介:在生成人工智能(GenAI)领域,微调扩散模型仍然是一个未被充分探索的领域,特别是与大型语言模型(LLMs)微调所取得的显著进展相比。虽然最先进的扩散模型如稳定扩散(SD)和SDXL依赖于监督微调,但它们的性能在看到一定量的数据后不可避免地停滞不前。最近,强化学习(RL)已被用于通过人类偏好数据微调扩散模型,但每个文本提示需要至少两个图像(“获胜者”和“输家”图像)。在本文中,我们介绍了一种名为自我对弈微调扩散模型(SPIN-Diffusion)的创新技术,其中扩散模型与其早期版本进行竞争,促进迭代的自我改进过程。我们的方法提供了一种替代传统的监督微调和RL策略,显著提高了模型的性能和对齐度。我们在Pick-a-Pic数据集上的实验表明,SPIN-Diffusion在人类偏好对齐和视觉吸引力方面优于现有的监督微调方法,甚至在第一次迭代时就表现出色。到第二次迭代时,它在所有指标上都超过了基于RLHF的方法的表现,并且使用更少的数据就能取得这些结果。

2、GES: Generalized Exponential Splatting for Efficient Radiance Field Rendering

中文标题:GES: 通用指数分层技术用于高效的辐射场渲染

简介:3D高斯喷洒技术的进步显著提高了3D重建和生成的速度。然而,这种方法可能需要大量的高斯函数,从而导致内存占用过多。本文介绍了一种名为GES(广义指数喷洒)的新型表示方法,它利用广义指数函数(GEF)来模拟3D场景。相比于高斯喷洒方法,GES需要更少的粒子来表示场景,因此在效率上表现更优。此外,GES还具有即插即用替换功能,可作为高斯基础实用程序的替代方案。研究对GES在理论上、实际的1D设置和现实的3D场景中进行了验证。结果表明,GES能够更准确地表示具有尖锐边缘的信号,而这对于高斯函数来说是具有挑战性的,因为高斯函数具有固有的低通特性。经验分析显示,GEF在拟合自然发生的信号(如正方形、三角形和抛物线信号)方面优于高斯函数,从而减少了高斯喷洒所需的内存。通过频率调制损失的辅助,GES在新视角合成基准测试中表现出了竞争性能,同时内存占用仅为高斯喷洒的一半,并且渲染速度提高了高达39%。您可以在项目网站https://abdullahamdi.com/ges获取相关代码。

3、Any-Shift Prompting for Generalization over Distributions

中文标题:对分布的泛化进行任意移位提示

简介:图像-语言模型通过提示学习在许多下游视觉任务中取得了显著的进展。然而,传统的提示学习方法在训练分布上过度拟合,失去了对测试分布的泛化能力。为了改善在各种分布转移情况下的泛化能力,我们提出了任意转移提示:一种考虑提示学习期间训练和测试分布之间关系的通用概率推断框架。我们通过构建层次结构的训练和测试提示,明确地将训练和测试分布在潜空间中连接起来。在这个框架内,测试提示利用分布关系来指导CLIP图像-语言模型从训练到任何测试分布的泛化。为了有效地编码分布信息及其关系,我们进一步引入了一个具有伪转移训练机制的Transformer推理网络。该网络在前向传递中生成量身定制的测试提示,避免了测试时间的额外训练成本。对23个数据集的广泛实验表明,任意转移提示对于在各种分布转移情况下的泛化能力具有有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/396912.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

搭建本地git仓库 gogs本地大家 CentOS搭建本地git仓库 CentOS部署gogs

运行环境 操作系统:CentOS7.8 64位 使用mysql5.7.44数据库 选用依赖 yum install vim wget unzip -y本文选择使用WLNMP集成环境 第一步 配置epel源(必须) yum install epel-release第二步 添加wlnmp源 这里选择自动脚本 curl -fsSL "https://sh.wlnmp.com/wlnmp…

算法模板 7.拓扑排序

拓扑排序 用来解决循环依赖相关问题!!! 一个有向无环图一定存在一个拓扑序列!一定存在至少一个入度为0的点 有向无环图也被称作拓扑图 先把入度为0的点压入队列,然后进行广度优先搜索(找到队头&#xf…

遥感影像数据处理分析软件与ChatGPT集成、多光谱数据分析与实践、高光谱数据分析与实践

目录 第一章 遥感科学与AI基础 第二章 遥感影像数据处理分析软件与ChatGPT集成 第三章 多光谱数据分析与实践专题 第四章 高光谱分析与实践专题 更多应用 将最新的人工智能技术与实际的遥感应用相结合,提供不仅是理论上的,而且是适用和可靠的工具和…

【天锐绿盾】| 数据防泄漏软件——防止公司核心文件数据\资料外泄、泄露!

数据防泄漏软件 数据防泄漏(DLP)软件是一种专门设计用于保护企业和组织内部敏感信息的网络安全工具。 PC端:https://isite.baidu.com/site/wjz012xr/2eae091d-1b97-4276-90bc-6757c5dfedee 它们通常包含以下核心功能: 文件加密…

2、windows环境下vscode开发c/c++环境配置(一)

前言:VSCode是微软出的一款轻量级编辑器,它本身只是一款文本编辑器而已,并不是一个集成开发环境(IDE),几乎所有功能都是以插件扩展的形式所存在的。因此,我们想用它编程,不只是把vscode下载下来就行&#x…

C语言系列(所需基础:大学C语言及格)-3-字符串/ASCII码表

文章目录 一、字符串二、ASCII码表 一、字符串 用" "来定义字符串&#xff1a; #include <stdio.h>int main() {"";//空字符串"hkl";//由""定义的字符串return(0); }用数组来存储字符串&#xff0c;并打印&#xff1a; #incl…

深度学习系列——“试错”发展直觉

试错法以发展直觉&#xff1a;面对复杂的深度学习问题时&#xff0c;学习者可以通过不断尝试不同解决方案&#xff0c;并观察其对模型性能的影响&#xff0c;逐渐形成一套针对特定任务的有效策略。这些经验有助于提升对深度学习模型工作原理的直观理解。 那么试错法是如何发展直…

专修戴尔R730xd服务器闪电灯 心跳亮黄灯故障

2024年开年第二天接到一个用户反馈说他公司有一台DELL PowerEdge R730xd服务器春节前由于市电问题意外断电关机了&#xff0c;刚好碰上春节就没去开机了&#xff0c;今天工厂开工服务器通电发现开不了机&#xff0c;且机器过了一会后报了2个黄灯错误&#xff0c;如下图&#xf…

SpringCloud-基于Feign远程调用

Spring Cloud 是一个用于构建分布式系统的开发工具包&#xff0c;它提供了一系列的微服务组件&#xff0c;其中之一就是 Feign。Feign 是一种声明式的 Web 服务客户端&#xff0c;它简化了在 Spring Cloud 中进行远程调用的过程。本文将介绍如何在 Spring Cloud 中使用 Feign 进…

这里有几个0?

注意n最大取 #include<iostream> #define endl \n using namespace std; void solve(long long x) {int cnt 0, sum 0;while (x) {cnt x & 1;sum;x >> 1;}cout << sum-cnt << endl; } int main() {int t;long long n;cin >> t;while (t-…

【力扣白嫖日记】1890.2020年最后一次登录

前言 练习sql语句&#xff0c;所有题目来自于力扣&#xff08;https://leetcode.cn/problemset/database/&#xff09;的免费数据库练习题。 今日题目&#xff1a; 1890.2020年最后一次登录 表&#xff1a;Logins 列名类型user_idinttime_stampvarchar (user_id, time_sta…

智能计算: 最新进展、挑战和未来(九名院士、12位专家)

论文&#xff1a;Intelligent Computing: The Latest Advances, Challenges, and Future 论文地址&#xff1a;https://arxiv.org/abs/2211.11281 Abstract 计算是人类文明发展的一个重要推动力。近年来&#xff0c;我们见证了智能计算的出现&#xff0c;在大数据、人工智能和物…

【FastAPI】P3 请求与响应

目录 请求路径参数查询参数 响应JSON 响应文本响应返回 Pydantic 模型 在网络通讯中&#xff0c;请求&#xff08;Request&#xff09; 与 响应&#xff08;Response&#xff09; 扮演着至关重要的角色&#xff0c;它们构成了客户端与服务器间互动的根本理念。 请求&#xff0…

原创java开源项目发布maven全球中央仓库详细过程示范和遇到的问题解决办法

文章目录 java项目上传到maven全球中央仓库&#xff08;原创个人开源项目发布maven中央仓库详细过程示范&#xff09;需求背景第一步 注册sonatype账号第二步 登录sonatype账号并申请新建项目第三步 准备个人GPG数字签名并发布到ubuntu第四步 准备maven配置第五步 修改项目配置…

网络原理HTTP/HTTPS(2)

文章目录 HTTP响应状态码200 OK3xx 表示重定向4xx5xx状态码小结 HTTPSHTTPS的加密对称加密非对称加密 HTTP响应状态码 状态码表⽰访问⼀个⻚⾯的结果.(是访问成功,还是失败,还是其他的⼀些情况…).以下为常见的状态码. 200 OK 这是⼀个最常⻅的状态码,表⽰访问成功 2xx都表示…

hot100 -- 滑动窗口

目录 &#x1f33c;无重复字符 -- 最长子串 AC 滑动窗口&#xff08;桶&#xff09; &#x1f33c;所有字母异位词 AC 滑动窗口 桶 AC 滑动窗口&#xff08;优化&#xff09; &#x1f33c;无重复字符 -- 最长子串 一开始考虑用 BF暴力 或者 KMP 的&#xff0c;后来想…

安宝特AR汽车行业解决方案系列1-远程培训

在汽车行业中&#xff0c;AR技术的应用正悄然改变着整个产业链的运作方式&#xff0c;应用涵盖培训、汽修、汽车售后、PDI交付、质检以及汽车装配等&#xff0c;AR技术为多个环节都带来了前所未有的便利与效率提升。 安宝特AR将以系列推文的形式为读者逐一介绍在汽车行业中安宝…

【机器学习笔记】 15 机器学习项目流程

机器学习的一般步骤 数据清洗 数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序&#xff0c;包括检查数据一致性&#xff0c;处理无效值和缺失值等。与问卷审核不同&#xff0c;录入后的数据清理一般是由计算机而不是人工完成。 探索性数据分析(EDA 探索性数据…

PROBIS铂思金融破产后续:ASIC牌照已注销

2024年1月31日&#xff0c;PROBIS铂思金融的澳大利亚ASIC牌照 (AFSL 338241) 被注销《差价合约经纪商PROBIS宣布破产&#xff0c;澳大利亚金融服务牌照遭暂停》&#xff0c;这也就意味着&#xff0c;PROBIS铂思金融目前已经没有任何金融牌照。 值得注意的是&#xff0c;时至今日…

com.alibaba.fastjson.JSONException: toJSON error的原因

问题&#xff1a; 导出接口报错&#xff0c;显示json格式化异常 发现问题&#xff1a; 第一个参数为HttpResponse,转换成json的时候报错 修改方法&#xff1a; 1.调换两个参数的位置 2.在aop判断里边 把ServletAPI过滤掉 Before("excudeWebController()")pub…