从CVPR 2024看域适应、域泛化最新研究进展

域适应和域泛化一直以来都是各大顶会的热门研究方向。

域适应指:当我们在源域上训练的模型需要在目标域应用时,如果两域数据分布差异太大,模型性能就有可能降低。这时可以利用目标域的无标签数据,通过设计特定方法减小域间差异,来提升模型在目标域的性能。

域泛化与域适应不同,域泛化让模型学会泛化到多个新测试域,而不仅仅是适应一个特定的目标域。这种方法的核心在于利用多源域信息增强模型泛化能力。

本文盘点了 CVPR 2024 有关域适应、域泛化的研究成果 32 篇,帮助大家了解并掌握最新的进展。

论文原文以及开源代码需要的同学看文末

域适应

Improving the Generalization of Segmentation Foundation Model under Distribution Shift via Weakly Supervised Adaptation

第一个针对「Segment Anything」大模型的域适应策略

方法:本文研究了Segment-Anything模型在多个图像分割任务中的泛化能力,并提出了一种适应性方法,该方法不需要访问源数据集且内存开销低,能够通过弱监督有效改善模型的适应性,通过对10个数据集的广泛评估,表明了该方法的有效性。

创新点:

  • 引入自我训练的自适应框架:作者提出了一种基于自我训练的自适应框架,通过弱监督来建立伪预测之间的对应关系,实现对下游数据的自适应。这种方法能够在没有源领域数据的情况下适应下游任务,从而避免了高计算开销和潜在的隐私问题。

  • 低内存占用的模型权重更新方法:作者介绍了一种低内存占用的模型权重更新方法,通过对编码器网络进行LoRA微调,实现了最佳性能。这种方法能够在大型基础模型上进行适应或微调,而无需重新训练整个模型,从而节省了计算资源。

LEAD: Learning Decomposition for Source-free Universal Domain Adaptation

方法:本文介绍了源无关通用领域自适应(SF-UniDA)问题,并提出了一种LEArning Decomposition(LEAD)框架来解决该问题。LEAD框架通过特征分解将特征分为源已知和源未知两部分,并根据与目标原型和源锚点的距离建立实例级别的决策边界,以识别目标私有未知数据。

创新点:

  • 提出了一种新的方法来处理源自由通用领域适应(SF-UniDA)问题。通过特征分解的方法,LEAD能够识别目标私有数据,减少了对手工调整阈值或依赖不稳定聚类的依赖。LEAD还可以作为现有方法的补充,进一步提高性能。

  • LEAD提出了一种实例级伪标签策略,通过与目标原型和源锚点的距离来建立决策边界。实例级决策边界策略在OPDA场景中能够显著提高性能,它考虑了不同类别之间的协变量漂移的不一致性和相同类别中样本的变异性。

域泛化

PracticalDG: Perturbation Distillation on Vision-Language Models for Hybrid Domain Generalization

方法:从算法、基准和指标的角度提高领域泛化的实用性,首先开发了一种新颖的扰动蒸馏(PD)算法,将视觉-语言模型的零样本能力转移到轻量级视觉模型,从而避免了传统微调范式下的大量计算成本;作者引入了从得分、类别和实例(SCI)中挖掘视觉-语言模型知识的扰动;此外,还提出了一个混合领域泛化(HDG)基准和一种新颖的度量H2 -CV来全面评估模型的鲁棒性

创新点:

  • 提出了一种名为SCI-PD的方法,通过从得分、类别和实例三个角度对轻量级视觉模型进行扰动,从而将知识从视觉-语言模型转移给轻量级视觉模型,解决了开放集域泛化问题。

  • 提出了一种名为HDG的基准和一种新的度量指标H2-CV,用于全面评估模型的鲁棒性。

Single Domain Generalization for Crowd Counting

方法:本文研究了单域泛化(SDG)在人群计数中的应用。作者提出了MPCount方案,该方案包括基于密度回归的注意力记忆库、内容错误掩码和注意一致性损失等。此外,为了应对标签模糊的挑战,还提出了基于补丁分类的方法。研究还引入了单域泛化的概念,该方法可以在只有一个源域可用的情况下进行训练。

创新点:

  • MPCount引入了一个注意力内存库(AMB),用于处理密度回归问题。与以往的方法不同,它只使用一个注意力内存库,而不是多个子域分别对应不同的类别。这种设计使得MPCount在狭窄的源分布下仍然有效,并能够对密度回归进行建模。

  • MPCount通过将图像划分为网格来实现基于块的分类作为辅助任务,以减轻标签的歧义性。这种方法可以解决标签模糊的问题,提供可靠的众数信息,从而提高模型对领域变化的鲁棒性。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CVPR域”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/749834.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

thinksboard 新建子类菜单

新建需要的文件 打开bz-routing.module.ts文件,设置bzRoutes,为下面使用 import { Injectable, NgModule } from angular/core; import { Resolve, RouterModule, Routes } from angular/router; import { Authority } from shared/models/authority.en…

【创建者模式-工厂模式】

简单工厂模式 (也称为静态工厂模式)由一个工厂对象负责创建所有产品类的实例。客户端通过传入一个参数给工厂类来请求创建哪种产品类的实例。这种模式的优点在于客户端不需要知道具体的产品类,只需要知道对应的参数即可。缺点是当需要添加新…

redis复习

redis知识点 redis持久化redis 订阅发布模式redis主从复制哨兵模式redis雪崩,穿透缓存击穿(请求太多,缓存过期)缓存雪崩 redis持久化 redis是内存数据库,持久化有两种方式,一种是RDB(redis dat…

【解决方案】你必须要知道的~前端九种跨域方式实现原理(完整版)

前言 前后端数据交互经常会碰到请求跨域,什么是跨域,以及有哪几种跨域方式,这些问题通常出现在Web开发中,当浏览器执行脚本发起请求到不同的域名、协议或端口时,出于安全考虑,浏览器会限制这种跨源HTTP请求…

Redis数据库(六):主从复制和缓存穿透及雪崩

目录 一、Redis主从复制 1.1 概念 1.2 主从复制的作用 1.3 实现一主二从 1.4 哨兵模式 1.4.1 哨兵的作用 1.4.2 哨兵模式的优缺点 二、Redis缓存穿透和雪崩 2.1 缓存穿透——查不到 2.1.1 缓存穿透解决办法 2.2 缓存击穿 - 量太大,缓存过期 2.2.1 缓存…

拍照就用华为Pura 70系列,后置真实感人像轻松出片!

平时喜欢用手机记录生活的人是不是总有个烦恼,想要拍出媲美单反的完美人像,又怕照片失真,经过近期对手机摄影的探索,我发现了华为Pura70系列的真实感人像之美,它给予每个热爱生活的人直面镜头的自信,记录真…

毕业季留念,就该这样记录下来

毕业季来啦!这个季节总是充满了不舍和期待,就像夏天里的冰淇淋,甜蜜中带着一丝丝凉意。在这个特别的时刻,我想和大家分享一款陪伴我记录青春点滴的神器——nova 12 Ultra 手机。 要说自拍,我可是个“资深玩家”。以前…

以算筑基,以智赋能 | Gooxi受邀出席2024中国智算中心全栈技术大会

6月25日,2024中国智算中心全栈技术大会暨展览会、第5届中国数据中心绿色能源大会暨第10届中国(上海)国际数据中心产业展览会在上海新国际博览中心隆重召开。Gooxi受邀参与并携最新服务器产品以及解决方案亮相展会,吸引众多行业领袖…

基于MATLAB仿真设计无线充电系统

通过学习无线充电相关课程知识,通过课程设计无线充电系统,将所学习的WPT,DC-DC,APFC进行整合得到整个无线充电系统,通过进行仿真研究其系统特性,完成我们预期系统功能和指标。 以功率器件为基本元件&#x…

【人工智能学习之图像操作(二)】

【人工智能学习之图像操作(二)】 图像上的运算图像混合按位运算 图像的几何变换仿射变换透视变换膨胀操作腐蚀操作开操作闭操作梯度操作礼帽操作黑帽操作 图像上的运算 图像上的算术运算,加法,减法,图像混合等。 加减…

Profibus协议转Modbus协议网关模块在船舶中的应用

一、背景 在当今数字化快速发展的时代,船舶作为重要的交通工具之一,也在不断追赶着科技的步伐,实现自身的智能化升级。而在这个过程中,Profibus转Modbus网关(XD-MDPB100)作为关键的一环,扮演着…

05 Shell编程之免交互

目录 5.1 Here Document 免交互 5.1.1 Here Document 概述 5.1.2 Here Document 免交互 1. 通过read命令接收输入并打印 5.1.3 Here Document变量设定 5.1.4 Here Document 格式控制 (1)关闭变量替换的功能。 (2)去掉每行之前的TAB字符。 5.1.5 Here Document 多行注释…

前端写代码真的有必要封装太好么?

前言 封装、代码复用、设计模式…… 这些都是方法,业务才是目的。技术始终是为业务服务的。能够满足业务需求,并且用起来舒服的,都是好方法。 不存在一套适用于所有项目的最佳代码组织方法,你需要结合业务,去不断地…

cad报错:由于找不到vcruntime140.dll无法继续执行代码

在现代的工程设计中,计算机辅助设计(CAD)软件已经成为了工程师们不可或缺的工具。然而,在使用CAD软件的过程中,有时我们会遇到一些问题,其中之一就是“找不到vcruntime140.dll”的错误提示。本文将详细介绍…

鸿蒙期末项目(2)

主界面 主界面和商店详情界面参考如下设计图(灵感严重匮乏) 简单起见,将整个app分为4个布局,分别是主界面、搜索界面、购物车界面,以及个人界面。 所以在app中也需要使用tab组件进行分割,且需要通过tabBa…

安装Flask

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 大多数Python包都使用pip实用工具安装,使用Virtualenv创建虚拟环境时会自动安装pip。激活虚拟环境后,pip 所在的路径会被添加…

离散傅里叶变化

傅里叶变换 对傅里叶变换了解不是很清楚的朋友推荐一下这个帖子,讲得很详细 傅里叶变换 源码 先看源码链接 #include "opencv2/core.hpp" #include "opencv2/imgproc.hpp" #include "opencv2/imgcodecs.hpp" #include "open…

FuTalk设计周刊-Vol.026

🔥🔥AI漫谈 热点捕手🔥🔥 1、Hotshot-XL AI文本转GIF Hotshot-XL 是一种 AI 文本转 GIF 模型,经过训练可与Stable Diffusion XL一起使用。能够使用任何现有或新微调的 SDXL 模型制作 GIF。 网页体验 网页http://htt…

git 初基本使用-----------笔记(结合idea)

Git命令 下载git 打开Git官网(git-scm.com),根据自己电脑的操作系统选择相应的Git版本,点击“Download”。 基本的git命令使用 可以在项目文件下右击“Git Bash Here” ,也可以命令终端下cd到指定目录执行初始化命令…

聚类算法(3)---K-means 算法

本篇文章是博主在人工智能等领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对人工智能等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。文章分类在AI学习笔记&#…