[论文阅读] 测试时间自适应TTA

最初接触 CVPR2024 TEA: Test-time Energy Adaptation
[B站](1:35:00-1:53:00)https://www.bilibili.com/video/BV1wx4y1v7Jb/?spm_id_from=333.788&vd_source=145b0308ef7fee4449f12e1adb7b9de2
实现:

  1. 读取预训练好的模型参数
  2. 设计需要更新的模型参数,其他模块不进行梯度更新
  3. 设计辅助任务进行测试时间的模型更新

论文列表--待更新

  • Contrastive Test-Time Adaptation(CVPR 2022)
  • Improved Test-Time Adaptation for Domain Generalization(CVPR 2023)
  • SoTTA: Robust Test-Time Adaptation on Noisy Data Streams(NeurIPS 2023)
  • Feature Alignment and Uniformity for Test Time Adaptation(CVPR 2023)
  • A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts(arXiv 2023)
  • TEA: Test-time Energy Adaptation(CVPR 2024)

Contrastive Test-Time Adaptation(CVPR 2022)

缩写:CoTTA
在测试时适应过程中将自监督对比学习与自我训练相结合。
PDF Code
上图展示了不同的方法。说明方法 AdaContrast 如何利用目标域数据与以前的工作。(a) 如果不进行调整,就是普通训练,仅根据目标数据评估源模型。(b) 使用伪标签时,源分类器预测被用作自我训练的伪标签。(c)现有的伪标签方法SHOT使用离线全局细化来减少嘈杂的伪标签。(d)在AdaContrast中,我们考虑了目标样本之间的两种关系:我们使用对比学习来利用样本对中的信息来学习更好的目标表示,同时通过聚合邻域中的知识来完善伪标签。颜色表示伪标记的类。
这个方法是利用对比学习的Moco为基本框架。主要流程如下图所示。
对比测试时适应方法(AdaContrast)的框架:在适应开始时,模型和动量模型由源模型初始化。目标图像由一个弱增强和两个强增强转换。(a) 弱增强图像被编码为特征向量 w,用于根据与目标特征空间的余弦距离查找最近邻,该空间作为内存队列进行维护。对相关概率进行平均,然后进行 argmax 以获得用于自我训练和对比学习的精细伪标签 ˆ y。(b)将图像的两个强增强版本编码为动量对比度的查询和关键特征q,k[6,17],与自训练联合应用。不使用投影头;当前伪标签和历史伪标签用于排除同类负对。(c) 从弱增强图像中获得的伪标签 ˆ y 也用于监督强增强图像的预测,从而加强自训练中的弱-强一致性。多样性正则化也基于相同的预测。请注意,用于最近邻搜索和对比学习的队列是分开的,它们分别使用 w 和 k 进行更新(此处未说明)。
基本流程是:
对输入图片进行一次弱增强,两次强增强,分别输入到不同的编码器中。弱增强经过encoder得到的伪标签对强增强的输出进行监督。
弱图像增强获得的样本进入经过源模型参数初始化的encoder中获得概率分布,这个概率分布与内存队列中的概率分布计算距离,使用K个临近的概率分布的平均值作为当前样本的输出的概率分布,进行argmax变成用于自训练和对比学习的伪标签,然后当前样本的概率分布对内存队列进行更新。
两个强增强得到的输入进入Moco,一个是Encoder得到query,一个是momentum encoder得到key。momentum得到的key对key队列进行更新,利用伪标签的值mask相同类别的key,只是对不同类别进行对比学习(就是不会让正样本和正样本进行对比)。其余操作与Moco相同。
损失函数:weak aug输出作为伪标签进行监督的的CE Loss,一个CTR对比学习Loss,一个均匀分布Loss(防止错误的伪标签对模型造成不利影响,同时提高模型输出的多样性)

Improved Test-Time Adaptation for Domain Generalization(CVPR 2023)

PDF Code
目前TTA遇到的困难是:

  1. 辅助任务设计很困难,辅助任务设计不好,与原来损失如果不匹配,使用TTA性能会下降。目前大多设计一个看起来比较合理的辅助任务。
  2. 模型需要更新的参数设计也比较复杂,更新哪个模块设计比较困难。
    主要是应用一致性损失。
    ITTA的训练过程。我们使用源域中的 x 作为特征提取器 fθ(·) 的输入来获得表示 z 及其增强版本 z′,其中应用了 [74] 中的增强技能。分类器 fφ(·) 和权重子网 fw(·) 用于计算主损失 Lmain 和可学习一致性损失 Lwcont。详情请参阅我们的文字。
    ITTA的测试适配过程。与训练阶段不同的是,我们在特征提取器 fθ 的每个块之后都包含额外的自适应参数 fΘ。对于每个测试样本 x,从 f i θ 获得的中间表示 zi 和 z′i 在进入下一个块 f i+1 θ 之前传递到 f i Θ。我们使用可学习的一致性损失 Lwcont 作为更新 fΘ 的目标。详情请参阅我们的文字。
    在每个block后面加入自适应模块。改动模块的激活层得到两个不同的特征,这两个特征的差经过fw之后要接近于0。其中胖一点的Θ是要更新的参数,瘦一点的θ是模型原来的参数这个是不在测试时间进行改变的。

SoTTA: Robust Test-Time Adaptation on Noisy Data Streams(NeurIPS 2023)

PDF Code
观察:如果测试集中有noise、对抗性样本等,TTA的性能会直线下降。
问题:现有的TTA方法都无可避免的适应了混杂在测试数据中的不好的样本,导致模型性能下降。
与先前的假设(Clean TTA)不同,真实世界的测试流可能包括模型范围之外的意外噪声样本(噪声TTA),例如眩光、覆盖镜头的落叶、看不见的物体(例如火烈鸟)以及自动驾驶场景中的噪声。在这种情况下,现有 TTA 方法的准确性会降低。现有 TTA 方法和我们的方法 (SoTTA) 在 CIFAR10-C 上的平均分类准确率 (%)。与原始数据相比,当嘈杂的数据混合到测试流中(嘈杂)时,现有方法的性能会下降
SoTTA概述。SoTTA 通过高置信度统一类采样 (HUS) 实现输入鲁棒性,通过熵锐度最小化 (ESM) 实现参数鲁棒性。
创新点:

  1. 高置信度均匀采样,选取良性样本进行memory更新。
  2. 熵锐度最小化,实现模型参数鲁棒性。
    观察:噪声样本和良性样本的区别可以通过模型输出观察到。
    memory更新:对数据进行筛选更新,保持memory中样本类别相对平衡有代表性,噪声低。
    Loss函数:熵的一阶泰勒,使模型扰动前后保持不变。

Feature Alignment and Uniformity for Test Time Adaptation(CVPR 2023)

PDF Code
缩写:TSD
测试时间自蒸馏
首先将 TTA 作为功能修订问题来解决,因为源域和目标域之间存在域间隙。之后,按照两个测量对齐和均匀性来讨论测试时间特征修订。对于测试时间特征的均匀性,提出了一种测试时间自蒸馏策略,以保证当前批次和之前所有批次表示之间的均匀性一致性。对于测试时特征对齐,提出了一种记忆空间局部聚类策略,以对齐即将到来的批次的邻域样本之间的表示。为了解决常见的噪声标签问题,提出了熵和一致性滤波器来选择和删除可能的噪声标签。
我们提出的方法概述。蓝线表示向前和向后,黑线仅表示向前(即没有梯度反向传播)。不同颜色的特征、日志和原型意味着不同的类别。MSLC:记忆空间局部聚类。TSD:测试时间自蒸馏。
分类模型与原型模型输出的一致性。
我的理解,MSLC是对原型分类模型中的feature和Logits进行更新(更新原型向量,如果分类预测与原型预测一致,则让临近的原型向量与当前得到的特征更加接近,否则就远离,动量更新),TSD是计算分类模型和原型模型输出的一致性损失(为了防止原型模型输出的噪声先经过过滤器再计算CE Loss)。

A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts(arXiv 2023)

PDF github综述(没看完)
在这里插入图片描述
TTT:有Training data,可以改变模型训练的策略,重新训练一个新的模型。
TTA:只有预训练好的模型和测试数据。
这篇综述也说了一些相关的领域,比如自监督、半监督、领域泛化、领域适应、测试增强、迁移学习、持续学习等,对概念理解有帮助。

TEA: Test-time Energy Adaptation(CVPR 2024)

PDF Code
缩写:TEA
观察:Test data的能量越低,测试的准确率越高。
在这里插入图片描述

在这里插入图片描述
让模型自行感知,以降低测试样本的能量,提高模型的泛化能力。

  1. 把分类器做成一个能量模型。
  2. 从模型中采样能量低的伪样本,提高伪样本的能量,降低测试数据的能量。
    看代码就是:从模型中采样能量低的伪样本,初始化得到一个输入,进入模型中得到梯度,根据梯度更新获得大致的局部最小值,作为伪样本,也就是模型中能量低的样本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/590340.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言写一个终端进度条

C语言写一个终端进度条 这个功能挺简单的,主要有以下两点: 如何获取终端宽度如何让字符在原地闪烁 如何获取终端宽度 这里用到了设备控制接口函数ioctl(),下面简单的介绍一下这个函数的用法: ioctl是一个在Unix和类Unix系统中…

怎样通过Java语言实现远程控制8路控制器/断路器

怎样通过Java语言实现远程控制8路控制器/断路器呢? 本文描述了使用Java语言调用HTTP接口,实现控制8路控制器/断路器,支持8路输出,均可独立控制,可接入各种电器。 可选用产品:可根据实际场景需求&#xff0…

【数据库主从架构】

【数据库主从架构】 1. 什么是数据库的主从架构1.1 主从复制1.1.1 MySQL的主从主从复制技术三级目录 1. 什么是数据库的主从架构 随着公司业务线的增多,各种数据都在迅速增加,并且数据的读取流量也大大增加,就面临着数据安全问题,…

手把手教你实现通讯录

整体构思 我们现在要实现一个通讯录 它应该有以下的功能 通讯录可以用来存储1000个人的信息,每个人的信息包括:姓名、性别、年龄、电话、住址 提供方法: 1.添加联系人信息 2.删除指定联系人信息 3.查找指定联系人信息 4.修改指定联系人信…

如何删除BigKey2

例2:假如有hash类型的key,其中有100万对field和value,field是自增id,这个key存在什么问题?如何优化? keyfieldvaluesomeKeyid:0value0..........id:999999value999999 存在的问题: hash的ent…

BJFUOJ-C++程序设计-实验2-类与对象

A 评分程序 答案&#xff1a; #include<iostream> #include<cstring>using namespace std;class Score{ private:string name;//记录学生姓名double s[4];//存储4次成绩&#xff0c;s[0]和s[1]存储2次随堂考试&#xff0c;s[2]存储期中考试&#xff0c;s[3]存储期…

机器学习:深入解析SVM的核心概念【二、对偶问题】

对偶问题 **问题一&#xff1a;什么叫做凸二次优化问题&#xff1f;而且为什么符合凸二次优化问题&#xff1f;**为什么约束条件也是凸的半空间&#xff08;Half-Space&#xff09;凸集&#xff08;Convex Set&#xff09;半空间是凸集的例子SVM 约束定义的半空间总结 **问题二…

使用Colab的高RAM模式

使用Colab的高RAM模式 colab需要升级为pro或者pro会员 1. 购买pro 图片来源&#xff1a;https://blog.csdn.net/javastart/article/details/138094086 2. 打开高RAM模式 要在Colab上使用高RAM模式来运行模型计算&#xff0c;您需要按照以下步骤操作&#xff1a; 打开您的…

Deep Learning Part Five RNNLM的学习和评价-24.4.30

准备好RNNLM所需要的层&#xff0c;我们现在来实现RNNLM&#xff0c;并对其进行训练&#xff0c;然后再评价一下它的结果的。 5.5.1 RNNLM的实现 这里我们将RNNLM使用的网络实现为SimpleRnnlm类&#xff0c;其层结构如下&#xff1a; 如图 5-30 所示&#xff0c;SimpleRnnlm …

调教AI给我写了一个KD树的算法

我不擅长C&#xff0c;但是目前需要用C写一个KD树的算法。首先我有一份点云数据&#xff0c;需要找给定坐标范围0.1mm内的所有点。 于是我开始问AI&#xff0c;他一开始给的答案&#xff0c;完全是错误的&#xff0c;但是我一步步给出反馈&#xff0c;告诉他的问题&#xff0c;…

基于Springboot的交流互动系统

基于SpringbootVue的交流互动系统的设计与实现 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringbootMybatis工具&#xff1a;IDEA、Maven、Navicat 系统展示 用户登录 首页 帖子信息 聚会信息 后台登录 后台管理首页 用户管理 帖子分类管理 帖子信息…

【模板】二维前缀和

原题链接&#xff1a;登录—专业IT笔试面试备考平台_牛客网 目录 1. 题目描述 2. 思路分析 3. 代码实现 1. 题目描述 2. 思路分析 二维前缀和板题。 二维前缀和&#xff1a;pre[i][j]a[i][j]pre[i-1][j]pre[i][j-1]-pre[i-1][j-1]; 子矩阵 左上角为(x1,y1) 右下角(x2,y2…

自然语言处理基础

文章目录 一、基础与应用简单介绍基本任务重要应用 二、词表示与语言模型词表示方案一&#xff1a;用一组的相关词来表示当前词方案二&#xff1a;one-hot representation&#xff0c;将每一个词表示成一个独立的符号方案三&#xff1a;上下文表示法&#xff08;contextual rep…

Mamba3D革新3D点云分析:超越Transformer,提升本地特征提取效率与性能!

DeepVisionary 每日深度学习前沿科技推送&顶会论文分享&#xff0c;与你一起了解前沿深度学习信息&#xff01; Mamba3D革新3D点云分析&#xff1a;超越Transformer&#xff0c;提升本地特征提取效率与性能&#xff01; 引言&#xff1a;3D点云分析的重要性与挑战 3D点云…

Python语言零基础入门——文件

目录 一、文件的基本概念 1.文件 2.绝对路径与相对路径 3.打开文件的模式 二、文件的读取 三、文件的追加 四、文件的写入 五、with语句 六、csv文件 1.csv文件的读取 2.csv文件的写入 七、练习题&#xff1a;实现日记本 一、文件的基本概念 1.文件 文件是以计算…

【Android学习】简易计算器的实现

1.项目基础目录 新增dimens.xml 用于控制全部按钮的尺寸。图片资源放在drawable中。 另外 themes.xml中原来的 <style name"Theme.Learn" parent"Theme.MaterialComponents.DayNight.DarkActionBar">变为了&#xff0c;加上后可针对button中增加图片…

最新AI创作系统,ChatGPT商业运营系统网站源码,SparkAi-v6.5.0,Ai绘画/GPTs应用,文档对话

一、文章前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统&#xff0c;支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美&#xff0c;那么如何搭建部署AI创作ChatGPT&#xff1f;小编这里写一个详细图文教程吧。已支持…

【C语言的完结】:最后的测试题

看到这句话的时候证明&#xff1a; 此刻你我都在努力~ 个人主页&#xff1a; Gu Gu Study ​​ 专栏&#xff1a;语言的起点-----C语言 喜欢的一句话&#xff1a; 常常会回顾努力的自己&#xff0c;所以要为自己的努力留下足迹…

Delta lake with Java--数据增删改查

之前写的关于spark sql 操作delta lake表的&#xff0c;总觉得有点混乱&#xff0c;今天用Java以真实的数据来进行一次数据的CRUD操作&#xff0c;所涉及的数据来源于Delta lake up and running配套的 GitGitHub - benniehaelen/delta-lake-up-and-running: Companion reposito…

软件无线电系列——信道编译码

微信公众号上线&#xff0c;搜索公众号小灰灰的FPGA,关注可获取相关源码&#xff0c;定期更新有关FPGA的项目以及开源项目源码&#xff0c;包括但不限于各类检测芯片驱动、低速接口驱动、高速接口驱动、数据信号处理、图像处理以及AXI总线等 本节目录 一、信道编译码 1、数字…