[Semi-笔记]Switching Temporary Teachers for Semi-Supervised Semantic Segmentation

目录

  • 概要
  • 创新一:Dual Temporary Teacher
    • 挑战:
    • 解决:
  • 创新二:Implicit Consistency Learning(隐式一致性学习)
    • 挑战:
    • 解决:
  • 实验结果
  • 小结
  • 论文地址
  • 代码地址

分享一篇2023年NeurIPS的文章。

概要

半监督语义分割中流行的师生框架,主要采用指数移动平均(EMA)来更新单个教师的权重。然而,EMA 更新提出了一个问题,即教师和学生的权重耦合,导致潜在的性能瓶颈。此外,当使用更复杂的标签(例如分割掩模)进行训练但注释数据很少时,这个问题可能会变得更加严重。本文介绍了双位教师,这是一种简单而有效的方法,采用双位临时教师,旨在缓解学生的耦合问题。临时老师轮班工作,逐步提高,始终防止师生关系过于亲密。具体来说,临时教师定期轮流生成伪标签来训练学生模型,并保持每个时期学生模型的独特特征。

创新一:Dual Temporary Teacher

挑战:

半监督语义分割中流行的师生框架主要采用指数移动平均(EMA)来基于学生的权重更新单个教师的权重。问题:教师与学生的权重正在耦合,从而导致潜在的绩效瓶颈。此外,当使用更复杂的标签(例如分割掩模)进行训练但使用很少的注释数据时,这个问题可能会变得更加严重。解决:双师制,旨在缓解学生耦合问题。
Mean Teacher使用学生模型的 EMA 权重更新教师模型,而不是从集成角度与学生模型共享权重。尽管这一师生框架展现了重大影响,但一个关键问题是耦合问题,其中紧密耦合的权重会降低性能

解决:

在半监督语义分割的背景下,我们的目标是减轻传统师生框架中采用的单个 EMA 更新例程引起的耦合问题 。在改进教师模型的关键因素中,我们主要注意到的是学生模型的多样性,我们努力通过建立学生模型的多样性增强教师模型的良性循环来防止随着训练的进行教师和学生模型变​​得过于相似。反过来,改进后的教师保留了学生的多元化观点,并有效地指导了学生模型。由于学生更新了每位 EMA 教师,由于整体效应,教师在学生多样化的同时得到了增强。强化后的教师模型随后可以向学生模型提供更精细的监督信号。
该文引入了一个简单而有效的框架——双教师:一种临时EMA教师模型交替生成伪标签来指导学生模型的方法;同时,学生模型使用其自身权重的指数移动平均值更新教师模型的权重。我们声称,引入额外的 EMA 教师可以通过提供独特且多样化的监督来促进学生的多元化。如图 所示,双教师由一对教师-学生模型组成,其中两个临时教师模型在训练过程中每个时期都会切换以教授单个学生模型。
在这里插入图片描述
与之前的研究类似,采用强增强图像作为学生模型的输入,采用弱增强图像作为教师模型的输入,以确保可靠的伪标签。然而,我们没有采用传统的依赖单一固定教师模型的师生框架,而是引入了每个时期交替激活的双临时教师,为学生模型提供了多样化的指导。临时 EMA 教师捕捉学生模型不断变化的时间知识,在不同的时间步上表现得像一个时间集合。

  • 强大的增强池

为了使学生模式更加多样化,我们不仅仅依靠 EMA 教师模式,尽管有交替的双教师。为了进一步确保多样性,我们通过在每个时期转移临时教师模型时改变应用于学生模型的强增强类型来提供多样性。我们通过构建预定义但非确定性的强增强池来实现这一点,包括精细类级别和粗略区域级别增强(即 ClassMix 和 CutMix)。每个训练时期从池中随机采样一个增强,限制连续时期不使用相同的增强。

  • 更新学生和教师

简而言之,临时教师模型的使用有助于将多样性引入学生模型,而学生模型获得的多样性特征有助于教师模型的增强。学生模型的目标函数定义如下:
在这里插入图片描述
在这里插入图片描述 (2)

其中 Bu 表示训练批次中未标记图像的数量,图像大小为 H ×W,第 i 个图像上的第 j 个像素,未标记输入应用强增强的学生模型的预测 pu ij,以及相应的伪标签 ˆyu ij来自教师模型。 λu 是一个标量超参数,用于调整无监督损失权重。
其中一名临时教师在每个时期交替激活,并通过 EMA 权重保留学生模型的特征。第 k 个临时教师 k ∈ {1, …, tn} 在每个 epoch 交替切换;第 k 个临时教师的参数 θk t 根据学生参数 θs 通过 EMA 通过式(2)进行更新。

创新二:Implicit Consistency Learning(隐式一致性学习)

挑战:

解决:

我们从一致性正则化的角度引入了另一种隐式集成学习来增强我们的学生模型。在[14,38,10]的推动下,我们鼓励层子集在学生模型中活跃,并且所有这些子模型做出一致的预测。与之前的研究[38, 2]相比,在同一模型中的完整模型和子模型之间强制执行一致的预测,我们在学生模型和完整教师模型的子模型之间强制执行一致性。我们通过多功能随机深度 [14] 在学生模型中构建子模型,适用于从 CNN 模型到基于 Transformer 的模型。因此,学生模型通过以下目标函数进行训练:
在这里插入图片描述

其中~θs表示学生模型的子模型参数,下降率为τ,B是训练批次中的图像数量。请注意,我们只对教师和学生模型的输入应用弱增强,这与等式 1 不同。 3,我们分别向学生模型提供强增强输入,向教师模型提供弱增强输入。最后这个loss配合Lunsup来更新学生模型。

实验结果

在这里插入图片描述
在这里插入图片描述

小结

该文引入了一种新颖的双教师框架来解决广泛使用的师生框架中由 EMA 更新引起的耦合问题。从隐式集成学习的角度提出了一种简单而有效的方法,而不是依赖于显式集成的现有解决方案。
(1)缓解传统师生框架中使用的单一EMA更新例程所引起的耦合问题。努力防止教师和学生模式变得过于相似,建立一个良性循环,在这个循环中,学生模式的多样性增强了教师模式。
(2)经过改进的教师保留了学生的不同观点,并有效地指导了学生模式。由于学生更新了每一位EMA老师,由于合奏效应,老师在使学生多样化的同时得到了增强。强化的教师模型随后可以向学生模型提供更精细的监督信号。

论文地址

pdf地址

代码地址

https://github.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/495432.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

学浪课程提取工具blog

由于抖音的流行,带动了学浪的销售,有些人可能不知道学浪是什么,学浪其实就是抖音课堂的前身,既然学浪官方不提供下载选项,但是有需求就一定有解决需求的方案,这不,经过研究,终于研究出来了学浪下载工具 这款学浪下载工具有需要的自己下载下来,我已经打包好了 链接&#xff1a…

软件项目的外包开发流程

软件项目的开发流程是一个系统化的过程,旨在确保软件产品能够高效、稳定地满足用户需求。在中国,软件产业的发展得到了国家的大力支持,众多软件企业遵循国际标准和最佳实践,推动了软件工程的进步。 以下是一般的软件项目开发流程&…

Web API —— BOM 学习(完结)

目录 一、BOM 介绍 二、Window 对象 (一)基本介绍 (二)定时器 —— 延时函数 1.语法 2.清除时间函数 3.和 interval 间歇函数的区别 (三)JS 执行机制 1.介绍 2.同步任务 3.异步任务 4.执行过程…

JetBrains全家桶激活,分享 WebStorm 2024 激活的方案

大家好,欢迎来到金榜探云手! WebStorm公司简介 JetBrains 是一家专注于开发工具的软件公司,总部位于捷克。他们以提供强大的集成开发环境(IDE)而闻名,如 IntelliJ IDEA、PyCharm、和 WebStorm等。这些工具…

Java SPI解读:揭秘服务提供接口的设计与应用

一、什么是SPI? 在 Java 编程中,SPI(Service Provider Interface)是实现可插拔式应用的一种机制。它就像是应用程序的魔法盒,让你可以随时添加新的功能实现,而不需搞得一团糟。通过SPI,我们可以…

汇春科技之MDT10F684

目录 第一、时钟 第二,定时器Timer0 第三,pwm 汇春官网:汇春科技 (yspringtech.com) 汇春是麦肯的原厂,以下是两个论坛,其中都有关于麦肯单片机的学习论坛,可以参考学习,第一个叫英锐恩&…

康耐视visionpro-CogAcqFifoTool工具详细说明

CogAcqFifoTool操作说明: ① 打开工具栏,双击或点击鼠标拖拽 添加CogAcqFifoTool ②.从图片采集设备/图像采集卡列表里选择对应的相机,视频格式选择图像格式。 Mono表示黑白图像,RGB表示彩色相机。点击初始化取相初始化相机。 ③…

【OJ】动归练习三

个人主页 : zxctscl 如有转载请先通知 题目 1. LCR166. 珠宝的最高价值1.1 分析1.2 代码 2. 931.下降路径最小和2.1 分析2.2 代码 3. 64.最小路径和3.1 分析3.2 代码 1. LCR166. 珠宝的最高价值 1.1 分析 状态表示 以[i][j]位置为结尾,表示到达[i][j]位置…

AI大模型智能大气科学探索之:ChatGPT在大气科学领域建模、数据分析、可视化与资源评估中的高效应用及论文写作

深度探讨人工智能在大气科学中的应用,特别是如何结合最新AI模型与Python技术处理和分析气候数据。课程介绍包括GPT-4等先进AI工具,旨在帮助大家掌握这些工具的功能及应用范围。内容覆盖使用GPT处理数据、生成论文摘要、文献综述、技术方法分析等实战案例…

HN 热帖|难以想象,20 年前代码版本管理是如何做的

本文源自 Hacker News 热帖,原文 Twenty Years Is Nothing,作者 Adrian Kosmaczewski。 在之前的文章中,我们曾称英语在我们的行业中如此普遍,以至于没有人质疑其使用。同样,Git 也是如此。很难想象仅仅二十年前&#…

掌握数字化运维方法,构建数字化运维体系

文章目录 📋 前言🎯 什么是数字化转型🎯 数字化运维发展变化🎯 数字化转型书籍推荐🧩 主要内容🧩 适合读者 🔥 参与方式 📋 前言 数字化转型已经成为大势所趋,各行各业正…

Leetcode1997. 访问完所有房间的第一天

Every day a Leetcode 题目来源:1997. 访问完所有房间的第一天 解法1:动态规划 状态转移: 代码: /** lc appleetcode.cn id1997 langcpp** [1997] 访问完所有房间的第一天*/// lc codestart class Solution { private:const in…

探索定制化创新,定制你的Jetson Linux驱动开发之旅!

Jetson驱动定制开发 Jetson linux驱动定制开发 在数字创新的浪潮中,Jetson系列为我们带来了无限的可能性。然而,要想真正发挥这种潜力,我们需要更多的自由和个性化。现在,通过定制化的Jetson Linux驱动开发,你可以实…

MYSQL8最新安装教程 ! ! !

MYSQL8最新安装教程 安装配置MySql一、下载MySql进入官网:https://dev.mysql.com 二、新建文件夹管理Mysql系列文件三、配置my.ini文件四、执行数据库初始化命令五、基础配置六、配置系统环境变量 可能会遇到无法启动MYSQL服务的问题:一、尝试删除MySQL服务&#xf…

揭秘:为何单点登陆方案(SSO)已无法满足现代企业的身份管理需求,统一身份中台才是未来

在信息化建设的浪潮中,企业面临着越来越多的应用系统管理和用户身份认证问题。许多企业最初可能认为,单点登录(SSO)系统就是他们所需要的解决方案,用以简化用户在多个系统间的登录过程。然而,随着业务的发展…

正大国际:黄金投资稳定与保值的避险之选

黄金作为备受投资者追捧的贵金属,在金融市场中扮演着重要的角色。黄金作为一种避险资产具有稳定性和保值特性,能够在市场动荡时提供投资者的资金保护, 正大召煮4/26/12 xiaoccsw 避险需求:当股票市场、货币市场或其他资产类别表现不佳时&a…

电脑关机速度很慢怎么解决?

给电脑关机,总是要很久才完全关闭。这是因为计算机运行了太长时间,并且打开的程序太多,则关闭时间超过十秒钟,这是正常的现象。还有就是计算机升级或补丁程序更新也将导致计算机缓慢关闭。此时,建议耐心等待关闭完成。还有可能是系统故障了。接下来分享电脑关机速度很慢怎…

高中数学:零点综合题型(拔高)

一、零点与交点 关键原则 1、数形结合 2、方程思想 例题1 解题思路 1、函数转化成方程 2、零点问题转化成交点问题 3、数形结合 4、对数运算法则(函数值的和 转化成 x的积) 二、分段函数零点 关键原则 1、分段函数分段看 2、数形结合 3、零点转交点…

springboot多模块

这里springboot使用idea中的 Spring Initializr 来快速创建。 一、demo 1、创建父项目 首先使用 Spring Initializr 来快速创建好一个父Maven工程。然后删除无关的文件,只需保留pom.xml 文件。 (1)new Project -> spring initializr快…