Augmentation Matters:一种简单而有效的半监督语义分割方法(CVPR2023)

文章目录

  • Augmentation Matters: A Simple-yet-Effective Approach to Semi-supervised Semantic Segmentation
    • 摘要
    • 本文方法
      • Random Intensity-based Augmentations
      • Adaptive Label-aided CutMix
    • 实验结果

Augmentation Matters: A Simple-yet-Effective Approach to Semi-supervised Semantic Segmentation

摘要

最近关于半监督语义分割(SSS)的研究进展迅速。尽管它们的性能很有希望,但目前最先进的方法往往以引入更多的网络组件和额外的训练程序为代价,进行越来越复杂的设计。
本文方法

  1. 遵循标准的教师-学生框架,并提出了AugSeg,这是一种简单而干净的方法,主要关注数据扰动,以提高SSS性能。
  2. 应该调整各种数据增强,以更好地适应半监督的场景,而不是直接应用监督学习中的这些技术
  3. 本文采用了一种简化的基于强度的增强方法,该方法从连续空间中选择随机数目的数据变换,并对失真强度进行均匀采样。
  4. 基于模型对不同未标记样本的估计置信度,随机注入标记信息,以自适应的方式增强未标记样本。
    在这里插入图片描述
    在这里插入图片描述

本文方法

在这里插入图片描述

  1. 标准的师生框架
  2. AugSeg通过分别最小化相应的监督损失Lx和无监督一致性损失Lu
  3. 在标记数据(x,y)和未标记数据u上训练由θs参数化的学生模型,由θt参数化的教师模型通过θs的指数移动平均(EMA)进行更新,并在未标记数据上生成伪标签pt。
  4. AugSeg的核心是对输入的未标记样本应用各种增强技术,包括弱几何增强Ag、基于随机强度的增强Ar和自适应标签辅助增强Aa。
  5. 红线和蓝线分别表示标记数据和未标记数据的正向路径。虚线表示“停止坡度”
    在这里插入图片描述

Random Intensity-based Augmentations

在这里插入图片描述
基于随机强度的增强:
在连续空间而不是有限离散空间中均匀地采样失真度
从扩充池中采样随机数目的扩充,以最大值k为界,而不是使用固定数
在增强池中删除基于强度的强转换,如反转操作。我们的池是从RandomAug中的池直接简化而来的,如表2所示。

基于随机强度的增强可以享受更好的数据多样性,并更多地适应semisuspervisored任务。
高度随机设计不会显著损害数据分布。因此,我们可以摆脱额外的特定于分发的修订和额外的过滤策略。

Adaptive Label-aided CutMix

与CutMix相关的或复制粘贴增强在监督和半监督分割任务中显示了其有效性。SSS中的最新研究在小批量内的未标记样本之间应用随机复制粘贴,并相应地修改其伪标签,然而,高度依赖伪标签可能不可避免地导致确认偏差,特别是对于一些难以训练的样本,或者在早期训练阶段。

因此,我们倾向于利用有信心的标记样本来增加未标记的数据,从而可以充分利用标记的信息。然而,将有信心的标记信息与未标记数据混合自然是有益的,但可能会充分利用未标记数据。这只是因为未标记数据的一些区域被标记样本的区域覆盖,并且在训练过程中从未使用过
在这里插入图片描述

设计了一种自适应标签辅助增强,可以充分利用标记数据,以特定于实例和置信度自适应的方式帮助对未标记样本进行训练。具体而言,我们首先估计置信度得分ρi,表示当前模型对第i个未标记实例的预测的置信度
在这里插入图片描述

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/26788.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【C语言】C预处理器(宏、文件包含、条件编译...)

一、C语言编译的预处理阶段1.1 C语言的编译过程1.2 C语言编译的预处理 二、C语言 宏2.1替换常量2.2函数宏2.3 字符串化和连接:#和##2.4 变参宏 三、文件包含:#include3.1 写法3.2 头文件的作用——声明3.3 头文件和extern 、static 四、 其他指令4.1 #un…

路径之谜 2016年国赛 深度优先搜索

目录 解题思路 AC代码: 题目描述 小明冒充 XX 星球的骑士,进入了一个奇怪的城堡。 城堡里边什么都没有,只有方形石头铺成的地面。 假设城堡地面是 nn 个方格。如下图所示。 按习俗,骑士要从西北角走到东南角。可以横向或纵向…

公司新来一00后,真让人崩溃...

2022年已经结束结束了,最近内卷严重,各种跳槽裁员,相信很多小伙伴也在准备今年的金九银十的面试计划。 在此展示一套学习笔记 / 面试手册,年后跳槽的朋友可以好好刷一刷,还是挺有必要的,它几乎涵盖了所有的…

Executor框架的两级调度模型

Executor框架的两级调度模型 在HotSpot VM的线程模型中Java线程(java.lang.Thread)被一对一映射为本地操作系统线程。Java线程启动时会创建一个本地操作系统线程;当该Java线程终止时,这个操作系统线程也会被回收。操作系统会调度…

计算机网络-网络层与链路层协议分析实验

一.实验目的 通过本实验,进一步熟悉PacketTracer的使用,学习路由器与交换机的基本配置,加深对网络层与链路层协议的理解。 二.实验内容 1.完成路由器交换机的基本配置 2.了解 ICMP 数据包的格式 3.检查ARP交换 三.实验过程 1.完成路由…

【Python】Python系列教程-- Python3 列表(十二)

文章目录 前言访问列表中的值更新列表删除列表元素Python列表截取与拼接嵌套列表列表比较Python列表函数&方法 前言 往期回顾: Python系列教程–Python3介绍(一)Python系列教程–Python3 环境搭建(二)Python系列…

【熬夜送书 | 第四期】python期末考试总结

文章目录 前言单选题程序填空题函数题编程题熬夜送书 第三期 前言 博主也是第一次接触到python语言,在考试前过了一遍python语法,因为有Java基础学习起来相对比较轻松,学校考的题相对简单一些,也是PTA上机考试,大概30…

一文说透ES6中的箭头函数表达式

一 总述 ​箭头函数表达式的语法比函数表达式更简洁,并且没有自己的this,arguments,super或new. target。箭头函数表达式更适用于那些本来需要匿名函数的地方,并且它不能用作构造函数。 二 详细 1 1个或多个参数 (param1, par…

Linux 实操篇-进程管理(重点)

Linux 实操篇-进程管理(重点) 基本介绍 在LINUX 中,每个执行的程序都称为一个进程。每一个进程都分配一个ID 号(pid,进程号)。>windows > linux每个进程都可能以两种方式存在的。前台与后台,所谓前台进程就是用户目前的屏幕上可以进行操作的。后…

基于matlab仿真带有飞机的虚拟场景

一、前言 此示例演示如何通过 MATLAB接口使用空间鼠标。 开始此示例后,带有飞机的虚拟场景将显示在 Simulink 3D 动画查看器中。您可以使用空格鼠标在场景中导航平面。通过按下设备按钮 1,您可以在当前平面位置放置标记。 此示例需要空间鼠标或其他兼容设…

chatgpt赋能python:Python就业学历要求

Python 就业学历要求 Python 是一门广泛应用于数据科学、人工智能、Web 开发和自动化等领域的编程语言,正在迅速成为行业内最受欢迎的语言之一。如果你想进入这些领域从事相关职业,那么 Python 编程技能将是你的一个优势。但是,Python 就业所…

【LeetCode全题库算法速练】2、两数相加

文章目录 一、题目🔸题目描述🔸样例1🔸样例2🔸样例3 二、代码参考 作者:KJ.JK 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 🌈 &a…

深入浅出讲解闭包及其原理

闭包 什么是闭包? 闭包的概念并不复杂,但是它的定义比较绕(就像平时经常用到它,却又说不出来是什么)。可以在一个作用域中调用函数的内部函数并访问到该函数中的作用域的成员,这就是闭包。给一个建议&…

“大四在读生”都四面成功拿到字节跳动Offer了,你还有什么理由去摸鱼?

博主大四在读,投的是字节 Data 的软件测试岗位实习生,base 杭州。 时间线: 4.12 投递4.13 安排简历筛选4.14 安排面试4.19 16:00 一面4.22 16:00 二面 4.23 8:00 三面4.23 16:00 HR 面4.23 16:30 Offer 一面 你对字节跳动的了解和认知有哪…

《架构设计》-09-分布式服务架构(注册中心、服务发布、服务调用、服务治理)

文章目录 1. 概述2. 集群容错策略3. 服务路由3.1 直接路由3.2 间接路由和注册中心3.3 路由规则3.4 服务路由/负载均衡/集群容错的关系 4. 服务发布4.1 发布启动器4.2 动态代理4.3 发布管理器4.4 协议服务器 5. 服务调用6. 服务治理 1. 概述 RPC架构的意义 解决了分布式环境下两…

C++语法(24) 哈希应用

C语法(23)-- 模拟实现unordered_set和unordered_map_哈里沃克的博客-CSDN博客https://blog.csdn.net/m0_63488627/article/details/130449452?spm1001.2014.3001.5501 目录 1.位图 1.定义 2.实现 3.应用 4.特点 2.布隆过滤器 1.介绍 2.设计场…

JavaSE01_初识Java

JavaSE-01【初识Java】 第一章:Java开发序言 1.1 Java语言概述 1、什么是Java语言 Java语言是美国Sun公司,在1995年推出的高级编程语言。 所谓编程语言,就是计算机语言,人们可以使用编程语言对计算机下达指令,让计…

LVGL学习(2):图片的转换和显示

我们在设计UI的过程中可能需要显示一些图片,本篇文章将介绍如何转换并显示一个固定的图片到lv_img中。 文章目录 1 图片转换1.1 GUI Guider1.2 在线转换 2 图片的显示 1 图片转换 和之前我写的一篇字体转换的文章一样:LVGL学习(1):中文字体…

UnityVR--组件5--Animation动画

目录 新建动画Animation Animation组件解释 应用举例1:制作动画片段 应用举例2:添加动画事件 Animator动画控制器 应用举例3:在Animator中设置动画片段间的跳转 本篇使用的API:Animation、Animator以及Animator类中的SetFlo…

MySQL学习(联结,组合查询,全文本搜索)

联结 SQL最强大的功能之一就是能在数据检索查询的执行中联结表; 关系表 为什么要使用关系表? 使用关系表可以储存数据不重复,从而不浪费时间和空间;如果有数据信息变动,只需更新一个表中的单个记录,相关…