【点云语义分割】弱监督点云语义分割-双教师指导的对比学习

Weakly Supervised Learning for Point Cloud Semantic Segmentation With Dual Teacher

摘要:

        为了增强特征学习能力,我们在这项工作中引入了双教师指导的对比学习框架,用于弱监督点云语义分割。双教师框架可以减少子网络耦合,促进特征学习。此外,交叉验证方法可以过滤掉低质量样本,伪标签校正模块可以提高伪标签的质量。经过清理的未标记数据被用于根据每个类别的原型构建对比损失,从而进一步提高分割性能。

介绍:

        早期曾有过一些半监督或弱监督点云分割的尝试 [9]、[10]。最近,这类工作通常基于具有对比学习功能的连体网络 [11]、[12]、[13]、[14]、[15]。然而,这些研究存在一些局限性。首先,由于每个连体网络中的子网络具有相同的权重,它们通常依赖于专门的数据扰动来适应不同的场景 [11]、[12]、[13]。这就阻碍了弱监督学习在处理新数据集时的应用。其次,使用复杂的标签传播策略生成伪标签有时会导致错误预测的误差累积[14],[16]。

        为了克服这些局限性,我们为弱监督学习框架引入了教师指导方法。如图 1 所示,许多传统的教师指导方法在训练中都会遇到网络耦合问题 [17], [18],而我们则为弱监督点云语义分割构建了一个双教师指导对比学习(Dual-teacher-guided Contrastive Learning,DCL)框架,由两对学生和教师网络组成。同一对中的教师和学生模型通过指数移动平均和一致性正则化进行更新,以便从未标明的数据中学习知识。每个教师模型还交叉指导不同配对中的学生模型,以避免网络耦合和偏差积累。

        具体来说,我们利用教师模型对未标记数据的预测作为伪标签。为了获得可靠的伪标签,我们整合了双教师模型的预测结果,我们采用交叉验证的方法来过滤低质量的伪标签。此外,在交叉验证结果的基础上,我们构建了每个类别的教师指导原型,并提出了学生模型的伪标签校正模块?。所有弱监督损失都建立在特征级,这可以减少错误伪标签的干扰。对于无标签数据,我们的双教师指导对比学习框架鼓励学生模型从教师模型中转移特征知识。

相关工作:

Point Cloud Semantic Segmentation:

        最近,以 PointNet [1] 和 PointNet++ [2] 为先驱,许多基于深度学习的方法被提出用于点云场景理解,特别是分类和分割。PointNet 是一种端到端的多层感知器网络,可以直接处理无序点云,PointNet++ 使用分层分组技术扩展了原有的 PointNet 架构。RandLA-Net [5] 采用随机抽样和局部特征聚合方法,保留了复杂的局部结构,对大规模点云具有很高的效率。RepSurf [19] 提出了一种新颖的特征表示法,利用伞状曲率来描述点云的空间结构。PointNeXt [3] 通过系统分析各个模块,重新审视了经典的 PointNet++。它提出了一种倒置残差瓶颈设计和可分离的 MLP。基于神经辐射场的方法 [20]、[21]、[22] 通过捕捉更精确的几何结构,为三维点云语义分割提供了强大的特定场景隐式表示。有几种方法 [23]、[24]、[25] 应用变换器和自我注意机制来处理点云。虽然这些方法在各种基准数据集上取得了长足的进步,但它们一般都需要完全注释的训练数据,需要付出密集而昂贵的劳动。

Weakly Supervised Learning on Point Cloud

        对于弱监督学习来说,关键是从大量未标记数据中学习知识[26],[27]。Xuet 等人[28]提出了一种基于深度学习背景的弱监督方法,在这种方法中,训练只需要极少部分的标记点。Zhang 等人[14]构建了一个自监督预处理任务,通过着色学习先验分布,并提出了一种针对无标签点的稀疏标签传播方法。OTOC [29] 是一种新颖的自训练方法,带有一个图传播模块,用于迭代训练和标签传播。受自我监督学习的启发,PSD[12]采用了一种自我蒸馏框架,旨在实现扰动样本和原始样本之间的预测一致性。考虑到语义相似性,HybridCR [13] 引入了局部和全局引导的对比正则化,以促进点云的特征学习。SQN [30] 是一种语义查询网络,可为弱监督训练提供相关语义特征,它由一个点局部特征提取器和一个灵活的点特征查询网络组成。DAT[11]包含用于在点级和区域级扰动原始点云的自适应变换,旨在加强点云的局部和结构平滑性约束。然而,这些弱监督方法大多基于连体网络?,而连体网络更容易受到数据耦合和误差累积的影响。在这中,我们引入了教师和学生网络,以缓解弱监督点云分割中的这些问题。

Contrastive Learning

        对比学习已被证明是一种有效的无监督学习技术。其核心思想是鼓励目标样本更接近同一类别的其他样本,同时远离不同类别的负面样本。PointContrast [31] 将对比学习引入点云场景,并提出了利用未标记点的 PointInfoNCE 损失。它随机选择不匹配的点作为负样本,当大部分节点来自同一类别时,这可能会影响特征学习。Jiang 等人[15]构建了一个记忆库,以确保从不同类别中选择负样本。HybridCR [13] 使用置信度阈值来选择用于计算对比损失的伪标签。

        由于所选样本的质量是对比学习的关键,因此在这项工作中,我们提出了一种交叉验证方法来过滤低质量样本,并提出了一个伪标签校正模块来提高对比学习的效果。

模型方法:

        为了增强对比学习的效果并缓解耦合问题,我们提出了一种简单而高效的双教师指导对比学习框架,用于弱监督语义分割,如图 2 所示。首先,将原始点云数据和扰动点云数据输入两对师生模型。整个框架由四个主要部分组成:监督分支,教师指导一致性正则化、交叉指导对比性正则化和伪标签校正模块。弱监督部分在特征级构建损失函数,促进学生模型从教师模型中学习高质量的表示方法。

        在此框架内,教师模型由历史学生模型的指数移动平均值(EMA)获得,因此可以提供更稳定的预测。教师模型预测的伪标签可以通过反向传播与其他损失函数一起交叉指导不同配对的学生模型。虽然教师模型或学生模型都可以用于推理,但我们在测试过程中习惯使用学生模型进行推理。 

        定义和术语如下。形式上,我们将 X = {XL,XU } 定义为训练数据集,其中 XL 是标注数据集,XU 是未标注数据集。在弱监督设置中,只有很小一部分训练数据是有标签的。然后,我们还应用一般的数据扰动方法来转换原始数据,扰动后的数据集定义为̃ X,它同样由一个有标签的数据集̃ XL 和一个无标签的数据集̃ XU 组成。

Network Architecture

        在弱监督点云语义分割中,给定大量带有极小部分标签的点作为输入,网络训练的目标是学习将输入数据映射到标签的函数。拟议的框架由以下两对师生网络组成:

 

        其中,S 和 T 分别代表学生模型和教师模型,下标 a 和 b 表示两对不同的模型。通过相应的权重 W,这些模型可以将输入数据 x 或  ̃ x 映射为输出标签 Y、置信度向量 P 和嵌入特征 F,上标代表相应的输入。变量中的下标表示相应的模型。 

Supervised Branch

        在弱监督学习中,标注数据通常用于交叉熵损失监督学习。然而,由于分类不平衡,某些类别中的标注数据可能很少,这会导致过度拟合。为了缓解这一难题,我们在监督学习过程中平滑真实标签,以计算交叉熵损失。给定与标注数据点 xl 相对应的one-hot处理格式的真实标签 Y (xl) L,我们对标签进行如下平滑处理:

其中,Nc 是类别数,ε 是平滑系数,默认情况下等于 0.2

        那么,学生模型 Sa 和 Sb 的监督损失如下:

Teacher-Guided Consistency Regularization 

        在这一部分,我们将重点关注如何利用大量未标注数据。其基本思想是一致性正则化,即强制模型在各种扰动下产生一致的预测结果。在这项工作中,我们将原始数据和扰动数据输入一对学生模型和教师模型,以鼓励教师模型指导学生模型。教师引导的一致性正则化定义如下:

 Cross-Guided Contrastive Regularization

        如果同一对教师模型和学生模型相互学习,它们很可能会耦合在一起,并在迭代几次后变得相似。为了缓解这些问题,我们设计了一个双教师网络,即每个教师模型指导另一对中的学生。我们还为来自不同配对的学生和教师模型建立了对比正则化。

        首先,我们需要确定可靠的样本。如果两个教师模型对一个未标注点的预测结果相同且置信度高,我们就认为该点是可靠的,可以用来指导学生模型。因此,我们采用交叉验证的方法来过滤掉不可靠的点,具体如下。对于学生模型 Sa 和教师模型 Tb,可靠样本集 X 来自:

        P (xi) Tb 是教师模型 Tb 在 xi 点的概率输出,φ 是置信度阈值。因此,X 代表教师模型 Tb 输出的可靠样本集,用于指导学生模型 Sa。 

        其次,以学生模型 Sa 和教师模型 Tb 为样本,构建正负样本的对比正则化。这两种样本的获取方法如下。给定可靠集合 X 中的一个输入点 xi 作为锚点,由 Sa 和 Tb 提取的特征,即 F (xi) Sa 和 F (xi) Tb 形成一对正样本,这对样本在嵌入空间中预计是接近的。此外,负样本预计在嵌入空间中距离较远。我们使用二进制掩码 M(ij) 来识别 xi 和 xj 是否能形成负样本对,如下所示:

        最后,我们提出了一种交叉对比正则化方法,该方法通过不同配对的教师模型来引导每个学生模型,其定义如下:

 

Pseudo-Label Correction Module 

        为了进一步提高伪标签的质量,我们提出了一个使用原型的伪标签校正模块,如图 3 所示。

我们使用可靠样本 X 和  ̃ X 生成每个类别的当前原型:

 在每一次训练迭代中,原型都会结合上一步的训练和下一步的训练进行更新。

        校正后,我们建议在嵌入特征 F (xi) Sa 和相应的原型 Pyi 之间进行对比学习,具体如下:

 其中,yi = Y (xi) Sa,cos 为余弦相似度,τ 为温度标量。Lpacl 要求同一类别中的点靠近该类别的原型,远离其他类别的原型。Lbpcl 损失与 Lpacl 相似。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/564647.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java web应用性能分析之服务端慢[网络慢]

Java web应用性能分析之服务端慢,如果是网络原因引起的服务端慢,经常会被忽略,很多时候我们第一时间不会去排查网络原因。出现这种情况也很正常,因为应用的外部网络都是超100M的大宽带服务器,而内部则是千兆网卡或者万…

SpringCloud 与 Dubbo 的区别详解

一、Spring Cloud 和 Dubbo 的概述 1.1 SpringCloud 简介 SpringCloud 是一个用于构建云原生应用的框架集合,它为开发者提供了一套完整的工具链,用于快速搭建分布式系统。SpringCloud 基于 SpringBoot 开发,具有如下特点: 提供…

mysql常见语法操作笔记

1. 数据库的基本操作 1.1. MYSQL登录与退出 D:\phpstudy_pro\Extensions\MySQL5.7.26\bin 输入 mysql -uroot -proot -h127.0.0.1 退出的三种方法 mysql > exit; mysql > quit; mysql > \q; 1.2. MYSQL数据库的一些解释 注意:数据库就相当于文件夹 …

类和对象(2)——封装(封装的概念、包、staic)

前言 面向对象程序三大特性:封装、继承、多态。而类和对象阶段,主要研究的就是封装特性。何为封装呢?简单来说就是套壳屏蔽细节。 一、什么是封装 1.1 概念 将数据和操作数据的方法进行有机结合,隐藏对象的属性和实现细节&…

CXL论文阅读笔记整理(持续更新)

CXL 介绍 An Introduction to the Compute Express LinkTM (CXLTM) Interconnect arXiv Paper 对CXL技术进行介绍,包括CXL 1.0、CXL 2.0、CXL 3.0,对各规范的提升做介绍。整理了现有的CXL实现方法,延迟测试结果,对未来发展进行…

三分钟带你读懂面向对象的三大特征:封装,继承,多态

很多小伙伴在学面向对象的时候觉得非常抽象,尤其是对于面向对象的三大特征:封装,继承,多态不理解,那这期文章呢,九九就给大家安排,三分种带你迅速掌握封装,继承,多态。 …

17.基础乐理-调式、自然大调式(C大调、D大调。。。)

调式: 若干个音,按照某种规则排列起来,就是调式,调式是一个非常大,非常抽象的概念,调式这两个字是一个统称,当明确了 若干个音 到底有几个音,某种规则到底是什么规则之后&#xff0c…

刚拿到的《HarmonyOS应用开发者高级认证》,全网整理的题目,将近300题,100%通过

刚拿到《HarmonyOS应用开发者高级认证》,现在把题目和答案分享一下,这些题目是我根据其他网站整理的,宁滥勿缺,有个别题目是重复的,抽半天时间看一下,应该是稳过的。当然建议还是先跟着文档学一下鸿蒙或者看…

【UE5.1】使用MySQL and MariaDB Integration插件——(4)修改、插入、删除数据

目录 效果 步骤 一、修改 二、插入、删除 在上一篇博客(【UE5.1】使用MySQL and MariaDB Integration插件——(3)表格形式显示数据)基础上继续实现修改、插入和删除数据库数据的功能 效果 修改数据: 插入数据&…

【YOLO系列PR、F1绘图】更改v5、v7、v8(附v8训练、验证方式),实现调用val.py或者test.py后生成pr.csv,然后再整合绘制到一张图上(使用matplotlib绘制)

目录 1. 前提 效果图2. 更改步骤2.1 得到PR_curve.csv和F1_curve.csv2.1.1 YOLOv7的更改2.1.1.1 得到PR_curve.csv2.2.1.2 得到F1_curve.csv 2.1.2 YOLOv5的更改(v6.1版本)2.1.3 YOLOv8的更改(附训练、验证方式) 2.2 绘制PR曲线 …

在CSDN创作了6个月,我收获了什么?文末送书~

作者主页:阿玥的小东东主页! 正在学习:python和C/C 期待大家的关注哦 目录 一次很好的机会,让我开始了CSDN之旅 首先来看看我的几位领路人 创作动力 1W粉丝 在CSDN我收获了什么? 很高的展现量 认证创作者身份 社…

Linux 网络操作命令FTP

FTP命令 引言 文件传输协议(FTP)是一种用于在网络上进行文件传输的协议。在Linux系统中,FTP可以作为一个非常有用的工具来上传、下载和管理文件。本文将介绍如何在Linux系统中安装FTP服务器,以及如何使用FTP客户端进行文件传输。…

RabbitMQ进阶学习

在之前的练习作业中,我们改造了余额支付功能,在支付成功后利用RabbitMQ通知交易服务,更新业务订单状态为已支付。 但是大家思考一下,如果这里MQ通知失败,支付服务中支付流水显示支付成功,而交易服务中的订…

充电器进阶,原边恒流,单片机控制小电流(预充电)的方案

前言 很多充电器,为了能控制电流输出,也就是充电时需要有小电流、大电流的情况,都会用副边及单片机进行控制,但因为是副边控制,需要一个比较器、一个二极管、若干电阻、若干电容,整体BOM成本可能多了三毛钱…

VUE 项目 自动按需导入

你是否有这样的苦恼,每个.vue都需要导入所需的vue各个方法 unplugin-auto-import 库 Vite、Webpack和Rollup的按需自动导入API 本章提供Vite、Webpack中使用说明 1. 安装 npm i -D unplugin-auto-import 2. config.js 配置文件内追加配置 2.1 Vite // vite.conf…

用Nest实现对数据库的增删改查~

概述 为了与 SQL和 NoSQL 数据库集成,Nest 提供了 nestjs/typeorm 包。Nest 使用TypeORM是因为它是 TypeScript 中最成熟的对象关系映射器( ORM )。因为它是用 TypeScript 编写的,所以可以很好地与 Nest 框架集成。 TypeORM 提供了对许多关系数据库的支…

问题总结笔记

1.向量旋转 问题: 将一个向量旋转90 方法:旋转矩阵 FVector FrontDir EndMousePoint - Point; FrontDir.Normalize(); FVector Left FVector(-FrontDir.Y, FrontDir.X, 0); Verties.Add(Point Left * (WallWedith / 2)); Verties.Add(FVector(Vertie…

C语言 | Leetcode C语言题解之第35题搜索插入位置

题目&#xff1a; 题解&#xff1a; int searchInsert(int* nums, int numsSize, int target) {int left 0, right numsSize - 1, ans numsSize;while (left < right) {int mid ((right - left) >> 1) left;if (target < nums[mid]) {ans mid;right mid - …

Ubuntu Server 20.04 LTS 64bit安装ftp服务

1.安装vsftpd sudo apt install vsftpd2.配置vsftpd sudo vim /etc/vsftpd.conf write_enableYES # 启用任何形式的FTP写入命令&#xff0c;即可以修改文件local_umask022 # 本地用户创建文件的 umask 值&#xff0c;默认是被注释的connect_from_port_20YES # 针对 PORT 类型…

01_Nginx

文章目录 NginxNginx的核心功能Nginx的优势Nginx常用指令Nginx配置文件Nginx的核心功能&#xff1a;反向代理 Nginx Nginx (engine x) 是一个高性能的HTTP和反向代理web服务器&#xff0c;同时也提供了IMAP/POP3/SMTP服务。Nginx是一款轻量级的Web 服务器/反向代理服务器及电子…