【论文解读】Robust Collaborative 3D Object Detection in Presence of Pose Errors

CoAlign

  • 摘要
  • 引言
  • 方法
  • 实验
  • 结论

摘要

协同3D对象检测利用多个代理之间的信息交换,以在存在诸如遮挡之类的传感器损伤的情况下提高对象检测的准确性。然而,在实践中,由于定位不完善而导致的姿态估计误差会导致空间消息错位,并显著降低协作性能。为了减轻姿态误差的不利影响,我们提出了Align,这是一种新的混合协作框架,对未知的姿态误差具有鲁棒性。所提出的解决方案依赖于一种新的代理-对象姿态图建模来增强协作代理之间的姿态一致性。此外,我们采用多尺度数据融合策略来聚合多个空间分辨率的中间特征。与之前需要地面实况姿态进行训练监督的工作相比,我们提出的CoAlign更实用,因为它在训练中不需要任何地面实况姿态监督,也没有对姿态误差做出具体假设。在多个数据集上对所提出的方法进行了广泛的评估,证明CoAlign显著降低了相对定位误差,并在存在姿态误差时实现了最先进的检测性能。代码可供研究界使用,网址为https://github.com/yifanlu0227/CoAlign.

引言

为了相互共享有效信息,多个代理需要精确的姿势来同步他们的个人致的空间坐标系中的数据,这是协作的基础。然而,每个代理的定位模块估计的6个DoF姿态在实践中并不完美,导致了所需的相对姿态误差。这种相对姿态误差将从根本上降低协作质量。为了解决这个问题,以前的工作考虑了各种方法来提高姿态鲁棒性[15],[16],[17],[18]。例如,[17]设计了姿态回归模块来学习姿态校正;[18]使用3D点的语义标签来寻找逐点对应关系。然而,这些方法需要训练数据中的真实姿态。尽管训练数据中的姿势错误可以离线纠正,但这种标记过程可能代价高昂且不完美。
受此限制,我们提出了一种新的混合协作框架CoAlign,它使多个代理能够共享中间特征和单代理检测结果。CoAlign可以在训练阶段处理任意姿势错误,而无需任何精确的姿势监督。为了实现这一点,核心思想是利用新的主体-对象姿态图优化来对齐场景中主体和检测到的对象之间的相对姿态关系,提高姿态一致性。这里,姿势一致性意味着从多个代理的角度来看,对象的姿势应该是一致的。由于我们的agent对象姿态图在优化过程中不使用任何训练参数,因此该方法具有较强的泛化能力,能够适应任意水平的姿态误差。为了有效缓解位姿误差的影响,我们进一步考虑了一种多尺度中间融合策略,该策略在多个空间尺度上全面聚合协作信息。
我们的贡献:

  • 我们提出了CoAlign,这是一种新的基于多智能体协作激光雷达的3D检测框架,可处理训练和测试阶段的未知姿态误差;
  • 我们提出了一种新的agent对象姿态图建模和优化方法,通过提高相对姿态的一致性来校正多个agent之间的相对姿态;
  • 我们进行了大量的实验来验证CoAlign可以大大降低相对姿态误差,并实现更准确、更稳健的3D检测性能。

方法

在这里插入图片描述
(特征编码->传输特征->融合->解码)

我们的策略
在这里插入图片描述
(特征编码->校正->传输特征->融合->解码)

在这里插入图片描述
CoAlign概述。在通信之前,每个代理使用输入原始观测来i)预测具有不确定性估计的边界框ii)生成中间特征。代理打包i)和ii),并测量姿势并向其他代理广播。通过聚合传入消息,每个代理构建代理对象姿势图,并局部优化相对姿势。校正后的姿态用于将特征图扭曲到自我坐标,然后通过多尺度中间融合模块。最后,将融合的特征解码为最终的检测输出。

  • encoder: 我们可以利用现成的设计,如PointPillars[1],为第i个代理生成中间特征Fi和估计的边界框Bi。请注意,对于每个边界框,我们还估计其不确定性.
  • correct: 组合所有损失函数,训练单体检测与不确定性估计的总损失为Ltotal=Lcls+αregLreg+αcenter(Lx+Ly)+αθLθ,其中Lcls是对象分类的交叉熵损失,Lreg是盒参数回归的平滑L1损失,αreg、αcenter、αθ是用于平衡的超参数
  • fusion: 在空间对齐之后,每个代理聚合其他代理的协作信息,并获得更具信息性的特征。然而,即使在相对姿态校正之后,特征图之间的错位也可能仍然存在。为了进一步减轻姿态噪声的影响,我们采用了一种多尺度融合方法,该方法融合了多个空间尺度上的特征。较细尺度的特征可以提供更详细的几何和语义信息,而较粗尺度的特征对姿态误差不太敏感。

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结论

本文提出了一种新的用于鲁棒三维对象检测的混合协作框架CoAlign。所提出的代理对象姿态图优化使CoAlign能够在没有任何精确姿态监督的情况下处理任意姿态误差。CoAlign不仅可以显著降低相对姿态噪声,而且可以提高检测能力和鲁棒性。此外,CoAlign不依赖于某些数据模态,也可以应用于基于相机的3D检测。在未来的工作中,我们将在多模式数据上扩展我们的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/429096.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

使用html网页播放多个视频的几种方法

前言 因为项目测试需要,我需要可以快速知道自己推流的多路视频流质量,于是我想到可以使用html网页来播放视频,实现效果极其简单,方法有好几种,以下是几种记录: 注意:测试过,VLC需要使…

微服务:Feign篇

1.什么是Feign Feign是一种声明式、模板化的HTTP客户端,可用于调用HTTP API实现微服务之间的远程服务调用。它的特点是使用少量的配置定义服务客户端接口,可以实现简单和可重用的RPC调用。 先来看我们以前利用RestTemplate发起远程调用的代码&#xff…

卡密交易系统 卡密社区SUP系统源码 分销系统平台 分销商城系统开发

卡密社区SUP系统总控源码主站分销系统功能源码 跟以前的卡盟那种控制端差不多总控可以给别人开通,分销,主站,类似自己做系统商一样,自助发卡,卡密交易系统。 搭建环境Nginx1.22 mysql 5.7 php8.1 rids 7.2 安装方法…

【C++】十大排序算法之 插入排序 希尔排序

本次介绍内容参考自:十大经典排序算法(C实现) - fengMisaka - 博客园 (cnblogs.com) 排序算法是《数据结构与算法》中最基本的算法之一。 十种常见排序算法可以分为两大类: 比较类排序:通过比较来决定元素间的相对次序…

鸿蒙开发就业前景以及发展方向分析~

鸿蒙操作系统作为华为公司自主研发的操作系统,已经成为当下炙手可热的话题。作为一个全新的操作系统,鸿蒙开发为IT行业带来了巨大的就业机会。本文将围绕鸿蒙开发的就业前景以及发展方向展开讨论。 一、鸿蒙开发就业前景 随着鸿蒙操作系统的发布&#…

二叉树——从中序与后序遍历序列构造二叉树、654. 最大二叉树、617. 合并二叉树

从中序与后序遍历序列构造二叉树 给定两个整数数组 inorder 和 postorder ,其中 inorder 是二叉树的中序遍历, postorder 是同一棵树的后序遍历,请你构造并返回这颗 二叉树 。 示例 1: 在这里插入代码片 输入:inorder [9,3,15…

leetcode 热题 100_和为 K 的子数组

题解一: 前缀和数组哈希表:可以计算所有子数组之和暴力求解,但复杂度太高。对于子数组求和的过程,我们可以采用前缀和数组进行优化,前缀和数组中pre[index]代表nums[0]~nusm[index]之和,当我们要计算子数组…

NLP评价指标

一、分类任务常见评估: 准确度(Accuracy) 评估预测正确的比例,精确率(Precision) 评估预测正例的查准率,召回率(Recall) 评估真实正例的查全率。如果是多分类,则每个类别各自求P、R最终求平均值。 TP(True Positives…

SwiftUI 在 App 中弹出全局消息横幅(上)

功能需求 在 SwiftUI 开发的 App 界面中,有时我们需要在全局层面向用户展示一些消息: 如上图所示:我们弹出的全局消息横幅位于所有视图之上,这意味这它不会被任何东西所遮挡;而且用户可以点击该横幅关闭它。这是怎么做到的呢? 在本篇博文中,您将学到以下内容 功能需求…

mac电脑使用pyinstaller打包python脚本

pyinstaller -F template.py 出现报错"AssertionError: Executable contains code signature!" 移除签名 codesign --remove-signature /Users/f7692281/PycharmProjects/TPtestlist/transmit_v6.0.py 打包命令 pyinstaller --windowed transmit_v6.0.py pyinst…

如何使用两个 ESP32-DevKit 开发板的 SDIO 接口测试 AT 固件?

文档参考 ESP32 SDIO AT GuideSDIO 硬件接线说明 硬件准备 两个 ESP32-DevKit 开发板10 KHz 电阻长度低于 10cm 的杜邦线 管脚ESP32 SDIO HostESP32 SDIO SlaveCLK1414CMD1515DAT022DAT144DAT21212DAT31313GNDGNDGND 1-bit SD 模式(默认)&#xff1…

HTTP代理扫描的技术解析(HTTP代理扫描的技术原理和使用方法)

HTTP代理扫描的技术解析 近年来,随着互联网的快速发展,HTTP代理扫描技术也日益成熟。HTTP代理扫描是指通过扫描网络中的HTTP代理服务器,获得有效代理的IP地址和端口,进而实现网络请求的转发。通过HTTP代理扫描,用户可…

深入了解直播美颜SDK,美颜SDK是什么?

在实现直播美颜功能的背后,美颜SDK扮演了重要的角色。今天,笔者将为大家讲解美颜SDK的定义、功能以及在直播行业中的应用。 一、美颜SDK的定义 美颜SDK是一种软件开发工具包,旨在为应用开发者提供一套实现美颜功能的接口和算法。它通常包含…

探究java反射取值与方法取值性能对比

探究java反射取值与方法取值性能对比 由于我开发框架时,经常需要对象取值。常用的取值方式有: 反射取值方法调用取值 环境 同一台电脑: jdk 21.0.2 idea 2023.3.3 1. 测试代码(常用) 1.1 反射取值 public stat…

从零开始手写RPC框架(4)

这一节主要讲述网络传输模块的代码,并且几乎每一行代码都加上了我个人理解的注释,同时也讲述了其中一些以前没见过的函数,和大致的底层运行逻辑。 目录 网络传输实体类网络传输实现基于Socket实现网络传输基于Netty实现网络传输客户端服务端 …

华为---MSTP(一)---MSTP生成树协议

目录 1. MSTP技术产生背景 2. STP/RSTP的缺陷 ​编辑 2.1 无法均衡流量负载 2.2 数据使用次优路径 3. MSTP生成树协议 3.1 MSTP相关概念 3.2 MSTP树生成的形成过程 4. MSTP报文 1. MSTP技术产生背景 RSTP在STP基础上进行了改进,实现了网络拓扑快速收敛。但…

【k8s管理--可视化界面】

1、可视化界面的软件 kubernetes的可视化软件有以下这些kubernetes dashboard:https://github.com/kubernetes/dashboardkubesphere官网: https://kubesphere.io/zh/rancher 官网: https://www.rancher.cn/kuboard 官网: https:/…

C++11常用知识分享(一)【列表初始化 || 简化声明 || 范围for || 左右值 || 可变参数模板】

目录 一. 列表初始化 1)用法 2) initializer_list 小节: 二,简化声明 1) ,auto 2) ,decltype类 3),nullptr 三,范围for 四,C11后,STL容器变化 五&#xff0c…

【数据结构】实现堆

大家好,我是苏貝,本篇博客带大家了解堆,如果你觉得我写的还不错的话,可以给我一个赞👍吗,感谢❤️ 目录 一. 堆的概念及结构二. 堆的实现堆的结构体初始化销毁插入数据删除数据(默认删除堆顶即…

【JS】WebSocket实现简易聊天室

【JS】WebSocket实现简易聊天室 聊天室思路示例 聊天室思路 聊天室思路 1、连接服务器先建立连接,默认生成匿名用户(admin01) 2、客户端发送消息,其它客户端用户都会同步接收消息(服务端接受消息广播所有连接用户) 3、客户端修改昵称,其它客…