【ECCV 2024】首个跨模态步态识别框架:Camera-LiDAR Cross-modality Gait Recognition

【ECCV 2024】首个跨模态步态识别框架:Camera-LiDAR Cross-modality Gait Recognition

  • 简介:
  • 主要方法:
  • 实验结果:

论文:https://arxiv.org/abs/2407.02038

简介:

步态识别是一种重要的生物特征识别技术。基于相机的步态识别已广泛应用于研究和工业领域。由于3D结构信息的提供,基于激光雷达的步态识别最近也开始发展。

在这里插入图片描述
然而,在某些应用程序中,相机不能识别人,如在低光环境和长距离识别场景中,激光雷达工作得很好。另一方面,激光雷达系统的部署成本和复杂性限制了其更广泛的应用。因此,在更广泛的应用中,考虑照相机和激光雷达之间的跨模态步态识别是非常必要的。

在这项工作中,我们提出了在相机和激光雷达之间的第一个跨模态步态识别框架,即CL-Gait。它采用了一个双流网络来对两种模式进行特征嵌入。由于3D和2D数据之间的固有匹配,表现出显著的模态差异,这是一个具有挑战性的识别任务。为了对齐两种模式的特征空间,即相机轮廓和激光雷达点,我们提出了一种对比的预训练策略来减轻模式差异。为了弥补预训练中缺乏配对的摄像机-激光雷达数据的不足,我们还引入了一种大规模生成数据的策略。该策略利用从单个RGB图像和虚拟摄像机中估计的单眼深度来生成伪点云,用于对比预训练。大量的实验表明,跨模态步态识别非常具有挑战性,但仍具有我们提出的模型和训练前策略的潜力和可行性。据我们所知,这是第一个解决跨模态步态识别的工作。

在这里插入图片描述

主要方法:

在这项工作中,我们提出 用于相CL-Gait 机和激光雷达之间的跨模态步态识别。CL-Gait 采用双流网络进行跨模态特征嵌入。该网络利用浅层模式特定模块,较深层模式共享模块,如图所示。

在这里插入图片描述

此外,CL-Gait采用对比学习策略对齐两种模态的特征空间,减轻模态差异,如图所示。

在这里插入图片描述
根据我们在步态识别任务中的观察,三维点云和二维图像之间的显著模态差异可能是影响模型性能的关键因素。具体来说,点云更多地关注于身体部位的三维定位,而图像则集中于个体的轮廓信息。在每个模态所关注的不同信息之间建立联系是至关重要的。受CLIP [30]的启发,我们提出了一种对比的剪影点预训练(CSPP)策略,在基于卷积的编码器中对齐两种模式的特征空间,如图3所示。训练前的过程不需要来自样本中的标识标签来进行监督。在对齐摄像机和激光雷达的成对单视图数据上进行训练后,预训练可以使模型专注于学习一个鲁棒表示,在没有直接基于身份的指导的情况下弥补模态之间的差距,并提高跨模态网络的性能。

利用预训练得到的主干来初始化跨模态嵌入网络。为了便于对大规模数据进行预训练,我们还提出了一种生成跨模态步态数据的方法,如图所示。

在这里插入图片描述
这是由于获取成对RGB和点云数据的成本高,对真实和大规模数据进行预训练具有挑战性。为了解决这个问题,我们提出了一种基于单眼深度估计的伪数据生成方法。如图所示,我们使用深度的任何东西从大规模的单个RGB图像中估计密集的深度D∈RH×W。然后,利用一个具有内参K的虚拟相机通过体素网格降采样,可以用于摄像机轮廓和激光雷达点云之间的对比预训练。具体来说,将降采样点向下投影回图像像素坐标中,获得深度图像进行对比预训练。与点云相比,RGB图像的收集成本更低,也更容易获取,因为已经有许多行人图像的公共数据集可用。我们提出的方法使合成大规模数据进行对比预训练成为可能。

实验结果:

对SUSTech1K有效的+测试集进行不同结构的评估。我们默认使用ResNet-18来提取图像特征。“L到C”表示以点云为探针,轮廓为图库的结果,“C到L”表示相反。

在这里插入图片描述
下图展示了激光雷达数据的比较。结果表明,基于点云的投影深度和插值深度最适合于交叉模态匹配。这表明三维几何信息是必要的。对于每个输入表单,都使用了性能最好的模型。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/775707.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【论文阅读】-- Strscope:不规则测量的时间序列数据的多尺度可视化

Stroscope: Multi-Scale Visualization of Irregularly Measured Time-Series Data 摘要1 引言2相关工作2.1(大型)时间序列数据可视化2.2 事件序列数据可视化2.3 评价 3问题分析3.1 数据集3.2 场景——现状3.3 设计流程3.4 设计原理 4 涟漪图&#xff1a…

十大排序:插入/希尔/选择/堆/冒泡/快速/归并/计数/基数/桶排序 汇总(C语言)

目录 前言非线性时间比较类插入排序(1) 直接插入排序(2) 希尔排序 选择排序(3) 选择排序优化版(4) 堆排序 交换排序(5) 冒泡排序(6) 快速排序hoare版本挖坑版前后指针版非递归版 归并排序(7) 归并排序递归版非递归版 线性时间比较类(8) 计数排序基数排序与桶排序 总结 前言 在计…

昇思25天学习打卡营第16天|文本解码原理——以MindNLP为例

在大模型中,文本解码通常是指在自然语言处理(NLP)任务中使用的大型神经网络模型(如Transformer架构的模型)将编码后的文本数据转换回可读的原始文本的过程。这些模型在处理自然语言时,首先将输入文本&#…

自闭症儿童的治疗方法有哪些?

身为星贝育园自闭症儿童康复学校的资深教育者,我深知自闭症谱系障碍(ASD)儿童的教育与治疗需要一个全面、个性化的方案。在星贝育园,我们致力于为孩子们提供一个充满爱与理解的环境,采用多种科学验证的教育方法&#x…

【Java11】变量的初始化和内存中的运行机制

成员变量的初始化和内存中的运行机制 系统加载类或创建类的实例时,系统自动为成员变量分配内存空间,然后自动为成员变量指定初始值。 class Person {public String name; // 实例变量public static int eyeNum; // 类变量 }var p1 Person(); var p2 …

动态线程池思想学习及实践

引言 在后台项目开发过程中,我们常常借助线程池来实现多线程任务,以此提升系统的吞吐率和响应性;而线程池的参数配置却是一个难以合理评估的值,虽然业界也针对CPU密集型,IO密集型等场景给出了一些参数配置的经验与方案…

MQ:RabbitMQ

同步和异步通讯 同步通讯: 需要实时响应,时效性强 耦合度高 每次增加功能都要修改两边的代码 性能下降 需要等待服务提供者的响应,如果调用链过长则每次响应时间需要等待所有调用完成 资源浪费 调用链中的每个服务在等待响应过程中,不能释放请求占用的资源,高并发场景下…

【后端面试题】【中间件】【NoSQL】MongoDB查询优化2(优化排序、mongos优化)

优化排序 在MongoDB里面,如果能够利用索引来排序的话,直接按照索引顺序加载数据就可以了。如果不能利用索引来排序的话,就必须在加载了数据之后,再次进行排序,也就是进行内存排序。 可想而知,如果内存排序…

【RT-thread studio 下使用STM32F103-学习sem-信号量-初步使用-线程之间控制-基础样例】

【RT-thread studio 下使用STM32F103-学习sem-信号量-初步使用-线程之间控制-基础样例】 1、前言2、环境3、事项了解(1)了解sem概念-了解官网消息(2)根据自己理解,设计几个使用方式(3)不建议运行…

DataWhale-吃瓜教程学习笔记 (七)

学习视频**:第6章-支持向量机_哔哩哔哩_bilibili 西瓜书对应章节: 第六章 支持向量机 - 算法原理 几何角度 对于线性可分数据集,找距离正负样本距离都最远的超平面,解是唯一的,泛化性能较好 - 超平面 - 几何间隔 例…

堆叠的作用

一、为什么要堆叠 传统的园区网络采用设备和链路冗余来保证高可靠性,但其链路利用率低、网络维护成本高,堆叠技术将多台交换机虚拟成一台交换机,达到简化网络部署和降低网络维护工作量的目的。 二、堆叠优势 1、提高可靠性 堆叠系统多台成…

ServiceImpl中的参数封装为Map到Mapper.java中查询

ServiceImpl中的参数封装为Map到Mapper.java中查询,可以直接从map中获取到key对应的value

【Python机器学习】处理文本数据——多个单词的词袋(n元分词)

使用词袋表示的主要缺点之一就是完全舍弃了单词顺序。因此“its bad,not good at all”和“its good,not bad at all”这两个字符串的词袋表示完全相同,尽管它们的含义相反。幸运的是,使用词袋表示时有一种获取上下文的方法&#…

LeetCode热题100刷题3:3. 无重复字符的最长子串、438. 找到字符串中所有字母异位词、560. 和为 K 的子数组

3. 无重复字符的最长子串 滑动窗口、双指针 class Solution { public:int lengthOfLongestSubstring(string s) {//滑动窗口试一下//英文字母、数字、符号、空格,ascii 一共包含128个字符vector<int> pos(128,-1);int ans 0;for(int i0,j0 ; i<s.size();i) {//s[i]…

全端面试题15(canvas)

在前端开发领域&#xff0c;<canvas> 元素和相关的 API 是面试中经常被提及的主题。下面是一些常见的关于 HTML5 Canvas 的面试问题及解答示例&#xff1a; 1. 什么是 <canvas> 元素&#xff1f; <canvas> 是 HTML5 引入的一个用于图形渲染的标签。它本身并…

能否免费使用Adobe XD?

Adobe XD不是免费的。Adobe 目前XD采用订阅模式&#xff0c;提供订阅模式 7 每天试用期结束后需要付费购买&#xff0c;具体价格根据不同的订阅计划确定&#xff0c;包括每月购买&#xff0c;包括 9.99 美元或每月 99.99 美元&#xff0c;或者选择购买Adobe CreativeCloud整体订…

【qt】如何通过域名获得IP地址?

域名是什么呢?像www.baidu.com的baidu.com就是域名. 域名相当于是网站的门牌号. 域名可以通过 DNS 解析将其转换为对应的 IP 地址. 用我们获取IP地址的方式就可以,但是现在没有可以用另一种方法. 槽函数的实现: void MainWindow::lookupHost(const QHostInfo &hostInf…

Python学习笔记29:进阶篇(十八)常见标准库使用之质量控制中的数据清洗

前言 本文是根据python官方教程中标准库模块的介绍&#xff0c;自己查询资料并整理&#xff0c;编写代码示例做出的学习笔记。 根据模块知识&#xff0c;一次讲解单个或者多个模块的内容。 教程链接&#xff1a;https://docs.python.org/zh-cn/3/tutorial/index.html 质量控制…

RedHat / CentOS安装FTP服务

本章教程,记录在RedHat / CentOS中安装FTP的具体步骤。FTP默认端口:21 1、安装 epel 源 yum install -y epel-release2、安装 pure-ftpd yum -y install pure-ftpd3、修改默认配置 # 默认配置位于 /etc/pure-ftpd/pure-ftpd.conf,在配置文件中找到下面几个参数进行修改:#…

并发、多线程和HTTP连接之间有什么关系?

一、并发的概念 并发是系统同时处理多个任务或事件的能力。在计算中&#xff0c;这意味着系统能够在同一时间段内处理多个任务&#xff0c;而不是严格按照顺序一个接一个地执行它们。并发提高了系统的效率和资源利用率&#xff0c;从而更好地满足用户的需求。在现代应用程序中&…