自动驾驶理论新突破登Nature子刊!清华、密歇根联合提出三条技术路线,剑指「稀疏度灾难」

自动驾驶理论新突破登Nature子刊!清华、密歇根联合提出三条技术路线,剑指「稀疏度灾难」
在这里插入图片描述

近日,清华大学与密歇根大学联合提出的自动驾驶汽车安全性「稀疏度灾难」问题,发表在了顶刊《Nature Communications》上。研究指出,安全攸关事件的稀疏性导致深度学习模型训练难度大增,提出了密集学习、模型泛化改进和车路协同等技术路线以应对挑战。

随着自动驾驶技术的快速发展,交通系统迎来了前所未有的变革。尽管自动驾驶技术在过去二十年中取得了显著进步,但L4级别自动驾驶汽车尚未实现商业化,其主要原因是安全性能尚未达到大规模应用的要求。

自动驾驶汽车(Autonomous Vehicle,AV)在真实道路上的测试已达数百万公里,但仍无法有效处理多种安全攸关事件,这些事件的概率分布呈现长尾特征,称为自动驾驶汽车安全性的长尾挑战(Long-Tail Challenge)。

然而,此问题在已有文献中尚未正式定义,这种理解的缺乏严重阻碍了解决这一问题的进程。

为此,清华大学助理教授封硕和密歇根大学Mcity主任、讲席教授刘向宏(Henry Liu)合作在国际上首次提出了自动驾驶汽车安全性挑战背后的关键科学问题——稀疏度灾难(Curse of Rarity,CoR),该研究成果作为评论文章(Comment)发表在Nature子刊《Nature Communications》

论文链接:https://doi.org/10.1038/s41467-024-49194-0

前序工作:https://www.tsinghua.edu.cn/info/1175/102314.htm

研究证明,随着安全攸关事件的稀疏度增加,深度学习梯度的估计方差会指数增加,使得模型训练所需数据量和计算量指数增加,严重阻碍了模型在安全攸关任务的学习能力。

由于深度学习在自动驾驶领域应用的广泛性,稀疏度灾难广泛存在于自动驾驶的感知、预测、决策、测试等安全攸关任务中,造成了自动驾驶汽车的安全性挑战。

在此基础上,研究提出了三种解决稀疏度灾难的技术路线,包括使用安全攸关数据进行密集学习、改善模型泛化和推理能力以及利用车路协同等技术降低安全风险事件发生概率。

什么是稀疏度灾难?

通俗地讲,稀疏度灾难是指真实驾驶环境高维空间中的安全攸关事件(Safety-critical Events)的发生概率极低,导致车辆驾驶数据中包含的安全攸关事件的信息极端稀疏,安全攸关事件的信息被大量的常规驾驶数据所掩盖,导致深度学习模型难以对这些安全攸关事件进行学习。

更糟糕的是,自动驾驶汽车更好的安全性能也意味着安全攸关事件的发生频率进一步降低,导致深度学习模型更加难以对安全攸关事件进行学习。

理论上分析,稀疏度灾难是指深度学习的梯度方差随着安全攸关事件的稀疏度增加而指数增加,导致深度学习所需数据和计算量相应指数增加。

深度学习的关键在于获得神经网络的最优参数,梯度下降方法在每个训练步使用一批数据来估计损失函数的梯度,然而随着安全攸关事件稀疏度的增加,梯度估计的方差可能会呈指数增长,导致稀疏度灾难。

稀疏度灾难给自动驾驶带来哪些挑战?

由于深度学习方法在自动驾驶领域应用的广泛性,稀疏度灾难广泛存在于自动驾驶的感知、预测、决策、测试等安全攸关任务中,导致自动驾驶汽车面临安全性挑战。

  1. 感知

自动驾驶的感知任务是从周围环境中获取信息并提取相关知识。在这一任务中,不少研究者讨论了数据不平衡的问题,即只有一小部分的数据类别具有大量样本,而其他类别只有非常少的样本。

然而,对于自动驾驶汽车的安全攸关感知任务来说,不平衡比(Imbalance Ratio)往往极高(例如,可能达到),而现有的方法,如类再平衡、信息增强­和模块改进等方法,往往不足以解决这一问题,因为它们只能处理有限的不平衡比(通常小于)。

不平衡比的这种数量级上的显著差异导致不平衡数据的问题转变为稀疏度灾难的问题。此外,即使每个感知错误看起来都微不足道,一系列感知错误的累积效应将会十分危险。

例如,单帧的对象分类错误可能不是什么问题,而连续多帧的分类错误则可能导致安全攸关事件发生,这种序列的发生概率远低于任何单个错误的发生概率,因此稀疏度灾难的问题会更加严重。

  1. 预测

自动驾驶汽车的高安全性能要求需要对周围交通参与者的行为进行精确的建模和准确的预测。在安全攸关场景下,即使是预测中的微小错误也是不可接受的。

例如,在乱穿马路的情况下,行人轨迹的精确预测对于自动驾驶汽车避免碰撞至关重要。一个小的预测误差可能会导致误报或漏报,让自动驾驶汽车的驾驶决策过于谨慎或过于自信,从而导致事故。

同样的,驾驶行为仿真中的不准确性可能导致低估或高估自动驾驶汽车的安全性能,从而误导自动驾驶汽车的研发过程。

  1. 决策

深度模仿学习和深度强化学习等深度学习技术已被应用于自动驾驶汽车的决策过程。然而,当涉及到安全攸关场景时,由于缺乏真实世界的数据,深度学习模型可能会受到稀疏度灾难的影响。

这种稀疏性导致策略梯度估计方差较大,阻碍深度学习进行有效学习。另一类确保决策安全的方法则基于一系列假设。

典型假设包括可获得自动驾驶汽车的系统模型,其特征可能是是有界的未知动力学和噪声。但是由于存在稀疏度灾难问题,当遇到高维驾驶环境中的安全攸关事件时,这些假设往往难以保证。

  1. 测试

自动驾驶汽车安全性的测试评估对自动驾驶汽车的广泛部署至关重要。现阶段通常将仿真测试、封闭场地测试和道路测试相结合,在自然驾驶环境中测试自动驾驶汽车。然而,由于稀疏度灾难,评估自动驾驶汽车的安全性往往需要数十亿英里。

为了加速这一过程,研究者提出了多种方法,如基于场景测试方法,这些方法侧重于在定制化生成的场景中测试自动驾驶汽车。然而,稀疏度灾难给生成时空复杂的安全攸关场景带来了严峻的挑战。

例如,由于生成复杂安全攸关场景时的较大方差,基于重要性采样的方法可能会出现严重的低效性,因此许多现有方法仅限于处理具有有限动态对象的短场景片段,有较强的时空局限性,无法捕捉真实世界安全攸关事件的全部复杂性和随机性。

如何解决稀疏度灾难?

针对自动驾驶汽车的稀疏度灾难,研究给出了给出三种可能的技术路线,三种技术路线可以互相补充。

路线1:使用更多安全攸关事件数据进行有效训练

第一条技术路线从数据入手,旨在通过更好地利用额外数据来不断提升对安全攸关事件的­处理能力。

一种思路是只利用与安全攸关事件相关的数据进行密集学习(Dense Learning),这可以显著降低估计方差,证明过程可以参考文章方法部分的定理1。

随之而来的一个问题是,如何定义并识别安全攸关事件?这一问题极具挑战性,因为安全攸关事件依赖于特定问题的目标函数,并且受到驾驶环境时空复杂性的影响。

更重要的是,目前仍缺乏能够指导安全攸关事件数据利用的相关理论。针对自动驾驶汽车的安全性验证,作者之前的工作已经尝试通过开发密集深度强化学习方法(Dense Deep Reinforcement Learning, D2RL)来解决稀疏度灾难问题。

理论和实验结果表明,密集深度强化学习方法可以显著降低策略梯度估计的方差,这是解决稀疏度灾难的关键一步。

另一个问题是如何收集或生成更多稀疏的事件数据。特斯拉提出了影子模式测试(Shadow Mode Testing)的概念,通过比较人类驾驶和自动驾驶的行为来识别稀疏事件,但文献中没有给出具体细节。除了从自然驾驶环境中收集数据外,还可以采用各种数据增强方法来生成安全攸关场景。

路线2:改善模型泛化和推理能力

第二条技术路线则聚焦提高机器学习模型的­泛化和推理能力。直觉上,人类可以通过有限的驾驶经验(通常不到一百小时的训练)掌握驾驶技术,未来的自动驾驶汽车也可能在不依赖大量特定任务数据的情况下克服稀疏度灾难。

这需要自动驾驶汽车同时具备自下而上的推理(感知数据驱动)和自上而下的推理(认知-期望驱动)能力,来弥合数据中没有的信息差距。

这些要求符合通用人工智能AGI的发展。近年来,语言大模型和视觉语言模型等基础模型通过采用全监督微调、上下文学习和思维链等技术,在自然语言处理、视觉理解和推理方面表现出了显著的泛化和推理能力。

尽管目前仍有幻觉等问题需进一步研究,语言大模型和视觉语言模型通过利用广泛的数据,为实现自上而下的­推理进而解决稀疏度灾难问题提供了可能的技术路线。

路线3:降低安全攸关事件发生概率

第三条技术路线则通过降低安全攸关事件的发生概率来减轻稀疏度灾难对自动驾驶汽车的影响。

一种方法是将传统的基于模型的方法与深度学习方法相结合以更好地发挥两者的优势,例如,形式化方法(Formal Methods)基于抽象模型来防止自动驾驶汽车的不安全行为。当然,如相关文献所述,想要充分利用形式化验证方法的潜力,仍需要解决多种挑战。

另一种方法是通过利用车路协同等技术,基于基础设施的传感器或协同感知来增强态势感知­,帮助自动驾驶汽车克服其自身车载传感器的局限性。

例如,通过车载人工智能实现4-5个9的安全可靠性,通过车路协同等技术再实现1-2个9的安全可靠性,使得系统整体安全性达到大规模落地应用要求。然而,如何有效利用这些额外信息来提高性能仍然是一项具有挑战性的任务,特别是在安全攸关场景中。

参考资料:
https://doi.org/10.1038/s41467-024-49194-0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/773449.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【12321骚扰电话举报受理中心-短信验证安全分析报告】

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…

揭秘:华火电焰灶可不可信,安不安全?

随着科技的不断进步,传统厨房灶具也在经历着前所未有的变革。在这个追求环保、节能和智能化的时代,最近发布的一款名为华火电燃喷焰式组合灶厨吸引了众多消费者的目光。今天,我们就来对这款华火HH-SZQP60电燃喷焰式组合灶进行一次深入评测&am…

谷粒商城学习-06-使用vagrant快速创建linux虚拟机

这一节的内容是在Windows上安装虚拟机。 为什么要按照虚拟机呢? 原因是很多软件只能在Linux下运行,有的虽然也可以在Windows上运行,但从安装到运行会遇到很多问题,为这些解决这些问题花时间对于大多数人特别是初学者是没有什么价…

Qt中udp指令,大小端,帧头帧尾实际示例

前言 虽然QT中,udp发送和接收,其实非常简单,但是实际工作中,其实涉及到帧头帧尾,字节对齐,以及大小端序的问题。比如网络中,正规的一般都是大端序,而不是小端序,大多数的…

Arthas实战(3)- CPU使用率高问题排查

一、 准备测试应用 新建一个 SpringBoot应用&#xff0c;写一段 CPU 使用率高的代码&#xff1a; GetMapping("/cpuUsageRate") public String cpuUsageRate() {while (true) {// 这个循环没有实际意义&#xff0c;只是为了占用CPUfor (int i 0; i < 1_000_000…

(三)共享模型之管程

线程安全问题 案例 两个线程对初始值为 0 的静态变量一个做自增&#xff0c;一个做自减&#xff0c;各做 5000 次&#xff0c;结果是 0 吗&#xff1f; Slf4j(topic "c.ThreadSafe") public class ThreadSafe {public static int counter 0;public static void …

南京,协同开展“人工智能+”行动

南京&#xff0c;作为江苏省的省会城市&#xff0c;一直以来都是科技创新和产业发展的高地。近日&#xff0c;南京市政府正式印发了《南京市进一步促进人工智能创新发展行动计划&#xff08;2024—2026 年&#xff09;》和《南京市促进人工智能创新发展若干政策措施》的“11”文…

Linux Static Keys和jump label机制

文章目录 前言一、asm goto二、API使用2.1 低版本API2.2 高版本API 三、jump label四、源码分析4.1 数据结构4.2 static_key_false4.3 jump_label_init4.4 __jump_label_transform4.5 static_key_slow_inc/dec 五、__jump_table节5.1 内核5.2 内核模块 六、修改内存代码6.1 x86…

vue配置sql规则

vue配置sql规则 实现效果组件完整代码父组件 前端页面实现动态配置sql条件&#xff0c;将JSON结构给到后端&#xff0c;后端进行sql组装。 这里涉及的分组后端在组装时用括号将这块规则括起来就行&#xff0c;分组的sql连接符&#xff08;并且/或者&#xff09;取组里的第一个。…

论文配色:跟着顶刊学配色(Nature篇)

写在前面&#xff1a; 截至目前&#xff0c;nature共发表Article 572篇&#xff0c;本文挑选了部分最新的文献&#xff0c;进行配色总结&#xff0c;每种颜色分别提供十六进制、RGB、HSB、CMYK和LAB5种描述模型&#xff0c;方便后期配色使用。 三色&#xff1a; 四色&#xff…

Java增加线程后kafka仍然消费很慢

文章目录 一、问题分析二、控制kafka消费速度属性三、案例描述 一、问题分析 Java增加线程通常是为了提高程序的并发处理能力&#xff0c;但如果Kafka仍然消费很慢&#xff0c;可能的原因有&#xff1a; 网络延迟较大&#xff1a;如果网络延迟较大&#xff0c;即使开启了多线…

【MindSpore学习打卡】应用实践-计算机视觉-SSD目标检测:从理论到实现

在计算机视觉领域&#xff0c;目标检测是一个至关重要的任务。它不仅要求识别图像中的目标物体&#xff0c;还需要精确定位这些物体的位置。近年来&#xff0c;随着深度学习技术的飞速发展&#xff0c;各种高效的目标检测算法层出不穷。SSD&#xff08;Single Shot MultiBox De…

推动高效能:东芝TB67H301FTG全桥直流电机驱动IC

在如今高度自动化的时代&#xff0c;电子产品的性能和效率成为了工程师们关注的焦点。东芝的TB67H301FTG全桥直流电机驱动IC应运而生&#xff0c;以其卓越的技术和可靠性&#xff0c;成为众多应用的理想选择。无论是在机器人、家用电器、工业自动化&#xff0c;还是在其他需要精…

企业怎么选购USB Server?先看这条!

一、首先&#xff0c;USB Server是什么&#xff1f; USB Server&#xff1f;听起来像是个高科技玩意儿&#xff01; 其实&#xff0c;它就是个很多企业都在用的远程“传送门”&#xff0c;把USB设备都固定插在USB Server上&#xff0c;然后将USB Server与计算机网络连接&…

LaTeX表格灵活设置列宽

一些基本的插入表格的操作见&#xff1a;https://blog.csdn.net/gsgbgxp/article/details/129457872 遇到问题先查阅《IShort》和刘海洋老师的《LaTeX入门》。 设置表格列宽基础操作&#xff08;不借助tabularx&#xff09; 先从一个简单表格开始 \begin{table}[!h]\centeri…

Python基础小知识问答系列-过滤列表元素

1. 问题&#xff1a; 如何根据单一条件过滤列表的元素&#xff1f; 如何根据复杂条件过滤列表的元素&#xff1f; 2. 解决方式&#xff1a; 可以使用推导式生成器&#xff0c;进行单一条件的列表元素过滤&#xff0c;尤其是列表内容较多时; 也可以使用filter函数进行列…

怎么看一家TPM管理咨询公司专不专业

在评估一家TPM管理咨询公司是否专业时&#xff0c;我们需要从多个维度进行深入的考量。TPM作为一种以提升设备综合效率为目标&#xff0c;以全系统的预防维修为过程&#xff0c;以全体人员参与为基础的设备保养和维修管理体系&#xff0c;其实施的成功与否直接关系到企业的生产…

二二复制模式,发展下属并形成一个销售网络体系来实现收入增长!

二二复制模式&#xff0c;又称为双轨制&#xff0c;是一种直销理念的营销模式&#xff0c;其核心在于通过发展下属并形成一个销售网络体系来实现收入增长。以下是对二二复制模式的详细讲解&#xff0c;包括其优势和玩法介绍&#xff0c;以及适合的行业。 一、二二复制模式的定…

刚办理的手机号被停用,你可能遇到这些问题了!

很多朋友都会遇到手机号被停用的情况&#xff0c;那么你知道你的手机号为什么会被停用吗&#xff1f;接下来&#xff0c;关于手机号被停用的问题&#xff0c;跟着小编一块来了解一下吧。 ​停机的两种形态&#xff1a; 1、第一个是局方停机&#xff0c;即语音、短信和流量都不…

opencv实现人脸检测功能----20240704

opencv实现人脸检测 早在 2017 年 8 月,OpenCV 3.3 正式发布,带来了高度改进的“深度神经网络”(dnn)模块。 该模块支持多种深度学习框架,包括 Caffe、TensorFlow 和 Torch/PyTorch。OpenCV 的官方版本中包含了一个更准确、基于深度学习的人脸检测器, 链接:基于深度学习…