论文《Planning-oriented Autonomous Driving》详细解析

论文《Planning-oriented Autonomous Driving》详细解析

在这里插入图片描述

摘要

现代自动驾驶系统被描述为顺序执行的模块化任务,即感知、预测和规划。为了执行各种任务并实现高级别智能,当前的方法要么为每个任务部署独立的模型,要么设计带有独立头的多任务范式。然而,这些方法可能会受到累积错误或任务协调不足的影响。本文提出了一种理想的框架,即应当设计和优化以实现自动驾驶汽车的最终目标,即规划。为此,我们重新审视了感知和预测中的关键组件,并优先考虑这些任务,使它们有助于规划。我们介绍了一种名为Unified Autonomous Driving (UniAD)的最新综合框架,该框架将全栈驾驶任务整合到一个网络中。它巧妙地利用每个模块的优势,并从全局视角为代理交互提供互补的特征抽象。任务通过统一的查询接口进行通信,互相促进,以实现规划。我们在具有挑战性的nuScenes基准上实例化了UniAD。通过广泛的消融实验,证明了这种方法在所有方面大大优于以前的最新技术。代码和模型公开。

1. 引言

随着深度学习的成功发展,自动驾驶算法由一系列任务组成,包括检测、跟踪、映射在感知中;在预测中进行运动和占用预测。大多数工业解决方案为不同任务部署独立模型,只要车载芯片的资源带宽允许。虽然这种设计简化了跨团队的研发难度,但由于模块间的优化目标隔离,可能导致信息丢失、错误累积和特征对齐问题。

一种更优雅的设计是将广泛的任务整合到多任务学习(MTL)范式中,通过在共享特征提取器中插入几个特定任务头。这样的方法在许多领域,包括通用视觉和自动驾驶中广泛应用。尽管如此,这种方案可能导致不理想的“负迁移”。

相比之下,端到端自动驾驶的出现将感知、预测和规划中的所有节点作为一个整体统一起来。前序任务的选择和优先级应有利于规划。系统应以规划为导向,精心设计某些组件,以避免独立选项中的累积错误或MTL方案中的负迁移。

2. 方法论

UniAD包含四个基于Transformer解码器的感知和预测模块,以及一个位于末端的规划模块。查询Q在连接管道中发挥作用,建模驾驶场景中实体的不同交互。具体来说,一系列多摄像头图像被输入特征提取器,得到的视角特征通过BEV编码器转换为统一的鸟瞰图(BEV)特征B。TrackFormer用于检测和跟踪代理;MapFormer表示道路元素并执行全景分割;MotionFormer捕捉代理和地图之间的交互并预测未来轨迹;OccFormer预测多步未来占用情况。最终,Planner利用来自MotionFormer的表达式强大的ego-vehicle查询进行规划预测,并避免碰撞。

2.1 感知:跟踪和映射
  • TrackFormer:联合执行检测和多目标跟踪(MOT),避免了不可微的后处理。
  • MapFormer:基于2D全景分割方法Panoptic SegFormer设计,稀疏表示道路元素,帮助下游运动预测。
2.2 预测:运动预测
  • MotionFormer:利用来自TrackFormer和MapFormer的高抽象查询,预测所有代理的多模态未来轨迹,以场景为中心的方式产生多代理轨迹,节省了对齐整个场景到每个代理坐标的计算成本。
2.3 预测:占用预测
  • OccFormer:将场景级和代理级语义结合起来,预测未来的占用格网图。通过交叉注意力模块统一场景和代理级理解。
2.4 规划
  • 规划通常需要高层命令来指示前进方向。本文将原始导航信号转换为可学习的嵌入,称为命令嵌入。通过BEV特征,计划查询被解码为未来的路径点。
3. 实验

我们在具有挑战性的nuScenes数据集上进行实验,验证了我们设计在任务协调和规划效果方面的有效性。

4. 结论

本文讨论了自动驾驶算法框架的系统级设计。提出了一种规划导向的管道,即UniAD,提供了详细的分析和实验验证其在各方面的优越性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/659497.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【YOLOv10】使用yolov10训练自己的数据集/验证 /推理 /导出模型/ONNX模型的使用

YOLOv10: 实时端到端的目标检测。 性能 YOLOv10比最先进的YOLOv9延迟时间更低,测试结果可以与YOLOv9媲美,可能会成为YOLO系列模型部署的“新选择”。 目录 1 数据准备 2 配置文件 3 训练 4 验证 5 预测 6 导出模型 7 ONNX模型的使用 官方论文地址…

高速公路边坡监测预警系统解决方案

一、概述 高速公路是国家交通大动脉,高速公路的安全、稳定是人民生命安全的保障。高速公路地基和边坡在线监测系统是交接高速公路运行状态的耳目,是保证高速公路稳定、安全保障人民生命财产安全、充分发挥高速公路国家交通大动脉的重要手段。高速边坡在线…

国产POE芯片,芯昇电子成熟量产POE芯片,在PSE端和PD端均成熟量产产品

随着技术的发展和市场的需求,国产POE芯片已经逐渐崭露头角。在POE技术领域,POE芯片分为供电设备PSE和受电设备PD,而选择参与802.3bt标准与以太网联盟徽标计划的厂商来生产这些芯片,可以确保在互操作性和合规性上更有把握。过去…

藏汉双语翻译平台,专业准确的藏语翻译工具和藏文OCR识别工具,在西藏提高工作效率的利器!

如果你正在找一款支持藏语-汉语双向翻译、操作简单、功能又丰富的藏汉在线翻译器,那就不得不推荐一下近期上线的藏汉翻译通小程序。在西藏工作、拉萨旅游或者写藏文作文时,如果你有翻译藏语的需求,那它,就能满足你,协助…

脑机接口:是现代医学的外挂,更是瘫痪病人的豪赌

5 月 17 日,马斯克公开表示,继今年年初首次成功将大脑芯片植入患者大脑后,Neuralink 正在寻找第二位受试者接受这项手术。 5 月 20 日,美国食品药品监督管理局 (FDA) 批准了马斯克的 Neuralink 公司为第二位患者植入脑芯片&#…

JavaSE——类和对象(三)~~继承

目录 一.继承 1.为什么需要继承 2 .继承概念 3.继承的语法格式 4.继承的特性及好处 5.父类成员访问 6.继承关系上的代码块执行顺序​​​​​​​ 二.继承与组合 一.继承 1.为什么需要继承 Java中使用类对现实世界中实体来进行描述,类经过实例化之后的产物…

2024年学浪视频怎么录屏

由于学浪最新版PC学生版客户端已经有防止录屏,而且录屏效率太慢,本文将介绍你一种高效率的工具,小浪助手.exe,它可以很轻松的将你的学浪视频下载下来 学浪下载工具我已经打包好了,有需要的自己下载一下 注意&#xf…

wxPython应用开发-后台线程更新大量数据到wxGrid避免ui无响应

一、问题描述 最近几天,我在用python开发一个数据处理的小工具。需要将xls文件中的大量数据(少则几千行多则几万行)读取出来后进行处理。其中一个功能是需要实现将读取到的原始数据和计算出来的结果在软件界面中以表格形式展示出来。 在pyt…

JVM学习-垃圾回收(二)

标记-清除(Mark-Sweep)算法 当堆中的有效内存空间被耗尽的时候,就会停止整个程序(stop the world),然后进行两项工作,第一项则是标记,第二项是清除 标记:Collector从引用根节点开始遍历,标记所有被引用的…

Redis分布式存储方案

一、Redis分布式存储方案 1、哈希取余分区 ①、原理 哈希计算:首先,对每个键(key)进行哈希计算,得到一个整数哈希值(hash value)。取余操作:将这个哈希值对服务器数量进行取余操作…

Ansible03-Ansible Playbook剧本详解

目录 写在前面5. Ansible Playbook 剧本5.1 YAML语法5.1.1 语法规定5.1.2 示例5.1.3 YAML数据类型 5.2 Playbook组件5.3 Playbook 案例5.3.1 Playbook语句5.3.2 Playbook1 分发hosts文件5.3.3 Playbook2 分发软件包,安装软件包,启动服务5.3.3.1 任务拆解…

数分之SQL查询电商数据案例

1,Python连接SQL数据库 以下是使用Python连接MySQL数据库并进行操作的示例代码: import random import time import pymysql# 定义名字数据 xing ["王", "李", "张", "刘", "陈", "杨", "黄&q…

【火猫CS2】fantic取代C9参加YaLLa指南针

1、近日YaLLa Compass主办方宣布,由于Could9战队未能在截止日期前提交完整的参赛阵容,fantic战队将取代其参赛。该比赛将在阿联酋阿布扎比举行,总奖金40万美元。 最近一段时间Cloud9战队最近将electroNic转会至VP,又下放了HObbit和Perfecto,队伍因没有完整阵容已被迫退出EPL S1…

服装服饰商城小程序的作用是什么

要说服装商家,那数量是非常多,厂家/经销门店/小摊/无货源等,线上线下同行竞争激烈,虽然用户群体广涵盖每个人,但每个商家肯定都希望更多客户被自己转化,渠道运营方案营销环境等不可少。 以年轻人为主的消费…

前端破圈用Docker开发项目

为什么要用 Docker 开发 🤔 直接在系统上开发不香吗?香,但是 Docker 有下面4香 环境依赖管理:Docker 容器可以管理所有依赖项,例如前端里面的 node 和 npm 版本,不需要在本地安装和维护这些依赖项 隔离&a…

【刷题(12)】图论

一、图论问题基础 在 LeetCode 中,「岛屿问题」是一个系列系列问题,比如: 岛屿数量 (Easy)岛屿的周长 (Easy)岛屿的最大面积 (Medium)最大人工岛 (Hard&…

高效记录收支明细,预设类别账户,智能统计财务脉络,轻松掌握个人财务!

收支明细管理是每位个人或企业都必须面对的财务任务,财务管理已经成为我们生活中不可或缺的一部分。如何高效记录收支明细,预设类别账户,智能统计财务脉络,轻松掌握个人财务?晨曦记账本为您提供了完美的解决方案&#…

windows环境redis未授权利用手法总结

Redis未授权产生原因 1.redis绑定在0.0.0.0:6379默认端口,直接暴露在公网,无防火墙进行来源信任防护。 2.没有设置密码认证,可以免密远程登录redis服务 漏洞危害 1.信息泄露,攻击者可以恶意执行flushall清空数据 2.可以通过ev…

使用docker安装nacos单机部署

话不多说,直接进入主题 1.查看nacos镜像 docker search nacos 一般选第一个也就是starts最高的。 2.拉取nacos镜像 docker pull nacos/nacos-serverdocker pull nacos/nacos-server:1.4.1 由于我使用的项目alibabacloud版本对应的是nacos1.4.1版本的,所以我安装的是1.4.1…

复购率下降是什么原因导致的?三个步骤直击复购率下降根源

在商业运营中,回购率的波动往往能够直观地反映出客户对品牌和产品的忠诚程度。一个健康的回购率可以为企业带来稳定的收入流,同时也是品牌口碑和市场影响力的有力证明。但是,当企业面临回购率下降的情况时,这通常是一个警示信号&a…