将要上市的自动驾驶新书《自动驾驶系统开发》中摘录片段

在这里插入图片描述

全书共分15章:第1章是自动驾驶系统的概述(场景分类、开发路径和数据闭环等),第2章简介自动驾驶的基础理论,即计算机视觉和深度学习等,第3~4章是自动驾驶的软硬件平台分析,包括传感器、计算平台、软件架构和操作系统等,第5~9章分别介绍自动驾驶的感知、地图、定位、规划和控制模块,第10章重点介绍自动驾驶的仿真系统,第11章讨论自动驾驶的安全理论,第12章讨论自动驾驶的一个特例-自动泊车系统,第13章介绍车联网技术(车-路协同和车辆编队),而第14~15章分别介绍最近自动驾驶相关的两个技术热点,即3D场景的神经渲染(主要以NeRF为主)和扩散模型的内容生成。

本书主要是给有一些基础的读者阅读,比如具备在计算机视觉和机器学习(甚至深度学习)方面的理论基础和实践经验。本书提供大量自动驾驶前沿技术第一手的资料,涉及开发自动驾驶的方方面面。希望该书能够启发和触动自动驾驶第一线的开发人员,在遇到问题和困难的时候开阔思路并发现解决问题的方法。

在“前言”部分,关于自动驾驶的研究现状,作者做了如下分析:

“自动驾驶的发展基本存在两条技术路线。一个是跨越式开发,即直接做L4级别的自动驾驶系统,以高科技公司谷歌和百度为主,他们对车企行业了解不深,把机器人研发的模式用于自动驾驶车辆。注:据说谷歌也曾想从L3级别做起,但是实验发现测试人员一段时间以后很容易相信计算机系统,失去监控的耐心。这个技术路线多半不计成本,采用高清地图和高精密度惯导定位,可没有地图的地方也很难运营(不需要和导航地图接口,直接采用高清地图进行规划,对于大规模导航区域的高清地图下载和全局规划的计算复杂度缺乏认识),安装激光雷达这种最好最昂贵的传感器(当时视觉的深度学习技术比较初级),采用最强的计算平台(因为不是量产,一些L4自动驾驶公司直接采用工控机作为支撑,不需要考虑平台移植的工程难度),面向robotaxi的落地,虽然还没有针对任意场景,但在测试的高速和城市街道场景中,基于较可靠的感知性能,的确提供了面向复杂交通环境下最强的规划决策能力。目前看到的基于数据驱动开发的规划决策算法,多半来自于L4公司,而且其中几个还举办了这方面的竞赛(基于本身提供的开源数据集)。在仿真平台的建设上,也是L4公司远远走在前面(特斯拉基本已经具备L4开发落地能力),包括数据重放和单点测试的可视化能力。高清地图方面,L4公司的技术也比较成熟。收集的传感器数据,L4公司在包括激光雷达和车辆定位轨迹等方面,也高于一般的L2公司。

另一条路线是渐进式开发,即先从L2级别的辅助自动驾驶系统起步,然后逐渐适应更复杂的交通环境,从高速高架慢慢过渡到有闸道有收费站的场景,然后进入城市大街和小路,自动驾驶系统的级别也慢慢演进到L2+、L3、L3+和L4水平。注:最近看到一种新趋势,即L4自动驾驶级别的开发公司,和L2级别自动驾驶的主机厂和Tier-1合作,共同开发L2+的量产级别车辆。渐进式开发的技术路线,一般是主机厂和Tier-1采用,他们首先会考虑成本、车规和量产用户的ODD定义。早先以mobileye为主要供应商,之后特斯拉和英伟达的开发模式成为主流。因为成本,所以这种路线多半采用摄像头为主传感器,加上车企已经接受的毫米波雷达为辅助。相对来说,这个路线的前沿水平(比如特斯拉)基本上视觉感知的能力尤其突出。因为在融合中雷达出现大量虚警信号,特斯拉甚至在自动驾驶感知模块中放弃了它。以前泊车自动驾驶采用超声波传感器,逐渐也和鱼眼摄像头结合提供泊车辅助、记忆泊车甚至代客泊车的应用。特斯拉也采用超声波提供拥挤交通场景的感知。也许是成本的压力,渐进路线一般是“重感知、轻高清地图”的模式,甚至特斯拉已经在BEV网络模型中实现了感知和在线地图及定位的端到端集成。作为行业领军企业的特斯拉,慢慢完善了数据驱动的开发工具链,实现了一个包括数据筛选、数据标注、仿真模拟、模型迭代、场景测试评估和模型部署等的数据闭环。基于自动驾驶的长尾问题和AI模型的不确定问题,谷歌也有类似的框架,但特斯拉将其发挥到极致,在量产的用户车辆上实现了良性循环,目前也已经推出L4级别的自动驾驶版本FSD。

自动驾驶基本存在1.0和2.0两个发展阶段。自动驾驶1.0时代采用多种传感器构成感知输入,比如激光雷达(Lidar)、视觉相机、雷达(Radar)、惯导IMU、轮速计和GPS/差分GPS等,各个传感器在感知能力上存在差异,针对性用多模态传感器融合架构,目前多是采用后融合策略,把各个传感器在相关任务的结果进行一次滤波,达到互补或者冗余的效果。这方面存在两种路线,一是依靠激光雷达加高清地图的做法,成本高,主要是robotaxi等L4公司采用,另一个是视觉为主、轻高清地图的道路,成本低,多是L2/L2+自动驾驶公司为量产落地的思路。两种路线都是会有很传统的后处理步骤(特别是视觉),大量调试工作和问题也来自于此。另外,这个阶段的规划决策多是采用基于规则的方法,实际上没有数据驱动的模型,比如开源的Autoware和百度Apollo。L4公司由于运行场景在一些具备高清地图的固定地区,本身感知投入的传感器精度较高,已经做过数据训练规划决策模型的探索;相对来说,L2/L2+公司还没有建立数据驱动的规划决策模块开发模式,多是采用优化理论的解决方案,普遍从高速场景入手,升级到特斯拉那种“闸道-到-闸道”的模式,很少能支持城市自动驾驶的复杂场景(比如环岛路口和无保护左拐弯操作等)。

自动驾驶2.0时代应该是以数据驱动为标志,同时对于1.0阶段的感知框架也有比较大的改进。数据驱动的开发模式倾向于端到端的模型设计和训练,对于规划决策而言就是需要大量的驾驶数据去学习“老司机”的驾驶行为,包括行为克隆的模仿学习,以及通过基于模型强化学习(M-RL)估计行为-策略的联合分布等,不再靠各种约束条件下的最优问题求解。其中轨迹预测是一个重要的前奏,需要对智体交互行为做良好的建模,并分析存在的不确定性影响。对于感知而言,2.0时代需要考虑机器学习模型取代那种传统视觉或信号处理(滤波)的部分,真正做到采集数据来解决问题的开发模式。比如特斯拉最近的BEV和Occupancy Network,都直接通过深度学习模型实现所需信息输出,而不是采用传统视觉和融合理论去二次处理模型输出。传感器融合理论也从后融合升级到模型中特征级融合甚至数据融合(如果同步和标定有一定的先验知识)。这里可以看到Transformer网络在这个感知框架下扮演着重要的角色,同时也给计算平台提出了更高的要求。基于这种数据驱动的自动驾驶平台需求,大模型的设计思路也被引入,因为大量数据的获取,包括高效的数据筛选、自动标注和仿真技术辅助,需要在服务器维护一个老师大模型支持各种布置到车端的学生小模型训练和迭代升级。”

在“概论”中,对于自动驾驶的场景,作者也进行了总结分级:

自动驾驶的场景,根据难度可以列出如下:

自动/自主泊车:自动泊车APA、记忆泊车HPA和代客泊车AVP分属L2、L3和L4级别;最低级的自动泊车是没有车辆控制的,只是提供泊车的建议,如虚拟的参考轨迹;L2级别会提供停车位检测,并确定规划和控制功能,简单的超声波雷达只是检测一个停车位,而视觉系统可以发现多个停车位,L2级系统让驾驶员选择其中一个,而L3级别会自动选择。

园区摆渡车:L4级,比如百度Apollo龙和法国创业公司EasyMiles,很多是在在闭环道路循环运行,相对驾驶路径固定,规划决策简单。

无人送货车:属于L4级别,其难度在于小区道路拥挤,行人多;但好处是低速,无人在车内,美团、京东、阿里菜鸟和硅谷创业公司Nuro均有这种场景。

高速路商用大货车巡航:属于L3-L4级,其优点是高速公路为主,商业模式简单,在降低司机成本和降低驾驶疲劳度等方面有优势;缺点是,因为高速行驶预警时间要长,而且车身大且长,周围监控难度大;谷歌、创业公司图森和智加科技在这种场景的自动驾驶研发有布局。

高速路交通拥挤堵塞巡航(HTJAP):L3级,好处是速度慢,缺点是交通拥挤,要预防有极端情况(corner case);奥迪A8实现了这种功能,特意安装了5个4线激光雷达Scala。

高速路巡航(HAP):特斯拉Autopilot,L2.5级,高速公路上提供自动跟车和车道保持,难点是报警时间不足,但是相对封闭的环境容易处理,目前正在扩展到街道,并加入红绿灯检测识别的能力;

城市路交通堵塞自动巡航(UTJAP):属于L4,目前没有市场上的产品,只有研发测试,比如Cruise在旧金山,Argo在迈阿密;

无人出租车(等同于城市自动巡航Urban Driving):L4级别,只有试运营的,比如谷歌在凤凰城的Waymo One。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/581811.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

面试:Redis

目录 一、缓存穿透 1、解决方案一: 2、解决方案二: 二、缓存击穿 1、解决方案一: 2、解决方案二: 三、缓存雪崩 1、解决方案一: 2、解决方案二: 3、解决方案三: 4、解决方案四&#x…

创建基于时间的 UUID

概述 在本文中,我们将会 对 UUIDs 和基于时间的 UUIDs(time-based UUIDs) 进行一些探讨。 当我们在对基于时间的 UUIDs 进行选择的时候,总会遇到一些好的方面和不好的方面,如何进行选择,也是我们将要简要…

数字签名学习

1 基本概念 数字签名是一种加密技术,用于验证信息来源的身份和数据的完整性。 就是对一个东西签上自己的名;收到的人可以验证这东西是你发的;这里是用数字的方式; 对字符串也可以签名,签名以后,还是一个…

《面向云计算的零信任体系第1部分:总体架构》行业标准正式发布

中华人民共和国工业和信息化部公告2024年第4号文件正式发布行业标准:YD/T 4598.1-2024《面向云计算的零信任体系 第1部分:总体架构》(后简称“总体架构”),并于2024年7月1日正式施行。 该标准由中国信通院牵头&#xf…

正点原子[第二期]Linux之ARM(MX6U)裸机篇学习笔记-6.5

前言: 本文是根据哔哩哔哩网站上“正点原子[第二期]Linux之ARM(MX6U)裸机篇”视频的学习笔记,在这里会记录下正点原子 I.MX6ULL 开发板的配套视频教程所作的实验和学习笔记内容。本文大量引用了正点原子教学视频和链接中的内容。…

web安全---CSRF漏洞/OWASP-CSRFTester的使用

what 跨站请求伪造 Cross Site Request Forgery how 攻击者诱骗点击恶意网页,盗用(伪造)受害者的身份,以受害者的名义向服务器发送恶意请求,而这种恶意请求在服务端看起来是正常请求 CSRF&&XSS区别 他们最本质区别就…

什么是中间件?中间件有哪些?

什么是中间件? 中间件(Middleware)是指在客户端和服务器之间的一层软件组件,用于处理请求和响应的过程。 中间件是指介于两个不同系统之间的软件组件,它可以在两个系统之间传递、处理、转换数据,以达到协…

ArcGIS基础:便捷分享图层包和地图包

1、分享图层包: 首先,选中要分享的数据,右键创建图层包,修改保存路径。 找到项目描述那一栏,将摘要、标签、描述都填写分享图层包的相关内容。 一切设置好之后,点击右上角的【分析】按钮。 点击分析之后…

linux下安装anaconda

顺手点个关注吧,谢谢! 一、下载安装包 https://repo.anaconda.com/archive/ 或者使用命令 wget https://repo.anaconda.com/archive/Anaconda3-5.3.1-Linux-x86_64.sh2.赋予权限并安装 # 给文件执行权限 chmod 777 Anaconda3-5.3.1-Linux-x86_64.sh# 执…

高频面试题:在浏览器搜索框中输入一个URL的完整请求过程?

相信很多小伙伴在校招或者社招面试中都遇到过这个问题 面试官:小伙子,了解 在浏览器搜索框中输入一个URL的完整请求过程吗?详细说说我:eeemm,不太清出具体的过程。整体过程应该是HTTP请求的过程。 如果在面试中不能很…

FinClip :可以让小程序脱离微信环境最快运行在自有App中

🧐 什么是FinClip? FinClip,一个可以让小程序脱离微信环境,最快运行在自有App中的神器。它支持在iPhone、Android、Windows、Linux、macOS、统信等平台下的应用中运行小程序,这意味着,无论是移动端、PC端&…

uniapp自定义返回事件(封装)

uniapp自定义返回事件 在我们使用uniapp时,我们导航栏一般都是自定义的,比如用uview框架的导航栏,那么返回事件通常会遇到以下几个问题 返回事件前需要做一些额外的处理 h5项目刷新页面后返回失效 返回按钮点击后到指定页面 如果只是监听返…

技术团队的管理方法和日常总结建议

管理学家德鲁克有言“管理是一种实践,其本质不在于知,而在于行,其验证不在于逻辑,而在于成果,其唯一的权威就是成就” ,因此管理重实践看效果,但如果管理实践有理论依凭,那么实践起来…

新媒体运营-----短视频运营-----PR视频剪辑----视频调色

新媒体运营-----短视频运营-----PR视频剪辑-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/138079659 文章目录 1. Lumetri调色,明暗对比度2. Lumetri调色,创意与矢量示波器2.1 创意2.2 矢量示波器 3. L…

滑块验证码破解----Java使用opencv后端破解滑块验证

使用技术:Java SpringBootopenCV 在windows上首先需要下载opencv进行安装,先去官网:Releases - OpenCV 下载这个windows版本的安装包 下载后直接安装解压就行,然后需要,然后找到安装位置里的这个文件: 你下载的是什么版本的,这里的数字就是多少,比如我下载4.5.3版本那么这…

分治策略 --- 快排归并

目录 分治-快排 一、颜色分类 二、排序数组 三、数组中的第K个最大元素 四、库存管理 分治-归并 一、排序数组 二、交易逆序对的总数 三、计算右侧小于当前元素的个数 四、翻转对 分治是一种思想,也就是将大问题分解成小问题,一直分到小问题可…

2024年云仓酒庄新动态合肥北京双城开课,持续培训助力酒业发展

云仓酒庄合肥北京双城开课,持续培训助力酒业发展 随着国内酒类市场的不断繁荣与消费需求的日益增长,云仓酒庄作为行业内的稳扎稳打之一的企业,始终致力于提升服务质量和品牌影响力。近日,云仓酒庄在合肥与北京两地同时开设培训课…

qt学习篇---C++基础学习

本学习笔记学习下面视频总结,感兴趣可以去学习。讲的很详细 【北京迅为】嵌入式学习之QT学习篇_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1tp4y1i7EJ/?spm_id_from333.337.search-card.all.click&vd_source8827cc0da16223b9f2ad8ae7111de9e2 目录 C…

JavaScript数组方法练习

第一个练习 ● 计算所有账户的存款总额 const bankDepositSum accounts //定义一个变量.flatMap(acc > acc.movements) //使用flatmap将所有的存款提取,然后组成一个新的数组.filter(mov > mov > 0) //使用filter方法提取所有的正值.reduce((sum, c…

【前端】VUE项目创建

在所需文件夹中打开cmd命令行窗口,输入vue ui 进入web可视化界面选择创建新项目 根据需求依次完成下列选择,下列是参考配置,完成后点击创建项目即可 最终显示完成