数据驱动与数据安全,自动驾驶看得见的门槛和看不见的天花板

作者 |田水

编辑 |德新

尽管心理有所准备,2023年智能驾驶赛道的内卷程度还是超出了大多数人的预期。

这一年,汽车价格战突然开打,主机厂将来自销售终端的价格压力,传导到下游智驾供应商,于是,市面上出现了一大批五千、三千乃至千元级别的智能驾驶方案,砍掉激光雷达、高精地图等部件,压榨芯片算力,将成本卷到极致。

时间上的“卷”更为直观,为了抢夺智驾上车窗口期,车企之间的NOA“开城大战”成为近一年的主旋律。50城、100城、所有城市可用,不管目标最终能不能实现,喊出一个个更大的开城数字本身,便反映出车企们在城市智能驾驶竞争中的急迫。

与此同时,对性能却毫不放松,年初ChatGPT在通用人工智能方面的惊艳表现,让行业一致转向加码“BEV+Transformer”大模型,助推智能驾驶技术发展,当原本“百花齐放”的技术路线变成“千军万马过独木桥”,内卷便不可避免。

归根结底,智能驾驶经过多年的发展,已经踏过摸索期,进入平台稳定期,身处其中的玩家们或快或慢,在2023年开始收敛到同一个方向,即加码大模型,以数据为驱动,解决智能驾驶剩余5%的corner case,以此快速迭代算法,抢占市场先机。

共识之下,有一个技术关键点却几乎被集体遗漏——数据合规。在以规则为驱动的智能驾驶技术早期,来自车端的数据规模量小,大多仅仅用于算法测试,还不足以构成足够引起重视的问题。

随着智能驾驶步入商业化阶段,上路收集数据的车辆以数十万乃至数百万计,这些多达PB级的海量数据是否合规、能否满足信息安全,将直接决定智能驾驶能走多远。

一位业内人士指出,行业热议的大模型,仅仅是跃入自动驾驶的门槛,而看似不起眼的数据安全合规问题,才真正代表着这项新技术的天花板。

一、数据安全合规,被低估了

当前谈论自动驾驶,言必提数据驱动。

背后的逻辑是,自动驾驶算法模型已基本搭建成熟,能够应对95%以上的常见驾驶场景,而剩下的5%是千奇百怪、无穷无尽的长尾问题,被称作“corner case”,例如穿着异形服装的路人、涂装人像广告的车辆、突然窜出的稀有动物等等,可以通过喂养海量数据给自动驾驶系统,驱动其提升识别能力,以此迭代算法,直至走向完全自动驾驶。

与此同时,有一个伴随而来的问题却鲜少被提到同样重要的位置来讨论,那就是数据安全合规。无论是算法公司还是车企,似乎都对技术给予了更高的优先级,而数据安全合规更像是锦上添花的部分。

这种漠视曾不断让消费者付出代价。早在2016年,有黑客在特斯拉官方知情的背景下,“黑”入了一辆Model S,远程实现了“变道时折叠后视镜”、“行驶中突然刹车”等功能,引发人们对于Model S安全性的恐慌。

更早之前,也有美国黑客“黑”了一辆在乡间高速上行驶中的四驱越野乘用车,远程操控加速和制动系统,让其冲进了路边的一条小水沟。

近些年,智能化趋势让汽车全身遍布比以往更多的数据,以此带来的数据泄露、数据被篡改的现象也“变本加厉”。

对于性能表现优劣尤为依赖数据正确输入和安全防护的智能驾驶来说,如若遭泄露或受到攻击,将带来难以预料的事故后果。

除了关乎行车安全,数据安全合规还与个人隐私、国家安全息息相关。

智能汽车上往往都装有摄像头、激光雷达等高精度感知硬件,在车辆开启自动驾驶功能后,这些设备就会对环境信息进行探测并记录,而这其中存在未经授权访问敏感数据的风险,包括道路环境数据、行人数据等,一旦泄露将在一定程度上威胁国家安全、侵害个人权益。

按照政策要求,解决数据合规问题最主要是依靠图商。国家曾收紧甲级测绘资质的监管,目前市面上达到要求的单位仅有19家

尽管如此,智能驾驶相关的企业并未完全遵从要求,一部分选择绕过图商,自主持有、保存、运行数据。究其原因,除了需要给图商额外支付一笔不小的服务费用外,更在于和图商合作虽然保证了数据合规,但智能驾驶技术开发的进度却大大因此延缓了。

以业内争论最多的“高精地图”去留问题为例,使用图商制作的高精地图,难以满足智能驾驶日常可用的需求,由于其按季度更新,而在城市场景,施工、改道等道路作业可能一周一变甚至一天一变,按照图商提供的路径走,很容易发生交通事故,由此阻碍智能驾驶的商业化落地,更难形成“数据驱动”的飞轮效应,技术迭代效率低下。

而如果车企自主“制作”高精地图(也即抛弃使用图商的“高精地图”),通过使用SD地图和借助车身传感器,实时绘制路况信息,达到每日更新的车道级“类高精地图”能力,这样尽管提升了智能驾驶开发效率,却使得智能汽车数据处于不合规不安全的风险之中。

按照2022年8月底自然资源部发布的《关于促进智能网联汽车发展维护测绘地理信息安全的通知》,“去高精地图”的方案仍然涉及敏感数据,必须与图商合作。

一家自动驾驶公司的技术人员表示,当前之所以存在有不少“去高精地图”的方案未达到数据安全合规的要求,却还没被叫停的现象,主要原因在于智能驾驶作为新事物出现,政策端的管理还较为放松,且相对粗放。

“一旦政策收紧,数据安全合规这把悬在所有人头上的达摩克利斯之剑,就会随时掉落下来。”

二、汽车专区,“既要效率又要安全”的最优解

既要满足数据安全合规要求,与图商开展合作,又要追求快速迭代技术,同时实现降本增效,汽车专区成为当下智能驾驶研发的最优选择

汽车专区是云服务厂商为智能驾驶搭建的专属云,一方面以强大的云存储、云计算能力,帮助车企、算法公司处理海量的数据:

图片及数据来源:《智能汽车云服务白皮书》

根据Gartner估计,每一部自动驾驶型车每天至少产生4TB数据,每一台量产车每日产生1GB数据,而当车企销售出数十万,甚至上百万的自动驾驶车辆时,其数据量将是从PB级到ZB级的增长,十分消耗车企在数据获取、传输、存储和计算上的资源,基于汽车专区云服务的方式,可以解决这一问题。

另一方面,在于全方位/全生命周期保证数据安全合规

采集、运输、上传、存储……汽车数据安全涉及环节众多,还需要经过分类分级、降密、脱敏、加密等流程,注定需要有资质的图商和懂合规、懂场景、懂技术的云服务厂商以及车企等一起合作,为智能驾驶数据提供全流程的安全合规保障。

具体来说,数据上传环节,车企在车端进行数据分类分级、将测绘数据与非测绘数据分离,此外还要对位置信息进行坐标偏转;而图商则利用密钥对车辆采集的图片、视频等敏感数据进行加密;云服务商则提供智能汽车数据专有云服务,储存图商加密后的数据。

而当车企需要使用数据时,云服务商根据监管合规要求,支持图商对数据进行解密,并完成信息脱敏、数据审校之后,传到车企在汽车专区使用的自动驾驶训练区域,同样能够实现所谓“去高精地图”方案的每日甚至每时更新频率,助推智能驾驶迭代速度。

在这样的架构下,车企使用智能驾驶车辆收集的图像、点云等数据不能同时达到既安全合规、又更新及时的两难问题,彻底得到解决。

整个过程首先是,在有资质图商的合规把控下,车企向云端传入来自车端的各类传感器数据,经过一定规则的数据处理后,形成脱密降敏后的数据,提供给车企在合规环境中进行算法训练,经过一整套合规流程,通过云端回传训练模型结果到车企,后者最后通过OTA下发到每一辆智能驾驶车辆上,完成自动驾驶能力的完整闭环。

需要指出的是,上述与高精地图相关的数据,仅仅是车辆实时收集过程中的一部分。事实上,智能汽车在运行时,还会记录包括驾驶员人脸、车身周围行人建筑等隐私信息,同样可以在汽车专区完成脱敏,保证数据合规安全。

可以看到,汽车专区既保证了“数据驱动”模式能够有效运行,主推自动驾驶不断迭代成熟,又让车企、智能驾驶科技公司免受数据安全合规的压力,专注于上层功能的开发。

值得一提的是,相较于部分车企自建私有云付出高昂的成本,接入汽车专区,车企完全可以根据自己的需求,采购服务能力和云资源,或者是调配资源的量与使用时间,轻松实现最高的性价比

目前,包括百度、腾讯、华为、阿里等头部云厂商均已先后布局汽车专区,底层逻辑较为相似,但具体打法又不尽相同,其中,华为云在今年发布的乌兰察布汽车专区,让行业为之眼前一亮。

三、华为云,给车企提供坚实“护城河”

乌兰察布是国家八大数据中心枢纽节点之一,更是国家东数西算战略重要的一环,这里气候凉爽,风电充足,尤为适合建设云基础设施。

华为云乌兰察布数据中心

华为云在乌兰察布规划了标准的3AZ架构,总体规模规划承载100万台服务器,并于今年7月份,联合北京华为数字、四维图新等业界多家图商,依据合规处理的流程设计,建造落地了汽车专区。

华为云乌兰察布汽车专区首创性采用“3分区”合规架构设计,包括数据处理区、智驾业务区和网络中继区。

其中数据处理区是专为图商设计的专属区域,需通过专线进行自动驾驶路测数据的接入,分区采用双因子控制权限,由华为云和图商专业人员共同运维。智驾业务区由图商监管,通过账号授权给车企或算法公司的自动驾驶研发团队进行业务研发。网络中继区的接入控制有严格的身份认证,并且由图商审批才能将数据传出专区。

仅仅依靠建设,并不足以达到真正的安全合规,原因在于汽车云服务本身也面临着巨大的安全挑战,有数据统计,全球云厂商平均每年要遭受数千亿次攻击。

此外,安全威胁随时在发生变种,只有随环境变化,不断更新迭代运营策略,才能够有效化解风险,也能更好地发挥已建设好的云能力上限。

为此,华为云提出“三分建设、七分运营”的理念,专门构建7层安全纵深防御体系,并打造了安全云脑方案,拥有300多个安全检测模型,100多个自动响应剧本,实现99%的安全威胁5分钟闭环。

面对各类“云上突袭”,保持7×24小时在线,随时应对可能发生的突发事件,进一步提升了云上数据的安全性。

建设与运营并驾齐驱,华为云乌兰察布汽车专区实现了“攻击不瘫、数据不丢、监管合规”的目标,为智能汽车行业的发展提供强大的安全保障。目前乌兰察布汽车专区一期已有大量车企在使用,未来将有更多车辆“跑”在华为云上。

汽车云服务市场产品与资源众多,为何乌兰察布汽车专区最引人注目,取得这一成绩的,为何是华为云?

一方面在于汽车专区本身的特殊性,横跨了云和汽车两大领域,对云服务商提出十分高的要求,后者不仅需要有ICT能力,更要懂汽车。

某汽车集团IT总监曾表示,在自动驾驶研发过程中,存在许多工具链断点问题,需要汽车云服务商拥有提供或整合统一工具链的能力,而只有云服务商懂汽车,才能帮助车企尽快跑通(数据驱动)Pipeline。

华为云相比于其他云服务商的优势正在于此,早在2009年就通过研发车载通信模块切入汽车市场,而后跟随车企数字化转型,进入车联网领域,随着智能汽车时代到来,又扎进自动驾驶赛道,近15年的深耕,为华为云打造了坚实的汽车行业基础。

可以说,汽车行业每一次剧变背后都有华为的身影,也正是基于多年来服务车企的经验积累,华为云成为“最懂汽车的云服务商”。

另一方面,华为云在安全合规方面的深厚积累和高标准要求,让其在新一轮竞争中脱颖而出。华为云不仅继承了华为30多年的安全运营和治理经验,在认证资质方面也走在前列,通过了业内120+权威安全合规认证,也是中国首个通过汽车TISAX认证的云厂商。

从乌兰察布汽车专区“3分区合规架构+7层安全防护”可以看到,华为云在安全合规之上,不断筑牢安全。领先优势下,华为云乌兰察布汽车专区在2023年获得了诸多顶级玩家的青睐,目前已与多家头部自动驾驶算法公司、大型国央企、造车新势力、合资车企合作,部署并上线智驾业务,守护的数据量达到了数百PB级,在市场端,据最新IDC数据统计,2023年上半年,华为云汽车云持续蝉联中国汽车云市场第一。

在国内外主流车企中,有90%以上选择与华为云合作:某月销量超30万辆的头部车企借助华为云,构筑安全隔离的专属云与边缘计算,加速智能驾驶数据闭环;某出海销量长期排名第一的国有车企选择华为云,构建统一的云底座和大数据平台,支撑其七大业务模块上云;某国产商用车销量TOP1车企携手华为云建立了高效的车联网大数据平台,实现高并发数据流处理及系统架构的优化升级,打造极低时延,并有效降低系统开发运维成本……

如今,汽车智能化趋势愈发加深,不仅是特斯拉、蔚小理、华为等新势力在争先角逐自动驾驶,过去被认为智能化进程较慢的传统车企也在纷纷加码,例如今年奔驰官宣,第六代奔驰全新E级将在中国市场首次落地NOA功能,宝马、奥迪另外传统豪华品牌也已经有了动作。

高工智能汽车研究院数据显示,2023年1-9月,中国市场(不含进出口)乘用车前装标配(软硬件)NOA交付新车37.73万辆,与上年同期相比增长151.20%。

未来几年,NOA的普及化将是高阶智能驾驶市场的主旋律,由此带来的数据安全合规,成为玩家们不得不重视的问题,尤其是沿着“数据驱动”技术策略下,积累的安全风险、政策风险、市场风险越来越高,数据安全合规将成为未来驶入完全自动驾驶路上必过的一道大关,引发行业新一轮的较量。

华为云响应国家战略和市场需求,打造的乌兰察布汽车专区,正是应对这一趋势的“先头兵”,通过提供集聚数据安全合规和开发效率优势的云服务,为车企和算法公司做好智能驾驶功能开发,构筑坚实“护城河”,为车企智能化时代加速到来贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/274158.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

功能测试知识超详细总结

一、测试项目启动与研读需求文档 (一) 组建测试团队 1、测试团队中的角色 2、测试团队的基本责任 尽早地发现软件程序、系统或产品中所有的问题。督促和协助开发人员尽快地解决程序中的缺陷。帮助项目管理人员制定合理的开发和测试计划。对缺陷进行跟…

Python+OpenCV 零基础学习笔记(1):anaconda+vscode+jupyter环境配置

文章目录 前言相关链接环境配置:AnacondaPython配置OpenCVOpencv-contrib:Opencv扩展 Notebook:python代码笔记vscode配置配置AnacondaJupyter文件导出 前言 作为一个C# 上位机,我认为上位机的终点就是机器视觉运动控制。最近学了会Halcon发现机器视觉还…

基于SpringBoot + Vue的图书管理系统的设计与实现

基于SpringBoot Vue的图书管理系统的设计与实现 目录 1 引言 1.1 编写目的 1.2 项目背景 1.3 参考资料 2 总体设计 2.1 需求概述 2.2 软件结构 3 模块设计 3.1 模块基本信息 3.2 功能概述 3.3 算法 3.4 模块处理逻辑 4 数据库设计 4.1 ER图表 4.…

网页乱码问题(edge浏览器)

网页乱码问题(edge) 文章目录 网页乱码问题(edge)前言一、网页乱码问题1.是什么:(描述)2.解决方法:(针对edge浏览器)(1)下载charset插…

【力扣题解】P404-左叶子之和-Java题解

👨‍💻博客主页:花无缺 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 本文由 花无缺 原创 收录于专栏 【力扣题解】 文章目录 【力扣题解】P404-左叶子之和-Java题解🌏题目描述💡题解🌏总结…

量子密码学简介

量子密码学(英语:Quantum cryptography)泛指利用量子力学的特性来加密的科学。量子密码学最著名的例子是量子密钥分发,而量子密钥分发提供了通信两方安全传递密钥的方法,且该方法的安全性可被信息论所证明。目前所使用…

声明 | 为打击假冒账号、恶意抄袭账号等诈骗活动,提升本账号权威,本博主特此郑重声明

声明 | 为打击假冒账号、恶意抄袭账号诈骗活动,提升本账号权威,本博主特此郑重声明 一、本账号为《机器学习之心》博主CSDN唯一官方账号,唯一联系方式见文章底部。 二、《机器学习之心》博主未授权任何第三方账号进行模型合作、程序设计、源…

AMEYA360:佰维发布CXL 2.0 DRAM,赋能高性能计算

导语:CXL是一种开放式全新互联技术标准,可在主机处理器与加速器、内存缓冲区、智能I/O设备等设备之间提供高带宽、低延迟连接,从而满足高性能异构计算的要求,并且其维护CPU/GPU内存空间和连接设备内存之间的一致性,突破…

性能测试必备基础知识(一)

1. 平均负载 平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数,它和CPU使用率并没有直接关系。 可运行状态的进程是指正在使用CPU或者等待CPU资源的进程。当我们使用类似于"ps"命令时…

金三银四,软件测试面试题总结,offer稳稳的。。。

前言 前面看到了一些面试题,总感觉会用得到,但是看一遍又记不住,所以我把面试题都整合在一起,都是来自各路大佬的分享,为了方便以后自己需要的时候刷一刷,不用再到处找题,今天把自己整理的这些…

基于springboot,vue在线聊天系统

开发工具:IDEA 服务器:Tomcat9.0, jdk1.8 项目构建:maven 数据库:mysql5.7 系统分前后台,项目采用前后端分离 前端技术:TypeScriptVue3.0ElementUI-Plus 服务端技术:springboo…

HarmonyOS4.0系统性深入开发06Stage模型开发概述

Stage模型开发概述 基本概念 下图展示了Stage模型中的基本概念。 图1 Stage模型概念图 UIAbility组件和ExtensionAbility组件 Stage模型提供UIAbility和ExtensionAbility两种类型的组件,这两种组件都有具体的类承载,支持面向对象的开发方式。 UIAbili…

Solana 生态铭文跨链桥 Sobit 是何神圣?其场外白名单已达到1200U

在短暂的沉寂,在与 Solana 手机 Saga 联合生态 Meme 币 Bonk 掀起一波 meme 浪潮,以及GPU 计算网路Render network 宣布将从公链Polygon迁往Solana 后,Solana 生态再次迎来爆发。随着 SOL 代币在 12 月暴涨,SOL 也在市值上超越了 …

最新多模态大模型SOTA - EMU (Generative Multimodal Models are In-Context Learners)

前言 设计的模型叫EMU,通过统一的自回归方式(其预测的输出依赖于过去的输出)训练。参数37B(370亿)。指标在目前多项视觉(图像,视频)问答的SOTA tips: 不过这里吐槽一点…

计算机网络——网络层(四)

前言: 前面我们已经对物理层和数据链路层有了一个简单的认识与了解,现在我们需要对数据链路层再往上的一个层,网络层进行一个简单的学习与认识,网络层有着极其重要的作用,让我们对网络层进行一个简单的认识与学习吧 目…

加强-jdbc与连接池的关系,连接池有哪些

0驱动什么是数据库驱动 开发人员编写好应用程序之后想要操作数据库,平常就了解到有很多种数据库如oracle\mysql\sql server,代码已经写好了是一套总不能在使用不同的数据库技术的时候代码就要写不同方式连接来连接数据库吧,所以开发商在开发数…

什么是公网IP和弹性公网IP

目录 公网IP 弹性公网IP 公网IP 公网IP是由公共网络运营商分配且具有独立性、全球唯一性和全球可达性等特点,可让用户通过互联网与其他用户实现数据交流和信息传递。 用户会使用网站的域名访问网站,而域名会通过DNS域名解析服务解析为公网IP地址&…

本地登陆页面:对本地搜索词进行排名的策略

位置着陆页没有得到足够的尊重。 你用你的姓名、地址、电话号码和工作时间来设置它们。也许您嵌入了用于行车路线的 Google 地图。 也许你写了一些没人会读的副本,如果你有多个位置,你在每一页上重复相同的副本,只是更改位置名称。 如果你…

【Unity6.0+AI】Sentis加载模型识别手写数字案例实现

按照国际惯例,看效果: 素材准备: 自己在PS中绘制黑底白字手写字体,导出jpg,尺寸28*28! 素材设置 基本步骤 准备工作:从 ONNX Model Zoo 下载手写识别 ONNX 模型文件 【下载模型】MNIST 手写数字识别模型 mnist-12.onnx,并将其拖入项目窗口的 Assets 文件夹。 【下载模…

组织框架概念澄清及表设计

组织 企业组织 企业组织就是企业正式编制,以单独的编制,是个人在企业所在的长久的家,类似于所说的考编,在企业体制内的位置,可能一个人在组织有不同的岗位,也可能有不同的项目组,但是&#xf…