汽车数据应用构想(一)

自从电动汽车GB/T32960标准颁布,要求所有电动汽车必须上传数据开始,各车厂就开始花费大量的人力物力,用于数据的上传与存储。同时随着智能化、网联化的趋势,不断丰富上传数据的内容与数量。数据已成为车厂的重要资产,但这些资产如何变现,却成为产品经理们的难题。

大概是6年多以前吧,当时的数据量还远远比不上如今,单靠一家车厂的数据量根本称不上“大数据”,所以行业中开始有建设汽车行业统一数据平台的呼声(当然,发声的主要是软件供应商……)。有幸参加了相关会议,与会的车厂代表都对这个话题表达了“有兴趣”,但“不参与”的态度。理由也很简单:数据是私有财产,分享了有啥好处啊?!

对,就是这个“有啥好处”成为话题的焦点,也成为无法推动这个事儿的最大障碍。车厂不想参与,却想听听每年花费不少的数据资源,到底能干点儿啥!可惜的是,除了围绕电池分析的价值外,很少有人能讲出还能干点儿啥。而当时电池又处于一个技术更新非常快的阶段,技术路线、生产工艺,甚至化学原理都不一样的情况下,用今天的数据去看明天的电池,任谁想来也不是一个靠谱的事儿。

时至今日,即便是最保守的日系合资车厂,也都有百万级的车在上传数据,且数据范围早已从电池扩展到整车,甚至用户与车的每一次交互,都记录下来。单个车厂的数据存储量,已经把单位从TB,升级到了PB。在如此巨大的数据资源下,无需建立行业统一数据平台,车厂自己就已经具备了对应各种数据需求的底气。

各种“数据平台”“数据底座”“数据能力”...被供应商们吹得天花乱坠,但实际结果往往就是最基础的数据采集、数据清洗,以及各业务部门要求的数据统计。经历多年高投入的“数据基础能力”建设,车厂数据部门每年都要经历“数据价值”的拷问。供应商们也都纷纷从基础能力的牛皮中转向“价值”接着吹,但与花费不菲,且需要持续投入的成本相比,价值几乎少得可怜!

所以咱们就新开一个话题,专门聊聊数据应用价值的想法,本期作为第一篇,先不说实际的应用,而是重点说说在做这些应用的时候,我们会面临哪些问题!

上面都说过了基础建设做了多年,为啥还有问题?其实答案特别简单:你没做过饭,就异想天开地去打造一套万能厨具,等真开始做饭的时候,你就会发现,缺这个少那个!

一、数据项缺失:你想去做停车位预测应用,为了弥补低速下GPS漂移问题,就需要通过方向盘角度及车轮转数精确计算停车时的行驶路径,结果发现,这两数据没采集。

二、采集频率不足:还是上面的例子,如果更进一步地想知道停车位的类型(侧停、斜停、垂直),就需要精确的停车轨迹,如果数据采集频率是5秒1次,那就没办法满足需要。

以上两点,在实际数据应用中是不可避免的,因为谁也不知道未来的应用到底需要哪些数据,更无法知道需要什么样的采集频率。很多人会想,那就把车上所有的数据都按车端最大产生频率上传,解决一切。但这可是要成本的啊!流量成本、储存成本都会成倍,不,应该说是几十倍上百倍地增长,且未来的检索速度也会上百倍地下降!

想解决这个问题其实并不难,就是在车端去做一个可配置化的“数据网关”,车上产生的所有数据都先传到网关,通过规则去配置哪些数据,以什么样的频率去打包上传(当然,什么压缩啊,实时/定时啊,都可以是这个数据网关要解决的问题)。这样就可以“按需所取”,把钱花在刀刃上:数据只有满足业务需要才是有价值的!

三、数值异常:数据库中存在着大量的异常数值。比如“0”、“null”,甚至各种乱码,这些数据虽然会被“洗”掉,还是停车的例子,洗掉这些异常数值后,停车轨迹可能只剩一个点了。

四、时序异常:停车轨迹会出现点位前后反复横跳的现象,其实就是数据在上传时并没按时间顺序保存,前一秒的数据被保存在后一秒之后,导致了数据的不连贯性;

以上两点,是在实际应用落地工作中最常见的问题,毕竟车载场景的网络环境不稳定,重传机制、补数机制,以及网络传输错误都会导致这些问题的出现。甚至还有些重传机制没做好的平台中,会出现大量重复数据。“脏数据”在汽车领域要远高于其他场景

解决方案只能依赖技术手段,无非就是车端与云端的各种容错、纠错、校验手段。随便找一个车联网供应商,都会给出各种产品级的解决方案,这里就不再多说了。但要强调的是,脏数据不避免,要不我怎么还能遇到这些问题呢!在实际应用开发中先去检测数据质量,根据实际数据质量调整数据算法才是最务实的方法

五、分布密度不足:你会发现一个现象,同一品牌的车,在A城有15万辆在传数据,在B城只有5千辆,这种分布密度的不同,导致数据应用的价值与体验有天壤之别;

有些车厂面对这个问题的时候,对于应用价值的认可度就会大打折扣,认为不能满足所有客户价值的服务是不公平的,也就不再推动相关的落地工作,上面说的停车位预测应用就是因为这个原因导致一直没有落地!

但停车是汽车场景中最高频,最有用户价值的服务,就像城市NOA对于自动驾驶,是所有用户都期待的,但没办法保证所有城市都覆盖。那不如也试试逐步上线的策略,一个城市一个城市地去推,哪个城市的数据量够了就上哪个城市,“抢占市场”在数据应用中也是个非常重要的目标

最后再说说对于数据应用中“准确度”这个事儿的看法,最好的例子就是导航中提供的“红绿灯倒数秒”这个功能。只要是越来越准,用户就非常满意了,用户本来也没指望你一上来就准,差不多就可以,被互联网熏陶多年的中国用户,容忍度非常高,数据应用是个迭代的过程,真的没必要上来就要求准确度要高于多少多少。用起来,再升级,是数据应用价值落地的最重要原则

下期开始讲具体的数据应用场景,还没想好一共写几篇,一个一个来吧。


文章首发于公众号:昊叔说车

原创不易,转载请告知原作者,注明出处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/648005.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

暴力数据结构之二叉树的代码练习

1.二叉树的遍历 来源:牛客网 解题思路:这里首先第一个遇到的难点就是如何创建一棵树, 我们知道树的创建首先就是找到根结点,然后创建左右子树,所以这里是利用前序创建一棵树。 根据题目,#就是一个叶子结…

C++系列-static成员

🌈个人主页:羽晨同学 💫个人格言:“成为自己未来的主人~” 概念 声明为static的类成员称为类的静态成员,用static修饰的成员变量,称之为静态成员变量,用static修饰的成员函数,称之为静态成…

基于集成经验模态分解的心电信号降噪和基于希尔伯特变换的R峰检测(MATLAB R2018)

近年来,心脏病已成为危害人类健康最常见的疾病。为了有效预防心脏疾病的发生,往往需要更加准确地采集与诊断心电信号,以便于更好地反映心脏情况。心电信号作为人体生理信号,对于识别心脏异常和心脏疾病具有重要的参考价值。心电信…

K8S认证|CKA题库+答案| 16. 升级集群

目录 16、升级集群 CKA v1.29.0模拟系统 下载试用 题目: 开始操作: 1)、切换集群 2)、 隔离节点 ​3)、登录提权 ​4)、解锁版本 ​5)、查看版本 6)、升级版本 7)、其他…

Taipy快速打造数据驱动的Web应用

Taipy: 用Taipy,让数据洞察与应用开发无缝对接- 精选真开源,释放新价值。 概览 Taipy快速打造数据驱动的 Web 应用。这是一个基于 Python 和 Flask 的项目,结合了 React 等前端技术,为开发者提供了一个简洁、高效的开…

Python考试复习--day3

1.统计字符串个数 ninput() z0 s0 k0 o0 for i in n:if i.isalpha():zz1elif i.isnumeric():ss1elif i.isspace():k1else:o1 print(字母有{}个,数字有{}个,空格有{}个,其他字符{}个.format(z,s,k,o))2.分类统计字符 ninput() x0 d0 s0 k0 o0 for i in n:if i.islower():x1elif …

2.1 数据类型-常量-变量(整型-浮点-字符)

目录 1 数据类型 1.1 关键字 2 常量 3 变量 3.1 命名规则 4 整形数据 4.1 符号常量 4.2 整型变量 5 浮点型数据 5.1 浮点型常量 5.2 浮点型变量 6 字符型数据 6.1 字符型常量 转义字符 6.2 字符数据在内存中的存储形式及其使用方法 6.3 ASCII码表 7 字符串型常…

吉大计科软件工程个人错题

文章目录 Chapter oneChapter two——软件过程Chapter three——可行性研究Chapter four——需求分析Chapter five——总体设计Chapter six——详细设计Chapter seven——实现Chapter eight——软件维护Chapter nine——软件项目管理Chapter ten——面向对象一些不会的题一些可…

windows安装SQL Server

1、下载 下载网页:SQL Server 下載 | Microsoft 2022版下载地址:https://go.microsoft.com/fwlink/p/?linkid2215158&clcid0x404&culturezh-tw&countrytw 下载结果:SQL2022-SSEI-Dev.exe 打开选第三个,下载介质&…

二叉树——经典练习题

目录 前言: 一、单值二叉树 题目描述: 思路分析: 代码实现: 二、二叉树最大深度 题目描述: 思路分析: 代码实现: 三、检查两颗树是否相同 题目描述: 思路分析: 代…

AI图书推荐:ChatGPT解码—人工智能增强生活指南

《ChatGPT解码—人工智能增强生活指南》(ChatGPT Decoded. A Beginners Guide to AI-Enhanced Living )是一本由 大卫维恩斯(David Wiens )所著的书籍,旨在帮助读者了解并有效利用GPT-4语言模型这一强大工具来提升日常…

OceanBase SQL 诊断和调优实践——【DBA从入门到实践】第七期

数据库作为绝大多数应用系统储存数据的核心系统,在用户系统需要访问数据时,有着至关重要的作用。在这些交互中,SQL 语言是应用与数据库系统之间“沟通”的桥梁,它负责将应用的指令传达给数据库。因此,SQL 的性能好坏直…

网络工程师---第三十八天

ISIS: ISIS含义:中间系统到中间系统IS-IS。 ISIS特点:①内部网关协议IGP(Interior Gateway Protocol),用于自治系统内部; ②IS-IS也是一种链路状态协议,使用最短路径优先SPF算法进…

Jenkins 流水线(Pipeline)详解

大家好,Jenkins 流水线(Pipeline)是一种可编排的持续集成和交付(CI/CD)方法,它以代码的方式定义整个软件开发过程中的构建、测试和部署流程。接下来就跟大家分享一下Jenkins 流水线(Pipeline&am…

云计算-基础设施和管理机制(Infrastructure and Management Mechanisms)

逻辑网络边界(Logical Network Perimeter) 逻辑网络边界是软件控制的虚拟网络,它是物理网络的一部分。其主要思想是隔离逻辑网络,防止不希望的访问,同时仍然为合法用户提供访问权限。下图显示了云系统中一个简单的逻辑…

【Qt】Qt入门

思维导图 学习目标 这一系列是学习Qt,在C中,会发现有不少岗位的要求是熟悉Qt,所以Qt的学习是不能推迟的。 一、Qt的概述 1.1 Qt的特点 Qt是一个跨平台的C应用程序开发框架: 具有短平快的优秀特质:投资少&#xff0…

每日练习——同余方程以及格雷码

同余方程 题目描述 运行代码 #include<iostream> #define ll long long using namespace std; ll exgcd(ll a, ll b, ll& x, ll& y) {if (!b)return x 1, y 0, a;ll d exgcd(b, a % b, y, x);y - a / b * x;return d; } int main() {ll a, b, x, y;cin >…

【教学类-58-05】黑白三角拼图05(2-10宫格,每个宫格随机1张-6张,带空格纸,1页3张黑白3张白卡)

背景需求&#xff1a; 【教学类-58-04】黑白三角拼图04&#xff08;2-10宫格&#xff0c;每个宫格随机1张-6张&#xff0c;带空格纸&#xff0c;1页6张黑白&#xff0c;1张6张白卡&#xff09;-CSDN博客文章浏览阅读582次&#xff0c;点赞16次&#xff0c;收藏3次。【教学类-58…

Kafka 安装教程和基本操作

一、简介 Kafka 是最初由 Linkedin 公司开发&#xff0c;是一个分布式、分区的、多副本的、多订阅者&#xff0c;基于 zookeeper 协调的分布式日志系统&#xff08;也可以当做 MQ 系统&#xff09;&#xff0c;常见可以用于 web/nginx 日志、访问日志&#xff0c;消息服务等等…

C++之lambda函数与std::bind区别及用法实例(二百八十)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a;多媒…