【金猿人物展】DataPipelineCEO陈诚:赋能数据应用,发挥未来生产力


22048a65ed890df61e905c4451a671b0.png

陈诚

本文由DataPipelineCEO陈诚撰写并投递参与“数据猿年度金猿策划活动——2023大数据产业年度趋势人物榜单及奖项”评选。

74c32a04fc66596f62985610efa61795.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


我们处在一个“见证奇迹”的时代。在过去的20年间,我们见证了大数据技术快速发展所带来的巨大改变。如今我们看到,以大数据为基础的智能时代已然来临,这将为全球信息技术带来前所未有的机遇和挑战,促成未来生产力的爆发。但从行业实际应用的角度出发,如何释放企业积累和持续产生的大量数据价值,使其成为撬动未来生产力的支点,实现业务和效率的双重提升,是迈向新征程的重中之重。

实时数据+AIGC有望开辟新的维度

随着AI时代的到来,数据的增长呈现上升趋势,包括直接获得的数据、通过业务系统或机器数据捕获的数据以及由AI模型生成的数据。这些数据对于企业感知用户需求、优化体验和决策至关重要。尽管AIGC技术的创新或许能为突破传统瓶颈问题带来全新的解决方案,但作为新兴技术,AIGC如何清晰的实现业务价值,还需要依赖可靠性和可信度极高的数据。在这个过程中,作为下一代数据基础设施提供商,DataPipeline将发挥重要的作用。

683e146d45280a8d3e6f8872d223be68.png
图源来自Gartner

数据领域在过去几十年得到迅速发展,现在每个企业都成为了“数据公司”。随着AIGC技术的发展,企业可以通过它来分析和处理内部所产生的大量独有数据资产,这种方式可以在市场分析、客户洞察、产品开发等多个方面发挥巨大作用,并且实现业务的持续创新和增长。因此,建立一个能够处理实时数据的基础设施变得至关重要,它能确保AIGC应用获取及时、可靠、精准的数据,实现实时分析和高效洞察,从而帮助企业充分释放数据价值。

从DataPipeline的产品结构上看,我们致力于将企业的数据这一核心生产要素和企业的价值通过基于DataOps的数据管理手段进行链接,并沉淀成必要的数字化底层能力。随着国家科技实力的不断提升和AIGC技术的崭露头角,数据流动所带来的价值也越发重要。不难预见,DataPipeline所提供的实时数据处理能力,将成为企业实现AIGC技术有效应用的关键。

5de0b52f8adb2c85963cf2d60080848a.jpeg
DataPipeline产品架构图

影响数据生产力的两大关键因素

一项技术从萌芽之初发展到稳定成熟的过程中,不可避免的会经历多个阶段。2000年,大数据概念的首次出现,便引起了数据处理领域的高度关注。到了2014年,当大数据最后一次被Gartner收录至Emerging Technologies Hype Cycle中,意味着大数据已步入稳定的成熟期。十年后的今天,大数据已成为企业战略的重要核心,数据在各行各业的发展运营、业务开拓、市场洞察和管理决策等方面中的重要性不言而喻。

“数据是新时代的石油。”这句话虽然有些老生常谈,但它却揭示了一个事实:在当今世界,数据已成为企业最重要的资产之一。在这个共识之下,企业以数据驱动数字化转型,实现数据生产力的充分释放。但是,数据技术的更新迭代和市场需求的快速升级,使数据管理在内外部作用下面临着新的挑战。如何推动数据与业务深度融合,让数据在业务中发挥实际作用并为企业创造价值,成为了每个企业不容忽视的重要课题。

随着新的业务形态不断出现,各行业的客户行为也发生着日新月异的变化,例如服务场景的社交化、营销渠道的线上线下一体化等,这对传统的经营模式带来了巨大挑战。企业在释放数据生产力的过程中,有着两个关键的影响因素。

一是数据应用场景不断丰富。随着数据技术的更新迭代和市场需求的快速升级,在业务侧,数据驱动了各种各样的应用场景,如风控、营销、客户体验、内部管理等多种用数场景推动了数据管理理念与实践的变革。在技术侧,数据源的架构变得繁多和复杂,数据应用也逐渐变得更加垂直和场景化,这倒逼了现代数据架构飞速发展。

二是数据供给速度持续提高。业务部门想要快速抓住商机、及时构建应用并留存客户进行营销,不仅需要用数据快速测算市场规模,更需要在时间窗口打开的时机内提供相应的产品和服务从而占领市场,这导致业务部门对数据处理的时效性要求变得越来越高。

在应对不断丰富的场景和数据处理速度的变化时,企业面临的核心问题是如何获得时效性更强、可靠性更高和可观测性更强的数据基础设施,以提高企业的运营效率和帮助企业发现新的业务增长点。

基础设施可靠性和业务需求间的平衡

构建实时数据管理体系是一个逐步演进的过程,这也反映了企业对数据时效性需求的巨大变化。我们发现,随着业务应用需要最新的数据以做出有效的决策,数据处理的时效性要求已从按季、月计算转变为以分钟、秒为单位。这一过程的关键在于增强多方角色协同与敏捷开发程度,确保数据从生产到消费的各个环节都紧密相连,从而形成一个有机的整体。当前趋势表明,基于大数据平台、流式计算引擎的数据处理模式相对数仓的数据处理模式而言,并不是替代和颠覆的关系,而是会共同且长期的存在于企业的数据架构当中,并不断引入和集成,更新、更加场景化的处理模式,从而应对快速变化的业务需求和市场需求。

df8f09f50a6ba8e61f0cfce2e5d3f9b3.jpeg

DataPipeline作为安全可靠的数字基础设施,一方面,我们能够高效地将数据从异构的数据源集成到业务系统,优化数据流程和提升数据处理的时效性,帮助企业迅速响应市场变化。另一方面,我们通过对业务需求进行精确判断和筛选,确保理解客户业务需求和最终目标,避免资源浪费。基于这种方法,我们既能清晰地规划产品发展路线,又能高效配置资源,从而实现数据生产力的最大化。

技术投入和成本效益的平衡

目前,我们可以大约接触到1400多种大数据技术。尽管技术的多样性为创新提供了广阔空间,但也带来了技术投入和成本效益之间的考量。自2010年开始,伴随互联网行业的崛起,数据量级呈现爆炸式增长,出现了更加复杂和多样的数据源,数据的流转、存储以及管理等问题变得更加复杂。到今天,多重系统和并行逻辑的使用仍会导致数据架构变得复杂,而AIGC等新技术的引入,会进一步增加数据架构的复杂性,这严重降低和阻碍了数据价值的释放与效率。因此,对于企业而言,建立统一的数据架构和管理机制至关重要,它不仅简化了管理流程,而且确保了技术投入和成本效益之间的平衡。

我们致力于让数据回归业务,让客户关心业务本身。DataPipeline提供统一的实时数据管理平台,通过对数据链路持续构建,像交付应用一样快速、灵活地交付数据,并在过程中管理好数据链路的可观测性,让数据业务人员更容易地发现数据、安全地使用数据,最终达到降低TCO,提高ROI,帮助各行各业的企业实现数字化和智能化转型的长期战略目标。

发挥未来生产力

目前,以人工智能、云计算、大数据及互联网技术为代表的技术正对各行各业的业务模式和竞争形态进行重塑。在新的发展格局之下,技术场景的快速分化产生大量不同特性的存储与计算引擎、信创大势下优秀国产基础软件涌现、业务导向下数据结构的快速迭代、网络技术革新带来的丰富数据源,繁荣的技术生态正在呼唤更创新的数据管理方式。

同时,业务全场景创新、数据量爆炸式增长且渗透度高、数据时效性需求增加、数据采集/获取/应用的复杂度提升、异构数据技术引擎的涌现与驱动,这几个因素的加权将带来必然的数据管理理念与实践的变革。

自DataPipeline创立之初,我们便秉承着“连接一切数据、应用和设备”的使命,将业务聚焦于组织的数据管理全景,始终致力于释放数据生产力。在多年的发展中,DataPipeline深耕对数据安全性、可靠性及运行性能有着最高行业标准的金融业,旨在打造具有高标准的行业级标杆案例,再逐步覆盖能源、运营商、政企等行业,目前已服务了中国银行、中国民生银行、中国石油、中国电信等世界五百强企业在内的数百家客户。实践证明,DataPipeline通过打造实时数据管理基础,有效满足了众多客户根据自身特点和业务场景的需求。这不仅让客户能够充分地挖掘数据潜力,也使他们能够敏捷应对业务变化。通过这种方式,DataPipeline成功地支持了各行各业的数字化和智能化转型进程。

c26a48b36297eacd47a21cc8a0c65c42.png
DataPipeline获得重点领域信息化领先客户的深入认同

同时,我们深知新技术的应用需要全产业链的共同探索。为此,DataPipeline不断加强生态系统的建设,积极投入产业适配。目前,DataPipeline已与多家生态伙伴开展生态建设,共同构建自主安全的上下游业务生态,旨在向下深度整合各类数据管理技术,向上支撑各行业的数字化和智能化应用,确保它们的成功落地和稳定运行。

a0b1617260c4bdd8f8a33930d3cfc609.png
DataPipeline生态图谱

我们相信,在不远的未来,数据生产力必将得到更进一步的释放!

·关于陈诚:

陈诚,DataPipeline创始人&CEO,本科就读于上海交通大学,留学于美国密歇根大学并获荣誉毕业,曾就职于美国 Google、Yelp 等国际知名公司;专注于大数据、计算机算法、软件工程、互联网产品等领域的研究,曾参与大数据团队构建实时可扩展大数据平台每年给 Yelp 节省上千万美元。

2c64e65428a648a997e36a828d54cc6a.jpeg

3d975350e25b1a64d37cf6b50a09c154.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/316008.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flask+ Dependency-injecter+pytest 写测试类

最近在使用这几个在做项目,因为第一次用这个,所以不免有些问题。总结下踩的坑 1.测试类位置 首先测试类约定会放在tests里面,不然有可能发生引入包的问题,会报错某些包找不到。 2. 测试类依赖注入 这里我就用的真实的数据库操作…

Vue-17、Vue人员列表过滤(案例)

1、watch实现 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>列表渲染过滤</title><script type"text/javascript" src"https://cdn.jsdelivr.net/npm/vue2/dist/vue.js&qu…

C1-3.4 多个样本的向量化

C1-3.4 多个样本的向量化 1、为什么要用样本的向量化呢&#xff1f; 总结一句话&#xff1a;计算方便 下图是神经网络计算的步骤&#xff0c;右侧 是有一个输入变量a[0]&#xff08;什么是X呢&#xff0c;因为输入层有三个神经元&#xff0c;说明有三个输入变量&#xff0c;…

信号量机制

1965年&#xff0c;由荷兰学者迪科斯彻Dijkstra提出&#xff08;P、V分别代表荷兰语的Proberen &#xff08;test&#xff09;和Verhogen &#xff08;increment&#xff09;&#xff09;、是一种卓有成效的进程同步机制。 信号量-软件解决方案&#xff1a; 保证两个或多个代码…

记录一个Insert姿势引起的MySQL从库上查不到数据的问题

转载说明&#xff1a;如果您喜欢这篇文章并打算转载它&#xff0c;请私信作者取得授权。感谢您喜爱本文&#xff0c;请文明转载&#xff0c;谢谢。 问题描述&#xff1a; 某测试环境的MySQL用了两台节点&#xff0c;主从同步结构。忽然有研发同学反映说MySQL的主从不同步了。他…

数据分析实战丨基于flask+pygal可视化分析sqlite中的数据

文章目录 写在前面实验目标项目框架实验内容1.配置实验环境2.查看sqlite3数据库的数据3.创建项目文件4.编写代码5.运行项目 运行结果写在后面 写在前面 本期内容&#xff1a; 基于FlaskPygal可视化分析Sqlite3中的数据 实验环境&#xff1a; pythonpygalflask 项目下载地址…

浅析链表结构

一、单向链表 C语言中数组是常用的一种数据类型&#xff0c;但可惜数组长度是固定大小的&#xff0c;不能动态扩展&#xff0c;使用起来有时不是很方便。然后就有了自定义的动态数组结构&#xff0c;动态数组就比较好用了&#xff0c;长度可以任意扩展&#xff0c;但还有一个问…

2024阿里云服务器ECS介绍_全方位解析_CPU性能详解

阿里云服务器ECS英文全程Elastic Compute Service&#xff0c;云服务器ECS是一种安全可靠、弹性可伸缩的云计算服务&#xff0c;阿里云提供多种云服务器ECS实例规格&#xff0c;如经济型e实例、通用算力型u1、ECS计算型c7、通用型g7、GPU实例等&#xff0c;阿里云百科aliyunbai…

Ubuntu 在线Swap扩容

1. 查看本机swap空间 free -h 2. 找一个较大的高速盘&#xff0c;创建swap的空间 mkdir /swap cd /swap sudo dd if/dev/zero ofswapfile bs50M count1k3.建swapfile&#xff0c;大小为bs*count 50M * 1k 50G 4.标记为Swap文件&#xff0c;让系统能识别交换文件。 sudo mk…

C1-3.2 关于‘神经网络’

C1-3.2 关于‘神经网络’ 【注释】 彩色图像&#xff08;RGB&#xff09;由三原色构成&#xff0c;二维图像在任意一个点像素为立体三层结构&#xff0c;分别是红色、绿色、蓝色值&#xff0c;该值的范围在0∽255之间 1、全连接神经网络——整体架构 【注释】&#xff1a; …

科技顶天,市场立地 。璞华科技“顶天立地”的成长之路

科技顶天&#xff0c;市场立地。 几十年来&#xff0c;我们越来越深刻地认识到&#xff0c;这就是真理&#xff0c;质朴而深刻。尤其在当前特殊的国际国内商业环境中&#xff0c;这一理念不但没有过时&#xff0c;反而恰逢其时。有这么一家企业&#xff0c;一直践行“科技顶天…

分类预测 | Matlab实现RP-LSTM-Attention递归图优化长短期记忆神经网络注意力机制的数据分类预测【24年新算法】

分类预测 | Matlab实现RP-LSTM-Attention递归图优化长短期记忆神经网络注意力机制的数据分类预测【24年新算法】 目录 分类预测 | Matlab实现RP-LSTM-Attention递归图优化长短期记忆神经网络注意力机制的数据分类预测【24年新算法】分类效果基本描述模型描述程序设计参考资料 分…

2023极客大挑战web小记

拿到题目提示post传参还以为是道签到题 刚开始直接把自己极客大挑战的username以及password怼上去&#xff0c;但是不对。看看F12&#xff0c;有提示。 当一个搜索蜘蛛访问一个站点时&#xff0c;它会首先检查该站点根目录下是否存在robots.txt&#xff0c;如果存在&#xff0c…

近视的孩子用什么灯?学生考研护眼台灯推荐

随着时代快速发展&#xff0c;2022年我国近视人数达到了7亿&#xff0c;呈现低龄化趋势&#xff0c;儿童及青少年人数占了53.8%。现在学业负担都很重&#xff0c;每个家长都不希望自己的孩子近视或加深近视了&#xff0c;都会想尽一切办法保护视力。而护眼台灯就成了家长购买台…

智能路由器中的 dns.he.net可使用自定义域名的免费 DDNS 服务配置方法

今天介绍的这个是可以使用自定义域名同时支持使用二级域名的免费DDNS服务 dns.he.net的动态DDNS服务的配置方法, 这个服务相对还是比较稳定的, 其配置也和其他的DDNS服务有些不太一样, 首先他的主机名: 这里需要设置为登录后分配的区域域名: ipv6.he.net 然后就是 DDNS 用户…

Git新手?这篇文章带你飞!基础操作一网打尽!

推荐阅读 智能化校园&#xff1a;深入探讨云端管理系统设计与实现&#xff08;一&#xff09; 智能化校园&#xff1a;深入探讨云端管理系统设计与实现&#xff08;二&#xff09; 文章目录 推荐阅读Git初识Git啥是版本控制系统&#xff1f;&#xff1f;集中式VS分布式 git使用…

录屏怎么打开?看这里,录制视频不费事!

随着科技的快速发展&#xff0c;录屏已经成为人们日常生活中经常使用的功能。无论是录制游戏视频、教程讲解&#xff0c;还是录制在线会议&#xff0c;录屏软件都发挥着重要作用。然而&#xff0c;很多用户并不知道录屏怎么打开&#xff0c;以及如何使用它们。本文将介绍两种常…

【书生·浦语】大模型实战营——第四课作业

教程文档&#xff1a;https://github.com/InternLM/tutorial/blob/main/xtuner/self.md 基础作业需要构建数据集&#xff0c;微调模型&#xff0c;让其明白自己的弟位&#xff08;OvO&#xff01;&#xff09; 微调环境准备 进入开发机后&#xff0c;先bash&#xff0c;再创…

uniapp微信小程序投票系统实战 (SpringBoot2+vue3.2+element plus ) -投票帖子明细实现

锋哥原创的uniapp微信小程序投票系统实战&#xff1a; uniapp微信小程序投票系统实战课程 (SpringBoot2vue3.2element plus ) ( 火爆连载更新中... )_哔哩哔哩_bilibiliuniapp微信小程序投票系统实战课程 (SpringBoot2vue3.2element plus ) ( 火爆连载更新中... )共计21条视频…

应急管理蓝皮书 |《应急预案数字化建设现状和发展建议》下篇

导读 《应急预案数字化建设现状和发展建议》&#xff1a;297-313页 《中国应急管理发展报告》系列蓝皮书由中央党校&#xff08;国家行政学院&#xff09;应急管理培训中心&#xff08;中欧应急管理学院&#xff09;联合社会科学文献出版社研创出版&#xff0c;本着“权威前沿…