今天,我们说一下大型企业全域数据的整合集成问题。
通常,中大型企业和集团公司拥有大量多源异构的数据存储资源,如数据仓库、数据湖以及分布于分子公司和混合多云平台的业务系统,通过传统物理集中统一数据资产管理的方式难度高,代价大,这就带来一系列问题:
数据孤岛普遍存在,包括随着业务发展,数据基础设施与组织架构持续演进,形成多层级、多地域的离散数据架构;大数据技术持续升级换代和 AI 技术的发展,企业内存在不同代际的计算、引擎与大数据技术架构。
物理数据集成模式失灵,数据采集滞后性严重,高度依赖人工 ETL 作业,导致业务用数效率低,普遍存在大量不必要的数据同步,导致存储和计算大量冗余,成本无序增长,无法复用已有计算引擎,算力重复投资,使得数据时效性和准确性很低。同时,数据管理权责界定困难,导致物理数据集中障碍重重,数据同步过程中,数据质量及维护责任界定困难,以及跨境合规、组织合规等问题,使得数据集成难上加难。
而因为跨源取数难、数据治理和分析难、数据安全管控难,为企业实现数据资产化管理和挖掘数据价值造成重重阻碍。
作为国内 Data Fabric 架构理念的实践者与引领者,Aloudata 大应科技业内首次提出了“NoETL”创新理念,旨在以自动化、智能化替代传统的 ETL 人工作业工程,消除数据管理技术瓶颈,系统性地提升数据管理与数据价值挖掘的效能。
为帮助企业实现全域数据的高效、低成本集成,Aloudata 打造了国内首个 Data Fabric (数据编织)逻辑数据平台——Aloudata AIR,通过自研数据虚拟化技术,以及独有的查询下推和查询加速技术,开创了一种全新的数据整合模式,可帮助企业轻松实现离散数据在逻辑层面的高效统一集成,以极低成本沉淀全域数据资产,并提供统一的数据服务,实现统一的数据访问控制机制,让全域数据要素低成本、实时地流通与消费。
借助于 Aloudata AIR 逻辑数据平台,企业无需进行数据复制、存储、搬运,即可实现全域数据的集成整合和自适应加速。
- 秒级数据集成:数据源接入即可实时查询;无物理数据同步,数据可实时保鲜;无需维护大量贴源层的数据同步任务,显著节省存算成本,同时避免数据权责转移带来的数据归属及数据质量等维护问题。
- 统一数据服务与全域资产管理:构建全域数据资产视图与目录;统一数据查询和访问入口;统一企业全部数据的权限管控、审计与数据脱敏。
- 自动化数据加工:自动生成 ETL 作业和作业回收,存算成本节约 50%+,人工作业量下降 70%+;智能查询下推与自适应的查询加速确保大规模数据加工性能;支持任意层级视图嵌套和任意 SQL 复杂度的视图加速和命中改写。
- 便捷化数据消费:一套 SQL 语法实现数据集成、逻辑整合和数据消费全链路取数和用数场景;面向业务,屏蔽不同引擎的技术差异与复杂性;需求交付效率 10 倍提升。
- 基础设施开放兼容:内置或复用已有计算引擎;逻辑数据平台层同底层引擎解耦;逻辑数据平台层同底层引擎解耦,支持企业未来透明升级新的大数据引擎及解决方案,例如基础设施升级(替换任意数据湖或数仓方案)场景下,屏蔽给上层业务带来的影响。
目前,Aloudata AIR 逻辑数据平台已在极高复杂度的数据生产和消费环境中落地应用,帮助首创证券轻松实现全域数据的集成整合,数据分析人员不再受“数据孤岛”限制,通过逻辑化集成整合,零数据搬运轻松实现 10+ 个不同数据源的快速、准确融合,并利用自适应查询加速能力,1 秒查询响应率达 95%,存算成本节约 70% 以上。
如您对 Aloudata AIR 逻辑数据平台感兴趣,点击了解。期待您的关注、交流、分享和反馈。