【金猿案例展】首创证券——NoETL敏捷分析解决方案


b3d71e9cceea43a304be84d2a5a46f92.png

Aloudata

本项目案例由 Aloudata 投递并参与“数据猿年度金猿策划活动——2023大数据产业年度创新服务企业榜单/奖项”评选。

1c83a5ece00df4fdb235975c95da2596.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


党的十八大以来,党中央、国务院不断加大金融科技创新支持力度,扩大金融科技创新在资本市场的试点范围。同时,2020年10月证监会发布《证券期货业科技发展“十四五”规划》,指出推进行业数字化转型发展是两大主题之一,并强调需加强科技治理体系、数据治理体系建设。数据治理是业务支撑能力应用场景数字化转型的基石,数字化转型是金融科技创新的关键环节。金融科技创新亦成为证券公司稳定运行、发展壮大的必然选择。

首创证券在保障业务系统平稳运行、加强合规管理和注重风险防范的基础上,持续加大金融科技投入,通过数字化水平的不断提升支撑业务战略的落地,依托金融科技保障业务的高质量增长。为满足经营发展需要,首创证券已建设有大量信息化应用系统,经内部调研发现,依然存在大量手工处理、加工数据的情况,导致各方的同一数据口径不一致、同一数据重复加工,耗费大量人力且效率不足,无法保障最终应用数据的质量。首创证券迫切希望打破各应用系统数据孤岛,梳理元数据、主数据,规范数据标准,建立数据模型,提供数据质量保障,实现金融数据价值的最大化。

为解决上述问题,持续提升经营分析、风险管理和监管报送等工作的数字化水平,首创证券决定建设新型的公司级数据中心,从数据应用出发,改变传统的数据仓库方法论,构建数据处理平台、指标中台和数据应用,提供数据治理整体方案,保障数据质量和安全,实现金融数据的作用与价值。

实施时间:

项目开始时间:2023年 7月

中间重要时间节点:2023年 11月

项目完结时间:2024年1月

应用场景

1、高质量经营战略决策

将首创证券各业务、各应用系统数据孤岛进行联通,集中分析整体经营情况,可进行不同业务间经营数据的横向对比,亦可进行同业务内的纵向对比,可支持实时查看各类业务考核指标完成进度,为公司管理层即时调整经营策略提供强有力的数据支撑。

2、数据资产化管理

通常,业务人员需对基础数据进行加工后应用,以支持业务决策。数据中心提供数据开发平台——指标中心,统一定义指标口径,指定指标数据责任人,保障出口数据质量;通过数据权限控制实现一次开发多人使用,避免数据重复开发,将数据资产化管理,提高数据应用效率。

3、数据共享

通过建设公司级数据中心,梳理并确定主数据内容、源头、责任岗位,保障数据质量。责任主岗维护一次数据后,即可供其它应用系统通过数据中心接口获取该主数据,既保障了各应用系统间同一数据的来源一致性,又减少了同一业务链条上多次手工维护数据造成的不确定性。数据中心汇集各应用系统的核心数据并提供接口,供应用系统获取其他数据,降低应用系统间共享数据的复杂度,提高数据安全性。

面临挑战

盘点发现,首创证券亟待解决的问题和场景包含以下方面:

1、数据孤岛现象严重:上万张数据表,分散在 10 多个不同业务系统、数据库和平台中,数据孤岛现象严重;

2、数据口径不一致:开发链路不一致,指标口径缺乏有效管理,导致同一业务指标从不同数据表或服务中取得的数据不一致;

3、口径溯源及影响面评估难:传统数据分析解决方案难以打通整体的数据血缘,导致指标的口径溯源困难;在调整数据链路时,也很难看清对下游的影响面;

4、数据使用与分析效率不足:投资经理对不同产品差异化分析的需求越来越高,但其很难通过数仓表自助完成数据提取,数据使用最后一公里痛点明显;

5、灵活性和敏捷性不足:证券市场变化迅速,需要快速调整分析策略,现有数据体系情况无法满足需求。

在此背景下,首创证券数据平台团队考察调研了多种数仓解决方案,传统数仓 + BI 的思路难以满足其对高效数据管理和智能分析的需求。

应用技术与实施过程

基于上述问题,首创证券联合 Aloudata大应科技制定了一套更高效、更统一、更智能的 DataFabric 架构理念下的敏捷数仓技术方案现代数据平台方案,适应数字化时代的新需求。

Data Fabric 是一种新的数据管理和集成方法,它将数据生态系统的复杂组件整合到一起,提供完整且有凝聚力的数据管理方案。与数据湖不同,Data Fabric 无需将数据移动到集中位置,而是依靠强大的数据虚拟化技术及数据治理策略来实现数据管理的统一。Data Fabric 数据管理方法,打破了传统数仓及数据湖等前几代数据处理技术限制,释放了数据的生产力。

因此,本方案摒弃传统数仓数据架构(贴源层->明细层->聚合层),基于 NoETL 理念进行跨数据源查询构建虚拟明细层,并根据下游使用数据情况智能化构建数据聚合层、自动化进行数据物化以提升数据应用性能,简化数据开发链条的长度,节约数据中心基础设施成本,降低数据中心运维成本,构建数仓新形态。

具体到方案设计,本敏捷数据分析方案实现了:

1、将外部采集数据、业务数据库数据(Mysql、Oracle、SqlServer等)以及对象存储数据统一通过 PDS(物理数据集,即业务库源表的映射)方式映射到敏捷数仓中,无需做一对一的数据复制,无需构建传统数仓的 ODS 层。

2、基于 PDS/VDS 定义新的 VDS(虚拟数据集,即定义了数据视图的取数逻辑),过程中,无需关心数据存储和计算调度等细节,也无需物理拷贝数据,可多层嵌套,直到定义出目标场景可用的虚拟数据集。

3、基于虚拟数据集进行统一模型和指标定义,并通过 API/JDBC 开放化接口对接外部的报表或者分析工具,或者通过 JDBC 导出到外部数据库或者文件,实现数据和外部系统的共享。

4、根据用户访问需求,配置投影加速策略,并由系统根据用户查询历史,智能构建加速策略,实现外部业务数据查询的快速响应。投影根据所属 VDS 的嵌套依赖关系,自动构建数据更新链路,实现自调度的自动化投影数据生产。

8a5864253092e41668a4617da1876dc3.png

本方案在落地应用阶段先后完成数据虚拟化引擎、指标服务平台搭建,其中100% 均为信创技术和产品、覆盖数据的采集、管理、分析、展示等多个维度,2023 年底达到版本与服务稳定运行的效果。各下游应用系统均从本平台获取数据,提高数据一致性;指标性数据,均在此平台实现定义与开发,提升指标数据生产效率,保障指标数据的一致性,避免重复性的数据开发工作;平台的数仓架构,从整体成本节约了数据存储成本,提高数据开发效率,敏捷高效满足即时业务数据分析需求。

商业变化


依托 Aloudata AIR 逻辑数据平台、Aloudata CAN 自动化指标平台构建的 NoETL 敏捷数据分析方案在降低成本和技术创新等方面具有显著优势,取得了重大效益和示范成果:

1、10倍以上数据化运营效率:本方案重新定义了数据工作方式。无需等待数据同步和漫长 ETL 排期,人人皆可自助发现可信数据,随时进行全域数据探索和数据准备,实现企业数据化运营的极致敏捷。

2、最高100倍数据湖分析性能:本方案提供相比开源 Presto、Impala 等开源方案2倍以上的数据查询性能。通过智能加速技术,最高可实现100倍性能提升,带来交互式的数据分析体验。

3、50%以上存储成本节约:本方案基于对象存储技术构建数据湖,按需物化,相比开源 HDFS 方案成本节约近2/3,同时通过对无用数据存储的自动回收以及对相似数据存储的自动合并,大幅降低存储成本。

4、70%以上数据管理成本节约:该方案实现了元数据驱动的智能化、主动式、持续式数据管理,让数据管理走向“自动驾驶”,大量节省在数据治理和风险应对上的管理投入。

从技术创新角度,该方案通过 NoETL 理念,该方案能够减少数据冗余存储,提高数据 ETL 效率,降低数据应用开发复杂度,从而有效提高数据应用开发效率,并大幅度减少数据资产化方面投入的人力与物力成本。此外,该方案还提供全链路血缘分析,为 IT 技术人员和业务人员带来高效便捷的数据开发和应用体验,提高技术人员与业务人员沟通协作效率,促进公司业务发展和品牌建设,有效积累无形资产,推动公司业务转型和市场竞争力的形成,并实现了以下几大技术创新突破:

1、Data Fabric 架构实践

① 支持联邦查询:利用虚拟数仓技术,将首创证券众多散落在各处的业务数据进行统一管理和定义,无需拷贝原始数据(无需 ods 层),直接构建明细层(dwd 层),降低建设复杂度和存储成本。

② 通过虚拟化技术,提供一致的数据视图,通过一套查询语言来支持分析、报表及 AI 等场景的数据使用。

③ 智能物化加速:基于用户查询行为和业务元数据驱动的智能加速能力,使得数据查询分析相比传统 presto、impala 等查询引擎有近百倍的提升。通过智能自动化生产,全面替换了原来需要人工完成的数据集成、开发和运维的工作,降低成本、提升效率。

2、指标定义即生产、定义即服务

提供极为灵活、声明式的指标定义能力,依托数据自动化生产技术,定义的指标触发自动的指标数据生产,并通过 JDBC、API、EXCEL 插件等诸多通道提供给各种数据消费场景。

3、全链路血缘

提供了从报表到指标到敏捷数仓到原始业务库,端到端的全链路列级血缘能力,从而为指标口径溯源、变更影响面评估等提供了可靠的评估依据。

相关企业介绍


·首创证券

首创证券股份有限公司成立于2000年2月,注册资本27.3亿元人民币。2022年12月22日,公司在上海证券交易所挂牌上市交易(证券代码“601136”)。公司总部设在北京,控股股东为北京首都创业集团有限公司,实际控制人为北京市国资委。

经过二十余年的稳健发展,公司已成为具有全牌照经营资质,业务结构均衡、特色鲜明的综合类证券公司。公司业务范围涵盖资产管理、自营投资与交易服务、投资银行、证券经纪、财富管理、信用融资、研究咨询、期货、私募基金管理、另类投资等多个领域,为企业客户、机构客户、零售客户、高净值客户等提供各类专业金融服务解决方案,在资产管理、固定收益投资交易等领域形成了自身特色与品牌优势。多年来,公司一直保持良好的发展态势,经营管理规范,资产质量良好。

·Aloudata

Aloudata(大应科技) 是一家自动化数据管理软件提供商,国内 Data Fabric 架构理念引领者,以“让数据随时就绪”为使命,致力于消除数据管理技术瓶颈,提升 ETL 工程自动化水平,助力企业平滑升级至下一代大数据基础设施。

Aloudata 自主研发的 Aloudata AIR 逻辑数据平台支持异构数据的逻辑集成、整合与查询,通过自适应物化加速和自动回收技术,实现秒级查询响应并节省 50% 以上的存算成本;Aloudata BIG 主动元数据平台,基于全球独创的算子级血缘解析技术,让复杂数据链路看得清、管得住、治得动,实现更精细更智能的数据管理;Aloudata CAN 自动化指标平台,改变“业务提需求IT 开发”的传统模式,支持业务人员从任意颗粒度、任何维度灵活分析指标,实现指标“定义即开发、定义即服务”。

目前,Aloudata 各产品已在多家头部企业的复杂数据环境中落地,成功交付了多个 Data Fabric 最佳实践。

d65edb3d055e3927ad2b7ab6bdfa16f9.jpeg



875df610c68f31ef905464a37f0e942c.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/309854.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

系统存储架构升级分享

一、业务背景 系统业务功能:系统内部进行数据处理及整合, 对外部系统提供结果数据的初始化(写)及查询数据结果服务。 系统网络架构: • 部署架构对切量上线的影响 - 内部管理系统上线对其他系统的读业务无影响 •分布式缓存可进行单独扩容, 与存储及查询功能升级…

中国智造闪耀CES | 木牛科技在美国CES展亮相多领域毫米波雷达尖端方案

素有全球科技潮流“风向标”之称的2024国际消费类电子产品展(CES),于1月9-12日在美国拉斯维加斯会议中心举办。CES是全球最大的消费电子和消费技术展览会之一,汇集了世界各地优秀的消费电子和科技公司,带着最好的产品来…

深入理解C#中的引用类型、引用赋值以及 `ref` 关键字

深入理解C#中的引用类型、引用赋值以及 ref 关键字 在C#编程中,理解引用类型、引用赋值以及 ref 关键字的使用对于编写高效、可靠的代码至关重要。本文将深入探讨这些概念,帮助您更好地理解C#的工作原理。 引用类型简介 在C#中,所有的类型都…

机器学习笔记一之入门概念

目录 一 基本分类二 按模型分类概率模型(Probabilistic Models)非概率模型(Non-Probabilistic Models)对比结论线性模型 (Linear Models)非线性模型 (Non-linear Models)对比 三 按算法分类1.批量学习(Batch Learning&…

centenos下载安装

阿里云镜像下载 centos-7-isos-x86_64安装包下载_开源镜像站-阿里云 新建虚拟机 (1) 创建新的虚拟机 可以在主页直接点击创建新的虚拟机也可以在上方,点击文件,新建虚拟机 (2) 选择自定义(高级) (3) 硬盘兼容性 默认即可。我…

php 函数声明与调用

在 PHP 中,函数声明和调用的语法如下: 函数声明的一般形式为: function functionName($param1, $param2, ...) {// 函数体return $result; // 可选 } 例如: function add($a, $b) {return $a $b; } 函数调用的一般形式为&am…

transbigdata笔记:数据预处理

0 数据 使用 transbigdata/docs/source/gallery/data/TaxiData-Sample.csv at main ni1o1/transbigdata (github.com) 和transbigdata/docs/source/gallery/data/sz.json at main ni1o1/transbigdata (github.com) 0.1 导入库 import transbigdata as tbd import pandas …

通过 Elastic Stack 充分利用电信领域生成式 AI 的力量

作者:Elastic Piotr Kobziakowski, Jrgen Obermann 在瞬息万变的电信领域,Elastic Stack 与生成式 AI 的集成正在开创运营效率和创新的新时代。 这些技术不仅增强了网络运营,而且还彻底改变了各个部门的内部流程。 下面,我们将深入…

Java 并发之《深入理解 JVM》关于 volatile 累加示例的思考

在周志明老师的 《深入理解 JVM》一书中关于 volatile 关键字线程安全性有一个示例代码(代码有些许改动,语义一样): public class MyTest3 {private static volatile int race 0;private static void increase() {race;}public …

视频监控录像服务器(中心录像服务器)功能详细介绍

目 录 一、概述 (一)定义 (二)视频监控中心录像服务器 二、存储策略服务 (一)存储策略配置 1、 录入页面 2、 选择需要进行录像的视频 3、批量选择多个通道号 4、其他关键参数…

rocketmq实现延迟消息

SpringBoot整合RocketMQ发送延时消息 springboot rocketmq 延迟消息 Windows下RocketMQ安装及可视化界面搭建 Java 客户端 RocketMQ延迟消息 项目背景 项目中有延时消息的需求,综合考量RocketMQ比较适合。 RocketMQ支持多维度的延迟级别 支持多种消息类型 基…

Windows安装PostgreSQL常见问题总结解决

1.用户权限不足/未关闭防火墙&杀毒软件 1.1.数据库初始化错误 1.2.SQL模块没有成功加载到数据簇 在安装PostgreSQL时,我们可能会遇到1.1和1.2的情况,其实这两个为一类问题,即安装权限不足。首先检测自己的用户是不是本地组Administrator再…

使用 Windbg 分析软件异常时的诸多细节与技巧总结

目录 1、dump文件 1.1、dump文件的生成方式 1.2、dump文件的大小 2、pdb符号文件 2.1、pdb文件的路径设置 2.2、pdb文件的时间戳与名称问题 2.3、如何确定要找哪些pdb文件? 3、使用Windbg静态分析dump文件以及动态调试程序的一般步骤 4、确定发生异常或崩溃…

Vue中的class和style绑定

聚沙成塔每天进步一点点 本文内容 ⭐ 专栏简介动态绑定class对象语法数组语法 动态绑定style对象语法多重值 ⭐ 写在最后 ⭐ 专栏简介 Vue学习之旅的奇妙世界 欢迎大家来到 Vue 技能树参考资料专栏!创建这个专栏的初衷是为了帮助大家更好地应对 Vue.js 技能树的学习…

Provide/Inject 依赖注入(未完待续)

父组件传递给子组件数据,通过props,但是需要逐层传递 provide/Inject 的推出就是为了解决这个问题,它提供了一种组件之间共享此类值的方式,不必通过组件树每层级显示地传递props 目的是为了共享那些被 认为对于一个组件树而言是全局的数据 p…

MulticoreWare与Imagination一同按下汽车计算工作负载的“加速键”

中国北京 – 2024年1月8日 - MulticoreWare Inc与Imagination Technologies共同宣布已在德州仪器TDA4VM处理器上实现了GPU计算,不仅使算力提升了约50 GFLOPS,而且还实现了自动驾驶和高级驾驶辅助系统(ADAS)常见工作负载性能的跃升…

MySQL 从零开始:03 基本入门语句

文章目录 1、连接数据库1.1 命令提示符登陆1.2 MySQL 8.0 Command Line Client 登陆1.3 MySQL Workbench 登陆 2、基本语句2.1 查看所有库2.2 创建库2.3 删除库2.4 选择数据库2.5 查看表2.6 创建表2.7 删除表2.8 改表名2.9 清空表 在上一小节中介绍了 MySQL 数据库的安装&#…

【Win10安装Qt6.3】安装教程_保姆级

前言 Windows系统安装Qt4及Qt5.12之前版本和安装Qt.12之后及Qt6方法是不同的 ;因为之前的版本提供的有安装包,直接一路点击Next就Ok了。但Qt5.12版本之后,Qt公司就不再提供安装包了,不论是社区版,专业版等&#xff0c…

羌族特色民居----碉楼

羌族是四川的一个少数民族,他们独具特色的民居就是----碉楼。在羌语中,碉楼被称为“邓笼”,意为美丽、高贵的房子,羌族人有“依山而居,垒石为屋,高者十余丈”的习俗。碉楼的高度在十米至三十米之间。用于御…

飞腾FT2000-4/D2000-8 VPX主板

产品特点 ①国产飞腾FT2000-4或D2000-8处理器 ,同一模块兼容两种处理器,可以根据性能需要选择 ②丰富的万兆以太网、千兆以太网、USB、SATA接口,可用作数据处理、存储、通信服务器 ③内部集成FPGA-V7协处理器,支持SRIO、LVDS等…