大宗商品贸易集团数据治理实践,夯实数字基座 | 数字化标杆

某大型央企是首批全国供应链创新与应用示范企业,在“十四五”规划期内以聚焦供应链管理核心主业作为主要战略发展方向。供应链运营管理以大宗商品贸易为主,其交易往往具有交易量巨大、交易环节复杂、风险交易难识别、风险客商难管控等痛点。

随着集团数字化转型不断深化,数据应用方面的需求不断扩展。但集团缺乏统一的大数据资产管理平台,导致在数据应用方面,出现数据价值不凸显、数据标准不统一、数据质量不可控、数据共享不畅通等问题。

在此背景下,该集团引入袋鼠云数据治理团队,立足于打造全集团统一,能满足覆盖运管、风控、业务全过程数字化经营管理及分析决策的统一数据资产平台。对集团现有存量数据进行数据治理及挖掘,搭建数据管理体系,对增量数据进行有效管理和应用。通过梳理目前集团所有存量数据,提炼运营指标及管理指标,科学化管理公司数据资产和挖掘数据价值。

01 围绕“数据治理、数据服务、数据应用”的数据治理方案

袋鼠云根据集团提出的数据治理需求,结合内部现有数据开发平台,以业务应用场景为导向,形成集团统一的数据治理方案。项目以数据治理、数据服务、数据应用三大方向展开实施,其中数据应用以聚焦供应链运营管理业务为核心,数据服务以满足集团下属各子公司数据需求为主,数据治理以统一集团数据归集方式、数据质量标准、元数据维护标准、数据建模标准为目标进行建设。

其中数据治理设计的步骤为:确定当前项目的目标和范围,设计本轮数据治理的模式、架构和方法。以集团当前提出的数据需求场景出发,针对场景数据进行数据治理,主要包括以下几个步骤

1、架构设计

技术架构上,从场景需求出发,结合当前企业组织架构及数据权限出发,将数据中台设计为多项目空间加经典ODS、DWD、DWS、ADS四层结构,其中集团为主项目空间,其余业务供应链平台为子项目空间。另外,根据前期调研结果,结合当前集团业务范围,将业务根据业务主体进行了数据域的设计与划分,其中重点建设数据域为:

1)客商域:企业所服务的所有客户及供应商; 2)商品域:企业自营或代理商品,SKU; 3)交易域:客户与企业发生的所有交易行为,包括交易合同,订单,采购等; 4)风险域:企业发生诉讼,处罚等风险数据; 5)仓储物流域:所有仓库出入库,在途等信息; 6)公共域:系统码值,参数信息,组织架构,人员以及标准化映射信息。

通过分层与分域的设计,将集团原本传统数据架构转变为新数据架构,统一源端数据,建设公共事实层,建设服务层最后满足各个不同需求,有效解决传统数据架构存在的数据孤立,事实重复建设,资产盘点困难等问题,更适应当前集团发展阶段诉求。

file

2、数据统一归集

当前集团源端数据大体分为三类:第一种是传统业务数据,包含SAP系统、MDM系统、CRM系统、云链、高达、南北、OA等系统;第二种是第三方数据,包含船讯网、启信宝、行情数据、价格数据等;第三种是其他手工填报数据。

其中传统业务数据存在数据源多,数据量级分布不均,部分系统只能取得界面全量数据或为高度汇总报表数据等问题,使用数栈底层数据同步工具FlinkX将不同数据接入数据中台中。

第三方数据使用PySpark脚本任务,通过调取特定的API服务接口,完成数据的采集及简单清洗,接入数据中台。

手工填报数据通过完成填报报表的初步设计后,回流手工填报平台(当前使用饭软),进行定期同步、定期填报、定期回流采集的形式来完成数据的收集。

file

3、数据集中处理及标准设计

从架构设计出发,对已接入的源端数据,进行明细事实层的建模设计,进行指标体系的统计和收集。

明细事实层的建模设计秉持维度建模理念,根据不同的主题域,将ODS层数据进行特定范围的清洗,处理,加工后形成可复用性强的描述某一颗粒度下,某一业务行为的各项信息,纵向可以进行上钻下钻,横向可以对比。

针对指标层的加工处理,在引入数据中台之前,数据计算逻辑、指标口径都存放在SAP系统的代码中,无法进行有效复用。为了解决这一问题,根据指标体系设计方法论,统一定义指标体系的各信息(包含指标ID、指标名称、指标主题、业务口径、维度、修饰词、计算方式、计算频率、时间周期、业务对接人及开发负责人),在接下来企业的数据应用过程中,完成数据指标口径的收口和统一。

4、数据应用场景

数据应用场景以集团供应链运营管理为核心,分别对运营管理、物流管理、信用管理数据进行统一归集,按照业务指标逻辑进行数据处理开发,满足业务人员数据报表填报和数据统计分析应用场景。

运营管理场景:通过重新梳理SAP客户逾期、客户赊销、现货敞口库存等业务报表数据逻辑为基础,结合大数据平台从SAP底表取数能力,实现风险周报填报、签约情况分析、重大事项填报场景建设,有效减轻业务人员每周报表加工填报的工作压力,同时提高业务数据线上留存能力。

物流管理场景:以物流合同、物流供应商、供应商库点、库点库存、库点盘点记录数据为基础,进行统一汇聚处理,按照业务指标口径进行数据开发,实现物流合同看板、物流供应商看板、库点盘点密度看板、库存看板四大看板,为业务人员发现潜在风险和日常业务数据便捷查询提供有利条件。

信用管理场景:以客商授信额度、客商逾期、行业产品加工利润数据为核心,结合业务逻辑指标进行数据开发,实现授信额度跟踪、逾期数据分析、行业加工利润填报场景建设,为业务人员控制客商授信额度、发现客商潜在风险、明确当前各行业产品盈利情况提供有效支撑。

02 夯实数字基座,有效支撑数据应用

截至目前,集团数据中台共构建700余张表,数据执行任务总量500余个,其中ODS数据源始层同步任务200多个、DWD数据明细层清洗加工任务40多个、DWS数据汇总层汇总任务60多个、DIM数据维度层维度同步任务20多个、ADS数据应用层业务场景数据推送任务100多个。

满足集团供应链运管部物流仓储管理、客商信用管理、价格管理、运营管理等部门数据分析需求,实施搭建签约销售/采购看板、物流仓储看板、授信额度跟踪看板、逾期数据分析看板、运管风险逾期周报填报等业务场景。

《数栈产品白皮书》下载地址:https://www.dtstack.com/resources/1004?src=szsm

《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001?src=szsm

想了解或咨询更多有关大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szcsdn

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/180827.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数字乡村:科技赋能农村产业升级

数字乡村:科技赋能农村产业升级 数字乡村是指通过信息技术和数字化手段,推动农业现代化、农村经济发展和农民增收的一种新模式。近年来,随着互联网技术的飞速发展,数字乡村开始在全国范围内迅速兴起,为乡村经济注入了新…

超详细的pytest玩转HTML报告:修改、汉化和优化

前言 Pytest框架可以使用两种测试报告,其中一种就是使用pytest-html插件生成的测试报告,但是报告中有一些信息没有什么用途或者显示的不太好看,还有一些我们想要在报告中展示的信息却没有,最近又有人问我pytest-html生成的报告&a…

银河麒麟V10-ARM架构-postgresql安装与部署指南

提示:本人长期接收外包任务。 前言 本文详细介绍应用源码进行pgsql的安装步骤,本文以postgresql-12.0为例。 一、下载并解压安装包 ☆下载地址:https://ftp.postgresql.org/pub/source/ 解压安装包,创建安装路径: …

【C++】特殊类设计 {不能被拷贝的类;只能在堆上创建的类;只能在栈上创建的类;不能被继承的类;单例模式:懒汉模式,饿汉模式}

一、不能被拷贝的类 设计思路: 拷贝只会发生在两个场景中:拷贝构造和赋值重载,因此想要让一个类禁止拷贝,只需让该类不能调用拷贝构造以及赋值重载即可。 C98方案: 将拷贝构造与赋值重载只声明不定义,并…

虚拟机VMware客户机隔离灰色如何解决||实现本机复制粘贴到虚拟机

前言:本次镜像为win10,其他操作系统也欢迎尝试 现象:虚拟机设置选项不可编辑,且是否勾选都无法实现复制粘贴 可能存在的问题解决方案 Q1:未安装虚拟机工具:VMware Tools A1:安装工具&#xff…

解决“使用 CNKI 保存时发生错误。改为尝试用 DOI 保存。”【Bug Killed】

文章目录 简介解决办法跟新本地Zotero中茉莉花插件的非官方维护中文翻译器更新网页插件Zetero Connector中的Transtors 结语参考资料 简介 使用Chrome ➕ Zotero Connector保存中国知网(CNKI)的参考文献到本地的Zotero时无法正常保存,出现使…

ubuntu22.04在线安装redis,可选择版本

安装脚本7.0.5版本 在线安装脚本,默认版本号是7.0.5,可以根据需要选择需要的版本进行下载编译安装 sudo apt-get install gcc -y sudo apt-get install pkg-config -y sudo apt-get install build-essential -y#安装redis rm -rf ./tmp.log systemctl …

电脑键盘推荐

一、键盘分类 (1)键位个数 目前有75,84,87,98,104,108的。 (2)薄膜键盘和机械键盘 薄膜键盘就是大多数办公室常见的键盘,主要打一个便宜,耐造…

《人月神话》读书笔记

文章目录 一、书名和作者二、书籍概览2.1 主要论点和结构2.2 目标读者和应用场景 三、核心观点与主题3.1 人员组织管理主题3.2 项目时间进度管理主题3.3 项目成本风险管理主题3.4 软件工程内在本质 四、亮点与启发4.1 最有影响的观点4.2 对个人专业发展的启示 五、批评与局限性…

SQLite3 数据库学习(五):Qt 数据库高级操作

参考引用 SQLite 权威指南&#xff08;第二版&#xff09;SQLite3 入门 1. Qt 数据库密码加密 MD5 加密在线工具 1.1 加密流程 加密后的密码都是不可逆的 1.2 代码实现 loginsqlite.h #ifndef LOGINSQLITE_H #define LOGINSQLITE_H#include <QWidget> #include <Q…

博士研究生不会编程,也没有使用过Python,是否很失败

首先&#xff0c;对于博士研究生来说&#xff0c;虽然在学习和科研的过程中会涉猎到大量的专业知识&#xff0c;但是同样也会错过很多知识&#xff0c;对于非计算机相关专业的博士研究生来说&#xff0c;没有使用过Python&#xff0c;或者说编程能力比较弱也是比较正常的情况&a…

使用whisper实现语音转文本

项目地址&#xff1a;GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision 1、需要py3.8环境 conda activate p38 2、安装 pip install -U openai-whisper 3、下载项目 pip install githttps://github.com/openai/whisper.git 4、安装…

Class文件转Java文件

目录 1、下载一个反编译工具2、在文件夹下打开命令窗口3、在此目录下随意建一个文件夹4、在打开的命令窗口输入命令5、返回解压目录下 1、下载一个反编译工具 下载链接&#xff1a;https://varaneckas.com/jad/ 下载的是第一个 下载后放至任意目录下解压即可 2、在文件夹下打…

E-R图与关系模式

1. E-R模型 英文全称&#xff1a;Entity-relationship model&#xff0c;即实体关系模型 把现实世界的 实体模型通过建模转换为信息世界的概念模型&#xff0c;这个概念模型就是E-R模型 2. 数据库设计流程 一般设计数据库分为三个步骤 把现实世界的实体模型&#xff0c;通…

手把手教你如何提交App备案

手把手教你如何提交App备案 随着工信部出台了《工业和信息化部关于开展移动互联网应用程序备案工作的通知》对于我司所使用的到的移动应用APP就需要做app备案&#xff0c;今天用游戏app手把手教你如何提交App备案。 基本操作流程 运营、市场 提供需要备案的APP名称、主体、A…

市场是变化的?这种悖论fpmarkets澳福一秒打破

你是不是始终认为市场是经常变化的&#xff0c;其实这是不对的&#xff0c;这种认识fpmarkets澳福今天一秒打破。 市场经常变化吗?众多投资者无需过多思考&#xff0c;就认为答案是肯定的。因为无论是在互联网的哪个角落&#xff0c;都可以看到这样的信息。即使我们没有深入研…

mysql查询统计最近12个月的数据

项目场景&#xff1a; mysql查询统计最近12个月的数据&#xff0c;按每个月纵向展示&#xff0c;效果图 sql语句 注意&#xff1a;count( v.uuid ) 这里的是被统计那张表的id SELECT m.month,count( v.uuid ) AS total FROM (SELECT DATE_FORMAT(( CURDATE()), %Y-%m ) AS mon…

【实用】mysql配置 及将线上数据导入本地 问题解决及记录

[ERR] 1292 - Incorrect datetime value: ‘0000-00-0000:00:00‘ for column ‘BIRTH_DATE‘ at row 1 此问题是mysql当前配置不支持日期为空&#xff0c;或者为‘0000-00-0000:00:00‘得情况 1、直接在数据库执行 # 修改全局 set global.sql_mode ONLY_FULL_GROUP_BY,STR…

vue2生命周期

前言 vue的生命周期其实可以分为两块,一个是vue实例的生命周期,一个是组件的生命周期。 vue实例的生命周期方法共有4个:$mout,$forceUpdate,$nextTick,$destroy vue组件的生命周期钩子共有8个:beforeCreate,created,beforeMount,mounted,beforeUpdate, updated,beforeDestr…

Element UI的Tabs 标签页位置导航栏去除线条

在实际开发中&#xff0c;我们调整了相关样式&#xff0c;导致导航栏的相关样式跟随不上&#xff0c;如下图所示&#xff1a; 因为我跳转了前边文字的样式并以在导航栏添加了相关头像&#xff0c;导致右边的线条定位出现问题&#xff0c;我在想&#xff0c;要不我继续调整右边…