数据治理之数据标准管理

目录

  • 一、概述
    • 什么是数据标准
    • 数据标准的作用
    • 什么是数据标准化
    • 数据标准的意义
      • 业务方面
      • 技术方面
      • 管理方面
  • 二、数据标准管理的内容
    • 数据模型标准
    • 基础数据标准
    • 主数据和参考数据标准
    • 指标数据标准
  • 三、数据标准管理流程
    • 数据标准梳理
    • 数据标准制定
    • 数据标准审查
    • 数据标准发布
    • 数据标准贯彻
  • 四、数据标准管理办法模板
    • 数据标准目的
    • 数据标准适用范围
    • 数据标准管理组织
    • 数据标准的执行要求
    • 数据标准管理流程
    • 数据标准绩效考核
    • 附则
  • 五、数据标准管理最佳实践
    • 业务主导
    • 循序渐进
    • 动态管理
    • 应用为王
  • 六、数据标准管理工具
    • 系统架构
      • 数据标准采集
      • 数据标准管理
      • 数据标准查询
    • 数据标准管理
      • 需求管理
      • 数据标准采集
      • 数据标准管理
    • 数据标准应用
      • 数据标准查询
      • 元数据地图
      • 数据标准对标
      • 数据标准访问接口

一、概述

数据标准管理是数据管理的基础性工作,是企业数据治理的第一步。

什么是数据标准

数据标准(Data Standards) 是指保障数据的内外部使用与交换的一致性和准确性的规范性约束。

数据标准就是对一项事物的统一描述,防止有歧义存在。
比如:对于销售来说,客户是购买企业产品的人员,对于财务来说,是发生财务往来,需要记账的人员,对于IT来说,需求部门;对于市场人员,想要购买我们产品的人。

数据标准的作用

数据标准适用于业务数据描述、 信息管理及应用系统开发, 既可作为经营管理中所涉及数据的规范化定义和统一解释, 也可作为数据管理的基础, 同时也是在应用系统开发时进行数据定义的依据。
比如:客户数据,在某些企业开发中喜欢使用一些备用字段,即在建客户表的时候防止字段不够,新增几个备用字段,具体含义需要等到使用到这个字段的时候才能够体现出来;时间一长,客户数据就容易造成混乱,字段不统一。
数据标准还有以下作用:

  • 数据标准可以增强各业务部门对数据理解的一致性, 提升沟通效率。
  • 数据标准可以减少数据转换, 促进系统集成和信息资源的共享。
  • 数据标准可以促进企业级单一数据视图的形成, 支持数据管理能力的发展。
  • 数据标准有助于对数据进行统一规范的管理, 消除各部门间的数据壁垒,支持业务流程的规范化。
  • 数据标准有利于提高数据质量。 可以基于数据标准的规范化定义对企业数据质量进行检查, 找出有问题的数据, 出具数据质检报告。
  • 数据标准有利于规范化管理数据资产。
  • 数据标准是数据资产梳理和定义的基础。 对于一家拥有大量数据资产或者要实现数据资产交易的企业而言,构建数据标准是一件必须做的事情。

什么是数据标准化

数据标准化是建立各部门数据共识过程, 是各业务部门之间沟通和各系统之间数据整合的基础。

  • 数据标准化是建立各部门共识的过程
  • 数据标准是各系统数据整合的基础

数据标准化是数据治理的基础:
image.png

数据标准与主数据、元数据、数据质量、参考数据、数据模型息息相关。
主数据:主数据管理过程中还会涉及主数据的清洗标准、 主数据的管理标准、 主数据的接口标准等。
元数据:业务元数据是基于数据标准的。
数据质量:数据不够标准,数据质量无从谈起。
数据模型:数据不进行标准化,数据模型就无法确定。

数据标准的意义

业务方面

数据标准解决数据不一致、不完整、不准确的问题,消除数据的二义性,提升业务规范,降低沟通成本,提升业务效率。

技术方面

提升应用系统开发以及系统集成间的实施效率,为数据质量规则的建立、稽核提供依据,是数据质量管理的重要输入。

管理方面

通过对业务术语、 主数据和参考数据、 指标数据等定义统一的标准, 为精准数据分析奠定了基础。 统一的数据标准能够让业务人员轻松获取数据, 从而为业务人员自助式地进行数据分析、 数据探索提供了可能。

二、数据标准管理的内容

数据模型标准

数据模型标准化是对每个数据元素的业务描述、 数据结构、 业务规则、 质量规则、 管理规则、 采集规则进行清晰的定义, 让数据可理解、 可访问、 可获取、 可使用。 数据模型反映的是对业务的理解和定义, 能够帮助企业建立组织内部和组织之间沟通的桥梁。 数据模型可以用于识别丢失和冗余的数据, 并且有助于在ETL过程中记录数据映射。

基础数据标准

基础数据是指数据字段,比如:国家地区、 行政区划、 邮政编码、 性别代码、 计量单位代码等。

image.png
基础数据标准的稳定性比较强, 一经发布, 一般不会轻易变更, 它属于企业各系统之间共享的公共代码。

image.png

主数据和参考数据标准

主数据是用来描述企业核心业务实体的数据, 比如客户、 供应商、 员工、产品、 物料等。 它是具有高业务价值、 可以在企业内跨业务部门被重复使用的数据, 被誉为企业的“黄金数据”。
参考数据是用于将其他数据进行分类或目录整编的数据, 是规定数据属性的域值范围。 参考数据一般以国际标准、 国家标准或行业标准为依据, 是固定不变的数据。

人员主数据案例:
image.png
主数据标准包含主数据分类、 主数据编码和主数据模型。

指标数据标准

企业的各业务域、 各部门均有其相应的业务指标, 这些指标有的名称相同却有着不同的业务含义, 而有的指标虽然名称差异很大, 但在业务上却是同一个指标。 如果不对指标数据进行标准化, 你可以想象: 对于同一指标, 不同系统的指标统计结果可能是不同的, 而且很难分清哪个才是正确的;

image.png

  • 指标业务属性一般包括指标编码、 指标中文名称、 指标英文名称、 指标主题、 指标分类、 指标类型、 指标的业务定义、 指标的业务规则、 指标的数据来源、 取数规则、 统计维度、 计算公式、 显示精度、 相关基础数据标准等。
  • 指标技术属性一般包括指标来源系统、 指标使用系统、 数据源表、 数据类型、 度量单位、 取值范围、 指标生成频度、 指标计算周期、 指标取数精度等。
  • 指标管理属性一般包括归口管理部门、 业务负责人、 技术负责人、 指标权限范围等。

三、数据标准管理流程

数据标准管理从需求发起到落地执行, 一般需要经过标准梳理、 标准编制、 标准审查、 标准发布、 标准贯彻五个阶段, 如下图所示:
image.png

数据标准梳理

数据标准梳理需要从企业业务域、 业务活动、 数据对象(数据实体、 指标) 、 数据关系等方面层层递进, 逐步展开, 我们将这个方法称为BOR法(Business-Object-Relationship) 。
image.png
从上往下分析,从企业活动域开始分析、活动域涉及到的对象实体、再到实体之间的关联关系。
第一, 根据企业业务情况划分业务域, 识别每个业务域的关键业务活动,并对每个业务域中的业务活动进行梳理和定义, 同时处理该活动输入和输出的各类业务单据、 用户视图, 并梳理每个单据和用户视图的数据对象。
第二, 对数据对象进行分析, 明确每个数据对象所包含的数据项(属性) , 同时, 梳理并提炼出该业务域中所涉及的数据指标和数据项。 分析并定义每个数据实体或指标的数据元标准, 包括数据元的名称、 编码、 类型、 长度、 业务含义、 数据来源、 质量规则、 安全级别、 域值范围、 管理部门等, 尽可能描述企业数据对象的业务逻辑。
第三, 梳理和抽象所有数据实体、 数据指标的关联关系, 并对数据之间的关系进行定义, 进一步明确数据对象间的数据关系。
第四, 通过以上梳理、 分析和定义, 确定企业数据标准管理的主体范围,并基于系统实现的逻辑进行归纳和抽象, 形成企业级数据标准模型。 这个过程可能涉及对数据对象的合并或拆分。

数据标准制定

数据标准编制是根据企业的业务需求和数据管控要求, 对数据对象及其数据项进行明确定义的过程, 包括数据项名称、 数据项编码、 数据类型、 长度、业务含义、 数据来源、 质量规则、 安全级别、 域值范围等。 数据标准的编制可以参考国际标准、 国家标准或行业标准, 也可以根据企业业务需求制定特定的企业级数据标准。
数据标准制定的三个方法:

  • 头脑风暴会议
  • 标准差异分析
  • 标准影响评估

数据标准审查

对数据标准初稿进行审查, 判断数据标准是否符合企业的应用和管理需求, 是否符合企业数据战略的要求。 如数据标准没有通过审查, 则由数据标准管理办公室进行修订, 直到满足企业数据标准的发布要求。
数据标准审查主要包括以下两个步骤:

  • 数据标准意见征求
  • 数据标准意见评审

数据标准发布

数据标准意见征集完成、 标准审查通过后, 由数据标准管理委员会以正式的形式向全公司发布数据标准。数据标准一经发布, 各部门、 各业务系统都需要按照标准执行。 遗留系统的存量数据会存在一定的风险, 企业应做好相应的影响评估。

数据标准贯彻

对于企业新建的系统应当直接应用定义好的数据标准, 对于旧系统一般建议建立相应的数据映射关系, 进行数据转换, 逐步将数据标准落地。 同时, 在数据标准贯彻过程中还需要加强对业务人员的数据标准培训、宣贯工作, 以帮助业务人员更好地理解数据标准。
数据标准贯彻的三个关键实践:

  • 数据标准宣贯

    • 要发挥出数据标准的各项效果, 需要在标准实施前认真宣贯, 让全公司对数据标准达成共识, 以便更好地将其应用到实践中去。
    • 数据标准的宣贯方法有文件传阅、 集中培训、 专题培训等。
  • 对业务部门的要求

    • 在数据标准的执行过程中, 应避免对标准的随意改动, 如果标准确实存在问题、 必须修改, 则需要提请数据标准变更流程, 经数据标准管理委员会审查后方可变更。
  • 对应用系统的要求

    • 在系统需求分析阶段, 系统建设方应提出数据使用需求, 然后数据标准管理委员会参与数据需求的评审, 并给出数据标准的使用建议。
    • 在系统设计开发阶段, 应基于现行的数据标准进行数据库和应用的设计和开发。
    • 在系统正式运行阶段, 系统应纳入公司的数据治理范围, 符合公司在数据标准、 数据质量、 数据安全等方面的要求。
    • 数据标准管理执行组对应用系统的数据标准贯彻执行情况进行监督考核, 对于不符合数据标准要求的, 提出改进要求, 并监督其完成整改。

四、数据标准管理办法模板

数据标准目的

明确数据标准的目的, 企业为什么需要数据标准管理。

数据标准适用范围

明确数据标准的适用范围, 是全公司适用还是只在某些部门生效。

数据标准管理组织

明确数据标准的管理组织和职责分工, 并规定各组织在数据标准的制订、 评审、 发布、 执行、 变更等各环节的职责。

数据标准的执行要求

明确在哪些数据操作环境(如录入、 维护、 应用、 归档等) 中应遵循数据标准要求, 明确在IT系统构建或改造中应遵循数据标准要求。

数据标准管理流程

明确数据标准需求的来源、 数据标准编制的原则、 数据标准编制使用的模板、 数据标准编制的注意事项、 数据标准编制完成后的提审流程等内容。
明确数据标准审核及发布的要求, 一般包含数据标准的评审原则、 评审方式、 评审内容、 发布要求、 发布范围、 执行范围、 版本控制等内容。
明确数据标准变更流程(如标准变更的发起、 审核、 复审流程) 、 标准变更注意事项、 影响评估等。

数据标准绩效考核

明确数据标准的绩效考核办法, 如考核指标、 考核对象、 考核周期、 考核方式等。
明确数据标准执行过程的奖惩条件、 奖惩措施。

附则

附则主要用于描述数据标准管理办法的监督检查规定、 办法的制定依据、 存在争议或分歧时的解决方式, 并说明办法的制定单位、 批准单位、 解释单位以及办法的开始执行时间。

五、数据标准管理最佳实践

业务主导

数据标准来源于业务, 服务于业务, 数据标准化问题归根到底还是管理问题, 应从业务入手。

循序渐进

从价值链、 业务流程角度进行分段实施, 不要企图一次实施所有的数据管理标准。 企业应根据业务需求, 结合系统改造和新系统建设的契机, 选择适当的数据标准落地范围和层次, 对亟待解决的标准问题进行落地。

动态管理

对于数据标准管理, 最重要的是保持数据定义、 标准设计和标准使用的一致性。 但数据标准不是一成不变的, 比如企业在拓展新业务的时候, 需要增加相应的标准, 对于没有价值的标准, 要及时废弃。

应用为王

任何一个企业建设数据标准都不是为了建标准而建标准, 而是为了让数据标准服务于业务, 提升业务效率。 应结合企业IT系统的现状, 以落地应用为目的, 以企业现行的各类国标、 行标为基础, 以对现有系统的影响最小为原则编制和落地标准, 这样才能确保标准切实可用, 让数据标准最终回归到业务应用中, 发挥作用。

六、数据标准管理工具

数据标准管理本质上是元数据管理, 管理的内容包括技术元数据、 业务元数据和操作元数据。 目前业界还没有体系化、 标准化的数据标准管理工具, 很多企业将其数据标准管理工具嵌入元数据管理平台, 作为一个整体为企业提供数据治理服务。

系统架构

数据标准管理涵盖数据标准申请、 制定、 发布、 变更和执行的全生命周期管理过程。 从管理和应用层面, 我们将数据标准管理工具分为数据标准采集、数据标准管理和数据标准查询三层架构,如下图所示:
image.png

数据标准采集

据标准采集是指统一采集和管理实现企业的业务术语标准、 基础数据元标准、 数据指标标准等数据标准所涉及的数据标准类型、 数据元名称、 数据元规则、 数据元值域、 数据元管理属性、 数据结构等信息。

数据标准管理

数据标准管理工具提供数据标准的维护、 审核、 发布, 以及数据标准的需求管理、 变更管理、 版本管理等基础管理功能; 提供数据标准对外接口, 实现数据标准的交换和共享, 确保数据标准的落地; 提供数据项对标、 一致性检查、 元数据地图等应用功能, 为数据标准的落地提供支撑。

数据标准查询

数据标准查询功能包括数据标准查询、 全文搜索、 数据导出、 详情查看等功能。 用户可根据自己的兴趣或业务需要来查询数据标准内容。 数据标准查询只能查询自己权限范围内的数据, 业务人员可以查询本业务条线和其他业务条线共享的数据, 管理人员可以查询管辖范围内的数据标准。

数据标准管理

需求管理

主要的需求内容如下:
image.png
收集完各业务部门对数据标准的需求后, 对这些需求进行业务影响分析、落地难度分析和实施优先级分析, 以帮助企业确定数据标准制定和落地的行动路线。

数据标准采集

数据标准采集是参考国际标准、 国家标准、 行业标准和企业现行标准, 对数据对象进行标准化设计, 主要包括数据对象的业务含义、 数据标准分类、 数据元定义、 数据元属性规则、 数据元值域范围、 数据元管理属性以及数据对象之间的关系等。 将所有的数据对象、 数据元素、 数据关系等数据统一采集、 入库。

数据标准管理

包含对数据标准的制定以及数据标准管理流程两部分。
标准制定和管理流程参考上面。

数据标准应用

数据标准应用包括数据标准查询、元数据地图、数据标准对标、数据标准访问接口等。

数据标准查询

数据标准管理工具提供数据标准查询功能, 支持按照数据标准分类、 数据标准关键字等多种数据标准查询方式, 支持按照数据标准的上下文查询相关联的数据标准。

元数据地图

数据标准管理工具提供元数据地图功能, 支持按数据域进行数据标准的组织并进行可视化展示。 数据标准的元数据地图可逐层展开, 通过上下文描述展示数据标准之间的关联关系, 以便于用户整体理解数据标准。

数据标准对标

数据标准管理工具提供数据项对标功能, 支持数据标准的一致性检查。 业务系统、 数据仓库、 大数据平台等系统可调用数据标准的对标功能, 对本系统中的数据标准进行一致性检查, 以及时发现系统中存在的数据缺陷。

数据标准访问接口

数据标准管理工具提供数据标准访问接口, 以供其他系统调用, 实现数据标准的落地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/269332.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Redis的安装以及使用

第一步,去官网下载一个压缩包到本地解压即用,绿色软件,不用其他操作,点击Download下载即可: Introduction to Redis | RedisLearn about the Redis open source projecthttps://redis.io/docs/about/第二步&#xff0…

用邮件群发软件开拓外贸客户:有效的方法与技巧

随着跨境电商业务的发展,企业在研发外贸客户时面临如何有效地与潜在用户沟通的挑战。电子邮件群发软件已经成为一种时兴的工具,帮助企业迅速推送很多电子邮件。本文将探讨电子邮件群发软件在外贸客户开发中的实际应用效果,并从专业角度分析其…

简单的喷淋实验--嵌入式实训

目录 喷淋实验--嵌入式实训 1.MQTT通信原理 2.MQTT库的移植 3.代码流程 运行视频如下: 喷淋实验--嵌入式实训 1.MQTT通信原理 MQTT(Message Queuing Telemetry Transport)是一种轻量级的发布/订阅消息传输协议,旨在提供可靠、高效的通信…

计算机视觉基础(12)——图像恢复

前言 我们将学习图像恢复相关知识。主要有图像恢复的定义、评价标准和实现图像恢复的方法。图像恢复任务包括图像去噪、去模糊、图像超分辨率、图像修复等;评价标准有峰值信噪比和结构相似性;图像超分辨的方法有传统方法和基于深度学习的方法&#xff1a…

three.js使用精灵模型Sprite渲染森林

效果&#xff1a; 源码&#xff1a; <template><div><el-container><el-main><div class"box-card-left"><div id"threejs" style"border: 1px solid red"></div><div class"box-right&quo…

Elasticsearch基本使用

文章目录 概要一、核心概念二、索引操作2.1 创建索引2.2 判断索引是否存在2.3 查看索引2.4 打开、关闭索引2.5 删除索引 三、映射操作3.1 创建映射字段3.2 映射属性详解3.3 查看映射关系 四、文档增删改查4.1 新增文档4.2 查看单个文档4.3 查看所有文档4.4 _source定制返回字段…

Linux进阶系列(二)——lscpu、htop、seq、shuf、sort

1. lscpu lscpu 命令是Linux系统中用来显示关于CPU架构的信息的工具。它详细展示了CPU的相关信息&#xff0c;包括型号、核心数、架构类型、缓存大小等等。 1.1 物理CPU与逻辑CPU 物理CPU指的是实际存在于硬件系统上的中央处理单元。每个物理CPU都是一个独立的处理器芯片或处…

【LeetCode刷题笔记】动态规划(二)

647. 回文子串 解题思路: 1. 暴力穷举 , i 遍历 [0, N) , j 遍历 [i+1, N] ,判断每一个子串 s[i, j) 是否是回文串,判断是否是回文串可以采用 对撞指针 的方法。如果是回文串就计数 +1

C# 类型和成员

C# 教程 - 类型及其成员 - C# | Microsoft Learnhttps://learn.microsoft.com/zh-cn/dotnet/csharp/tour-of-csharp/types 目录 类和对象 类型参数 基类 结构 接口 枚举 可为 null 的类型 元组 作为面向对象的语言&#xff0c;C# 支持封装、继承和多态性这些概念。 类可…

算法——链表

链表常用技巧 画图分析&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;——直观形象&#xff0c;便于理解、大多数都是模拟引入虚拟头结点&#xff08;哨兵位&#xff09; 典型的就是在第一个节点…

Redis设计与实现之服务器与客户端

目录 一、服务器与客户端 1、初始化服务器 1. 初始化服务器全局状态 2. 载入配置文件 3. 创建 daemon 进程 4. 初始化服务器功能模块 5. 载入数据 6. 开始事件循环 2、 客户端连接到服务器 3、命令的请求、处理和结果返回 4、命令请求实例:SET 的执行过程 5、Redis服…

【浏览器】同源策略和跨域

1. 什么是跨域 在说跨域之前,先说说同源策略,什么是同源策略呢?同源策略是浏览器的一种安全机制,减少跨站点脚本攻击(XSS,Cross Site Scripting)、跨站点请求伪造(CSRF,Cross Site Request Forgery)攻击等,因为非同源的请求会被浏览器拦截掉。 同源就是协议、域名(…

电路设计(7)——窗口比较器的multism仿真

1.功能设计 构建一个窗口比较器的电路&#xff0c;在输入电压大于3.5v&#xff0c;小于0.8v时&#xff0c;蜂鸣器报警&#xff0c;输入电压在0.8v到3.5v之间时&#xff0c;不报警。 整体电路如下&#xff1a; 2.设计思路 在输入端&#xff0c;采取电阻分压的方式&#xff0c;输…

ChatGPT/GPT4+AI绘图+论文写作+编程结合到底有多强大?带你详细了解

ChatGPT在论文写作与编程方面具备强大的能力。无论是进行代码生成、错误调试还是解决编程难题&#xff0c;ChatGPT都能为您提供实用且高质量的建议和指导&#xff0c;提高编程效率和准确性。此外&#xff0c;ChatGPT是一位出色的合作伙伴&#xff0c;可以为您提供论文写作的支持…

Jenkins自动化部署之后端

准备工作参考本人另外几篇Jenkins相关的文章 新建任务 添加参数配置 字符串参数&#xff1a;分支名称 多选框&#xff1a;项目名称&#xff08;Extended Choice Parameter插件必备&#xff0c;插件安装参考我另外的文章&#xff09; 这个分割规则自定义。只要根据Jenkins…

【Java】MybatisPlus

MybatisPlus MybatisPlus是在mybatis基础上的一个增强型工具。它对mybatis的一些操作进行了简化&#xff0c;能够提高开发的效率。 springboot整合了mybatis之后&#xff0c;其实已经非常方便了&#xff0c;只需要导入mybatis的包后&#xff0c;在配置文件中编写数据源信息&a…

MySQL的替换函数及补全函数的使用

前提&#xff1a; mysql的版本是8.0以下的。不支持树形结构递归查询的。但是&#xff0c;又想实现树形结构的一种思路 提示&#xff1a;如果使用的是MySQL8.0及其以上的&#xff0c;想要实现树形结构&#xff0c;请参考&#xff1a;MySQL数据库中&#xff0c;如何实现递归查询…

渗透测试——1.2被动扫描

一、概念 目标无法觉察的情况下进行的信息收集。公开渠道可获得的信息&#xff0c;与目标系统不产生直接交互&#xff0c;尽量避免留下一切痕迹。 二、CDN&#xff08;content delivery netword内容分发网路&#xff09; 多台边缘服务器提供网络服务&#xff0c; 三、WAF&am…

CRS-4995: The command ‘start resource’ is invalid in crsctl.

ntp时间调整后&#xff0c;节点1&#xff0c;advm 和acfs offline 处理办法&#xff1a; /u01/app/12.2.0.1/grid/bin/crsctl stop crs /u01/app/12.2.0.1/grid/bin/crsctl start crs 曾经尝试如下命令不起作用 /u01/app/12.2.0.1/grid/bin/acfsload start /u01/app/12.2…

Quartz持久化(springboot整合mybatis版本实现调度任务持久化)--提供源码下载

1、Quartz持久化功能概述 1、实现使用quartz提供的默认11张持久化表存储quartz相关信息。 2、实现定时任务的编辑、启动、关闭、删除。 3、实现自定义持久化表存储quartz定时任务信息。 4、本案例使用springboot整合mybatis框架和MySQL数据库实现持久化 5、提供源码下载 …