如何制定数据治理策略?做好这7点就够了

在当今的商业环境中,数据已成为企业最宝贵的资产之一。随着大数据、云计算、物联网(IoT)和人工智能(AI)等技术的不断进步,企业积累的数据量呈指数级增长,这为企业提供了前所未有的商业机会,同时也带来了严峻的治理挑战。有效的数据治理是确保数据资产得到充分利用的前提,它不仅涉及到数据的收集、存储、使用、共享和维护等环节,更关乎数据的质量、安全、合规性以及价值最大化。

然而,实施数据治理并非易事,它要求企业不仅要有明确的数据治理策略,还需要精心规划和执行复杂的项目。数据治理项目的实施遵循一个周密的四阶段流程,这一流程从识别问题开始,经过需求定义、策略制定,直至执行和监督,形成了一个循环的管理闭环。

本文将介绍数据治理项目的实施过程,并着重介绍数据策略制定方法,帮助企业构建一个坚实、灵活和前瞻性的数据治理体系。

206d0b1a713252e1d935977ce12f007f.jpeg

一、  数据治理的四个过程

1、发现阶段:发现问题,识别需求

发现阶段,正如其名,是指识别问题和需求的阶段,也就是搜集数据治理的需求,识别数据管理中的问题和潜在风险,评价数据治理的当前成熟度,并设定数据治理的目标与范围的过程。在发现阶段,主要活动包括以下几个方面:

  •  理解组织的业务战略和目标
  •  对现有的业务流程和状态进行调研和评估;
  •  对IT基础设施和系统的当前状态进行调研和评估;
  •  评估组织当前的数据治理成熟度
  •  明确数据治理的具体目标和界定其范围
  •  制定实施数据治理的详细计划和路线图

这一阶段是数据治理项目成功的关键,因为它为后续的数据治理工作奠定了基础,并提供了明确的方向和目标。

2、定义阶段:确立数据治理项目实施规范和方案

定义阶段是确立数据管理相关标准、规章、流程、项目章程及计划的环节。该阶段通常与发现阶段同步进行,依据企业现有的数据治理状况、面临的挑战及既定目标,来设计和确定解决问题、达成目标所需的数据治理策略和标准。定义阶段的关键活动主要包括:

  •  制定数据管理的策略,确立数据管理的指导原则和长远目标;
  •  制定数据管理的标准,确保数据的一致性和合规性;
  •  建立数据管理的流程,规范数据的收集、存储、使用和维护;
  •  制定数据管理的绩效指标,用于衡量数据管理的效率和效果;
  •  制定项目章程,明确项目的目标、范围、资源和责任;
  •  制定项目计划,详细规划项目的时间表、里程碑和执行步骤。

通过这些活动,定义阶段为数据治理项目的顺利实施提供了清晰的框架和行动指南。

更多详细内容,推荐下载《大数据建设方案》:
https://s.fanruan.com/5iyug
分享行业真实的数字化转型案例,以及方案架构图


3、执行策略和计划

执行阶段是依据数据治理项目既定的策略、流程、标准和计划来开展具体数据管理任务的环节。在执行阶段,主要活动通常包括:

  •  启动数据治理项目:正式开启项目,确保所有相关方都清楚项目的目标和预期成果。
  •  发布数据治理策略:向所有利益相关者明确传达数据治理的策略和目标,确保策略的透明度和一致性。
  • 实施数据治理策略:按照既定的策略和流程,开展数据管理的具体工作,如数据清洗、标准化、质量控制等。
  •  沟通与协调:在整个执行过程中,保持与团队成员和利益相关者的有效沟通,及时解决实施过程中出现的问题,确保项目按计划顺利进行。

执行阶段是数据治理项目中至关重要的一环,它要求严格的项目管理和控制,以确保数据治理的策略和措施得到有效执行,并达到预期的治理效果。

4、监控数据治理项目实施情况

监控阶段是针对数据治理策略的执行情况进行跟踪和评估的环节,目的是为了确认这些策略是否可行、能否产生预期效果,并量化数据治理工作带来的成果。在监控阶段,主要活动通常涵盖:

  •  对数据治理策略执行的实时监控,确保各项措施得到正确实施;
  •  定期评估数据治理策略的有效性,检查是否达到了既定目标;
  •  量化和度量数据治理工作产生的价值,包括改进的数据质量、提升的数据透明度、增强的数据驱动决策能力等。

通过这些活动,监控阶段有助于及时发现问题、调整策略,并持续优化数据治理流程,以保障数据治理的长期成功和数据资产的最大化利用。

a5b8af0cc2eeb391fde9a9b23b7efc30.jpeg

随着我们深入理解了数据治理的过程,包括从数据的发现、定义、执行、监控的每个环节,每个环节都与数据治理策略紧密相关,现在自然而然地转向一个核心议题:如何制定有效的数据治理策略?这一策略不仅需要反映组织的业务目标和法规要求,还要能够适应快速变化的数据环境和技术进步。

二、  如何制定数据治理策略

在企业数据治理中,预防胜于治疗,采取有效的数据管理预防措施可以显著提高数据治理的效率和效果。所谓的“数据管理的预防措施”指的是在数据治理的早期阶段就制定的一系列策略和计划,包括但不限于数据治理策略和项目章程。这些策略和计划是数据治理成功的基石,具体包括:

1、  定义业务术语表

创建业务术语表是企业为了促进与关键业务词汇相关的业务上下文环境的共享与协作而采取的一种策略。

明确业务术语的定义对于企业内不同业务部门之间达成共识至关重要,它有助于解决企业中常见的业务术语“同名异义,同义异名”的现象。例如,对于“客户”这一术语,不同部门可能有不同的理解:

  •  业务人员可能认为任何拥有联系方式的个体都可视为企业的客户;
  • 财务人员则可能认为只有那些购买了产品或服务并完成支付的个体才能算作客户;
  •  而IT人员可能简单地将客户视为数据库中的一个数据实体。

业务术语的定义不仅要涵盖核心数据实体及其属性,还需要描述这些实体的上下文环境。上下文环境包括但不限于使用语境、相关规则、政策、参考数据、附加注解、相关链接以及数据的责任所有者等。不同的上下文环境可能导致即便是相同的业务术语,其具体含义和应用也可能有显著差异。

因此,定义业务术语表不仅涉及术语本身,还包括了对术语所处环境的全面描述,这对于确保企业内部对业务概念的统一理解和正确应用至关重要。

2、  制定元数据标准

制定元数据标准是依据特定的业务规则对数据实体进行系统分类,并对其业务元数据、技术元数据和管理元数据进行规范化定义的过程。

元数据的应用赋予了企业数据资源查询、定位、管理和跟踪的能力。

  • 对于结构化数据,元数据提供了一种方式来检索相关的业务和技术上下文环境,使得数据的来源、用途和关系变得清晰可查。
  • 而对于非结构化数据,元数据则通过为内容信息添加标签和分类,支持基于类别的检索,从而加快了数据的定位过程。

通过这种方式,元数据成为了数据管理和决策支持的基石,它不仅帮助企业更好地理解和使用数据,还提高了数据的透明度和可操作性。

3、  制定主数据标准

主数据构成了企业运营和业务分析的基石,是关键的共享信息。通过对企业内诸如组织结构、员工信息、物料清单、客户资料、产品信息、销售渠道等核心数据进行标准化处理,包括数据的分类、编码和模型化,可以显著提升不同业务部门间的协同效率,减少系统整合时的复杂性。这种标准化定义为主数据管理提供了一致性和准确性,为信息系统的整合、数据的统计分析以及决策支持系统提供了坚实的基础。

通过这种方式,主数据管理确保了关键信息的一致性和可访问性,支持了企业范围内的数据治理和优化了业务流程,从而为企业的持续发展和数字化转型提供了强有力的数据支撑。

4、  制定参考数据标准

标准化的参考数据是实现数据一致性和整合性的关键,它为数据的协调和汇总提供了坚实基础。通过明确定义和规范在应用系统内部或跨应用系统使用的参考数据,可以保证数据在捕获和应用过程中的统一性。参考数据主要包括以下几个类别:

  • 业务属性值表:涉及业务运作中的具体分类,例如客户类型、产品颜色等,它们为业务交易和决策提供明确的分类标准。
  • 国家或地区标准值表:如ISO 3166国家代码,这类标准值表为跨国经营和国际交流提供了统一的识别和分类方式。
  • 行业规范标准:例如医疗卫生领域的全国性数据元值域代码表,确保行业内数据的标准化和互操作性。

通过这些标准化的参考数据,企业能够建立一个稳定可靠的数据环境,支持高效的数据管理和分析,同时促进不同系统和组织之间的数据交换与协作。

5、  制定业务规则

确立数据验证、清洗、匹配、合并、屏蔽、归档和标准化等操作的业务逻辑需求是数据治理中的重要一环。制定明确的业务规则对于自动化数据治理流程的计算机系统执行至关重要,同时,也为需要人工介入的手动流程提供了操作和校验的具体指南。

业务规则的制定在数据治理的实施阶段发挥着核心作用,它们确保了数据的可信度、有效性、安全性,并保证数据最终能够满足业务需求。这些规则不仅指导数据治理的自动化工具,也帮助数据管理人员进行决策,从而提高数据的整体质量和适用性。

通过这些业务规则,企业能够确保数据治理流程的一致性和系统性,无论是在自动化处理还是人工操作中,都能够维持数据的高标准和高质量。

6、  制定治理制度

为了有效推进数据治理,需要制定一系列相关策略、规章和保障机制,包括但不限于:

  • 数据的所有权和责任归属,明确谁对数据的准确性和完整性负责;
  • 组织内的角色分配及相应职责,确保数据治理任务的明确分工;
  • 数据录入和审核的规范流程,保障数据在初次进入系统时的准确性;
  • 数据获取和验证的标准,确保数据来源的可靠性和数据本身的正确性;
  • 数据访问和使用的规则,规范数据的使用行为,防止数据滥用;
  • 数据封存和归档的规范,为数据的长期保存和历史追溯提供指导。

数据治理制度的建立、审批、发布和普及是提升数据质量和安全性的关键步骤。这些制度的制定需要高层领导的推动和支持,通过自上而下的执行力度,可以有效地在企业内部形成一种重视数据、合理利用数据的文化氛围。这不仅是数据治理成功的关键,也是企业数字化转型和可持续发展的重要保障。

7、  制定数据治理评估指标

数据治理评估是一种衡量数据治理工作成效和价值的关键手段。不同的数据治理领域会侧重不同的评估指标,常见的包括:

  • 合规性操作基线:确保数据治理遵循相关法律法规和行业标准;
  • 数据质量衡量标准:评价数据的准确性、完整性和一致性;
  • 投资回报率(ROI):衡量数据治理项目的经济效果,即投入与产出的比率。

缺乏对数据治理工作成效和价值的评估机制,将导致难以获得企业对资金和资源的持续支持,进而影响数据治理计划的有效执行。

数据治理评估不仅帮助企业了解数据治理的当前状态,还能揭示改进的方向,为决策者提供依据,确保数据治理活动与企业战略目标保持一致。此外,通过定期评估,可以持续优化数据治理流程,提升数据管理的成熟度,从而推动企业数据治理向更高水平发展。

总结

总之,数据治理是一项长期而复杂的任务,它要求企业投入持续的关注和资源。从项目启动到持续优化,每一步都至关重要,都需要企业展现出高度的专业性和创新精神。通过本文的分析和指导,我们希望企业能够更好地理解和应用数据治理的核心技术,构建起一个坚实、灵活和前瞻性的数据治理体系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/726039.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

大语言模型的微调方法_大语言模型六种微调方法

01 引言 自2018年BERT发布以来,“预训练微调”成为语言模型的通用范式。以ChatGPT为代表的大语言模型针对不同任务构造Prompt来训练,本质上仍然是预训练与微调的使用范式。千亿规模的参数微调需要大量算力,即使提供了预训练的基座模型&…

正版 navicat 下载

1. 打开浏览器访问 navicat 官网 Navicat | 下载 Navicat Premium 14 天免费 Windows、macOS 和 Linux 的试用版 windows 用户选择这三项其中一个就可以 2. 下载 点击之后等个几秒钟就会开始下载了 3. 双击打开 下载好的 .exe 程序 进入安装程序 (不影响之前已经安装过的) 可…

数据结构试题 20-21

真需要就死记吧 二叉树遍历-先序(非递归)【图解代码】_哔哩哔哩_bilibili 解释一下步骤: 一个循环为: 1.取节点 2.放右子树 3.放左子树 每次循环,都要从栈里取出一个节点 先放右子树,再放左子树 那这道题就是,先放1&am…

山西青年杂志山西青年杂志社山西青年编辑部2024年第10期目录

本刊专稿 共融共创、校企共建BIM创新创业中心的探索与实践 黄强;马福贵;贾晓敏;苏艳贞;魏艳卿; 1-3 财务管理课程专创融合教学改革与实践 宋衍程; 4-7 数字化赋能国际贸易实务课程建设研究 吴珍彩; 8-11《山西青年》投稿:cn7kantougao163.com 青年教育研…

智慧学习实践系统的设计

管理员账户功能包括:系统首页,个人中心,企业管理,任务管理,公告管理,菜单管理,用户管理,基础数据管理 企业账户功能包括:系统首页,个人中心,任务…

android 在线程中更新界面

在Android中,你不能直接从子线程中更新UI,因为这会导致应用崩溃。你需要使用Handler或runOnUiThread()来更新UI。 使用Handler 以下是如何使用Handler在子线程中更新UI的示例: 1. 创建Handler实例: import android.os.Bundle;…

从boost库到时间戳

一、以问题引入 授权证书一般有到期时间的说法,公司测试同事在测试更新后的证书时,将系统时间调到了2050年,重启服务后发现各个进程的cpu占用率特别高;结合日志分析,发现这些进程 都在不停的刷heartbeat()的日志&#…

常用的Java日志框架:Log4j、SLF4J和Logback

日志是软件开发中不可或缺的一部分,它有助于记录应用程序的运行状态、调试问题和监控系统。Java中有多个流行的日志框架,如Log4j、SLF4J和Logback。 一、Log4j 1.1 什么是Log4j? Log4j是Apache基金会开发的一个开源日志框架,它…

webpack处理样式资源04--webpack入门学习

处理样式资源 本章节学习使用 Webpack 如何处理 Css、Less、Sass、Scss、Styl 样式资源 介绍 Webpack 本身是不能识别样式资源的,所以我们需要借助 Loader 来帮助 Webpack 解析样式资源 我们找 Loader 都应该去官方文档中找到对应的 Loader,然后使用…

【0-1系列】从0-1快速了解搜索引擎Scope以及如何快速安装使用(下)

前言 近日,社区版家族正式发布V2024.5版本,其中,社区开发版系列重磅发布Scope开发版以及StellarDB开发版。 为了可以让大家更进一步了解产品,本系列文章从背景概念开始介绍,深入浅出的为读者介绍Scope的优势以及能力…

链表经典面试题--链表修至圆满

目录 1.环形链表 a.为什么一定会相遇,有没有可能会错过,永远追不上?请证明 b.slow一次走1步,fast走3步 4步 5步 n步还一定追得上吗 请证明 2.环形链表2 3.随机链表的复制 1.环形链表 141. 环形链表 - 力扣(Lee…

【stm32-新建工程-寄存器版本】

stm32-新建工程-寄存器版本 ■ 下载相关STM32Cube官方固件包(F1,F4,F7,H7)■ 1. ST官方搜索STM32Cube■ 2. 搜索 STM32Cube■ 3. 点击获取软件■ 4. 选择对应的版本下载■ 5. 输入账号信息■ 6. 出现下载弹框&#xff…

【轨迹规划论文整理(1)】UAV轨迹规划的开山之作Minimum Snap Trajectory

【轨迹规划论文整理(1)】UAV轨迹规划的开山之作Minimum Snap Trajectory Generation and Control for Quadrotors 本系列主要是对精读的一些关于无人机、无人车的轨迹搜索论文的整理,包括了论文所拓展的其他一些算法的改进思路。 这是本系列的第一篇文章&#xff0…

人工智能发展历程了解和Tensorflow基础开发环境构建

目录 人工智能的三次浪潮 开发环境介绍 Anaconda Anaconda的下载和安装 下载说明 安装指导 模块介绍 使用Anaconda Navigator Home界面介绍 Environment界面介绍 使用Jupter Notebook 打开Jupter Notebook 配置默认目录 新建文件 两种输入模式 Conda 虚拟环境 添…

参数量Params和每秒浮点运算次数FLOPs的单位是多少

先看一下yolov8的表 模型计算量(FLOPs)和参数量(Params)是衡量深度学习算法复杂度的两个重要指标,它们可以用来评估一个模型的性能和实用性。以下是对这两个指标的理解: 1、Params - 参数量 即模型中需要学习的参数数量,它是衡量模型复杂度的…

Elsevier曝光73篇论文操纵同行评审,涉嫌操纵同行评审和人为引用

近日,全球知名学术出版商爱思唯尔(Elsevier)旗下期刊《Engineering Analysis with Boundary Elements》对73篇论文发出了关注声明,这些论文涉嫌操纵同行评审和人为引用。去年7月,该期刊前编委Masoud Afrand被指涉嫌论文…

第 7 章: 对象关系映射

在第 6 章中,我们大概了解了如何通过 JDBC 来进行简单的数据库操作。通过 SQL 来执行操作虽然不算复杂,但在面向对象的语言中,这类操作多少显得有些格格不入,毕竟我们都是在与“对象”打交道。把对象与关系型数据库关联起来&#…

VMare连接Centos7无法连接网络

VMare连接Centos7无法连接网络 打开ifcfg-ens33文件检查ONBOOT是否为yes,如果是no需要修改成yes vi /ect/syscong ig/network-scripts/ifcfg-ens33 保存后输入ip a命令,能看到自己的ip就是成功了 ip就是成功了

C++ | Leetcode C++题解之第165题比较版本号

题目&#xff1a; 题解&#xff1a; class Solution { public:int compareVersion(string version1, string version2) {int n version1.length(), m version2.length();int i 0, j 0;while (i < n || j < m) {long long x 0;for (; i < n && version1[…

leetCode-hot100-链表专题

leetCode-hot100-链表专题 链表简介单链表单链表的使用例题206.反转链表19.删除链表的倒数第N个结点24.两两交换链表中的节点25.K个一组翻转链表 双向链表双向链表的使用 循环链表61.旋转链表141.环形链表142.环形链表Ⅱ LinkedListLinkedList的使用 链表简介 参考博客&#x…