引入
上一篇我们聊了数仓架构设计,它是企业构建数据中台的基石。其本质就是构建一个可靠易用的架构,可以借此将原始数据汇聚、处理,最终转换成可消费使用的数据资源。
在拥有数据资源以后,我们就需要考虑如何利用它,为企业创造价值,让它变成企业的资产而不是负担。也就是要实现数据资产化,将数据资源变成质量可靠,安全合规,经济易用的数据资产。
而数据资产化,就需要通过本文主角数据治理与管理来实现。
数据治理与数据管理
数据治理概念是在20世纪90年代提出的,率先大规模开展数据治理工作的是强监管要求下的以银行为代表的金融业。DAMA对数据治理的定义是:数据治理(Data Governance,DG)是指对数据资产管理行使权力和控制的活动集合(规划、监督和执行)。
而中国信通院对数据资产管理的定义是:对数据资产进行规划、控制和提供的一组活动职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。
可以看到,数据治理的核心在于企业顶层设计和战略规划。它是数据管理活动的总纲和指导,强调组织模式、职责分工和标准规范,比如明确数据管理过程中有哪些决策要制定、由谁负责等。而数据管理是为实现数据资产价值的获取、控制、保护、交付及提升,对项目、政策和实践所做的计划、执行和监督。
下面我们梳理一下数据治理与管理在企业应该如何设计落地:
目标
首先,自然是要确定我们资产化的目标。其核心就是将企业的数据资源统一管理起来,实现数据的可见、可懂、可用。
可见(Visibility)
可见,是指企业能够清晰地了解和掌握其拥有的数据资产的全貌。
- 数据使用方可以快速、精确地查找到自己想要的数据;
- 数据管理者可以及时、准确地评估数据质量的现状。
可懂(Comprehensibility)
可懂,是指数据具有清晰、准确、易理解的描述和定义,包括数据的业务含义、使用场景、数据质量等信息。并且数据无论是业务定义还是加工处理口径,在整个企业层面都是统一、无歧义的。
可用(Usability)
可用,是指数据的可信度高,无论是数据质量,还是数据安全,都有相应规范和保障措施;并且数据使用便捷,有完善的数据服务和共享能力。
实现
具体实现要从两方面入手&#