前言
在建模前规划制定数据标准,或在建模使用过程中根据业务情况沉淀企业业务的数据标准。通过规范约束标准代码、度量单位、字段标准、命名词典,来保障数据处理的一致性,从源头上保障数据的标准化生产,节约后续数据应用和处理的成本。数据标准包含字段标准、标准代码、度量单位、命名词典。
一、字段标准
字段标准是对含义相同但字段名称不同的数据进行统一规范管理的标准。
字段标准包含:
二、标准代码
标准代码是字段标准的取值范围,在标准代码中可设置某一字段标准可选择的数据的内容以及范围。例如性别字段标准的标准代码内容应该为男或女。
三、度量单位
度量单位指字段参数的数量单位(如个、厘米等),系统已为您提供了预置的度量单位,您可根据自定义需求创建新的度量单位。度量单位包括货币单位、对象量词、比例单位、排名单位、时间单位等度量类别。
四、命名词典
命名词典提供管理业务名词、物理表、字段的词根和词素等。
五、规则检查器
例如:某公司希望目标数仓分层中的表以dim_
开头。当数仓分层中包含命名为dim_sku、dim_store、dimension_warehouse、fact_order的表时,触发检测后,检测结果如下表所示。
表名称 | 是否符合数仓分层的命名规范 |
dim_sku | 匹配 |
dim_store | 匹配 |
ension_warehouse | 不匹配。名称不符合以 |
fact_order | 不匹配。名称不符合以 |
总结
创建完成命名词典后,您可以在数仓规划的各层的检查器配置中。数据域、业务过程与业务分类的规划和创建。检查数仓中的表名、字段名等是否符合数仓分层的命名规范。