上篇文章「一个问题鉴定指标管理真实力:订单表里有原子指标吗?」写完以后,分享到一个群里,有同行回复:有,比如订单金额。
看到回复,我脑子突然就断电了,好像对诶!确实是有原子指标叫订单金额的。
果然,哪怕推导过依然会经常忘记,我当时是咋推导出来的呢?跟我一起来看看~
01 先看一些材料
阿里的数据团队基于电商的海量大数据,在国内构建顶级的数据系统,也输出了很多数据理论和规范,他们产出OneData指标理论体系,也可以说是业界公认的标准体系了。
以下两段内容以及图片都来源于阿里云dataworks-智能建模/原子指标
指标是衡量业务特征的统计数值,用于体现企业某一业务活动的业务状况。指标通常分为原子指标和派生指标,与指标相关的参数还包括修饰词和时间周期。派生指标则是由
原子指标 + 时间周期 + 一个或多个修饰词
组成。
原子指标用于明确业务的统计口径和计算逻辑,是基于用户的业务活动(即业务过程)创建的,用于统计业务活动中某一业务状况的数值。例如,用户的业务活动为购买,则原子指标就可以指定为支付金额。
下面这张非常经典的图估计你也看过,也是来源于阿里数据团队的书:《阿里巴巴·大数据实践之路》,被很多数据领域的文章和书籍所引用。
第一次看这张图,我很震撼。因为当时对指标体系的认知很模糊,相当于给我当时错乱的脑子梳理出来一个非常清晰的逻辑。
但其实,有一些东西深究下去,发现自己不理解。
比如,维度为什么指向属性?是维度表里属性字段的意义吗?那什么是度量,度量和指标是一个意思吗?数据域是什么?如何划分?划分的标准是什么?
但后来,我发现很多书、文章都是基于这套理论系统来展开的,有的甚至把原子指标、派生指标这套体系大讲特讲,但始终没把蠢蠢的我讲懂、讲服。
其实,这些问题萦绕在脑子里,需要结合实际数据慢慢去去理解,甚至是需要自己依照这个图的结果自行给出合理的解释,才能说服自己(就这样吧,别纠结了吧)。
好吧,但既然大家都这么说,那我也就随大流吧。但始终我还是觉得没懂,不太舒服,直到我捋清楚了。
02 为啥没有原子指标
接下来,我说说为啥订单事实表里没有原子指标。
以下,我们结合数据仓库的知识一起来看几个点(包含我的个人理解)
第一,指标定义。
指标是对事实的数字化度量。
第二,原子指标特点。
原子指标是最细粒度、不可拆分的指标。
第三,派生指标的定义。
派生指标 = 一个或多个修饰词 + 时间周期 + 原子指标(有的公司也叫衍生指标,不管叫啥定义都差不多,有的公司定义是这样:衍生指标 = 维度+时间周期+业务限定+原子指标)
第四,事实表的特点。
事实表,包含维度属性字段和事实字段。如果有疑问,可以看《数据仓库工具箱·维度建模权威指南》里对事实表的定义。
也可以看各个数据产品中数据建模的功能模块,在创建事实表时,字段会分不同的类型,维度 or 指标 or 事实。
可以参考官方文档:华为云数据治理中心 DataArts Studio> 用户指南> 数据架构组件> 模型设计> 维度建模> 新建事实表
也可以参考:有数数据开发及管理平台用户手册 V6.5.0 Update /离线用户手册/模型设计中心使用指南/外部数据源建表演示
当然,你依然可以参考:大数据开发治理平台 DataWorks 操作指南/数据建模 DataWorks智能数据建模/维度建模/可视化建模/创建逻辑模型:明细表
不过需要补充说明,阿里的dataworks这款产品里,维度和粒度很容易把人绕晕(关联粒度,也就是关联维度)
有了这四个前提,很明显看到:订单事实表得有维度,而原子指标没有维度。
故而,订单事实表没有原子指标。
那表里面有啥指标呢?表里有数,所有的数对应的都是衍生指标,或者派生指标(或者复合指标),都是具有非常明确业务含义的指标
正如这篇文章衬衫的价格是九磅十五便士,那么你应该选…提到的:一个美丽小胖黑孩(皮肤黝黑),买了一个中国的纯棉衬衫,衬衫的价格是九磅十五便士。
单纯说「订单价格」这个指标,是没有任何业务含义的,在具体的业务场景里的解释一个具体的数字才有实际意义。
就好像,平台打广告给咱们说:诶呀,双十一衬衫跳水价啦!但是呢,你喜欢的特定品牌的、M码的、黑色经典款的衬衫价格没降,结果你没下单,系统也没订单生成。
就算咱们把这个订单金额的指标定义出来了,有啥真实意义呢?没数哇,分析啥?要解释啥?啥也没有,洗洗睡了。
聊抽象的东西,可以聊,但是分析一个真实发生了的、一个具体的什么样的人、买了一件具体的什么样的衬衫价格多少,才有意义。
03 不争了,而且我知道你懂,请让我再说一句
到这里,问题的争论就结束了,咱也不掰扯概念了。
不管认不认可答案,只要知道:衍生/派生指标由修饰词/维度/时间周期/原子指标组成,你肯定也知道指标该怎么管。
原子指标,只不过定义了数该怎么算,从哪算。除了原子指标以外,其他构成派生指标的其他元素,是叫做修饰词、维度、业务限定,都无所谓了。
再多的前缀,也都是修饰,形容词。
「原子」这个词语在我们中文语义里,是不能再细拆的,而当我们加形容词,描述的粒度反而越来越细,这个结果跟对词语的理解是完全相反的,很容易给人带来错误的感觉。
任何的形容词,都是对原子指标的细致解释。最终,我们反过来看。与其叫做原子指标,不如换种说法叫词根指标。
比如:近1天线上渠道订单金额、近1天线上渠道会员订单金额、近1天上午时段线上渠道高级会员订单金额。
当我们彻底搞明白了指标的定义,有了自己的理解,哪怕真实的工作中业务复杂,有成千上万的指标,我们也不会怕了,一眼就能识别出来。
希望看完文章的你,不用再为概念纠结了,也不会被别人轻易地唬住了,也能一眼识别对方是在不懂装懂,还是真的OneData大师~
-end-
接下来,我们可以看看指标具体怎么管,指标管理系统如何构建,会碰到哪些问题,而这,是一个复杂的系统性工程。
以上~
感兴趣的话,记得点赞、在看、收藏,如果还有问题,记得留言喔,这样我才有继续写的人情,我们下回见!
-推荐阅读-
一文帮你更好地理解指标
四千字全面解析数据产品经理必知概念:标签、维度、指标
-链接我-
一个人走得快,但是一群人走得更远。欢迎链接,请写明来源:公众号
非球友的微信私信问题不会回答,如果有问题,请加入星球提问
让我们彼此尊重,一起探索有价值的问题。