标签 VS 数据指标,概念与区别

一、标签体系相关概念

标签由标签和标签值组成,打在目标对象上,如图所示。

 打标签示例

标签由互联网领域逐步推广到其他领域,打标签的对象也由用户、产品等扩展到渠道、营销活动等。

  •     在互联网领域,标签有助于实现精准营销、定向推送、提升用户差异化体验等;
  •     在行业领域,标签更多助力于战略分级、智能搜索、优化运营、精准营销、优化服务、智慧经营等。

标签分为事实标签、规则标签和模型标签,如图所示。

 

  •     事实标签是描述实体的客观事实,关注实体的属性特征,如一个部件是采购件还是非采购件,一名员工是男性还是女性等,标签来源于实体的属性,是客观和静态的;
  •     规则标签是对数据加工处理后的标签,是属性与度量结合的统计结果,如货物是否是超重货物,产品是否是热销产品等,标签是通过属性结合一些判断规则生成的,是相对客观和静态的;
  •     模型标签则是洞察业务价值导向的不同特征,是对于实体的评估和预测,如消费者的换机消费潜力是旺盛、普通还是低等,标签是通过属性结合算法生成的,是主观和动态的。

标签管理分为标签体系建设和打标签。

01 标签体系建设

  •     选定目标对象,根据业务需求确定标签所打的业务对象,业务对象范围参考公司发布的信息架构中的业务对象。
  •     根据标签的复杂程度进行标签层级设计。
  •     进行详细的标签和标签值设计,包括标签定义、适用范围、标签的生成逻辑等:
  •     事实标签应与业务对象中的属性和属性值保持一致,不允许新增和修改;
  •     规则标签按照业务部门的规则进行相关设计;
  •     模型标签根据算法模型生成。

 

02 打标签

1. 打标签数据存储结构

打标签是建立标签值与实例数据的关系,可以对一个业务对象、一个逻辑数据实体、一个物理表或一条记录打标签。

为了方便从“用户”视角查找、关联、消费标签,可增加用户表,将标签归属到该“用户”下,这里的“用户”是泛指,可以是具体的人,也可以是一个组织、一个部门、一个项目等。

2. 打标签的实现方法

  •     事实标签:根据标签值和属性允许值的关系由系统自动打标签。
  •     规则标签:设计打标签逻辑由系统自动打标签。
  •     模型标签:设计打标签算法模型由系统自动打标签。

二、数据指标体系相关概念

数据指标就是将大数据之“大”的精髓给提炼出来,展现每日观察数据的使用者最迫切想要看到的统计量。数据指标体系并不是第三方服务公司的专利,只要对埋点科学地进行数据采集,每个成型的互联网公司都可以自己搭建数据指标体系。

数据之大,很多时候人们并不知从哪里着手,甚至弄不清自己到底想要什么数据,这时候数据产品经理这一角色应运而生。数据产品经理既要完成数据体系设计,让原本无序或庞杂的数据变得“规矩”,又要根据业务场景的变化不断调整项目内容,推进项目进度,推进数据指标体系的建设与迭代。

数据指标体系的规划是平台型数据产品经理必备的能力,这也是数据产品经理有别于其他产品经理和数据分析师的方面。

《荀子》有云:“水能载舟,亦能覆舟。”在公司日常运营过程中,数据指标体系就像是水,孕育着生命,承载着万物。科学的数据指标体系能指引公司在正确的道路上不断前进,或者使平淡无常的业务焕发新生,而不合理的数据指标体系可能使得业务方无所适从。

01 什么是数据指标体系?

在了解什么是数据指标之前,我们思考一下为什么会出现指标,它是为了解决什么问题。人类及科学的发展是与时俱进的,早期为了使自然科学的实验及结果更具统一性及方便标准化衡量,一些标准化的专业指标应运而生。

随着人类社会的发展,社会科学也越来越需要统计学来进行事物的衡量,一系列统计学指标也逐步产生了。随着新信息技术的发展,数据指标逐步被大众认可为衡量目标的方法。

从社会科学角度看,指标是统计学的范畴,用于数据的描述性统计。指标是说明总体数量特征的概念及其数值的综合,故又称为综合指标。

在实际的统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。传统的指标有国内生产总值(Gross Domestic Product,GDP)、国民生产总值(Gross National Product,GNP)、居民消费价格指数(Consumer Price Index,CPI)、沪深300指数等。

1. 什么是数据指标?

数据指标有别于传统意义上的统计指标,它是通过对数据进行分析得到的一个汇总结果,是将业务单元精分和量化后的度量值,使得业务目标可描述、可度量、可拆解。

数据指标需要对业务需求进行进一步抽象,通过埋点进行数据采集,设计一套计算规则,并通过BI和数据可视化呈现,最终能够解释用户行为变化及业务变化。常用的数据指标有PV、UV等。

本文提及的指标是衡量目标的方法,指标由维度、汇总方式和量度组成(见下图)。

 

    其中,维度是指从哪些角度衡量,是看待事物的视角与方向,决定了根据不同角度去衡量指标。

    汇总方式是指用哪些方法衡量,是统计汇总数据的方式。

    而量度主要是明确事物的具体目标是什么,是对一个物理量的测定,也用来明确数据的计量单位。

比如,播放总时长是指用户在一段时间内播放音频的时长总和(单位:分钟)。按照上述拆解,维度是指筛选的一段时间,汇总方式为计算了时间长度的总和,而量度就是统一的单位—分钟数。

这里,我们可以理解为指标是由这几个方面构成,相当于英文的构词法,前缀、后缀等共同形成了一个单词。

2. 什么是指标体系?

体系化的本质是将数据指标系统性地组织起来,具体会按照业务模型、按标准对指标不同的属性分类及分层。当然,不同的业务阶段、不同业务类型会有不同阶段的划分标准。

数据指标体系含有十分丰富的统计量,从宏观上看,它是一个相对全面的有机整体;从微观上看,每个数据指标都有其特定含义,反映了某一细节的客观事实。不同的数据指标定义不同,逻辑也不同,这些各种各样的统计量共同构成了数据指标体系,使其产生不可磨灭的价值。

总的来说,数据指标体系是对业务指标体系化的汇总,用来明确指标的口径、维度、指标取数逻辑等信息,并能快速获取到指标的相关信息。

02 数据指标体系的价值

数据指标体系是业务数据标准化的基础,其对指标进行了统一管理,体系化是为了方便统一修改、共享及维护。

宏观方面,数据指标体系建设是数据中台建设的重要一环,不仅符合“创新驱动”的意识,更是企业实现自身“数据驱动”发展的重要途径。

随着大数据和人工智能技术的发展,很多企业选择借助信息技术实现转型升级。在大数据时代早期,大部分数据并没有被充分地挖掘分析和利用。虽然数据规模非常大,但是却很难利用这些数据创造价值。而数据中台的提出及数据指标体系的构建,使得数据产生了实际价值。

有了数据指标,人们做决策时不再是按照经验“拍脑袋”,而是看看数据是怎样呈现的,能够及时基于数据进行战略调整及决策规划。

数据指标体系的价值主要体现在全面支持决策、指导业务运营、驱动用户增长,同时统一统计口径(如下图所示)。其中,作为压轴作用的统一统计口径对于数据指标体系而言具有战略意义。

在一个整体中,如果不能统一口径,那么一切分析及对比的参考价值就会显得无意义,各方也会陷入公说公有理,婆说婆有理的尴尬局面。由此说明,对于衡量整个公司的业务价值而言,建立一套统一标准的数据指标体系的作用不言而喻。

1. 全面支持决策

数据指标极具参考价值,公司的管理层为了更准确地进行战略决策,需要搭建完备的数据指标体系。一个相对全面的数据指标体系,可以让管理者对公司的发展从数据层面有一个比较客观的认知,而不是管中窥豹,这样在进行战略决策时,可以保持相对理性。

而对于新业务的洞察,也可以不断融入新的数据指标,丰富指标体系,灵活且全面地把握业务发展趋势,为未来的决策提供借鉴。

2. 指导业务运营

不懂数据的产品不是好运营,为了便捷地了解产品现状及业务效果,指标体系中会有很多拆解的细分指标,这些数据的变动反映的是用户对于运营情况的最新反馈,为运营的业务决策提供了数据支持。用户运营可以根据这些数据,了解用户的喜好,决定下一步的运营策略和活动开展。

例如,对于阅读行业来说,内容编辑会基于自己对内容的认知,将一组有共性特征的书籍组成一个书单推送给用户,那么指标体系中也会有相应的指标反映用户对这个书单的偏好。内容编辑就可以通过这些指标,了解用户的偏好,决定下一步是否要继续尝试这种类型的专题。

3. 驱动用户增长

最近最火的词莫过于用户增长,数据指标体系中的用户行为数据,可以让产品及运营人员对用户的行为路径和喜好模式有一个比较深入的理解。剖析用户的行为特征,助力用户价值的提升,让产品及运营更聚焦于产品细节的优化,更好地进行监测,提升用户留存及转化。

人们在分析和挖掘用户行为的过程中,也许会发现不少新的用户增长点。体系化的指标结合了用户的场景,且多个不同的指标和维度可以串联起来进行全局分析,解决了非体系化指标无法串联的痛点。

公司在深入进行数据分析后,可能会在原有业务中发现某个点潜藏着巨大商业价值,从而单独把这块业务重点推进,实现用户增长的二次腾飞。

4. 统一统计口径

从技术角度来看,数据中台是为了汇总与融合企业内的全部数据,甚至外部数据,打破数据隔阂,解决数据标准与口径不一致的问题。数据指标体系化有个好处是可以实现指标的统一管理,实现统一的统计口径,避免定义模糊和逻辑混乱,影响数据质量。

同时,完备的数据指标体系也可减少重复统计的问题,从而避免日志上报产生的数据冗余和重复分析产生的服务器资源浪费。

三、数据指标与标签的区别

从内容上看:指标通常描述客观事实,标签往往存在人为划分。

指标通常是描述客观事实,并通过不同的统计口径,叠加不同的计算维度与限定词来展现客观事实。指标多为数值型,最常见的数据指标为各类宏观指标。比如 GDP、CPI,都是一个实实在在的数字,无人为判断。在金融行业中也存在着海量的指标,比如各类经营指标、不良率等,同样也是实实在在的数值。具有数据口径的指标通常是抽象的概念,比如将数据计数、求和、比率等,与具体的实体无关。

但标签通常是人为定义的概念,比如客群标签可以分为长尾客户、高净值客户;产品标签有高风险和低风险。标签并不是一个客观的事实,而是由人为的定义和客观事实结合得到的数据标签。标签通常会定位到具体的实体,其核心的目的是划分不同的实体群组。比如长尾客户,一定可以通过一些数据指标圈定出一部分人群,通过数据标签可以进行更加精细化的用户运营。

从二者之间的关系来说是可以相互转化的。指标可以从标签中转化,比如高净值客户的迁移率(从长尾客户转化到高净值客户的比率),其中高净值客户和长尾客户都是标签,但在标签的基础上增加一个迁徙率,就由标签转化为了指标。同样标签也可以从指标转化得来,比如说银行中常用的数据标签:私行客户(AUM>=500万),其中 AUM 就是数据指标,不同银行的标签设定可能是不同的。以上就是数据指标和标签在内容上的区别。

从分类和场景上看,指标和标签的分类原则不同,使用的场景也不同。

 

  •     指标分类

一般来说指标常用的分类是相对固定的,会将指标分为原子指标、派生指标和衍生指标三类。原子指标指的是不需要叠加任何纬度的,通常是 SQL 直接统计的一些基础指标,比如客户数、交易量等。派生指标指的是由原子指标通过叠加一个或多个维度而得到的二级指标,如客户数叠加了渠道的维度就变成了派生指标,比如手机银行客户数、长尾客群交易量等。除此之外还有一些常见的比率类指标是通衍生得来的。

  •     标签分类

标签可分为事实标签、规则标签和模型标签。同原子指标类似,事实标签来自于底层的原始数据,事实标签用于描述实体的客观事实,例如性别标签、车主标签、持卡类型标签等。规则标签指的是基于事实的统计结果,结合一些人为判断而生成的,比如按照年龄的不同区间就可以将用户划分为青年、中年和老年客户。模型标签则更加抽象、更加主观,是通过事实标签和规则标签抽象而来的群体特征,比如月光族、白领、消费达人等。

  •     指标使用场景

指标通常拆解使用。比如一个较大的指标:客户数,可以拆解到不同维度上,并且加以限定词,比如手机银行客户数、七日内客户数的增量等,主要是用来监测和评价业务的效果。

  •     标签使用场景

标签通常归纳使用,用来刻画某一个群体的特征,可以是客户也可以是产品,其核心是分类,给予不同类别不同的经营策略。

 

具体举例说明:指标体系通常会首先定义一个或几个北极星指标,比如招商银行常年使用 AUM 作为北极星指标,将北极星指标拆解到现金/存款、投资理财或其他业务模块,同时用户也可以拆解为活跃用户和非活跃用户等。以此基础可以梳理出整体的指标框架,从而指导业务。

在标签的使用场景上更多的偏向一线的营销场景,包括客户的经营、精准营销和资格判断等。通过不同客户的标签将其分成不同的类别,并进行不同的活动、资格或者产品的推送。也可以给产品打标签,用来标识产品适合哪类人群,在平安银行口袋 APP 这样的平台就做到了千人千面,每个人进去看到的具体内容是不一样的,这就是通过标签去筛选圈定的。

来源:标签 VS 数据指标,一文搞懂概念与区别_51CTO博客_数据标签和指标区别

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/264029.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙声势浩大,程序员能从中看出什么机遇?

鸿蒙声势浩大,在最近的大厂商合作消息中我们能看到什么未来机遇?? 12 月 22 日消息,据华为开发者联盟服务消息,来自政务、金融、教育等行业的 8 家企业与华为签约并官宣启动鸿蒙原生应用开发。此前,美团、…

Kubernetes pod ip 暴露

1. k8s pod 和 service 网络暴露 借助 iptables 的路由转发功能,打通k8s集群内的pod和service网络,与外部网络联通 # 查看集群的 pod 网段和 service 网段 kubectl -n kube-system describe cm kubeadm-config networking:dnsDomain: cluster.localpod…

Kafka收发消息核心参数详解

文章目录 一、从基础的客户端说起消息发送者主流程消息消费者主流程 二、从客户端属性来梳理客户端工作机制消费者分组消费机制生产者拦截器机制消息序列化机制消息分区路由机制生产者消息缓存机制发送应答机制生产者消息幂等性生产者消息事务 三、客户端流程总结四、SpringBoo…

ubuntu20.04下安装pcl_ubuntu安装pcl

pcl点云数据库,用来进行3D信息的获取与处理,和opencv相比较,opencv是用来处理二维信息,他是学术界与工业界针对点云最全的库,且网络上相关的资料很多。以下是pcl的安装步骤以及遇到的问题。 提前说明,本人…

算法基础之表达整数的奇怪方式

表达整数的奇怪方式 中国剩余定理: 求M 所有m之积 然后Mi M / mi x 如下图 满足要求 扩展中国剩余定理 找到x **使得x mod mi ai**成立 对于每两个式子 都可以推出①式 即 用扩展欧几里得算法 可以算出k1,-k2和m2–m1 判无解 : 若**(m2–m1) % d ! 0** 说明该等式无解 …

无约束优化问题求解(3):共轭梯度法

目录 4. 共轭梯度法4.1 共轭方向4.2 共轭梯度法4.3 共轭梯度法的程序实现4.4 非二次函数的共轭梯度法 Reference 4. 共轭梯度法 4.1 共轭方向 最速下降法的线搜索采取精确线搜索时,由精确线搜索需要满足的条件:迭代点列 x k 1 x k α k d k x_{k1}…

Java中使用JTS实现WKB数据写入、转换字符串、读取

场景 Java中使用JTS实现WKT字符串读取转换线、查找LineString的list中距离最近的线、LineString做缓冲区扩展并计算点在缓冲区内的方位角: Java中使用JTS实现WKT字符串读取转换线、查找LineString的list中距离最近的线、LineString做缓冲区扩展并计算点在缓冲区内…

MFC静态链接+libtiff静态链接提示LNK2005和LNK4098

编译报错 1>msvcrt.lib(ti_inst.obj) : error LNK2005: "private: __thiscall type_info::type_info(class type_info const &)" (??0type_infoAAEABV0Z) 已经在 libcmtd.lib(typinfo.obj) 中定义 1>msvcrt.lib(ti_inst.obj) : error LNK2005: "pr…

电子说明书制作:零基础也可以轻松上手

引言: 在数字化时代,电子说明书成为了传统纸质说明书的现代替代品。电子说明书具有可交互性、易更新、环保等优势,越来越受到企业和个人的青睐。本文将介绍一些简单易用的工具和方法,帮助零基础的用户轻松上手电子说明书的制作。…

Sui 生态排名第一的头部流动性协议 NAVI Protocol 活动进行中

作为在熊市中启动的新生公链,Sui 正在稳步崛起。公链的 TVL 持续攀升,目前已经达到了 1.76亿美元,闯入了公链排名前20榜单。仅过去四个月内,TVL 增加了10倍,并且增长仍在继续,SUI 的价格在近期也有了很亮眼…

智能优化算法应用:基于瞬态优化算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于瞬态优化算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于瞬态优化算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.瞬态优化算法4.实验参数设定5.算法结果6.…

网络调优,部署内网备份冗余和负载分担---实验

目录 网络调优,部署内网备份冗余和负载分担---实验 拓扑 需求 配置步骤: 配置命令: 网络调优,部署内网备份冗余和负载分担---实验 拓扑 需求 主机获取IP地址,访问WEB服务器,WEB服务器网关在SW5上SW5作为VLAN10,V…

Qt配置opencv,cmake编译参考笔记,已成功

Qt版本:Qt5.14.2 opencv:4.5.4(不要用4.5.5!!很坑别问我为什么知道) cmake:下的最新版本 前言:为什么非得要用cmake编译呢?跳过cmake不好吗? 之前用的opencv…

PS里面怎么提取图上要的颜色然后用到另一个部位去

PS里面要提取图上要的颜色然后用到另一个部位去,具体步骤如下: 在ps里打开特定的图像文件; 想要提取图上的哪个颜色,就使用”吸管工具“在图上特定的位置上点击一下,就会看到前景色变成了相应的颜色; 然…

web网页端使用webSocket实现语音通话功能(SpringBoot+VUE)

写在前面 最近在写一个web项目,需要实现web客户端之间的语音通话,期望能够借助webSocket全双工通信的方式来实现,但是网上没有发现可以正确使用的代码。网上能找到的一个代码使用之后只能听到“嘀嘀嘀”的杂音 解决方案:使用Jso…

vue之router-link页面跳转及传参

文章目录 vue之router-link页面跳转及传参根据路由的路径跳转及传参(query)根据路由的名称跳转及传参(params)根据store传参 vue之router-link页面跳转及传参 <router-link> 是用于在 Vue.js 应用程序中进行路由导航的组件。它可以用来生成具有正确链接的<a> 标签…

我的应用我做主:扩展线程池

自定义线程创建&#xff1a;ThreadFactory 线程池中的线程是从哪里来的呢&#xff1f; ThreadPoolExecutor(int corePoolSize,//指定了线程池种的线程数量 int maximumPoolSize,//指定了线程池中的最大线程数量。 long keepAliveTime,// 当线程池数量超过了corePoolSize&#x…

【电路笔记】-串联电容器

串联电容器 文章目录 串联电容器1、概述2、示例13、示例34、总结 当电容器以菊花链方式连接在一条线上时&#xff0c;它们就串联在一起。 1、概述 对于串联电容器&#xff0c;流过电容器的充电电流 ( i C i_C iC​ ) 对于所有电容器来说都是相同的&#xff0c;因为它只有一条…

在x64上构建智能家居(home assistant)(二)(新版Debain12)连接Postgresql数据库

新版数据库安装基本和旧版相同,大部分可以参考旧版本在x64上构建智能家居(home assistant)&#xff08;二&#xff09;连接Postgresql数据库_homeassist 数据库-CSDN博客 新版本的home assistant系统安装,我在原来写的手顺上直接修改了,需要的可以查看在x64上构建智能家居(home…

心有暖阳,笃定前行,2024考研加油

2024考研学子&#xff0c;所有的付出终有收获&#xff0c;阳光终将穿透阴霾&#xff0c;终将上岸。 当曙光破晓的时候&#xff0c;你可曾记得那些星月为伴&#xff0c;孤独为友&#xff0c;理想为灯来指引前行之路的日子&#xff0c;那些默默扎根的日子终将化作星星在未来闪闪发…