数据分析思维(一):业务指标(数据分析并非只是简单三板斧)

个人认为,数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。

推荐书本《数据分析思维——分析方法和业务知识》,本文内容就是提取这本书的主体思维,以提高自身的数据分析素养。

先来点鸡汤:学会把书读薄,就要学会总结,撰写学习博客的过程就是加深印象的过程,也是持续提高自身素质的有效方法。冲冲冲!


一、如何理解数据

第一步,当我们拿到一个数据集(通常是Excel数据),我们首先要弄清楚数据每一列的含义,不懂时要及时与数据提供方沟通。

第二步,进行数据分类。

数据分类

数据通常分为3类:

1、用户数据:

用户数据指用户的基本情况,包括姓名、性别、年龄、家庭地址、职业等。

2、行为数据:

行为数据是记录用户做了什么的数据。比如,用户在某网页的停留时间、浏览过哪些产品、购买了什么产品、转发量、收藏数等。

3、产品数据

描述产品的数据(像废话hhh)。比如,产品名称、产品价格、视频、评论、标题、阅读量、发表日期等。

注:从不同角度来看,数据可能属于多个不同类别。比如收藏量,用户收藏,则收藏量定义为行为数据,被用户收藏,则定义为产品数据。数据分类不是绝对,要根据业务来灵活定义。

二、常用指标

什么是指标?引用现代管理学之父的一句名言来定义指标:“如果你不能衡量,那么你就不能有效增长。”(用管理促进企业增长)

如何衡量指标?就是用某个统一标准去衡量业务。

2.1 用户数据指标

用户可以分三类:新增用户、活跃用户(不活跃用户)、留存用户(流失用户)。

我们需要选择合适的指标来衡量用户留存、活跃等情况。

用户数据相关指标有:

  • 新增用户——日新增用户数
  • 活跃用户——活跃率
  • 留存用户——留存率

下面围绕上述3个指标深入讲解:

1、日新增用户数:

日新增用户数——就是产品每日新增的用户的多少。

为什么要关注新增用户?

答:首先,一个产品如果没有用户增长,用户数量就会逐渐减少,产品经营惨淡。其次,新增用户可以反应某推广渠道下产品的推广效果,用于选择和优化产品推广策略。

2、活跃率

怎么定义活跃?不同产品定义不一样,可以用户登录了app,也可以是打开了某个功能,视情况而定。

要计算活跃率,就首先要计算活跃用户数。活跃用户数按时间主要分为以下三种:

  • 日活跃用户数:一天内活跃的用户数。比如,一天内登录过app的用户人数。
  • 周活跃用户数:一周内至少活跃一次的用户数。比如,一周内打开某app的人数。
  • 月活跃用户数:一个月内至少活跃一次的用户数。

统计活跃用户数时要去除重复数据。比如,某一天活跃一次,一个月就活跃30次,那么月活跃用户数是 30 ? 显然不对,同一个人月内活跃多次,也是一个人,月活跃人数是1。

活跃率——即活跃用户占总用户的比值。分为日活跃率、周活跃率、月活跃率等。出现低活跃率往往说明产品存在较大问题,需要想办法提升活跃率。

3、留存率

什么是留存?就是指推广渠道吸引来的新用户经过一段时间后有部分用户逐渐流失,留存下来的用户就是留存用户。比如,某一天新增了一批粉丝关注,一段时间后部分粉丝取关(流失)了,仍旧关注的就是留存用户。

留存率是用来评估产品(功能)对用户的黏性。留存率低,用户流失严重,用想办法提高。

留存率按照时间可以分为次日留存率、第3日留存率、第七日留存率、第30日留存率等。

留存率的40-20-10法则。即次日、第七日、第30日留存率分别为40%、20%和10%时,说明产品数据表现是较好的。

2.2 行为数据指标

行为数据指标包括:PV(访问次数)、UV(访问人数)、转发率、转化率、K因子。

1、PV和UV

PV(Page View):指一定时间内某个页面的浏览次数。比如,某网页一天被打开10次,则PV=10

UV(Unique Visitor):指一定时间内访问某个页面的人数。比如,某用户一天访问10次某网页,但是同一个人,所以 UV=1 ,而不是 UV=10

注:业务不同定义就不同,本质上还是PV和UV。通过 PV 或 UV 可以推断用户喜欢或不喜欢哪个功能或产品,根据用户行为来优化产品(功能)。

2、转发率

许多产品往往通过转发功能实现 “病毒式” 推广。转发率=转发某产品(功能)的用户数 / 看到该产品(功能)的用户数。比如,推送一篇文章给10万用户,转发人数1万,则 转发率 = 1/10 = 10%

3、转化率

转化率的计算方法与特定业务场景有关。

这里的到店人数、看到广告人数实质上就是UV。

4、K因子

K-因子用来衡量推荐效果,即一个发起推荐的用户可以带来多少新用户。

K因子 = 平均每个用户向多少人发起邀请 * 接收到邀请的人转化为新用户的转化率

举个例子:假设平均每个用户向20人发出邀请,而平均转化率为10%,则K因子=20*10%=2。当 K>1 时,新增用户会滚雪球式的增大。k<1时,那么新增用户增加到一定规模时就会停止自传播增长。

2.3 产品数据指标

产品数据指标主要包括:

  • 衡量业务总量的指标——如成交额、成交数量等。
  • 衡量人均情况的指标——如客单价。
  • 衡量付费情况的指标——如付费率、复购率等。
  • 与产品相关的指标

1、业务总量

 分析报告中常常会看到GMV(Gross Merchandise Volume),即成交总额,也是零售业所说的“流水”。特别注意的,成交总额包括销售额、取消订单金额、拒收订单金额和退货订单金额。

 成交数量就是下单的产品数量。

访问时长指用户使用app或网站的总时长。

2、人均情况

衡量人均情况的指标有:人均付费(Average Revenue Per User,ARPU)、付费用户人均付费(Average Revenue Per Paying User,ARPPU)、人均访问时长。其中,人均付费在电商领域也叫客单价。

3、付费情况

主要包括付费率、复购率。

4、产品

产品相关指标指从产品角度去衡量哪些产品好与不会。找出好产品重点推销,不好的产品分析原因。根据业务需求,产品常见指标包括但不限于热销产品数(Top N)、好评产品数、差评产品数等。

2.4 推广付费指标(特定场景用到)

我们在付费推广产品时,需要特定指标来衡量推广效果。主要有以下指标:

1、展示位广告

展示位广告出现在网站或app的顶部或开屏等最显眼的地方。比如,打开某个app时出现的几秒广告。展示位广告——含义是多少人看了该广告,通常按展示次数付费(CPM,Cost Per Mille)。

2、搜索广告

广告主为某一广告关键词出价,按照价格高低排名,出现在用户的搜索结果中。搜索广告——含义是多少人点击了该广告,通常按照点击次数付费(CPC,Cost Per Click)。

3、信息流广告

信息流广告是根据用户兴趣爱好来推荐的。通常按照CPC或者根据投放的实际效果(CPA,Cost Per Action)来付费。

投放的实际效果(CPA)包括:

  • CPD(Download):按照app下载数付费。
  • CPI(Install):按照下载并且安装app的数量(人数)付费。
  • CPS(Sale):按照完成购买的用户数或者销售额付费。

举个生活中的例子:比如,你打开某app时出现的几秒广告,展示的广告按照CPM付费;如果你对广告感兴趣,点击了广告,叫按照CPC付费;如果你点进去并且下了单购买产品(根据情况,可能是下载或按照app),叫按照CPA付费。广告主可以根据需求灵活选择付费标准。

一般来讲,如果推广一个新的产品(可能是app),要选择CPD付费。因为新产品几乎没什么知名度,按照下载数量来衡量更划算。等产品有了一定知名度,再选择CPC或者CPA付费更划算。

三、如何选择指标

这么多指标,如何选择?主要考虑两点:

1、好的数据指标应该是比例。通常情况下,单凭一个总数指标是看不出产品或业务有没有出现什么问题,因此,我们想办法将其转化为某种比例,用比例作为指标更有优势。

举个例子:比如,若告诉你我的活跃粉丝有10万,其实看不出来什么问题,也不知道是多还是少;假如我再告诉你我的总粉丝有1000万,我们可以计算出活跃率为1%,根据活跃率就可以看出来问题所在了(活跃用户比例过低)。

2、根据当前的业务重点,找到“北极星”指标(指引业务方向的核心指标)

“北极星”指标没有唯一的标准,不同公司关注的业务重点不一样,同一个公司在不同阶段的业务重点也不一样。

举个例子:在 Facebook 成立之前,最大社交网站是 myspace,myspace 被 Facebook 打败的原因之一在于,myspace 将“注册用户数”作为其核心指标,而 Facebook 成立之初就将“月活跃用户数”作为其核心指标。

四、指标体系和报表

一个优秀数据分析师要求会“构建指标体系”,也是一项基本技能。

4.1 什么是指标体系

在实际工作和生活中,讲清楚一件事情是不容易的。比如,我们可能听到“大概有1w多人申请贷款吧”、“很多人没有申请通过”、“我们的审核是不是太严格了”等对话。同事之间闲聊是没什么问题,但是向老板汇报或者自己回答业务上的问题时就不能这么说了,1w人是多是少,和什么对比,什么叫“很多人”,究竟是多少,为什么说审核严格。

因此我们需要详细数据和指标来描述问题。比如,今天新增的申请贷款用户为1.1万人,超目标达成1000人,其中申请通过的人数为1100人,申请通过率为10%。

在实际工作中,一个指标往往没有办法解决复杂的业务问题,就需要使用多个指标,从不同维度来评估业务,也就是使用指标体系。简单来讲,指标体系 = 指标 + 体系(业务联系)。一个指标不能叫指标体系,几个毫无关系的指标也不能叫指标体系。

4.2 指标体系有什么用

引入一个例子,判断一个人是否健康,我们可能会涉及体温、血压、体脂率等名词。综合这些来考量,就能确定一个人是否健康,若指标体系的某一指标出现异常,说明可能出现健康问题。判断业务是否健康时也一样。

指标体系的主要作用有以下3点:

  • 监控业务情况(监控业务)
  • 通过拆解指标寻找当前业务问题(排查问题)
  • 评估业务可以改进的地方,找出下一步工作的方向(提供方向)

4.3 如何构建指标体系

关键绩效指标(Key Performance Indicator,简称KPI)

可以按照图中的方法建立指标体系:

(1)明确部门 KPI,找到一级指标

一级指标是用来评价公司或部门情况最核心的指标。比如,某旅游公司在会员积分开销较大,业务部门关心成本,希望合理利用积分抵扣金额,所以定 KPI 为积分抵扣金额,也即一级指标。

一级指标并非只能为一个指标,可能需要多个指标综合评价业务(即多个KPI)。比如,某公司希望产品新增更多用户数,并且希望他们都很活跃,这时公司的 KPI 就有为新增用户数、活跃率两个。

(2)了解业务运营情况,找到二级指标。(细分一级指标)

得到一级指标后,我们需要拆解一级指标为二级指标。如何拆解?根据具体业务。比如,从会员角度拆解,积分抵扣金额 = 积分抵扣会员数 * 人均抵扣金额。二级指标就是积分抵扣会员数、人均抵扣金额。

(3)梳理业务流程,找到三级指标。

一级指标往往是业务的最后一个结果,比如积分抵扣金额。细分一级指标为二级指标后,二级指标可能也不足以监督、改进业务流程,就需要继续拆解为三级指标。

继续上面的例子,有业务流程(会员→购买业务产品→使用积分抵扣金额→支付金额),我们可能需要监测不同等级会员的情况,以便及时发现问题或优化针对性策略。这时候我们就将二级指标继续细分为三级指标,积分抵扣会员数 =(抵扣积分的Lv.1会员数 + 抵扣积分的Lv.2会员数......),而人均抵扣金额 = sum(各个Lv等级的人均抵扣金额)。

复杂来说,形成的指标体系金字塔可以为:

 (4)通过报表监控指标,不断更新指标

(可视化)报表就是通过表格、图表来展示指标,从而帮助部门掌握业务情况。日报——每天汇总更新的报表,周报——每周汇总更新的报表。必要时可以制作动态报表。

4.4 如何制作报表

1、需求分析

制作报表的目的是什么?希望从报表上知道什么问题?

2、建立指标体系

什么样的指标体系能满足业务需求?

3、设计展现形式

如何展示数据,以便业务部门更容易理解数据?比如给报表增加筛选器等。

4、编写需求文档

将上述指标体系和报表需求整理成一份需求文档,发给开发部门。

5、验证数据

报表开发出来并验证数据没有问题后,就可以告知业务部门了。

五、注意事项

注意避免以下几种情况:

1、没有一级指标,抓不住重点。

你获得了离职同事交接过来的报表,或者时领导给你的指标,而你只是负责更新报表。你要知道为什么要这样做报表,就必须知道一级指标,如果不是根据一级指标做事,会闹笑话的。我们要依葫芦画瓢。

2、指标之间没有逻辑关系。

你的报表指标虽多,但是指标之间没有逻辑联系。出现问题时候,就会找不到对应业务节点,没法解决问题。

3、拆解的指标没有意义。

要注意围绕业务目标拆解指标。有的报表指标很丰富,但是没有实际业务意义,报表就变成没用数字堆积成的“废表”。

4、自己独自一人完成指标体系和报表,没有和业务部门沟通。

零沟通是大忌!没有沟通制作出来的东西毛病多多,浪费时间精力,还不能有效解决业务问题。各部门之间是紧密协作的!

# 文章若对大噶有帮助的话,点个赞支持一下呗。我想知道自己写得有多烂 hhhhhhh

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/936747.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

matlab测试ADC动态性能的原理

目录 摘要&#xff1a; 简介&#xff1a; 动态规范和定义 动态规格&#xff1a; 双面到单边的功率谱转换 摘要&#xff1a; 模数转换器&#xff08;adc&#xff09;代表了接收器、测试设备和其他电子设备中的模拟世界和数字世界之间的联系。正如本文系列的第1部分中所概述…

5G中的ATG Band

Air to Ground Networks for NR是R18 NR引入的。ATG很多部分和NTN类似中的内容类似。比较明显不同的是&#xff0c;NTN的RF内容有TS 38.101-5单独去讲&#xff0c;而ATG则会和地面网络共用某些band&#xff0c;这部分在38.101-1中有描述。 所以会存在ATG与地面网络之间的相邻信…

vue组件开发:构建响应式快捷导航

前言 快捷导航不仅能够显著提升系统的灵活性和用户交互性&#xff0c;还极大地增强了用户的操作体验。本文将展示如何在 vue 中实现一个既可自定义又具备响应式特性的快捷导航菜单。 一、实现思路 列表页 结构设计 定义页面结构&#xff0c;包含一个导航卡片和一个对话框组件&a…

事务管理与锁机制

title: 事务管理与锁机制 date: 2024/12/14 updated: 2024/12/14 author: cmdragon excerpt: 在数据库系统中,事务管理至关重要,它确保多个数据库操作能够作为一个单一的逻辑单元来执行,从而维护数据的一致性和完整性。一个良好的事务管理系统能够解决并发操作带来的问题…

《操作系统 - 清华大学》7 -1:全局页面置换算法:局部页替换算法的问题、工作集模型

文章目录 1. 局部页替换算法的问题2. 全局置换算法的工作原理3. 工作集模式3.1 工作集3.2 工作集的变化 4 常驻集 1. 局部页替换算法的问题 局部页面置换算法 OPT&#xff0c;FIFO&#xff0c;LRU&#xff0c;Clock 等等&#xff0c;这些算法都是针对一个正在运行的程序来讲的…

力扣-图论-12【算法学习day.62】

前言 ###我做这类文章一个重要的目的还是给正在学习的大家提供方向和记录学习过程&#xff08;例如想要掌握基础用法&#xff0c;该刷哪些题&#xff1f;&#xff09;我的解析也不会做的非常详细&#xff0c;只会提供思路和一些关键点&#xff0c;力扣上的大佬们的题解质量是非…

每日十题八股-2024年12月14日

1.类加载器有哪些&#xff1f; 2.双亲委派模型的作用 3.讲一下类加载过程&#xff1f; 4.讲一下类的加载和双亲委派原则 5.什么是Java里的垃圾回收&#xff1f;如何触发垃圾回收&#xff1f; 6.判断垃圾的方法有哪些&#xff1f; 7.垃圾回收算法是什么&#xff0c;是为了解决了…

智能引导小车充电系统设计(论文+源码)

1总体方案设计 在16*16点阵LED字符显示器的设计中&#xff0c;系统总体框架如图2.4所示&#xff0c;包括单片机主控模复位电路模块、晶振电路模块、按键电路模块、LED点阵驱动电路模块&#xff0c;蓝牙模块等构成。系统功能实现主要是利用系统在软件程序编写过程中&#xff0c…

【Vue】自定义指令、插槽

目录 自定义指令 是什么 作用 使用方法 定义 使用 自定义指令配合绑定数据 语法 自定义指令的简写 语法 使用时机 插槽 什么是插槽 默认&#xff08;匿名&#xff09;插槽 ​编辑插槽的默认值 具名插槽 使用方法 简写 使用示例 作用域插槽 自定义指令 是什…

顺序队列的实现及其应用

一、概念 队列是允许在两端&#xff08;队头、队尾&#xff09;进行插入和读出操作的线性表 默认情况下&#xff0c;队尾插入&#xff0c;队头读出&#xff08;这一点和排队很像&#xff09;&#xff0c;先进先出FIFO 队中没有元素时称为空队 当队列两端都允许插入、读出时&…

Web安全深度剖析

1.Web安全简介 ​ 攻击者想要对计算机进行渗透&#xff0c;有一个条件是必须的&#xff0c;就是攻击者的计算机与服务器必须能够正常通信&#xff0c;服务器与客户端进行通信依靠的就是端口。 ​ 如今的web应该称之为web应用程序&#xff0c;功能强大&#xff0c;离不开四个要…

C# 探险之旅:第九节 - 循环(for):无限循环的魔法轮盘!

嘿&#xff0c;勇敢的探险家们&#xff0c;欢迎回到C#的神秘世界&#xff01;在这一节里&#xff0c;我们将踏上一场关于循环的奇妙冒险&#xff0c;特别是那个能带我们无限次探险的“for循环”&#xff01;准备好了吗&#xff1f;让我们一起揭开for循环的神秘面纱&#xff0c;…

解决Logitech G hub 无法进入一直转圈的方案(2024.12)

如果你不是最新版本无法加载尝试以下方案&#xff1a;删除AppData 文件夹下的logihub文件夹 具体路径&#xff1a;用户名根据实际你的请情况修改 C:\Users\Administrator\AppData\Local 如果你有通过lua编译脚本&#xff0c;记得备份&#xff01;&#xff01; ↓如果你是最新…

如何使用 Docker Compose 创建 LAMP 环境 ?

现如今&#xff0c;通过 Docker 容器化部署环境已经逐渐成为主流&#xff0c;特别是在部署像 LAMP (Linux、Apache、MySQL、PHP) 这样的复杂环境时。本教程旨在带您完成使用 Docker-Compose 建立 LAMP 环境的整个过程&#xff0c;同时还包括定制 PHP 环境的步骤&#xff0c;安装…

12.1【JAVA EXP4】next项目

next项目构建问题 详解一下这个页面 什么是Node选项&#xff1f; Node选项是指在运行Node.js应用程序时可以传递给Node.js进程的一系列命令行参数。这些选项可以让开发者控制Node.js的行为&#xff0c;例如设置内存限制、启用或禁用某些功能、指定调试端口等 --inspect 和 --i…

PyTorch3D 可视化

PyTorch3D是非常好用的3D工具库。但是PyTorch3D对于可用于debug&#xff08;例如调整cameras参数&#xff09;的可视化工具并没有进行系统的介绍。这篇文章主要是想介绍我觉得非常使用的PyTorch3D可视化工具。 1. 新建一个Mesh 从hugging face上下载一个glb文件&#xff0c;例…

内网穿透讲解

什么是内网穿透 内网穿透是一种网络技术&#xff0c;它允许外网或者其他局域网的用户来访问这个局域网的服务器资源&#xff0c;让资源的利用率更高&#xff0c;更加灵活&#xff0c;但是也要确保网络安全。 工作原理 如果你在公司&#xff0c;但是你需要使用到你家里的那台电…

Python中PyTorch详解

文章目录 Python中PyTorch详解一、引言二、PyTorch核心概念1、张量&#xff08;Tensor&#xff09;1.1、创建张量1.2、张量操作 2、自动求导&#xff08;Autograd&#xff09;2.1、自动求导示例 三、构建神经网络1、使用nn模块2、优化器&#xff08;Optimizer&#xff09; 四、…

Linux之网络配置

一、检查虚拟机和本机通不通 测试虚拟机和本机是否通不通 winR&#xff0c;运行本机cmd&#xff0c;输入ipconfig&#xff0c;拿到本机ip地址 在虚拟机上ping一下这个地址(ctrlshitv)可以把复制的文本粘贴进虚拟机。 可以看到&#xff0c;不通&#xff0c;解决方法在最后&am…

细说Flash存储芯片W25Q128FW和W25Q16BV

目录 一、Flash存储芯片W25Q128FW 1、W25Q128硬件接口和连接 2、存储空间划分 3、数据读写的原则 4、操作指令 &#xff08;1&#xff09;“写使能”指令 &#xff08;2&#xff09;“读数据”指令 &#xff08;3&#xff09;“写数据”指令 5、状态寄存器SR1 二、Fl…