个人认为,数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。
推荐书本《数据分析思维——分析方法和业务知识》,本文内容就是提取这本书的主体思维,以提高自身的数据分析素养。
先来点鸡汤:学会把书读薄,就要学会总结,撰写学习博客的过程就是加深印象的过程,也是持续提高自身素质的有效方法。冲冲冲!
一、如何理解数据
第一步,当我们拿到一个数据集(通常是Excel数据),我们首先要弄清楚数据每一列的含义,不懂时要及时与数据提供方沟通。
第二步,进行数据分类。
数据分类
数据通常分为3类:
1、用户数据:
用户数据指用户的基本情况,包括姓名、性别、年龄、家庭地址、职业等。
2、行为数据:
行为数据是记录用户做了什么的数据。比如,用户在某网页的停留时间、浏览过哪些产品、购买了什么产品、转发量、收藏数等。
3、产品数据:
描述产品的数据(像废话hhh)。比如,产品名称、产品价格、视频、评论、标题、阅读量、发表日期等。
注:从不同角度来看,数据可能属于多个不同类别。比如收藏量,用户收藏,则收藏量定义为行为数据,被用户收藏,则定义为产品数据。数据分类不是绝对,要根据业务来灵活定义。
二、常用指标
什么是指标?引用现代管理学之父的一句名言来定义指标:“如果你不能衡量,那么你就不能有效增长。”(用管理促进企业增长)
如何衡量指标?就是用某个统一标准去衡量业务。
2.1 用户数据指标
用户可以分三类:新增用户、活跃用户(不活跃用户)、留存用户(流失用户)。
我们需要选择合适的指标来衡量用户留存、活跃等情况。
用户数据相关指标有:
- 新增用户——日新增用户数
- 活跃用户——活跃率
- 留存用户——留存率
下面围绕上述3个指标深入讲解:
1、日新增用户数:
日新增用户数——就是产品每日新增的用户的多少。
为什么要关注新增用户?
答:首先,一个产品如果没有用户增长,用户数量就会逐渐减少,产品经营惨淡。其次,新增用户可以反应某推广渠道下产品的推广效果,用于选择和优化产品推广策略。
2、活跃率
怎么定义活跃?不同产品定义不一样,可以用户登录了app,也可以是打开了某个功能,视情况而定。
要计算活跃率,就首先要计算活跃用户数。活跃用户数按时间主要分为以下三种:
- 日活跃用户数:一天内活跃的用户数。比如,一天内登录过app的用户人数。
- 周活跃用户数:一周内至少活跃一次的用户数。比如,一周内打开某app的人数。
- 月活跃用户数:一个月内至少活跃一次的用户数。
统计活跃用户数时要去除重复数据。比如,某一天活跃一次,一个月就活跃30次,那么月活跃用户数是 30 ? 显然不对,同一个人月内活跃多次,也是一个人,月活跃人数是1。
活跃率——即活跃用户占总用户的比值。分为日活跃率、周活跃率、月活跃率等。出现低活跃率往往说明产品存在较大问题,需要想办法提升活跃率。
3、留存率
什么是留存?就是指推广渠道吸引来的新用户经过一段时间后有部分用户逐渐流失,留存下来的用户就是留存用户。比如,某一天新增了一批粉丝关注,一段时间后部分粉丝取关(流失)了,仍旧关注的就是留存用户。
留存率是用来评估产品(功能)对用户的黏性。留存率低,用户流失严重,用想办法提高。
留存率按照时间可以分为次日留存率、第3日留存率、第七日留存率、第30日留存率等。
留存率的40-20-10法则。即次日、第七日、第30日留存率分别为40%、20%和10%时,说明产品数据表现是较好的。
2.2 行为数据指标
行为数据指标包括:PV(访问次数)、UV(访问人数)、转发率、转化率、K因子。
1、PV和UV
PV(Page View):指一定时间内某个页面的浏览次数。比如,某网页一天被打开10次,则PV=10
UV(Unique Visitor):指一定时间内访问某个页面的人数。比如,某用户一天访问10次某网页,但是同一个人,所以 UV=1 ,而不是 UV=10
注:业务不同定义就不同,本质上还是PV和UV。通过 PV 或 UV 可以推断用户喜欢或不喜欢哪个功能或产品,根据用户行为来优化产品(功能)。
2、转发率
许多产品往往通过转发功能实现 “病毒式” 推广。转发率=转发某产品(功能)的用户数 / 看到该产品(功能)的用户数。比如,推送一篇文章给10万用户,转发人数1万,则 转发率 = 1/10 = 10%
3、转化率
转化率的计算方法与特定业务场景有关。
这里的到店人数、看到广告人数实质上就是UV。
4、K因子
K-因子用来衡量推荐效果,即一个发起推荐的用户可以带来多少新用户。
K因子 = 平均每个用户向多少人发起邀请 * 接收到邀请的人转化为新用户的转化率
举个例子:假设平均每个用户向20人发出邀请,而平均转化率为10%,则K因子=20*10%=2。当 K>1 时,新增用户会滚雪球式的增大。k<1时,那么新增用户增加到一定规模时就会停止自传播增长。
2.3 产品数据指标
产品数据指标主要包括:
- 衡量业务总量的指标——如成交额、成交数量等。
- 衡量人均情况的指标——如客单价。
- 衡量付费情况的指标——如付费率、复购率等。
- 与产品相关的指标
1、业务总量
分析报告中常常会看到GMV(Gross Merchandise Volume),即成交总额,也是零售业所说的“流水”。特别注意的,成交总额包括销售额、取消订单金额、拒收订单金额和退货订单金额。
成交数量就是下单的产品数量。
访问时长指用户使用app或网站的总时长。
2、人均情况
衡量人均情况的指标有:人均付费(Average Revenue Per User,ARPU)、付费用户人均付费(Average Revenue Per Paying User,ARPPU)、人均访问时长。其中,人均付费在电商领域也叫客单价。
3、付费情况
主要包括付费率、复购率。
4、产品
产品相关指标指从产品角度去衡量哪些产品好与不会。找出好产品重点推销,不好的产品分析原因。根据业务需求,产品常见指标包括但不限于热销产品数(Top N)、好评产品数、差评产品数等。
2.4 推广付费指标(特定场景用到)
我们在付费推广产品时,需要特定指标来衡量推广效果。主要有以下指标:
1、展示位广告
展示位广告出现在网站或app的顶部或开屏等最显眼的地方。比如,打开某个app时出现的几秒广告。展示位广告——含义是多少人看了该广告,通常按展示次数付费(CPM,Cost Per Mille)。
2、搜索广告
广告主为某一广告关键词出价,按照价格高低排名,出现在用户的搜索结果中。搜索广告——含义是多少人点击了该广告,通常按照点击次数付费(CPC,Cost Per Click)。
3、信息流广告
信息流广告是根据用户兴趣爱好来推荐的。通常按照CPC或者根据投放的实际效果(CPA,Cost Per Action)来付费。
投放的实际效果(CPA)包括:
- CPD(Download):按照app下载数付费。
- CPI(Install):按照下载并且安装app的数量(人数)付费。
- CPS(Sale):按照完成购买的用户数或者销售额付费。
举个生活中的例子:比如,你打开某app时出现的几秒广告,展示的广告按照CPM付费;如果你对广告感兴趣,点击了广告,叫按照CPC付费;如果你点进去并且下了单购买产品(根据情况,可能是下载或按照app),叫按照CPA付费。广告主可以根据需求灵活选择付费标准。
一般来讲,如果推广一个新的产品(可能是app),要选择CPD付费。因为新产品几乎没什么知名度,按照下载数量来衡量更划算。等产品有了一定知名度,再选择CPC或者CPA付费更划算。
三、如何选择指标
这么多指标,如何选择?主要考虑两点:
1、好的数据指标应该是比例。通常情况下,单凭一个总数指标是看不出产品或业务有没有出现什么问题,因此,我们想办法将其转化为某种比例,用比例作为指标更有优势。
举个例子:比如,若告诉你我的活跃粉丝有10万,其实看不出来什么问题,也不知道是多还是少;假如我再告诉你我的总粉丝有1000万,我们可以计算出活跃率为1%,根据活跃率就可以看出来问题所在了(活跃用户比例过低)。
2、根据当前的业务重点,找到“北极星”指标(指引业务方向的核心指标)
“北极星”指标没有唯一的标准,不同公司关注的业务重点不一样,同一个公司在不同阶段的业务重点也不一样。
举个例子:在 Facebook 成立之前,最大社交网站是 myspace,myspace 被 Facebook 打败的原因之一在于,myspace 将“注册用户数”作为其核心指标,而 Facebook 成立之初就将“月活跃用户数”作为其核心指标。
四、指标体系和报表
一个优秀数据分析师要求会“构建指标体系”,也是一项基本技能。
4.1 什么是指标体系
在实际工作和生活中,讲清楚一件事情是不容易的。比如,我们可能听到“大概有1w多人申请贷款吧”、“很多人没有申请通过”、“我们的审核是不是太严格了”等对话。同事之间闲聊是没什么问题,但是向老板汇报或者自己回答业务上的问题时就不能这么说了,1w人是多是少,和什么对比,什么叫“很多人”,究竟是多少,为什么说审核严格。
因此我们需要详细数据和指标来描述问题。比如,今天新增的申请贷款用户为1.1万人,超目标达成1000人,其中申请通过的人数为1100人,申请通过率为10%。
在实际工作中,一个指标往往没有办法解决复杂的业务问题,就需要使用多个指标,从不同维度来评估业务,也就是使用指标体系。简单来讲,指标体系 = 指标 + 体系(业务联系)。一个指标不能叫指标体系,几个毫无关系的指标也不能叫指标体系。
4.2 指标体系有什么用
引入一个例子,判断一个人是否健康,我们可能会涉及体温、血压、体脂率等名词。综合这些来考量,就能确定一个人是否健康,若指标体系的某一指标出现异常,说明可能出现健康问题。判断业务是否健康时也一样。
指标体系的主要作用有以下3点:
- 监控业务情况(监控业务)
- 通过拆解指标寻找当前业务问题(排查问题)
- 评估业务可以改进的地方,找出下一步工作的方向(提供方向)
4.3 如何构建指标体系
关键绩效指标(Key Performance Indicator,简称KPI)
可以按照图中的方法建立指标体系:
(1)明确部门 KPI,找到一级指标
一级指标是用来评价公司或部门情况最核心的指标。比如,某旅游公司在会员积分开销较大,业务部门关心成本,希望合理利用积分抵扣金额,所以定 KPI 为积分抵扣金额,也即一级指标。
一级指标并非只能为一个指标,可能需要多个指标综合评价业务(即多个KPI)。比如,某公司希望产品新增更多用户数,并且希望他们都很活跃,这时公司的 KPI 就有为新增用户数、活跃率两个。
(2)了解业务运营情况,找到二级指标。(细分一级指标)
得到一级指标后,我们需要拆解一级指标为二级指标。如何拆解?根据具体业务。比如,从会员角度拆解,积分抵扣金额 = 积分抵扣会员数 * 人均抵扣金额。二级指标就是积分抵扣会员数、人均抵扣金额。
(3)梳理业务流程,找到三级指标。
一级指标往往是业务的最后一个结果,比如积分抵扣金额。细分一级指标为二级指标后,二级指标可能也不足以监督、改进业务流程,就需要继续拆解为三级指标。
继续上面的例子,有业务流程(会员→购买业务产品→使用积分抵扣金额→支付金额),我们可能需要监测不同等级会员的情况,以便及时发现问题或优化针对性策略。这时候我们就将二级指标继续细分为三级指标,积分抵扣会员数 =(抵扣积分的Lv.1会员数 + 抵扣积分的Lv.2会员数......),而人均抵扣金额 = sum(各个Lv等级的人均抵扣金额)。
复杂来说,形成的指标体系金字塔可以为:
(4)通过报表监控指标,不断更新指标
(可视化)报表就是通过表格、图表来展示指标,从而帮助部门掌握业务情况。日报——每天汇总更新的报表,周报——每周汇总更新的报表。必要时可以制作动态报表。
4.4 如何制作报表
1、需求分析
制作报表的目的是什么?希望从报表上知道什么问题?
2、建立指标体系
什么样的指标体系能满足业务需求?
3、设计展现形式
如何展示数据,以便业务部门更容易理解数据?比如给报表增加筛选器等。
4、编写需求文档
将上述指标体系和报表需求整理成一份需求文档,发给开发部门。
5、验证数据
报表开发出来并验证数据没有问题后,就可以告知业务部门了。
五、注意事项
注意避免以下几种情况:
1、没有一级指标,抓不住重点。
你获得了离职同事交接过来的报表,或者时领导给你的指标,而你只是负责更新报表。你要知道为什么要这样做报表,就必须知道一级指标,如果不是根据一级指标做事,会闹笑话的。我们要依葫芦画瓢。
2、指标之间没有逻辑关系。
你的报表指标虽多,但是指标之间没有逻辑联系。出现问题时候,就会找不到对应业务节点,没法解决问题。
3、拆解的指标没有意义。
要注意围绕业务目标拆解指标。有的报表指标很丰富,但是没有实际业务意义,报表就变成没用数字堆积成的“废表”。
4、自己独自一人完成指标体系和报表,没有和业务部门沟通。
零沟通是大忌!没有沟通制作出来的东西毛病多多,浪费时间精力,还不能有效解决业务问题。各部门之间是紧密协作的!
# 文章若对大噶有帮助的话,点个赞支持一下呗。我想知道自己写得有多烂 hhhhhhh