目录
- 背景:
- 数据说明:
- 任务描述
- 数据分析
- 1. 流量分析
- 2.漏斗分析
背景:
本次可视化分析的目的是针对脱敏过的用户行为数据(包括浏览、收藏、加购和购买4类数据)进行分析,使用Python、Numpy、Pandas和Matplotlib工具完成可视化分析,帮助选手更好的理解数据,并作出商业洞察。
数据说明:
本次分析数据提供了1万用户量级的完整行为数据:user_action.csv,为了简化问题相比原数据集,我们去掉了user_geohash这个大部分情况为空的字段。
字段 | 字段说明 | 提取说明 |
---|---|---|
user_id | 用户标识 | 抽样&字段脱敏 |
item_id | 商品标识 | 字段脱敏 |
behavior_type | 用户对商品的行为类型 | 包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4。 |
item_category | 商品分类标识 | 字段脱敏 |
time | 行为时间 | 精确到小时级别 |
任务描述
通过数据分析和可视化展示,充分挖掘数据的价值,让数据更好地为业务服务:
- 流量分析:PV/UV是多少,通过分析PV/UV能发现什么规律?
- 漏斗分析:用户“浏览-收藏-加购-购买”的转化率是怎样的?哪一步的折损比例最大?
- 用户价值分析:对电商平台什么样的用户是有价值的?如果你作为商家,要重点关注哪部分用户?
- 更多有意义的问题欢迎大家发挥聪明才智来挖掘。
数据分析
1. 流量分析
- 访问量(PV):基于用户每次对淘宝页面的刷新次数,用户每刷新一次页面或者打开新的页面就记录就算一次访问。
- 独立访问量(UV):一个用户若多次访问淘宝只记录一次,熟悉SQL的小伙伴会知道,本质上是unique操作。