数据分析常用6种分析思路(下)

作为一名数据分析师,你又没有发现,自己经常碰到一些棘手的问题就没有思路,甚至怀疑自己究竟有没有好好学过分析?

在上篇文章里,我们讲到了数据分析中的流程、分类、对比三大块,今天,我们继续讲剩下的3块内容。

4、关联

看数据指标不要只看一个“点”,还要看一条“线”上的前后连接的环节,进而从“面”或“体”的角度去看整个大环境中都有哪些因素相互作用。

对现象的分析可以参考简单的调节模型:

IMG_264

其中:X是自变量,Y是因变量,M是调节变量。

寻找关联关系时,不仅仅要找出对Y有直接影响的X(一个或者多个),还要找出影响X对Y作用的调节因素M。关联也可以分为同时关联和延时关联两类。

4.1同时关联

即多个因素(X)同时发生作用一起促成了现象(Y)的发生。

e.g. 电商网站销售的变化可能考虑的因素:

用户:用户结构是否发生变化,是否有新的注册渠道,新渠道导流进来的用户质量如何;

商品:品类结构是否有变化,e.g. 随着四季变化,服装类的种类也会发生变化;

产品:多少用户使用旧版本或者新版本,产品某个环节有没有改版,产品的策略(商品推荐策略等)是否有变化;

运营:前期的线上或者线下预热,商城的优惠力度,优惠涉及的人群等;

4.2延时关联

现象的产生可能存在延迟效应,要考虑当前现象(环节)的前置的“因”和后置的“果”。

e.g. 今天上线的营销方案可能在几天甚至几十天后才会有显著的效应,今天交易量上出现的波动也可能是因为一段时间前产品或者运营策略上有改动。

5、层级

要有结构化、系统化的思维,对影响因素自上而下的拆解和自下而上的组合。
IMG_265

5.1自上而下的拆解

可以理解为“分级钻取”,如同金字塔结构一样,先从总体看到二级分支,然后再看更细的分支。

e.g. 支付成功率的影响,可以对新老客、订单来源、支付方式、银行通道一层一层拆解,细化各个分支对整体变化的贡献率;
IMG_266

e.g. 销售额 = 下单人数*客单价 (a)

从登录到下单是层层转化后的,所以

下单人数 = 访客人数浏览转化率购物车转化率*支付转化率 (b)

公式(b)代入公式(a),得到:

销售额 = 访客人数浏览转化率购物车转化率支付转化率客单价

5.2自下而上的组合

就是将个体组成群体,将小的指标组合成一个综合指标。

e.g. 用户的标签分为基础标签和复合标签,基础标签就是单个用户属性来定义的(例如性别、婚否等),复合标签则是考虑多个基础标签的组合(例如,某个典型的用户群体画像是:女性+单身+白领+一线城市);

e.g. 规划用户标签时,先用头脑风暴想出一批指标,然后进行归类、筛选、组合;

e.g. 风控业务中累计坏账计提的计算,是将不同的逾期资金规定不同的风险计提比例,最后再把所有类别的风险计提资金汇总起来,作为公司所有贷出款项的风险计提资金,从而对公司贷款业务风险进行评估;

举个形象的例子,自上而下好比国家财政拨款,从中央到省会再到各市县区;自下而上则像是国家征税,就是从各市县区、各企业层层汇总,直到报送国库。

6、优化

分析的最终目标无非两种:寻找解决方案,寻找更好的解决方案。第一步是保证数据的准确性和稳定性,第二步就是优化,提高准确性、提高效率和效益。

优化包含两部分的内容:缩小当前和目标的差距,直到达成并超越目标;在成本或者预算固定的前提下,使收益最大化。

6.1缩小当前和目标的差距

e.g. 全公司各部门各业务线的同事们都在追逐和超越KPI的路上;

e.g. 机器学习建模时,尝试多种方案,调试各种参数,使模型的精确度逐渐提高。
IMG_267
6.2成本固定,最大化收益
IMG_268

e.g. 对于信用贷款产品而言,如果把“最安全”放在首位,那么极端的方式就是不给任何人发放贷款,这样就不会出现坏账了。正确的信贷模型思维是将坏账控制在业务上可以接受的范围内,并使利息覆盖坏账,进而最大化收益。

任何商业模式都是追逐利益的,首要目标是收益最大化,参考如下公式:

利润 = 收入 - 投入成本 - 风险损失

优化的过程就是寻找利润最大化的过程。

小结:

以上总结了常见的6种数据分析思路,涉及具体的业务场景还要结合业务特点适当变通。精通方法,深入业务,勤于实践,多加总结,最终就能踏上描述–>解释–>预测–>控制,步步高升的数据分析师精进之路。

文章来源:网络 版权归原作者所有

上文内容不用于商业目的,如涉及知识产权问题,请权利人联系小编,我们将立即处理

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/707117.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

为Nanopi m1交叉编译opencv

为Nanopi m1交叉编译opencv 一、下载交叉编译器 根据之前的博客进行 二、下载opencv和必要库 sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-devgit clone https://github.com/opencv/opencv.git cd opencv三、进行编…

计算机网络实验(15):基于Socket的网络编程(附JAVA源码.txt)

一、实验名称 UDP客户服务器即时通信程序 二、实验目的: 掌握基于SOCKET的网络编程方法。 基于JAVA语言,编写一个SOCKET的即时通信小程序 三、实验内容和要求 实验内容: 基于JAVA语言,编写一个SOCKET的即时通信小程序 实…

docker一些常用命令以及镜像构建完后部署到K8s上

docker一些常用命令以及镜像构建完后部署到K8s上 1.创建文件夹2.删除文件3.复制现有文件内容到新建文件4.打开某个文件5.查看文件列表6.解压文件(tar格式)7.解压镜像8.查看镜像9.删除镜像10.查看容器11.删除容器12.停止运行容器13.构建镜像14.启动容器15…

Mongodb在UPDATE操作中使用$push向数组中插入数据

学习mongodb,体会mongodb的每一个使用细节,欢迎阅读威赞的文章。这是威赞发布的第69篇mongodb技术文章,欢迎浏览本专栏威赞发布的其他文章。如果您认为我的文章对您有帮助或者解决您的问题,欢迎在文章下面点个赞,或者关…

无需破解,基于AI翻译的Poedit翻译小助手PoeditHelper

背景: 应用在做国际化的时候是一件比较让人头大的事情,需要进行多国语言互译,做国际化的方式有很多,现阶段比较常用的方式是gettext的形式,并输出一个.po文件来做国际化,与之配套的有一款半开源软件叫Poedi…

【PB案例学习笔记】-21小大写金额转换

写在前面 这是PB案例学习笔记系列文章的第21篇,该系列文章适合具有一定PB基础的读者。 通过一个个由浅入深的编程实战案例学习,提高编程技巧,以保证小伙伴们能应付公司的各种开发需求。 文章中设计到的源码,小凡都上传到了gite…

晶振的匹配电容的计算

晶振 等效电路 C0是晶振的静态电容 L1是晶振的等效电感 C1是晶振的等效电容 R1是晶振的等效串联电阻 芯片内部已有反相器和负载电阻 计算公式 参考1 参考2

Blender骨骼创建

骨骼系统 建立 使用Shift A添加骨骼或在添加|骨架中添加一段骨骼 骨骼的三种模式 -物体模式:做动画,摆人物pose时在该模式 -编辑模式:进行骨骼搭建(选择一段骨骼,然后按E挤出一段骨骼并进行调整) -姿…

matlab 任意二维图像转点云

目录 一、概述二、代码实现三、结果展示本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。 一、概述 给定任意一张图片,通过代码操作将图片转成点云。图像中包含大量可用信息,其中必不可少的信息为像素坐标和像素值,将像…

【乐吾乐2D可视化组态编辑器】导出HTML,下载离线部署包

乐吾乐2D可视化组态编辑器地址:https://2d.le5le.com/ 使用步骤 1. 从“文件”菜单导出HTML 导出为 HTML 需要一定的开发能力,后续不再维护,即将下线,推荐使用 下载离线部署包(html) 2. 解压 3. 下载后端…

Intellij IDEA开发Android项目打包生成APK

在 IntelliJ IDEA 左上方中选择 “Build” -> “Generate Signed Bundle / APK…”选择“APK”——“Next”——“Create New…”(Password随便填123456即可) “Next”——选择release(APK生成后默认存放在本项目的release文件夹里&#x…

Leetcode 力扣119. 杨辉三角 II (抖音号:708231408)

给定一个非负索引 rowIndex,返回「杨辉三角」的第 rowIndex 行。 在「杨辉三角」中,每个数是它左上方和右上方的数的和。 示例 1: 输入: rowIndex 3 输出: [1,3,3,1]示例 2: 输入: rowIndex 0 输出: [1]示例 3: 输入: rowIndex 1 输出: [1,1]提示…

Cisco Packet Tracer实验(二)

二、用交换机构建 LAN 构建物件如下: 四个PC 两个交换机 一个Multi Switch多功能拓展控制器 连线必须是这个直线!!!不是虚线 最后实现效果如下: 全部的线是绿的,就表示是通的。 尝试一下,看PC…

SpringBoot系列——使用Spring Cache和Redis实现查询数据缓存

文章目录 1. 前言2. 缓存2.1 什么是缓存2.2 使用缓存的好处2.3 缓存的成本2.4 使用Spring Cache和Redis的优点 3. Spring Cache基础知识3.1 Spring Cache的核心概念3.2 Spring Cache的注解3.2.1 SpEL表达式3.2.2 Cacheable3.2.3 CachePut3.2.4 CacheEvict 4. 实现查询数据缓存4…

量化交易入门——盘口

今天接着上一期讲解开盘定势的种类,在讲之前,科普一下“盘口五档”的成交知识。 每个炒股软件上,都会有某只个股的成交信息,在其中会出现一个五档的行情列表,里面列出了买家和卖家各五个价格及其对应的数量。这五档价…

深入浅出 Go 语言的 GPM 模型(Go1.21)

引言 在现代软件开发中,有效地利用并发是提高应用性能和响应速度的关键。随着多核处理器的普及,编程语言和框架如何高效、简便地支持并发编程,成为了软件工程师们评估和选择工具时的一个重要考量。在这方面,Go 语言凭借其创新的并…

基于51单片机的教室智能照明控制系统

一.硬件方案 本系统以51单片机作为控制模块的核心部件,采用热释红外人体传感器检测人体的存在,采用光敏三极管构成的电路检测环境光的强度;根据教室合理开灯的条件,通过对人体存在信号和环境光信号的识别与判断,完成对…

MySQL的增删查改(CRUD)

目录 一.CRUD 1.什么是CRUD 2.CRUD的特点 二.新增(Create) 单列插入全行数据 表的复制 额外小知识 三.阅读(Read) 1.全表查询指定列查询 2.查询字段为表达式 3.别名 ​编辑 4.去重 5.排序 1.根据列名进行排序 2.使用表达式及别名进行排序…

PyTorch -- 最常见激活函数的选择

首先,简单复习下什么是梯度:梯度是偏微分的集合 举例说明:对于 z y 2 − x 2 : ∇ z ( ∂ z ∂ x , ∂ z ∂ y ) ( 2 x , 2 y ) z y^2-x^2: \nabla z (\frac{\partial z}{\partial x}, \frac{\partial z}{\partia…

文件操作(总)

1.为什么使用文件 a是内存上的一块区域 如果程序退出,则内存回收,数据丢失了,再次运行就看不到上次的数据了 为了持久化保存,我们可以使用文件 2.文件是什么 磁盘上的文件是文件 在程序设计中,文件有两种&#xff…