数据分析——AB测试应用与实战

摘要

某电商公司非常注重自己的落地页设计,希望通过改进设计来提高转化率。以往该公司全年转化率平均在13%左右,现在希望设计的新页面能够带来更高的转化率,希望新页面的转化率能有2%的提升,达到15%。在正式推出新页面之前,该公司希望通过AB测试在小范围的用户中进行测试,以确保新页面的效果能够达到预期目标。

一、AB测试基本流程

了解了基本的背景之后,就可以进入AB测试了。在进行AB测试之前,需要梳理一下AB测试的基本流程,以确保实验的顺利进行。AB测试的基本流程包括以下几个步骤:

确定实验目标及衡量指标:在本案例中实验目标是通过AB测试确定新落地页是否可以提升2%的转化率。衡量指标即为页面转化率

设计实验方案:设计实验的具体方案,包括实验变量(即页面的具体改动点)﹑实验时间、实验样本量、划分实验组和对照组等。还需要确定实验数据的收集方法和分析方式。

一般分析方式:包括描述性统计、假设检验、置信区间估计、回归分析等等。在进行AB测试的时候,需要分析师根据实验的目标和具体情况选择合适的分析方法,并结合实际情况进行解读,提出合理的建议和决策。

执行实验并收集数据:按照实验方案进行实验执行,同事记录实验数据。

二、设计AB实验

在A/B测试实验设计这一步,通常需要完成以下6个步骤:

  1. 提出假设
  2. 确定实验分组
  3. 计算实验样本量及试验周期
  4. 上线AB测试并收集数据
  5. 数据分析及假设检验
  6. 得出结论及建议

2.1 提出假设

设计AB test实验的筏一步通常是提出假设。假设是对于某个特定变化我们所期望的结果,也是后续实验的基础,我们需要在后续实验中通过数据验证这个假设是否成立。如果验证成立,我们可以将这个变化推广到全部用户。如果验证不成立,则需要继续优化这个假设或者放弃这个修改方案,以寻找更好的变化。

在这个实验中,我们希望新页面可以提升2%的转化率,原则上我们应选择单尾检验,准确的说,应该选择右侧单尾检验,因为我们的假设是新页面的转化率要大于旧页面的转化率。但是,在本案例中,我们并不能确定新页面的性能一定比当前的页面更好。所以,这里选择双尾检验

补充说明:单尾检验和双尾检验是假设检验中的两种常见常见形式。它们的区别在于对假设的方向性不同:

在单尾检验中,研究者针对假设提出了明确的方向性,例页新设计的落地页转化率比原设计高"、“将按钮颜色从灰色改的为红色将导致更多的点击.....因此只检验这个方向是否具有统计显著性,被称为单侧检验。

在双尾检验中,研究者不确定假设所在的方向,例如新设计的落地页转化率与原设计是否存在差异"、“改变页面布局会影响用户的满意度....需要同时检验两个方向的统计显著性,被称为双侧检验。

在AB测试中,一般应根据实验目的、数据分布情况和统计分析方法等因素来确定单尾检验或双尾检验。例如,如果实验的目的是验证新设计的落地页转化率是否明显高于旧设计,就可以选择单尾检验。但如果不确定两种设计是否存在差异,则应选择双尾检验。

简单来说,可以这样辨别单尾/双尾检验:

  • 如果备择假设H1中是”",则是双尾检验;
  • 如果备择假设H1中是">“或者">”,则是右侧单尾检验;
  • 如果备泽假设H1中是”<“或者"≤”,则是左侧单尾检验。

此外,需要特别注意的是:想支持的结论通常放在备择假设上。所以在本案例中,原假设和备择假设分别是:

  • 原假设H0: P =P0
  • 备择假设H1: P≠P0

其中,P0代表的是旧版落地页的转化率,P1代表的是新版落地页的转化率。

2.2 确定实验分组

在此次AB测试中,我们分为实验组和对照组两组:

  • 对照组(control组)︰这一组用户将看到日版落地页。
  • 实验组(eatment组)︰这一组用户将看到新版落地页。

为了后续计算每一组的转化效率,需要记录每一位参与实验的用户的购买行为,也就是说无论用户看到的是新版落地页还是旧版落地页,都需要记录这位用户最终是否购买了产品。这可以通过在网站上添加相应的追踪代码来实现

  • 0:代表用户在测试期间没有购买产品
  • 1:代表用户在测试期间购买了产品

这样,后续就可以很容易地计算出每个组的均值,从而得到新旧两版落地页的转化率。

2.3 计算实验样本量及试验周期

实验样本量的确定

我们之前讲过,根据大数定律和中心极限定理,样本量越大我们的估计就会越精确,但同时也意味着成本越高,所以需要知道实验所需的最小样本量是多少,在成本可控范围里,选择合适的样本量即可。每一个实验组所需样本量计算公式如下:

N=\frac{\sigma ^2}{\varepsilon ^2}(Z(1-\frac{\alpha }{2})+Z(1-\beta ))))^2

在这个公式当中,a为犯第一类错误的概率,为犯第二类错误的概率,σ代表的是样本数据的标准差,δ代表的是预期实验组和对照组两组数据的差值。一般情况下,我们会设置:

  1. 显著性水平: a= 0.05,即在拒绝原假设之前,我们有95%的把握新版落地页的转化率比旧版落地页要高。
  2. 统计功效(1-β) : β= 0.2, 即表示测试检测特定效果的能力,如果该特定效果存在的话。在此案例中就是,如果新版落地页真的比旧版转换率要高,该测试有80%的概率能检测出这个状况。当衡量指标为比率类指标时,

标准差计算公式为:

σ2= Pa(1- PA)+ Pp(1- PB)

其中,PA和PB分别是对照组和实验组的观测值。在此案例中PA= 13%,PB= 15%,每个组所需的最小样本量为:

实验周期的确定:根据上面最小样本量的计算,我们知道此次AB测试至少需要9440个用户参与测试,假如该落地页以往每天的平均浏览量为1000,则实验周期至少需要的天数为:试验周期=9440/1000 = 9.4 ~10(天)

2.4 上线AB测试并收集数据

目前市面上大家熟知的大公司基本上都在做AB测试,比如:百度、阿里、腾讯、字节跳动、京东、滴滴、携程、美团等:百度:

  • 百度统计可视化A/B测试: https://baijiahao.baidu.com/s?id=1735048932168957887&wfr=spider&for=pc。
  • 字节跳动:巨量引擎「AB实验工具」:https://zhuanlan.zhihu.com/p/508366232
  • 阿里: 淘宝推出的AB测试平台,主要针对淘宝商家进行A/B测试
  • 腾讯: 腾讯云AB实验平台: https://abtest.qq.com/

大公司做AB测试的主要特点就是。一般都是自研系统。而对于规模不是那么大的企业,也有做AB测试的需求,比如互金、运动。、在线教育、SaaS的都有做A/B测试,但是这部分企业一般是使用第三方的A/B测试工具。目前市面上的第三方AB测试工具主要有:

  • 神测数据:https://www.sensorsdata.cn/features/ABTesting.html
  • ABtester:提供web网站A/B测试http://www.abtester.cn/
  • 热云数据:支持App、web、H5的AB测试https://www.appadhoc.com/

2.5 数据分析及假设检验

这里,我们使用的是Kaggle上的A/B测试数据集来模拟练习。

从上面的统计数据来看,新旧两版落地页的表现结果非常相近,相比于旧版落地页,新版落地页的转化率略微好一点点,高了0.3% 那么,这种差异在统计学上显著么?我们可以直接说,新版落地页更好么?

假设检验:我们分析的最后一步就是假设检验了。那么,具体选择哪一种假设检验呢?在统计学中,当样本容量较大时(一般是大于30),我们可以使用Z检验或者t检验。

在这个案例中,由于我们的样本非常大,所以我们使用Z检验。Python中的statsmodels.stats.proportion模块可以来计算P值和置信区间:

2.6 得出结论及建议

由于我们计算出来的P值=0.607远高于显著水平α =0.05,所以我们不能拒绝原假设H0.这意味着新版落地页与旧版落地页没有明显不同(更不用说更好了......)

此外,我们继续看置信区间,treatment组的置信区间为[0.117,0.136],可以看出:·它包括我们的转化率基准线13%。

它不包括我们的转化率目标值15%,也可以说明,新版落地页的真实转化率更有可能与我们的基线相似,而没有办法达到我们期望的15%。进一步证明了,新版设计并不是一个很好的改进。

博文参考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/37490.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Distributed】分布式ELK日志文件分析系统(二)

文章目录 一、FilebeatELK 部署1. 环境部署2. 在 Filebeat 节点上操作2.1 安装 Filebeat2.2 设置 filebeat 的主配置文件 3. 在 Apache 节点上操作3.1 在 Logstash 组件所在节点上新建一个 Logstash 配置文件 3. 启动3.1 在Logstash 组件所在节点启动3.2 在 Filebeat 节点 启动…

Python调用ImageMagick生成PDF文件缩略图

使用Python调用ImageMagick生成PDF文件缩略图 Imagemagick使用Ghostscript作为其依赖项之一&#xff0c;以便能够处理和转换PDF相关的图像。 准备 安装Ghostscript&#xff0c;网站安装ImageMagick&#xff0c;网站 安装完毕后&#xff0c;需要自行配置环境路径 脚本 使用示…

【USRP X310】如何将你的X310转化为USRP RIO 可以用于FPGA编程

X310 转化为USRP RIO X310产品X310和NI-USRP对应关系 简介第一步原理解释打开工具运行 Initialize Flash.vi可以去选择设备类型Hardware Current Version 如何选择 第二步创建工程运行校准程序 附录&#xff1a;射频子板的IDWBXSBXCBXUBXTwinRX X310产品 X310和NI-USRP对应关系…

jvm新生代调优

5-4 新生代调优 只有排除了自己代码的问题后&#xff0c;再进行内存调优&#xff0c;内存调优都是从新生代开始&#xff0c;因为新生代优化空间更大一些 新生代的特点 所有的new操作分配内存都是非常廉价的&#xff0c;非常快 TLAB&#xff1a;thread-local allocation buf…

Redis——基础篇(包含redis在云服务上的docker化安装和连接以及常用命令)

初识Redis Redis为键值型数据库&#xff0c;数据以键值形式存储。没有表&#xff0c;没有约束。 认识NoSQL mysql就是典型的关系型数据库(SQL)。 目的都是数据的增删改查&#xff0c;但数据存储方式不一样。 关系型和非关系型在结构上有差异 关系型的结构一般定好后就很少修…

【JAVAEE】JVM中垃圾回收机制 GC

博主简介&#xff1a;想进大厂的打工人博主主页&#xff1a;xyk:所属专栏: JavaEE初阶 上篇文章我们讲了java运行时内存的各个区域。 传送门&#xff1a;【JavaEE】JVM的组成及类加载过程_xyk:的博客-CSDN博客 对于程序计数器、虚拟机栈、本地方法栈这三部分区域而言&#x…

动态规划01背包之1049 最后一块石头的重量 II(第9道)

题目&#xff1a; 有一堆石头&#xff0c;用整数数组 stones 表示。其中 stones[i] 表示第 i 块石头的重量。 每一回合&#xff0c;从中选出任意两块石头&#xff0c;然后将它们一起粉碎。假设石头的重量分别为 x 和 y&#xff0c;且 。那么粉碎的可能结果如下&#xff1a; …

微信小程序(二)

目录 1、input标签 一、表单绑定 1、数据绑定 2、输入获取 二、网络请求 1、介绍 2、注意 3、使用 4、基于Promise封装 三、自定义组件 1、创建 2、父向子组件通信 3、子向父组件通信 4、生命周期 四、vant weapp组件库 1、配置 2、使用 进入本章前的拓展&#…

Git❀详细使用教程

Git❀详细使用教程 一、Git简介1.1 什么是Git&#xff1f;1.2 Git的特点1.3 集中式与分布式的区别&#xff1f;1.4 Git工作流程图 二、Git安装与常用命令2.1 Git环境配置2.1.1 下载与安装2.1.2 基本配置2.1.3 为常用指令设置别名&#xff08;可选&#xff09;2.1.4 解决GitBash…

jsonschema networknt json-schema-validator 高级能力json 数字很大时, 变成什么类型

入参校验产品化 schema_个人渣记录仅为自己搜索用的博客-CSDN博客 自动变成了bigInteger类型. 哪怕你的jsonSchema 配置的是integer , 不冲突.

AlGaN基深紫外FP激光器仿真模型及材料信息数据库有何用途?

波长范围为UVC波段&#xff08;100-280 nm&#xff09;的深紫外FP&#xff08;Fabry-Pero&#xff0c;法布里和珀罗是两位法国的科学家&#xff09;激光器可广泛应用于数据通信、光通信、3D打印、材料加工、显示与照明、激光雷达、人脸/手势识别、医疗和表面监测等领域。FP激光…

2023年Q2京东冰箱行业品牌销售排行榜(京东销售数据分析)

近年我国的冰箱零售呈波动变化的趋势&#xff0c;由于冰箱市场趋于饱和&#xff0c;因此消费者对冰箱的需求逐渐变为替换需求&#xff0c;这也进一步推动了产品的更新迭代。接下来结合具体数据&#xff0c;我们来分析一下2023年Q2冰箱行业的销售详情。 根据鲸参谋电商数据分析平…

SpringBoot+Vue实现的高校图书馆管理系统

项目描述&#xff1a;这是一个基于SpringBootVue框架开发的高校图书馆管理系统。首先&#xff0c;这是一个前后端分离的项目&#xff0c;代码简洁规范&#xff0c;注释说明详细&#xff0c;易于理解和学习。其次&#xff0c;这项目功能丰富&#xff0c;具有一个高校图书馆管理系…

6.2.5 网络基本服务----动态主机配置协议DHCP

6.2.5 网络基本服务----动态主机配置协议DHCP 动态主机配置协议允许一台计算机加入新的网络时可自动获取网络配置信息&#xff0c;不用人工参与。连网的计算机需要配置的参数包括 IP地址子网掩码默认路由器的IP地址域名服务器IP地址 DHCP与DNS、FTP、Telnet一样也采用客户服…

Lua脚本本地调试

这里主要使用日志的方式进行debug 环境依赖 项目对openresty包的依赖比较高&#xff0c;所以环境基础都在openresty下进行 openresty的使用 openresty下载地址 下载完成后解压&#xff0c;具体使用方式和nginx没有什么区别&#xff0c;主要依赖文件是一下几个 nginx.exe …

搬家送货小程序开发源码定制一键报警实时定位路线规划

1.货物信息录入&#xff1a; 用户可以输入货物的名称、数量、重量、尺寸等信息。 2.路线选择&#xff1a; 用户可以选择起始地点和目的地点&#xff0c;并根据需求选择最佳路线。 提供地图服务或第三方路径规划服务&#xff0c;以帮助用户确定最佳路线。 3.车辆选择&#…

基于深度学习的高精度鸡蛋检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要&#xff1a;基于深度学习的高精度鸡蛋检测识别系统可用于日常生活中或野外来检测与定位鸡蛋目标&#xff0c;利用深度学习算法可实现图片、视频、摄像头等方式的鸡蛋目标检测识别&#xff0c;另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5目标检测模型…

跨域问题解决

由于同源策略&#xff0c;需要协议&#xff0c;域名&#xff0c;端口三个都相同才能进行访问&#xff0c;是一种浏览器的保护策略 CORS:Cross Origin Resource Sharing SpringBoot 项目中解决跨域 1.在目标方法中加入CrossOrigin注解 2.添加一种过滤器 分别是允许哪些域&#…

ffmpeg2段视频合成一段

查看分辨率 帧率和编码器 ffprobe -v error -select_streams v:0 -show_entries streamcodec_name,width,height,avg_frame_rate -of defaultnoprint_wrappers1 rs2.mp4得到&#xff0c;编码器&#xff0c;分辨率&#xff0c;还有帧率 codec_nameh264 width1920 height1080 avg…

Linux 发行版 Gentoo 存在重大漏洞

网络安全公司 SonarSource 在日前研究中发现&#xff0c;Gentoo Linux 发行版中存在漏洞 CVE-2023-28424&#xff0c;黑客可以利用该漏洞进行 SQL 注入攻击。 研究人员从 GentooLinux 的 Soko 搜索组件中找到了这个漏洞。该漏洞的 CVSS 风险评分为 9.1&#xff0c;属于特别重大…