R语言用逻辑回归贝叶斯层次对本垒打数据与心脏移植数据后验预测检验模拟推断及先验影响分析|附数据代码...

全文链接:https://tecdat.cn/?p=40152

在统计学领域中,层次建模是一种极为强大且实用的工具。它能够巧妙地处理复杂的数据结构,通过分层的方式对数据进行建模。在贝叶斯统计的框架内,层次建模优势尽显,其可以有效地融合先验信息,进而实现更精准的推断。这种方法在多个学科如生物医学、社会科学等领域有着广泛的应用前景,为解决实际问题提供了有力的支持点击文末“阅读原文”获取完整代码、数据、文档)。

层次建模的初步应用

以下是一个针对特定球员本垒打数据进行逻辑模型拟合的示例。

依据输入的球员名字,从数据集中筛选出相关数据,并运用逻辑回归模型来拟合本垒打概率与球员年龄之间的关系。随后,通过循环操作对多个球员的数据进行处理整合,并使用xyplot函数绘制出每个球员的拟合曲线。

xyplot(Fitted ~ Age | Player, 
data=new_data, 
type="l", lwd=3, col="black")

通过运行这些代码并查看生成的图形(图1),我们能够直观地观察到不同球员的本垒打概率随年龄的变化趋势。

图1:不同球员本垒打概率随年龄变化的拟合曲线

个体估计与联合估计

在分析心脏移植数据时,我们可通过以下代码绘制散点图,以观察数据特征。

绘制了心脏移植数据中预期值的对数与观测值和预期值比值的散点图,并标注了观测值(图2)。通过该图,我们能初步了解数据的分布状况,为后续深入分析奠定基础。

图2:心脏移植数据散点图

死亡率是否相等的检验

为判断等死亡率模型是否合适,我们采用后验预测检验方法。首先计算数据中的总观测值和总预期值。接着,通过生成伽马分布的随机数模拟参数lambda,并据此生成泊松分布的随机数来模拟观测值。

随后,绘制模拟观测值的直方图,并标注实际观测值(图3),以此直观判断等死亡率模型的合理性。最后,绘制概率与预期值对数的关系图(图4),以便进一步分析。

with(hearttransplants,
 plot(log(e), pout, ylab="Prob(extreme)"))


图3:模拟观测值直方图及实际观测值标注

图4:概率与预期值对数关系图


点击标题查阅往期内容

790c459f95a03fe8edb5c540472504ff.jpeg

Python用PyMC3马尔可夫链蒙特卡罗MCMC对疾病症状数据贝叶斯推断

outside_default.png

左右滑动查看更多

outside_default.png

01

图片

02

图片

03

图片

04

图片

可交换性先验信念的建模

为对泊松率的可交换性信念进行建模,我们定义了一个两阶段先验函数。

通过设置不同的alpha值,并使用函数绘制等高线图(图5),可直观展示先验分布的形态。


图5:不同alpha值下的先验分布等高线图

后验模拟

在贝叶斯分析里,后验分布的模拟是关键步骤。我们将后验分布表示为[μ,αμ,α]{λj}|μ,α{λj}|μ,α的形式,并着重关注[μ,αμ,α]的后验分布。

通过mycontour函数绘制等高线图(图6),呈现后验分布的轮廓。

此外,运用gibbs抽样方法模拟后验分布。

通过绘制抽样点的分布以及参数的密度图(图7、图8),深入了解后验分布的特征。

最后,依据后验模拟结果,计算速率的后验分布,并绘制相关图形(图9)展示观测值与后验分布的关系。

with(hearttransplants,
 lines(log(e\[i\]) * c(1, 1), probint))
}


图6:[μ,αμ,α]后验分布等高线图

图7:gibbs抽样点分布

图8:参数log.alpha的密度图

图9:观测值与速率后验分布关系图

后验推断

后验推断是基于后验分布对模型参数进行估计和推断的过程。我们再次绘制后验分布的等高线图(图10)。

通过计算收缩率,并绘制收缩率与预期值对数的关系图(图11),分析不同观测值的收缩情况。

在比较不同医院时,计算每个医院的平均速率,找出平均速率最小的医院。

通过模拟速率并进行比较(图12),进一步了解不同医院之间的差异。


图10:后验分布等高线图

图11:收缩率与预期值对数关系图

贝叶斯敏感性分析

贝叶斯敏感性分析主要探究先验选择对推断结果的影响。我们通过改变先验中的参数z0,观察后验分布的变化。

log.alpha <- fitgibbs$par\[, 1\]
log.alpha.new <- sir.old.new(log.alpha, 
prior, prior.new)

借助lattice软件包绘制密度图(图13),直观比较原始先验和新先验下的后验分布。


图13:原始先验和新先验下后验分布的密度图

从图中可以清晰地看到,不同先验设定下后验分布的差异,这有助于我们了解先验选择对推断结果的影响程度,进而在实际应用中更加谨慎地选择合适的先验分布。

后验预测模型检验

后验预测模型检验是衡量模型预测能力的重要环节。我们通过模拟预测分布,并与实际观测值对比来进行检验。首先生成参数lambda的后验样本,并据此生成预测的观测值。

然后绘制预测观测值的直方图,并标注实际观测值(图14),以此直观展示预测分布与实际值的契合情况。


图14:预测观测值直方图及实际观测值标注

为更全面评估模型的预测性能,我们计算每个观测值的预测分布至少与实际观测值一样大的概率。

最后,绘制概率对比图(图15),将等均值情况下的极端概率与可交换情况下的极端概率进行对比,从而深入分析模型的性能。


图15:等均值与可交换情况下极端概率对比图

从图中我们可以直观地看出两种情况下概率的差异,进而对模型的预测能力和合理性有更深入的认识,判断模型是否能够较好地捕捉数据的特征和规律。

结论

本文围绕贝叶斯框架下的层次建模展开了深入的研究与实践。通过对本垒打数据和心脏移植数据的分析,展示了层次建模在数据拟合、后验模拟、推断、敏感性分析以及后验预测模型检验等方面的具体应用过程。

0adf9532b641e5371779241ac16b2a06.jpeg

本文中分析的完整数据、代码、文档分享到会员群,扫描下面二维码即可加群! 

f41ef754aa618636d090b13f8929ec0a.png


资料获取

在公众号后台回复“领资料”,可免费获取数据分析、机器学习、深度学习等学习资料。

c18b17f7c6300c711d4d90a1812ca161.jpeg

点击文末“阅读原文”

获取完整代码、数据、文档。

本文选自《R语言用逻辑回归贝叶斯层次对本垒打数据与心脏移植数据后验预测检验模拟推断及先验影响分析|附数据代码》。

点击标题查阅往期内容

数据分享|Python用PyMC3贝叶斯模型平均BMA:采样、信息准则比较和预测可视化灵长类动物的乳汁成分数据

Python用PyMC贝叶斯GLM广义线性模型、NUTS采样器拟合、后验分布可视化

R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享

PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像

MATLAB随机森林优化贝叶斯预测分析汽车燃油经济性

R语言中贝叶斯网络(BN)、动态贝叶斯网络、线性模型分析错颌畸形数据

使用贝叶斯层次模型进行空间数据分析

MCMC的rstan贝叶斯回归模型和标准线性回归模型比较

python贝叶斯随机过程:马尔可夫链Markov-Chain,MC和Metropolis-Hastings,MH采样算法可视化

Python贝叶斯推断Metropolis-Hastings(M-H)MCMC采样算法的实现

matlab贝叶斯隐马尔可夫hmm模型实现

贝叶斯线性回归和多元线性回归构建工资预测模型

Metropolis Hastings采样和贝叶斯泊松回归Poisson模型

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

R语言RSTAN MCMC:NUTS采样算法用LASSO 构建贝叶斯线性回归模型分析职业声望数据

R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性

PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

R语言JAGS贝叶斯回归模型分析博士生延期毕业完成论文时间

R语言Metropolis Hastings采样和贝叶斯泊松回归Poisson模型

Python决策树、随机森林、朴素贝叶斯、KNN(K-最近邻居)分类分析银行拉新活动挖掘潜在贷款客户

R语言贝叶斯MCMC:用rstan建立线性回归模型分析汽车数据和可视化诊断

R语言贝叶斯MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例

R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数

随机森林优化贝叶斯预测分析汽车燃油经济性

R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

R语言用Rcpp加速Metropolis-Hastings抽样估计贝叶斯逻辑回归模型的参数

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归

Python贝叶斯回归分析住房负担能力数据集

R语言实现贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析

Python用PyMC3实现贝叶斯线性回归模型

R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型

R语言Gibbs抽样的贝叶斯简单线性回归仿真分析

R语言和STAN,JAGS:用RSTAN,RJAG建立贝叶斯多元线性回归预测选举数据

R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

R语言贝叶斯线性回归和多元线性回归构建工资预测模型

R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例

R语言stan进行基于贝叶斯推断的回归模型

R语言中RStan贝叶斯层次模型分析示例

R语言使用Metropolis-Hastings采样算法自适应贝叶斯估计与可视化

R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型

WinBUGS对多元随机波动率模型:贝叶斯估计与模型比较

R语言实现MCMC中的Metropolis–Hastings算法与吉布斯采样

R语言贝叶斯推断与MCMC:实现Metropolis-Hastings 采样算法示例

R语言使用Metropolis-Hastings采样算法自适应贝叶斯估计与可视化

视频:R语言中的Stan概率编程MCMC采样的贝叶斯模型

R语言MCMC:Metropolis-Hastings采样用于回归的贝叶斯估计

fc21c75fec3510832c6852e237fb8b11.jpeg

ff12f4eaf37d31a71da7fba65b9c7fba.png

52dfb33ead228c495b2374c635fe9f65.png

a72e225298a515daad213e3443c8e4bc.jpeg

8ce8adbdc50d8d3678b848f699af3534.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/972022.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

解锁机器学习核心算法 | 随机森林算法:机器学习的超强武器

一、引言 在机器学习的广阔领域中&#xff0c;算法的选择犹如为一场冒险挑选趁手的武器&#xff0c;至关重要。面对海量的数据和复杂的任务&#xff0c;合适的算法能够化繁为简&#xff0c;精准地挖掘出数据背后隐藏的模式与价值。机器学习领域有十大核心算法&#xff0c;而随…

网络工程师 (43)IP数据报

前言 IP数据报是互联网传输控制协议&#xff08;Internet Protocol&#xff0c;IP&#xff09;的数据报格式&#xff0c;由首部和数据两部分组成。 一、首部 IP数据报的首部是控制部分&#xff0c;包含了数据报传输和处理所需的各种信息。首部可以分为固定部分和可变部分。 固定…

部署k8s 集群1.26.0(containerd方式)

随着k8s版本逐步更新&#xff0c;在不支持docker环境的情况下&#xff0c;需要使用containerd方式作为容器引擎。为了更好的个人学习使用&#xff0c;需要重新部署一套1.26.0版本的k8s集群&#xff0c;并且使用containerd方式作为容器引擎&#xff0c;版本为1.6.33。在部署过程…

移动通信发展史

概念解释 第一代网络通信 1G 第二代网络通信 2G 第三代网络通信 3G 第四代网络通信 4G 4g网络有很高的速率和很低的延时——高到500M的上传和1G的下载 日常中的4G只是用到了4G技术 运营商 移动-从民企到国企 联通-南方教育口有人 电信 铁通&#xff1a;成立于 2000 年…

HarmonyOS进程通信及原理

大家好&#xff0c;我是学徒小z&#xff0c;最近在研究鸿蒙中一些偏底层原理的内容&#xff0c;今天分析进程通信给大家&#xff0c;请用餐&#x1f60a; 文章目录 进程间通信1. 通过公共事件&#xff08;ohos.commonEventManager&#xff09;公共事件的底层原理 2. IPC Kit能…

openCV中如何实现滤波

图像滤波用于去除噪声和图像平滑&#xff0c;OpenCV 提供了多种滤波器&#xff1a; 1.1. 均值滤波&#xff1a; import cv2# 读取图像 image cv2.imread("example.jpg")# 均值滤波 blurred_image cv2.blur(image, (5, 5)) # (5, 5) 是滤波核的大小 滤波核大小的…

Linux网络 | 多路转接Reactor

前言&#xff1a;本节内容结束Linux网络部分。本节将要简单实现一下多路转接Reactor的代码&#xff0c;制作一个多路转接版本的四则运算计算器服务器。Reactor的代码相当困难&#xff0c;除了350多行新代码&#xff0c; 还要用到我们之前写的许多文件&#xff0c; 比如之前写的…

数控机床设备分布式健康监测与智能维护系统MTAgent

数控机床设备分布式健康监测与智能维护系统MTAgent-v1.1融合了目前各种先进的信号处理以及信息分析算法以算法工具箱的方式&#xff0c;采用了一种开发的、模块化的结构实现信号各种分析处理&#xff0c;采用Python编程语言&#xff0c;满足不同平台需求(包括Windows、Linux)。…

Opencv项目实战:26 信用卡号码识别与类型判定

项目介绍 在日常生活中&#xff0c;信用卡的使用越来越普遍。本项目的主要目标是通过图像处理技术自动识别信用卡号码&#xff0c;并根据信用卡号码的第一个数字判定信用卡的类型&#xff08;如Visa、MasterCard等&#xff09;。项目结合了图像预处理、轮廓检测、模板匹配等技…

利用websocket检测网络连接稳定性

浏览器中打开F12&#xff0c;控制台中输入以下内容 > 回车 > 等待结果 连接关闭 表示断网 let reconnectDelay 1000; // 初始重连间隔 let pingInterval null; let socketManuallyClosed false; // 标志是否手动关闭function createWebSocket() {if (socketManuallyCl…

WPF9-数据绑定进阶

目录 1. 定义2. 背景3. Binding源3.1. 使用Data Context作为Binding的源3.2. 使用LINQ检索结果作为Binding的源 4. Binding对数据的转换和校验4.1. 需求4.2. 实现步骤4.3. 值转换和校验的好处4.3.1. 数据转换的好处 4.4. 数据校验的好处4.5. 原理4.5.1. 值转换器原理4.5.2. 数据…

【Unity Shader编程】之图元装配与光栅化

执行方式&#xff1a;自动完成 图元装配自动化流程 顶点坐标存入装配区 → 按绘制模式连接顶点 → 生成完整几何图元 示例&#xff1a;gl.drawArrays(gl.TRIANGLES, 0, 3)自动生成三角形 会自动自动裁剪超出屏幕范围&#xff08;NDC空间外&#xff09;的三角形&#xff0c;仅保…

ssm121基于ssm的开放式教学评价管理系统+vue(源码+包运行+LW+技术指导)

项目描述 临近学期结束&#xff0c;还是毕业设计&#xff0c;你还在做java程序网络编程&#xff0c;期末作业&#xff0c;老师的作业要求觉得大了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等。这里根据疫情当下&#xff0c;你想解决的问…

网工项目理论1.11 网络出口设计

本专栏持续更新&#xff0c;整一个专栏为一个大型复杂网络工程项目。阅读本文章之前务必先看《本专栏必读》。 一.网络出口接入技术 二.单一出口网络结构 三.同运营商多出口结构 四.多运营商多出口结构——出向流量 五.多运营商多出口结构——服务器访问流量 六.多运营商多出口…

Django 5 实用指南(一)安装与配置

1.1 Django5的背景与发展 Django 自从2005年由Adrian Holovaty和Simon Willison在 Lawrence Journal-World 新闻网站上首次发布以来&#xff0c;Django 一直是 Web 开发领域最受欢迎的框架之一。Django 框架经历了多个版本的演进&#xff0c;每次版本更新都引入了新功能、改进了…

Redis实战-扩展Redis

扩展Redis 1、扩展读性能2、扩展写性能和内存容量3、扩展复杂的查询3.1 扩展联合查询3.2 扩展分片排序 如有侵权&#xff0c;请联系&#xff5e; 如有错误&#xff0c;也欢迎批评指正&#xff5e; 本篇文章大部分是来自学习《Redis实战》的笔记 1、扩展读性能 单台Redis服务器…

【AI面板识别】

题目描述 AI识别到面板上有N&#xff08;1 ≤ N ≤ 100&#xff09;个指示灯&#xff0c;灯大小一样&#xff0c;任意两个之间无重叠。 由于AI识别误差&#xff0c;每次别到的指示灯位置可能有差异&#xff0c;以4个坐标值描述AI识别的指示灯的大小和位置(左上角x1,y1&#x…

朴素模式匹配算法与KMP算法(有next[]和nextval[]详细讲解

这篇文章是建立在上篇文章的基础上的,看此篇文章要有串的基本知识 举个例子引进我们今天的知识 假设我们这里有两个字符串,一个主串,一个子串 主串: aaa223aa225 子串: aa22 我们这里需要进行匹配,传统的朴素模式匹配算法,就是主串下标i从1开始,主串j从1开始…

文件操作(PHP)(小迪网络安全笔记~

免责声明&#xff1a;本文章仅用于交流学习&#xff0c;因文章内容而产生的任何违法&未授权行为&#xff0c;与文章作者无关&#xff01;&#xff01;&#xff01; 附&#xff1a;完整笔记目录~ ps&#xff1a;本人小白&#xff0c;笔记均在个人理解基础上整理&#xff0c;…

【分治法】棋盘覆盖问题 C/C++(附代码和测试实例及算法分析)

问题描述 在一个 2 k 2 k 2^k \times 2^k 2k2k大小的棋盘中&#xff0c;有一个与其他方块不同的特殊方块&#xff0c;如下图红色方块。另有4种形态不同的L型骨块&#xff08;见下图&#xff09;&#xff0c;要用图示四种骨块覆盖棋盘上除特殊方格外的其他所有方格&#xff0c…