第100+6步 ChatGPT文献复现:ARIMAX预测新冠

基于WIN10的64位系统演示

一、写在前面

我们继续来解读ARIMAX模型文章,这一轮带来的是:

《PLoS One》杂志的2022年一篇题目为《A data-driven eXtreme gradient boosting machine learning model to predict COVID-19 transmission with meteorological drivers》文章的公开数据做案例。

这文章做的是用:使用Xgboost结合天气数据预测新冠。

题目里没说ARIMAX模型,实际上它在文章中被作为对照组。

二、闲聊和复现:结果一描述性分析

1全文技术路线

① 收集天气相关的数据,比如气温、湿度、降雨量、风速和气压。作者认为这些天气情况可能会影响病毒的传播。

② 使用了两种不同的统计模型来分析数据和做出预测:ARIMAX和XGBoost。

③ 将模型输出的预测数值与实际发生的病例数进行对比,来看看哪个模型的预测更准确。

④ 选择那个对于某个特定国家预测结果更好的模型,认为这个模型是最适合用来预测那个国家的COVID-19病例数的。

简单来说,这个研究就是试图找出最好的方法来预测不同国家的COVID-19病例数,帮助我们理解疫情可能如何发展。

GPT看图写作文,我只是搬运过来。也就是用气象数据辅助预测COVID-19,感觉这个思路是万金油,可能也可以预测股票走势。

(2)逐段解析

第一、二段,描述性统计,没啥好说的,就是丰富结果(凑图)呗:

第三段,直奔主题:

翻译一下:

这段时间序列图展示了自疫情开始至2022年1月29日,各个南亚区域合作联盟(SAARC)国家的COVID-19确诊病例趋势。孟加拉国、尼泊尔和巴基斯坦的每日确诊病例在不同时期出现波动,包括一些高速上升的趋势。阿富汗和斯里兰卡的模式非常相似,显示出明显的下降倾向。总体而言,不丹和马尔代夫的COVID-19传播率相对于其他SAARC国家来说较低(见图3)。COVID-19确诊病例与气象变量之间的互相关性在0至30的滞后时间内形成。

为了探究在特定时期气象因素对COVID-19传播的影响,只考虑了正的滞后时间[48]。在阿富汗,最高温度和最低温度在滞后时间0处显示出与COVID-19确诊病例显著相关。在印度,只有在滞后时间4天的最高温度显示出显著关系。在孟加拉国滞后9天和马尔代夫滞后13天的最大风速显示出显著关系。在不丹的滞后26天和尼泊尔的滞后10天的相对湿度与COVID-19确诊病例显示出显著相关。地表气压在印度滞后9天、斯里兰卡滞后13天以及巴基斯坦滞后28天与COVID-19确诊病例显示出显著相关(见图4)。

解读,很明显可以分成两段话:

① 疫情趋势图的描述,没啥好说的哈,就客观描述就好;

② 疫情时序图与气象自变量的相关矩阵分析,我们用SPSS整一下:

第一个图是Afghanistan的疫情与最高温度:

有一点要注意的是定义日期得谁,选天哈。

看看这个结果:相关性绝了,气候因素真实万金油的存在。

回到文章的描述:“在阿富汗,最高温度和最低温度在滞后时间0处显示出与COVID-19确诊病例显著相关。”:问题来了,为啥只描述滞后0处,1-30没有描述?而且最后构建ARIMAX模型的时候,选取哪个滞后阶数?

类似的,其他国家的也是存在这种现象,

“在印度,只有在滞后时间4天的最高温度显示出显著关系。”:然后我发现他们在图四中放错图了,并不是最高温度,正确的图如下:

似乎、貌似、可能0-30天都有相关关系吧,求解答。

其他结果,大家自行探索吧。

第四段,构建ARIMAX模型:

翻译:

上述气象因素作为协变量,在不同的滞后期内被用于ARIMAX模型中,以确定它们对COVID-19确诊病例的影响。例如,在阿富汗,滞后0的最高和最低温度被用作构建ARIMAX模型的协变量。同样,对于孟加拉国、不丹、印度、马尔代夫、尼泊尔、巴基斯坦和斯里兰卡,滞后变量被用作协变量,并在表2中显示了这些变量对疾病的影响。

表2展示了阿富汗同一天(即滞后0)的最低温度(β = -8.93,95% CI: -14.30, -3.56)对COVID-19病例传播产生了负面影响。印度滞后4天的最高温度(β = 0.18,95% CI: 0.01, 0.35)和阿富汗同一天(即滞后0)的最高温度(β = 11.91,95% CI: 4.77, 19.05)对COVID-19确诊病例的传播产生了正面影响。孟加拉国滞后9天的最大风速(β = -53.89,95% CI: -93.45, -14.32)和马尔代夫滞后13天的最大风速(β = -4.24,95% CI: -8.31, -0.18)对COVID-19确诊病例的传播产生了负面影响。尼泊尔滞后10天的相对湿度(β = -4.84,95% CI: -9.20, -0.48)和不丹滞后26天的相对湿度(β = -0.12,95% CI: -0.22, -0.02)对COVID-19确诊病例产生了负面影响。巴基斯坦滞后28天的地面压力(β = 25.77,95% CI: 7.85, 43.69)和斯里兰卡滞后13天的地面压力(β = 411.63,95% CI: 49.04, 774.23)对COVID-19确诊病例产生了正面影响。此外,印度滞后9天的地面压力(β = -1.91,95% CI: -3.75, -0.06)对COVID-19确诊病例的传播产生了负面影响。关于气象因素对COVID-19传播影响的详细结果在表2中呈现。

这里他们把建模策略说的比较详细了:首先建立ARIMA模型,然后纳入气象因素。至于气象因素的滞后因子的取值,就一个一个尝试(统计检验需P值小于0.05),我们使用SPSS,以印度为例子:

(1)寻找最优的ARIMA模型,我就直接上结果:

ARIMA(0,1,6),跟文章中的不太一样,毕竟软件不同。注意,这里没有使用季节参数P、D、Q。

(2)加入最高温度纳入自变量,寻找最优的ARIMAX模型,我把最高温度滞后值从0尝试到30,只有滞后等于19的时候,P值小于0.05:

可以看到,模型的参数除了MAPE提升了不少,其他似乎大同小异。至于“(β = 0.18,95% CI: 0.01, 0.35)”,SPSS似乎不能提供了。

三、个人感悟

ARIMAX模型,并非看着的那么光鲜亮丽,有时候还不如单纯的ARIMA模型。

四、数据

链接:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0273319

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/569017.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

树莓派驱动开发----iic驱动oled屏幕篇

水一期吧,上效果 有点模糊,我直接说吧,修改设备树,iic1,地址0x3c,然后编写驱动文件,app文件,挂载驱动模块后在终端输入 /*******************************************************…

Appium一本通

Appium介绍 概念:Appium是一个移动App(手机应用)自动化工具。 用途:重复性任务、爬虫、自动化测试。 特点:开源免费、多平台支持(ios\android)、多类型支持(native\webview)、类selenium支持多语言(java\python\js\ruby) Appium原理 三个主…

基于小程序实现的查寝打卡系统

作者主页:Java码库 主营内容:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app等设计与开发。 收藏点赞不迷路 关注作者有好处 文末获取源码 技术选型 【后端】:Java 【框架】:ssm 【…

k-均值聚类

K均值聚类(K-means clustering)是一种常用的无监督学习方法,用于将一组数据点划分为K个簇(cluster)。 它的目标是将相似的数据点归到同一个簇中,同时使得不同簇之间的数据点尽可能不相似。K均值聚类算法的…

学习笔记记录ensp中防火墙配置(trust,unstrus,dmz 资源下载可用)

实验目的,通过配置防火墙控制相互之间的访问,拓扑图如下 资源已上传,注意lsw1和ar2的路由表到各个网段的路由表配置,通过防火墙来控制各个区域能否访问成功。 防火墙通过cloud2链接,方便登录网页配置防火墙策略。防火…

分享基于鸿蒙OpenHarmony的Unity团结引擎应用开发赛

该赛题旨在鼓励更多开发者基于OpenHarmony4.x版本,使用团结引擎创造出精彩的游戏与应用。本次大赛分为“创新游戏”与“创新3D 化应用”两大赛道,每赛道又分“大众组”与“高校组”,让不同背景的开发者同台竞技。无论你是游戏开发者&#xff…

操作系统—系统调用(实验)

文章目录 系统调用1.实验目标2.实验过程记录(1).理解系统调用接口(2).阅读argraw、argint、argaddr和argstr(3).理解系统调用的解耦合实现方式(4).wait系统调用的非阻塞选项实现(5).yield系统调用的实现 3.存在的问题及解决方案实验小结 系统调用 1.实验目标 阅读并了解xv6内核…

基于Python+Selenium+Pytest的Dockerfile如何写

使用 Dockerfile 部署 Python 应用程序与 Selenium 测试 在本文中,我们将介绍如何使用 Dockerfile 部署一个 Python 应用程序,同时利用 Selenium 进行自动化测试。我们将使用官方的 Python 运行时作为父镜像,并在其中安装所需的依赖项和工具…

Error creating bean with name ‘ribbonLoadBalancingHttpClient‘~

场景 利用Ribbon来实现负载均衡 报错提示 Caused by: org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with name ribbonLoadBalancer defined in org.springframework.cloud.netflix.ribbon.RibbonClientConfiguration: Unsatisfi…

Linux中的vi与vim:编辑器的王者之争与深度探索

🐇明明跟你说过:个人主页 🏅个人专栏:《Linux :从菜鸟到飞鸟的逆袭》🏅 🔖行路有良友,便是天堂🔖 目录 一、前言 1、Linux的起源与发展 2、vi与vim的历史与发展 …

opencv android 使用笔记

目录 获取app路径: 下载:OpenCV-android-sdk cmakelist配置: 头文件路径: 编译报错:clang: error: linker command failed with exit code 1 (use -v to see invocation) 读取图片例子 保存mp4 获取app路径&am…

UE4网络图片加载库(带内存缓存和磁盘缓存)

UE4网络图片加载库,带内存缓存和磁盘缓存,支持自定义缓存大小,支持蓝图和C++代码调用 1、调用示例 2、对外暴露函数 3、源代码-网络模块 KeImageNet.h // Fill out your copyright notice in the Description page of Project Settings.#pragma once#include "CoreM…

链表操作III

看这篇文章之前,可以先看看链表操作I和链表操作II。而这篇文章主要是想说明两道关于链表环的问题。 环形链表 给你一个链表的头节点 head ,判断链表中是否有环。 如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则…

【六十】【算法分析与设计】用一道题目解决dfs深度优先遍历,dfs中节点信息,dfs递归函数模板进入前维护出去前回溯,唯一解的剪枝飞升返回值true

路径之谜 题目描述 小明冒充X星球的骑士,进入了一个奇怪的城堡。 城堡里边什么都没有,只有方形石头铺成的地面。 假设城堡地面是nn个方格。如下图所示。 按习俗,骑士要从西北角走到东南角。可以横向或纵向移动,但不能斜着音走,也不能跳跃。每走到一个新方格,就要向正北 方和正西…

【Linux】解决ubuntu20.04版本插入无线网卡没有wifi显示【无线网卡Realtek 8811cu】

ubuntu为Realtek 8811cu安装驱动,解决wifi连接问题 1、确认无线网卡的型号-Realtek 8810cu2、下载并配置驱动 一句话总结:先确定网卡的型号,然后根据网卡的型号区寻找对应的驱动下载,下载完成之后在ubuntu系统中进行编译&#xff…

3D 文件格式的江湖纷争

自从上世纪 60 年代计算机辅助设计(Computer Aided Design, CAD)发明已来,3D 图形产业繁荣发展,逐步覆盖工业制造、影视游戏、VR/AR 、3D 打印等各个领域。如果说 3D 模型是构成 XR 应用场景的基础组件,那么 3D 文件格式就是构建 XR 世界沟通语言。而伴随各种 3D 建模软件…

C++链表操作入门

数据结构基础:链表操作入门 数据结构基础:链表操作入门链表的基本概念链表的基本操作输出链表插入节点删除节点查找值 完整的链表操作示例结语 数据结构基础:链表操作入门 在计算机科学中,数据结构是组织和存储数据的方式&#x…

H264 编码标准常见术语解释

H264 编码标准 H.264编码标准,也被称作MPEG-4 AVC(Advanced Video Coding),是一种被广泛使用的数字视频压缩标准,由国际电信联盟(ITU-T)和国际标准化组织(ISO)共同开发。…

【蓝牙协议栈】【BLE】低功耗蓝牙工作流程(角色\广播\扫描\连接等专业名词介绍)

1. 精讲蓝牙协议栈(Bluetooth Stack):SPP/A2DP/AVRCP/HFP/PBAP/IAP2/HID/MAP/OPP/PAN/GATTC/GATTS/HOGP等协议理论 2. 欢迎大家关注和订阅,【精讲蓝牙协议栈】和【Android Bluetooth Stack】专栏会持续更新中.....敬请期待&#x…

谷歌搜索seo排名怎么做上去?

谷歌算法纵使千变万化,用户体验(UX)也始终是核心,用户体验包含很多,但核心就是让访问你网站的人觉得你的网站看着顺眼,同时轻松找到他们需要的信息或服务,这意味着你的网站得易于导航&#xff0…