AI论文速读 | 2024[KDD]GinAR—变量缺失端到端多元时序预测

题目:GinAR: An End-To-End Multivariate Time Series Forecasting Model Suitable for Variable Missing

作者:Chengqing Yu(余澄庆), Fei Wang(王飞), Zezhi Shao(邵泽志), Tangwen Qian, Zhao Zhang, Wei Wei(魏巍), Yongjun Xu(徐勇军)

机构:中科院计算所,华中科技大学

arXiv网址https://arxiv.org/abs/2405.11333

Cool Paperhttps://papers.cool/arxiv/2405.11333

代码https://github.com/Jimmy-7664/STD-MAE

关键词:多变量时间序列预测,缺失值下的预测,图神经网络,插值注意力,自适应图卷积

TL; DR: 本文提出了一种新颖的图插值注意力递归(Recursive)网络(GinAR),用于解决多变量时间序列预测中存在的变量缺失问题,通过插值注意力和自适应图卷积技术,即使在高达90%的变量缺失情况下,也能准确预测未来值。


🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

摘要

多元时间序列预测 (MTSF) 对于决策至关重要,基于从多个序列的历史观测中识别出的复杂关系来准确预测未来的值/趋势。最近,时空图神经网络 (STGNN) 因其在挖掘时空依赖性方面的强大能力而逐渐成为 MTSF 模型的主题,但它们中的大多数都严重依赖于历史数据完整性的假设。实际上,由于数据收集器故障和耗时修复等因素,收集整个历史观测值而不遗漏任何变量极具挑战性。在这种情况下,STGNN 只能利用正常变量的子集,并且很容易受到不正确的时空依赖性建模问题的影响,从而导致其预测性能下降。为了解决这个问题,本文提出了一种新颖的图插值注意循环网络(名为 GinAR),以精确地建模有限收集数据的时空依赖性以进行预测。在 GinAR 中,它由两个关键组件组成,即插值注意力和自适应图卷积,以取代简单循环单元的全连接层,从而能够恢复所有缺失变量并重建正确的时空依赖关系,以对多元时间序列数据进行循环建模。在五个真实数据集上进行的大量实验表明,GinAR 的表现优于11个 SOTA 基线,即使在 90% 的变量缺失的情况下,仍然可以准确预测所有变量的未来值。

Q: 这篇论文试图解决什么问题?

A: 这篇论文试图解决的问题是多变量时间序列预测(Multivariate Time Series Forecasting, MTSF)中变量缺失的问题。具体来说,传统的空间时间图神经网络(Spatial-Temporal Graph Neural Networks, STGNNs)在进行MTSF时,通常依赖于历史数据完整性的假设。然而,在现实世界中,由于数据收集器故障、维修耗时等因素,很难收集到完整的历史观测数据,这导致STGNNs在建模空间时间依赖关系时容易出错,进而影响预测性能。

为了解决这个问题,论文提出了一种新颖的图插值注意力递归网络(Graph Interpolation Attention Recursive Network, GinAR),它能够在有限收集到的数据上精确建模空间时间依赖关系,以进行预测。GinAR包含两个关键组件:插值注意力(Interpolation Attention, IA)和自适应图卷积(Adaptive Graph Convolution, AGCN),它们能够分别恢复所有缺失变量和重建正确的空间时间依赖关系,以递归地建模多变量时间序列数据。

论文的主要贡献包括:

  1. 提出了第一个挑战性的工作,即在变量缺失的情况下实现MTSF的端到端框架,可以解决建模过程中的误差累积问题。

  2. 设计了包含插值注意力和自适应图卷积的图插值注意力递归网络,这两个组件替换了简单递归单元(Simple Recursive Unit, SRU)中的所有全连接层,目的是在递归建模过程中纠正空间时间依赖关系。

  3. 在五个真实世界的数据集上设计了实验,结果表明GinAR在所有数据集上的表现都超过了11个基线模型。即使在90%的变量缺失的情况下,GinAR仍然能够准确预测所有变量的未来值。

    缺失值预测

Q: 有哪些相关研究?

A: 相关研究主要集中在多变量时间序列预测(MTSF)和数据插补(imputation)方法上。以下是一些与本论文相关的研究工作:

  1. 空间时间预测方法 (Spatial-Temporal Forecasting Method):
    • DCRNN: 结合门控循环单元(GRU)和图卷积网络(GCN)提出的扩散卷积循环神经网络(Diffused Convolutional Recurrent Neural Network),用于MTSF。
    • GWNET: 结合时间卷积网络(TCN)和GCN提出的图波网(Graph Wavenet),用于捕捉MTS的空间时间依赖性。
  2. 图学习方法 (Graph Learning):
    • 空间注意力机制: 设计用于学习图结构中交通特征和变量嵌入的空间注意力分数。
    • 动态图学习: 提出用于探索变量之间空间时间依赖性的解耦空间时间框架和动态图学习方法。
  3. 数据插补方法 (Imputation Method):
    • 经典插补模型: 依赖于时间序列的上下文信息来恢复缺失值。
    • 深度学习基础的插补方法: 结合时间序列的上下文信息和空间相关性来生成合理的缺失值。
    • GNN-based 方法: 结合GCN和序列模型来分析缺失数据和正常数据之间的空间时间依赖性,并恢复所有缺失数据。
  4. 其他相关研究:
    • 时间序列分析: 包括时间序列的模式识别、异常检测和预测等。
    • 图神经网络: 用于捕捉数据的空间相关性,包括图卷积网络(GCN)和其他图基模型。

这些研究为本文提出的GinAR模型提供了理论基础和技术支持。特别是,STGNNs在捕捉多变量时间序列的空间时间依赖性方面取得了显著进展,但它们在处理不完整数据时面临挑战。本文提出的GinAR模型正是为了解决这一问题,通过插值注意力和自适应图卷积来恢复缺失变量并重建正确的空间时间依赖性,从而提高预测性能。

Q: 论文如何解决这个问题?

GinAR

A: 论文通过提出一个名为Graph Interpolation Attention Recursive Network (GinAR)的端到端框架来解决多变量时间序列预测中变量缺失的问题。GinAR框架包含两个关键组件:

  1. 插值注意力(Interpolation Attention, IA)

    • IA的目的是生成正常变量和缺失变量之间的对应关系,然后使用注意力机制恢复所有缺失变量到合理的表示形式。
    • 通过这种方式,序列模型避免了直接挖掘没有有价值模式的缺失变量,从而纠正了时间依赖性。

    插值注意力

    蓝色代表正常变量,白色代表缺失变量,黄色代表归纳后的变量。

  2. 自适应图卷积(Adaptive Graph Convolution, AGCN)

    • AGCN用于重建所有变量之间的空间相关性。
    • 由于所有缺失变量都已恢复,AGCN可以更准确地利用它们的表示来生成更可靠的图结构,并获取更准确的空间相关性。

GinAR的工作流程如下:

  • 输入:接受包含变量缺失的历史观测数据。
  • 处理
    • 使用插值注意力(IA)模块,为每个时间步的数据生成正常变量和缺失变量之间的对应关系,并通过注意力机制恢复缺失变量。
    • 使用自适应图卷积(AGCN)模块,处理IA恢复后的表示,重建所有变量之间的空间相关性。
  • 递归建模:通过GinAR层(包含多个GinAR单元)递归地处理输入特征,同时捕获时间依赖性。
  • 输出:最终,通过一个多层感知器(MLP)解码器,预测未来所有变量的变化。

GinAR的主要贡献在于它能够在建模过程中纠正空间时间依赖性,并且通过端到端的方式避免了两阶段模型中的误差累积问题。实验结果表明,即使在90%的变量缺失的情况下,GinAR仍然能够准确地预测所有变量的未来值,这证明了其在处理变量缺失问题上的优越性能。

Q: 论文做了哪些实验?

超参设置

主实验结果

A: 论文中进行了以下实验来评估GinAR模型的性能:

  1. 实验设计
    • 数据集:选择了五个真实世界的数据集进行比较实验,包括两个交通速度数据集(METR-LA和PEMS-BAY)、两个交通流量数据集(PEMS04和PEMS08)以及一个空气质量数据集(China AQI)。
    • 基线模型:选择了十一种现有的最先进(SOTA)方法作为主要基线,包括预测模型(如MegaCRN、DSformer和STID)和带有数据恢复组件的预测模型(如LGnet、TriD-MAE、GCVRNN和BiTGraph)。
    • 设置:所有数据集统一划分为训练集、验证集和测试集,设置了历史/未来长度,并随机设置缺失变量的比例。
    • 指标:使用了三个经典指标来全面评估不同模型的预测性能:平均绝对误差(MAE)、均方根误差(RMSE)和平均百分比误差(MAPE)。
  2. 主要结果
    • 展示了所有基线和GinAR在五个数据集上的性能比较结果。
    • 分析了GinAR与其他一阶段模型和两阶段模型相比的优势,特别是在处理缺失数据和避免误差累积方面。
  3. 消融实验(Ablation Study):
    • 为了证明GinAR中各个组件的重要性,进行了消融实验,包括移除插值注意力(IA)、预定义图(PG)和自适应图学习(AG)。
  4. 插值注意力性能评估(Performance Evaluation of IA):
    • 将插值注意力与其他数据插补方法(如GRIN、GATGPT、GPT4TS和TimesNet)进行比较,以评估它们对STID模型性能提升的效果。
  5. 超参数实验(Hyperparameter Experiment):
    • 评估了三个主要超参数(嵌入大小、变量嵌入大小和层数)对GinAR预测效果的影响。
  6. 可视化(Visualization):
    • 通过可视化GinAR在不同缺失率下的输入特征和预测结果,展示了模型在空间维度上的预测效果。

这些实验结果表明,GinAR在多变量时间序列预测任务中,尤其是在存在变量缺失的情况下,具有优越的性能和实际应用价值。

消融实验

插补结果

超参实验

可视化映射

Q: 总结一下论文的主要内容

A: 这篇论文的主要内容包括以下几个方面:

  1. 问题背景:论文针对多变量时间序列预测(MTSF)中存在的变量缺失问题进行了研究。在现实世界中,由于数据收集器故障、维修耗时等因素,收集完整的历史观测数据非常困难,这严重影响了预测模型的性能。
  2. 现有方法局限性:传统的空间时间图神经网络(STGNNs)在处理MTSF时依赖于历史数据的完整性,但在变量缺失的情况下,它们容易捕获错误的空间时间依赖关系,导致预测性能下降。
  3. GinAR模型提出:为了解决上述问题,论文提出了一种新颖的图插值注意力递归网络(GinAR)。GinAR包含两个关键组件:
    • 插值注意力(Interpolation Attention, IA):用于生成正常变量和缺失变量之间的对应关系,并通过注意力机制恢复缺失变量。
    • 自适应图卷积(Adaptive Graph Convolution, AGCN):用于重建所有变量之间的空间相关性。
  4. 端到端框架:GinAR是一个端到端框架,可以在建模过程中同时纠正空间时间依赖关系,避免两阶段模型中的误差累积问题。
  5. 实验验证:论文在五个真实世界的数据集上进行了广泛的实验,包括交通速度、交通流量和空气质量数据。实验结果表明,GinAR在所有数据集上都优于11个现有的基线模型,即使在90%的变量缺失的情况下,GinAR仍然能够准确预测所有变量的未来值。
  6. 主要贡献:论文的主要贡献在于提出了第一个挑战性的工作,即在变量缺失的情况下实现MTSF的端到端框架,并通过精心设计的GinAR模型,有效地解决了建模过程中的误差累积问题。
  7. 未来工作:论文最后提出了未来的研究方向,包括优化GinAR的效率,以及在具有更大空间维度和更复杂空间相关性的数据集上进行研究。

了第一个挑战性的工作,即在变量缺失的情况下实现MTSF的端到端框架,并通过精心设计的GinAR模型,有效地解决了建模过程中的误差累积问题。
7. 未来工作:论文最后提出了未来的研究方向,包括优化GinAR的效率,以及在具有更大空间维度和更复杂空间相关性的数据集上进行研究。

总结来说,这篇论文针对多变量时间序列预测中的变量缺失问题,提出了一个创新的解决方案GinAR,并通过实验验证了其有效性。这项工作为解决实际问题提供了新的思路和方法。

🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/691428.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

实战 | 通过微调SegFormer改进车道检测效果(数据集 + 源码)

背景介绍 SegFormer:实例分割在自动驾驶汽车技术的快速发展中发挥了关键作用。对于任何在道路上行驶的车辆来说,车道检测都是必不可少的。车道是道路上的标记,有助于区分道路上可行驶区域和不可行驶区域。车道检测算法有很多种,每…

【python报错】TypeError: ‘dict_values‘ Object IsNot Subscriptable

【Python报错】TypeError: ‘dict_values’ object is not subscriptable 在Python中,字典(dict)提供了几种不同的视图对象,包括dict_keys、dict_values和dict_items。这些视图对象允许你以只读方式遍历字典的键、值或键值对。如果…

【大学物理】期末复习双语笔记

3 vectors and scalar 20 damped harmonic motion,forced harmonic motion, superposition of SHM damped harmonic motion underdamped motion:欠阻尼 critical damped零界阻尼 over damped过阻尼 energy of damped harmonic motion application of damped oscillation:减震器…

springboot + Vue前后端项目(第十五记)

项目实战第十五记 写在前面1.后端接口实现1.1 用户表添加角色字段1.2 角色表增加唯一标识字段1.3 UserDTO1.4 UserServiceImpl1.5 MenuServiceImpl 2. 前端实现2.1 User.vue2.2 动态菜单设计2.2.1 Login.vue2.2.2 Aside.vue 2.3 动态路由设计2.3.1 菜单表新增字段page_path2.3.…

HuggingFace团队亲授大模型量化基础: Quantization Fundamentals with Hugging Face

Quantization Fundamentals with Hugging Face 本文是学习https://www.deeplearning.ai/short-courses/quantization-fundamentals-with-hugging-face/ 这门课的学习笔记。 What you’ll learn in this course Generative AI models, like large language models, often exce…

基于OpenVINO实现无监督异常检测

异常检测(AD) 在欺诈检测、网络安全和医疗诊断等关键任务应用中至关重要。由于数据的高维性和底层模式的复杂性,图像、视频和卫星图像等视觉数据中的异常检测尤其具有挑战性。然而,视觉异常检测对于检测制造中的缺陷、识别监控录像中的可疑活动以及检测医…

应用广义线性模型二|二响应广义线性模型

系列文章目录 文章目录 系列文章目录一、二响应模型的不同表达方式和响应函数二、二响应模型的性质(一)二响应变量的条件数学期望与方差(二)二响应模型参数的极大似然估计(三)二响应模型的优势 三、二响应模…

算法人生(21):从“React框架”看“情绪管理”

说起React框架,我们知道它是一种由Facebook开发和维护的开源JavaScript库,主要用于构建用户界面,特别是单页应用程序(SPA)。React框架围绕组件化,即把用户界面拆分为可复用的独立组件,每个组件负…

OpenCV 4.10 发布

OpenCV 4.10 JPEG 解码速度提升 77%,实验性支持 Wayland、Win ARM64 根据 “OpenCV 中国团队” 介绍,从 4.10 开始 OpenCV 对 JPEG 图像的读取和解码有了 77% 的速度提升,超过了 scikit-image、imageio、pillow。 4.10 版本的一些亮点&…

SpringBoot+Vue甘肃非物质文化网站(前后端分离)

技术栈 JavaSpringBootMavenMySQLMyBatisVueShiroElement-UI 系统角色对应功能 用户管理员 系统功能截图

Dockerfille解析

用于构建Docker镜像的文本,由一条条指令构成 Docker执行Dockerfile的流程 1. Docker从基础镜像执行一个容器 2. 执行一条指令并对容器进行修改 3. 执行类型Docker commit的命令添加一个新的镜像层 4. Docker再基于新的镜像执行一个新的容器 5. 执行Dockerfile中…

小阿轩yx-iptables 防火墙

小阿轩yx-iptables 防火墙 Linux 防火墙基础 体系主要工作在 网络层针对TCP/IP 数据包实施过滤和限制 属于典型的包过滤防火墙(或者称为网络层防火墙) 体系基于内核编码实现 好处 具有非常稳定的性能高效率 防火墙两个表示 netfilteriptables …

C语言 数组——数组的其他应用之筛法求素数

目录 数组的其他应用 求100以内的所有素数 筛法求100以内的所有素数 自顶向下、逐步求精设计算法 数组的其他应用 求100以内的所有素数 筛法求100以内的所有素数 自顶向下、逐步求精设计算法 step 1:设计总体算法  初始化数组a,使a[2]2, a[3]3,..…

10-指针进阶——char型,多级指针,void指针,const指针

10-指针进阶——char型,多级指针,void指针,const指针 文章目录 10-指针进阶——char型,多级指针,void指针,const指针一、char 型指针1.1 示例 二、多级指针2.1 示例 三、 指针的万能拆解方法3.1 示例 四、v…

CMakeLists如何多行注释

在使用Visual Studio编写CMakeLists的时候你可能会遇到需要多行注释的情况,可又不知道快捷键是什么。。。 其实你只需要敲个 #[[ 就行了,另外一般方括号VS会自动帮你补全,之后将需要注释的内容放在第二个方括号与第三个方括号之间就完成注释…

Nvidia Jetson/Orin/算能 +FPGA+AI大算力边缘计算盒子:潍柴雷沃智慧农业无人驾驶

潍柴雷沃智慧农业科技股份有限公司,是潍柴集团重要的战略业务单元,旗下收获机械、拖拉机等业务连续多年保持行业领先,是国内少数可以为现代农业提供全程机械化整体解决方案的品牌之一。潍柴集团完成对潍柴雷沃智慧农业战略重组后,…

翻译《The Old New Thing》- Why isn’t there a SendThreadMessage function?

Why isnt there a SendThreadMessage function? - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20081223-00/?p19743 Raymond Chen 2008年12月23日 为什么没有 SendThreadMessage 函数? 简要 文章讨论了 Windows 中不存在 Sen…

全链路性能测试:Nginx 负载均衡的性能分析和调优

为什么性能测试很多同学觉得是一个比较难以自学上岸的测试领域,是因为真正做全链路的性能测试是比较难的。所谓的全链路就是在项目的整个链路上任何一环节都有可能存在性能测试瓶颈,我们都需要能够通过分析性能的监控指标找到对应的问题。 我们今天要讲的Nginx负载均衡就是…

Shell脚本学习_字符串变量

目录 1.Shell字符串变量:格式介绍 2.Shell字符串变量:拼接 3.Shell字符串变量:字符串截取 4.Shell索引数组变量:定义-获取-拼接-删除 1.Shell字符串变量:格式介绍 1、目标: 能够使用字符串的三种方式 …

【NI国产替代】500 MSPS 采样率,14 bit 分辨率数据采集盒子

• 双高速高精度数据采集通道 • 支持内外精准触发采样模式 • 丰富的总线控制接口 • 抗干扰能力强 高速采集盒子是一款双通道,具有 500 MSPS 采样率,14 bit 分辨率的高速高精度数据采集设备,其模拟输入带宽为 200 MHz,…