AI论文速读 |(图腾) TOTEM:通用时间序列分析的token化时间序列嵌入表示

题目:TOTEM: TOkenized Time Series EMbeddings for General Time Series Analysis

作者:Sabera Talukder ; Yisong Yue ; Georgia Gkioxari

机构:加州理工学院(Caltech)

网址https://arxiv.org/abs/2402.16412

Cool Paperhttps://papers.cool/arxiv/2402.16412

代码https://github.com/SaberaTalukder/TOTEM

关键词:时间序列token化,嵌入表示,通用时间序列分析,VQVAE

TL, DR: 提出了TOTEM,这是一种新颖的通用时间序列分析方法,它利用tokenized embeddings进行跨领域训练和零样本推理。


🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

作者简介(通讯和二作):

通讯Gkioxari是Caltech的助理教授,Mask r-cnn的二作

Georgia Gkioxari二作岳一松是Caltech的教授

岳一松 Yisong Yue

摘要

通用时间序列分析领域最近开始探索统一建模,其中可以针对特定数据集的特定任务重新训练通用架构主干。 在这项工作中,我们从一个互补的有利角度来实现统一:跨任务和领域的统一(unification across tasks and domains)。 为此,本文探索了离散的、学习的、时间序列数据表示的影响,这些数据表示能够实现通用的、跨领域的训练。 TOTEMTOkenized Time Series EMbeddings) 提出了一种简单的tokenizer架构,该架构使用以自监督方式学习的离散向量化表示来嵌入来自不同领域的时间序列数据。 TOTEM 可以跨多个任务和领域工作,只需极少的(minimal)调整甚至无需调整。 通过对 3 个任务的 17 个真实世界时间序列数据集进行广泛评估来研究 TOTEM 的功效。 评估了专家(specialist,即在每个领域训练模型)和通才(generalist,即在多个领域训练单个模型)设置,并表明 TOTEM 在几个流行的基准测试中匹配或优于以前的最佳方法。

Q: 这篇论文试图解决什么问题?

A: 这篇论文提出了一个名为TOTEM(TOkenized Time Series EMbeddings)的方法,旨在解决通用时间序列分析中的几个关键问题:

  1. 统一建模(Unified Modeling):传统的时间序列分析通常采用专家训练(specialist training),即针对特定任务和数据集训练模型。TOTEM探索了一种跨任务和领域的统一建模方法,即在多个任务和数据集上共同训练一个模型,以实现更好的泛化能力。
  2. 跨领域和任务的通用性(Cross-Domain and Task Generality):TOTEM通过学习离散的、可学习的时序数据表示,使得模型能够在不同领域和任务之间进行迁移和泛化。这种方法减少了对特定领域知识的依赖,提高了模型的适用性。
  3. 零样本学习(Zero-Shot Learning):TOTEM还探讨了零样本学习的可能性,即在没有见过某些测试领域数据的情况下,模型能否进行有效的预测。这对于实际应用中快速适应新领域具有重要意义。
  4. 数据表示(Data Representation):论文强调了学习有效的数据表示的重要性,并提出了一种基于向量量化变分自编码器(VQVAE)的离散数据表示方法。这种表示方法有助于简化模型架构,同时保持对时间序列数据的丰富捕捉。
  5. 性能评估(Performance Evaluation):TOTEM在多个真实世界的时间序列数据集上进行了广泛的评估,包括插值(imputation)、异常检测(anomaly detection)和预测(forecasting)任务。通过与现有最佳方法的比较,TOTEM展示了其在不同任务和领域中的竞争力。

总的来说,TOTEM试图通过一种统一的、跨领域的建模方法,提高时间序列分析的通用性和适应性,同时保持或提高模型在特定任务上的性能。

Q: 有哪些相关研究?

A: 论文中提到的相关研究主要集中在时间序列建模和数据表示方法上。以下是一些关键的相关研究领域和具体工作:

  1. 时间序列建模方法
    • 统计方法:如指数平滑(Exponential Smoothing)和自回归模型(Autoregressive Models)。
    • 机器学习方法:包括多层感知器(MLPs)、卷积神经网络(CNNs)、循环神经网络(RNNs)和变换器(Transformers)。
  2. 数据表示学习
    • 向量量化变分自编码器(VQVAEs):用于学习离散的数据表示。
    • 语言和视觉建模中的统一数据表示:如自然语言处理中的通用token化表示。
  3. 时间序列分析的统一架构
    • 探索在不同时间序列任务上使用共享模型架构的方法,例如使用语言和视觉模型的骨干网络。
  4. 零样本学习和泛化能力
    • 研究在不同数据集上训练的模型在未见过的领域上的性能,以及如何通过零样本学习提高模型的泛化能力。
  5. 特定任务的时间序列分析
    • 针对特定任务(如预测、异常检测、插值)的时间序列分析方法,这些方法通常采用专家训练模式。
  6. 多任务学习
    • 同时在多个时间序列任务上训练模型,以提高模型的泛化能力和效率。
  7. 时间序列数据的预处理和特征工程
    • 研究如何通过数据预处理和特征工程来提高时间序列模型的性能。
  8. 时间序列的深度学习模型
    • 研究如何利用深度学习技术来捕捉时间序列数据的复杂模式和依赖关系。

这些相关研究为TOTEM提供了理论和技术基础,同时也展示了时间序列分析领域的多样性和不断发展。TOTEM通过结合这些研究成果,提出了一种新的统一建模方法,旨在提高时间序列分析的通用性和跨领域能力。

TOTEM

  • (a):TOTEM的VQVAE架构
  • (b):离散,自监督的codebook可利用于跨域和零样本测试

Q: 论文如何解决这个问题?

A: 论文通过提出TOTEM(TOkenized Time Series EMbeddings)方法来解决通用时间序列分析的问题。TOTEM的核心是一个简单的tokenizer架构,它使用离散的、自监督学习的方式嵌入来自不同领域的时间序列数据。以下是TOTEM解决这个问题的关键步骤:

  1. 离散数据表示:TOTEM使用向量量化变分自编码器(VQVAE)来学习时间序列数据的离散表示。这种表示方式使得模型能够在不同任务和领域之间进行泛化。
  2. 自监督学习:TOTEM的tokenizer通过自监督学习的方式训练,这意味着它不需要针对特定任务的标签。这种方法简化了训练过程,并允许模型在多个任务上进行训练。
  3. 统一的模型架构:TOTEM设计了一个统一的模型架构,该架构可以在不同的时间序列任务(如插值、异常检测和预测)上进行训练和测试,而无需进行大量调整。
  4. 跨领域和任务的泛化能力:通过在多个数据集和任务上共同训练,TOTEM能够学习到通用的特征表示,从而在不同领域和任务上实现良好的性能。
  5. 零样本测试:TOTEM在零样本测试中表现出色,即使在没有见过的领域上也能进行有效的预测。这表明模型能够很好地泛化到新的测试领域。
  6. 广泛的评估:TOTEM在17个真实世界的时间序列数据集上进行了评估,涵盖了3个不同的任务。这些评估结果证明了TOTEM在专家(针对单个领域的训练)和通用(针对多个领域的训练)设置中的有效性。
  7. 性能比较:论文将TOTEM与现有的最佳方法进行了比较,展示了TOTEM在多个流行基准数据集上匹配或超越现有方法的性能。

通过这些方法,TOTEM旨在提供一个通用的时间序列分析框架,该框架能够在不同的任务和领域中实现高性能,同时减少对特定领域知识的依赖。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

预测任务需要在VQVAE之外进行建模。TOTEM预训练的,学习到的,离散的Code作为输入数据表示,并训练一个Transformer编码器。沿着时间维度添加位置嵌入,并在最终输出之前使用线性层,以及对结果预测进行解归一化

Q: 论文做了哪些实验?

最好:蓝色

次好:浅红

第三:橘色

个人认为这个对baseline结果的说明很好:在设置一样的情况下采用前文的结果,并注明参考的是哪篇文章baseline的结果。

baseline values are from (Zhou et al., 2023(one fits all, NeurIPS23 Spotlight); Wu et al., 2022a(TimesNet, ICLR 2023))

插补(specialist)

插补(generalist)
异常检测(specialist)
异常检测(generalist)

预测(specialist)

预测(generalist)

A: 论文中进行了一系列实验来评估TOTEM方法在不同时间序列分析任务上的性能。以下是主要的实验内容:

  1. 插值(Imputation)
    • 在多个时间序列数据集上进行插值任务的评估,包括不同的掩码百分比(例如12.5%,25%,37.5%,50%)。
    • 使用均方误差(MSE)和平均绝对误差(MAE)作为评价指标。
    • 对比专家(single-task)和通用(generalist)训练设置下的性能。
  2. 异常检测(Anomaly Detection)
    • 在多个数据集上进行异常检测任务的评估,考虑已知的异常百分比。
    • 使用精确度(Precision)、召回率(Recall)和F1分数作为评价指标。
    • 同样对比了专家和通用训练设置下的性能。
  3. 预测(Forecasting)
    • 在多个数据集上进行时间序列预测任务的评估,考虑不同的预测长度(例如96, 192, 336, 720时间步)。
    • 使用MSE和MAE作为评价指标。
    • 对比了专家、通用以及零样本(zero-shot)测试设置下的性能。
  4. 消融实验(Ablations)
    • 进行了消融实验来评估离散表示(tokens)对TOTEM性能的影响,通过与没有使用VQVAE的TimeTOTEM模型进行对比。
    • 探索了码本大小(codebook size)对VQVAE重建性能的影响。
  5. 探索性研究(Exploratory Studies)
    • 训练了使用通用码本但特定于数据集的变换器预测器的模型,以进一步探索通用码本数据表示的能力。
    • 对比了混合模型(使用通用码本但特定于数据集的预测器)与通用和专家模型的性能。
  6. 零样本性能(Zero-Shot Performance)
    • 评估了在零样本设置下,专家模型和通用模型的性能,即在训练时未见过的领域上进行测试。

这些实验涵盖了时间序列分析的多个关键方面,包括模型的泛化能力、跨领域性能、以及在不同任务和数据集上的表现。通过这些实验,论文全面地展示了TOTEM方法的有效性和优越性。

附录还有好多实验,感兴趣的读者可以点击阅读原文,获取更多细节。

Q: 总结一下论文的主要内容

A: 这篇论文介绍了TOTEM(TOkenized Time Series EMbeddings),这是一个用于通用时间序列分析的方法。以下是论文的主要内容总结:

  1. 问题背景:传统的时间序列分析通常采用专家训练,针对特定任务和数据集训练模型。这种方法在泛化到新领域时可能面临挑战。为了解决这个问题,论文提出了一种跨任务和领域的统一建模方法。
  2. TOTEM方法:TOTEM通过一个简单的tokenizer架构,使用离散的、自监督学习的方式嵌入时间序列数据。这种方法允许模型在不同任务和领域之间进行泛化,而无需大量调整。
  3. 核心贡献
    • 提出了TOTEM,一个跨领域和任务的时间序列分析方法。
    • 展示了TOTEM在多个真实世界数据集上的性能,包括插值、异常检测和预测任务。
    • 在专家和通用训练设置下,TOTEM在多个流行基准数据集上匹配或超越了现有最佳方法。
  4. 实验评估:论文在17个真实世界时间序列数据集上进行了广泛的评估,包括3个不同的任务。实验结果表明,TOTEM在专家和通用设置下都表现出色,尤其是在零样本测试中。
  5. 消融实验:通过与没有使用VQVAE的TimeTOTEM模型进行对比,证明了离散表示(tokens)对TOTEM性能的重要性。
  6. 探索性研究:论文还探讨了通用码本数据表示的能力,并比较了混合模型与通用和专家模型的性能。
  7. 未来工作:论文提出了一些未来研究方向,包括动态token长度、更广泛的数据集和任务、多模态数据融合、解释性和可视化、实时预测和在线学习等。
  8. 伦理和社会影响:论文讨论了时间序列模型可能带来的隐私、误用和经济影响等伦理和社会问题。

表示的能力,并比较了混合模型与通用和专家模型的性能。
7. 未来工作:论文提出了一些未来研究方向,包括动态token长度、更广泛的数据集和任务、多模态数据融合、解释性和可视化、实时预测和在线学习等。
8. 伦理和社会影响:论文讨论了时间序列模型可能带来的隐私、误用和经济影响等伦理和社会问题。

总的来说,TOTEM是一个创新的时间序列分析方法,它通过统一的建模框架和离散的数据表示,提高了模型在不同任务和领域中的泛化能力和性能。
🌟【紧跟前沿】“时空探索之旅”与你一起探索时空奥秘!🚀
欢迎大家关注时空探索之旅时空探索之旅QRCode

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/541427.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity DOTS1.0 入门(3) System与SystemGroup 概述

System与SystemGroup 概述 System System是提供一种代码逻辑,改变组件的数据状态,从一个状态到另外一个状态System在main thread里面运行, system.Update方法每一帧执行一次(其他线程中运行的就是JobSystem的事情了)System是通过一个System Group这个体系来决定它…

【计算机毕业设计】企业销售人员培训——后附源码

🎉**欢迎来到琛哥的技术世界!**🎉 📘 博主小档案: 琛哥,一名来自世界500强的资深程序猿,毕业于国内知名985高校。 🔧 技术专长: 琛哥在深度学习任务中展现出卓越的能力&a…

《积极情绪的力量》 - 三余书屋 3ysw.net

积极情绪的力量 大家好,今天我们解读的这本书名为《积极情绪的力量》。在情绪的世界里,我们可以分为积极和消极两类,但让人留下深刻印象的是,许多人更容易体验到消极情绪,如抑郁、恐惧、焦虑、挫败和烦躁等。这并非令…

【JavaSE进阶】00-基础语法(13-14章) 01-面向对象 02-数组 03-常用类 04-异常处理

13 第十三章 方法覆盖和多态(Polymorphism)★★★★★ 13.1 章节目标与知识框架 13.1.1 章节目标 理解在什么情况下我们需要进行方法覆盖?掌握在满足什么条件的时候构成方法覆盖?什么是多态,代码怎么写?向上转型和向下转型都是…

谷歌推出全新AI代码辅助工具Code Assist,挑战GitHub Copilot|TodayAI

在其Cloud Next大会上,谷歌推出了一款名为Code Assist的AI驱动代码完成工具。该工具原名为Duet AI,现增强了功能并与流行的编辑器兼容。 Code Assist不仅与GitHub的Copilot Enterprise直接竞争,还以百万级的token上下文窗口自豪,…

Vue3.4 中自定义组件 v-model 双向数据绑定

父组件如下: 虽然下面userName没有使用 v-model.userName"userName"的写法,它默认与子组件中 defineModel();中不指定参数的变量对应, 只能有一个不指定名称,否则会报如下错 <template><div>{{ userName}}- {{ age}}- {{ sex }}<!-- 自定义子组件 Per…

【Linux 学习】进程优先级和命令行参数!

1. 什么是优先级? 指定进程获取某种资源&#xff08;CPU&#xff09;的先后顺序&#xff1b; Linux 中优先级数字越小&#xff0c;优先级越高&#xff1b; 1.1 优先级和权限的区别&#xff1f; 权限 &#xff1a; 能不能做 优先级&#xff1a; 已经能了&#xff0c;但是获…

网页input框自动填充问题

autocomplete 大部分查询解决办法是设置&#xff0c;autocompleteoff&#xff0c;关于autocomplete的含义&#xff0c;官网参考如下: HTML attribute: autocomplete - HTML: HyperText Markup Language | MDN 在 autocomplete 的文档中说明了 value 为 off 时&#xff0c;浏览…

【Canvas与艺术】绘制黄色三角生化危险标志

【关键点】 系统函数arcTo函数的用法及自编函数createRegTriArr的灵活运用。 【成果图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head>&…

ZooKeeper分布式服务与Kafka消息队列+ELKF整合方案

前言 ZooKeeper 是一个分布式的、开放源码的分布式应用程序协调服务&#xff0c;提供配置维护、命名服务、分布式同步、组服务等功能&#xff1b; Kafka 是一个开源的分布式流处理平台&#xff0c;它被设计用来处理实时数据流&#xff0c;包括发布和订阅消息系统、日志收集以…

napi系列学习进阶篇——NAPI生命周期

什么是NAPI的生命周期 我们都知道&#xff0c;程序的生命周期是指程序从启动&#xff0c;运行到最后的结束的整个过程。生命周期的管理自然是指控制程序的启动&#xff0c;调用以及结束的方法。 而NAPI中的生命周期又是怎样的呢&#xff1f;如下图所示&#xff1a; 从图上我们…

WordPress 图片压缩插件:Compress JPEG PNG images 使用方法

插件介绍 Compress JPEG & PNG images是一款非常好用的图片压缩插件:&#xff0c;非常值得大家安装使用&#xff1b;特别是图片类型网站。其实我们很多服务器磁盘空间是不在乎多那么几十 MB 大小的&#xff0c;但是压缩了图片能提升网站速度&#xff0c;节省宽带&#xff…

入门:多层感知器Multiple-Layer Perceiver, MLP

本文将简单介绍多层感知器&#xff08;MLP&#xff09;的基本概念、原理和应用。MLP是一种前馈人工神经网络&#xff0c;由多层节点组成&#xff0c;每层节点通过权重和偏置与下一层节点相连。MLP在许多领域都有广泛的应用&#xff0c;如分类、回归、自然语言处理等。 本文将分…

软考数据库---2.SQL语言

主要记忆&#xff1a;表、索引、视图操作语句&#xff1b;数据操作&#xff1b;通配符、转义符&#xff1b;授权&#xff1b;存储过程&#xff1b;触发器 这部分等等整理一下: “”" 1、 数据定义语言。 SQL DDL提供定义关系模式和视图、 删除关系和视图、 修改关系模式的…

基于ssm的大学生租房平台的设计与实现(java源码+文档)

风定落花生&#xff0c;歌声逐流水&#xff0c;大家好我是风歌&#xff0c;混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的大学生租房平台。项目源码以及部署相关请联系风歌&#xff0c;文末附上联系信息 。 项目简介&#xff1a; 大学生租房平台的设计与实现的主…

Python数据分析可视化之Pandas的使用

一、项目介绍 数据获取与存储&#xff1a;能够使用Python财经数据接口包tushare下载股票交易数据&#xff0c;并将数据保存到CSV文件或MySQL数据库中。数据处理&#xff1a;能够用Pandas从CSV文件、Excel文件以及MySQL数据库中读取数据。能够使用Pandas对数据进行简单处理和深…

某狗网歌曲接口逆向之加密算法刨析

逆向网址 aHR0cHM6Ly93d3cua3Vnb3UuY29t 逆向链接 aHR0cHM6Ly93d3cua3Vnb3UuY29tL21peHNvbmcvN2dxcGVzNjguaHRtbA 逆向接口 aHR0cHM6Ly93d3dhcGkua3Vnb3UuY29tL3BsYXkvc29uZ2luZm8 逆向过程 请求方式&#xff1a;GET 逆向参数 signature:1898d8f157837fadc9751fdacf1398f9 …

天猫精灵要会员,不能听歌,还能用来干什么呢?榨干它的剩余价值

目录 起因&#xff1a;以听歌为主要功能的设备&#xff0c;却不能听歌了 1.蓝牙音箱 2.控制智能家电 3.万能遥控器&#xff0c;需要一个外接设备 4.倒计时/提醒&#xff0c;闹钟提醒&#xff0c;整点提醒&#xff08;这功能有人不喜欢&#xff0c;闲吵&#xff0c;还不能关…

职场证件照:不只是一张照片那么简单,这些细节请注意

随着毕业季的到来&#xff0c;许多应届生已经开始在各自的岗位上实习&#xff0c;准备迎接转正的挑战。在这个过程中&#xff0c;一张得体的职场证件照将成为你职业生涯中的一张重要名片。在职场中&#xff0c;证件照的应用场景多种多样&#xff0c;从窗口岗位的公示到工作牌上…

Pytorch Windows EOFError: Ran out of input when num_workers>0

关于深度学习的一些学习框架,我使用过pytorch,caffe,caffe2,openchatkit,oneflow等,最近我将长达几十万字的报错手册重新进行了整理,制作出一个新的专栏,主要记录这几种常见的开发框架在安装和使用过程中常见的报错,以及我是如何解决掉的,以此来帮助更多的深度学习开…