kaggle竞赛宝典 | 最新时间序列统一大模型,秒杀各类时序任务!

本文来源公众号“kaggle竞赛宝典”,仅用于学术分享,侵权删,干货满满。

原文链接:最新时间序列统一大模型,秒杀各类时序任务

作者:Fareise

最新时间序列统一大模型UniTS,秒杀各类时序任务!

今天给大家介绍一下哈佛和MIT最近联合发表的最新时间序列大模型工作,构建了一个统一的时间序列模型,能够处理各类时间序列任务,在38种不同的时间序列任务中,有27个都取得了最优效果。 

论文标题:UniTS: Building a Unified Time Series Model

下载地址https://arxiv.org/pdf/2403.00131v1.pdf

1 时间序列统一建模挑战

时间序列统一建模包括很多挑战,主要有数据差异和任务差异2个方面。

  • 数据差异:不同于NLP、CV等数据,不同领域的数据遵循相同的规律,时间序列数据在不同领域可能存在很大的差别,包括时序上的规律、周期性等等,异构的多源数据联合建模难度较大,并且不同类型数据的序列长度、变量数量也不一样,给统一建模带来很大难度;
  • 任务差异:时间序列包括分类、预测、填充、异常检测等多种类型的任务,而每种任务的目标差异很大,比如回归任务和分类任务的差异,预测和填充的差异等等,如何让一个模型能适配多种类型任务是一个难题。

为了解决上述问题,搭建统一时间序列模型,本文提出了UniTS方法核心是通过prompt的方式将各类任务进行统一,并通过时间维度和变量维度self-attention搭建对输入数据格式不敏感的统一模型,能够处理不同的数据类型。

2 统一序列输入

UniTS中为了统一各种类型的任务,实现一个模型统一处理,将原始的时间序列数据转换成了3种类型的token,分别是sequence token、prompt token、task token

  1. Sequence Token:sequence token对应原始的时间序列,使用不重叠的窗口将原始序列划分成patch,每个patch通过MLP映射,得到sequence token的embedding;
  2. Prompt Token:prompt token类似于NLP中的soft prompt思路,生成几个可学习的prompt embedding,拼接到上述sequence token,主要用来根据任务特性来吸收序列中的上下文信息,每个任务有其特征的prompt embedding,这样对于同一条数据,针对不同的任务的prompt不同,对应的提取上下文的信息也不同;
  3. Task Token:task token用于实现不同任务的统一,包括mask token和cls token,前者用来统一时间序列预测、时间序列填充,mask的部分生成的结果是预测结果,cls token用来做时间序列分类相关的任务。

3 统一模型结构

下面介绍UniTS的统一模型结构,主要包括序列和变量维度的attention、卷积、Gate、DyLinear三个部分。

  • 序列和变量维度的attention:时间序列使用patch序列的self-attention实现,变量维度会将时间维度attention中的Query和Key做pooling后,做一个变量维度整体的self-attention;
  • 卷积网络:对于输入的序列,使用一个3维卷积提取局部信息;
  • Gate网络:由于不同数据集的分布差异,文中使用一个gate网络对输入特征做场景个性化缩放,使用上一层输入过一个sigmoid生成缩放因子,乘到本层输出中;
  • Dynamic MLP:由于不同数据输入的长度不一样,传统的attention后面接的MLP网络输入长度不一样,MLP的权重尺寸会变化。为了解决这个问题,文中采用了DyLinear,其思路是对原始的MLP权重,根据输入向量长度的大小做双线性插值,生成和输入维度匹配的MLP权重;

4 模型训练

训练包括预训练阶段和finetune阶段。在预训练阶段,采用的是reconstruction任务,对时间序列的数据进行部分mask,然后进行还原;在finetune阶段,随机采样各类任务的数据进行多任务联合finetune,分类任务使用交叉熵损失,预测任务使用MSE。

5 实验结果

文中在各类数据集上进行了实验,使用统一模型的效果对比各个任务上的SOTA模型,以及GPT4TS等其他类型的统一模型效果,在38个任务上有27个任务都取得了最优效果。

THE END!

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/502770.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ubuntu20.04安装截图工具flameshot

ubuntu20.04 自带的截图工具,可以使用快捷键“shift printScreen” ,但是它不能对截图进行编辑。 现在安装截图工具 flameshot,使用以下命令: sudo apt install flameshot 安装完成后,使用以下命令打开: flamesho…

Flutter 开发学习笔记(1):第一个简单的Flutter项目(上)

文章目录 前言相关链接初始化项目设置键盘映射建议使用AnLink链接物理机。 项目配置日志打印官方案例添加依赖主函数更换添加最简单的按钮Flutter 项目结构Flutter项目入口Flutter的MyApp函数 更新视图直接修改浅拷贝父节点数据思考 修改布局子节点重构子节点布局重构多次扩展布…

操作系统--死锁

目录 说明使用互斥锁时死锁是如何发生的。 系统模型: 死锁的特性: 处理死锁的方法: 死锁的预防: 死锁避免: 说明使用互斥锁时死锁是如何发生的。 我们先来看一个例子: 当两列火车在十字路口逼近时&am…

linux忘记mysql的root密码,强制修改

1、登录linux后编辑mysql的配置文件:vi /etc/my.cnf 2、添加如下代码,表示跳过授权表登录mysql 编辑完成后,按Esc键,":wq"退出编辑并保存修改内容。 3、使用命令:service mysqld restart 重启mysql服务. …

【No.21】蓝桥杯组合数学|数位排序|加法计数原理|乘法计数原理|排列数|组合数|抽屉原理|小蓝吃糖果|二项式定理|杨辉三角|归并排序(C++)

组合数学 数位排序 【问题描述】 小蓝对一个数的数位之和很感兴趣,今天他要按照数位之和给数排序。当两个数各个数位之和不同时,将数位和较小的排在前面,当数位之和相等时,将数值小的排在前面。 例如,2022 排在 409 前面, 因为 2022 的数位之和是 6,小于 409 的数位 之和 13。…

【Web应用技术基础】JavaScript(1)——案例:猜数字

上一个博客发了视频。这个博客因为不能插入视频&#xff0c;所以给大家一张一张截图的 点击“重新开始一局游戏” <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"…

Java类与对象:从概念到实践的全景解析!

​ 个人主页&#xff1a;秋风起&#xff0c;再归来~ 文章专栏&#xff1a;javaSE的修炼之路 个人格言&#xff1a;悟已往之不谏&#xff0c;知来者犹可追 克心守己&#xff0c;律己则安&#xff01; 1、类的定义格式 在java中定义类时需要用到…

Spring: 在SpringBoot项目中解决前端跨域问题

这里写目录标题 一、什么是跨域问题二、浏览器的同源策略三、SpringBoot项目中解决跨域问题的5种方式&#xff1a;使用CORS1、自定 web filter 实现跨域(全局跨域)2、重写 WebMvcConfigurer(全局跨域)3、 CorsFilter(全局跨域)4、使用CrossOrigin注解 (局部跨域) 一、什么是跨域…

matlab 点云可视化(6)——点云按强度进行可视化

目录 一、功能概述1、算法概述2、主要函数二、代码示例三、结果展示四、参考链接本文由CSDN点云侠原创原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫。 一、功能概述 1、算法概述 点云按强度进行可视化 2、主要函数

Request和Response

Request&#xff08;请求&#xff09;&Response&#xff08;响应&#xff09; Request&#xff1a;获取请求数据 Response&#xff1a;设置响应数据 Request继承体系 1.Tomcat需要解析请求数据&#xff0c;封装为request对象&#xff0c;并且创建request对象传递到servic…

分治实现快速排序和归并排序

本文用于记录个人算法竞赛学习&#xff0c;仅供参考 一.快速排序&#xff08;升序为例&#xff09; 思想&#xff1a;确定分界点x&#xff0c;将小于分界点的值放在分界点的左边&#xff0c;将大于分界定的值放在分界点的右边&#xff0c;再递归处理两边的左右区间。 步骤&am…

HR应用人才测评开展招聘,可以显著提升效率

某汽车零部件武汉有限公司诚聘库管员1名…… 孟X毅&#xff0c;男&#xff0c;29岁,市场营销专业,做过生产主管,求一份白班工作。 王X宸&#xff0c;女&#xff0c;22岁&#xff0c;有一年会计经验&#xff0c;求相似工作。 张汉X&#xff0c;男&#xff0c;31岁&#xf…

Python程序怎么打包成exe文件

前言 pyinstaller可以将.py文件打包成.exe可执行文件&#xff0c;即使别人的电脑上没有搭建Python环境&#xff0c;也是可以直接运行程序的。 pyinstaller安装 首先打开cmd&#xff0c;在里面输入下面这一行命令&#xff0c;回车即可。 pip install pyinstaller 我运行命令…

TR2 - Transformer模型的复现

目录 理论知识模型结构结构分解黑盒两大模块块级结构编码器的组成解码器的组成 模型实现多头自注意力块前馈网络块位置编码编码器解码器组合模型最后附上引用部分 模型效果总结与心得体会 理论知识 Transformer是可以用于Seq2Seq任务的一种模型&#xff0c;和Seq2Seq不冲突。 …

Echarts地图之——如何给地图添加外边框轮廓

有时候我们希望给地图外围加一圈边框来增加美感 但实际情况中&#xff0c;我们需要把国界的边框和各个省份属于国界的边框相吻合&#xff0c;否则就会造成两者看起来是错位的感觉 这就需要我们把echarts registerMap的全国省份json和国界边框json的坐标相一致。 这个json我们可…

WEPE系统安装纯净版window11教程(包含pe内系统安装方法)

目录 一.安装u盘启动盘 1.1制作安装系统引导盘 1.2下载保存windows镜像 1.3根据自己电脑品牌查询进入BIOS设置的方法 1.4我们成功进入了PE 二.重装系统 2.1遇到问题 2.2重新来到这个界面 三.PE中基本软件的作用 四.学习声明 今天不敲代码&#xff0c;今天来讲讲We P…

PetaLinux 去除自动获取 IP 地址

问题&#xff1a;系统启动的时候会自动检测 IP 地址&#xff0c;如不需要这个功能&#xff08;该过程需耗时十几秒&#xff09;。可以自定义 IP 地址&#xff0c;去掉这一步。 操作步骤如下&#xff1a; 所有命令均需在非管理员模式下执行 1. 初始化 PetaLinux 运行环境 运行…

LabVIEW车载轴承振动监测系统

LabVIEW车载轴承振动监测系统 随着汽车工业的快速发展&#xff0c;车用轴承的稳定性和可靠性对保障车辆安全运行越来越重要。目前&#xff0c;大多数车用轴承工作在恶劣的环境下&#xff0c;容易出现各种故障。开发了一种基于LabVIEW的车载轴承振动监测系统&#xff0c;提高车…

算法题:桃飘火焰焰,梨堕雪漠漠(Java贪心)

链接&#xff1a;桃飘火焰焰&#xff0c;梨堕雪漠漠 来源&#xff1a;牛客网 题目描述 在某游戏平台打折之际&#xff0c;EternityEternityEternity兴致勃勃地在该游戏平台上购买了nnn个不同的游戏&#xff0c;从1到nnn编号。 通过游览游戏论坛EternityEternityEternity确定…

# Apache SeaTunnel 究竟是什么?

作者 | Shawn Gordon 翻译 | Debra Chen 原文链接 | What the Heck is Apache SeaTunnel? 我在2023年初开始注意到Apache SeaTunnel的相关讨论&#xff0c;一直低调地关注着。该项目始于2017年&#xff0c;最初名为Waterdrop&#xff0c;在Apache DolphinScheduler的创建者…