时间序列的迁移学习

目录

时间序列及其研究状况: 

时间序列中存在迁移学习问题吗? 

已有的时间序列建模方法的大致思路

迁移学习如何应用于时间序列建模?


本内容摘录于王晋东老师的《迁移学习导论》 

时间序列及其研究状况: 

        所谓时间序列,指的是按照时间、空间或其他定义好的顺序形成的一条序列数据。由于时间的连续性,不难想象,时间序列数据会随着时间动态变化。特别地,时序列的一些统计信息(例如均值、方差等)会随着时间动态变化。统计学通常将此类时间序列称为非平稳时间序列。

        为解决此问题,传统方法通常基于马尔可夫假设来建模,即时间序列上的每个观测仅依赖于它的前一时刻的观测。依据此假设,隐马尔可夫模型、动态贝叶斯网络、卡尔曼滤波法,以及其他统计模型如自回归移动平均模型(Autoregressive Integrated Moving Average Model,ARIMA)等都在时间序列预测上取得了良好的效果。最近几年随着深度学习的兴起,基于循环神经网络(Recurrent Neural Networks,RNN)的方法取得了比之前这些方法更好的效果。与其相比,RNN对时间序列的时间规律不做显式的假设,依靠强大的神经网络,RNN能自动发现并建模序列中高阶非线性的关系,并且能实现长时间的预测。因此,RNN系列方法在解决时间序列建模上十分有效。

时间序列预测问题的形式化定义:

时间序列中存在迁移学习问题吗? 

我们注意到,非平稳时间序列的最大特性便是其动态变化的统计特征。故而,其数据分布也在动态变化着。在这种情形下,RNN模型尽管能够捕获一些局部的时间相关性,但是对于一个预测问题而言,对测试数据一无所知。此问题与传统的图像分类等问题并不相同:试想,时间序列建模要求我们预测未来(例如根据最近一周的天气预测未来的天气),因此未来的数据是不可知的;而在图像分类时,我们可以获取测试数据的图片。RNN在面对未知的数据分布时,很可能会发生模型漂移(Model shift)现象。因此,对时间序列进行迁移学习的主要任务就是构建一个时间无关(Temporally-invariant)的模型用于未知数据和任务。

(存在困难)

此问题无法直接应用迁移方法。首先,时间序列的数据分布具有连续性。由于每个时刻的数据分布都在改变,因此需要找到一种方法将连续的分布差异变成离散的、可计算的分布差异,同时又能最大限度地捕获整个时间序列的分布特性,以便最大化后续的迁移效果。其次,即使上一步骤能够完成,现有的迁移方法均为基于卷积神经网络的分类问题而设计,也无法直接用于RNN模型。由于上述两个挑战的存在,我们需要研究特别的算法来完成时间序列的迁移学习。

已有的时间序列建模方法的大致思路

(棘手的模型漂移问题)

已有的时间序列建模方法,这些方法包括基于距离的方法[Orsenigo and Vercellis2010Górecki and Luczak2015],基于特征变换的方法[Schäfer2015],以及基于集成学习的方法[Lines and Bagnall2014Bagnall et al.2015]。基于距离的方法通常直接利用某种相似度度量作用于原始数据上,基于特征变换的方法则期望能从数据中提取某些对时间不变的特征,基于集成学习的方法则通过多个分类器的集成来取得更好效果。这些方法均基于手动的特征提取或数据表征。基于RNN的方法则利用注意力机制[Choi et al.2016Lai et al.2018Qin et al.2017]或张量分解[Sen et al.2019]等方法来捕获时间相关性。另一类方法则将深度学习与状态空间模型(State Space Model)进行结合[Rangapuram et al.2018Salinas et al.2020]。另外,一些方法[Salinas et al.2020Vincent and Thome2019]使用了序列到序列(Sequence to Sequence)模型进行多步预测。这些方法尽管取得了很好的效果,但均未从数据分布角度对时间序列进行建模,因此在面对未知数据时很有可能发生模型漂移的问题。

迁移学习如何应用于时间序列建模?

王晋东及团队提出了针对时间序列进行建模的AdaRNN方法Adaptive RNNs[Du et al.2020b]AdaRNN方法首先将时间序列中分布动态改变的现象定义为时序分布漂移Temporal Covariate ShiftTCS)问题,并提出有效的方法来解决此问题。TCS现象如图11.5所示。AdaRNN方法为研究时间序列建模提供了一个全新的数据分布的视角。

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/7331.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux权限提升—内核、SUID、脏牛等提权

Linux权限提升—内核、SUID、脏牛等提权1. 前言2. 基础信息收集2.1. 内核、操作系统、设备信息等2.2. 用户信息2.3. 用户权限信息2.4. 环境信息2.5. 进程与服务2.6. 安装的软件2.7. 服务与插件2.8. 计划任务2.9. 是否有存放明文密码2.10. 查看与主机通信信息2.11. 日志信息3. 脚…

基于混合整数规划方法的微网电池储能容量优化配置

代码相关资源:TOPSIS法(优劣解距离法) 风电场风速两参数weibull(威布尔)分布的MATLAB小程序 遗传算法优化神经网络,对光伏出力预测的优化设计,实现了部分功能 关键词:储能容量优化 储能配置 微网 编程…

10年花费9773亿,华为完成13000颗元器件国产替代,外媒:结束了

近期,华为的消息层出不穷,就在前几天,华为就释放出2个信号,任正非为代表的巨头纷纷表态及发言,显而易见的是,如今华为正处于生死攸关的重要阶段。那么华为释放了哪2个信号呢?其一是,…

centos7离线安装docker

前言 在没有互联网的情况下想要安装某些软件用docker是十分方便的一种方式,例如oracle。原生的oracle安装是非常麻烦的,本人亲眼目睹一个专门搞oracle的公司的人安装oracle三天没有成功!因此不得不学习在没有互联网的情况下使用docker来安装…

网络层IP协议和数据链路层

目录IP协议协议头格式分片网段划分特殊的IP地址IP地址的数量限制NAT技术NAT技术背景NAT IP转换过程NAPTNAT技术的缺陷NAT和代理服务器私有IP地址和公网IP地址路由路由表生成算法数据链路层认识以太网以太网帧格式认识MAC地址对比理解MAC地址和IP地址认识MTUMTU对IP协议的影响MT…

web自动化测试:Selenium+Python基础方法封装(建议收藏)

01、目的 web自动化测试作为软件自动化测试领域中绕不过去的一个“香饽饽”,通常都会作为广大测试从业者的首选学习对象,相较于C/S架构的自动化来说,B/S有着其无法忽视的诸多优势,从行业发展趋、研发模式特点、测试工具支持&…

SpringCloud学习2(Spring Cloud Netflix)负载均衡Ribbon、Feign负载均衡、Hystix服务熔断

文章目录负载均衡RibbonRibbon的作用代码实现生产者cloud1_provider实现配置文件在HiController中编写以下代码启动集群消费者cloud1_consumer实现引入依赖编写配置文件编写启动类,并给RestTemplate配置LoadBalanced注解编写RestController来测试Feign负载均衡简介F…

信息收集与运用

目录 一.实验目的 二.实验原理 三.实验内容 一.收集信息 二.猜解密码 三.密码强度检测 源码 测试用例 程序输出结果​编辑 ​四.小结与讨论 1.举出保护个人敏感信息的方法(最少三点)。 2.如何提高你的密码强壮性,以避免黑客利用密…

Java类加载过程面试总结

什么是Java的类加载机制 Java 虚拟机一般使用 Java 类的流程为:首先将开发者编写的 Java 源代码(.java文件)编译成 Java 字节码(.class文件),然后类加载器会读取这个 .class 文件,并转换成 jav…

05.List的介绍

1. List 在集合框架中,List是一个接口,继承自Collection。 Collection也是一个接口,该接口中规范了后序容器中常用的一些方法,具体如下所示: Iterable也是一个接口,表示实现该接口的类是可以逐个元素进行遍…

仿真与测试:单元测试与Test Harness

本文描述单元测试的概念,以及Test Harness建立的方法和简单的单元测试过程。 文章目录1 单元测试1.1 场景举例1.2 简单的测试方法2 Test Harness建立2.1 模型配置2.2 创建Test Harness3 总结1 单元测试 单元测试,简单来说就是在Simulink模型中只测试一小…

63-哈希表

目录 1.哈希表的概念 2.哈希函数的概念 3.哈希函数的设计 3.1.key为整型时哈希函数的设计 3.1.1.普通整数 3.1.2.负整数 3.1.3.大整数 PS:哈希函数设计的3个要求: PS:2种类型的哈希函数(大整数) 3.2.key为其…

【数据结构】树与二叉树的基本概念及性质

目录 一、树的基本概念 1️⃣树的定义 2️⃣基本术语 3️⃣树的性质 二、二叉树的概念 1️⃣二叉树的定义 2️⃣特殊二叉树 3️⃣二叉树的性质 参考资料 一、树的基本概念 1️⃣树的定义 数据结构中的树是什么❓ 树是 个结点的有限集。有且仅有一个特定的称为根(上图A结点…

C++ [内存管理]

本文已收录至《C语言》专栏! 作者:ARMCSKGT 目录 前言 正文 计算机中内存分布 C语言的内存管理 内存申请函数 内存释放函数 C内存管理 new操作符 delete操作符 特性总结 注意 原理探究 operator new和operator delete函数 operator new的底…

【C++】STL之string的使用和模拟实现

初阶的C语法和基本的类和对象我们已经学过了,下面我们会步入一段新的旅程。本章我们将初步了解STL(标准模板库),并且深入探讨其中一个非常重要的容器———string。 目录 (一)STL简介(了解即可) &#xf…

Hashtable、HashMap、ConcurrentHashMap的区别

作者:爱塔居 专栏:JavaEE 作者简介:大三学生,希望和大家一起进步。 Hashtable和HashMap、ConcurrentHashMap 之间的区别? HashMap:线程不安全,key允许为null Hashtable:线程安全,使用synchronized锁Hashta…

2.4 特征工程

2.4 特征工程 李沐 B站:https://space.bilibili.com/1567748478/channel/collectiondetail?sid=28144 课程主页:https://c.d2l.ai/stanford-cs329p/ 1. 为什么需要特征工程: 特征工程 数据集进行特征提取,以使机器学习模型在对经过特征工程处理过的数据进行学习时可以更快…

(02)基础强化:面向对象,变量作用域,封装,继承,虚方法,可访问性

一、面向对象概念复习 1、什么是面向对象?OOP(Object-Oriented Programming) 一种分析问题的方式,增强了程序的可扩展性。 OOP面向对象编程 OOA面向对象分析 OOAD面向对象分析与设计(…

Redis管道(pipeline)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言1、管道(pipeline)的基本概念2、管道实操3、小总结前言 在正式讲解Redis管道之前,先引入一个面试题: 如何优化频繁命令往返造成的性能瓶…

【Hello Linux】线程控制

作者:小萌新 专栏:Linux 作者简介:大二学生 希望能和大家一起进步! 本篇博客简介:简单介绍linux中的线程控制 线程控制线程创建线程等待线程终止线程分离线程id和进程地址空间布局线程创建 我们可以通过下面pthread_c…