【SITS_CC】卫星图像时间序列的变化字幕(IEEE GRSL)

摘要

  • Satellite images time series (SITS) 提供了一种有效的方法来同时获取地球上观测区域的时间和空间信息。然而,传统的遥感CD方法的输出是二进制图或语义变化图,往往难以被最终用户解释,传统的遥感图像变化字幕方法只能描述双时图像。
  • 提出了SITS_CC,它不仅识别了SITS中的变化区域,而且用自然语言描述变化。不幸的是,无可用的SITS训练数据集。为了解决这些问题,本文只利用双时态遥感图像变化字幕训练数据,而不是SITS_CC训练数据。在实际测试数据集上的实验结果证明了该方法的有效性,在所有指标上都取得了更好的性能。所观察到的改善幅度超过了20%。
  • 论文链接:Change Captioning for Satellite Images Time Series | IEEE Journals & Magazine | IEEE Xplore
  • 代码链接:GitHub - Crueyl123/SITSCC: SITSCC:Change Caption for Satellite Images Time Series

动机

之前的相关工作都没有涉及到SITS的变化字幕。本文提出一种新的SITS的变化字幕方法,目前,缺乏SITS变化字幕的训练数据集,并且对注释一个这样的数据集耗时耗力。因此,关键问题是如何在一个新的框架下完成本文的任务。

目前只有少量可用的双时态遥感图像变化字幕,SITS变化字幕任务通常是指描述几个到几十个图像之间的变化。因此,第二个问题是如何利用SITS中的时间依赖相关性来增强生成的变化字幕的逻辑性。

基于广泛的实验观察,对SITS变化描述与时间项严重纠缠,并构成明显的时间依赖特征。提供了一个明确的方向,使用现有相邻图像之间的变化字幕来训练本文的模型,然后,通过特殊的时间依赖相关正则化,合并非相邻的时间信息,并在SITS中保持时间特征。

方法

SITS_CC网络结构如下:

  • A. Feature Extractor
    • 利用CNNs提取抽象特征,以保留SITS中包含的光谱空间信息。
    • 使用改进的ResNet-101架构作为从SITS中提取图像特征的骨干,通过调整池化层,可以保留大部分图像信息,同时适应不同的输入大小,从而确保后续处理的空间大小保持一致。输出表示为Fi (i = 0, 1, 2, . . . )。
  • B. Temporal Encoder
    • 使用时间编码器模块进行位置嵌入和特征融合(FF)。
    • 1) Position Embedding
      • 使用二维位置嵌入给模型纳入空间信息,增强模型对 SITS数据的时空理解。
      • 在字幕解码器中使用正弦和余弦函数对词序列进行位置嵌入。
      • 为此,在三个位置重塑特征:
        • 来自CNN主干的特征图在进行特征处理前被重新排列为:(H,W,d) →(H×W,d);
        • 将CNN主干输出序列 F i (i = 0, 1, 2, . . . )重新排列为:(H×W,d)→(H,W,d)
        • 在输入transformer解码器之前,重新 排列为:(H,W,d) →(H×W,d)
      • 位置嵌入表示如下:{F}'_i=F_i+F_{pos}
    • 2) Differential Representation
      • SITS图像通常由几张甚至几十张图像组成。这些图像之间的变化往往是不连续的,相邻图像之间可能存在显著差异,影响了整体分析。此外,由于训练数据集只包含成对的双时态遥感图像,最初的重点是如何捕获相邻图像之间的差异。
      • DR模块产生差异表示 F_{dif|t_i}(i=0,1,2,...)捕捉和识别图像在多个时间上的多个变化。为了捕获相邻图像之间的差异,探索三种方法生成 F_{dif|t_i}(i=0,1,2,...)
        • 作差:降低了图像特征的独特性。
        • 作差加绝对值:忽略了图像之间的时间序列特征。
        • F_{dif|t_i}=RELU(Conv([F_{t_{i+1}}-F_{t_i};F_{t_i}])):本文使用这种方法改善前两种方法的不足之处。
    • 3) Feature Fusion
      • 获得差异特征之后,使用FF模块来获得更好的高级语义特征表示,揭示多个变化。
      • 用交叉注意力机制代替transformer编码层种的自注意力机制,使得FF模块有效的捕获和结合不同的差异特征,同时保持跨空间和时间维度的上下文信息。Q来自单一时态图像特征,K和V来自差异特征。
      • 为了融合这些不同的增强的差异特征Feni(i = 0,1,2,……)来获得对SITS变化的描述,提出了三种融合策略:
        • 直接相加:根据观察在同一地方的变化倾向于遵循固定的趋势,如扩张或消失。但是,当 SITS相同空间位置变化表现出周期性时,该方法就不适用。例如图3(a),草地在时间t1和t2之间逐渐消失,在t3和t4之间逐渐恢复。当采用此策略,这组SITS数据的输出不涉及任何变化,与事实相反。即采用此方法时,中间变化过程会被抵消。
        • 直接连接:对频繁变化的情况表现良好,因为它考虑了跨整个时间序列的变化,并充分利用了时间信息。但是如图3(b),在SITS数据上不可行,在t0-t3图像没有变化,但在t3和t4的最后一幅图像出现了显著变化,很明显,这种融合策略生成的输出句子不能正确描述时间t3和t4之间某些建筑物的外观。这一缺陷源于这种策略对 SITS内的所有图像不加选择地处理,可能忽略了某些重大变化。
        • 按时间顺序按比例连接:例如图3用绿色标记输出句子,表明该策略是有效的。具体策略如下:如果在ti和ti+1的两个相邻图像之间没有检测到显著变化,则变化的特征信息按比例减少,然后连接到下一个重要特征信息。这种策略保证了来自之前和后续图像的特征信息的保留,同时促进了差异信息的获取。如图3所示,策略3有效地缓解了前两种策略所造成的缺陷。
        • ​​​​​​​​​​​​​​
  • C. Caption Decoder
    • ​​​​​​​​​​​​​​ 使用标准的transformer解码器对结果进行解码和输出,以生成描述的句子。

实验

Experimental Data

  • 训练集和验证集:使用LEVIR-CC数据集中的训练集和验证集。具体来说,复制一组双时态图像,获得四张图像,类似一组SITS。输出包含三种类型的句子:unchanged, change description, and unchanged。
  • 测试集:测试数据集由从Google Earth中提取的150个SITS组成。每个SITS包含5张图像,每张图像大小为512×512像素。这些SITS的时间跨度为15-25年,主要场景包括草地、居民区等,由一个专家对每个SITS序列标注一个注释句子,这个句子总结了在现场中发生的人类活动所引起的主要变化,作为参考句子,用于评价。

Experimental Analysis

Discussion

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/679775.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ARM32开发——串口输出

🎬 秋野酱:《个人主页》 🔥 个人专栏:《Java专栏》《Python专栏》 ⛺️心若有所向往,何惧道阻且长 文章目录 需求串口数据发送串口打印实现复用功能串口发送流程(了解)串口的标志位关心的内容 需求 串口循环输出内容到…

AI生成PPT:一键式演示文稿制作的秘诀

工欲善其事,必先利其器。 随着AI技术与各个行业或细分场景的深度融合,日常工作可使用的AI工具呈现出井喷式发展的趋势,AI工具的类别也从最初的AI文本生成、AI绘画工具,逐渐扩展到AI思维导图工具、AI流程图工具、AI生成PPT工具、AI…

java 原生http服务器 测试JS前端ajax访问实现跨域传post数据

后端 java eclipse 字节流转字符 package Httpv3;import com.sun.net.httpserver.Headers; import com.sun.net.httpserver.HttpExchange; import com.sun.net.httpserver.HttpHandler; import com.sun.net.httpserver.HttpServer;import java.io.IOException; import java.i…

测试工具链

缺陷管理 bug管理工具 devops---项目管理--缺陷管理 bug管理地址 https://devsecops.mychery.com:8443/chery/project?filterROLE&statusACTIVE bug管理环境 采用公司的devops平台,对每个项目的bug进行管理。目前在使用 接口测试和服务端性能测试 工具…

Python-3.12.0文档解读-内置函数zip()详细说明+记忆策略+常用场景+巧妙用法+综合技巧

一个认为一切根源都是“自己不够强”的INTJ 个人主页:用哲学编程-CSDN博客专栏:每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 详细说明 基本用法 示例 特性 高级用法 注意事项 版本更新 示例代码 记忆策略…

「小明赠书活动」第五期“网安三剑客”套系图书《内网渗透技术》《渗透测试技术》《Web应用安全》

大模型风潮已掀起,各大巨头争相入局,从ChatGPT到Sora,全球的AI应用“卷出了花”。然而,网络安全人员在享受AI技术带来的便捷之余,也不得不面对一系列新兴的安全挑战,无法忽视。 ⭐️ 赠书 - 图书简介 人…

攻防世界---misc---Aesop_secret

1、下载附件一张动图,仔细观察发现它分成了很多小块,观察小块但是感觉又不像是二维码,可能需要把图片拼起来 2、用winhex分析,发现有一串编码,看编码的开头,猜测是AES加密 3、解码需要密码 4、想到刚刚的图…

MySQL——C语言连接数据库

MySQL Connection ​ 连接数据库的客户端除了命令行式的还有图形化界面版本,网页版本,当然也包括语言级别的库或者是包,能够帮助我们直接连接数据库; 一、语言连接库下载 方式一:不建议使用,需要自己配置…

RabbitMQ简介

一、安装和使用方式 1.https://www.erlang.org/ https://www.rabbitmq.com/ 2.先安装Erlang,管理员安装,在安装rabbitMQ,也是管理员安装,因为rabbitMQ是用Erlang语言开发的。且每个版本的RabbitMQ对应不同的Erlang版本&…

【深度学习】【机器学习】支持向量机,网络入侵检测,KDD数据集

文章目录 环境加载数据归一化数据训练模型用测试数据集给出评估指标准确率召回率预测某个输入数据随便取一行数据加载训练好的SVM支持向量机模型并预测 全部数据和代码下载 环境 之前介绍过用深度学习做入侵检测,这篇用向量机。 环境Python3.10 requirements.txt…

C++候捷stl-视频笔记3

算法的形式 Cmp通常是个比大小的准则,是Functor。 算法所需的信息通常指迭代器如何移动 迭代器的分类 array,vector,deque它们是连续的,它们的迭代器是Random Access Iterator/随机访问迭代器 list的迭代器是Bidirectional Itera…

如何微调出自己的大模型——LoRA原理解析

1、前言 上一篇文章,我们已经讲了隐扩散模型——Stable Diffusion生成大模型。这种大模型,参数量及其之大。你没有足够的算力资源,就只能够使用人家已经训练好的大模型。既然没有办法训练属于自己的模型,那我们就想,是…

小索引大力量,记一次explain的性能优化经历

在 MySQL 的生产环境中,性能问题是一个常见的挑战。当数据库查询响应时间变慢,或者系统资源消耗异常时,我们需要快速定位问题并进行优化。MySQL 提供了一个强大的工具——EXPLAIN,它可以帮助我们分析查询语句的执行计划&#xff0…

前后端实现文件上传进度条-实时进度

后端接口代码&#xff1a; PostMapping("/upload")public ResponseEntity<String> handleFileUpload(RequestParam("file") MultipartFile file) {try {// 获取文件名String fileName file.getOriginalFilename();// 创建上传目标路径Path targetPa…

读书笔记-Java并发编程的艺术-第2章 Java并发机制的底层实现原理

文章目录 2.1 volatile的应用2.1.1 volatile的定义与实现原理2.1.2 volatile的使用优化 2.2 synchronized的实现原理与应用2.2.1 Java对象头2.2.2 锁的升级与对比2.2.2.1 偏向锁2.2.2.2 轻量级锁2.2.2.3 锁的优缺点对比 2.3 原子操作的实现原理2.3.1 术语定义2.3.2 处理器如何实…

Linux 内存管理 SLUB 分配器

文章目录 前言一、SLUB allocator二、SLUB core参考资料 前言 本文来自&#xff1a;https://lwn.net/Articles/229984/ [Posted April 11, 2007 by corbet]SLAB分配器是用于处理“频繁分配和释放的对象”的对象缓存内核内存分配器。它是内存管理子系统中关键的一部分&#xf…

Opencv 色彩空间

一 核心知识 色彩空间变换&#xff1b; 像素访问&#xff1b; 矩阵的、-、*、、&#xff1b; 基本图形的绘制 二 颜色空间 RGB&#xff1a;人眼的色彩空间&#xff1b; OpenCV默认使用BGR&#xff1b; HSV/HSB/HSL; YUV(视频); 1 RGB 2 BGR 图像的多种属性 1 访问图像(Ma…

MySQL之查询性能优化(三)

查询性能优化 重构查询的方式 在优化有问题的查询时&#xff0c;目标应该是找到一个更优的方法获得实际需要的记过——而不是一定总是需要从MySQL获取一模一样的结果集。有时候&#xff0c;可以将查询转换一种写法让其返回一样的结果&#xff0c;但是性能更好。但也可以通过修…

关于URL获取的参数,无法执行二选一查询

&#x1f3c6;本文收录于「Bug调优」专栏&#xff0c;主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案&#xff0c;希望能够助你一臂之力&#xff0c;帮你早日登顶实现财富自由&#x1f680;&#xff1b;同时&#xff0c;欢迎大家关注&&收藏&&…

Arthas调优工具使用

1&#xff0c;服务器端下载 curl -O https://arthas.aliyun.com/arthas-boot.jar 2&#xff0c;服务器端启动 java -jar arthas-boot.jar 选定要绑定的Java进程ID 3&#xff0c;本地idea安装Arthas idea 4&#xff0c;选定方法右键trace,生成命令 trace com.xxx.xxx.xxx.vouche…