土地利用的时序建模

1、LULC 模型的现状

最近的土地利用和土地覆盖 (LULC) 建模进展来自两种方法。 在一种方法中,现有模型适用于 LULC,而在另一种方法中,模型架构是针对 LULC 明确设计的。

随着大型基础模型的兴起,人工智能和深度学习取得了重大进展。 这些模型已经过大量训练数据的训练,可以适应各种领域和数据集。 一个很好的例子是 Segment Anything Model,它是各种分割任务的基础模型。 我们已经开始探索 GeoAI 的分割任意模型的潜力。 通用图像分类模型的其他示例包括 FCN、UNet 或 DeepLab,所有这些模型的主干网络都在 Imagenet(标记摄影图像的参考数据集)上进行了预训练。

虽然这些基础模型有潜力解决一般分割任务,但它们仅限于单图像输入。 然而,正如我们之前概述的那样,时间维度对于准确的 LULC 建模至关重要。 GeoAI 的一个令人兴奋的研究领域特别关注利用时间维度。 这些模型成功地使用卷积、循环编码器和自注意力,通过从时间序列数据中学习来获得出色的结果。

下表总结了两种 GeoAI 方法的优缺点:

模型类别优点缺点
基础或重新调整用途现有训练数据的深层堆栈,众所周知的架构和行为,即用型软件实施,预先训练的模型可以快速产生良好的结果光谱带使用不足,专注于 3 波段 RGB,忽略红外波段,不知道时间维度,针对 2D 卷积进行训练,仅单图像分类
时间序列感知架构面向特定的 LULC 挑战,例如变化检测,文献中证明了高 LULC 精度,时间感知架构利用图像堆栈需要大量的训练数据,而这对于许多项目来说是不可用的,从头开始训练模型既困难又昂贵,需要更多的专业知识,因为软件实施通常不公开或易于安装

2、退一步才能前进

LULC 建模的一大限制是缺乏训练数据。 不同 LULC 模型的目标各不相同,通常需要自定义训练数据。 检测北非的城市地区与检测西亚或北美的城市地区是一个非常不同的挑战。 因此,在许多实际例子中,训练数据必须从头开始创建。

虽然建立基础模型是为了克服这一限制,但它们不适用于时间动态很重要的 LULC 制图。 另一方面,专业模型需要大量高质量的训练数据,而这些数据几乎不可能在合理的时间范围和预算限制内创建。

解决这个难题的方法之一是退后一步,专注于目标。 如果我们简化模型并利用数据最重要的方面,我们就可以用更少的努力获得高质量的结果。 我们尝试了利用数据的多光谱和时间性质的模型,但没有考虑土地覆盖的空间特征。

卫星图像堆栈中的光谱和时间信息可以补偿空间背景。 在我们的实验中,即使不利用空间特征,基于像素的模型也可以产生与 2D 模型相同质量的结果。

2.1 简化的训练数据集创建

为 LULC 项目创建训练数据集是一项劳动密集型工作。 简化标记过程可以说是抛开空间上下文的最重要优势。 打标签者不必非常详细地理解和追踪空间背景。 这使得生成训练数据集变得快速而简单。

在绘制 2D 映射的分割掩模时,需要对图像中的每个像素进行注释(图 1 中的左图)。 此过程可能需要 5 到 30 分钟,具体取决于土地利用类别或景观的复杂程度。

一维模型的注释方法更直接、更快速。 注释者只需标记他们最有信心的像素,无需注释每个像素或处理复杂的空间细节(图 1 中的右图)。 不必追踪每个功能的每个细节,可以大大降低复杂性。 此过程通常会将每个图像的标记时间缩短至 5 秒到一分钟。

图 1:2D标注 vs. 1D标注

2.2 紧凑模型

简化的模型更小,因此更容易训练和部署。 与卷积模型相比,它们的可训练参数大小减少了高达 1000 倍。 简化的模型也需要更少的数据来实现良好的拟合。 最后,即使在常规 CPU 实例上,较小模型的训练和推理速度也很快。 这使得运行和使用模型的成本大大降低。 对于资源有限的项目来说,这可能是一个显着的优势。

2.3 快速迭代

随着创建训练数据和训练模型的周转速度加快,简化的模型加快了迭代过程,促进了高效的模型细化。 在这些模型之上构建主动学习循环变得毫不费力。

这就是建模周期在实践中的样子:

  • 在数小时内创建第一个训练数据集。
  • 训练模型并创建第一个模型预测。
  • 在模型输出的基础上创建额外的标签,专注于主动学习并在最需要的地方帮助模型。
  • 返回步骤 2 并迭代,直到模型输出令人满意。

3、森林类型映射测试用例

我们在一个项目中测试了上述技术,其目标是区分森林类型和景观类别。 使用具有四个月内每两周一次的时间序列和十个光谱带的单像素模型,我们实现了与 U-Net 2D 模型相同的质量。

图 2 中的可视化显示了一些基于像素的模型输出以及每个预测的基础图像系列:

图 2:该模型对于不断变化的景观、季节性和大气影响具有稳健性。

对于此示例,我们开发了一种基于像素的小规模模型,而不是用于 LULC 映射的深层模型。 该编码器由一个 2 层 1D 卷积块组成,具有不同的内核映射,用于处理时间序列数据立方体的各种属性。 这些提取的特征被输入多层感知器(MLP)以生成像素级掩模。

通过采用基于像素的模型,我们还克服了在处理平铺数据时 2D 模型中常见的边缘伪影的挑战。

高级模型结构如下图所示。 有关我们如何实现模型架构的更多详细信息,您可以查看以下模型要点文件。

图3:Data Cube模型结构

为了有效地查询数据集,我们利用了时空资产目录(STAC)。 我们利用了云优化的 GeoTIFF (COG) 格式,这使我们能够在基于云的基础设施上执行高效的查询。

查询数据集时,我们使用元数据指定我们的要求,例如:

  • 目录类型(例如“哨兵”、“陆地卫星”、“hls”等)。
  • GeoJSON 或用于定义感兴趣的地理区域的边界框。
  • 用于指定数据时间范围的时间范围(例如“2021 年 1 月 - 2022 年 5 月”)。

对于每个训练样本,我们随时间收集一堆图像,并定期合成图像。 在上面的示例中,我们使用 14 天的间隔和简单的云去除算法来尽可能减少云。

对于模型训练,我们使用 xarray 创建数据立方体,由沿时间维度的像素复合组成。 这些数据立方体还包括每个土地利用类别的栅格化标签。 该管道的概述如图 4 所示。

图 4:数据管道

4、结束语

我们强调了时间序列数据在土地利用建模中的关键作用。 时间信息在准确绘制土地利用地图方面的重要性变得显而易见,特别是随着深度时间档案的可访问性不断提高。 在土地利用模型中包含时间序列数据可以增强其稳健性和准确性。

此外,时间上下文可以成为获取空间 2D 上下文的可行替代方案,而空间 2D 上下文通常具有挑战性。 通过用时间上下文替代空间上下文,为更简单的模型创建训练数据变得更快、更经济、更高效。 这种替代在许多实际用例中证明是有价值的,证明时间上下文和频谱深度可以有效地替代空间上下文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/477711.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据结构 二叉树 力扣例题AC——代码以及思路记录

LCR 175. 计算二叉树的深 某公司架构以二叉树形式记录,请返回该公司的层级数。 AC int calculateDepth(struct TreeNode* root) {if (root NULL){return 0;}else{return 1 fmax(calculateDepth(root->left), calculateDepth(root->right));} } 代码思路 …

【Linux C | 多线程编程】线程的创建、线程ID、线程属性

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀 🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C、数据结构、音视频🍭 ⏰发布时间⏰:2024-03-22 0…

SSC9211_USB-CAM解决方案

一、方案描述 SSC9211是一种用于USB-CAM应用程序跟场景的高度集成的SOC产品。平台本身基于ARM层-A7双核,内置16位,64M的DDR2,集成了图像传感器接口、高级ISP、高性能JPEG编码器和其他丰富的外设接口。支持单,双 MIPI sensor方案&…

H3C--堆叠(IRF)

拓扑图 配置流程 配置SW1与SW2堆叠 一、SW1: shutdown 物理端口配置堆叠优先级,优先级高的成为主设备创建堆叠逻辑接口,将物理接口加入到堆叠逻辑接口中 二、SW1: sysname SW1 # irf member 1 priority 6 # irf-port 1/1port…

基于时空上下文(STC)的运动目标跟踪算法,Matlab实现

博主简介: 专注、专一于Matlab图像处理学习、交流,matlab图像代码代做/项目合作可以联系(QQ:3249726188) 个人主页:Matlab_ImagePro-CSDN博客 原则:代码均由本人编写完成,非中介,提供…

windowsVMware虚拟机中扩展linux磁盘空间

1.虚拟磁盘扩容 VM中,关闭linux虚拟机,直接编辑虚拟机-硬盘-扩展磁盘容量 2.通过Gparted工具进行LINUX系统磁盘分区 未分区挂载前可以看到/挂载点下空间为20G: 通过虚拟机-快照-拍摄快照,操作前可拍摄快照(便于恢复之前…

科技云报道:造完“大模型”,“具身智能”将引领AI下一个浪潮?

科技云报道原创。 资深机器人专家Eric Jang不久前曾预言:“ChatGPT 曾在一夜之间出现。我认为,有智慧的机器人技术也将如此。” 3月13日深夜,一段人形机器人的视频开始热传。 在视频中,Figure的人形机器人,可以完全…

基于java+springboot+vue实现的健身房管理系统(文末源码+Lw+ppt)23-523

摘 要 健身房管理的以往工作流程繁杂、多样、管理复杂与设备维护繁琐。而如今计算机已完全能够胜任健身房管理工作,而且更加准确、方便、快捷、高效、清晰、透明,它完全可以克服以上所述的不足之处。这将给查询信息和管理带来很大的方便,从…

从0写一个问卷调查APP的第13天-1

1.今日任务 我也只是一个大学生,有什么思路不对的地方给我指出来哟! 分析:上次我们实现了任务调查的插入。但是我们插入的问卷调查只有它的标题,也就是这个问卷调查是什么我们告诉数据库了,但是现在我们还没有给它添加任何问题&…

图片如何去除水印?试试这三款去水印工具!

在处理图片时,经常会遇到一个棘手的问题:水印。不论是想去除不美观的版权标记,还是希望消除图片上的杂物,一个好用的去水印工具都是必不可少的。今天,我们就为大家介绍三款功能强大、操作简便的图片去水印软件&#xf…

JavaScrpt学习笔记_一

一、Js编写位置 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title> <!-- 可以将js代码编写到外部js文件中&#xff0c;然后通过script标签引入写到外部文件中可以在不同页面中…

梦百合发布“正确睡眠观”,再次呼吁“别睡硬床”

3月21日“世界睡眠日”当天,MLILY梦百合召开了主题为“别睡硬床”的品牌发布会,梦百合家居董事长倪张根发布了一场线上主题演讲,普及睡硬床可能带来的危害,呼吁国人“别睡硬床!”,并发布“100万张硬床垫改造计划”,期望消费者通过从体验一张薄垫开始,从而逐步认识到睡硬床的危害…

1.C#对接微信Native支付(接入前准备)

在申请微信支付商户和微信公众号成功后&#xff0c;我们需要根据官方文档继续进行下一步操作。 1.申请appid和申请mchid 其实只要申请了支付商户和公众号那么这两个id就已经生成了。 我们在公众号管理端的微信支付中可以看到appid 在微信支付商户管理端中可以看到mchid 2…

20240316-1-向量化搜索

向量化搜索 在高维空间内快速搜索最近邻&#xff08;Approximate Nearest Neighbor&#xff09;。召回中&#xff0c;Embedding向量的搜索。 FAISS、kd-tree、局部敏感哈希、【Amnoy、HNSW】 FAISS faiss是Facebook的AI团队开源的一套用于做聚类或者相似性搜索的软件库&…

图中的边关系和节点关系之间的转换

图中的边关系和节点关系之间的转换 边关系转为图 在relation数组中记录的是从一个节点到一个节点&#xff0c;前面的就叫做from&#xff0c;后面的就叫做to&#xff0c;因此每次添加进节点关系的数组的时候&#xff0c;from就是数组索引&#xff0c;to就是需要加入的值。也就是…

揭秘最热门AI写作软件,看看有哪些值得推荐的AI写作神器

在快节奏的现代生活中&#xff0c;我们常常面临各种压力&#xff0c;例如工作、学习等。因此&#xff0c;一款能够提高写作效率的工具变得尤为重要。那么&#xff0c;有没有什么AI写作软件是比较好用的呢&#xff1f;下面小编给大家推荐几款热门的写作软件。 一.爱制作AI写作 …

打造稳定高效的会员系统:技术架构解析与优化策略

随着互联网时代的发展和用户需求的变化&#xff0c;会员系统成为了各行各业企业实现用户粘性和增长的重要手段。一个稳定高效的会员系统架构能够帮助企业更好地管理会员数据、提供个性化服务和增加用户价值。本文将深入探讨会员系统的技术架构&#xff0c;分析其重要性和挑战&a…

Transformer的前世今生 day02(神经网络语言模型、词向量)

神经网络语言模型 使用神经网络的方法&#xff0c;去完成语言模型的两个问题&#xff0c;下图为两层感知机的神经网络语言模型&#xff1a; 假设词典V内有五个词&#xff1a;“判断”、“这个”、“词”、“的”、“词性”&#xff0c;且要输出P(w_next | “判断”、“这个”、…

Linux东方通下载及使用

把压缩包拖进去 解压文件 mkdir /usr/local/java

新品发布 | Ftrans FIE文件安全导入导出系统

关于飞驰云联 飞驰云联是中国领先的数据安全传输解决方案提供商&#xff0c;长期专注于安全可控、性能卓越的数据传输技术和解决方案&#xff0c;公司产品和方案覆盖了跨网跨区域的数据安全交换、供应链数据安全传输、数据传输过程的防泄漏、FTP的增强和国产化替代、文件传输自…