基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP

最近我在 International Journal of Digital Earth (《国际数字地球学报》)发表了一篇森林生物量模型构建的文章:Evaluation of machine learning methods and multi-source remote sensing data combinations to construct forest above-ground biomass models,主要是利用多源遥感变量开展样地生物量反演具体请前往原文:https://www.tandfonline.com/doi/full/10.1080/17538947.2023.2270459

文章出发点

虽然已有一些研究探索了利用多源遥感变量估算森林 AGB 的方法(Sinha 等引文 2016;Su 等引文 2016;Sun 等引文 2011;Zhang 等引文 2020),但目前还没有具体的构建过程来选择 ML 方法和不同的遥感变量组合(Lu 引文 2006)。在此,我们采用最优 ML 方法,使用单一输入数据类型构建不同的森林 AGB 模型,并构建多源遥感变量与最优单一变量进行比较。然后根据多源遥感变量的重要性和多源遥感变量阵列之间的相关性构建多源遥感变量组合,以检验最佳森林 AGB 模型。然而,为了准确测定混交林的生物量,有必要考虑遥感数据中树种的具体差异。本文的目的是:(i) 改进不同森林类型(即阔叶林、针叶林和混交林)的 AGB 估算;(ii) 确定遥感数据的最佳组合,以提高使用 ML 方法估算森林 AGB 的准确性;(iii) 对太岳山下霍东煤矿区域内的森林进行勘探,以验证所选方法。

题目

Evaluation of machine learning methods and multi-source remote sensing data combinations to construct forest above-ground biomass models

ABSTRACT

Rapid and accurate estimation of forest biomass are essential to drive sustainable management of forests. Field-based measurements of forest above-ground biomas (AGB) can be costly and difficult to conduct. Multi-source remote sensing data offers the potential to improve the accuracy of modelled AGB predictions. Here, four machine learning methods: Random Forest (RF), Gradient Boosting Decision Tree (GBDT), Classification and Regression Trees (CART), and Minimum Distance (MD) were used to construct forest AGB models of Taiyue Mountain forest, Shanxi Province, China using single and multi-sourced remote sensing data and the Google Earth Engine platform. Results showed that the machine learning method that most accurately predicted AGB were GBDT and spectral index for coniferous (R2 = 0.99; RMSE = 65.52 Mg/ha), broadleaved (R2 = 0.97; RMSE = 29.14 Mg/ha), and mixed-species (R2 = 0.97; RMSE = 81.12 Mg/ha) forest types. Models constructed using bivariate variable combinations that included the spectral index improved the AGB estimation accuracy of mixed-species (R2 = 0.99; RMSE = 59.52 Mg/ha) forest types and reduced slightly the accuracy of coniferous (R2 = 0.99; RMSE = 101.46 Mg/ha) and broadleaved (R2 = 0.97; RMSE = 37.59 Mg/ha) forest AGB estimation. Overall, parameterizing machine learning algorithms with multi-source remote sensing variables can improve the prediction accuracy of mixed-species forests.

摘要

快速和准确地评估森林生物量对于推动森林的可持续管理至关重要。通过野外调查来评估的森林地上生物量(AGB)不仅需要耗费巨大的人力物力,且观测面积有限,随着遥感影像技术的发展,利用多源遥感数据为大面积的AGB估算提供了可能。本文利用随机森林(Random Forest,RF)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、分类回归树(Classification and Regression Trees,CART)和最短距离法(Minimum Distance,MD)四种方法构建山西省矿林复合区(太岳山和霍东矿区)AGB模型。结果表明,四种机器学习方法中GBRT方法所构建的AGB模型精度最高,在单一变量的AGB模型中,以光谱指数构建的的AGB模型精度最高,针叶树(R2=0.99;RMSE=65.52 Mg/ha)、阔叶林(R2=0.97; RMSE=29.14 Mg/ha)和混交林(R2=0.97; RMSE=81.12 Mg/ha) 。采用光谱波段和指数的双变量组合构建的AGB模型可有效提高混交林的预测精度(R2=0.99;RMSE=59.52 Mg/ha),而针叶树(R2=0.99;RMSE=101.46 Mg/ha)和阔叶林(R2=0.97; RMSE=37.59 Mg/ha) 的模型误差略有增加。总体而言,基于多源遥感变量的机器学习算法所构建的AGB模型可以提高混交林的模型精度,而单一树种的RMSE误差会增大。

流程图

大多数科学文献并未解释如何选择合适的变量来开发和评估森林 AGB 模型。基于这一认识,我们设计了本实验,利用多源遥感变量组合构建森林 AGB 模型,然后比较不同变量组合对森林 AGB 模型的准确性,以更科学地遵循单一变量的最优组合,并揭示哪种变量组合的拟合效果最好。

为了评估不同变量组合的效用及其在估算森林 AGB 方面的准确性,我们进行了四项实验:(i) 单一变量;(ii) 多源变量组合;(iii) 变量重要性;(iv) 皮尔逊相关系数。本研究中使用的四种 ML 方法(RF、CART、GBDT 和 MD)以 n = 500 个决策树参数进行了评估。通过评估以下四个指标对每个模型进行了分析:R2、RMSE、MAE 和 RE。卫星图像处理和使用 ML 生成森林 AGB 模型的详细流程图如图所示。

卫星图像处理和基于机器学习(ML)方法生成森林地上生物量(AGB)模型的流程图。在数据处理过程中获得的六种变量类型中,特征变量合成孔径雷达(SAR)来自 ALOS-2 PALSAR 数据。光谱波段、光谱指数、Kauth-Thomas(K-T)和灰度共现矩阵(GLCM)均来自 Landsat 8 SR 图像。地形变量来自美国国家航空航天局的航天飞机雷达地形图任务(SRTM)。

模型预测结果

讨论

本研究的目的是建立一个框架,用于选择 ML 方法和变量组合,以构建一个能准确预测不同森林类型中森林 AGB 的森林 AGB 模型。许多研究报道了 RF 方法在利用遥感数据预测森林 AGB 方面的卓越性能(Chen 等引文 2018;Zhang 等引文 2023b)。本文发现,GBDT 方法具有更高的森林 AGB 预测精度,尤其是当训练数据中的样本点数量较多时。然而,RF 和 GBDT 方法之间的差异并不明显,这与之前的研究结果一致(Tamiminia 等人,引用 2022)。本研究中使用的选择最佳森林 AGB 模型的方法和过程适用于所有森林 AGB 建模。尽管研究区域是位于复杂地形的混交林,但仍有可能对森林 AGB 进行准确预测。通过比较不同变量组合建立的生物量模型,结果表明变量数量与模型精度并无直接关系,两个变量组合的模型精度优于三个或更多变量组合的模型。经过重要性和相关性筛选后的变量建立的森林 AGB 模型的精度低于最佳单一变量组合。

不区分树种的森林 AGB 模型降低了森林 AGB 估计的准确性。区分不同树种以构建树种特异性森林 AGB 模型可能会使利用遥感技术对大面积森林 AGB 的评估更加准确。然而,构建树种特异性森林 AGB 模型需要投入大量精力和资源,以获得用于训练和验证的森林样地。在太岳山森林下的霍东煤矿地区,阔叶树大多分布在海拔较低的地方,导致采样点位于居民区附近,森林样地分布零散,这可能导致除光谱指数外,其他单一变量的总体拟合度较低(Zhang 等,引用 2023a)。相比之下,针叶林大多分布在人烟稀少的高海拔地区,这增加了森林资源清查数据收集的难度,也是本研究用于训练和验证的样本量有限的原因。尽管样本量有限,但由于针叶林的斑块往往位于不常受干扰的独特斑块中,因此仍能以合理的精度估算针叶林的 AGB。不过,由于针叶树种的样本量较小,在构建变量重要性和相关变量时,可能会因样本点不足而导致模型拟合精度不稳定。因此,如果随后使用 ML 方法构建生物量模型,建议收集足够的样本点,以便进行训练和验证活动(Yang 等,引用 2023)。根据本文的实验结果,单一树种生物量模型至少需要 100 个样本点。

在单变量和多源变量生物量预测模型中,样本数量决定了模型的准确性,如图 A 和 B(补充)所示。即使不区分树种,混交林 AGB 模型的预测结果也比单独预测阔叶林和针叶林的结果要好。在不同的变量组合中,用光谱指数和 K-T 构建的最佳模型对阔叶林的 AGB 预测最好,而对针叶林和混交林的最佳变量组合是光谱指数、纹理特征、光谱指数和波段。特别是针叶林的 AGB 模型参数化了纹理特征和光谱指数,似乎弥补了由于训练和验证样本量较小而导致的预测准确率较低的问题。

结论

本研究在 GEE 云平台中使用了四种 ML 方法,利用单源和多源变量组合构建了森林 AGB 模型,并利用变量重要性值和预测 AGB 值与测量 AGB 值之间的皮尔逊相关系数对其性能进行了评估。使用包括 R2、RMSE、MAE 和 RE 的完整模型评价系统来确定预测森林 AGB 的最佳模型。结果表明,使用 GBDT ML 方法获得了最佳模型结果。混交林的生物量估算最为准确。多源遥感数据和 ML 方法能够准确估算森林 AGB 生物量,从而快速估算复杂地形景观中的森林生产力、常量生物量和碳储量。

生物量预测模型应用APP


为了帮助可视化和解释,开发了三个基于 GEE 的应用程序,即

森林生物量与变量相关性分析应用程序

(https://bqt2000204051.users.earthengine.app/view/forest-agb-variables-correlation-analysis)

森林生物量与变量重要性分析应用程序

(https://bqt2000204051.users.earthengine.app/view/forest-agb-variable-importance-analysis)

森林生物量预测应用程序

(https://bqt2000204051.users.earthengine.app/view/forest-aboveground-biomass-prediction)

将选定的多源遥感变量与采集的森林生物量相关联,并根据相关系数筛选出相关性高的遥感变量,用于生物量建模。

数百个变量的相关性分析结果包括相关系数和 p 值。森林生物量和变量重要性分析应用程序根据多源遥感变量和森林生物量进行变量重要性分析,并根据变量重要性结果选择多源遥感变量建立模型,变量重要性分析中提供了 RF、CART 和 GBDT ML 方法。森林生物量预测应用程序以上述应用程序为基础,但对其进行了扩展,允许用户使用本分析中使用的 30 种多源变量组合选择不同的 ML 方法进行生物量模型预测,并可在线比较森林 AGB 估计值和准确性(即 R2、RMSE、MAE 和 RE)的评估结果。

文章引用:

Xingguang Yan, Jing Li, Andrew R. Smith, Di Yang, Tianyue Ma, YiTing Su & Jiahao Shao (2023) Evaluation of machine learning methods and multi-source remote sensing data combinations to construct forest above-ground biomass models, International Journal of Digital Earth, 16:2, 4471-4491, DOI: 10.1080/17538947.2023.2270459

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/114071.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[概述] 获取点云数据的仪器

这里所说的获取点云的仪器指的是可以获取场景中物体距离信息的相关设备,下面分别从测距原理以及适用场景来进行介绍。 一、三角测距法 三角测距原理 就是利用三角形的几何关系来测量物体的距离。想象一下,你站在一个地方,你的朋友站在另一…

vue(32) : win10创建vue2基础前端框架

vue2element-uiaxios 1.创建vue2项目 开发工具为HBuilderX 3.7.3 1.1.新建项目 1.2.普通项目-vue项目(2.6.10) 等待创建项目 2.安装element-ui组件 2.1右键左下角开始图标 2.2.cd进入项目目录,执行安装element-ui npm i element-ui -S 2.3.main.js引入配置 import {Paginat…

人工智能基础_机器学习013_三种梯度下降对比_线性回归梯度下降更新公式_对梯度下降函数求偏导数_得到---人工智能工作笔记0053

这里批量梯度下降,就是用准备的所有样本数据进行梯度下降计算. 然后小批量梯度下降就是使用比如我一共有500个样本,那么我从中拿出50个样本进行梯度下降计算. 然后随机梯度下降,更厉害, 从一共有500个样本中,随机的取一个样本进行梯度下降计算, 首先我们看批量梯度下降,使用…

【Linux学习笔记】进程概念(中)

1. 操作系统的进程状态2. Linux操作系统的进程状态3. 僵尸进程4. 孤儿进程5. 进程优先级5.1. 优先级是什么和为什么要有优先级5.2. Linux中的进程优先级 6. 进程切换7. 环境变量7.1. 环境变量的认识7.2. 环境变量相关的命令7.3. 环境变量和本地变量7.4. 命令行参数7.5. 获取环境…

使用ssl_certificate_by_lua指令动态加载证书

1、下载 OpenResty - 下载 根据自己系统选择下载,我的是64位 2、解压到目录 3、启动openresty 进入解压后的目录,执行nginx.exe 浏览器输入 http://localhost 查看是否正常。显示以下画面就表示没有问题。 接下来可以开始准备动态安装证书 4、使用o…

渗透测试工具(AntSword)

软件安装 蚁剑渗透测试工具分为AntSword-Loader和antSword两部分 文件下载: AntSword-Loader下载地址:GitHub - AntSwordProject/AntSword-Loader: AntSword 加载器 antSword下载地址:Releases AntSwordProject/antSword GitHub 使用&a…

NLP之LSTM与BiLSTM

文章目录 代码展示代码解读双向LSTM介绍(BiLSTM) 代码展示 import pandas as pd import tensorflow as tf tf.random.set_seed(1) df pd.read_csv("../data/Clothing Reviews.csv") print(df.info())df[Review Text] df[Review Text].astyp…

Django实战项目-学习任务系统-自定义URL拦截器

接着上期代码框架,6个主要功能基本实现,剩下的就是细节点的完善优化了。 首先增加URL拦截器,你不会希望没有登录用户就可以进入用户主页各种功能的,所以增加URL拦截器可以解决这个问题。 Django框架本身也有URL拦截器&#xff0…

非递归(迭代)遍历二叉树

前言 在树结构中我们经常使用递归算法,但是递归本身的特质会带来很多疑难痛点,比如递归过深导致爆栈,或者是逻辑复杂... 本文将以树的前序遍历为例,浅析迭代算法如何模拟递归过程。 思路 我们先来看看这个算法的具体思想。 在递…

泛微e-office系统存在SQL注入漏洞

泛微e-office系统存在SQL注入漏洞 一、泛微简介二、漏洞描述三、影响版本四、fofa查询语句五、漏洞复现 免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使…

【算能】stream在docker的环境下编译报错

错误问题一&#xff1a; /workspace/sophon-stream/element/multimedia/encode/../../../3rdparty/websocketpp/websocketpp/common/asio.hpp:56:14: fatal error: boost/version.hpp: No such file or directory 56 | #include <boost/version.hpp> 解决方法&a…

rwkv模型lora微调之accelerate和deepspeed训练加速

目录 一、rwkv模型简介 二、lora原理简介 三、rwkv-lora微调 1、数据整理 2、环境搭建 a、Dockerfile编写 b、制造镜像 c、容器启动 3、训练代码修改 四、模型推理 1、模型推理 2、lora权重合并 3、推理web服务 五、总结 由于业务采用的ChatGLM模型推理成本太大了…

软件测试---边界值分析(功能测试)

能对限定边界规则设计测试点---边界值分析 选取正好等于、刚好大于、刚好小于边界的值作为测试数据 上点: 边界上的点 (正好等于)&#xff1b;必选(不考虑区开闭) 内点: 范围内的点 (区间范围内的数据)&#xff1b;必选(建议选择中间范围) 离点: 距离上点最近的点 (刚好…

linux下mysql-8.2.0集群部署(python版本要在2.7以上)

目录 一、三台主机准备工作 1、mysql官方下载地址&#xff1a;https://dev.mysql.com/downloads/ 2、修改/etc/hosts 3、关闭防火墙 二、三台主机安装mysql-8.2.0 1、解压 2、下载相应配置 3、初始化mysql&#xff0c;启动myslq&#xff0c;设置开机自启 4、查看初始密…

代码训练营第59天:动态规划part17|leetcode647回文子串|leetcode516最长回文子序列

leetcode647&#xff1a;回文子串 文章讲解&#xff1a;leetcode647 leetcode516&#xff1a;最长回文子序列 文章讲解&#xff1a;leetcode516 DP总结&#xff1a;动态规划总结 目录 1&#xff0c;leeetcode647 回文子串。 2&#xff0c;leetcode516 最长回文子串&#xff1…

Agent 应用于提示工程

如果Agent模仿了人类在现实世界中的操作方式&#xff0c;那么&#xff0c;能否应用于提示工程即Prompt Engingeering 呢&#xff1f; 从LLM到Prompt Engineering 大型语言模型(LLM)是一种基于Transformer的模型&#xff0c;已经在一个巨大的语料库或文本数据集上进行了训练&…

Docker(1)

文章目录 Docker物理机部署的缺点虚拟机Docker 与虚拟机的区别Docker 的优势 Docker 概念安装 DockerDocker 架构镜像加速Docker 命令进程服务相关命令 镜像相关文件命令容器相关的命令 镜像加载的原理UnionFS(联合文件系统)docker 镜像加载原理 容器的数据卷数据卷概念配置数据…

一座 “数智桥梁”,华为助力“天堑变通途”

《水调歌头游泳》中的一句话&#xff0c;“一桥飞架南北&#xff0c;天堑变通途”&#xff0c;广为人们所熟知&#xff0c;其中展现出的&#xff0c;是中国人对美好出行的无限向往。 天堑变通途从来不易。 中国是当今世界上交通运输最繁忙、最快捷的国家之一&#xff0c;交通行…

2024上海国际人工智能展(CSITF)以“技术,让生活更精彩”为核心理念,以“创新驱动发展,保护知识产权,促进技术贸易”为主题

2024上海国际人工智能展&#xff08;CSITF&#xff09; China&#xff08;Shanghai&#xff09;International Technology Fair 时间:2024年6月12-14日 地点:上海世博展览馆 主办单位 中华人民共和国商务部 中华人民共和国科学技术部 中华人民共和国国家知识产权局 上海市…

C#,数值计算——求解一组m维线性Volterra方程组的计算方法与源程序

1 文本格式 using System; namespace Legalsoft.Truffer { /// <summary> /// 求解一组m维线性Volterra方程组 /// Solves a set of m linear Volterra equations of the second kind using the /// extended trapezoidal rule.On input, t0 is the st…