利用AI技术预测未被充分监测的流域中的极端洪水事件笔记

利用人工智能(AI)技术预测未被充分监测的流域(ungauged watersheds)中的极端洪水事件


文章目录

  • 利用人工智能(AI)技术预测未被充分监测的流域(ungauged watersheds)中的极端洪水事件
  • 前言
  • 一、论文主要内容
    • 1.1 主要内容
    • 1.2 主要数据
    • 1.3 模型处理
  • 二、论文相关的问答
    • 2.1 数据分布如何
    • 2.1 AI模型效果如何
    • 2.1 为什么选择未被充分监测流域
    • 2.1 LSTM模型的预测能力如何?
    • 2.1 为什么会被选为nature


前言

介绍:
论文:Global prediction of extreme floods in ungauged watersheds
Github:https://github.com/tommylees112/neuralhydrology/tree/pixel
参考链接:https://mp.weixin.qq.com/s/GoOPqLtdYvPv3_no7GJUJQ


一、论文主要内容

1.1 主要内容

洪水影响:洪水是最常见的自然灾害之一,对发展中国家的影响尤为严重,因为这些国家往往缺乏密集的流量测量网络。准确及时的洪水预警对于减轻洪水风险至关重要。

AI预测模型:研究表明,基于人工智能的预测模型能够在没有长期数据记录的情况下,对未监测流域的极端河流事件进行可靠预测,预测时间可长达五天,与当前最先进的全球模型系统(Copernicus Emergency Management Service Global Flood Awareness System,简称GloFAS)的即时预报(零天预测时间)的可靠性相当或更好。

预测准确性:AI模型在预测一年至十年重现期事件的准确性与当前一年重现期事件的准确性相当或更好。这意味着AI可以为未监测流域提供更早的洪水预警,覆盖更大范围和更具影响力的事件。

实际应用:研究中开发的模型已被纳入一个实时预警系统,该系统在80多个国家提供公开可用的(免费和开放)实时预报。这些预报可以通过https://g.co/floodhub访问。

数据可用性:文章强调了增加水文数据可用性的重要性,以继续提高全球范围内可靠洪水预警的获取能力。

研究方法:AI模型使用长短期记忆(LSTM)网络,通过7天的预测时间范围预测日流量。模型的训练和测试使用了随机k折交叉验证,涵盖了5680个流量测量站的数据。

模型比较:与GloFAS相比,AI模型在不同重现期事件的预测中显示出更高的精确度和召回率。特别是在5年重现期事件的预测中,AI模型的表现优于GloFAS。

地理差异:两种模型在世界不同地区的可靠性存在差异。例如,在南美洲和西南太平洋地区,AI模型的表现与GloFAS存在显著差异。

预测可靠性:研究还探讨了在没有地面真实数据的地点评估预测可靠性的挑战,并尝试使用流域属性(地理、地球物理数据)来预测不同模型的可靠性。

1.2 主要数据

ECMWF Integrated Forecast System (IFS) High Resolution (HRES) atmospheric model: 提供了包括总降水量(TP)、2米温度(T2M)、地表净太阳辐射(SSR)、地表净热辐射(STR)、雪fall(SF)和地表压力(SP)等变量的日聚合单层预测数据。

ECMWF ERA5-Land reanalysis: 与上述HRES模型相同的六个变量。

NOAA Climate Prediction Center (CPC) Global Unified Gauge-Based Analysis of Daily Precipitation: 提供了降水估计数据。

NASA Integrated Multi-satellite Retrievals for GPM (IMERG) early run: 同样提供了降水估计数据。

HydroATLAS database: 提供了地质、地球物理和人为的流域属性数据。

所有输入数据都是根据每个测量站或预测点的上游总面积,对流域多边形进行面积加权平均处理。研究中使用的5680个评估测量站的上游总面积范围从2.1平方千米到4,690,998平方千米不等

1.3 模型处理

  • 数据收集:首先,从各个数据源收集所需的气象数据、降水数据、流域属性数据以及流量测量数据。

  • 数据整合:将收集到的数据整合到一起,确保它们具有相同的时间序列和空间分辨率。这可能涉及到数据的合并、对齐和匹配。

  • 缺失值处理:对于缺失的数据,采用合适的插值方法进行填充。例如,可以使用其他数据源的相似变量数据进行替换,或者使用历史数据的平均值进行插值,并添加标记以示区分。

  • 面积加权平均:对于流域属性数据,需要根据每个测量站上游的总面积进行面积加权平均,以得到代表整个流域的综合特征。

  • 标准化:对所有数值型数据进行标准化处理,通常包括去除均值和除以标准差,以便在模型训练中减少不同特征量纲的影响。

  • 特征选择:根据模型的需要,选择与洪水预测相关的特征。这可能包括气象数据中的降水量、温度等,以及流域属性数据中的流域面积、土壤类型等。

  • 序列构建:将选定的特征按照时间序列顺序排列,构建成输入序列。对于LSTM模型,这通常包括一个固定长度的历史数据窗口,例如过去365天的数据。

  • 目标变量定义:定义模型的输出目标,即未来一段时间内的流量预测。这可能涉及到将流量数据转换为适合模型学习的格式,例如,使用流量的对数变换来处理数据的偏态分布。

  • 数据集划分:将整合和预处理后的数据划分为训练集和测试集。这通常涉及到时间序列的分割,确保训练集和测试集在时间上是不重叠的。

  • 模型训练:使用处理好的训练数据集来训练LSTM模型。在训练过程中,模型会学习如何根据输入的历史数据来预测未来的流量。

  • 交叉验证:为了评估模型的泛化能力,使用交叉验证技术来重复训练和测试过程,确保模型在不同的数据子集上都有稳定的表现。

  • 性能评估:使用测试集数据评估模型的性能,计算精确度、召回率、F1分数等指标,以确定模型在预测洪水事件方面的准确性和可靠性。


二、论文相关的问答

2.1 数据分布如何

在这里插入图片描述
如图分析,从分布上分析,大部分数据分布在美洲和欧洲,尤其是北美地区,中国比较少,因此该实验不适合国情。

2.1 AI模型效果如何

在这里插入图片描述
不管是目前在应用的全球洪水系统GloFAS还是AI模型预测的结果来说,分数都是低于0.5;AI模型的precision和recall的值域比GloFAS要大。时间越长,预测分数越低。

2.1 为什么选择未被充分监测流域

数据稀缺性:许多流域,尤其是在发展中国家,缺乏足够的流量测量站来提供长期的数据记录。

风险缓解需求:未被充分监测的流域往往位于易受洪水影响的地区,这些地区的居民和基础设施面临较高的洪水风险。

技术挑战:在未被充分监测的流域进行洪水预测是一个技术挑战,因为它要求模型能够在没有或只有很少现场数据的情况下进行准确预测。

模型泛化能力:通过在未被充分监测的流域上测试模型,可以评估模型的泛化能力,即模型在不同地理、气候和水文条件下的适用性和预测性能。

提高预测效率:开发能够在未被充分监测流域有效工作的洪水预测模型,可以减少对传统监测基础设施的依赖,提高预测效率,并降低在这些地区实施洪水预警系统的成本。

论文说是为了发展中国家进行分析,地图上的点上看都是发达国家的点,发达国家【69.4%】 发展中国家【31.6%】

2.1 LSTM模型的预测能力如何?

在这里插入图片描述
这些子图显示了在不同预测时间(从0天到5天)和不同重现期的洪水事件下,模型预测性能的变化。确实前5天的分数都是高于GloFAS。

2.1 为什么会被选为nature

创新性方法:用LSTM编码水文学、气象学的相关数据,并提供了一套标准化、合理化的清洗手段,来预测极端天气的内容
全球影响:洪水是全球性的问题,对人类社会和自然环境都有重大影响,虽然发达国家数据居多,但是发展中国家的数据也不少
数据稀缺性:该研究展示了在数据稀缺环境下,如何利用现有数据和AI技术提高预测能力,5680点位的数据是混合数据,有监测数据的内容也有合成的内容,其中一项挑战是去预测未监测流域的情况。
提高了风险预测的准确性:确实是高于GloFAS.
跨学科合作:该研究可能涉及气象学、水文学、数据科学、机器学习等多个学科的合作,这种跨学科的方法是解决复杂问题的重要途径。
项目还开源了:鼓励全球进行合作和提高行业的整体水平

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/491833.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[HackMyVM]靶场Crossbow

kali:192.168.56.104 靶机:192.168.56.136 端口扫描 # nmap 192.168.56.136 Starting Nmap 7.94SVN ( https://nmap.org ) at 2024-03-26 22:17 CST Nmap scan report for crossbow.hmv (192.168.56.136) Host is up (0.0057s latency). Not shown: 997 closed tcp…

实现ls -l 功能,index,rindex函数的使用

index();----------------------------------------------------------------- index第一次遇到字符c&#xff0c;rindex最后一次遇到字符c&#xff0c;返回值都是从那个位置开始往后的字符串地址 #include <stdio.h> #include <sys/types.h> #include <pwd.h&g…

Spring Boot | Spring Boot的“核心配置“与“注解“

目录: Spring Boot的核心配置与注解 &#xff1a;1. 全局配置文件 ( application.properties / application.yaml&#xff1a;创建项目时候自动生成&#xff0c;其会被“自动导入”到“程序”中 )application.properties配置文件application.yaml 配置文件 (推荐使用)当value值…

MAC使用Clion开发STM32

安装软件 CLion &#xff1a;略 STM32CubeMX&#xff1a;略 brew &#xff1a; /bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"openocd &#xff1a; brew install open-ocd # 以下命令有输出说明安装成功 openocd -…

linux 系统安装php 8.0.2

1. 安装包准备 https://www.php.net/distributions/php-8.0.22.tar.gz 我下载到 /usr/local/src 这个目录了 cd /usr/local/srcwget https://www.php.net/distributions/php-8.0.22.tar.gz 2. tar 解压 然后进到解压的文件夹 tar -zxvf php-8.0.22.tar.gz cd php-8.0.2…

0101支付安全-支付模块-项目实战

文章目录 一、信息安全的基础-机密性1 相关概念2 对称加密和非对称加密 二、身份认证三 摘要算法四、数字签名五、数字证书结语 在支付过程中&#xff0c;设计多方的敏感信息&#xff0c;那么安全尤为重要。下面先简单介绍下&#xff0c;相关概念。 一、信息安全的基础-机密性 …

YOLOv8项目解析——一文搞定目标检测、语义分割、状态估计、目标追踪算法原理与模型部署

简介 Ultralytics YOLOv8是一种前沿的、最先进的&#xff08;SOTA&#xff09;模型&#xff0c;它在前代YOLO版本的成功基础上进行了进一步的创新&#xff0c;引入了全新的特性和改进&#xff0c;以进一步提升性能和灵活性。作为一个高速、精准且易于操作的设计&#xff0c;YO…

基于单片机的智能汽车防盗系统设计

摘要:本文介绍了一种以汽车专用单片机飞思卡尔MC68HC908QT4CPE 作为底层主控芯片,人体远红外热释传感器、防闯入光幕墙及振动传感器作为检测装置的汽车防盗系统。单片机将检测到的防盗传感器开关信号,通过数据分析,系统可以设置布防和解除布防模式,在布防模式下,当检测到…

【AI+编程】使用chatGPT AI工具Python语言从0到1完成pdf转docx小工具

昨天运营同学问我一个问题&#xff0c;能不能把一个pdf转换成 docx 。 我给他提供了2种方式。一是用 PDF Reader PRO软件&#xff0c; 一个是WPS会员&#xff08;普通用户只能转换3页&#xff09;。 休息间隙&#xff0c;脑海里冒出一个想法。能不能用python写一个pdf转换do…

免杀对抗-C2远控篇CC++SC转换格式UUID标识MAC物理IPV4地址减少熵值

参考文章&#xff1a; https://github.com/INotGreen/Bypass-AMSI https://mp.weixin.qq.com/s/oJ8eHdX8HGuk6dZv0kmFxg https://kyxiaxiang.github.io/2022/12/14/AMSIandEtw https://github.com/S3cur3Th1sSh1t/Amsi-Bypass-Powershell 文章参考&#xff1a; https://www.…

SQLAlchemy模型映射提示declarative_base() takes 0 positional arguments but 1 was given

原码&#xff1a; #SQLAlchemy模型映射表结构. from sqlalchemy import create_engine,Column,Integer,String from sqlalchemy.ext.declarative import declarative_base# 数据库的变量 HOST 127.0.0.1 PORT 3306 DATA_BASE itbz USER root PWD 123456 DB_URL fmysqlpy…

deepspeed chat RLHF个人笔记(待完成)

一、linux配置 # 新的linux配置: 1. 查看linux版本 uname -a 2. linux装软件ubuntu:安装软件:sudo apt install 软件名更新软件源:sudo apt update升级已安装的软件:sudo apt upgrade3. ubuntu 查看终端类型printenv | grep TERM 3. 安装 c编译器 sudo apt-get update sudo ap…

使用Redis位图实现12306分段购票

系列文章目录 文章目录 系列文章目录前言前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 很多编程语言都有位运算符,Java语言也不例外。在Java语言中,提供了7种位…

通信原理QPSK OQPSK MSK 信道编码 GMSK

通信原理 通信QPSKOQPSKMSK信道编码GMSK需要的联系qq&#xff1a;2329738917 通信 QPSK OQPSK MSK 信道编码 GMSK 需要的联系qq&#xff1a;2329738917

小黑开始了芙蓉路岔气恰巧看到芙蓉脱单,假期东方时尚的学车生活,跟尚香骑车去北大微电子学院,在雪天考科目二的leetcode之旅: 43. 字符串相乘

小黑代码1:暴力转换 class Solution:def multiply(self, num1: str, num2: str) -> str:num1 int(num1)num2 int(num2)return str(num1 * num2)小黑代码2:转化为多位数x一位数 class Solution:def multiply(self, num1: str, num2: str) -> str:# 定义多位数x一位数的…

Github简单入门教程

文章目录 使用前提查看项目内容查看项目介绍打包下载项目查看项目作者项目搜索复制项目分支项目创建向项目中添加文件对项目进行评论 使用前提 想要使用Github&#xff0c;首先需要学会科学上网&#xff0c;不然用国内的网在正规情况下是无法访问Github滴~ 查看项目内容 打开…

解决错误LibreSSL SSL_connect: SSL_ERROR_SYSCALL in connection to

react native pod第三方包或者git clone的时候遇到 OpenSSL SSL_connect: SSL_ERROR_SYSCALL in connection to github.com:443两种解决方案 方法一 修改计算机网络配置 由于使用 IPv6 的原因&#xff0c;可能会导致这一问题的出现 系统在解析hostname时使用了ipv6 可以配…

联合体类型

结构体我们已经介绍在 自定义类型&#xff1a;结构体 中&#xff0c;今天我们来介绍另一种 自定义类型&#xff1a;联合体 目录 1.联合体的声明 2.联合体的特点 3.联合体大小的计算 4.联合体的应用 5.联合体的一个练习 1.联合体的声明 联合体与结构体类似&#xff0c;它也…

webpack练习之手写loader

手写一个style-loader来把样式文件插入head里面&#xff0c;准备工作 vue webpack就自己弄了&#xff0c;webpack的一些配置也自己配置好 一、创建index.css文件 .box{width: 100px;height: 100px;background-color: red; }然后在vue的main.js文件中引入它 二、创建自定义l…

深度学习知识【CSPNet网络详解】

CSPNet的贡献 1.增强了CNN的学习能力&#xff0c;能够在轻量化的同时保持准确性。 2.降低计算瓶颈。 3.降低内存成本。 CSPNet介绍 在神经网络推理过程中计算量过高的问题是由于网络优化中的梯度信息重复导致的。CSPNet通过将梯度的变化从头到尾地集成到特征图中&#xff0c…