AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著提升。Aurora 不仅在预测技术上取得了重大突破,更在应用层面展现出了巨大潜力。


aurora-1

2023年11月,风暴“夏兰”席卷了欧洲西北部,造成了严重破坏,伴随而来的低压系统刷新了英格兰的记录,成为极为罕见的气象事件。这场风暴的猛烈程度让许多人措手不及,在暴露当前天气预测模型不足的同时,也凸显了气候变化日益加剧的情况下,提升气候预测准确性的迫切需求。我们如何才能更好地预测此类极端天气事件,并做好更为充分的准备?

Charlton-Perez 等人(2024年)近期的一项研究指出,即便是目前最先进的人工智能天气预测模型,在准确捕捉风暴“夏兰”的快速增强过程及其峰值风速方面也面临着挑战。为应对这些挑战,微软研究院开发了先进的人工智能基础模型 Aurora,可以从海量的大气数据中洞察到有价值的信息。Aurora 所展示出的创新天气预测方法,有望显著提升人们预测并减轻极端天气事件影响的能力,包括对风暴“夏兰”这类恶劣天气事件的急剧恶化进行预测。

Aurora 论文:Aurora: A Foundation Model of the Atmosphere

灵活的大气三维基础模型

Aurora 的有效性在于它经过了超一百万小时的多样化天气和气候模拟的训练,能够全面了解大气动力学。这使得该模型在广泛的预测任务中都表现出色,即使在数据稀疏的地区或极端天气的情况下也能如此。通过以0.1°(赤道处约11公里)的高空间分辨率运行,Aurora 可以捕捉大气过程的复杂细节,提供比以往更准确的预报,而且其计算成本仅为传统数值天气预报系统的一小部分。据估计,Aurora 相较于最先进的数值预报系统(Integrated Forecasting System, IFS)可提升约5000倍的计算速度。

Aurora 不仅拥有极高的预报准确性和效率,还具有多功能性,可以预测各种大气变量,从温度和风速到空气污染水平和温室气体浓度。Aurora 的架构旨在处理异构的黄金标准输入,并以不同的分辨率和保真度生成预测。该模型由一个灵活的 3D Swin Transformer 和基于 Perceiver 的编码器和解码器组成,使其能够处理和预测一系列跨空间和压力水平的大气变量。通过对大量多样化数据进行预训练并针对特定任务进行微调,Aurora 学会了捕捉大气中的复杂模式和结构,即使在有限的训练数据下对特定任务进行微调时,它仍然能有出色的表现。

图1:Aurora 架构

图1:Aurora 架构

大气化学和空气污染的快速预测

Aurora 多功能性的一个典型例子是其能够利用哥白尼大气监测服务(CAMS)的数据预测空气污染水平。这是一项众所周知的艰巨任务,因为大气化学、天气模式和人类活动之间复杂的相互作用,以及 CAMS 数据的高度异构性。通过利用灵活的编码器-解码器架构和注意力机制,Aurora 可以有效处理并学习这些具有挑战性的数据,捕捉空气污染物的独特特征及其与气象变量的关系。这使得 Aurora 能够在0.4°的空间分辨率下生成精确的五天全球空气污染预报,并在所有目标的74%中超越了最先进的大气化学模拟,从而证明了 Aurora 在解决各种环境预测问题方面的高度适应性和巨大潜力,即使在数据稀缺或高度复杂的情况下也是如此。

aurora-3-1

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

图2:Aurora 在许多目标上的表现都优于现行的 CAMS:(a) Aurora 对二氧化氮柱总量的样本预测与 CAMS 的分析比较;(b) Aurora 相对于 CAMS 的纬度加权均方根误差(RMSE),负值(蓝色)表示 Aurora 的表现更佳

利用数据多样性与模型缩放改善大气预测

该研究的主要发现之一是,与在单一数据集上的训练相比,在多样化的数据集上进行预训练可以显著提升 Aurora 的性能。通过整合气候模拟、再分析产品及业务预报的数据,Aurora 能够学习到更强大、更通用的大气动力学表征。得益于庞大的规模和多样化的预训练数据,Aurora 可以在各种任务和分辨率上,超越目前最先进的数值天气预报模型和专业的深度学习方法。

aurora-4-1

aurora-4-2

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

图3:在不同数据上进行预训练并扩大模型规模均有助于提升性能

Aurora 模型的规模化直接带来了在架构设计、训练数据语料库以及预训练和微调协议方面的性能优势,使得 Aurora 的性能超过了现有的专业深度学习模型。为进一步验证在多个数据集上预训练大模型的优势,研究员们将 Aurora 与 GraphCast 进行了比较,后者仅在 ERA5 上进行了预训练,并被认为是分辨率为0.25°、交付时间长达五天的最先进的人工智能模型。此外,研究员们还将 IFS HRES(数值天气预报的黄金标准)也纳入了比较范围。结果表明,无论是在与气象分析、气象站观测数据还是极端值的对比中,Aurora 的表现均优于 GraphCast 和 IFS HRES。

aurora-5-1

aurora-5-2

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

图4:在绝大多数目标上,Aurora 的性能都优于现行的 GraphCast 和 HRES。在每幅图中,中心线右侧的值代表高于阈值的累积均方根误差,左侧的值表示低于阈值的累积均方根误差。

地球系统建模的范式转变

Aurora 的影响力远不止于大气预报领域。通过展示基础模型在地球科学中的潜力,该研究为开发覆盖整个地球系统的综合模型奠定了基础。基础模型可以在数据稀缺的情况下出色地完成下游任务,有望使得在数据稀缺地区(例如发展中国家和极地地区)的民众也能够更加平等地获取准确的天气和气候信息。同时,这一进展也将对农业、交通、能源开发以及灾害应对等多个领域产生深远影响,让人们能够更好地适应气候变化带来的挑战。

随着人工智能在环境预测领域的不断进步,微软研究院希望 Aurora 能够成为未来研究和发展的新范式。该研究强调了多样化预训练数据集、模型扩展和灵活架构在构建地球科学强大的基础模型时的重要性。随着计算资源和数据可用性的不断进步,可以预见,未来像 Aurora 这样的基础模型将成为天气和气候领域预测系统的核心,为全球决策者和公众提供及时、准确和可操作的洞见。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/739124.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python-矩阵元素定位

[题目描述] 小理得到了一个 n 行 m 列的矩阵,现在他想知道第 x 行第 y 列的值是多少,请你帮助他完成这个任务。输入格式: 第一行包含两个数 n 和m ,表示这个矩阵包含 n行 m 列。从第 2 行到第 n1 行,每行输入 m 个整数…

vue中用JSON格式查看数据(vue-json-viewer)

vue中把string用JSON格式展示数据 vue-json-viewer使用 官网地址:https://www.npmjs.com/package/vue-json-viewer 1. 安装插件vue-json-viewer //vue2 npm install vue-json-viewer2 --save //vue3 npm install vue-json-viewer3 --save2. 引入vue-json-viewer…

“论SOA在企业集成架构设计中的应用”写作框架,系统架构设计师

论文真题 企业应用集成(Enterprise Application Integration, EAI)是每个企业都必须要面对的实际问题。面向服务的企业应用集成是一种基于面向服务体系结构(Service-OrientedArchitecture,SOA)的新型企业应用集成技术,强调将企业和组织内部的资源和业务…

【C语言】函数执行背后的秘密:函数栈帧的创建和销毁超详解

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】 目录 1. 什么是函数栈帧 2. 理解函数栈帧能解决什么问题呢? 3. 函数栈帧的创建和销毁解析 3.1 什么是栈? 3.2 认识相关寄存器和汇编指…

vscode在windows系统上进行C/C++环境配置

随手笔记前言 vscode在windows系统上进行C/C环境配置 步骤如下 第一步 下载安装VSCode 这应该是最简单的一步,相信大家自己就可以完成。如果在vscode官网感觉下载特别慢的话,可以去试一下腾讯软件中心,我都是在这个网页上下载的。下载好之…

Huffman树——AcWing 148. 合并果子

目录 Huffman树 定义 运用情况 注意事项 解题思路 AcWing 148. 合并果子 题目描述 运行代码 代码思路 其它代码 代码思路 Huffman树 定义 它是一种最优二叉树。通过构建带权路径长度最小的二叉树,经常用于数据压缩等领域。 运用情况 在数据压缩中&a…

RK3568开发笔记(三):瑞芯微RK3588芯片介绍,入手开发板的核心板介绍

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/139905873 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…

格雷码计数器

目录 描述 输入描述: 输出描述: 参考代码 描述 实现4bit位宽的格雷码计数器。 电路的接口如下图所示。 输入描述: input clk, input rst_n 输出描述: output reg [3:0] gray_out 参考代码 timescale 1ns/1nsmod…

等级保护测评中的建设整改要做什么?

随着信息技术的飞速发展,信息系统已成为现代社会运转的核心。然而,网络安全问题的日益突出,使得信息系统的安全稳定运行面临着严峻挑战。为了有效应对这一挑战,我国推行了等级保护制度,其中建设整改作为等级保护工作的…

指令微调数据集构建方法

指令微调(Instruction Tuning),是指使用自然语言形式的数据对预训练后的大语言模型进行参数微调,在一些文章中也称为有监督微调(Supervised Fine-tuning,SFT)或多任务提示训练(Multi…

ONLYOFFICE8.1版本桌面编辑器测评

OO官方链接点这里:ONLYOFFICE 文档 8.1 现已发布:功能全面的 PDF 编辑器、幻灯片版式、优化电子表格的协作等等 | ONLYOFFICE 博客 一、界面与用户体验 整体布局和设计的美观性、易用性: ONLYOFFICE 8.1 版本的桌面编辑器展现出了令人眼前一亮…

【ISAC】通感一体化讲座(刘凡)

高斯信道下通信感知一体化的性能极限(刘凡) 文章目录 背景背景 通信和感知在硬件结构上相似,高效地利用资源,实现相互的增益; 感知是基于不同的任务,比如目标检测(检测概率,虚警概率),估计任务(从收到的信号中去估计有用的参数,均方误差,CRB),识别(知道目标的…

开源seata的分布式事务解决方案-XA、AT、TCC、SAGA哪个模式好

分布式事务是分布式系统中非常重要的一部分。假设一个用户购买商品的业务逻辑,系统有3个微服务组成,分别是订单服务、账户服务、库存服务,用户在提交订单后会从用户账户余额中扣款,同时扣减库存数量。在这样的场景下扣款和减库存需…

Vue核心指令解析:探索MVVM与数据操作之美

文章目录 前言一、Vue.js1. MVVM模式介绍2. 单页面组件介绍及案例讲解3. 插值表达式介绍及案例讲解 二、Vue常用指令详解1. 数据绑定指令v-textv-html 2. 条件渲染指令v-ifv-show 3. 列表渲染指令v-for循环数组介绍及案例讲解循环对象介绍及案例讲解 4. 事件监听指令v-on事件修…

【unity小技巧】unity事件系统创建通用的对象交互的功能

文章目录 前言实现1. **InteractEvent 类**:2. **Interact 类**:3. **Player 类**:4. **Chest 类**: 工作流程说明:开单个箱子按钮触发打开很多箱子拾取物品(传参)参考完结 前言 游戏开发过程中…

有效利用MRP能为中小企业带来什么?

在离散制造企业,主流的生产模式主要为面向订单生产和面向库存生产(又称为预测生产),在中小企业中,一般为面向订单生产,也有部分面向库存和面向订单混合的生产方式(以面向订单为主,面…

【初阶数据结构】深入解析栈:探索底层逻辑

🔥引言 本篇将深入解析栈:探索底层逻辑,理解底层是如何实现并了解该接口实现的优缺点,以便于我们在编写程序灵活地使用该数据结构。 🌈个人主页:是店小二呀 🌈C语言笔记专栏:C语言笔记 &#x1…

Kylin系列:架构和高级功能详解

目录 一、Kylin的架构 1.1 总体架构概述 1.2 数据源 1.3 元数据存储 1.4 构建引擎 1.5 存储引擎 1.6 查询引擎 1.7 用户接口 二、Kylin的高级功能 2.1 多维立方体(Cube) 2.1.1 Cube的定义 2.1.2 Cube的构建 2.2 查询优化 2.3 数据模型和星型模式 2.3.1 数据模…

我的常见问题记录

1,maven在idea工具可以正常使用,在命令窗口执行出现问题 代码: E:\test-hello\simple-test>mvn clean compile [INFO] Scanning for projects... [WARNING] [WARNING] Some problems were encountered while building the effective model for org.consola:simple-test:jar…

SpringBoot系列之搭建WebSocket应用

SpringBoot系列之@ServerEndpoint方式开发WebSocket应用。在实时的数据推送方面,经常会使用WebSocket或者MQTT来实现,WebSocket是一种不错的方案,只需要建立连接,服务端和客户端就可以进行双向的数据通信。很多网站的客户聊天,也经常使用WebSocket技术来实现。 WebSocket…