强对流降水临近预报

强对流降水是一种最常见的灾害性天气，其突发性和局地性强、生命史短、灾害重等特点极易给人民生产和生活带来巨大的破坏和伤害。如果可以提前预知此类天气状态，则可以挽回巨大的生命财产损失，尤其是短时（0~12小时）和临近（0~2小时）阶段是转移和应对灾害天气的黄金时期。对强对流降水的临近预报和准确评估成为一项极具挑战性的重要课题。本文从机理分析和数学模型的角度，借助传统物理方法和深度学习模型两种方式建立强对流降水临近预报模型，研究双偏振雷达观测数据和降水微物理结构之间的关系，预测临近雷达数据和定量降水估测，最后建立降水综合贡献度指标体系，并优化数据融合策略，不断提高预测精度，以便更好地为应对突发灾害性天气提供理论指南。

问题1：将问题1拆分为问题1-1和问题1-2。

问题 1-1：根据双偏振雷达变量（ZH、ZDR、KDP）求解降水微物理结构信息。根据问题描述将双偏振雷达数据提取为 ZH、ZDR、KDP 三个变量，将降水微物理结构提取为降水粒子大小、相态、含水量三个变量，问题转化为以双偏振雷达变量（ZH、ZDR、KDP）作为输入，用雨滴谱反推技术求解降水粒子大小、用模糊逻辑法求解相态、用线性回归方法含水量。

问题1-2：建立深度学习强对流临近预报模型并预测未来1小时的雷达观测量ZH。以U-Net和ConvLSTM为基础，分别训练1km、3km、7km三个等高面的预报模型，输入前面一小时（10 帧）的雷达观测量（ZH、ZDR、KDP），输出后续一小时（10 帧）的ZH预报，最后进行模型评估和对比分析。

问题 2：优化问题 1 中的临近预报模型，缓解模糊效应。从数据增强和模型优化两方面解决问题。首先借助生成对抗网络（GAN）生成额外的训练数据，帮助深度学习模型获取更多的数据特征信息。然后引入注意力机制和残差结构进行模型优化，解决模型的输入序列缺乏区分度问题和深层神经网络中的梯度消失或梯度爆炸的问题，构建基于传统U-Net 的改进模型 GAN-AR-U-Net。后面与问题 1 中相同，分别训练 1km、3km、7km三个等高面的预报模型，输入前面一小时（10帧）的雷达观测量（ZH、ZDR、KDP），输出后续一小时（10帧）的ZH预报，最后进行模型评估和对比分析。

问题 3：借助雨滴谱拟合方法和深度学习模型完成定量降水估测并求解 Z-R 关系。雨滴谱拟合降水量估测方法中，根据双偏振雷达降水估测公式，借助整体数据与分段雨强拟合方法完成Z-R关系的拟合，随后进行两种拟合方法估测结果的分析和评估。基于深度学习的降水估测方法中，以问题1、问题2为基础，构建基于GAN-AR-U-Net的定量降水估测网络模型，并将传统方法与深度学习方法输出结果做比较分析。模型输入为两个雷达变量ZH和ZDR，不考虑KDP，输出降水量预测值。

问题 4：构建降水综合贡献度指标体系和评估方法，优化数据融合策略以提高临近预报准确率。在本题中充分考虑双偏振雷达资料在降水量预报和降水微物理结构等方面的贡献，建立双偏振雷达资料“降水粒子半径-相态-含水量”的综合贡献度指标评估体系；构建基于模糊层次分析法–熵权法–逼近理想解排序法的双偏振雷达资料贡献度评估方法，分析降水的微物理结构贡献度最优选择策略，并将方案进行灵敏度检验；最后，通过算例，分析双偏振雷达资料中的三个变量对降水微物理结构三个指标的综合贡献度，及其灵敏度，优化双偏振雷达变量数据融合策略，为降水微物理结构和预报提出参考性建议。

关键词：强对流降水；双偏振雷达；微物理结构；雨滴谱；临近预报；深度学习模型；U-Net；ConvLSTM；生成对抗网络；注意力机制；残差结构；定量降水估测；贡献度评估；数据融合策略

一、问题背景与问题重述

1.1问题背景

强对流天气对人们的生活和工作具有很大影响。由于我国辽阔的地域以及自然条件

的复杂性，短时强降水、龙卷风等极端性灾害性天气呈多发频发态势。这种天气的出现不仅会对国家经济造成损失，同时也会对人们的生命安全造成威胁。如图 1-1 所示，为2022年6月16-21日暴雨灾害影响评估。部分地区由于暴雨遭受暴雨影响等级很高，城市、农田长时间积浶，地表生态环境和农作物受损严重。

图1-1 2022年6月16-21日暴雨灾害影响评估

我国政府极为重视强对流天气带来的突发性问题。2021年，国务院发布了《气象高质量发展纲要（2022-2035 年）》和《短时临近预报预警服务业务能力提升工作方案》部署要求。纲要指出，加强天气机理、气象灾害发生机理和地球系统多圈层相互作用等

基础研究，强化地球系统数值预报模式、灾害性天气预报、气候变化等领域的科学研究和技术攻关[1]。之后，气象局印发了《进一步提升国家级短时临近预报预警服务业务能力工作方案（2022-2035）》，进一步提升国家级应对强对流天气的短临预报预警服务业务能力。

强对流降水作为灾害性天气中最常见的一种，较其他极端性天气出现的更为频繁。

它最显著的特点就是生命周期短、突发性强。在国家举办重大活动时，气象保障服务尤为重要，这就需要短临预报的协助。与短期预报相比，提前 1-2 小时的短临预报可以清楚的捕捉到系统所在的位置，从而能够预报出降雨的落区。这有利于活动方提前采取措

施应对，以保障活动的顺利举行。此外，强对流降水还会影响到人们的出行和安全。最常见的就是航班延误和飞行安全。2021 年 7 月 20 日，郑州多地爆发强降雨，这导致郑州新郑机场多架航班被迫延误或取消，给旅客的出行造成了很大的影响[2]。2020年8月7 日，印度航空公司一架波音 737-800 客机在尼加拉国际机场降落时遭遇暴雨，冒险着陆导致坠毁，且伤亡人数较多。因此，深入研究强对流天气系统的物理机理，提升灾害性天气精密监测和灾害性天气短时临近精准预报能力具有重要意义。

强对流天气临近预报使用的传统方法是依靠雷达等观测资料，并结合风暴识别、追踪技术进行雷达外推预报。该方法的目的是为得到未来时刻的雷达反射率因子，然后通过雷达反射率因子和降水之间的经验性关系（即Z-R关系）来估计未来某个时刻的降水量。近年来，随着物联网行业的发展，人类产生和储存的数据越来越多。与此同时，人工智能和深度学习技术成为各行各业研究的热点。深度学习方法作为一类数据驱动的方法，因大数据的积累而被广泛的使用。理论上，其性能随着训练数据量增大而提升的优点，使得该方法适用于有大量雷达观测数据支撑的短临预报领域。目前国际上的短临预报模型主要是以深度学习为基础，包括基于卷积神经网络（Convolutional Neural Networks, CNNs）和基于循环神经网络（Recurrent Neural Networks, RNNs）两类。其中，CNNs中的U-Net模型[3]和RNNs中的ConvLSTM、DGMR等模型[4,5]已被用于强对流天气的短临预报。

本题针对双偏振雷达数据和降水格点数据展开研究，借助 U-Net、ConvLSTM、DGMR、QPE 等人工智能技术实现对突发性和局地性强的强对流降水短期临近精确预报。此外，还设计了数学模型以展示双偏振雷达数据中的微物理特征和降水量之间的关系及预报中的模糊效应。最后，根据对双偏振雷达资料在强对流降水临近预报中的贡献，设计数据融合策略，优化强对流降水的预报结果。在强对流降水临近预报问题中，双偏振雷达数据和降水格点数据作为重要因素，对两者的关系和贡献建模并分析具有重要的实际意义。因此，本问题的分析和求解具有较好的研究价值。

1.2问题重述

          基于前述研究背景，该题目提供两组数据，基于数据和问题的描述，拟要解决的研究问题如下：
          （1）根据附件数据，建立可提取用于强对流临近预报双偏振雷达资料中微物理特征信息的数学模型，并以前面一小时的雷达观测量（ZH、ZDR、KDP）为输入，输出后续一小时的ZH预报；
          （2）在问题 1 的基础上，设计数学模型解决预报中存在的模糊效应，尽可能消除和缓解“回归到平均”问题，使预报出的雷达回波细节更充分真实；
          （3）根据附件数据中的ZH、ZDR和降水量，设计数学模型完成定量降水估计，使模型输入为ZH、ZDR，输出为降水量，并且本算法中不可使用KDP变量；
          （4）设计数学模型来评估双偏振雷达数据在强对流降水临近预报中的贡献，并优化数据融合策略，使其预报结果更加准确，从而更好地应对突发性局部地区的强对流天气。

二、模型假设与符号说明

2.1模型假设

（1）雷达和降水样本数据属性完整、数据以致，无噪声数据问题；
（2）每个降水过程中的两帧之间的时间间隔均相同，不存在其他因素影响间隔差；（3）降水数据为近似的地面降水，高度对降水结果无影响；
（4）在进行定量降水估计时，只考虑雷达观测量ZH和ZDR；
（5）近地面垂直气流很弱，可略去不计；

（6）所有雨滴的散射都满足瑞利散射条件。

2.2符号说明

表2-1 符号说明

符号

意义

ZDR

KDP

POD

FAR

CSI

水平反射率因子

差分反射率

比差分相移

粒径

截断参数

形状因子

斜率参数

中值粒径

归一化的粒子数浓度

降水强度

液态含水量

检测概率

虚警率

关键成功指标

三、理论基础与技术准备

3.1强对流降水短临预报

短临预报（Nowcasting）指的是气象预报的时效范围，一般情况下主要集中在 0 小时到 12 小时之间。短期预报的时效范围在 1 到 3 天，相比较而言，短临预报的时效更短。短临预报主要应用于水平范围较小、生命期较短的天气系统，即中小尺度的天气系统，主要针对生消速度快，难以把握的强对流天气。这是因为强对流天气的生命周期往往很短，且多为突发性的情况，这刚好与短临预报的时效性契合。

短期预报一般只针对强对流天气出现的可能性进行预报，但却无法准确预报由强对流天气系统所产生的降雨区域范围以及降雨的猛烈程度。而短临预报却能解决这些问题。一般，提前1小时到2小时的短临预报能够捕捉到强对流系统所在的位置，从而预报出强对流天气所携带而来的降雨落区，以及衍生剧烈天气的影响范围。

3.2双偏振雷达观测

对天气的观测，并且及时进行天气预报，尤其是对强对流天气的短临预报，可以及时的向公众发布灾害预警，具有重要的社会经济意义。随着现代科技发展和提供的观测天气和预警系统中，其中最重要、最关键的仪器之一就是气象雷达。雷达几乎是唯一的、必不可少的传感器，能够实时、准确地提供大面积的强风、强降水、冰雹等强对流天气现象的信息。最常用两种雷达是多普勒雷达和风廓线雷达。在实际应用中表明，这两种雷达在提供空间，特别是大气层低层的高分辨率数据方面具有极高的价值。多普勒雷达作为国家网络的一部分，并越来越多地在区域网络中广泛使用，主要用于恶劣天气现象的短程预报。其中特别有用的是多普勒雷达在进行风力测量和估计降雨量方面的能力。

偏振雷达（Polarimetric Radars）是在传统单偏振多普勒天气雷达的基础上添加额外的发射和处理功能，可以进一步计算出关于接收到的反射电磁能量方向性的额外信息。大多数气象雷达发射和接收的电波都是单一的、水平偏振的，电场波峰的方向沿水平轴对齐。偏振雷达则是同时发射和接收水平和垂直两极化的无线电波。尽管有许多不同的方法可以将水平和垂直脉冲混合到传输方案中，但最常用的方法是在水平和垂直极化之间交替使用每个连续脉冲。在每一个传输脉冲后都有一个短暂的监听期，在此期间，雷达会接收和解释来自云层的反射信号。偏振雷达发射和接收水平和垂直偏振的无线电波脉冲。因此，他们同时测量云和降水粒子的水平和垂直方向上的维度。这些附加信息改进了雷达对降水类型和速率的估计。

3.3雨滴谱DSD

雨滴谱资料研究对进一步了解对流云团内部的微物理结构特征、雷达定量估测降水和改进数值预报模式有重要意义。雨滴谱资料是由雨滴谱仪获得，我国最常用的是激光雨滴谱。如图 3-1 显示的是地面激光雨滴谱仪，它可以同时观测水凝物粒子的数量、尺度和下落速度。

循环神经网络

循环神经网络（Recurrent Neural Network，RNN）是一类用于处理序列数据的神经网络，它是在全连接神经网络的基础上增加了前后时序上的关系。其核心思想是利用该

网络内部很强的记忆性来处理任意时序的输入序列，所以在处理具有时序性的问题时展

现出很好的适用性，被广泛的应用在语音识别、语言模型以及自然语言生成等任务上。

这同样为气象领域带来了启发，对于本文研究的降水预测问题，降水数据之间有着时序上的联系，利用 RNN 可以较好的抓取降水数据之间的时序信息，这有助于提高降水预测的准确性。

RNN的网络结构如图3-4所示：

图3-4循环神经网络结构

RNN会受到短时记忆的影响，适用于处理的是长期依赖的问题，可如果输入的关键信息间隔较大，RNN会丧失学习远距离信息的能力，导致遗漏重要信息，并且在反向传播期间面临梯度消失或梯度爆炸的问题。长短期记忆网络(LongShort-TermMemory，LSTM)是一种改进之后的循环神经网络,作为 RNN 的变体，可以在一定程度上解决反向传播期间梯度消失以及梯度爆炸等问题。LSTM网络结构如图3-5所示：

八、模型评价与推广

8.1模型的优点

问题1：
（1）U-Net的编码器-解码器结构有助于保留图像的上下文信息。在强对流预报中，这有助于更好地理解天气系统的全局和局部结构。

（2）U-Net使用跳跃连接（skip connections）将编码器和解码器层级之间的特征图相连接，从而促进了特征复用。这有助于提高预测的准确性。

          问题2：
          （1）采用生成对抗网络（GAN）用于数据增强，通过生成额外的训练数据，帮助提高深度学习模型的性能；
          （2）引入注意力机制和残差结构改进和优化 U-Net 模型，进一步提高了预测的准确率。

          问题3：
          （1）利用雨滴谱数据反推雷达观测数据。基于物理原理的方法。它依赖于雨滴谱、雷达波长、反射率之间的物理关系，因此提供了对降水过程的物理洞察；
          （2）利用GAN-AR-U-Net深度学习数据驱动模型，来学习ZH和ZDR之间的复杂非线性关系。可以从大量的ZH和ZDR观测数据中学习。这意味着模型可以不断优化和适应实际观测数据，提高了其泛化能力。