文献阅读记录,也是组会汇报材料收集,从中文文献开始学习。
开发一种快速、精确且自动化程度较高的滑坡定位或检测模型可以为地质灾害防治提供有效支撑,为研究滑坡分布规律及滑坡潜在风险等问题提供技术支持
①《基于高分辨率遥感影像和改进 U-Net 模型的滑坡提取———以汶川地区为例》
背景
语义分割作为遥感图像解译的主要表现形式之一,已被广泛应用于滑坡提取任务中。U-Net 是一种轻量化、容易部署的网络模型,其优势在于小样本训练,因此被大量用于滑坡检测任务。U-Net 由编码器和解码器构成。 在编码器阶段,模型通过一系列卷积、池化和下采样操作来提取图像中的特征信息;解码器阶段则通过一系列上采样和卷积操作,恢复图像分辨率以实现对图像语义分割。
U-Net 模型在滑坡检测任务中具有应用潜力,另一方面U-Net 模型本身的缺陷,如编码器与解码器之间存在的语义鸿沟、上采样过程中的空间信息损失等。
针对前人研究的不足,本文提出了一种改进型U-Net 模型实现滑坡的快速检测,同时引入 DEM、变化检测、坡度等多源数据作为模型输入。 模型以U-Net 为基准,结合密集上采样技术和非对称卷积技术来解决语义信息不匹配和空间信息损失问题,提高了网络在复杂场景下的滑坡解译能力
U-Net原理分析与代码解读 - 知乎 (zhihu.com)
研究区域
四川省汶川县映秀镇,以2008年5月12日为时间节点,选取震前、震后影像进行滑坡提取
数据
高分辨率光学影像——2007年5月Quickbird02、2018年4月world-view3(积雪遮挡、云覆盖等问题),DEM数据——ALOS PALSAR 12.5m分辨率
方法
样本库构建:3236副256*256RGB影像,1m分辨率,对应于3236副二值化标签图像(255:滑坡,0:背景)。根据专家知识目视解译进行初步样本制作。利用坡度信息进行二次核验,坡度小于经验值10°予以剔除,剔除面积占比小于3%的滑坡噪点。训练数据:测试数据=7:3
多源数据集
高分辨率光学影像、DEM、面向对象多特征变化向量分析法( robust change vector analysis,RCVA)方法提取的滑坡发生前后的变化特征和依据DEM 数据提取的坡度信息(256*256*6,不明白6个通道怎么来的,应该就是总的输入数据种类),数据通过随机翻转和随机缩放得到增强,输入改进网络。
由于DEM 数据和坡度信息和遥感数据在分辨率上有较大差异,因此地形特征需要插值处理。 研究为了提升滑坡的分割效果,选用双线性、分形插值、反距离插值等方式提升 DEM 数据和坡度信息的分辨率,结果表明不同插值方式对模型分割结果的影响并无明显区别,因此本实验结果选用双线性插值法处理地形特征。
面向对象多特征变化向量分析法:提取遥感影像中的变化特征。该方法基于 2 幅遥感影像的纹理特征得到不同时相间的变化特征。 假设在某一给定区域内,对应像素间的光谱方差最小,这样可以在计算变化特征时减少图像畸变引起的误差。 计算公式如下:
a 和 b 分别为 a 和 b 时相遥感影像作为参考影像计算变化特征;p,q 为计算某像素位置变化特征时该像素在参考影像上的行列号;j,k 为另一遥感影像计算变化特征时像素行列号; x1 i和 x2 i为不同时相影像中波段 i 的数字编号; xdiff 为波段差值;n为波段数;w 为计算变化特征时的窗口尺寸,也可以视作图像配准时允许的误差范围。 分别以 x1 i和 x2 i
作为基准图像计算特征,可以减小信息损失。 该方法使用尺寸为 2w + 1 的滑动窗口计算像素差异。其中,本文 w 的值是 3 像素
从时间的角度来看,滑坡的实质就是变化,因此引入变化信息有利于模型学习,提高滑坡解译的精度。 高程信息可以影响滑坡的形态和分布特征
以 U-Net 网络为基准,通过非对称卷积(asymmetric convolutions, AC)和密集上采样( dense upsampling convolution,DUC) 模块的不同组合, 设计了 U-Net,U-Net+AC,U-Net+DUC,UNet+AC+DUC 这 4 种网络提取研究区内的滑坡
评价指标
研究选用 Precision,Recall,IoU,F1 - Score 这 4 种指标评价模型精度。研究采用了一种包含柔性边界的精度计算方法评价模型,该方法允许预测结果与标签之间存在一个像素范围的误差。最后分析不同模型得到的滑坡提取结果,选取最佳模型生成研究区的滑坡分布图。
模型
U-Net 由编码器和解码器 2 部分组成,其中编码器的下采样模块由 3×3 卷积构成,每个卷积层后使用 BN 层和 RELU 层增强模型的表征能力。 每经过一次下采样,输入数据的特征图尺寸缩小为原尺寸的 1 / 2,通道数扩大 1 倍。 为了弥补因编码器下采样损失的信息,编码器与解码器之间的特征图在通道上叠加,为解码器的特征图添加更多的细节信息。
密集上采样引入原因——滑坡边界的确定对分割效果具有十分明显的影响。 传统的 U-Net 编码器的下采样过程会对滑坡特征造成不可逆的空间信息损失,其解码器则通过双线性插值上采样的方式来恢复特征图的空间大小,故难以精细刻画滑坡边界特征,同时导致 U-Net编码器和解码器提取的滑坡特征存在语义差异。直接通过特征图拼接的方式很难弥合这种差异性,为此本文引入了密集上采样模块。在解码阶段,该模块通过空间重新排列的方式对低分辨率特征图进行降维,同时提高了空间分辨率,直至与滑坡标签大小相同,从而起到保留空间信息和追踪边界的作用
密集上采样模块全部由卷积层组成。 密集上采样输入特征图的尺寸是 h × w × C,其中,h = H / d, w = W / d, d 是下采样的倍数。 为了使输出的特征图可以通过重新排列的方式与标签大小一致,特征图输出的大小应当是 h × w × d2。 经过密集上采样模块后生成的特征图尺寸是 H × W,与原始图像尺寸一致。 这样每个上采样的卷积层可以直接预测像素级的滑坡分布,从而增强解码器对滑坡边界的捕捉能力。
非对称卷积引入原因——不规则的滑坡边界会使模型解译滑坡的结果不精确。 为了增强网络在复杂场景下对滑坡的解译能力,模型引入非对称卷积。标准的 d × d 卷积可分解为 1 × d 和 d × 1 卷积,本文中模型使用 1 × 3 和 3 × 1 大小的卷积核取代标准的 3 × 3 卷积,整合多个非线性激活层,增强网络在复杂场景下对滑坡的解译能力。 该方法可以在提升网络分割性能的同时不显著增加计算开销,保持了 U - Net 模型轻量化、易于部署的优势。
该方法利用了二维卷积的可加性,即卷积过程存在这样的性质,大小兼容的二维卷积核在同一特
征图上以相同的步长进行卷积运算,产生相同大小的特征图,对这些特征图求和,可以等效于这些卷积核相加产生的结果。 公式表示为:
式中:I 为执行卷积操作的矩阵; K(1) 和 K(2) 为具有兼容尺寸的 2 维卷积核; 为求和运算。 兼容意味着较小的内核可以采用求和的方式添加到较大尺寸的卷积核上。 例如,3 × 1 卷积和 1 × 3 卷积是与 3 × 3 卷积兼容的。 对于一个特定的卷积核 F(j) ,一个指定的点 y,则输出结果可用下式计算:
式中 X 为输入 M 对应的滑动窗口。 此时将 2 个卷积核的输出通道相加,则依据前式,相加法则成立。
精度评价
Precision 体现算法对负样本的识别能力。 Recall 表示所有正例中被正确预测的比例。 F1-score 是统计学中用来衡量二分类模型精确度的一种指标。 它同时兼顾了分类模型的精确率和召回率,可以看作是两者的一种调和平均,值介于0 ~ 1 之间。 IoU 表示标签的真实值与模型预测值两者集合的重叠率
由于滑坡边界线通常不明显,植被以及降水造成的冲沟都会增加滑坡边界人工判读难度,影响精度计算的结果。 研究设计了一种包含柔性边界的精度计算方式,该方法可以允许边界存在一定范围的误差,实验中允许的误差范围是 1 个像素。
TP 为被模型预测为正类的正样本数量;FP 为被模型预测为正类的负样本数量;FN 为被模型预测为负类的正样本数量;TN 为被模型预测为负类的负样本数量。 在滑坡图斑边界以一个像元为距离做缓冲区,缓冲区内的像元个数是 e,经过修正后的 TPC =TP+e,FPC =FP-e,FNC =FN-e,FPC =FP+e。
超参数设置
改进的 U-Net 模型使用大小为 3×3 的卷积核构建。 权重初始化采用 He 等 [49]提出的方法。 在每次卷积操作之前使用 0 填充特征图,确保所有的特征图具有相同大小。 优化器选择随机梯度下降法,初始学习率为 0. 01, 每 10 个训练周期衰减70%,共训练 100 个周期。 损失函数是交叉熵损失函数,用于衡量标签与输出结果之间的差异程度
结论
本研究对比了不同模块组合和不同数据组合对模型分割精度的影响。 为了探究 DEM 数据和坡度以及变化特征对分割精度的影响,设计对比实验比较了 U-Net 网络在不同数据上的表现。 除了 U-Net网络外,研究还通过 AC 和 DUC 模块的不同组合方式,设计了 U -Net +AC,U -Net +DUC,U -Net +AC + DUC 这 3 种网络对比不同模块对分割结果的影响。
不同数据源的影响
应用上述模型得到的滑坡结果如图 5 所示,预测结果有漏检或错检存在,这主要体现在:①滑坡边界不一致(如人工勾绘的边界相对平滑,而预测的滑坡边界多呈锯齿状,二者难以重合),故本文引入了新的精度量度指标;②裸地与滑坡仍存在一定的混淆,为此本文将 DEM 数据和变化特征图(表 1,+ C)作为模型输入,以期引导模型对二者进行有效区分。 遗憾的是,由于变化特征图受云雾、积雪干扰明显,且所使用的 DEM 分辨率较低,加之先前已使用过坡度信息进行样本筛选,故新加入的数据源对解译精度只有小幅提升(如表 1)。 不过,后文将证明在一些局部地段,例如地形起伏较大或无云雪覆盖的区域(图 5,对比试验区),新加入的数据源对解译精度具有显著提升
这里加的C是什么,没有看到论文解释???是变化特征???
从遥感图像处理的角度来看,滑坡实质上是一种变化,所以引入变化检测结果作为模型输入特征之一。 为了更好地体现变化特征在滑坡检测中的作用,在此选取部分研究区进行深入分析。 该区域变化特征(图 6( a)) 与滑坡分布具有一定的关联性,但变化特征的分布与滑坡分布并不是完全一致。 这是因为滑坡虽然属于变化的一种类型,但该地区的变化并不完全由滑坡引起。 植被的变更、降雨、降雪引起的地表覆盖物的变化都属于时序变化的范畴。
因此变化特征在此作为一种输入特征用于训练而不是直接提取滑坡。 加入变化特征后的滑坡分割结果(图 6(c)) 与标签基本一致,目视效果较未加入变化特征的解译结果(图 6( b)) 有明显提升,表现为IoU,Precision 等精度量度的显著提升(表 2)。 在全区尺度上受限于前后时相影像质量、云雾遮挡等差异影响,导致变化特征提升分割效果不明显,但在数据质量较高的区域仍然说明了该方法的可行性创新性。
不同模型的影响
可见改进的 U-Net 网络(U-Net+AC+DUC)在几个评价指标上都取得了最佳的效果,并且参数量(Params)仅高于 ResU-Net,FLOPS 处于较低位置,表明该网络可以在保持轻量化、易部署优势的同时提升滑坡检测能力。
消融实验结果
可见,引入非对称卷积模块后,预测结果的细节特征得以加强,分割边界更贴近自然地物边界,使其 Recall 小幅提升(如表 6a、b、c、d)。 密集上采样模块由于弥合了编码器和解码器之间的语义差异,故其预测结果与人工解译的结果更为贴近,表现为 IoU、Precision 等精度量度显著提升(如表 6a、b、e)。 综合二者的优势,可保证模型对复杂场景的适应能力,
精度和目视效果提升更为显著(如表 6a、b、c、f、g),如较之于基准 U-Net 模型,U-Net+AC+DUC 的 IoU和召回率分别提高了 5%和 3%。 同时,其浮点运算次数和参数量变化不大,表明计算开销仍维持在较低水平。 总之,模型从 U-Net 到 U-Net+AC(加了非对称卷积)、U-Net +DUC(加了密集上采样) 再到 U-Net+AC+ DUC 之解译精度和目视效果逐步改善,符合预期。
消融实验表明,模型从 U-Net 到 U-Net_AC、UNet_AC+DUC 再到 U-Net+AC+ DUC 之解译精度和目视效果逐步改善。
亮点
其次,本文就经典 U-Net 模型存在空间信息损失及语义差异两大缺陷,有针对性的引入了非对称卷积(AC)和密集上采样模块(DUC)用于滑坡灾害点的自动提取,其模型输入包括 RGB 遥感影像、DEM 高程数据、坡度特征图、变化特征图等多源数据。
由于光照、滑坡形状、植被物候、拍摄角等因素的干扰,U-Net 模型在滑坡解译过程中存在一定的缺陷。 一是不能很好的提取诊断性的语义和上下文信息,这是因为网络的编码器和解码器输出的特征图存在语义鸿沟, 因此采用密集上采样的方法缩小编码器和解码器间的语义差异,提高滑坡分割的精度;二是 U - Net 网络存在一些固有的缺陷,跳跃连结会使差异过大的特征图在通道维叠加,引入无关的特征[37] ,面对不规则的目标时不能很好地适应,影响分割效果。 因此本研究引入了非对称卷积增强网络对滑坡不规则分布的适应能力。
较之于其它的语义分割算法包括新近提出的 ConvNext 和 Swin - Transformer等,改进后的 U-Net 模型所取得的滑坡解译精度更高,且计算成本较低。
为了减轻人工滑坡解译边界的不确定性,本文还提出了一套新的精度量度标准,即允许预测边界与人工解译边界存在一个像素的误差,从而使预测结果聚焦于滑坡本身而非边界的契合。
优化
(1) 扩展现有样本库,即纳入更多的、不同类型和地区的滑坡样本。 (2) 收集高质量多期次影像制作变化特征图,重点调查变化特征对解译精度的影响。 (3) 模型的优化和改进,即在保证模型轻量化的同时提高其捕捉语义特征的能力
借鉴之处
提取光学影像变化特征上的方法:面向对象多特征变化向量分析法