论文地址https://arxiv.org/pdf/2301.10051.pdf
目录
01CIEFRNet:面向高速公路的抛洒物检测算法
02改进 YOLOv5 的 PDC 钻头复合片缺损识别
03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测
04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测
编辑05 基于改进YOLOv8的SAR图像飞机目标检测算法
编辑编辑
06 基于改进YOLOv8的隧道火灾检测研究
07 融合 CA-BiFPN 的轻量化人体姿态估计算法
08基于改进 YOLOv5s 的果园环境葡萄检测
09 基于融合 GhostNetV2 的 YOLO v7 水稻籽粒检测
10 结合特征重用与特征重建的 YOLO 绝缘子检测方法
WIoU 更多的关注到普通样本的锚框,有效防止网络模型产生不能收敛的梯度,提升了检测精度。
01CIEFRNet:面向高速公路的抛洒物检测算法
摘要:高速公路抛洒物危及行车安全,极易诱发交通事故,及时识别并清理高速公路抛洒物十分重要。由于高速公路抛洒物在图像中面积占比小且图像背景复杂,现有检测方法常出现漏检和误检的情况。针对上述问题,提出了一种基于上下文信息增强和特征提纯的抛洒物检测算法,记为CIEFRNet。首先,设计了一种融合上下文transformer的主干特征提取模块(CSP-COT),充分挖掘局部静态上下文信息和全局动态上下文信息,增强小抛洒物的特征表示;其次,在主干网络中使用改进的空间金字塔池化(ISPP),通过级联的空洞卷积实现特征的多尺度下采样,减轻目标细节信息的损失;为提高特征融合能力,设计了特征提纯模块(CNAB),其中嵌入了提出的一种混合注意力机制(ECSA),可抑制图像背景噪声,强化微小抛洒物的特征;最后,引入基于动态非单调聚焦机制的WIloU优化损失函数,提高小抛洒物学习能力,加速网络收敛。实验结果表明,所提方法在自制的高速公路抛洒物数据集上的精确率、召回率、APo;和APo.5.a9s分别达到96.5%、81.6%、88.1%和46.5%,优于当前主流的目标检测方法,其算法复杂度也更低,满足实际场景应用需要。
关键词:抛洒物检测;上下文信息;空间金字塔池化;注意力机制;损失函数
02改进 YOLOv5 的 PDC 钻头复合片缺损识别
摘要:PDC钻头复合片的缺损情况是影响钻进效率的重要因素,检测 PDC钻头复合片是否缺损是修复PDC钻头的前提。为了减少对PDC'钻头复合片的误检,提升检测准确率,提出了一种基于改进VOLOv5的目标检测算法。该方法以YOLOv5网络为基础,融合RepVGG重参数化模块增强网络的特征提取能力;在C3模块中引入坐标注意力机制,在通道注意力机制中嵌入位置信息,提升对缺损复合片的目标检测能力;将边界框回归损失函数改进为WIoU损失函数,制定合适的梯度增益分配策略。实验结果表明,改进后的网络的精确率提升2%,召回率提升0.9%,平均精度均值(mAP)提升了1.3%,达到了98%,能够实现对 PDC钻头复合片的缺损识别。
关键字:PDC钻头复合片;YOLOv5; RepVGG;坐标注意力机制;WIoU损失函数
03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测
摘要:【目的】针对水下环境复杂,水下目标因光线折射等问题导致的目标边界模糊或外观、形状可能会发生非刚性形变,使水下目标检测困难,提出了一种基于SimAM注意力机制的DCN-YOLOv5水下目标检测方法。【方法】首先,采用YOLOv5所使用的双向金字塔网络(BiFPN, Bi-directional Feature Pyramid Network)在多个尺度上提取和融合特征信息,从而提高目标辨别的准确度;其次,针对水下目标的外观、形状的变化问题,将C3模块中的CBS模块结合可变形卷积(DCN, Deformable Convolution),提出DBS模块并组成D3模块替换部分C3模块,以适应水下目标的外观、形状的变化;同时,融入加权注意力机制(SimAM),自适应地调节模型的关注度,进一步在复杂场景下增强特征表达能力;最后,考虑目标边界模糊,为改善目标定位精度,采用WIoU(Wise-loU)损失函数来替换交叉嫡损失,能够更好地适应不同目标类型和尺寸的特点,提高算法鲁棒性。【结果】实验结果表明,DCN-YOLOv5可以达到87.57%的平均精度(mAP),检测效果优于YOLOv5网络和其他经典网络,平均每张图像的识别时间仅为24.5ms。【结论】通过实验结果可以证明模型在检测精度明显提升的同时兼顾检测的实时性,对水下目标检测用于实际用途有着一定的参考价值。
关键词:水下目标检测;SimAM注意力机制;可变形卷积; WloU
04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测
05 基于改进YOLOv8的SAR图像飞机目标检测算法
为了解决样本质量的不平衡问题,后续又提出Focal-EIOU 损失函数,假设y为控制抑制程度的参数。Focal-EIOU损失函数公式如下:
06 基于改进YOLOv8的隧道火灾检测研究
CIoU虽然将边界框回归的距离、重叠面积、中心点偏移以及宽高比都考虑在内,避免了DIoU中心点重合时交并比一样无法区分的情况,对于边界框回归有更好的收敛率。但是没有考虑到真实框与预测框之间不匹配的方向。文献[28]指出CIoU公式(5)中v仅仅只是反映了宽高比的差异,而不是预测框宽高和真实框宽高的实际关系,并且质量差的回归样本对回归损失产生了比较大的影响,回归质量相对较好的样本则难以进一步优化。出于这两个原因导致模型训练收敛速度慢且效率较低,预测框不够精确。该文献提出Focal EloUv1来解决质量较好和质量较差的样本间的 BBR 平衡问题。
但是由于EIoU使用静态聚焦机制(FM,Focusing Mechanism),非单调FM的潜力没有被充分利用,基于这一思想,文献[29]提出了一种具有动态非单调FM 的损失,名为WIoU。
07 融合 CA-BiFPN 的轻量化人体姿态估计算法
训练数据集中不可避免的包含低质量样本,距离、纵横比等几何度量都会加剧对低质量样本的惩罚从而使模型的泛化性能下降,因此高质量样本不能够很好的进一步优化。因此本文又引入了具有动态非单调聚焦机制的WloU126损失函数对样本进行平衡,通过动态非单调聚焦机制将loU替换为离群度来评估锚框的质量,以避免几何因素(例如距离和纵横比)对模型的过度惩罚,即
08基于改进 YOLOv5s 的果园环境葡萄检测
原YOLOv5s采用CIoU Loss做预测框的损失函数,CIoU损失函数在DIoU的基础上引入了预测边界框与真实边界框的长宽比,在一定程度上可以加快预测框的回归速度,但是两个边界框长宽比的定义十分模糊,并不利于网络的优化。本研究采用了Wise-IoUv3损失函数[28],与前者相比,Wise-loUv3没有引入长宽比的计算,而是在基于注意力的边界框损失 Wise-IoU vl 上,采用了动态非单调的聚焦机制,使用“离群度”来描述锚框的质量。
首先基于注意力的边界框损失 Wise-IoU vl计算式如下:
09 基于融合 GhostNetV2 的 YOLO v7 水稻籽粒检测
Focal Loss设计了一种针对交叉嫡的单调聚焦机制,有效降低了普通度量值对损失值的干扰。这使得模型能够聚焦于重要度量值,获得分类性能的提升。WIoUv2构造了单调聚焦系数Liou的表达式: