多篇论文介绍-摘要

论文地址https://arxiv.org/pdf/2301.10051.pdf

目录

01CIEFRNet:面向高速公路的抛洒物检测算法

02改进 YOLOv5 的 PDC 钻头复合片缺损识别

03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测

04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测

​编辑05 基于改进YOLOv8的SAR图像飞机目标检测算法

​编辑​编辑

06 基于改进YOLOv8的隧道火灾检测研究

 07 融合 CA-BiFPN 的轻量化人体姿态估计算法

 08基于改进 YOLOv5s 的果园环境葡萄检测

09 基于融合 GhostNetV2 的 YOLO v7 水稻籽粒检测

10 结合特征重用与特征重建的 YOLO 绝缘子检测方法


        WIoU 更多的关注到普通样本的锚框,有效防止网络模型产生不能收敛的梯度,提升了检测精度。

加速了模型的收敛速度,检测精度提升了 0.11 个百分点。使用 WIoU 损失函数对模型进行优化,模型损失降到了更低,并使得检测边框也更加贴合被检测物体。

01CIEFRNet:面向高速公路的抛洒物检测算法

摘要:高速公路抛洒物危及行车安全,极易诱发交通事故,及时识别并清理高速公路抛洒物十分重要。由于高速公路抛洒物在图像中面积占比小且图像背景复杂,现有检测方法常出现漏检和误检的情况。针对上述问题,提出了一种基于上下文信息增强和特征提纯的抛洒物检测算法,记为CIEFRNet。首先,设计了一种融合上下文transformer的主干特征提取模块(CSP-COT),充分挖掘局部静态上下文信息和全局动态上下文信息,增强小抛洒物的特征表示;其次,在主干网络中使用改进的空间金字塔池化(ISPP),通过级联的空洞卷积实现特征的多尺度下采样,减轻目标细节信息的损失;为提高特征融合能力,设计了特征提纯模块(CNAB),其中嵌入了提出的一种混合注意力机制(ECSA),可抑制图像背景噪声,强化微小抛洒物的特征;最后,引入基于动态非单调聚焦机制的WIloU优化损失函数,提高小抛洒物学习能力,加速网络收敛。实验结果表明,所提方法在自制的高速公路抛洒物数据集上的精确率、召回率、APo;和APo.5.a9s分别达到96.5%、81.6%、88.1%和46.5%,优于当前主流的目标检测方法,其算法复杂度也更低,满足实际场景应用需要。
关键词:抛洒物检测;上下文信息;空间金字塔池化;注意力机制;损失函数


02改进 YOLOv5 的 PDC 钻头复合片缺损识别

摘要:PDC钻头复合片的缺损情况是影响钻进效率的重要因素,检测 PDC钻头复合片是否缺损是修复PDC钻头的前提。为了减少对PDC'钻头复合片的误检,提升检测准确率,提出了一种基于改进VOLOv5的目标检测算法。该方法以YOLOv5网络为基础,融合RepVGG重参数化模块增强网络的特征提取能力;在C3模块中引入坐标注意力机制,在通道注意力机制中嵌入位置信息,提升对缺损复合片的目标检测能力;将边界框回归损失函数改进为WIoU损失函数,制定合适的梯度增益分配策略。实验结果表明,改进后的网络的精确率提升2%,召回率提升0.9%,平均精度均值(mAP)提升了1.3%,达到了98%,能够实现对 PDC钻头复合片的缺损识别。
关键字:PDC钻头复合片;YOLOv5; RepVGG;坐标注意力机制;WIoU损失函数

03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测


摘要:【目的】针对水下环境复杂,水下目标因光线折射等问题导致的目标边界模糊或外观、形状可能会发生非刚性形变,使水下目标检测困难,提出了一种基于SimAM注意力机制的DCN-YOLOv5水下目标检测方法。【方法】首先,采用YOLOv5所使用的双向金字塔网络(BiFPN, Bi-directional Feature Pyramid Network)在多个尺度上提取和融合特征信息,从而提高目标辨别的准确度;其次,针对水下目标的外观、形状的变化问题,将C3模块中的CBS模块结合可变形卷积(DCN, Deformable Convolution),提出DBS模块并组成D3模块替换部分C3模块,以适应水下目标的外观、形状的变化;同时,融入加权注意力机制(SimAM),自适应地调节模型的关注度,进一步在复杂场景下增强特征表达能力;最后,考虑目标边界模糊,为改善目标定位精度,采用WIoU(Wise-loU)损失函数来替换交叉嫡损失,能够更好地适应不同目标类型和尺寸的特点,提高算法鲁棒性。【结果】实验结果表明,DCN-YOLOv5可以达到87.57%的平均精度(mAP),检测效果优于YOLOv5网络和其他经典网络,平均每张图像的识别时间仅为24.5ms。【结论】通过实验结果可以证明模型在检测精度明显提升的同时兼顾检测的实时性,对水下目标检测用于实际用途有着一定的参考价值。
关键词:水下目标检测;SimAM注意力机制;可变形卷积; WloU

04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测

        传统 YOLOv7-tiny 算法采用CIOU  损失函数作为边界框的损失函数。由于训练数据集中不可避免地存在低质量样本,这些样本往往会导致模型的泛化能力下降,特别是当存在几何因素(例如距离和纵横比)时,该问题尤为突出;为此,使用WIloU损失函数替代CIoU损失函数。实验测试了2个版本的WIoU函数(WIoUvl和WloUv2) ,经过多次实验,最终选择了WloUv2版本作为替代版本。首先,在loU损失函数的基础上结合了距离注意力机制,得到了具有2层注意力机制的WloUv1;其中,第1层注意力用于计算样本之间的距离,第2层注意力则用于惩罚低质量样本,则有


05 基于改进YOLOv8的SAR图像飞机目标检测算法


 

         为了解决样本质量的不平衡问题,后续又提出Focal-EIOU 损失函数,假设y为控制抑制程度的参数。Focal-EIOU损失函数公式如下:

 

06 基于改进YOLOv8的隧道火灾检测研究

        CIoU虽然将边界框回归的距离、重叠面积、中心点偏移以及宽高比都考虑在内,避免了DIoU中心点重合时交并比一样无法区分的情况,对于边界框回归有更好的收敛率。但是没有考虑到真实框与预测框之间不匹配的方向。文献[28]指出CIoU公式(5)中v仅仅只是反映了宽高比的差异,而不是预测框宽高和真实框宽高的实际关系,并且质量差的回归样本对回归损失产生了比较大的影响,回归质量相对较好的样本则难以进一步优化。出于这两个原因导致模型训练收敛速度慢且效率较低,预测框不够精确。该文献提出Focal EloUv1来解决质量较好和质量较差的样本间的 BBR 平衡问题。

        但是由于EIoU使用静态聚焦机制(FM,Focusing Mechanism),非单调FM的潜力没有被充分利用,基于这一思想,文献[29]提出了一种具有动态非单调FM 的损失,名为WIoU。

 

 07 融合 CA-BiFPN 的轻量化人体姿态估计算法

        训练数据集中不可避免的包含低质量样本,距离、纵横比等几何度量都会加剧对低质量样本的惩罚从而使模型的泛化性能下降,因此高质量样本不能够很好的进一步优化。因此本文又引入了具有动态非单调聚焦机制的WloU126损失函数对样本进行平衡,通过动态非单调聚焦机制将loU替换为离群度来评估锚框的质量,以避免几何因素(例如距离和纵横比)对模型的过度惩罚,即
        

6 WIoU 示意图
Fig. 6 Chematic diagram of the WIoU

 08基于改进 YOLOv5s 的果园环境葡萄检测

        原YOLOv5s采用CIoU Loss做预测框的损失函数,CIoU损失函数在DIoU的基础上引入了预测边界框与真实边界框的长宽比,在一定程度上可以加快预测框的回归速度,但是两个边界框长宽比的定义十分模糊,并不利于网络的优化。本研究采用了Wise-IoUv3损失函数[28],与前者相比,Wise-loUv3没有引入长宽比的计算,而是在基于注意力的边界框损失 Wise-IoU vl 上,采用了动态非单调的聚焦机制,使用“离群度”来描述锚框的质量。
        首先基于注意力的边界框损失 Wise-IoU vl计算式如下:

09 基于融合 GhostNetV2 YOLO v7 水稻籽粒检测

本文采用 WIoU 替换原来的CIoU作为新的损失函数,首先根据距离度量构造了距离注意力,得到了具有两层注意力机制的WIoUv1:

Focal Loss设计了一种针对交叉嫡的单调聚焦机制,有效降低了普通度量值对损失值的干扰。这使得模型能够聚焦于重要度量值,获得分类性能的提升。WIoUv2构造了单调聚焦系数Liou的表达式:

 

 

10 结合特征重用与特征重建的 YOLO 绝缘子检测方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/124730.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity | Shader(着色器)和material(材质)的关系

一、前言 在上一篇文章中 【精选】Unity | Shader基础知识(什么是shader)_unity shader_菌菌巧乐兹的博客-CSDN博客 我们讲了什么是shader,今天我们讲一下shder和material的关系 二、在unity中shader的本质 unity中,shader就…

pip无法下载moviepy -无法联网

猜测是无法联网 尝试更新匹配 ——失败 尝试1:从网络下载whl文件——还需要下载相关依赖,过于麻烦 但应该可行 下载地址 https://pypi.tuna.tsinghua.edu.cn/simple/对应的包名/ 可能会出现如下,然后继续挨个找 尝试2:使pip联网…

RabbitMQ的高级特性

目录 数据导入 MQ的常见问题 消息可靠性问题 生产者确认机制 SpringAMQP实现生产者确认 消息持久化 消费者消息确认 失败重试机制 消费者失败消息处理策略 死信交换机 TTL 延时队列 待更 数据导入 资料下载地址:day05MQ高级 MQ的常见问题 消息可靠性…

关于卷积神经网络的池化层(pooling)

了解池化层 池化层又称“下采样层”或“子采样层”,池化层可以大大降低特征的维度,减少计算量,同时可以避免过拟合问题。 顾名思义,最大池化层就是从输入的矩阵中某一范围内,选择最大的元素进行保留;平均池…

ThreadLocal原理以及内存泄露问题

1、ThreadLocal实现原理 1、每个线程中有一个ThreadLocalsMap,这是一个哈希表的结构里面有很多entry(也就是k-v),当我们使用ThreadLocal进行set值的时候,会将这个threadLocal设置为key,然后值设置为value放入ThreadLocalsMap,key为弱引用&am…

Python爬虫实战-批量爬取美女图片网下载图片

大家好,我是python222小锋老师。 近日锋哥又卷了一波Python实战课程-批量爬取美女图片网下载图片,主要是巩固下Python爬虫基础 视频版教程: Python爬虫实战-批量爬取美女图片网下载图片 视频教程_哔哩哔哩_bilibiliPython爬虫实战-批量爬取…

兴达易控232转profinet在搅拌站使用案例配置案例

该搅拌站所采用的是双行星动力搅拌桨混合机,借助兴达易控232转profinet网关(XD-PNR200)与PLC和变频器进行通信,从而实现对变频器的精确控制,大大提升了搅拌过程的稳定性和效率。 这一方案还具备高度的灵活性和可扩展性,使得搅拌站…

HashMap源码分析(一)

存储结构 说明:本次讲解的HashMap是jdk1.8中的实现,其他版本可能有差异 内部是由Node节点数组组成,Node节点之间又由链表或红黑树组成。 图是网上找的,实在不想画 属性介绍 //存储数据的数组,初次使用时初始化&…

CocosCreator让一个物体跟随鼠标移动(两种方式 本地坐标系和世界坐标系)

在 Cocos Creator 3.x 游戏运行时显示的画布大小就是屏幕区域,屏幕坐标是从画布的左下角为原点开始计算 在 Creator 3.x 里,屏幕和 UI 是完全区分开的,用户可以在没有 UI 的情况下点击屏幕获取触点信息。因此,获取屏幕触点&#…

mac M2 anaconda 解决装不了python3.7

今天发现一个很奇怪的问题 但是我一换成 conda create -n DCA python3.8.12就是成功的 这个就很奇怪, 解决如下 https://towardsdatascience.com/how-to-manage-conda-environments-on-an-apple-silicon-m1-mac-1e29cb3bad12 998 conda search pythonconda search python …

半导体(芯片)制造工艺流程简单说

半导体行业是国民经济支柱性行业之一,是信息技术产业的重要组成部分,是支撑经济社会发展和保障国家安全的战略性、基础性和先导性产业,其发展程度是衡量一个国家科技发展水平的核心指标之一,属于国家高度重视和鼓励发展的行业。 …

ant design pro of vue怎么使用阿里iconfont

一 使用离线iconfont 首先需要生成图所有图标对应的js文件。如下图所示,将生成的js代码复制,在项目中创建一个js文件,将代码粘贴进去。这里我将js文件放在了src/assets/iconfont下面 然后,在main.js中引入文件,并进…

Java代码是怎么运行的?

Java代码是怎么运行的? 运行流程 将Java程序转换成Java虚拟机所能识别的指令序列,也称Java字节码。之所以这么取名,是因为Java字节码指令的操作码(opcode)被固定为一个字节。 Java虚拟机可以由硬件实现,…

IP协议相关技术

文章目录 IP协议相关技术仅凭IP无法完成通信DNSARP IP协议相关技术 仅凭IP无法完成通信 人们在上网的时候其实很少直接输入某个具体的IP地址。 在访问Web站点和发送、接收电子邮件时,我们通常会直接输入Web网站的地址或电子邮件地址等那些由应用层提供的地址&…

麒麟v10 安装jenkins

1.想安装哪个版本? https://pkg.jenkins.io/redhat-stable/ 我们查看我们想要哪个版本: 4年前安装的是 Jenkins2.279 版本 现在在docker 上安装的是Version 2.425 版本 2.碰到到的问题 1.安装老版本的Jenkins,会出现安装的插件不兼容&…

viple入门(四)

(1)行打印 主要用于在运行窗口中显示数据,打印完成后,自动换行。 注意事项:不可同时打印两个数据,例如 解决方案1:使用或并,使得每次进入行打印的数据只有一个,缺点&am…

文件管理技巧:如何利用文件名关键字进行整理

在日常生活和工作中,我们经常需要处理大量的文件,这些文件可能包含各种类型的信息,如文本、图像、视频、音频等。如何有效地管理和整理这些文件,以便我们能够快速找到所需的文件,是一个非常重要的问题。本文将介绍一种…

Linux shell编程学习笔记22: () $() (()) 的用法小结

最近学习Linux Shell编程,对 () (()) [] [[]]等符号的用法还是有点分不太清楚,于是决定再梳理一下。今天先整理 () $() (()) 的用法。 1 单小括号() 1.1 子shell(命令组) 括号中的命令将会新开一个子shell顺序执行,所…

用vite搭建一个vue3 + ts项目

搭建项目 参考连接https://www.jianshu.com/p/1ce93c7e15a0 练手项目参考 https://www.xuexiluxian.cn/ 1.安装pina vue3 pinia的安装和使用 2.安装router npm install vue-router -S Vue3: Vue-router路由的使用

什么是跨境电商独立站?有什么优势和劣势?

你是否有过这样的经历:当你在网上浏览一些商品时,发现有些网站的域名很奇怪,比如.com、.net、.co等,而且网站的界面和设计也和国内的电商平台不太一样。 你可能会好奇,这些网站是什么?它们是怎么做的&…