基于StyleGAN2-ADA和FNW YOLOv8的玉米害虫智能检测

基于StyleGAN2-ADA和FNW YOLOv8的玉米害虫智能检测

刘浏¹, 薛凯¹, 姬琪琪¹,*
¹ 马来西亚吉隆坡泰莱大学应用计算硕士(MAC)

电子邮箱: 0369721@sd.taylors.edu.my

接收日期:2024年8月9日
发布日期:2024年11月14日

Measurement Science and Technology

https://iopscience.iop.org/article/10.1088/1361-6501/ad8cf4

摘要

玉米害虫的早期快速精准检测对于减少作物经济损失至关重要。针对实际生产环境中玉米害虫识别效果差、效率低的问题,本研究提出了一种基于StyleGAN2和FNW YOLOv8方法的玉米害虫智能检测方法。通过StyleGAN2-ADA扩充玉米害虫数据。在特征提取网络中,替换了Fasternet轻量级网络以降低模型复杂性并加速检测。在特征融合网络的后端集成了基于归一化的注意力模块(NAM),以抑制冗余的非显著特征表示。优化损失函数为Wise Intersection of Union v3(WIoU v3)后,引入了FNW YOLOv8算法。研究结果表明,与基线模型相比,该算法在精度和F1评分方面分别提高了3.77%和5.95%。尤其是,FNW YOLOv8模型实现了实时检测速度达289.1 fps。与常规模型相比,FNW YOLOv8模型有效解决了标准模型中存在的冗余权重问题。FNW YOLOv8的参数量被减少至仅1.74百万,模型大小仅为2.36 MB。同时,FNW YOLOv8的GFLOPS运算量显著降低。因此,为保证玉米害虫识别的精度和时效性,建立其在移动设备上的识别和检测的理论基础至关重要。

关键词: 智慧农业、玉米害虫、深度学习、注意力机制

1. 引言

玉米作为一种重要的经济作物,在世界各地广泛种植【1】。然而,各种害虫的存在导致了玉米产量的大幅减少,进而影响农业活动的经济效益。及时检测害虫对于成功管理和减少玉米害虫的侵害至关重要【2】。
目前,玉米害虫的识别方法通常依赖于知识渊博的专家进行筛查,这需要较高的专业水平以及大量的时间和精力【3】。然而,这些方法可能无法准确区分早期害虫,特别是具有相似物候特征的害虫,从而可能延误控制措施的实施【4-6】。
人工智能、深度学习和计算机视觉技术的快速发展,催生了诸如实时检测变换器(RT-DETR)【7】、单次多框检测器(SSD)【8】、“你只看一次”(YOLO)【9-11】以及快速区域卷积神经网络(Faster R-CNN)【12】等经典框架,这些已成为作物检测的重要工具。这些技术能够在害虫检测过程中自动识别和分析作物(如玉米)的信息。近年来,国内外许多学者利用深度学习和目标检测技术识别作物中的虫害区域,并用于害虫管理目的【13】。
害虫识别对于利用智能技术开展精准农业的预警系统至关重要。Tian【14】提出了一种改进的YOLO模型,用于检测三种典型的小目标鳞翅目害虫,旨在解决害虫区域多尺度密度问题。通过在特征提取过程中引入自适应注意力模块,该模型增强了对特征表示的有效利用能力。然而,模型的F1值为79.1%,表明仍有改进空间。
现有基于深度学习的害虫检测算法通常需要大量的计算资源和内存。Xu【15】通过重新构建骨干网络(使用Stem和ShuffleNet V2)并调整颈部网络宽度,开发了一种基于YOLOv5的轻量级害虫模型。与其他模型相比,该模型显著降低了模型复杂性,例如参数量减少了95.1%,模型大小减少了92.5%,浮点运算数减少了81.6%,但其精度并不高。在害虫区域检测中平衡精度和轻量化仍是极具挑战性的任务。
此外,数据集也影响了害虫检测的进展。Zhang【16】利用StyleGAN2扩展并生成了一个公共数据集,随后使用改进的YOLOv7模型检测葡萄叶片上的早期害虫。通过在目标检测前对图像进行增强,可以改善光照环境并突出害虫特征。
Zhang【17】在检测小麦枯萎病时,使用了一种具有旋转配置的YOLO小麦检测网络,并结合了简单的空间注意力网络,能够检测任意方向的麦穗图像,效率得到了提高。Ali【18】基于YOLOv5提出了一种茶叶害虫检测模型YOLO-Tea,旨在利用卷积神经网络自动提取茶叶害虫特征并进一步进行害虫检测。尽管该模型能够有效表达局部特征,但无法捕获长距离像素之间的全局相关信息。Zhuang【19】采用改进的Faster R-CNN检测图像中的玉米害虫区域。然而,该模型实时检测能力较差,不利于后期硬件部署。
上述研究表明,利用目标检测技术检测作物害虫是可行的,但很少有研究聚焦于大规模采集玉米目标害虫图像数据的难点【20】。此外,现有模型的检测精度低且检测速度慢。为解决上述问题,本研究提出了FNW YOLOv8(FasterNet-NAM-WIoUv3 YOLOv8)模型。

应用带自适应鉴别器增强的StyleGAN2扩充玉米害虫数据,有助于提高模型稳定性并避免过拟合问题,从而有效提升模型精度。
模型采用轻量化的FasterNet网络模型,降低了网络复杂性,实现算法轻量化。
引入NAM注意力机制,有效消除冗余特征信息,增强特征提取过程,从而提高模型的精度和检测速度。
模型损失函数采用WIoU v3,通过减少与距离和横纵比相关的惩罚项的干扰,有效提升了玉米害虫检测的定位性能。

2. 数据与方法

2.1 数据准备
数据集采集于重庆市农业科学院黄田玉米研究基地(东经106°20′,北纬29°29′)的田间。数据使用高清Canon EOS 6D相机拍摄,分辨率为6960×4640。相机设置为M档自动格式,从叶片上方20-30厘米的多个角度进行拍摄,确保每片害虫叶片都能被完整捕获,并保持图像清晰可见。在采集数据时,考虑了光照条件等环境因素。数据分别在晴天、阴天、阴雨天等不同天气下采集,并在一天中的早晨、上午、正午和下午拍摄,覆盖不同区域受害的玉米害虫情况。

2.1.1 StyleGAN2-ADA
数据扩展是害虫检测中的关键环节。利用StyleGAN2-ADA【21】生成多种高质量图像,能够有效扩展原始数据集,增强机器学习模型的泛化能力,并降低过拟合风险。这种方法不仅提高了模型应对未见或稀有害虫样本的能力,还提升了检测精度,同时节省了采集大量图像数据的时间和资源。StyleGAN2-ADA以640 × 640像素的分辨率生成玉米害虫图像。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/918995.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[ACTF2020]Upload 1--详细解析

信息收集 题目告诉我们是一道upload,也就是文件上传漏洞题目。 进入界面,是一个灯泡,将鼠标放在图标上就会出现文件上传的相应位置: 思路 文件上传漏洞,先看看有没有前端校验。 在js源码中找到了前端校验&#xff…

Android Studio开发学习(五)———LinearLayout(线性布局)

一、布局 认识了解一下Android中的布局,分别是: LinearLayout(线性布局),RelativeLayout(相对布局),TableLayout(表格布局), FrameLayout(帧布局),AbsoluteLayout(绝对布局),GridLayout(网格布局) 等。 二、…

计算机视觉在自动驾驶汽车中的应用

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 计算机视觉在自动驾驶汽车中的应用 计算机视觉在自动驾驶汽车中的应用 计算机视觉在自动驾驶汽车中的应用 引言 计算机视觉在自动…

表格的选择弹窗,选中后返显到表格中

项目场景: 提示:这里简述项目相关背景: 表格的下拉框可以直接显示选项,那如果选择框不是下拉的,而是弹窗,那么在表格中如何返显呢? 问题描述 如上图所示,点击表格中的选择&#xf…

金融领域先锋!海云安成功入选2024年人工智能先锋案例集

近日,中国人工智能产业发展联盟《2024年人工智能先锋案例集》(以下简称“AIIA先锋案例集”)在中国人工智能产业发展联盟第十三次全体会议上正式发布。该案例集由人工智能产业发展联盟(AIIA)、工业和信息化部新闻宣传中…

HarmonyOs鸿蒙开发实战(16)=>沉浸式效果第一种方案一窗口全屏布局方案

1.沉浸式效果的目的 开发应用沉浸式效果主要指通过调整状态栏、应用界面和导航条的显示效果来减少状态栏导航条等系统界面的突兀感,从而使用户获得最佳的UI体验。 2.窗口全屏布局方案介绍 调整布局系统为全屏布局,界面元素延伸到状态栏和导航条区域实现沉…

OpenAI震撼发布:桌面版ChatGPT,Windows macOS双平台AI编程体验!

【雪球导读】 「OpenAI推出ChatGPT桌面端」 OpenAI重磅推出ChatGPT桌面端,全面支持Windows和macOS系统!这款新工具为用户在日常生活和工作中提供了前所未有的无缝交互体验。对于那些依赖桌面端进行开发工作的专业人士来说,这一更新带来了令人…

Android OpenGLES2.0开发(八):Camera预览

严以律己,宽以待人 引言 终于到该章节了,还记得Android OpenGLES2.0开发(一):艰难的开始章节说的吗?写这个系列的初衷就是因为每次用到GLSurfaceViewCamera预览时,总是CtrlC、CtrlV从来没有研究…

独立站干货:WordPress主机推荐

WordPress作为全球最受欢迎的独立站建设平台,提供了灵活性和强大的功能,使得建站变得简单而高效。本文将为您详细介绍WordPress建站的流程,并推荐几款实测后觉得好用的主机商。 WordPress建站流程 域名注册 首先需要注册一个域名&#xff0c…

细说STM32单片机DMA中断收发RTC实时时间并改善其鲁棒性的方法

目录 一、DMA基础知识 1、DMA简介 (1)DMA控制器 (2)DMA流 (3)DMA请求 (4)仲裁器 (5)DMA传输属性 2、源地址和目标地址 3、DMA传输模式 4、传输数据量的大小 5、数据宽度 6、地址指针递增 7、DMA工作模式 8、DMA流的优先级别 9、FIFO或直接模式 10、单次传输或突…

基于Spring Boot+Vue的多媒体素材管理系统的设计与实现

一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构:B/S架构 运行环境:win10/win11、jdk17 前端: 技术:框架Vue.js;UI库:ElementUI; 开发工具&…

如何禁用关闭奇安信天擎开机自启动教程

前言 公司要求我们员工每个电脑上都要安装奇安信防护软件,但是身为开发,这个软件占内存不说,还禁用我们电脑上todesk等远程软件,因为我们给客户部署的项目,部署的有软件服务,经常需要用到todesk等远程软件…

[Docker#8] 容器配置 | Mysql | Redis | C++ | 资源控制 | 命令对比

目录 一:Mysql 容器化安装 二:Redis 容器化安装 Redis 简介 Redis 容器创建 三:C容器制作 四:容器资源更新 常见问题 一:Mysql 容器化安装 进入 mysql 的镜像网站,查找 mysql 的镜像 mysql docker…

CentOS 修改服务器登录密码的完整指南

个人名片 🎓作者简介:java领域优质创作者 🌐个人主页:码农阿豪 📞工作室:新空间代码工作室(提供各种软件服务) 💌个人邮箱:[2435024119qq.com] &#x1f4f1…

深入理解Redis(七)----Redis实现分布式锁

基于Redis的实现方式 1、选用Redis实现分布式锁原因: (1)Redis有很高的性能; (2)Redis命令对此支持较好,实现起来比较方便 2、使用命令介绍: (1)SETNX SETNX …

Uniapp运行环境判断和解决跨端兼容性详解

Uniapp运行环境判断和解决跨端兼容性 开发环境和生产环境 uniapp可通过process.env.NODE_ENV判断当前环境是开发环境还是生产环境,一般用于链接测试服务器或者生产服务器的动态切换。在HX中,点击运行编译出来的代码是开发环境,点击发行编译…

WPF MVVM框架

一、MVVM简介 MVC Model View Control MVP MVVM即Model-View-ViewModel,MVVM模式与MVP(Model-View-Presenter)模式相似,主要目的是分离视图(View)和模型(Model),具有低…

【nginx】client timed out和send_timeout的大小设置

websocket连接会断开,抓包检查后发现是中间的代理服务器nginx断开的,同时将后端和浏览器都断开了。将nginx日志调到debug级别后,有下面的断开信息。 [info] 125923#125923: *34 client timed out (110: Connection timed out) while proxyin…

python视频编辑中的蒙版技术:创意与技术相结合

在数字视频编辑的世界里,蒙版技术是一种强大的工具,它允许我们在视频帧上进行精确的编辑和效果叠加。通过蒙版,我们可以控制哪些部分的视频内容被显示或隐藏,从而创造出各种视觉效果和过渡。在本文中,我们将探讨如何使…

前端算法:树(力扣144、94、145、100、104题)

目录 一、树(Tree) 1.介绍 2.特点 3.基本术语 4.种类 二、树之操作 1.遍历 前序遍历(Pre-order Traversal):访问根节点 -> 遍历左子树 -> 遍历右子树。 中序遍历(In-order Traversal&#xf…