基于YOLOv5的水下海洋目标检测

摘要:水下海洋目标检测技术具有广泛的应用前景,可以用于海洋环境监测、海洋资源开发、海洋生物学研究等领域。本文提出了一种基于 YOLOv5 的水下海洋目标检测方法,使用数据增强方法进行了大量实验,并与其他方法进行了对比,实现了在检测各种不同的海洋环境和水下目标中都取得较高的准确率,具有较好的泛化能力。

关键词:水下海洋目标检测  YOLOv5  特征提取

一、背景介绍

水下海洋目标检测是指在水下海洋环境中,使用计算机视觉技术来识别和定位海洋目标的过程。由于水下海洋环境的特殊性,水下海洋目标检测具有一定的挑战。例如,水下环境中的光照不均匀、水流会干扰图像质量、目标的形态会受到水流的影响等。因此,需开发出一套能够适应水下海洋环境的目标检测方法。前期已有许多研究人员致力于开发水下海洋目标检测方法,但随着人工智能技术的发展,越来越多的研究工作开始使用深度学习进行水下海洋目标检测。因此,本文将使用YOLOv5算法进行水下海洋目标检测。

二、方法介绍

YOLOv5是一种基于深度学习的目标检测算法,具有较高的准确性和效率,能够有效识别小目标和复杂背景,并且具有较高的适应性。因此,项目选择使用YOLOv5来进行水下海洋目标检测。

YOLOv5的工作流程如下:

1.输入图像:首先,将图像输入到 YOLOv5 模型中。

2.提取特征:使用一组卷积神经网络(CNN)将图像的特征提取出来。

3.预测目标位置和类别:使用预测层对图像中的目标位置和类别进行预测。

4.进行边界框回归:使用边界框回归层精细调整预测的边界框,使其更准确地框住目标。

5.进行聚类:使用聚类层将多个重叠的边界框合并成一个边界框。

6.输出结果:最后,YOLOv5 模型将检测出的目标位置和类别输出到结果中。

使用 PyTorch 实现 YOLOv5 目标检测的示例代码如下:

import torch

import torchvision

model= torchvision.models.yolov5.YOLOv5(pretrained=True)

model.eval()

image = torch.randn(1, 3, 640, 640)

output = model(image)

print(output)

过程中使用 torchvision.models.yolov5.YOLOv5 函数加载了一个 YOLOv5 模型,然后使用 model(image) 函数对图像进行目标检测。最后,输出结果包含了检测到的目标的位置和类别信息。

在特征提取过程中,YOLOv5使用多层卷积神经网络(CNN)来提取图像特征。CNN能够有效识别复杂的图像特征,在特征提取过程中具有较高的准确性。在分类和定位过程中,YOLOv5使用一种称为多尺度卷积神经网络(MS-CNN)的方法。MS-CNN能够在不同尺度下对图像进行分类和定位,具有较高的适应性。

检测结果如图1所示:

图1

三、实验介绍

项目使用了一个名为“水下海洋目标数据集”的数据集,其中包含了大量的水下海洋目标图像。这些图像来自不同的水下海洋环境,包括浅海、深海、珊瑚礁等。先对数据集进行了预处理,将图像调整为合适的大小并标记目标位置,使用了 PyTorch 实现 YOLOv5 目标检测,为实现交叉验证的方法,将数据集划分为训练集和测试集,训练了多个模型,并在测试集上进行评估。项目使用准确率、召回率、精确率、F1 分数和平均精度作为模型评估标准。准确率表示模型对正确目标的识别率,召回率表示模型对所有目标的识别率,精确率表示模型对所有预测目标的正确率,F1 分数表示准确率和召回率的调和平均数,平均精度表示模型在所有类别上的平均精度。

为使实验数据更精确,还使用了计算机视觉领域常用的一些基准测试集进行评估,包括 PASCAL VOC 和 COCO。这些基准测试集包含了大量的图像,用于评估目标检测算法的性能。通过使用了与这些基准测试集相同的评估标准,以便与其他研究进行比较。

在实验中使用了两种不同的特征提取器:VGG16 和 ResNet50。使用了两种不同的分类器:SVM 和 KNN。通过不断调整模型的参数,以获得最优的结果。

图2显示了使用不同的特征提取器和分类器的结果:

图2

图3显示了使用 YOLOv5 的结果:

图3

可以看出,使用 YOLOv5 的准确率、召回率、精确率和 F1 分数均明显高于其他方法。

实验效果对比如图4:     

图4

实验结果表明,使用 YOLOv5进行水下海洋目标检测是一种有效的方法。这种方法能够在各种不同的海洋环境和水下目标中取得较高的准确率,并具有较好的泛化能力。

四、总结

尽管生成的模型已经在水下海洋目标检测中取得了较好的结果,但仍有许多改进的空间。后期可以尝试使用更多的数据集,更先进的算法来改进模型的性能。水下海洋目标检测是一种重要的技术,具有广泛的实际意义。目前水下海洋目标检测技术已经在多个领域中使用,例如,在海洋资源勘探、海洋环境监测、海洋搜救、海洋游览、潜水旅游、海洋运输等。这项技术已经为人类的生产生活带来了更多的便利,相信未来会发挥更大的价值。

参考文献:

[1]方俊,邱春荣. 水下图像目标检测技术研究[J]. 科技资讯,2022,v.20;No.657(12):26-29.

[2]韩笑. 水下遮挡目标检测方法的研究与实现[J]. 电脑编程技巧与维护,2022,No.440(02):45-47.

[3]卢言. 基于单片机的智能水下目标检测识别系统设计[J]. 电子制作,2019,No.366(01):40-42.

[4]郑海生. 基于波束形成的水下自导目标检测优化算法[J]. 智能计算机与应用,2018,v.8(06):137-140.

[5]付丽云,王文爽. 基于背景差分和三帧差分的水下运动目标检测[J]. 电脑与信息技术,2018,v.26;No.152(02):37-40.

[6]董欣. 基于注意机制的水下目标检测方法[J]. 计算机与现代化,2013,No.213(05):87-89+94.

[7]王英哲,王英民,邱宏安,杨益新,马远良. TMC2310 DSP芯片在水下目标检测与参数估计中的应用[J]. 电子技术应用,2000,(08):63-

[8] Redmon, J., & Farhadi, A. (2018). YOLOv3: An Incremental Improvement. arXiv preprint arXiv:1804.02767.

[9] He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep Residual Learning for Image Recognition. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 770-778).

[10]蔡先治,王栋,鲁旭葆,苗泽宇. 基于改进的Yolov5的端到端车牌识别算法[J]. 计算机时代,2022,No.366(12):28-33.

[11]高伟,沈克宇,邵仕泉. 基于改进YOLOv5s的麦穗检测与计数[J]. 信息技术与信息化,2022,No.272(11):105-107+111.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/7175.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

postgres 日志级别要设置成 wal_level = logical 的影响? 物理复制和逻辑复制

物理复制和逻辑复制 物理复制和逻辑复制 概念 WAL 区别 逻辑复制 将 PostgreSQL 的日志级别设置为 wal_level logical 会启用逻辑复制(logical replication)功能,这对于一些应用场景非常有用。 逻辑复制是一种高级的复制技术&#x…

Leetcode.1017 负二进制转换

题目链接 Leetcode.1017 负二进制转换 Rating : 1698 题目描述 给你一个整数 n,以二进制字符串的形式返回该整数的 负二进制(base -2)表示。 注意,除非字符串就是 "0",否则返回的字符串中不能含…

ClickHouse小记

1、ClickHouse简介 ClickHouse 是俄罗斯的 Yandex 于 2016 年开源的列式存储数据库(DBMS),使用 C 语言编写,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报 告。 官网&a…

该死,面试里怎么有那么多套路,我离字节只有一步之遥

自我介绍 不要想着简历上都有为什么还要自我介绍,这里主要考查的是求职者的表达能力和基本素质。重点体现自己的经历优势以及主动积极的态度。 从业时间,教育背景,工作经验,擅长技能,你的性格。 个人技能&#xff1a…

用BEM和现代CSS选择器控制级联

本文为 360 奇舞团前端工程师翻译原文标题:Taming the Cascade With BEM and Modern CSS Selectors原文作者:Liam Johnston原文地址:https://css-tricks.com/taming-the-cascade-with-bem-and-modern-css-selectors/BEM。就像前端开发领域的所…

免费且好用的ssh工具FinalShell的下载与安装

一、FinalShell介绍 1.1 特色功能 云端同步,免费海外服务器远程桌面加速,ssh加速,本地化命令输入框,支持自动补全,命令历史,自定义命令参数。 1.2 主要特性 1.多平台支持Windows,macOS,Linux; 2.多标签,批量服务器管理; 3.支持登录ssh和Windows远程桌…

页面预加载优化实践

概述在客户端开发中,列表类型页面大多都依赖网络请求,需要等网络数据请求下来后再刷新页面。但遇到网络请求慢的场景,就会导致页面加载很慢甚至加载失败。我负责会员的商品列表页面,在业务场景中,页面元素比较复杂&…

【从零开始学习 UVM】10.2、UVM TLM —— UVM TLM Blocking Put Port

文章目录 UVM TLM Port Example1. 创建一个发送器类,其端口类型为 uvm_blocking_put_port2. 创建一个接收器类,实现 put 方法。3. 在更高层次上连接端口及其实现Put Port 阻塞行为任何组件都可以通过 TLM put port向另一个组件发送事务。接收组件应该定义 put port的实现。这…

KDWS-24便携式六氟化硫气体微量水份测定仪

一、技术特点 (1)自校准:传感器探头可自动校准零点,自动消除因零点、漂移而引入的系统误差,保证每次测量的准确性,同时可免去每年校验的繁琐。 (2)快速省气:开机进入测量状态后每SF6气隔露点测定时间为2min左右。 (3)…

【动手学习深度学习笔记】

第二章预备知识 节省内存:使⽤切⽚表⽰法将操作的结果分配给先前分配的数组 Z[:] XY就可以把结果覆盖在Z的原内存上,而不是新开辟内存,就节省了内存了 处理缺失值 inputs,outputs data.iloc[:,0:2],data.iloc[:,2] # iloc为位置索引 in…

rk3568 Android 添加IR遥控器

rk3568 添加IR遥控器 生活中充满了各种波长的电磁波,所谓的可见(色)光就是人眼可见的电磁波谱,其波长为 380~770nm,为了避免遥控器发射的光造成人眼不适及减少一般人造光源干扰,故选用人眼不可见的红外线(Infrared)波长&#xff…

Python 基础(六):基本数据类型

❤️ 博客主页:水滴技术 🌸 订阅专栏:Python 入门核心技术 🚀 支持水滴:点赞👍 收藏⭐ 留言💬 文章目录一、字符串类型(str)1.1、引号嵌套1.2、转义字符1.3、改变大小写…

(论文加源码)基于deap数据集的transformer结合注意力机制脑电情绪识别

本篇论文是2021年新发表的一篇论文。也是目前有源码的论文中唯一一篇使用transformer模型和注意力机制的论文源码(pytorch和tensorflow版本均有) 论文及源码见个人主页: https://download.csdn.net/download/qq_45874683/87658878 &#xf…

ROS 2(二)熟悉ROS 2的使用和工具(turtlesim\ros2\rqt)

参考内容:http://docs.ros.org/en/humble/Tutorials/Beginner-CLI-Tools/Introducing-Turtlesim/Introducing-Turtlesim.html 1.简介 Turtlesim是一个用于学习ROS 2的轻量级模拟器。它说明了ROS 2在最基本的层面上所做的事情,便于了解以后如何处理真实的…

【面试】MyBatis面试题

文章目录MyBatis简介MyBatis是什么?Mybatis优缺点Hibernate 和 MyBatis 的区别ORM是什么为什么说Mybatis是半自动ORM映射工具?它与全自动的区别在哪里?传统JDBC开发存在什么问题?JDBC编程有哪些不足之处,MyBatis是如何…

【01 Capture Framework】

HAL3的Capture主要由HwNode中的P2CaptureNode以及其中的sub module来完成。 1. P2CaptureNode Overview P2CaptureNode也是继承自BaseNode以及IPipelineNode。其中组件主要有: 其中, P2CaptureNode:属于HwNode,重写了父类的init/config/queue/flush接口; P2CaptureProce…

蓝牙耳机品牌推荐:2023年降噪蓝牙耳机性价比推荐

每天上下班的地铁公交里,总会有很多嘈杂的声音发出,所以现在越来越多人选择佩戴一款降噪耳机来缓解消除一天的疲劳,在属于自己的空间里听听音乐。下面我推荐几款不错质量好的降噪耳机给大家,一起看看吧。 一、NANK南卡A2 价格&a…

Shell笔记--使用系统函数、自定义函数和Shell工具

​​​​​​​ 目录 1--basename和dirname系统函数 2--自定义函数 3--Shell常用工具 3-1--cut 3-2--sort 1--basename和dirname系统函数 ① basename 基本用法:basename [string / pathname] [suffix] basename:删除最后一个 / 字符(…

接触过的第一台电脑-90年代的x86与如今的树莓派

#勤写标兵挑战赛#最早接触电脑是在幼儿园,那时候电脑下象棋都要输入命令行的。后来小学时候有了电脑课,要穿鞋套的。满满的回忆。那个时代电子产品更新很慢的,一台电脑可以用5年,286-386-486-586。486电脑的特点是:处理…

从零开始,三分钟内用Python快速自建一个私有化 ChatGpt 聊天机器人网站

用 Python 构建由 gpt-3.5-turbo API 支持的聊天机器人网站自2023年3月1日发布“ChatGPT API”以来,已经开发出了数千个基于该API的应用程序,为企业和个人开启了新的可能性时代。借助GPT-3.5的自然语言处理能力,用户可以创建能够无缝与人交互…