蘑菇分类检测数据集 21类蘑菇 8800张 带标注 voc yolo

蘑菇分类检测数据集 21类蘑菇 8800张 带标注 v

 

蘑菇分类检测数据集 21类蘑菇 8800张 带标注 voc yolo

蘑菇分类检测数据集介绍

数据集名称

蘑菇分类检测数据集 (Mushroom Classification and Detection Dataset)

数据集概述

该数据集专为训练和评估基于YOLO系列目标检测模型(包括YOLOv5、YOLOv6、YOLOv7等)而设计,旨在帮助研究人员和开发者创建能够高效识别图像中的多种蘑菇类别的系统。通过使用这个数据集,可以开发出适用于生态研究、食品安全监测、野外探险等多种应用场景的技术解决方案。

数据集规格
  • 总图像数量:8,800张
    • 训练集:具体划分比例未提供,通常建议按照70%(训练)、20%(验证)、10%(测试)的比例来分配。
  • 标注格式
    • VOC格式:每个图像对应一个XML文件,包含边界框坐标及类别信息。
    • YOLO格式:每个图像对应一个TXT文件,包含边界框坐标及类别ID。
  • 分辨率:图像分辨率可能有所不同,但为了保证一致性,推荐将所有图像调整至统一尺寸,如640x640或1280x1280像素。
  • 类别:涵盖21种常见的蘑菇类型,包括但不限于Clitocybe maxima、Lentinus edodes、Agaricus bisporus等。
数据集结构
mushroom_classification_dataset/
├── images/
│   ├── train/
│   ├── val/
│   └── test/
├── labels/
│   ├── train/
│   ├── val/
│   └── test/
└── data.yaml
  • images/ 目录下存放的是原始图像文件。
  • labels/ 目录存放与图像对应的标注文件,每个图像文件都有一个同名的.txt文件存储其YOLO格式的标注信息,以及一个同名的.xml文件存储其VOC格式的标注信息。
  • data.yaml 文件包含了关于数据集的基本信息,如路径指向、类别数目及其名称等关键参数。
数据集配置文件 (data.yaml)
# 训练集图像路径
train: path_to_your_train_images
# 验证集图像路径
val: path_to_your_val_images
# 测试集图像路径(如果有的话)
test: path_to_your_test_images

# 类别数量
nc: 21
# 类别名称
names: [
    'Clitocybe maxima',
    'Lentinus edodes',
    'Agaricus bisporus',
    'Pleurotus eryngii',
    'Copr inus comatus',
    'Cantharellus cibarius',
    'Boletus',
    'Dictyophora indusiata',
    'Pleurotus citrinopileatus',
    'Hypsizygus marmoreus',
    'Pleurotus cystidiosus',
    'Flammulina velutiper',
    'Agrocybe aegerita',
    'Auricularia auricula',
    'Armillaria mellea',
    'Agaricus blazei Murill',
    'Pleurotus ostreatus',
    'Morchella esculenta',
    'Hericium erinaceus',
    'Cordyceps militaris',
    'Collybia albuminosa'
]
标注统计
  • Clitocybe maxima:606张图像,共1,049个实例
  • Lentinus edodes:479张图像,共2,690个实例
  • Agaricus bisporus:161张图像,共521个实例
  • Pleurotus eryngii:423张图像,共704个实例
  • Coprinus comatus:519张图像,共1,599个实例
  • Cantharellus cibarius:648张图像,共1,317个实例
  • Boletus:639张图像,共1,353个实例
  • Dictyophora indusiata:535张图像,共1,275个实例
  • Pleurotus citrinopileatus:441张图像,共531个实例
  • Hypsizygus marmoreus:393张图像,共583个实例
  • Pleurotus cystidiosus:429张图像,共711个实例
  • Flammulina velutiper:423张图像,共550个实例
  • Agrocybe aegerita:179张图像,共197个实例
  • Auricularia auricula:242张图像,共408个实例
  • Armillaria mellea:200张图像,共290个实例
  • Agaricus blazei Murill:137张图像,共307个实例
  • Pleurotus ostreatus:433张图像,共549个实例
  • Morchella esculenta:433张图像,共1,107个实例
  • Hericium erinaceus:454张图像,共1,299个实例
  • Cordyceps militaris:600张图像,共1,137个实例
  • Collybia albuminosa:493张图像,共2,074个实例
  • 总计 (total):8,858张图像,共20,251个实例
标注示例
YOLO格式

对于一张图片中包含一个“Lentinus edodes”情况,相应的.txt文件内容可能是:

1 0.5678 0.3456 0.1234 0.2345

这里1代表“Lentinus edodes”这一类别的ID,后续四个数字依次表示物体在图像中的相对位置(中心点x, 中心点y, 宽度w, 高度h),所有值均归一化到[0, 1]范围内。

VOC格式

对于同一张图片,相应的.xml文件内容可能是:

<annotation>
    <folder>images</folder>
    <filename>000001.jpg</filename>
    <size>
        <width>640</width>
        <height>640</height>
        <depth>3</depth>
    </size>
    <object>
        <name>Lentinus edodes</name>
        <bndbox>
            <xmin>180</xmin>
            <ymin>200</ymin>
            <xmax>300</xmax>
            <ymax>400</ymax>
        </bndbox>
    </object>
</annotation>

这里<name>标签指定了类别名称(Lentinus edodes),<bndbox>标签定义了边界框的坐标。

使用说明
  1. 准备环境

    • 确保安装了必要的软件库以支持所选版本的YOLO模型。例如,对于YOLOv5,可以使用以下命令安装依赖库:
      pip install -r requirements.txt
  2. 数据预处理

    • 将图像和标注文件分别放在images/labels/目录下。
    • 修改data.yaml文件中的路径以匹配你的数据集位置。
    • 如果需要,可以使用脚本将VOC格式的标注文件转换为YOLO格式,或者反之。
  3. 修改配置文件

    • 更新data.yaml以反映正确的数据路径。
    • 如果使用YOLOv5或其他特定版本的YOLO,还需要更新相应的模型配置文件(如models/yolov5s.yaml)。
  4. 开始训练

    • 使用提供的训练脚本启动模型训练过程。例如,对于YOLOv5,可以使用以下命令进行训练:
      python train.py --img 640 --batch 16 --epochs 100 --data data.yaml --weights yolov5s.pt
  5. 性能评估

    • 训练完成后,使用验证集或测试集对模型进行评估,检查mAP等指标是否达到预期水平。例如,对于YOLOv5,可以使用以下命令进行评估:
      python val.py --data data.yaml --weights runs/train/exp/weights/best.pt --img 640
  6. 部署应用

    • 将训练好的模型应用于实际场景中,实现蘑菇自动检测功能。例如,可以使用以下命令进行推理:
      python detect.py --source path_to_your_test_images --weights runs/train/exp/weights/best.pt --conf 0.4
注意事项
  • 数据增强:可以通过调整数据增强策略来进一步提高模型性能,例如随机裁剪、旋转、亮度对比度调整等。
  • 超参数调整:根据实际情况调整学习率、批大小等超参数,以获得最佳训练效果。
  • 硬件要求:建议使用GPU进行训练,以加快训练速度。如果没有足够的计算资源,可以考虑使用云服务提供商的GPU实例。
  • 平衡数据:注意数据集中各类别之间的不平衡问题,可以通过过采样、欠采样或使用类别权重等方式来解决。
  • 复杂背景:蘑菇可能出现在各种复杂的自然环境中,因此在训练时需要注意模型对这些特性的适应性。
  • 细粒度分类:由于蘑菇种类较多且外观相似,模型需要具备较强的区分能力,可以在训练过程中引入更精细的数据增强技术或采用更强的特征提取网络。

通过上述步骤,你可以成功地使用YOLO系列模型进行蘑菇分类检测,并获得高精度的检测结果。该数据集为研究者们提供了一个良好的起点,用于探索如何有效地利用计算机视觉技术解决各种实际问题,特别是在生态研究和食品安全监测领域。

oc yolo

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/886957.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

python爬虫 - 初识爬虫

&#x1f308;个人主页&#xff1a;https://blog.csdn.net/2401_86688088?typeblog &#x1f525; 系列专栏&#xff1a;https://blog.csdn.net/2401_86688088/category_12797772.html 目录 前言 一、爬虫的关键概念 &#xff08;一&#xff09;HTTP请求与响应 &#xff0…

uni-app在线预览pdf

这里推荐下载pdf.js 插件 PDF.js - Browse Files at SourceForge.net 特此注意 如果报 Promise.withResolvers is not a function 请去查看版本兼容问题 降低pdf.js版本提高node版本 下载完成后 在 static 文件夹下新建 pdf 文件夹&#xff0c;将解压文件放进 pdf 文件…

基于SpringBoot+Vue的摄影社团管理系统

作者&#xff1a;计算机学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等&#xff0c;“文末源码”。 专栏推荐&#xff1a;前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏&#xff1a;…

API接口开发系列文章:构建高效、安全与可扩展的API服务

前言 在当今的数字化时代&#xff0c;API&#xff08;应用程序编程接口&#xff09;已成为连接不同系统、服务和应用的核心桥梁。无论是企业内部的数据交互&#xff0c;还是面向第三方的服务开放&#xff0c;API都扮演着至关重要的角色。本系列文章将深入探讨API接口开发的各个…

【nlp自然语言】知识图谱,全文检索,自然语言nlp,数据资产标签,集成管理平台

一、项目介绍 一款全源码&#xff0c;可二开&#xff0c;可基于云部署、私有部署的企业级知识库云平台&#xff0c;一款让企业知识变为实打实的数字财富的系统&#xff0c;应用在需要进行文档整理、分类、归集、检索、分析的场景。 为什么建立知识库平台&#xff1f; 助力企业…

雷池 WAF 如何配置才能正确获取到源 IP

经常有大哥反馈说雷池攻击日志里显示的 IP 有问题。 这里我来讲一下为什么一些情况下雷池显示的攻击 IP 会有问题。 问题说明 默认情况下&#xff0c;雷池会通过 HTTP 连接的 Socket 套接字读取客户端 IP。在雷池作为最外层网管设备的时候这没有问题&#xff0c;雷池获取到的…

【Linux】进程地址空间(初步了解)

文章目录 1. 奇怪的现象2. 虚拟地址空间3. 关于页表4. 为什么要有虚拟地址 1. 奇怪的现象 我们先看一个现象&#xff1a; 为什么父子进程从“同一块地址中”读取到的值不一样呢&#xff1f; 因为这个地址不是物理内存的地址 &#xff0c;如果是物理内存的地址是绝对不可能出…

Android Context是什么?有很多的context他们之间有什么区别?什么时候该使用哪个?

目录 一、Context是什么&#xff1f; 在Android中&#xff0c;Context是一个抽象类 &#xff0c;它代表了应用程序的当前状态&#xff0c;包括资源和类加载器等&#xff0c;它提供了一个应用运行所需的信息&#xff0c;比如我们要获取资源 &#xff0c;那么需要她&#xff0c;…

自动驾驶-轨迹拼接

自动驾驶在进行规划之前&#xff0c;要确定当前帧轨迹规划的起点&#xff0c;这个起点常被误认为是当前车辆的位置&#xff0c;即每次以车辆的当前位置进行轨迹规划&#xff1b;其实不是这样的&#xff0c;直观上&#xff0c;这会导致本次次规划的轨迹同上次规划的轨迹之间是不…

Hadoop之WordCount测试

1、Hadoop简介&#xff1a; Hadoop是Apache旗下的一个用Java语言实现的开源软件框架&#xff0c;是一个开发和运行处理大规模数据的软件平台。 Hadoop的核心组件包括Hadoop分布式文件系统&#xff08;HDFS&#xff09;和MapReduce编程模型。HDFS是一个高度容错的系统&#xf…

Python | Leetcode Python题解之第456题132模式

题目&#xff1a; 题解&#xff1a; class Solution:def find132pattern(self, nums: List[int]) -> bool:candidate_i, candidate_j [-nums[0]], [-nums[0]]for v in nums[1:]:idx_i bisect.bisect_right(candidate_i, -v)idx_j bisect.bisect_left(candidate_j, -v)if…

MFC有三个选项:MFC ActiveX控件、MFC应用程序、MFC DLL,如何选择?

深耕AI&#xff1a;互联网行业 算法研发工程师 ​ 目录 MFC ActiveX 控件 控件的类型 标准控件 自定义控件 ActiveX控件 MFC ActiveX控件 标准/自定义控件 MFC ActiveX控件分类 3种MFC如何选择&#xff1f; MFC ActiveX控件 MFC 应用程序 MFC DLL 总结 举例说明…

不只是前端,后端、产品和测试也需要了解的浏览器知识(二)

目录标题 一、业务系统呈现给用户的节点1. 输入 URL 并解析1.1 用户输入 URL 并按下回车键1.2 浏览器解析 URL1.3 DNS 解析 2. 建立连接、发送请求并接收响应2.1 建立 TCP 连接2.2 发送 HTTP 请求2.3 服务器处理请求2.4 发送 HTTP 响应2.5 浏览器接收响应 3. 解析和加载资源、渲…

模拟算法(4)_外观数列

个人主页&#xff1a;C忠实粉丝 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 C忠实粉丝 原创 模拟算法(4)_外观数列 收录于专栏【经典算法练习】 本专栏旨在分享学习算法的一点学习笔记&#xff0c;欢迎大家在评论区交流讨论&#x1f48c; 目录 1. 题目链…

golang学习笔记27-反射【重要】

本节也是GO核心部分&#xff0c;很重要。包括基本类型的反射&#xff0c;结构体类型的反射&#xff0c;类别方法Kind()&#xff0c;修改变量的值。 目录 一、概念&#xff0c;基本类型的反射二、结构体类型的反射三、类别方法Kind()四、修改变量的值 一、概念&#xff0c;基本…

有些硬盘录像机接入视频汇聚平台EasyCVR后通道不显示/显示不全,该如何处理?

EasyCVR视频监控汇聚管理平台是一款针对大中型项目设计的跨区域网络化视频监控集中管理平台。该平台不仅具备视频资源管理、设备管理、用户管理、运维管理和安全管理等功能&#xff0c;还支持多种主流标准协议&#xff0c;如GB28181、RTSP/Onvif、RTMP、部标JT808、GA/T 1400协…

Linux忘记root用户密码怎么重设密码

直接说步骤&#xff1a; 1.重启客户机 2.在选择内核页面快速按e键&#xff0c;进入编辑模式 进入后应该是这个样子 在这里只能按上下键切换行 找到Linux16这里 3.按右方向键切换到行尾&#xff0c;也就是UTF-8处&#xff0c;在后面添加一个空格&#xff0c;然后加上这段话 …

【ubuntu】ubuntu20.04安装chrome浏览器

1.下载 https://download.csdn.net/download/qq_35975447/89842972 https://www.google.cn/chrome/ 2.安装 sudo dpkg -i google-chrome-stable_current_amd64.deb 3.使用

SkyWalking监控SQL参数

前言 SkyWalking可以记录每个请求中执行的所有SQL&#xff0c;但是默认情况下&#xff0c;SkyWalking不记录SQL参数导致使用起来不是很方便&#xff0c;每次都得看日志才能知道具体的参数。不过SkyWalking提供了一个配置参数&#xff0c;开启后&#xff0c;便可记录SQL执行的参…

【目标检测】yolo的三种数据集格式

目标检测中数据集格式之间的相互转换--coco、voc、yolohttps://zhuanlan.zhihu.com/p/461488682?utm_mediumsocial&utm_psn1825483604463071232&utm_sourcewechat_session【目标检测】yolo的三种数据集格式https://zhuanlan.zhihu.com/p/525950939?utm_mediumsocial&…