YOLO中yaml文件解读

YOLO中yaml文件解读

当我们使用yolo系列去做视觉方面的研究时,都会进行模型的训练,在yolo基础上进行模块的替换之后需要设置对应的yaml文件,但是yaml文件中的参数分别代表什么,应该如何调试是至关重要的。

参数解读

如下所示是yolov8的yaml文件中的backbone:

YOLOv8.0n backbone

backbone:

[from, repeats, module, args]

  • [-1, 1, Conv, [64, 3, 2]] # 0-P1/2
  • [-1, 1, Conv, [128, 3, 2]] # 1-P2/4
  • [-1, 3, C2f, [128, True]]
  • [-1, 1, Conv, [256, 3, 2]] # 3-P3/8
  • [-1, 6, C2f, [256, True]]
  • [-1, 1, Conv, [512, 3, 2]] # 5-P4/16
  • [-1, 6, C2f, [512, True]]
  • [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32
  • [-1, 3, C2f, [1024, True]]
  • [-1, 1, SPPF, [1024, 5]] # 9

from表示该层的输入来源。它可以是一个整数,表示前一层的索引,或者是一个字符串,表示前一层的名称。这个参数用于指定该层的输入来自于哪一层。
-1表示该层的输入是上一层;

repeats表示该层的重复次数。有些backbone网络的某些层会被堆叠多次,通过设置repeats参数来指定重复的次数。

modules表示该层所使用的模块或组件的类型。可以是一个字符串,表示该层的类型,如"convolutional"(卷积层)、“maxpool”(最大池化层)等。

args比较重要表示该层的其他参数,以字典的形式给出。这些参数包括卷积核大小、通道数、步幅、填充等,具体取决于该层所使用的模块类型。

举个例子:
如下图所示的Conv卷积的参数为[64,3,2],也就是说,这些参数在初始化Conv时将模块的形参进行了更新。
在这里插入图片描述
首先可以在YOLO的nn/modules/conv.py中找到如下图所示的Conv的代码:
在这里插入图片描述
我们首先需要了解,在模块初始化时,这些模块的参数的作用
c1 :表示输入通道数,即输入特征图的深度或通道数。它决定了输入特征图的形状。
c2 :表示输出通道数,即卷积层中卷积核的数量,也是输出特征图的深度或通道数。它决定了输出特征图的形状。
k:表示卷积核的大小或尺寸。在这里,k 是一个整数,表示卷积核的高度和宽度相等。例如,k=3 表示使用一个 3x3 的卷积核。
s:表示卷积的步幅(stride),即卷积核在输入特征图上滑动的步长。默认情况下,步幅为 1,表示卷积核每次滑动一个像素。如果设置 s=2,则卷积核每次滑动两个像素。
p:表示卷积的填充(padding)。填充是在输入特征图周围添加额外的像素,以控制输出特征图的大小。p 可以是一个整数,表示在每个边缘添加相同数量的填充像素,也可以是一个元组 (p1, p2),其中 p1 表示在高度方向的填充数,p2 表示在宽度方向的填充数。默认情况下,没有填充。
g:表示分组卷积(group convolution)中的分组数。默认为 1,表示标准的卷积操作。当 g 大于 1 时,卷积核被分成 g 个子组,每个子组进行独立的卷积操作。分组卷积可以降低计算量,减少参数数量。
d:表示卷积操作的扩张(dilation)。扩张卷积是通过在卷积核元素之间添加间隔来增加感受野的。d 的默认值为 1,表示标准的卷积操作。当 d 大于 1 时,卷积核元素之间会有间隔。

之后,我们譬如再来讲字典[64,3,2]所传的参数,在传参数时,模块的c1表示当前层的输入,来源于上一层的输出,是不参与字典中的数据传输的,从c2这个形参开始,64代表c2 = 64, k = 3, s = 1;
一般的数据都是从c2开始依次传输。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/631505.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

贷款借钱平台 贷款源码 小额贷款系统 卡卡贷源码 小额贷款源码 贷款平台

贷款平台源码/卡卡贷源码/小贷源码/完美版 , 数据库替换application/database.php 源码下载:https://download.csdn.net/download/m0_66047725/89268533 更多资源下载:关注我。

Java项目:基于ssm框架实现的家政服务网站管理系统分前后台(B/S架构+源码+数据库+毕业论文+答辩PPT)

一、项目简介 本项目是一套基于ssm框架实现的家政服务网站管理系统 包含:项目源码、数据库脚本等,该项目附带全部源码可作为毕设使用。 项目都经过严格调试,eclipse或者idea 确保可以运行! 二、技术实现 jdk版本:1.…

Elasticsearch的并发控制策略

文章目录 利用external对版本号进行外部控制利用if_seq_no和if_primary_term作为唯一标识来避免版本冲突 ES中的文档是不可变更的。如果你更新一个文档,会将就文档标记为删除,同时增加一个全新的文档。同时文是的version字段加1内部版本控制 If_seq_no If_primary_term 使用外…

大模型对数据库运维的赋能:智能运维的新时代

引言随着人工智能技术的飞速发展,大模型作为AI领域的前沿技术,已经开始在数据库运维(DBA)领域展现出其独特的价值。大模型的引入,不仅提升了数据库运维的效率,还极大地改善了运维的质量和智能化水平。本文将深入分析大模型在数据库…

【SQL】SQL常见面试题总结(3)

目录 1、聚合函数1.1、SQL 类别高难度试卷得分的截断平均值(较难)1.2、统计作答次数1.3、得分不小于平均分的最低分 2、分组查询2.1、平均活跃天数和月活人数2.2、月总刷题数和日均刷题数2.3、未完成试卷数大于 1 的有效用户(较难&#xff09…

[数据集][目标检测]结直肠息肉内镜图像病变检测数据集13524张2类别

数据集共分为2个版本,即A版和B版,两个版本图片数一样,数据集图片不存在重叠文件名也不存在重复,可以合并训练,也可以单独训练。 下面是信息介绍: 结直肠息肉内镜图像病变检测数据集13524张2类别A版 数据…

东莞酷得电子方案 遥控水弹坦克车

首先遥控小车是一种能够通过无线遥控器进行远程操控的小型机器人。遥控小车应用了哪些软硬件技术呢?本文将从以下几个方面进行详细介绍。 遥控小车应用了多种软硬件技术,涉及底盘结构、动力系统、传感器、控制器等多个方面。 底盘结构:遥控…

蓝桥杯 EDA 组 历届国赛真题解析

一、2021年国赛真题 1.1 CN3767 太阳能充电电路 CN3767 是具有太阳能电池最大功率点跟踪功能的 4A,12V 铅酸电池充电管理集成电路。 最大功率点应指的是电池板的输出电压,跟踪电压其做保护。当然 CN3767 也可以直接使用直流充电,具体可以阅读…

openEuler 22.03安装单机版oracle 19c(附录所有patch包)

客户要在OpenEuler 22.0.3 LTS上安装的19.3.0.0 ,在安装到11%的时候报错all_no_orcl错误,我们知道欧拉底层是rhel9,这些错误其实经常接触都知道肯定是各种软件包的版本不对导致的,但是各种依赖太多了也不好解决,最后在官网有所发现: Requirements for Installing Oracle Datab…

未授权访问:Rsync 未授权访问漏洞

目录 1、漏洞原理 2、环境搭建 3、未授权访问 4、利用rsync下载任意文件 5、利用rsync反弹shell 防御手段 今天继续学习各种未授权访问的知识和相关的实操实验,一共有好多篇,内容主要是参考先知社区的一位大佬的关于未授权访问的好文章&#xff0c…

QCustomplot---动态图

QCustomplot绘制动态曲线图-游标及鼠标跟踪显示数值_qcustomplot 游标-CSDN博客 m_timer new QTimer(this);connect(m_timer,SIGNAL(timeout()),this,SLOT(slotTimeout()));m_timer->start(50); void MainWindow::slotTimeout() {static int p0;static int i0;double m,m1…

ubuntu中如何删除常规匹配不到的乱码目录文件

原因是之前误操作创建了多个带空格的gerrit仓库的时候导致的服务器乱码,进入geriit服务器可以查看到如下的一个异常目录,常规rm -rf 操作的时候是匹配不到这个目录的。 这时候我们应该考虑使用inode的性质来匹配删除。 注:在Linux文件系统中…

【设计模式】JAVA Design Patterns——Acyclic Visitor(非循环访问者模式)

🔍目的 允许将新功能添加到现有的类层次结构中,而不会影响这些层次结构,也不会有四人帮访客模式中那样循环依赖的问题。 🔍解释 真实世界例子 我们有一个调制解调器类的层次结构。 需要使用基于过滤条件的外部算法(是…

python中内置函数简要介绍

pyton3.11版本中常用的内置函数,不需要导入,可直接使用。这些函数大多数都是比较常用的,很多在之前的文章都有介绍过。 大家也可直接到官网查看学习 https://docs.python.org/zh-cn/3.11/library/functions.html。 内置函数 abs() min() …

力扣/leetcode383.比特位记数

题目描述 给你一个整数 n &#xff0c;对于 0 < i < n 中的每个 i &#xff0c;计算其二进制表示中 1 的个数 &#xff0c;返回一个长度为 n 1 的数组 ans 作为答案。 示例 代码思路 第一种方法 最简单的方法就是&#xff0c;遍历然后使用python自带的bin()方法直接…

UART 16550 IP核使用详解

AXI UART 16550是Xilinx FPGA中提供的一个UART IP核&#xff0c;它允许通过AXI接口与UART设备进行通信。本文描述了如何使用Xilinx的Vivado Design Suite环境中的工具来定制和生成 UART 16550 IP核&#xff0c;以及如何配置和使用该IP核。 1 UART 16550 IP核的使用 以下是针对…

[数据集][目标检测]蕃茄核桃桔子龙眼青枣5种水果检测数据集VOC+YOLO格式270张5类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;270 标注数量(xml文件个数)&#xff1a;270 标注数量(txt文件个数)&#xff1a;270 标注类别…

logger使用,解决中文乱码问题,重复缓存问题

目的 在模型训练过程中&#xff0c;想把控制台内容输出的内容缓存起来&#xff0c;以便后期检查使用&#xff0c;就用起了logger。用的时候遇到过中文乱码问题以及重复缓存问题&#xff08;即后面的logger对象将前面的logger对象缓存内容也缓存下来了&#xff09;。 解决方法…

SerDes系列之电路技术概述

现在的高速电路设计中&#xff0c;SerDes的应用几乎无处不在&#xff0c;如下图所示的一款SoC&#xff0c;其外设接口除了少量普通的IO&#xff0c;几乎都是SerDes专用接口&#xff0c;因此&#xff0c;电路设计中对于SerDes接口电路的熟知程度&#xff0c;几乎就决定了设计的成…

小米电脑管家-非小米电脑安装教程

​​第一步&#xff1a;去浏览器搜索小米跨终端智联官网 下载小米电脑管家 如果是小米电脑&#xff0c;直接安装就行了 这里主要讲的是不是小米电脑&#xff0c;怎么去安装&#xff1f; 不是小米电脑就需要下载免检测机型插件&#xff0c;不然安装不了的 第二步&#xff1a;…