yolov5-6.0调测记录

  直接运行yolov5-6.0/detect.py,输出如下:

image 1/2 C:\Users\dun\Downloads\yolov5-6.0\data\images\bus.jpg: 640x480 4 persons, 1 bus, Done. (0.216s)
image 2/2 C:\Users\dun\Downloads\yolov5-6.0\data\images\zidane.jpg: 384x640 2 persons, 2 ties, Done. (0.166s)
Speed: 1.5ms pre-process, 191.0ms inference, 1.5ms NMS per image at shape (1, 3, 640, 640)
Results saved to runs\detect\exp3

  待检测的图像保存在yolov5-6.0\data\images 目录下,bus.jpgzidane.jpg 是项目自带的图像,检测结果保存在runs\detect\exp3 目录下,检测结果如下:
在这里插入图片描述
在这里插入图片描述
  检测涉及到的参数如下,后面会逐一解释和测试:

def parse_opt():
    parser = argparse.ArgumentParser()
    parser.add_argument('--weights', nargs='+', type=str, default=ROOT / 'yolov5s.pt', help='model path(s)')
    parser.add_argument('--source', type=str, default=ROOT / 'data/images', help='file/dir/URL/glob, 0 for webcam')
    parser.add_argument('--imgsz', '--img', '--img-size', nargs='+', type=int, default=[640], help='inference size h,w')
    parser.add_argument('--conf-thres', type=float, default=0.25, help='confidence threshold')
    parser.add_argument('--iou-thres', type=float, default=0.45, help='NMS IoU threshold')
    parser.add_argument('--max-det', type=int, default=1000, help='maximum detections per image')
    parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    parser.add_argument('--view-img', action='store_true', help='show results')
    parser.add_argument('--save-txt', action='store_true', help='save results to *.txt')
    parser.add_argument('--save-conf', action='store_true', help='save confidences in --save-txt labels')
    parser.add_argument('--save-crop', action='store_true', help='save cropped prediction boxes')
    parser.add_argument('--nosave', action='store_true', help='do not save images/videos')
    parser.add_argument('--classes', nargs='+', type=int, help='filter by class: --classes 0, or --classes 0 2 3')
    parser.add_argument('--agnostic-nms', action='store_true', help='class-agnostic NMS')
    parser.add_argument('--augment', action='store_true', help='augmented inference')
    parser.add_argument('--visualize', action='store_true', help='visualize features')
    parser.add_argument('--update', action='store_true', help='update all models')
    parser.add_argument('--project', default=ROOT / 'runs/detect', help='save results to project/name')
    parser.add_argument('--name', default='exp', help='save results to project/name')
    parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')
    parser.add_argument('--line-thickness', default=3, type=int, help='bounding box thickness (pixels)')
    parser.add_argument('--hide-labels', default=False, action='store_true', help='hide labels')
    parser.add_argument('--hide-conf', default=False, action='store_true', help='hide confidences')
    parser.add_argument('--half', action='store_true', help='use FP16 half-precision inference')
    parser.add_argument('--dnn', action='store_true', help='use OpenCV DNN for ONNX inference')
    opt = parser.parse_args()
    opt.imgsz *= 2 if len(opt.imgsz) == 1 else 1  # expand
    print_args(FILE.stem, opt)
    return opt
  • weightstype=str 表示参数类型为字符串;default=ROOT / 'yolov5s.pt' 表示默认值为ROOT / 'yolov5s.pt' ;根据help='model path(s)' 可知,该参数表示模型权重文件的路径。
parser.add_argument('--weights', nargs='+', type=str, default=ROOT / 'yolov5s.pt', help='model path(s)')
  • source:指定输入的路径,默认值为ROOT / 'data/images'
parser.add_argument('--source', type=str, default=ROOT / 'data/images', help='file/dir/URL/glob, 0 for webcam')

  如执行python detect.py --source data/images/bus.jpg 只会检测bus.jpg

  • imgsz:模型在detect前,会把图像resize成640×640再进行检测,该尺寸需要和训练模型时使用的尺寸保持一致。在640×640的尺寸上得到检测框以后,再将640×640的图像连同检测框一起变换回原来的尺寸。
parser.add_argument('--imgsz', '--img', '--img-size', nargs='+', type=int, default=[640], help='inference size h,w')
  • conf-thres:置信度阈值,只有置信度大于该阈值时,我们才认为这是一个物体。
parser.add_argument('--conf-thres', type=float, default=0.25, help='confidence threshold')

  执行python detect.py --conf-thres 0.25 ,检测结果如下。注意右边的tie 的置信度为0.26。
在这里插入图片描述
  执行python detect.py --conf-thres 0.27 ,检测结果如下,右边的tie已经没有了。
在这里插入图片描述

  • iou-thres:iou阈值,若两个检测框的iou大于该阈值,则根据NMS简化为一个框。
parser.add_argument('--iou-thres', type=float, default=0.45, help='NMS IoU threshold')

  IoU即Intersection over Union,其计算公式如下:
在这里插入图片描述

  执行python detect.py --iou-thres 0.45 ,结果如下:
在这里插入图片描述
  执行python detect.py --iou-thres 1 ,结果如下,可以看到同一个人对应了多个检测框。
在这里插入图片描述
  执行python detect.py --iou-thres 0 ,结果如下:
在这里插入图片描述
  关于NMS算法,这篇文章中的图解很清晰:機器/深度學習: 物件偵測 Non-Maximum Suppression (NMS),我在这里把图贴出来,不做过多分析。
NMS算法背景
  第一個例子,有兩隻狗,我們怎麼用NMS將偵測到的物件框將把兩隻狗框出來。我們假設這張圖我們捉到5個BBox(如上圖),每個BBox帶有一個socre,代表他是foreground的信心度。
在这里插入图片描述
  實際流程如下圖:
在这里插入图片描述
  步骤1.「確定是物件集合」= {空集合}
  步骤2.Run 1: 先將BBox依照信心程度排序,信心程度最高的BBox (紅色) 會被選入「確定是物件集合」內,其他BBox會看這步驟選出最高的BBox進行IoU計算,如果粉紅色的IoU為0.6大於我們設定的0.5,所以將粉紅色的BBox信心度設置為0。「確定是物件集合」= {紅色BBox }
  步骤3.Run 2: 不考慮信心度為0和已經在「確定是物件集合」的BBox,剩下來的物件繼續選出最大信心程度的BBox,將此BBox(黃色)丟入「確定是物件集合」,剩下的BBox和Run2選出的最大信心程度的BBox計算IoU,其他BBox都大於0.5,所以其他的BBox信心度設置為0。「確定是物件集合」= {紅色BBox; 黃色BBox}
  步骤4.因為沒有物件信心度>0,所以結束NMS。
  「確定是物件集合」= {紅色BBox; 黃色BBox}。
  這邊衍生一個問題,為什麼IoU設定是0.5,不能在高一點嗎?
  剛剛的例子我這邊舉一個IoU閾值是0.7的例子(下圖),看會發生什麼問題?
在这里插入图片描述
  由此可以知道,如果IoU閾值設定太高,可能會造成物件重複偵測的問題。

  第二個例子,有1隻狗1隻貓,我們怎麼用NMS將偵測到的物件框將把貓和狗框出來。

在这里插入图片描述
  前面的範例一是標準的NMS程序,這邊要搭配一下分類來看,範例二和標準NSM作法一樣,先將「確定是物件集合」選出來,此例是NMS選出的BBox是{紫色BBox ; 紅色BBox}。

  這時候在搭配一下分類的機率,就可以把每個NMS選出的BBox做類別判斷了(如下圖,每個BBox都會帶有一組機率)。
在这里插入图片描述
  這邊附上實際做法,還會先用一個閾值先初步去掉一些候選的BBox,不然假設一張圖預選出一萬個BBox,後面用CPU計算NMS會很花時間,所以會依據BBox的confidence score先去掉一些沒用的BBox,然後再做NMS,如下圖。
在这里插入图片描述

  • max-det:检测到的物体的最大数量。
parser.add_argument('--max-det', type=int, default=1000, help='maximum detections per image')

  执行python detect.py --max-det 4 ,结果如下:
在这里插入图片描述
  执行python detect.py --max-det 3 ,结果如下:
在这里插入图片描述
  执行python detect.py --max-det 2 ,结果如下:
在这里插入图片描述

  • view-img:设置该参数时,将会自动显示结果图像。
parser.add_argument('--view-img', action='store_true', help='show results')

  执行python detect.py --view-img ,将自动显示结果图像。

  • save-txt
  • save-conf
  • save-crop
parser.add_argument('--save-txt', action='store_true', help='save results to *.txt')
parser.add_argument('--save-conf', action='store_true', help='save confidences in --save-txt labels')
parser.add_argument('--save-crop', action='store_true', help='save cropped prediction boxes')

  执行python detect.py --save-txt --save-conf --save-crop ,结果如下:
在这里插入图片描述
  runs/detect/exp29/zidane.jpg 内容如下:
在这里插入图片描述
  runs/detect/exp29/labels/zidane.txt 内容如下:

27 0.782812 0.506944 0.0359375 0.141667 0.261517
0 0.327344 0.634028 0.4625 0.731944 0.666693
27 0.366797 0.796528 0.0429688 0.379167 0.675119
0 0.736328 0.533333 0.311719 0.933333 0.879861

  runs/detect/exp29/crops/person/zidane.jpg
  runs/detect/exp29/crops/person/zidane2.jpg
  runs/detect/exp29/crops/tie/zidane.jpg
  runs/detect/exp29/crops/tie/zidane2.jpg
  内容分别如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • nosave:若设置该参数,表示不保存结果图像。
parser.add_argument('--nosave', action='store_true', help='do not save images/videos')
  • classes
parser.add_argument('--classes', nargs='+', type=int, help='filter by class: --classes 0, or --classes 0 2 3')

  执行python detect.py --classes 27 ,27表示tie,结果如下:
在这里插入图片描述
  执行python detect.py --classes 0 ,0表示person,结果如下:
在这里插入图片描述

  • project
  • name
  • exist-ok
parser.add_argument('--project', default=ROOT / 'runs/detect', help='save results to project/name')
parser.add_argument('--name', default='exp', help='save results to project/name')
parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')
  • line-thickness
  • hide-labels
  • hide-conf
parser.add_argument('--line-thickness', default=3, type=int, help='bounding box thickness (pixels)')
parser.add_argument('--hide-labels', default=False, action='store_true', help='hide labels')
parser.add_argument('--hide-conf', default=False, action='store_true', help='hide confidences')

  执行python detect.py --line-thickness 12 --hide-labels --hide-conf ,结果如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/560823.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

单链表的简单应用

目录 一、顺序表的问题及思考 二、链表的概念及结构 三、单链表的实现 3.1 增 3.1.1 尾插 3.1.2 头插 3.1.3 指定位置前插入 3.1.4 指定位置后插入 3.2 删 3.2.1 尾删 3.2.2 头删 3.2.3 指定位置删除 3.2.4 指定位置后删除 3.2.5 链表的销毁 3.3 查 3.4 改 四…

【Godot4自学手册】第三十九节利用shader(着色器)给游戏添加一层雾气效果

今天,主要是利用shader给游戏给地宫场景添加一层雾气效果,增加一下气氛,先看一下效果: 一、新建ParallaxBackground根节点 新建场景,根节点选择ParallaxBackground,命名为Fog,然后将该场景保…

什么是AIoT?

什么是AIoT? AIoT,即人工智能物联网,是一种将人工智能(AI)技术与物联网(IoT)相结合的新型应用形态。它不仅实现了设备之间的互联互通,还赋予了它们更智能化的特性。AIoT的核心在于通过AI的数据…

prometheus+grafana可视化监控

prometheus监控 一、用二进制安装 1、安装Prometheus 打开官方网址:https://prometheus.io/download/ wget https://github.com/prometheus/prometheus/releases/download/v2.45.4/prometheus-2.45.4.linux-amd64.tar.gz下载完成后解压一下安装包 tar vxf prometheus-2.45.…

解锁棋盘之谜:探索N皇后问题的全方位解决策略【python 力扣51题】

作者介绍:10年大厂数据\经营分析经验,现任大厂数据部门负责人。 会一些的技术:数据分析、算法、SQL、大数据相关、python 欢迎加入社区:码上找工作 作者专栏每日更新: LeetCode解锁1000题: 打怪升级之旅 python数据分析…

软考138-上午题-【软件工程】-软件评审

一、软件评审 通常,把“质量”理解为“用户满意程度”。为了使得用户满意,有以下两个必要条件: (1) 设计的规格说明书符合用户的要求,这称为设计质量。 (2) 程序按照设计规格说明所规定的情况正确执行,这称为程序质…

Docker安装教程,什么系统都有

下载Docker 如果你的系统是图形界面的,比如windows、mac、ubuntu等,到 Docker 官网下载 Docker Desktop。 官网链接: https://www.docker.com/products/docker-desktop/ 根据你的系统选择对应的安装包,然后下载,是不是特别简单&a…

Git TortoiseGit 安装使用详细教程

前言 Git 是一个免费的开源分布式版本控制系统,是用来保存工程源代码历史状态的命令行工具,旨在处理从小型到非常大型的项目,速度快、效率高。《请查阅Git详细说明》。TortoiseGit 是 Git 的 Windows Shell 界面工具,基于 Tortoi…

改进前后端交互实例

前后端交互实例(javaweb05)-CSDN博客 在这之前我假设大家都已经学完了IOC和DI 不明白的这里我也解释一下,首先是两个概念 1.控制反转:对象的创建控制权由程序自身转到外部(容器) 2.依赖注入:容器为程序提供运行时所依赖的资源 Bean对象:IOC容器中创建,关联的对象,称之为be…

【wpf】ObservableCollection 跨线程报错问题

背景 ObservableCollection 我们之前介绍过他和List的区别。ObservableCollection 的好处在于,当集合发生变化时,能发送通知通知界面发生相应的更改。但是ObservableCollection 有个弊端。无法在非UI线程中访问。 要么就是通知失效了,要么就…

从0到1实现RPC | 接入Apollo配置中心

一、代码实现 添加依赖 添加apollo客户端的依赖和spring配置相关依赖 添加监听器 通过实现ApplicationContextAware接口,获取Spring上下文。 使用ApolloConfigChangeListener注解监听命名空间rpc-demo-provider.yaml和默认的application.properties。 监听逻辑…

前端页面助手 (vue)

快速开发页面(图形化开发页面) 自主编辑 然后自己也可以修改属性 最后导出页面即可 github地址 ;https://github.com/opentiny/tiny-engine

虹科Pico汽车示波器 | 免拆诊断案例 | 2016款保时捷911 GT3 RS车发动机异响

一、故障现象 一辆2016款保时捷911 GT3 RS车,搭载4.0 L水平对置发动机(型号为MA176),累计行驶里程约为4.2万km。车主反映,1星期前上过赛道,现在发动机有“哒哒”异响。 二、故障诊断 接车后试车&#xff…

C++语言·类和对象(下)

1. 初始化列表 我们回忆上节写的MyQueue类,其中有两个栈类和一个int类型,栈类因为其特殊性,要开空间,所以我们必须手搓Stack类的构造函数。但是正常来说MyQueue自动生成的构造函数会调用自定义类型的默认构造函数,也就…

Proxy 代理

意图 为其它对象提供一种代理以控制这个对象的访问。 结构 Proxy保存一个引用使得代理可以访问实体;提供一个与Subject的接口相同的接口,使代理可以用来替代实体;控制实体的存取,并可能负责创建和删除它;其他功能依赖…

【leetcode面试经典150题】63. 删除链表的倒数第 N 个结点(C++)

【leetcode面试经典150题】专栏系列将为准备暑期实习生以及秋招的同学们提高在面试时的经典面试算法题的思路和想法。本专栏将以一题多解和精简算法思路为主,题解使用C语言。(若有使用其他语言的同学也可了解题解思路,本质上语法内容一致&…

现货白银保证金交易要先分析趋势

现货白银是保证金交易品种,买卖过程中可能会涉及数十倍的资金杠杆,所以它对投资者的分析水平和交易水平的要求都比较高,所以在进入这个市场之前,投资者需要先学习一些基本的分析方法,当中可以分为基本面和技术面两大流…

Vmware ---快捷键

Vi 文件名.c xrandr 查看分辨率 xrandr -s 分辨率 调你自己想要的分辨率 ctr shift 放大字体 ctr - 缩小字体 ctr alt t 打开控制台 cd caoshupei 进入曹树培文件夹 cd .. 退回上层文件夹 ls 列出生成的文件 ls -a 显示所有文件,包含隐藏的文件和文件…

2024-4-狼道

2024-4-狼道 2024-4-9 宋犀堃(堃通坤,多用于人名) fatux: 做人当如狗,和蔼可亲;做事当如狼,专注果决。 狼道 智慧生存的强者法则 走向卓越的成功之道 狼道,是追求卓越的野心&am…

第一个Python程序

1、python与java的区别 Python和Java是两种不同的编程语言,它们具有以下一些主要区别: 语法:Python的语法相对简洁和可读性高,使用缩进来表示代码块;而Java的语法更为严格,使用花括号来表示代码块。 类型…