基于Matplotlib的模型性能可视化工作

一、项目简介

本项目是科技考古墓葬识别工作的中间过程,因为需要大量复用所以另起一章好了。

主要涉及到数据读取、数据可视化和少量的数据处理过程。

二、相关知识

  • Pandas
  • Matplotlib

三、实验过程

1. 数据探索性分析

1.1 准备工作–导入模块
import pandas as pd
import os
import numpy as np 
import matplotlib.pyplot as plt
1.2 数据预处理

我们首先构建一个色彩映射表,这个表将由一组自定义的颜色条构成,并且对应一个索引值,以便我们按照强度自定义生成绘图颜色。

可以在网址 上对你想要的颜色生成色度条。

colorMap=dict(zip(range(len(ModelMap),-1,-1),[
     "#d16ba5",
    "#c777b9", 
    "#ba83ca", 
    "#aa8fd8", 
    "#9a9ae1", 
    "#8aa7ec",
    "#79b3f4",
    "#69bff8",
    "#52cffe",
    "#41dfff", 
    "#46eefa", 
    "#5ffbf1"
]))

这个优势在于手动调整,不想怎么做可以使用各种可视化模块里自带的色彩映射cmap

然后就是将训练的模型信息输入到一个字典中,这里k,v值分别是模型名称、(模型参数量,模型平均精度)。

ModelMap={
    "YOLOv5-n":[1.9,0.7],
    "YOLOv5-s":[7.2,0.782],
    "YOLOv5-m":[21.2,0.777],
    "YOLOv5-l":[46.5,0.746],
    "YOLOv5-x":[86.7,0.768],
    "YOLOv8-n":[3.2,0.764],
    "YOLOv8-s":[11.2,0.813],
    "YOLOv8-m":[25.9,0.7],
    "YOLOv8-l":[43.7,0.7],
    "YOLOv8-x":[68.2,0.7]
}

我们想要将模型参数量从小到大排布,以便确定最优性能,那么可以使用sort方法进行排序:

newSort=list(ModelMap.items())
newSort.sort(key=lambda x:x[1][1],reverse=True)

这里面的reverse=True表示降序排序,这里等于是以模型的精度进行排序。注意lambda表达式,:前表示输入,后表示返回值。

结果应该如下所示。

[('YOLOv8-s', [11.2, 0.813]),
 ('YOLOv5-s', [7.2, 0.782]),
 ('YOLOv5-m', [21.2, 0.777]),
 ('YOLOv5-x', [86.7, 0.768]),
 ('YOLOv8-n', [3.2, 0.764]),
 ('YOLOv5-l', [46.5, 0.746]),
 ('YOLOv5-n', [1.9, 0.7]),
 ('YOLOv8-m', [25.9, 0.7]),
 ('YOLOv8-l', [43.7, 0.7]),
 ('YOLOv8-x', [68.2, 0.7])]

2. 可视化

为了更加直观的比较模型性能,我们选择采用二维散点图进行绘制。在此过程中,采用不同的颜色和尺寸可以让结果更加清晰直观。因此,我们选择了颜色和尺度两个额外维度,辅助可视化过程。

首先是获取尺度信息,这里采用的归一化缩放,为了让数据区间更加美观,选择采用np.clip(n,a,b)方法将数据区间变成(a,b),并执行相应的放缩。

def getScale(x,k=9.5):
    return np.clip(((x-min(y))/(max(y)-min(y))),0.15,0.95)*k
2.1 绘制散点图

还记得我们之前构建的自定义色度条吗,现在我们将结合色度条和尺度信息来绘制散点图。

# 首先是设置好 Figure 大小
# 在matplotlib中,绘图将基于 figure canvas axis 进行
plt.figure(figsize=(16,8))

for i,(k,v) in enumerate(newSort):
	# label 表示标签
	# s表示尺寸信息
	# c表示色彩信息
	# alpha表示透明度通道信息
	plt.scatter(v[0],v[1],c=colorMap[i],label=k,s=getScale(v[1])**2*np.pi,alpha=1)

# 添加行列标签
plt.ylabel("AP")
plt.xlabel("Parameters (M)")

# 在右上显示图例
plt.legend(loc='upper right')
# 设置标题
plt.title("AP-Params of different Model structures")

# 设置 xaxis 范围
plt.xlim(0,120)
# 设置格网信息
plt.grid(alpha=0.1,linestyle="--")

for i,j in zip(x,y):
	# 标记,用的是annotate 方法
	# plt.annotate(text,loc,xytext,textcoords,ha)
	# 常用参数 text表示文本信息 loc表示坐标点位置
	# xytext表示文本偏移量 textcoords表示文本以什么为坐标
	# ha表示文本显示位置,一般这组参数可以不动,即
	
	# xytext=(0,10),textcoords="offset points",ha='center'
    plt.annotate("%s"%j,(i,j),xytext=(0,10),textcoords="offset points",ha='center')
plt.savefig(r"new.jpg")
    
plt.show()

在这里插入图片描述

此时图像如图所示,为了将同一类模型归类,我们还可以采用折线图进行辅助。

2.2 绘制折线图
for i,j in ModelMap.values():
    x.append(i)
    y.append(j)

plt.plot(x[:5],y[:5],label="YOLO-v5",linestyle=':',alpha=0.5)
plt.plot(x[5:],y[5:],label="YOLO-v8",linestyle=':',alpha=0.5)

结果如图所示:

在这里插入图片描述

2.3 绘制模型过程性参数

在本阶段,我们需要做的需求为: 将训练过程中的精度、召回率以及mAP:0.5,mAP:0.5:0.95进行可视化。

可简要拆解为以下过程:

  • 读取相关csv文件
  • 构建文件映射,并且将每30epoch进行平均
  • 基于matplotlib绘制
  • 基于pyecharts进行绘制

为了方便读取csv文件,我们可以用os.listdir方式快速获取某一路径下的所有子文件,这个方法常常结合寻找后缀来用,譬如:

[i for i in os.listdir(path) if i.endswith('.csv')]

这里我们有两个大文件夹,先获取其路径:

yolov5=r"C:\Users\Administrator\Desktop\Train_Res\YOLO_V5"
yolov8=r"C:\Users\Administrator\Desktop\Train_Res\YOLO_V8"

然后构建csv文件列表:

data_list=[os.path.join(yolov5,i) for i in os.listdir(yolov5) if i.endswith('.csv')]+[os.path.join(yolov8,i) for i in os.listdir(yolov8) if i.endswith('.csv')]

与上述方法相同,当路径较多时,可写成迭代器形式。

接下来就是确定模型名称+csv文件了,用的是pd.read_csv,这里如果出现中文,可能需要加上pd.read_csv(encoding="utf-8")

dataMap={}
for i in data_list:
    fir,sec=i.find("_V")+2,i.find(".c")-1
    dataMap[f"yolov{i[fir]}_{i[sec]}"]=pd.read_csv(i)

注意这样的写法不具有泛用性,甚至改个位置就会报错,但是确实很快

查看我们的结果:

dataMap.keys()

# dict_keys(['yolov5_l', 'yolov5_m', 'yolov5_s', 'yolov5_x', 'yolov8_n', 'yolov8_s'])

已经拿到数据了,然后就是看看读取到的结果咋样:

dataMap['yolov5_x'].head()

在这里插入图片描述

成功。

下面来构造数据,由于有些模型采用了剪枝,在100epoches不收敛的情况下自动终止训练,所以数据的长度不一致。我们可以取其中最短的进行分析,不过这里用了360epoches。

请注意,确定你的模型在区间 U ( δ ) U(\delta) U(δ)内是陷入了局部最优解的,否则没有比较意义。

x=[i for i in range(0,360,15)]
# 获取列名
col=dataMap['yolov5_x'].columns

由于有多组参数需要比较,出于复用性考虑,我们采用函数的方式进行绘制:

def plotValue(idx,reset=None,ws=15):
    plt.figure(figsize=(20,8))
    for k,v in dataMap.items():
        v=v.iloc[:,idx]
        # 此时的平滑窗口是15
        plt.plot(x,[sum(v[i*ws:i*ws+ws])/ws for i in range(360//ws)],label=k)
    plt.xlabel("epoches")
    ylab=col[idx] if not reset else reset
    plt.ylabel(ylab)
    plt.title(f"{ylab} variation of different models")
    plt.legend()
    return plt

调整参数ws 即可获得在不同大小的滑动窗口下的平均值。reset 支持自己改名称,这都没啥

来看看结果:

plotValue(4,"Precision").show()
plotValue(5,"Recall").show()
plotValue(6,"mAP_0.5").show()
plotValue(7,"mAP_0.5:0.95").show()

在这里插入图片描述

看一个就好了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/614755.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Python系列】Python中列表属性提取

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

【Java orm 框架比较】十一 新增 原生jdbc对比

迁移到(https://gitee.com/wujiawei1207537021/spring-orm-integration-compare) orm框架使用性能比较 比较mybatis-plus、lazy、sqltoy、mybatis-flex、easy-query、mybatis-mp、jpa、dbvisitor、beetlsql、dream_orm、wood、hammer_sql_db、原生jdbc…

OpenCv中cv2.subtract(image,blurred)与(image-blurred)的区别

目录 一、cv2.subtract()函数二、cv2.subtract(image,blurred)和(image-blurred)处理效果对比2.1 代码2.2 输出结果 三、总结 一、cv2.subtract()函数 cv2.subtract是OpenCV库中的一个函数,用于进行图像减法运算。它可以很方便地进行两个图像…

LeetCode/NowCoder-链表经典算法OJ练习1

目录 说在前面 题目一:移除链表元素 题目二:反转链表 题目三:合并两个有序链表 题目四:链表的中间节点 SUMUP结尾 说在前面 dear朋友们大家好!💖💖💖数据结构的学习离不开刷题…

【C/C++笔试练习】DNS设置文件、应用层、Dos攻击、DNS服务、DNS、子网划分、http状态、路由设置、TCP连接、HTTP状态码、剪花布条、客似云来

文章目录 C/C笔试练习选择部分(1)DNS设置文件(2)应用层(3)Dos攻击(4)DNS服务(5)DNS(6)子网划分(7)http状态&am…

网络运维故障排错思路!!!!!(稳了!!!)

1 网络排错的必备条件 为什么要先讲必备条件?因为这里所讲的网络排错并不仅仅是停留在某一个小小命令的使用上,而是一套系统的方法,如果没有这些条件,我真的不能保证下面讲的这些你可以听得懂,并且能运用到实际当中&a…

Navicat 17:先睹为快

官方声明:Navicat 17(英文版)目前处于测试阶段中,并计划 5 月 13 日发布! 如果你觉得 Navicat 16 已经推出很多令人兴奋的新功能,那么这次你可能要好好看看 Navicat 17,本次升级涵盖了更多的内容…

ASP.NET WebApi 如何使用 OAuth2.0 认证

前言 OAuth 2.0 是一种开放标准的授权框架,用于授权第三方应用程序访问受保护资源的流程。 OAuth 2.0 认证是指在这个框架下进行的身份验证和授权过程。 在 OAuth 2.0 认证中,涉及以下主要参与方: 资源所有者(Resource Owner&…

【算法】动态规划之背包DP问题(2024.5.11)

前言: 本系列是学习了董晓老师所讲的知识点做的笔记 董晓算法的个人空间-董晓算法个人主页-哔哩哔哩视频 (bilibili.com) 动态规划系列 【算法】动态规划之线性DP问题-CSDN博客 01背包 步骤: 分析容量j与w[i]的关系,然后分析是否要放…

iLogtail 社区开源之夏活动来了!

作者:玄飏 在这个充满活力的夏日,随着阳光一同灿烂的是开源精神的光辉与创新的火花。iLogtail 社区高兴地宣布,我们正式加入开源之夏 2024 的行列,诚邀每一位怀揣梦想与激情的学生开发者,共同开启一场探索技术前沿、贡…

WP All Import Pro插件下载 - 一键导入,无限可能

在当今快节奏的数字时代,网站内容的更新和管理是每个网站管理员和开发者的日常工作。但是,传统的手动更新方法不仅耗时,而且容易出错。现在,有了WP All Import Pro,这一切都将改变。 WP All Import Pro 是一款专为Wor…

完美撤离暗区突围测试资格获取指南 超简单的暗区突围资格申请

完美撤离!暗区突围测试资格获取指南 超简单的暗区突围资格申请! 最近游戏圈关注度最高的一件事莫过于暗区突围国际服的上线,随着暗区突围PC端的上线,这款游戏的测试资格申请成为了玩家们心头的一个大问题,许多玩家爱不…

SpringBoot实现统一返回值+全局异常处理

在这里首先感谢的就是程序员老罗&#xff0c;从他的项目里面学到了这些东西。 首先就是去创建一个SpringBoot项目&#xff0c;这里我就不多做赘述了 封装一个统一返回对象 package com.example.demo.vo;public class ResponseVO<T> {private String status;private In…

YOLOv5-7.0改进(四)添加EMA注意力机制

前言 关于网络中注意力机制的改进有很多种&#xff0c;本篇内容从EMA注意力机制开始&#xff01; 往期回顾 YOLOv5-7.0改进&#xff08;一&#xff09;MobileNetv3替换主干网络 YOLOv5-7.0改进&#xff08;二&#xff09;BiFPN替换Neck网络 YOLOv5-7.0改进&#xff08;三&…

python实现pip一键切换国内镜像源脚本分享

本文主要分享一个自己写的pip一键切换国内镜像源python脚本 import subprocess# pip 国内镜像源加速 source_urls [{"name": "默认镜像源", "url": ""},{"name": "清华大学镜像源(推荐使用)", "url": …

示例十、红外遥控器

通过以下几个示例来具体展开学习,了解红外遥控器原理及特性&#xff0c;学习红外遥控器的应用&#xff08;干货版&#xff09;&#xff1a; 示例十、红外遥控器 ino文件源码&#xff1a; //Arduino C demo #include "IRremote.h"IRrecv irrecv(4); decode_results …

自主实现Telnet流量抓取

自主实现Telnet流量抓取 根据测试需求&#xff0c;需要抓取Telnet流量包&#xff0c;使用wireshark Python&#xff08;socket、telnetlib库&#xff09;实现 实现代码 主要此处有坑&#xff0c; 根据协议规则&#xff0c;wireshark 默认端口为23 的是Telnet协议&#xff0…

递归,搜索,和回溯算法

目录 一、什么是递归&#xff1a; 二、为什么要用到递归 三、如何看待递归这个过程 四、如何写好一个递归 大家也看到了&#xff0c;我们这个算法篇章的开头就比较长&#xff0c;这主要是因为他们三者关系紧密。 一、什么是递归&#xff1a; 我们在学习C语言和数据结构二…

java--io流(二)

一、打印流&#xff08;PrintStream[字节]、PrintWriter[字符]&#xff09; &#xff08;基本上可以代替前面所学的字节、字符输出流&#xff09;&#xff0c;二者关于打印数据功能相同&#xff08;都方便且高效&#xff09;&#xff0c;但是关于数据写出不同&#xff0c;前者…

【算法】并查集

并查集是一种树形的数据结构&#xff0c;通常可以用于高效的合并多个集合和查询两个数是否属于同一个集合的情况。 其原理在于&#xff0c;把每个集合变成一棵树&#xff0c;树根的值就是整个集合的编号&#xff0c;通过查找两个数所在树根是否相同即可判断是否在同一个集合&a…