【卷积神经网络】常用评价指标总结

评估指标

概述

该评价指标适合分类任务与目标检测,主要用于评估模型的性能。该文章对相关指标进行总结,同时对输出的图片进行学习分析

混淆矩阵的组成

  • TP(True Positives,真正例):实际为正例,且被模型正确预测为正例的样本数
  • FP(False Positives,假正例):实际为负例,但被模型错误预测为正例的样本数
  • FN(False Negatives,假负例):实际为正例,但被模型错误预测为负例的样本数
  • TN(True Negatives,真负例):实际为负例,且被模型正确预测为负例的样本数

例如对苹果和橙子的预测

实际情况模型预测分析
苹果 (Positive)预测为苹果 (TP)检测器正确预测为苹果
苹果 (Positive)预测为橙子 (FN)检测器错误预测为橙子(漏检苹果)
橙子 (Negative)预测为苹果 (FP)检测器错误预测为苹果(误检橙子)
橙子 (Negative)预测为橙子 (TN)检测器正确预测为橙子。

详细分析

准确率

计算方法分析

\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}

判断随机检测的100个水果中,哪些水果被正确的分类,真实情况是40个苹果60个橙子,假如检测器的水果的预测结果为

  • 30 个苹果正确检测为苹果(TP = 30)
  • 10 个苹果被误检测为橙子(FN = 10)
  • 5 个橙子被误检测为苹果(FP = 5)
  • 55 个橙子正确检测为橙子(TN = 55)

\text{Accuracy} = \frac{30 + 55}{30 + 55 + 5 + 10} = \frac{85}{100} = 85\%

优缺点分析

  • 优点
    • 直观简单,可以看出其整体性能如何,适合在类别分布均衡的情况下使用
    • 该模型在苹果和橙子数量差不多的情况下,可以很好的反应模型的性能
  • 缺点
    • 假如95个橙子和5个苹果,那么就会总是预测出橙子,那么假如此时的情况如下
      • TP = 0(所有苹果都预测为橙子)
      • TN = 95(所有橙子都预测正确)
      • FP = 0(没有误检橙子为苹果
      • FN = 5(所有苹果都被漏检)
    • 此时的准确率高达95%,但是检测器完全没有正确识别苹果,所以不可以判定该模型是好的

精确率

计算方法分析

\text{Precision} = \frac{TP}{TP + FP}

假如对于包裹的分析,总共有100个包裹,20个有违禁品(正例),80个不含违禁品(反例),此时模型预测结果如下

  • 预测了 15 个包裹含有违禁品,其中:
    • 10 个是实际违禁品(TP = 10)
    • 5 个是误判的(FP = 5)
  • 剩余的 85 个包裹被预测为正常包裹,其中:
    • 10 个是实际违禁品,但被误判为正常包裹(FN = 10)
    • 75 个是实际正常包裹(TN = 75)

\text{Precision} = \frac{10}{10 + 5} = 0.6667 \ (66.67\%)

优缺点分析 

  • 优点
    • 精确度可以避免普通包裹的误报也就是减少FP,高精确率意味着系统标记为违禁品的包裹,大部分确实是违禁品
  • 缺点
    • 精确率 忽略了实际违禁品中未被识别出来的包裹(FN = 10)。如果只看精确率,这种漏检的情况不会被体现

召回率

计算分析

\text{Recall} = \frac{TP}{TP + FN}

继续接着上述检测包裹的例子计算,那么此时的召回率是

\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{10}{10 + 10} = 0.5 \, (50\%)

优缺点分析

  • 优点
    • 减少漏检(FN):召回率关注模型是否漏掉正例(FN)。高召回率意味着模型捕获了大多数正例
    • 适用于需要高召回率的任务:如癌症筛查或安全检测,FN 会带来严重后果
  • 缺点
    • 忽略误报(FP):召回率不关注误报(FP),可能导致模型过于激进地预测正例,从而产生较多假正例

F1-Score

分析

F1 = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}

技术上述对于包裹的检测,那么可以计算出f1为

 \text{F1-Score} = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}} = 2 \cdot \frac{0.6667 \cdot 0.5}{0.6667 + 0.5} = 0.5714 \, (57.14\%)

分类评估

二分类评估

事例说明

例如分析信用卡欺诈行为,真实情况是30笔交易欺诈(正例),70笔交易实正常(反例),那么模型的预测结果如下

  • 预测为欺诈交易的有 40 笔
    • 25 笔为真正的欺诈交易(TP = 25)
    • 15 笔为误报(FP = 15)
  • 预测为正常交易的有 60 笔
    • 5 笔是被漏检的欺诈交易(FN = 5)
    • 55 笔为正确的正常交易(TN = 55)

\text{Accuracy} = \frac{\text{TP} + \text{TN}}{\text{TP} + \text{TN} + \text{FP} + \text{FN}} = \frac{25 + 55}{25 + 55 + 15 + 5} = 80\%

\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}} = \frac{25}{25 + 15} = 62.5\%

\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}} = \frac{25}{25 + 5} = 83.33\%

\text{F1-Score} = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}} = 2 \cdot \frac{0.625 \cdot 0.8333}{0.625 + 0.8333} \approx 71.43\%

多分类评估

例如篮球、鸡、人中的事例,总图片4776张

  • 人的图片数:1748
  • 鸡的图片数:1558
  • 球的图片数:1473

注:截图来源于“炮哥带你学”

\text{Accuracy} = \frac{1494 + 1244 + 1126}{1748 + 1558 + 1473}

\text{Precision} = \frac{1494}{1494 + 195 + 223} = \frac{1494}{1912}

针对人进行计算

\text{Recall} = \frac{1494}{1494 + 119 + 135} = \frac{1494}{1748}

F1 = 2 \cdot \frac{78.13 \cdot 85.46}{78.13 + 85.46}

针对鸡计算

\text{Precision} = \frac{1244}{1244 + 119 + 124} = \frac{1244}{1487}

目标检测评估

计算回顾

交并比IOU

置信度

  • 存在性得分:预测框中是否存在目标的概率。
  • 类别得分:预测框中目标属于某一类别的概率。

目标检测分析图

归一化的混淆矩阵

主要用于显示 真实类别(True Label)预测类别(Predicted Label) 之间的对应关系

  • 颜色深浅:越接近深蓝色(值越接近 1.00),说明对应的预测和真实类别高度匹配(高准确性);浅色(值接近 0.00)表示预测和真实类别的重合度较低
  • 对角线:表示预测类别与真实类别完全一致的情况;理论上越接近1那么识别的效果越好
  • 非对角线
    • 表示预测错误的情况,即预测类别与真实类别不一致
    • 值越大,说明模型在该类别上存在明显误分类
  • 特殊类别(注意)
    • Background FN:真实是背景区域,但被误分类为某个目标类别(漏检)
    • Background FP:模型误将背景区域预测为目标类别(误报)

F1-Score 与 Confidence 阈值关系图

分析

  • 横轴置信度
    • 低阈值(靠近 0): 模型几乎会将所有预测框保留下来,包括低质量预测框
    • 高阈值(靠近 1): 模型只保留置信度非常高的预测框,从而减少假阳性(FP)
  • 纵轴:F1-Score
    • 值越高,表示模型在当前置信度下的精确率和召回率平衡得越好
    • 值越低,表示模型的预测质量较差,要么漏检过多(低召回率),要么误检过多(低精确率)

精确率与置信度关系图

分析

  • 横轴置信度
    • 低阈值(靠近 0): 模型几乎会将所有预测框保留下来,包括低质量预测框
    • 高阈值(靠近 1): 模型只保留置信度非常高的预测框,从而减少假阳性(FP)
  • 纵轴:Precision(精确率)
    • 衡量模型预测为正例的样本中,有多少是正确的
    • 值越高,表示模型预测为正例的置信度越高、准确性越好

Precision-Recall 曲线

分析

理想的目标检测模型希望在 高 Recall 的同时保持 高 Precision,即曲线尽可能靠近右上角

  • 横轴:Recall(召回率)
    • 值越高,说明模型能够捕获更多的正例(漏检较少)
    • 横轴从 0 到 1,表示召回率从低到高
  • 纵轴:Precision(精确率)
    • 值越高,说明模型预测为正例的准确性越高(误报较少)
    • 纵轴从 0 到 1,表示精确率从低到高

召回于置信度关系图

分析

 类似超时摄像头捕捉顾客行为,目标是捕捉所有顾客(即召回率高),并且准确地识别出每个人(即精确率高)

  • 置信度:摄像头对捕捉到的画面有一个“清晰度分数”(类似置信度),分数越高,表示画面越清晰
    • 低置信度(靠近 0.0): 模型会保留几乎所有预测框,包括高置信度和低置信度的预测框
    • 高置信度(靠近 1.0): 模型仅保留置信度很高的预测框,预测结果更加“谨慎”
  • 召回率:摄像头对所有经过的顾客都能记录下来
    • 值越高,说明模型能够捕获更多的正例(漏检少)
    • 值为 1.0 时,表示模型捕获了所有的真实正例,没有漏检

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/942780.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS NEXT 的技术发展和市场趋势:打造1+8+N的万物互联新世界

随着5G、AI、物联网等技术的飞速发展,全球智能设备和操作系统的竞争也日益激烈。在这一背景下,华为推出的HarmonyOS NEXT正逐渐成为智能设备生态中一个重要的参与者,其独特的18N战略布局以及跨设备、跨平台的互联互通理念,正在塑造…

免费 IP 归属地接口

免费GEOIP,查询IP信息,支持IPV4 IPV6 ,包含国家地理位置,维度,asm,邮编 等,例如 例如查询1.1.1.1 http://geoip.91hu.top/?ip1.1.1.1 返回json 对象

以太网通信--读取物理层PHY芯片的状态

PHY芯片通过MDIO接口进行读写,框图如下所示: 原理很简单,就是按照时序将PHY芯片的指定寄存器信息读出或者写入。 MDC时钟需要输出到PHY芯片,一般不低于80MHz。 MDIO是双向接口,FPGA读出状态信息时为输入,FP…

Docker服务发现新纪元:探索Consul的无限魅力

作者简介:我是团团儿,是一名专注于云计算领域的专业创作者,感谢大家的关注 •座右铭: 云端筑梦,数据为翼,探索无限可能,引领云计算新纪元个人主页:团儿.-CSDN博客 目录 前言&…

OpenHarmony-6.IPC/RPC组件

IPC/RPC组件机制 1.基本概念 IPC:设备内的进程间通信(Inter-Process Communication)。 RPC:设备间的进程间通信(Remote Procedure Call)。 IPC/RPC用于实现跨进程通信,不同的是前者使用Binder驱…

0.机顶盒晶晨s905l3b芯片--刷入第三方系统+安卓9 root教程+armbian写入EMMC教程

机顶盒s905l3b芯片刷第三方系统安卓9 root教程刷armbian写入EMMC教程 声明: 由于固件、软件、镜像等持续更新,本文仅代表当前所使用版本的流畅安装记录。行文略长,关键代码处会配以截图展示,请自行对比是否存在差异导致安装失败…

视频监控平台:Liveweb视频汇聚融合平台智慧安防视频监控应用方案

Liveweb是一款功能强大、灵活部署的安防视频监控平台,支持多种主流标准协议,包括GB28181、RTSP/Onvif、RTMP等,同时兼容海康Ehome、海大宇等厂家的私有协议和SDK接入。该平台不仅提供传统安防监控功能,还支持接入AI智能分析&#…

汇编语言学习

想要理解栈溢出的最基本原理,汇编和栈是必不可少的,不然想我之前学了也是白学,原理都不知道 一、准备 1.安装gcc sudo apt-get build-dep gcc 这里显示版本不对,我用的是国内镜像源,需要换一下配置 sudo nano /e…

“乡村探索者”:村旅游网站的移动应用开发

3.1 可行性分析 从三个不同的角度来分析,确保开发成功的前提是有可行性分析,只有进行提前分析,符合程序开发流程才不至于开发过程的中断。 3.1.1 技术可行性 在技术实现层次,分析了好几种技术实现方法,并且都有对应的成…

Python + 深度学习从 0 到 1(02 / 99)

希望对你有帮助呀!!💜💜 如有更好理解的思路,欢迎大家留言补充 ~ 一起加油叭 💦 欢迎关注、订阅专栏 【深度学习从 0 到 1】谢谢你的支持! ⭐ Keras 快速入门: 神经网络的基本数据结…

MySQL用户授权

什么是数据库 数据库概述:数据库是按照一定的数据结构将数据存储在存储器的集合常见数据库软件 软件名开源跨平台厂 商Oracle否是甲骨文MySQL是是甲骨文SQL Server否否微软DB2否是IBMMongoDB是是MongoDB Inc.Redis是是开源软件Memcached是是开源软件 DB (DataBas…

2025年我国网络安全发展形势展望

展望2025年,我国网络安全产业有望迎来新的快速增长阶段,零信任安全架构将在各行各业加快应用落地,数据安全技术攻关和应用进程加快,关键基础设施安全能力不断提升。同时,也应关注国家级网络对抗风险加剧、网络安全产业…

GitPuk安装配置指南

GitPuk是一款开源免费的代码管理工具,上篇文章已经介绍了Gitpuk的功能与优势,这篇文章将为大家讲解如何快速安装和配置GitPuk,助力你快速的启动GitPuk管理代码 1. 安装 支持 Windows、Mac、Linux、docker 等操作系统。 1.1 Windows安装 下载…

ArcGIS+MIKE21 洪水淹没分析、溃坝分析,洪水淹没动态效果

洪水淹没分析过程: 一、所需数据: 1.分析区域DEM数据 二、ArcGIS软件 1.提取分析区域DEM(水库坝下区域) 2.DEM栅格转点 3.计算转换后几何点的x和y坐标值(精度20、小数位3) 4.导出属性表,形式…

中伟视界:AI识别摄像头+AI预警平台在矿山皮带空载监测中的应用

在矿山开采和矿物处理过程中,皮带运输机扮演着举足轻重的角色。它们负责将矿石、煤炭等物料从一处运送到另一处,是矿山生产流程中不可或缺的一环。然而,皮带运输机在运行过程中也面临着一些挑战,其中之一便是皮带空载问题。皮带空…

探索多模态大语言模型(MLLMs)的推理能力

探索多模态大语言模型(MLLMs)的推理能力 Multimodal Large Language Models (MLLMs) flyfish 原文:Exploring the Reasoning Abilities of Multimodal Large Language Models (MLLMs): A Comprehensive Survey on Emerging Trends in Mult…

AIGC时代:如何快速搞定Spring Boot+Vue全栈开发

文章目录 一、Spring Boot基础二、Vue.js基础三、Spring Boot与Vue.js集成四、性能优化与最佳实践《快速搞定Spring BootVue全栈开发》内容简介作者简介目录前言/序言本书内容本书特点读者对象 随着人工智能生成内容(AIGC)技术的迅速发展,内容…

mongodb和Cassandra

mongodb的一致性问题: 15.MongoDB的一致性(读关注与写关注)_mongo w选项-CSDN博客 孤儿节点问题: 技术干货 | MongoDB 偶遇孤儿文档及处理方法-腾讯云开发者社区-腾讯云 分片集群MongoDB迁移前清除孤儿文档 由数据迁移至MongoDB导致的数据不一致问题…

nginx-rtmp服务器搭建

音视频服务器搭建 本文采用 nginx/1.18.0和nginx-rtmp-module模块源代码搭建RTMP流媒体服务器 流程 查看当前服务器的nginx版本下载nginx和nginx-rtmp-module源代码重新编译nginx,并进行相关配置(nginx.conf、防火墙等)客户端测试连接测试搭…

初始 ShellJS:一个 Node.js 命令行工具集合

一. 前言 Node.js 丰富的生态能赋予我们更强的能力,对于前端工程师来说,使用 Node.js 来编写复杂的 npm script 具有明显的 2 个优势:首先,编写简单的工具脚本对前端工程师来说额外的学习成本很低甚至可以忽略不计,其…