【大厂AI课学习笔记NO.55】2.3深度学习开发任务实例(8)模型训练

作者简介:giszz,腾讯云人工智能从业者TCA认证,信息系统项目管理师。

博客地址:https://giszz.blog.csdn.net

声明:本学习笔记来自腾讯云人工智能课程,叠加作者查阅的背景资料、延伸阅读信息,及学习心得理解等。仅供学习使用,请勿转载,如有争议,请联系博主。

笔记思维脑图已上传,有需要的朋友可到博主首页——下载,自行获取。

模型检测原理

先来看模型检测的2个原理。

我们为实现目标检测任务的有效特征识别,构建一个含有多隐藏层的前馈神经网络。

前馈神经网络-最简单的神经网络,也叫做多层感知机。

学习的是神经元中的权重参数,可以看到面模型有效的提取出输入图像的特征信息。

 在本案例中,使用了知名的YOLO模型。

YOLO模型(You Only Look Once)是一种先进的目标检测算法,它将目标检测任务作为一个回归问题来解决,只需一次查看即可完成目标的定位和分类。与传统的目标检测方法相比,YOLO具有更快的速度和更高的准确率,因此在计算机视觉领域得到了广泛应用。

YOLO模型的作用是在输入的图像中检测出目标对象的位置和类别。它通过将图像划分为一个SxS的网格,每个网格负责预测B个边界框(bounding boxes)以及这些边界框中包含的对象的类别概率。每个边界框都包含5个预测值:x, y, w, h和置信度,其中(x, y)表示边界框的中心坐标,(w, h)表示边界框的宽度和高度,置信度表示该边界框中包含对象的可能性。

YOLO模型采用单个神经网络来实现目标检测,这使得它的速度非常快。由于它将目标检测作为一个回归问题来解决,因此只需要一次前向传播就可以得到所有目标的位置和类别信息。此外,YOLO还采用了多尺度特征融合的策略,使得模型能够更好地处理不同大小的目标对象。

总的来说,YOLO模型是一种高效、准确的目标检测算法,它可以快速地检测出图像中的目标对象,并给出它们的位置和类别信息。这使得它在许多计算机视觉任务中都非常有用,如自动驾驶、智能安防、人脸识别等。同时,由于YOLO模型具有简单、易于实现和优化的特点,它也成为了许多研究者和开发者的首选目标检测算法之一。

需要注意的是,虽然YOLO模型在目标检测任务中取得了很好的效果,但它仍然存在一些局限性,如对小目标检测效果不佳、对密集目标的检测性能有待提高等。因此,在实际应用中需要根据具体任务需求来选择合适的目标检测算法。

 第二种方法。

本方法中,将原图进行预处理,划分为若干窗口,例如上图中的416*416,针对图片特征,不断修正检测框的位置,提高分类算法的置信度。对检测结果不断的拟合,使差别越来越小。

训练过程

 使用训练集进行训练,同步观察输出效果。

 

这里我们要学习2个特别重要的概念:准确率和召回率。

准确率:

准确率(Precision):在被识别为正类别的样本中,确实为正类别的比例是多少?把多少个真的挑出来了,垃圾邮件,真正值/(真正值+真假值)。

所谓真正值、真假值,前面的“真、假”,是实际结果。后面1个字的“真、假”,是检测结果。真正值,就是检测出来的结果是真的,真的正值。真假值,就是检测出是假的(没检测出来),但其实是这的。

垃圾邮件检测中,真假值,就是没有检测出来的垃圾邮件。就是说,我们有一些邮件,是垃圾邮件,但是我们没检测出来。这是我们在这个场景下,比较关心的。

召回率:

召回率(Recall):在所有正类别样本中,被正确识别为正类别的比例是多少?

挑出的真的,是否有假的,疾病检测(误诊),真正值/(真正值+假正值)。

找个最好理解的例子,就是癌症筛查,我们比较在意的是,你找出来的患者,有多少实际结果是假,就是健康人,被算法给误诊出来了。如上面的公式去理解。

延伸学习:


准确率和召回率是机器学习中常用的两个评估指标,主要用于分类问题,尤其是在信息检索、自然语言处理等领域。它们分别反映了分类器的不同性能特点。

  1. 准确率(Precision):准确率又称查准率,它是指分类器预测为正例的样本中,真正为正例的比例。简单来说,就是预测为正确的正样本占所有预测为正样本的比例。准确率的计算公式为:Precision = TP / (TP + FP),其中TP表示真正例(True Positive),即实际为正例且被预测为正例的样本数;FP表示假正例(False Positive),即实际为负例但被预测为正例的样本数。
  2. 召回率(Recall):召回率又称查全率,它是指所有真正的正例中被分类器正确预测出来的比例。简单来说,就是预测为正确的正样本占所有实际为正样本的比例。召回率的计算公式为:Recall = TP / (TP + FN),其中FN表示假反例(False Negative),即实际为正例但被预测为负例的样本数。

准确率和召回率的区别在于它们关注的角度不同:准确率更加关注预测结果中真正例的准确性,而召回率更加关注所有真正例中被预测出来的比例。在实际应用中,我们需要根据具体任务需求来选择合适的评估指标。例如,在垃圾邮件分类中,我们可能更加关注准确率,以避免将非垃圾邮件误判为垃圾邮件;而在疾病检测中,我们可能更加关注召回率,以确保尽可能多地检测出真正的病例。

计算准确率和召回率时,需要先得到分类器的预测结果和实际标签,然后根据上述公式进行计算。需要注意的是,在实际应用中,我们通常会使用测试集来评估分类器的性能,以避免过拟合等问题。同时,还可以使用混淆矩阵、ROC曲线等其他评估指标来更全面地评估分类器的性能。

上面再次详细的描述,就好理解多了。

(待续,欢迎关注。)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/412135.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

CDQ分治详解,一维、二维、三维偏序

文章目录 零、偏序关系一、一维偏序二、二维偏序三、三维偏序(CDQ)3.1CDQ分治3.2CDQ分治解决三维偏序的流程 四、OJ练习4.1三维偏序模板题4.1.1原题链接4.1.2AC代码 4.2老C的任务4.2.1原题链接4.2.2解题思路4.2.3AC代码 4.3动态逆序对4.3.1原题链接4.3.2解题思路4.3.3AC代码 零…

C# 学习第二弹

一、变量 存储区(内存)中的一个存储单元 (一)变量的声明和初始化 1、声明变量——根据类型分配空间 ①声明变量的方式 —变量类型 变量名 数值; —变量类型 变量名; 变量名 数值; —变…

使用R语言进行主成分和因子分析

一、数据描述 数据来源2013年各地区水泥制造业规模以上企业的各主要经济指标,原始数据来源于2014年(《中国水泥统计年鉴》),试对用主成分和因子进行经济效益评价。 地区,企业个数(亿元),流动资产合计&…

python Matplotlib Tkinter-->最终框架一

3D雷达上位机实例(能够通过点击柱状图来展示3D雷达数据)2024.2.26 环境 python:python-3.12.0-amd64 包: matplotlib 3.8.2 pillow 10.1.0 import matplotlib.pyplot as plt from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg, NavigationToolbar2Tk impor…

基于Springboot + Vue 母婴商城系统

末尾获取源码作者介绍:大家好,我是墨韵,本人4年开发经验,专注定制项目开发 更多项目:CSDN主页YAML墨韵 学如逆水行舟,不进则退。学习如赶路,不能慢一步。 目录 一、项目简介 二、开发技术与环…

基于Java SSM框架实现驾校预约管理系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现驾校预约管理系统演示 摘要 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身的优势,驾校预约管理系统当然也不能排除在外,随着网络市场的不断成熟,带动了驾校…

【BUG 记录】史诗级 BUG - MYSQL 删库删表却没有备份如何恢复数据

【BUG 记录】史诗级 BUG - MYSQL 删库删表却没有备份如何恢复数据 1. 问题描述2. 解决方案(binlog)2.1 构造测试环境2.2 查看 MySQL 环境是否开启 binlog2.3 查看所有的 binlog 日志记录2.4 查看当前正在使用的是哪一个 binlog 文件2.5 查看此时的 binlo…

设计并实现一个并发安全的LRU(Least Recently Used,最近最少使用)缓存结构

文章目录 前言实战演示写在最后 前言 相信很多人都使用过LinkedHashMap,LinkedHashMap中的removeEldestEntry可以删除老旧的元素,我们可以以此来实现一个LRU缓存结构,并结合java中JUC包中的各种多线程锁机制来保证多线程安全。 以下是我遇见…

C# OpenCvSharp DNN Yolov8-OBB 旋转目标检测

目录 效果 模型信息 项目 代码 下载 C# OpenCvSharp DNN Yolov8-OBB 旋转目标检测 效果 模型信息 Model Properties ------------------------- date:2024-02-26T08:38:44.171849 description:Ultralytics YOLOv8s-obb model trained on runs/DOT…

Windows常用协议

LLMNR 1. LLMNR 简介 链路本地多播名称解析(LLMNR)是一个基于域名系统(DNS)数据包格式的协议,可用于解析局域网中本地链路上的主机名称。它可以很好地支持IPv4和IPv6,是仅次于DNS 解析的名称解析协议。 2.LLMNR 解析过程 当本地hosts 和 DNS解析 当本地hosts 和 …

Linux浅学笔记04

目录 Linux实用操作 Linux系统下载软件 yum命令 apt systemctl命令 ln命令 日期和时区 IP地址 主机名 网络传输-下载和网络请求 ping命令 wget命令 curl命令 网络传输-端口 进程 ps 命令 关闭进程命令: 主机状态监控命令 磁盘信息监控&#xff1a…

2018-02-14 新闻内容爬虫【上学时做论文自己爬新闻数据,原谅我自己懒发的图片】

2018-02-14新闻内容爬虫【上学时做论文自己爬新闻数据,原谅我自己懒发的图片】资源-CSDN文库https://download.csdn.net/download/liuzhuchen/88878591爬虫过的站点: 1QQ新闻 1,准备爬取滚动新闻页面 2 通过F12 开发工具查找发现&#xff…

Qt项目:网络1

文章目录 项目:网路项目1:主机信息查询1.1 QHostInfo类和QNetworkInterface类1.2 主机信息查询项目实现 项目2:基于HTTP的网络应用程序2.1 项目中用到的函数详解2.2 主要源码 项目:网路 项目1:主机信息查询 使用QHostI…

SIMON 32/64加密电路的实现(System Verilog)

关于SIMON加密电路的原理,参考之前发布的博文【SIMON加密算法的原理】 1.总览与电路介绍 1.1 电路总体结构图 1.2 模式配置介绍 SIMON加密算法的分组长度、密钥长度以及必要的参数配置如下图: 本次需要实现的是SIMON 32/64,即分组长度2n3…

【数据结构】B树,B+树,B*树

文章目录 一、B树1.B树的定义2.B树的插入3.B树的中序遍历 二、B树和B*树1.B树的定义2.B树的插入3.B*树的定义4.B树系列总结 三、B树与B树的应用 一、B树 1.B树的定义 1. 在内存中搜索效率高的数据结构有AVL树,红黑树,哈希表等,但这是在内存…

Stable Diffusion 绘画入门教程(webui)-ControlNet(Shuffle)

Shuffle(随机洗牌),这个预处理器会把参考图的颜色打乱搅拌到一起,然后重新组合的方式重新生成一张图,可以想象出来这是一个整体风格控制的处理器。 那么问题来了,官方为啥会设计个这样的处理器呢,主要是给懒人用的&am…

Atcoder ABC341 E - Alternating String

Alternating String(交替字符串) 时间限制:3s 内存限制:1024MB 【原题地址】 所有图片源自Atcoder,题目译文源自脚本Atcoder Better! 点击此处跳转至原题 【问题描述】 【输入格式】 每个查询 q u e r y i query…

STM32存储左右互搏 QSPI总线FATS文件读写FLASH W25QXX

STM32存储左右互搏 QSPI总线FATS文件读写FLASH W25QXX FLASH是常用的一种非易失存储单元,W25QXX系列Flash有不同容量的型号,如W25Q64的容量为64Mbit,也就是8MByte。这里介绍STM32CUBEIDE开发平台HAL库Quad SPI总线实现FATS文件操作W25Q各型号…

Vue笔记(一)

常用指令 1.v-show与v-if底层原理的区别 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>创建一个V…

快速搭建宠物医院服务小程序的步骤,无需编程经验

如果你是一家宠物医院或者宠物服务机构&#xff0c;想要拥有一款方便用户预约、查询信息的小程序&#xff0c;那么乔拓云网提供的轻应用小程序是你的不二选择。下面将为你详细介绍如何轻松打造宠物医院服务小程序。 1. 进入乔拓云网后台&#xff0c;点击【轻应用小程序】中的【…