作者简介:giszz,腾讯云人工智能从业者TCA认证,信息系统项目管理师。
博客地址:https://giszz.blog.csdn.net
声明:本学习笔记来自腾讯云人工智能课程,叠加作者查阅的背景资料、延伸阅读信息,及学习心得理解等。仅供学习使用,请勿转载,如有争议,请联系博主。
笔记思维脑图已上传,有需要的朋友可到博主首页——下载,自行获取。
模型检测原理
先来看模型检测的2个原理。
我们为实现目标检测任务的有效特征识别,构建一个含有多隐藏层的前馈神经网络。
前馈神经网络-最简单的神经网络,也叫做多层感知机。
学习的是神经元中的权重参数,可以看到面模型有效的提取出输入图像的特征信息。
在本案例中,使用了知名的YOLO模型。
YOLO模型(You Only Look Once)是一种先进的目标检测算法,它将目标检测任务作为一个回归问题来解决,只需一次查看即可完成目标的定位和分类。与传统的目标检测方法相比,YOLO具有更快的速度和更高的准确率,因此在计算机视觉领域得到了广泛应用。
YOLO模型的作用是在输入的图像中检测出目标对象的位置和类别。它通过将图像划分为一个SxS的网格,每个网格负责预测B个边界框(bounding boxes)以及这些边界框中包含的对象的类别概率。每个边界框都包含5个预测值:x, y, w, h和置信度,其中(x, y)表示边界框的中心坐标,(w, h)表示边界框的宽度和高度,置信度表示该边界框中包含对象的可能性。
YOLO模型采用单个神经网络来实现目标检测,这使得它的速度非常快。由于它将目标检测作为一个回归问题来解决,因此只需要一次前向传播就可以得到所有目标的位置和类别信息。此外,YOLO还采用了多尺度特征融合的策略,使得模型能够更好地处理不同大小的目标对象。
总的来说,YOLO模型是一种高效、准确的目标检测算法,它可以快速地检测出图像中的目标对象,并给出它们的位置和类别信息。这使得它在许多计算机视觉任务中都非常有用,如自动驾驶、智能安防、人脸识别等。同时,由于YOLO模型具有简单、易于实现和优化的特点,它也成为了许多研究者和开发者的首选目标检测算法之一。
需要注意的是,虽然YOLO模型在目标检测任务中取得了很好的效果,但它仍然存在一些局限性,如对小目标检测效果不佳、对密集目标的检测性能有待提高等。因此,在实际应用中需要根据具体任务需求来选择合适的目标检测算法。
第二种方法。
本方法中,将原图进行预处理,划分为若干窗口,例如上图中的416*416,针对图片特征,不断修正检测框的位置,提高分类算法的置信度。对检测结果不断的拟合,使差别越来越小。
训练过程
使用训练集进行训练,同步观察输出效果。
这里我们要学习2个特别重要的概念:准确率和召回率。
准确率:
准确率(Precision):在被识别为正类别的样本中,确实为正类别的比例是多少?把多少个真的挑出来了,垃圾邮件,真正值/(真正值+真假值)。
所谓真正值、真假值,前面的“真、假”,是实际结果。后面1个字的“真、假”,是检测结果。真正值,就是检测出来的结果是真的,真的正值。真假值,就是检测出是假的(没检测出来),但其实是这的。
垃圾邮件检测中,真假值,就是没有检测出来的垃圾邮件。就是说,我们有一些邮件,是垃圾邮件,但是我们没检测出来。这是我们在这个场景下,比较关心的。
召回率:
召回率(Recall):在所有正类别样本中,被正确识别为正类别的比例是多少?
挑出的真的,是否有假的,疾病检测(误诊),真正值/(真正值+假正值)。
找个最好理解的例子,就是癌症筛查,我们比较在意的是,你找出来的患者,有多少实际结果是假,就是健康人,被算法给误诊出来了。如上面的公式去理解。
延伸学习:
准确率和召回率是机器学习中常用的两个评估指标,主要用于分类问题,尤其是在信息检索、自然语言处理等领域。它们分别反映了分类器的不同性能特点。
- 准确率(Precision):准确率又称查准率,它是指分类器预测为正例的样本中,真正为正例的比例。简单来说,就是预测为正确的正样本占所有预测为正样本的比例。准确率的计算公式为:Precision = TP / (TP + FP),其中TP表示真正例(True Positive),即实际为正例且被预测为正例的样本数;FP表示假正例(False Positive),即实际为负例但被预测为正例的样本数。
- 召回率(Recall):召回率又称查全率,它是指所有真正的正例中被分类器正确预测出来的比例。简单来说,就是预测为正确的正样本占所有实际为正样本的比例。召回率的计算公式为:Recall = TP / (TP + FN),其中FN表示假反例(False Negative),即实际为正例但被预测为负例的样本数。
准确率和召回率的区别在于它们关注的角度不同:准确率更加关注预测结果中真正例的准确性,而召回率更加关注所有真正例中被预测出来的比例。在实际应用中,我们需要根据具体任务需求来选择合适的评估指标。例如,在垃圾邮件分类中,我们可能更加关注准确率,以避免将非垃圾邮件误判为垃圾邮件;而在疾病检测中,我们可能更加关注召回率,以确保尽可能多地检测出真正的病例。
计算准确率和召回率时,需要先得到分类器的预测结果和实际标签,然后根据上述公式进行计算。需要注意的是,在实际应用中,我们通常会使用测试集来评估分类器的性能,以避免过拟合等问题。同时,还可以使用混淆矩阵、ROC曲线等其他评估指标来更全面地评估分类器的性能。
上面再次详细的描述,就好理解多了。
(待续,欢迎关注。)