一、YOLO的输入参数介绍
打标签后会生成一系列参数,包含:
置信度、预测框的位置(中心点的位置、高度宽度)、类别(标签1、标签2、标签3......)
二、处理图像和标签
首先YOLO会把图像均分为19*19个格子 ,然后用分类和定位算法,逐一的对每一个格子进行查看,也就是通过外标签看他们的参数值是多少(每个框都会有一系列参数)。如果Pc(置信度)是0,那也就说明这些格子不重要因为没有标记到。YOLO就是把所标注的中心点(注意是中心点)的格子在哪,就把信息分配到哪些格子里面。
最开始标注的时候是相对于整个图片,在处理时就相对于每个格子。处理完后就会得到19*19*8的参数(8是一个格子的参数种类数)。
相当于把原本的图片x通过CNN、卷积层等各种处理转化成所需要的参数值。
三、检测
输入图片,得到参数
交并比IOU(交集比上并集)>=0.5 来判断是否准确
非极大值抑制,每个格子都有置信度,算法会规定这个值大于多少,之后才能画框
比如右边0.9的框,会求交并比,筛除重复的框: