本文重点
在目标检测领域,当模型预测出多个候选框(bounding boxes)时,我们需要一种方法来确定哪些候选框最有可能表示真实的目标。由于模型的不完美性和图像中目标的重叠性,往往会有多个候选框对应于同一个目标。此时,极大值抑制(Non-Maximum Suppression,NMS)技术就显得尤为重要。
目标检测算法
使用19*19的网络对图片进行处理
首先我们应该知道,一个目标对象应该只有一个中心点,所以即使19*19的格子比较密集,那么这个中心点也应该在某一个小格子中。所以当我们传入神经网络一个未知的样本的时候,理论上应该只有一个格子做出有车的预测y=1。但是实际上一辆车上有可能多个格子都会预测出有车y=1,比如:
首先这个 19×19 网格上执行一下算法,你会得到 19×19*5的输出尺寸。每一个输出结果为: