滑动窗口的卷积的问题
滑动窗口的卷积实现效率很高,但是它依然不能够输出最精准的边界框,比如下面所示:
我们可以看到蓝色框不论在什么位置都不能很好的确定车的位置,有一个算法是YOLO 算法它能够帮助我们解决这个问题。
YOLO 算法
比如我们的输入图像是100*100,我们会在图像上放一个网格。这个网络要用比较精细的,比如19*19,但是为了讲解方便,我们使用3*3的网格
比如本张图像就被分成了九个小格子了。然后我们使用图像分类和定位算法应用到每一个小格子上,也就是我们将每一个小格子看成是一个样本,对每一个小格子都应用图像分类定位算法,具体来说就是1、2、3、7、8、9样本的标签是这样的
而5格子是有一点争议的,因为看起来6的车有一点在5位置,为了让图片中的目标只属于一个格子,yolo算法规定目标的中心点在哪个格子,那么这个物体就属于哪个格子,很明显6中的那个白车目标的中心点在6中,所以我们认为白车在6中,而5中什么都没有,所以5的标签也是