1 介绍
S3FD是一个实时人脸检测器,这篇论文的主要思想是试图解决一个常见的问题,即基于anchor(锚点)的检测器随着人脸变小而急剧恶化。
-
基于锚点的目标检测方法是通过对一系列预设锚点进行分类和回归来检测目标的,这些锚点是通过在图像上有规律地平铺一组不同尺度和宽高比的方框而产生的。这些锚点与一个或几个卷积层相关联,其空间大小和步幅大小分别决定了锚点的位置和间隔。将锚相关层进行卷积以对相应的锚进行分类和对齐。与其他方法相比,基于锚点的检测方法在复杂场景下具有更强的鲁棒性,且检测速度不受目标数量的影响。然而,随着目标变小,基于锚点的探测器的性能急剧下降。
-
作者认为,性能下降的主要原因在于:
-
1、基于锚点的检测框架容易忽略中小人脸。首先,最低锚关联层的步长太大(例如8像素、16像素),因此中小人脸在这些层上被高度挤压,可供检测的特征很少,如图1(a)。其次,小脸、锚定尺度和感受野是相互不匹配的:锚定尺度与感受野不匹配,两者都太大而无法适应小脸,见图1(b)。
-
2、锚匹配策略。在基于锚点的检测框架中,锚点尺度是离散的(如16、32、64、128、256、512),而人脸尺度是连续的。因此,那些尺度分布远离锚点尺度的人脸无法匹配足够的锚点,如图1(c
-