人脸识别——Webface-OCC遮挡人脸识别算法解析

1. 概述

自2019年被誉为人脸识别技术的元年,各地纷纷引入这项技术。然而,自2020年起,为了抵御冠状病毒(COVID-19)的全球传播,人们普遍开始佩戴口罩。众所周知,现有人脸识别模型在面对遮挡物(如口罩)时,其识别精度会显著下降。这一现象的主要原因在于,现有数据集往往没有充分考虑遮挡因素。

目前,尚未有一个公开的数据集能够全面考虑人脸识别中的遮挡问题。尽管已有一些研究提出了针对遮挡感知的人脸识别模型,包括对面具和太阳镜的识别,但这些研究大多是基于自行构建的数据集。然而,这些自行构建的数据集与现实情况存在较大差异,因此其有效性受到限制。

例如,(a) 展示了2016年报道的MaskNet所使用的数据集样本。该数据集通过随机应用不同尺寸的黑色遮罩来模拟遮挡。然而,这种单一的遮挡类型预计会降低模型的泛化能力。此外,考虑到实际应用场景,这种咬合(遮挡)方式显得并不自然。

(b) 展示了2019年报道的成对差分连体网络(PDSN)所使用的三个数据集样本。这里提供了三种不同的遮挡类型,与(a)相比,遮挡类型的多样性有所增加。但是,从实际应用的角度来看,遮挡的位置和大小仍然不够自然。

© 展示了2020年报告的wID所使用的数据集样本。在这个数据集中,人脸图像被随机应用了方形框作为遮挡。尽管采用了综合方法,但这种方法仍然无法很好地适应实际条件。

近年来,使用生成对抗网络(GANs)的方法受到了广泛关注,因为它们能够生成视觉上更自然的遮挡图像。然而,这些图像在细节信息上的变化可能导致在这些图像上训练的人脸识别模型在实际应用中表现不佳。

因此,尽管目前已有一些考虑遮挡的数据集,但它们大多数与现实情况相去甚远。

为了改善这一状况,本文提出了一个新的公共遮挡感知数据集——Webface-OCC。(d) 展示了Webface-OCC的样本数据。该数据集包含10,575个不同主体的804,704张面部图像,涵盖了各种遮挡类型,有望为人脸识别技术的发展提供更贴近实际的支持。


论文地址:https://arxiv.org/abs/2103.02805
源码地址:https://github.com/Baojin-Huang/Webface-OCC

2. Webface-OCC

Webface-OCC是基于广泛使用的CASIA-Webface人脸识别数据集构建的。CASIA-Webface数据集包含了轻微遮挡的人脸图像,使得在该数据集上训练的人脸识别模型在小遮挡情况下表现出色。

为了进一步提升模型在遮挡条件下的表现,我们对CASIA-Webface进行了增强,创建了全新的Webface-OCC数据集。这一改进对于提高模型在面对遮挡时的人脸识别性能具有显著帮助。

以下是Webface-OCC数据集的示例。与以往使用方块随机遮挡人脸的方法不同,我们在Webface-OCC中采用了口罩和太阳镜等更符合实际情境的遮挡物,这些是人们在日常生活中经常遇到的。

Webface-OCC提供了多种类型的(a)纹理/颜色和(b)口罩/太阳镜,具体如下所示。然后,我们从未经遮挡的正常图像中提取了面部特征点。

接下来,利用这些面部特征点,我们通过精确地将口罩映射到覆盖口鼻区域,将太阳镜映射到覆盖眼睛区域,并调整它们的角度和大小,生成了一系列带有遮挡的人脸图像。

通过这种方式,我们增加了数据集的多样性,使得数据集包含了多种遮挡类型的组合。最终,Webface-OCC数据集包含了10,575个不同个体的804,704张人脸图像。
此外,数据集中每个ID都包含了正常和遮挡状态下的人脸图像,且两者数量相等,如下所示。

3.测试实验

Webface-OCC训练的模型在两种不同情境下进行了评估:

  1. 一般人脸识别:使用了Labeled Faces in the Wild (LFW)、Celebrity Frontal-Profile in the Wild (CFP-FP) 和 AgeDB-30 数据集进行评估。
  2. 遮挡人脸识别:使用了最新提出的LFW-mask、CFP-FP-mask、AgeDB-30-mask 和 Real-World Masked Face Dataset (RMFRD) 进行评估。

LFW-mask、CFP-FP-mask 和 AgeDB-30-mask 是在原始数据集的基础上添加了遮挡物,这些数据集在图像数量和比例上与原始数据集保持一致,没有变化。

评估所用的模型基于六种具有代表性的人脸识别架构:CenterFace、SphereFace、FaceNet、CosFace、ArcFace 和 MaskNet。特别地,FaceNet 和 ArcFace 还在 WiderFace 数据集上进行了重新训练,以进一步验证其性能。

评估结果显示,由于人脸方向和年龄差异的影响,CFP-FP 和 AgeDB-30 的准确率显著低于 LFW。然而,使用 Webface-OCC 训练的模型与原始模型相比,准确率仅下降了大约 1%,表明这些模型在一般人脸识别数据集上的整体表现仍然较高。

模型性能比较图

此外,重新训练的模型(特别是 FaceNet 和 ArcFace)在性能上明显优于原始模型。例如,ArcFace 在四个遮挡人脸识别数据集(LFW-mask、CFP-FP-mask、AgeDB-30-mask 和 RMFRD)上的准确率比原始模型分别提高了 36.22%、29.14%、27.04% 和 15.03%。

换言之,重新训练的模型在显著提升对遮挡人脸识别数据集的性能的同时,保持了对一般人脸识别数据集的高准确率。

与模拟遮挡的人脸识别数据集(LFW-mask、CFP-FP-FP-mask 和 AgeDB-30-mask)相比,真实遮挡的人脸识别数据集(RMFRD)的识别精度较低。这可能是由于 RMFRD 中遮挡物的未知性,或者是因为被试者是公众人物,他们可能会故意伪装,以隐藏自己的身份。

4.总结

本文介绍了一个新的公共数据集,专为闭塞感知人脸识别而设计。与传统的合成遮挡方法相比,我们采用了一种创新的面部特征点映射技术来合成遮挡物,这种方法更贴近现实世界的应用场景。我们提出了一种综合的遮挡合成方法,它能够更真实地模拟实际中的遮挡情况。

通过将此方法应用于现有的Webface数据集,我们成功构建了一个包含大规模遮挡图像的公共数据集。此外,我们在该数据集上对ArcFace模型进行了重新训练,结果表明,重新训练后的模型在LFW-Mask和RMFRD数据集上分别达到了97.08%和78.25%的高准确率。

据NIST等多个国际权威机构的报告,传统人脸识别模型在口罩遮挡下的准确率会有显著下降。我们预计,Webface-OCC的推出将为人脸识别领域带来一个规模更大、更多样化、更精确的遮挡人脸识别数据集,从而显著提升人脸识别模型的准确性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/655077.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

关于Windows中桌面窗口管理器的知识,看这篇文章就可以了

序言 你打开了任务管理器,发现了一个叫做“桌面窗口管理器”的东西,它是恶意软件吗?它应该在任务管理器吗?如果它应该在那里,它的作用什么?以下是你需要了解的所有信息。 什么是桌面窗口管理器 Desktop Window Manager(dwm.exe)是一个合成窗口管理器,可以在Windows…

【Docker|漏洞】Docker api未授权导致rce

一、漏洞描述 扫描出http://ip地址:4243漏洞,该漏洞可通过Docker pai未授权访问可以直接执行命令,获取服务器权限。 二、解决方案 禁用Docker api远程访问功能,或者通过安全授权等方式限制其使用权限。升级duoker至最新版本。 三、漏洞排查…

速度百倍提升,高性能 Python 编译器 Codon 火了

引言 在当下的编程世界里,Python由于其易用性和强大的库支持在数据科学、人工智能和网页开发等多个领域占据着举足轻重的地位。然而,Python的执行速度往往成为开发者的一大痛点。 针对 这一问题,Codon项目正试图提供一个高效的解决方案。Codo…

中科驭数驭云、超低时延网络案例双双入选第七届数字中国建设峰会数字化转型典型应用案例

5月24日-25日,第七届数字中国建设峰会在福州召开。在“数字赋能民营经济专业工作会议”上,中关村云计算产业联盟发布了《2024中小企业数字化转型典型应用案例集》,中科驭数驭云、超低时延网络两大方案入选。 作为国内领先的DPU芯片及解决方案…

java第十七课 —— 递归

方法递归调用 递归就是方法自己调用自己,每次调用时传入不同的变量,递归有助于编程者解决复杂问题,同时可以让代码变得简洁。 递归重要规则 执行一个方法时,就创建一个新的受保护的独立空间(栈空间)。方…

【openlayers系统学习】3.3假彩色图像合成(三个波段合成假彩色图像)

三、假彩色图像合成 在上一步中,我们使用 ol/source/GeoTIFF​ 源从单个多波段源(具有红色、绿色、蓝色和Alpha波段)渲染真彩色图像。在下面这个例子中,我们将从可见光谱之外提取数据,并使用它来呈现假彩色合成。 我…

快消终端门店真实性新玩法:全流程校验+多元认证多重保障

在某饮品企业会议室,气氛凝重。城市经理一脸严肃地扫视着团队成员,小李、小张和小陈等人在这锐利的目光下显得有些局促不安。 城市经理沉声开口:小李上报的“幸福超市”’新店在XX大街上并不存在。这是怎么回事? 小李支吾着回答…

javaIO流知识点概况

一、前言: 1.1.流的概念: java将输入与输出比喻为"流",英文:Stream. 就像生活中的"电流","水流"一样,它是以同一个方向顺序移动的过程.只不过这里流动的是字节(2进制数据).所以在IO中有输入流和输出流之分,我们理解他们…

【RabbitMQ】使用SpringAMQP的Publish/Subscribe(发布/订阅)

Publish/Subscribe **发布(Publish)、订阅(Subscribe):**允许将同一个消息发送给多个消费者 **注意:**exchange负责消息路由,而不是存储,路由失败则消息丢失 常见的**X(exchange–交换机)***类型: Fanout 广播Direc…

SPP/BLE蓝牙双模方案,主从一体,串口速率可达85KB/S

MS-BTD020A是一款蓝牙5.0双模数传模块,支持SPP(经典蓝牙)和BLE(低功耗蓝牙)。蓝牙双模技术使其能够在传统蓝牙和低功耗蓝牙之间无缝切换,用户只需要进行简单的设置就可以实现串口与手机之间的无线传输。模块…

【每日一坑】KiCAD 覆铜区域约束

【每日一坑】 1.螺丝孔周围不想要要铜皮; 2、首先在CTRLshiftK;画一个区域,比如铺一个GND; 3、选择CUTOUT; 4、画线,画好闭合图形;如下图 5、就是这样了,就是还没有画圆或者异形的;

Scikit-Learn随机森林

Scikit-Learn随机森林 1、随机森林1.1、集成学习1.2、Bagging方法1.3、随机森林算法1.4、随机森林的优缺点2、Scikit-Learn随机森林回归2.1、Scikit-Learn随机森林回归API2.2、随机森林回归实践(加州房价预测)1、随机森林 随机森林是一种由决策树构成的集成算法,它在大多情况…

香橙派 AiPro通过Micro USB接口进行串口调试

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、配置步骤1.安装CH343驱动2.配置串口参数 二、使用步骤总结 前言 最近在玩一个新玩具香橙派 AiPro,除了通过SSH方式连接开发板以外,…

Llama模型家族训练奖励模型Reward Model技术及代码实战(二)从用户反馈构建比较数据集

LlaMA 3 系列博客 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 LangGraph 在windows本地部署大模型 (三) 基于 LlaMA…

设计模式:外观模式 导诊台。空指针异常

文章目录 UML类图目录结构思路Register.javaOutpatientService.javaPrice.javaPharmacy.javaFacade.java空指针异常 Test.java UML类图 目录结构 思路 照着写,然后getRegister()方法的具体实现就是:打印一句话,然后到…

服务器端口查询:一项至关重要的网络管理任务

在网络管理和系统维护中,服务器端口查询是一项至关重要的任务。服务器端口是网络通信的入口点,它们允许各种服务和应用程序在网络上进行交互。因此,准确而有效地查询服务器端口的状态和配置对于确保网络的安全性和稳定性至关重要。 首先&…

floodfill 算法(上)

目录 图像渲染 题意: 题解: 非递归: 递归: 岛屿数量 题解: 非递归: 递归: 岛屿的最大面积 题解: 非递归: 递归: 被围绕的区域 题解&#xff1a…

10G SFP双口万兆以太网控制器,高速光口网络接口卡

2-Port 10G SFP NIC 是一款高速网 络接口卡,采用了 PCI Express 3.0 x8 接口,支持双 端口万兆以太网,具有高性能、高可靠性、低功耗等 优点,是数据中心、云计算、虚拟化等领域的理想选 择。 支持多种网络协议,如 …

爱岗敬业短视频:成都科成博通文化传媒公司

爱岗敬业短视频:传递正能量,塑造职场新风尚 在当今社会,短视频以其独特的传播方式和广泛的受众群体,成为了信息传播的重要渠道。在众多短视频内容中,以“爱岗敬业”为主题的短视频尤为引人注目,成都科成博…

云衔科技:为什么推荐使用zoho crm客户管理系统?

在当今快速变化的商业环境中,企业对高效、智能化的客户关系管理(CRM)系统的需求日益增长。Zoho CRM,作为全球领先的企业级CRM解决方案提供商,凭借其全面的功能、高度的可定制性、以及无缝集成的生态系统,成…