互联网场景下人脸服务基线方案总结

2.人脸服务引擎的基本原理

        本文档描述的人脸服务是基于现有的人脸引擎1910版本的基础进行二次开发完成的。整个服务主要分为两个模块:目标库的构建、网络视频中目标库人物的检索。

2.1 目标库的构建

根据互联网场景的实际需求,构建目标人物的底库。具体的需求包括:目标库创建、目标库删除、目标库新增图片文件、目标库信息查询、目标库删除图片文件。

目标库创建:创建一个目标库,用于存储目标人的注册人脸图片特征以及相对应的ID。

目标库删除:将创建好的目标库,进行删除。

目标库新增图片文件:若已经创建了目标库,并且有的新的目标人物,需要支持将新的目标人的注册到目标库当中。

目标库删除图片文件:若已经创建了目标库,并且发现其中部分的目标人物失效,需要支持将失效的目标人物从目标库中删除的操作。

2.2网络视频中目标库人物的检索方法

目标库建立完成之后,需要用目标库中的关键人在互联网视频中检索,目标库关键人物的检索的需求包括:人脸检测,人脸跟踪,人脸关键点定位,人脸质量评价,人脸特征提取,人脸比对,人脸检索。

人脸检测:对视频解码后的互联网视频没隔15帧做一次人脸检测,检测结果作为后续人脸跟踪的初始化以及终止标准;

人脸跟踪:利用人脸检测的结果进行人脸跟踪的初始化,并对互联网视频解码出的每一帧进行人脸跟踪的操作;

人脸关键点定位:对获得的人脸框提取21个关键点,用于人脸特征的提取;

人脸质量评价:对获得的人脸进行质量评价,输出得分,角度等评价指标,只有通过质量评价的人脸才会进行后续的人脸特征提取以及人脸比对;

人脸特征提取:利用提取的人脸关键点,用于提取人脸的特征,这个特征可以用于人脸的特征比对;

人脸比对:利用提取两个人脸的特征比较两个人脸的相似度,并输出人脸相似度的得分;

人脸搜索:利用提取的人脸特征去目标库去检索匹配,做人脸比对。

2.3互联网场景下人脸服务基线方案

经过调研发现互联网场景下的网络视频相比与监控摄像头来说,多了视频的跳变部分,也就是电视中经常见切镜的画面。而视频的切镜会影响人脸的跟踪模块,因为人脸的跟踪模块是不能应付切镜这种情况的。所以为了解决这种问题,需要在人脸服务中添加跳帧检测的功能,及时发现视频切镜的地方,及时终止并清除当前所有跟踪,基线方案中使用的方案如下:

跳帧检测:对解码后的视频的相邻两帧进行相似度度量,判定当前帧是否发生跳变,即视频的切镜。

人脸图片的选取:对于人脸轨迹中用于人脸检索的人脸图片的选取方法是对于同一个跟踪ID的人脸轨迹中选取一张质量评价最好的一张图片进行特征提取,将利用提取的特征代表当前跟踪ID的轨迹,并将结果送入目标库进行检索和人脸比对。

整体的互联网场景下人脸服务的基线策略的流程图如图1所示:

图1 互联网场景下人脸服务的基线策略的流程图

其中:

IFRDFaceDetect:表示人脸引擎中人脸检测的主要接口;

IFRTInitTrack和IFRTUpdateTrack:表示人脸引擎中人脸跟踪的主要接口;

       IFRDQualityAcess:表示人脸引擎中图片质量评价的主要接口;

       IFRAFaceAlign:表示人脸引擎中人脸图片关键点提取的主要接口;

       IFRVGetFea:表示人脸引擎中人脸图片特征提取的主要接口;

       IFRVCompFea:表示人脸引擎中人脸特征比对的主要接口

3. 互联网场景下人脸服务基线方案效果验证设计

3.1 测试验证标准

视频中标注一个人脸出现的时间段,该人脸在人脸服务引擎的目标库中注册,引擎开启目标跟踪,每段视频只标注特定的一个人。

数据集:

  1. 400多段视频(平均时长4分钟);
  2. 目标库中42张注册人脸。

判定条件:

  1. 优先级1:标注结果和引擎输出结果交并比阈值 0.5;
  2. 优先级2:标注结果和引擎输出结果的交差比为25帧。

相关定义:

  1. 交并比:引擎输出后的帧区间与人工标记的帧区间的交叠率,即它们的交集与并集的比值,例如0.5。最理想情况是完全重叠,即比值为1; 
  2. 交并差:引擎输出后的帧区间与人工标记帧区间交集与并集的差值,例如小于25帧(即1秒),默认为可接受范围,即使交并比低于阈值,也认为是通过的。
  3. A:平台返回目标人脸所在帧区间的交并比满足阈值的个数。
  4. B:平台返回目标人脸所在帧区间的交并比不满足阈值的个数。
  5. C:目标人脸标记的帧区间没有结果匹配到的个数。
  6. 召回率(R):交并比满足0.5的人脸服务处理后帧区间数量/标注的帧区间数量(A/A+C)
  7. 准确率(P):交并比满足0.5的人脸服务处理后帧区间数量/人脸服务处理后的所有帧区间数量。(A/A+B)

3.2 效果验证设计

    将上述A+B的所有人脸比对结果输出的得分作为PR曲线的阈值,即每一个得分阈值计算一组Precision和Recall的值,最后给出人脸服务的PR曲线,针对这个PR曲线分析人脸服务引擎的效果。

4.实验结果及其分析

针对上述的测试方案,对人脸服务的基线引擎进行了测试,具体的实验结果如下所示。

4.1 人脸服务基线引擎测试结果

图2 Precision and Recall 曲线

    从PR曲线的趋势可以看出,准确率随着召回率先降后升再降的现象,这样的原因是人脸服务的引擎出现了高分虚警的情况。查看了阈值为0.999212的所有虚警,如图3所示,发现高分虚警基本上都是出现在简历视频中。

图3 阈值为0.999212时,人脸服务引擎输出的高分虚警列表

    查看人脸服务的高分虚警视频,发现如下问题,视频的截图如图4所示,发现视频中出现了类似ppt翻页的操作,导致一段完整的视频被切成多段,而按照上述的测试标准,所有的被切出来的帧区间都和视频标注的帧区间不满足条件,所以这样的视频都变成了高分虚警,从而影响了人脸服务引擎的准确率。

图4 视频截图

    从整体的PR曲线可以看出,实际人脸服务引擎的召回率比较低,并且准确率也不高,所以需要对人脸服务引擎进一步进行优化。

下一步工作:

  • 修改人脸服务测试标准,需要对服务输出的结果进行合并操作;
  • 需要对跳帧检测的阈值进行调节,避免类似PPT翻页这种视频带来的翻页误检;
  • 考虑引入轨迹分段识别的方法,设法提高人脸服务的准确率;
  • 针对召回率低的问题,考虑引入二次检索的功能,增加召回率;

5.总结

    从人脸服务基线的测试结果中,可以看出,在当前的测试标准下,人脸服务的效果不理想,最大的召回率和准确率都比较低,其中的问题有的是出现在测试标准中所以需要对测试的指标重新进行制定,也有的问题是出现在服务,所以需要对人脸服务引擎本身进一步的优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/763129.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

华为防火墙在广电出口安全方案中的应用(方案设计、配置、总结)

号主:老杨丨11年资深网络工程师,更多网工提升干货,请关注公众号:网络工程师俱乐部 你们好,我的网工朋友。 不知道你有没有想过,我们每天看电视、上网追剧的广电网络,它的背后是如何确保安全稳定…

Git 命令学习之推送本地项目到 Gitee 托管

引言 在软件开发中,版本控制是不可或缺的一环。Git 作为目前最流行的分布式版本控制系统,广泛应用于各种项目中。而 Gitee(原名码云)作为国内知名的代码托管平台,为开发者提供了稳定、安全的代码托管服务。下面将详细…

Eclipse配置Tomcat时无Apache选项问题

有可能你会遇到,安装最新版本Eclipse,但是 Window——Preferences——Servers——Runtime Environments。发现没有Apache选项。,这是因为,默认没有安装J2EE组件,我们可以通过手动安装,来解决这个问题。 一…

vue3中的图片懒加载指令及全局注册

vue3中的图片懒加载指令及全局注册 最近重新刷了一遍黑马的小兔鲜前端项目,发现有个懒加载的指令之前还没有用过。而且写法相对固定,因此记录一下 首先,懒加载(Lazy Loading)的作用是延迟加载某些资源或组件&#xf…

【秋招突围】2024届秋招笔试-科大讯飞笔试题-03-三语言题解(Java/Cpp/Python)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系计划跟新各公司春秋招的笔试题 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 📧 清隆这边…

日期时间显示网页

SweetOrange_Clock 🕘 一、简介 1、这个项目包括一个HTML文件,其中包含页面的样式和脚本。 2、页面以优雅的黑白配色为主题,突出了实用性和视觉冲击力,使得显示内容在视觉上更为突出和易于阅读。 3、这是一个日期时间显示器。通…

数据库定义语言(DDL)

数据库定义语言(DDL) 一、数据库操作 1、 查询所有的数据库 SHOW DATABASES;效果截图: 2、使用指定的数据库 use 2403 2403javaee;效果截图: 3、创建数据库 CREATE DATABASE 2404javaee;效果截图: 4、删除数据…

Supabase 自托管部署实践

Supabase 是 Firebase 的开源替代品。使用 Postgres 数据库、身份验证、即时 API、边缘函数、实时订阅、存储和向量嵌入来启动您的项目。 Supabase介绍 Supabase 是一个开源的后端即服务(BaaS)平台,提供了一系列工具和服务,帮助…

刷代码随想录有感(122):动态规划——最长子序列

题干&#xff1a; 代码&#xff1a; class Solution { public:int lengthOfLIS(vector<int>& nums) {if(nums.size() < 1)return nums.size();vector<int>dp(nums.size(), 1);int res 0;for(int i 1; i < nums.size(); i){for(int j 0; j < i; j)…

Windows 10,11 Server 2022 Install Docker-Desktop

docker 前言 Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux或Windows 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。 docker-compose Compose 是用于定义和运行…

14-10 AIGC 项目生命周期——第一阶段

生成式 AI 项目生命周期的整个过程类似于从范围、选择、调整和对齐/协调模型以及应用程序集成开始的顺序依赖过程。流程表明每个步骤都建立在前一步的基础上。有必要了解每个阶段对于项目的成功都至关重要。 下面的流程图重点介绍了生成式 AI 项目生命周期的第一阶段 1 — “范…

[数据集][目标检测]水面垃圾水面漂浮物检测数据集VOC+YOLO格式3749张1类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;3749 标注数量(xml文件个数)&#xff1a;3749 标注数量(txt文件个数)&#xff1a;3749 标注…

问题-小技巧-专业版Win11怎么启动电脑的休眠模式?

专业版Win11怎么启动电脑的休眠模式&#xff1f; powercfg -a powercfg -hibernate on 启用管理员面板依次输入上述命令就可以了。

Vue基础用法

Vue 定义&#xff1a; 是一套前端框架&#xff0c;免除原生JS中的DOM操作&#xff0c;简化书写&#xff0c;基于MVVM&#xff08;Model-View-ViewModel&#xff09;思想&#xff0c;实现数据的双向绑定&#xff0c;将编程的关注点放在数据上。 图来自黑马程序员网课 常用指令&…

性能测试中的场景设计和测试执行

假设一个内部系统要求响应时间在 3s 以内&#xff0c;支持最大用户数为4万。根据二八原则&#xff0c;80%用户在20%时间使用系统(4w80%)/(24h20%)≈1.9点击/秒。并发数TPS&#xff08;运行时间思考时间&#xff09;1.9&#xff08;30.50.330.50.30.53&#xff09;21。 注意&am…

大数据学习之Clickhouse

Clickhouse-23.2.1.2537 学习 一、Clickhouse概述 clickhouse 官网网址&#xff1a;https://clickhouse.com/ ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。 OLTP(联机事务处理系统)例如mysql等关系型数据库&#xff0c;在对于存储小数据量的时候&#xff…

【论文复现|智能算法改进】基于自适应动态鲸鱼优化算法的路径规划研究

目录 1.算法原理2.改进点3.结果展示4.参考文献5.代码获取 1.算法原理 SCI二区|鲸鱼优化算法&#xff08;WOA&#xff09;原理及实现【附完整Matlab代码】 2.改进点 非线性收敛因子 WOA 主要通过控制系数向量 A 来决定鲸鱼是搜索猎物还是捕获猎物&#xff0c;即系数向量 A 可…

C语言部分复习笔记

1. 指针和数组 数组指针 和 指针数组 int* p1[10]; // 指针数组int (*p2)[10]; // 数组指针 因为 [] 的优先级比 * 高&#xff0c;p先和 [] 结合说明p是一个数组&#xff0c;p先和*结合说明p是一个指针 括号保证p先和*结合&#xff0c;说明p是一个指针变量&#xff0c;然后指…

适用于高海拔地区的工业路由器产品

1、西藏背景 西藏&#xff0c;这个位于中国西南部的神秘之地&#xff0c;以其雄伟壮观、神奇瑰丽的自然风光和深厚的文化底蕴&#xff0c;被无数人视为心中的圣地。这里属于高原性气候&#xff0c;具有气温低、气压低&#xff0c;降水少&#xff0c;生态环境十分恶劣。西藏被誉…

Coze搭建《测测你的本命宠物》

前言 本文讲解如何从零开始&#xff0c;使用扣子平台去搭建《测测你的本命宠物》 《测测你的本命宠物》&#xff1a;测测你的本命宠物 - 扣子 AI Bot (coze.cn) 欢迎大家去体验一下&#xff01;&#xff01;&#xff01; 正文 接下来我们开始讲解制作这个bot的流程吧&#…