深度学习实战人脸识别

在这里插入图片描述

文章目录

  • 前言
  • 一、人脸识别一般过程
  • 二、人脸检测主流算法
    • 1. MTCNN
    • 2. RetinaFace
    • 3. CenterFace
    • 4. BlazeFace
    • 5. YOLO
    • 6. SSD
    • 7. CascadeCNN
  • 三、人脸识别主流算法
    • 1.deepface
    • 2.FaceNet
    • 3.ArcFace
    • 4.VGGFace
    • 5.DeepID
  • 四、人脸识别系统实现
    • 0.安装教程与资源说明
    • 1. 界面采用PyQt5框架
    • 2.人脸定位
    • 3. 人脸注册
    • 4.人脸删除
    • 5.单人脸匹配识别
    • 6.多人脸匹配识别
    • 7.未注册人脸匹配识别
    • 8.代码实现
  • 五、总结
  • 结束语


深度学习实战人脸检测与识别

前言

人脸识别技术的研究意义是多方面的,它涉及到社会生活的各个领域,并为社会发展和人民生活带来便利和安全。以下是人脸识别研究的几个主要意义:

  1. 安全领域:人脸识别技术可以应用于门禁系统、监控系统等,实现人员身份的快速识别和记录,提高安全性。

  2. 社会管理:在公安、边检、人口普查等社会管理领域,人脸识别技术可以进行人员身份的准确核验,确保社会管理工作的效率和准确性。

  3. 商业领域:在金融、零售、旅游等行业,人脸识别技术可以实现快速的身份识别和安全支付,提高用户体验。

  4. 医疗领域:在医院门诊、护理等医疗领域,人脸识别技术可以快速识别患者身份,提高医疗服务的质量和效率。

  5. 技术创新:人脸识别技术的发展推动了计算机视觉和人工智能领域的技术进步,尤其是在深度学习的应用上,人脸识别技术取得了显著的成就。

  6. 跨领域应用:人脸识别技术与其他技术领域如物联网、移动计算等的融合,创造出新的应用场景和业务模式。

综上所述,人脸识别技术的研究意义不仅在于技术层面的创新,也包括对社会、法律和伦理方面问题的深入思考,以实现技术的健康发展和应用。


一、人脸识别一般过程

人脸识别的一般过程可以分为以下几个步骤:

  1. 人脸检测

    • 图像采集:首先需要获取图像数据,这可以是静态图像或视频流。
    • 人脸定位:在图像中定位人脸的位置,这通常通过人脸检测算法实现,如Haar特征、HOG+SVM、MTCNN等。
  2. 预处理

    • 图像预处理:包括灰度化、直方图均衡化、噪声去除等,以提高后续处理的准确性。
    • 人脸对齐:将检测到的人脸调整到标准位置和大小,通常涉及到旋转、缩放和裁剪等操作。
  3. 特征提取

    • 特征表示:从预处理后的人脸图像中提取特征,这些特征可以是几何特征、纹理特征或基于深度学习的特征。
    • 特征选择:选择最有代表性的特征用于识别,以减少计算量并提高识别率。
  4. 特征匹配

    • 特征编码:将提取的特征转换为一种可以比较的形式,如特征向量。
    • 相似度计算:计算待识别人脸的特征向量与数据库中已知人脸的特征向量的相似度。
  5. 分类决策

    • 分类器训练:使用已知的人脸数据训练分类器,如支持向量机(SVM)、神经网络、决策树等。
    • 分类预测:将待识别人脸的特征向量输入分类器,得到识别结果。
  6. 结果输出

    • 输出识别结果:将识别结果输出给用户,可以是人脸的身份信息、相似度分数等。
    • 反馈学习:根据识别结果的准确性,对模型进行调整和优化。
  7. 活体检测

    • 防止欺骗:为了提高安全性,人脸识别系统通常会加入活体检测步骤,以区分真实人脸和照片、视频等伪造人脸。

二、人脸检测主流算法

1. MTCNN

MTCNN (Multi-task Cascaded Convolutional Networks)是由中国科学院提出的一种多任务级联卷积神经网络,它可以同时进行人脸检测、关键点定位和姿态估计等任务,具有精度高、速度快、能够处理多个尺度的人脸等优点。


具体说明与代码实现可参考博主写的教程MTCNN人脸检测算法实现(python)

2. RetinaFace

RetinaFace 是由中国香港城市大学提出的一种准确率更高的人脸检测与关键点定位算法,其使用了可变形卷积网络(Deformable Convolutional Network)来实现更加准确的定位,RetinaFace 特别适用于小尺度人脸的定位。

3. CenterFace

CenterFace 是由华为提出的一种轻量级人脸检测与关键点定位算法,该算法只需要 1.5MB 的模型大小,可以在移动端实时运行,CenterFace 采用了 Hourglass 模型和特征金字塔网络(Feature Pyramid Network)来实现高精度的人脸定位。

4. BlazeFace

BlazeFace 是由 Google 提出的一种极其轻量级的人脸检测算法,它的模型大小只有 2MB 左右,可以在移动端实时运行,BlazeFace 采用了创新的 anchor-free 检测方式,可以实现更快速度的人脸定位。

5. YOLO

YOLO 是一种端到端的实时目标检测算法,可以同时对多个目标进行检测和定位。由于 YOLO 可以将整张图像划分为网格,并在每个网格上预测目标的类别和边界框,因此它通常比其他基于区域的目标检测算法更快。

6. SSD

SSD 是一种基于卷积神经网络的单步目标检测算法,可以在一次前向传播中完成对多个目标的检测,相对于 Faster R-CNN 等基于区域的检测算法,SSD 更加简单与高效。

7. CascadeCNN

CascadeCNN 是由微软亚洲研究院提出的级联卷积神经网络,能够在不牺牲性能的情况下大幅减小网络规模和计算量。CascadeCNN 的结构是由多个级联阶段组成,每个阶段包含多个级联卷积层和池化层,可以有效地提高人脸定位的精确度和稳定性。

三、人脸识别主流算法

深度学习在人脸识别领域的主流算法主要包括以下几种:

1.deepface

DeepFace:由Facebook开发,使用深度神经网络来识别人脸,达到了接近人类水平的识别准确率。

2.FaceNet

FaceNet:由Google开发,使用三元组损失函数(triplet loss)将人脸映射到欧几里得空间中,使得相似的人脸在空间中的距离更近。

3.ArcFace

ArcFace:在之前模型的基础上引入了角度边际损失(angular margin loss),使得学习到的特征更具区分性。

4.VGGFace

VGGFace:这是一个深度网络,使用大型数据集进行训练,以提供高精度的人脸识别任务。

5.DeepID

DeepID系列:一系列深度学习模型,用于人脸识别任务,以逐步提高识别性能而闻名。

这些算法在设计、训练/测试数据集、应用场景以及评估协议等方面都取得了显著的进展,并且它们在处理RGB-D、视频和异构人脸数据方面也表现出色。这些主流算法的发展,极大地推动了人脸识别技术的进步,并在多个方面重塑了人脸识别的研究格局。

四、人脸识别系统实现

0.安装教程与资源说明

离线安装配置文件说明
在这里插入图片描述
在这里插入图片描述

1. 界面采用PyQt5框架

在这里插入图片描述

2.人脸定位

在这里插入图片描述

3. 人脸注册

在这里插入图片描述

4.人脸删除

在这里插入图片描述

5.单人脸匹配识别

在这里插入图片描述

6.多人脸匹配识别

在这里插入图片描述

7.未注册人脸匹配识别

在这里插入图片描述

8.代码实现

class QThreadFaceModel(QThread):
    cnn_predict_finish_sig = pyqtSignal(object)
    face_recog_record_insert_sig = pyqtSignal(list)
    face_recog_warning_sig = pyqtSignal(str)

    def __init__(self):
        super(QThreadFaceModel, self).__init__()
        self.run_flag = False
        self.mode = 0
        self.last_pid_list = []

        self.cap = cv2.VideoCapture(0)
    def __del__(self):
        print('__del__')
        self.cap.release()

    def set_run_flag(self, flag):
        self.run_flag = flag
    def set_face_model(self, model):
        self.face_model = model

    def set_model(self, mode):
        self.mode = mode

    def set_face_features(self, face_features):
        self.face_features = face_features

    def set_face_names(self, face_name_dict):
        self.face_name_dict = face_name_dict

    def query_face_id(self, query_feature, sim_thresh=0.65):
        id ='unknown'
        for key in self.face_features:
            face_sim = self.face_model.CalculateSimilarity(query_feature, self.face_features[key])
            # print(face_sim)
            if face_sim >= sim_thresh:
                id = key
                break
        return id

    def run(self):
        """
            线程启动后执行的函数入口,
            采用run_flag控制流程的运行状态
        """
        while True:
            if self.run_flag:
                ok, frame = self.cap.read()  # 读取一帧数据
                # print(frame.shape)
                if not ok:
                    self.cap = cv2.VideoCapture(0)
                    continue
                try:
                    detect_result = self.face_model.Detect(frame)
                    # print(detect_result)
                    for i in range(detect_result.size):
                        face = detect_result.data[i].pos
                        if self.mode == 1:

                            face_points = self.face_model.mark5(frame, face)
                            face_crop_image = self.face_model.CropFace(frame, face_points)
                            face_crop_image_feature = self.face_model.ExtractCroppedFace(face_crop_image)
                            face_id = self.query_face_id(face_crop_image_feature)

                            if face_id == 'unknown':
                                cv2.rectangle(frame, (face.x, face.y), (face.x + face.width, face.y + face.height),
                                              (0, 0, 255), 2)
                                frame = cv2ImgAddText(frame, self.face_name_dict[face_id], face.x - 30, face.y -30,
                                                      textColor=(255, 0, 0), textSize=30)
                            else:
                                cv2.rectangle(frame, (face.x, face.y), (face.x + face.width, face.y + face.height),
                                              (255, 0, 0), 2)
                                frame = cv2ImgAddText(frame, self.face_name_dict[face_id], face.x - 30, face.y - 30,
                                                      textColor=(0, 255, 0), textSize=30)


                        elif self.mode == 0:
                            cv2.rectangle(frame, (face.x, face.y), (face.x + face.width, face.y + face.height),
                                          (255, 0, 0), 2)
                            # cv2.putText(frame, f"pid:{PID}", (face.x, face.y), 0, 1, (0, 255, 0))

                    self.cnn_predict_finish_sig.emit(frame)
                except Exception as e:
                    self.cap = cv2.VideoCapture(0)
                    print(e)


五、总结

深度学习人脸定位算法已经取得了非常显著的进展,已经被广泛应用于人脸识别、人脸表情分析、虚拟换脸等应用场景中,这些算法在不断地优化和改进中,未来还有很大的发展空间。

结束语

由于博主能力有限,本篇文章中提及的方法,也难免会有疏漏之处,希望您能热心指出其中的错误,以便下次修改时能以一个更完美更严谨的样子,呈现在大家面前。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/922178.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Qt 字符串、信号槽详解

目录 1.QT中字符串QString的使用 1.1.常见的函数 1.2.总结QT中跟字符,字符串有关的类 1.3.字符串列表StringList 2.信号与槽 1.作用 2.右键转到槽函数 3.关联信号与槽函数(让你的信号跟槽函数之间形成一一对应关系) 4.信号与槽的特点 3.总结 1.继承自QMainWin…

Vscode进行Java开发环境搭建

Vscode进行Java开发环境搭建 搭建Java开发环境(Windows)1.Jdk安装2.VsCode安装3.Java插件4.安装 Spring 插件5.安装 Mybatis 插件5.安装Maven环境6.Jrebel插件7.IntelliJ IDEA Keybindings8. 收尾 VS Code(Visual Studio Code)是由微软开发的一款免费、开…

响应式数据(v-on、v-if、v-show、v-for、v-bind、v-model、computed、watch)

目录 一、事件绑定指令v-on 二、条件渲染指令v-if 三、v-show 四、遍历指令v-for 1、遍历对象的值 2、遍历对象的值和键(先值后键) 3、遍历对象的值、键和索引 4、遍历数组的值和索引 五、属性动态化指令v-bind(单向) 【CSS样式的绑定&#…

设计模式之 命令模式

命令模式(Command Pattern)是行为型设计模式之一,它将请求(或命令)封装成一个对象,从而使用户能够将请求发送者与请求接收者解耦。通过命令模式,调用操作的对象与执行操作的对象不直接关联&…

微信小程序2-地图显示和地图标记

一、index修改页面&#xff0c;让页面能够显示地图和一个添加标记的按钮。 index.wxml <scroll-view class"scrollarea" scroll-y type"list"><view class"index_container"><map id"map" style"width: 100%; h…

使用eclipse构建SpringBoot项目

我这里用eclipse2018版本做演示&#xff0c;大家有需要的可以下载Eclipse Downloads | The Eclipse Foundation 1.打开eclipse&#xff0c;选择存放代码的位置 2.选择 file >> new >> project >> 选择springboot文件下的 spring starter project 2.这里选择N…

uniapp接入BMapGL百度地图

下面代码兼容安卓APP和H5 百度地图官网&#xff1a;控制台 | 百度地图开放平台 应用类别选择《浏览器端》 /utils/map.js 需要设置你自己的key export function myBMapGL1() {return new Promise(function(resolve, reject) {if (typeof window.initMyBMapGL1 function) {r…

绕过CDN寻找真实IP

在新型涉网案件中&#xff0c;我们在搜集到目标主站之后常常需要获取对方网站的真实IP去进一步的信息搜集&#xff0c;但是现在网站大多都部署了CDN&#xff0c;将资源部署分发到边缘服务器&#xff0c;实现均衡负载&#xff0c;降低网络堵塞&#xff0c;让用户能够更快地访问自…

【计算机网络】网段划分

一、为什么有网段划分 IP地址 网络号(目标网络) 主机号(目标主机) 网络号: 保证相互连接的两个网段具有不同的标识 主机号: 同一网段内&#xff0c;主机之间具有相同的网络号&#xff0c;但是必须有不同的主机号 互联网中的每一台主机&#xff0c;都要隶属于某一个子网 -&…

HarmonyOS笔记5:ArkUI框架的Navigation导航组件

ArkUI框架的Navigation导航组件 在移动应用中需要在不同的页面进行切换跳转。这种切换和跳转有两种方式&#xff1a;页面路由和Navigation组件实现导航。HarmonyOS推荐使用Navigation实现页面跳转。在本文中在HarmonyOS 5.0.0 Release SDK (API Version 12 Release)版本下&…

基于阿里云服务器部署静态的website

目录 一&#xff1a;创建服务器实例并connect 二&#xff1a;本地文件和服务器share 三&#xff1a;关于IIS服务器的安装预配置 四&#xff1a;设置安全组 五&#xff1a;建站流程 六&#xff1a;关于备案 一&#xff1a;创建服务器实例并connect 创建好的服务器实例在云…

mysql根据日期查询没有的日期也要显示数据

先查询出日期数据(当前日期往前推12个月) select bb.datefrom (select num : num 1,date_format(adddate(date_sub(date_sub(curdate(),interval 12 month),interval 1 month),interval num month), %Y-%m) as datefrom mysql.help_topic,(select num : 0) as twhere addd…

Go语言链接Redis数据库

1.使用go get命令安装go-redis/v8库&#xff1a; 我这里使用的vscode工具安装&#xff1a; go get github.com/go-redis/redis/v82.创建Redis客户端实例 使用以下Go代码连接到Redis服务器并执行命令&#xff1a; package mainimport ("context""fmt"&q…

1-测试go-redis缓存数据

1-测试go-redis缓存数据 1.go-redis缓存数据测试效果 a.测试页面 测试页面&#xff1a;--这里使用 Postman 来做测试 http://127.0.0.1:8000/article/getone/3 http://127.0.0.1:8000/article/getone/4 http://127.0.0.1:8000/article/getone/5b.测试效果 查看终端&#xf…

查看浏览器的请求头

爬虫时用到了请求头&#xff0c;虽然可以用网上公开的&#xff0c;但是还是想了解一下本机浏览器的。以 Edge 为例&#xff0c;其余浏览器通用。 打开浏览器任一网页&#xff0c;按F12打开DevTools&#xff1b;或鼠标右键&#xff0c;选择“检查”。首次打开界面应该显示在网页…

git branch -d 删除分支

Git进行版本控制时&#xff0c;删除分支是常见的操作。特别是当特定的功能开发完成或者分支不再需要时&#xff0c;删除分支可以帮助保持仓库的整洁。删除本地分支和删除远端分支是两个独立的操作。如果需要同时删除本地和远端的分支&#xff0c;需要分别执行以下两个命令。 一…

【漏洞复现】|智互联SRM智联云采系统quickReceiptDetail SQL注入漏洞

漏洞描述 智互联(深圳)科技有限公司SRM智联云采系统针对企业供应链管理难题&#xff0c;及智能化转型升级需求&#xff0c;智联云采依托人工智能、物联网、大数据、云等技术&#xff0c;通过软硬件系统化方案&#xff0c;帮助企业实现供应商关系管理和采购线上化、移动化、智能…

[论文阅读] 异常检测 Deep Learning for Anomaly Detection: A Review(三)总结梳理-疑点记录

《深度异常检测综述》总结梳理 目录 一、研究背景与挑战二、深度异常检测方法分类三、实验评估四、结论在这篇文章中&#xff0c;**异常检测的异构性**主要从以下几个方面来理解&#xff1a;如何理解多源数据融合的困难“学习正常性的特征表示”与“用于特征提取的深度学习”在…

linux下i2c开发与框架源码分析

目录 1 概述 2 I2c子系统框架 3 I2C的使用流程 3.1 在驱动里使用 3.2 在应用层使用 3.3 I2ctool的使用 4 为硬件i2c注册一个适配器 5 i2c子系统源码流程分析 5.1 i2c device与driver绑定过程 5.1.1 Driver的注册与处理 5.1.2 Client device的生成 5.2 I2c的发送与接…

学习路之phpstudy--安装mysql5.7后在my.ini文件中无法修改sql_mode

windows环境下使用phpstudy安装mysql5.7后需要修改mysql中的sql_mode配置&#xff0c;但是在phpstudy中打开mysql配置文件my.ini后&#xff0c; 通过查找找不到sql_mode或sql-mode&#xff0c; 此时无法在my.ini文件中直接进行修改&#xff0c;可以使用mysql命令进行修改&#…