人脸识别系统之动态人脸识别

二．动态人脸识别

1.摄像头人脸识别

1.1.导入资源包

import dlib
import cv2
import face_recognition
from PIL import Image, ImageTk
import tkinter as tk
import os

注：这些导入语句允许您在代码中使用这些库和模块提供的功能，例如创建图形用户界面、处理文件、进行图像处理和人脸识别等。
Dlib：是一个开源的机器学习库，包含了许多常用的机器学习算法。它还包含了一个名为shape_predictor的模块，用于检测人脸的关键点。

1.2.初始化摄像头

# 初始化摄像头
cap = cv2.VideoCapture(0)
#参数0指定要使用的摄像头设备。在大多数情况下，0表示默认摄像头。

注：这行代码初始化了摄像头，并将其作为cap对象返回。cv2.VideoCapture(0)中的0参数通常表示默认摄像头。这行代码是用于从摄像头上捕获实时视频流。

1.3.创建主窗口

root = tk.Tk()
root.title("人脸识别程序")
root.geometry('600x600')

注：这段代码通常用于创建一个Tkinter窗口，并为其设置一个标题和一个初始大小。在后续的代码中，您可以添加更多的组件，如按钮、标签、图像等，来构建图形用户界面。

1.4.创建画布

# 创建画布
canvas = tk.Canvas(root, width=600, height=600)
canvas.pack()

注：这段代码首先导入了 Tkinter 模块，并创建了一个名为 root 的窗口。然后，它创建了一个画布（canvas），并设置了其宽度和高度。最后，它将画布添加到窗口中，并启动了 Tkinter 的主循环，这样窗口才会显示出来。

1.5.显示摄像头部分

# 摄像头画面显示部分
camera_frame = tk.Label(root)
camera_frame.place(x=50, y=50, width=400, height=400)

注：这段代码创建了一个 Label 对象，并将其放置在窗口（root）的坐标 (50, 50) 处，大小为 400x400。然而，由于 Label 控件本身不支持显示动态内容，如摄像头捕获的帧，您需要使用其他方法（如前面提到的 Canvas 控件和 PIL/Pillow 库）来显示摄像头画面。

1.6.显示文本

# 文本显示部分
text_label = tk.Label(root, text="", font=('Helvetica', 12))
text_label.place(x=50, y=460, width=500, height=100)

注：这段代码创建了一个 Label 对象，并将其放置在窗口（root）的坐标 (50, 460) 处，大小为 500x100。标签的初始文本内容为空，字体为 Helvetica 字体，字号为 12。

1.7.按钮的点击事件处理函数

# 按钮部分
def capture_face():
    ret, frame = cap.read()
    if ret:
        # 将人脸图像转换为RGB
        rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)

        # 检测人脸位置
        face_locations = face_recognition.face_locations(rgb_frame)

        # 如果检测到人脸
        if face_locations:
            # 对检测到的人脸进行编码
            face_encoding = face_recognition.face_encodings(rgb_frame, face_locations)[0]

            # 加载已保存的人脸编码
            known_face_encodings = []
            known_face_names = []
            for file in os.listdir("facecomparison"):
                image = face_recognition.load_image_file(f"facecomparison/{file}")
                encoding = face_recognition.face_encodings(image)[0]
                known_face_encodings.append(encoding)
                known_face_names.append(file)

            # 比较当前人脸与已知人脸
            matches = face_recognition.compare_faces(known_face_encodings, face_encoding)
            if True in matches:
                text_label.config(text="该人脸已存在，请勿重复录入")
            else:
                # 裁剪人脸图像
                top, right, bottom, left = face_locations[0]
                face_image = frame[top:bottom, left:right]

                # 生成唯一的文件名
                unique_filename = f"facecomparison/face_{len(os.listdir('facecomparison')) + 1}.jpg"

                # 保存人脸到指定文件夹
                cv2.imwrite(unique_filename, face_image)
                text_label.config(text="人脸已录入")
        else:
            text_label.config(text="未检测到人脸")
    else:
        text_label.config(text="无法从摄像头读取帧")

注：这段代码的作用是实现一个面部识别系统，该系统能够从摄像头捕获实时帧，检测帧中的人脸，并将新检测到的人脸与已保存的人脸编码进行比较。如果新检测到的人脸与已保存的人脸匹配，它会显示一个消息，告知用户该人脸已存在，不应该重复录入。如果新检测到的人脸与已保存的人脸不匹配，它会将新的人脸图像保存到指定的文件夹中，并显示一个消息，告知用户人脸已录入。如果无法从摄像头读取帧，或者没有检测到人脸，它会显示相应的错误消息。

1.8.识别摄像头捕获的人脸

def recognize_face():
    # 识别摄像头捕获的人脸
    ret, frame = cap.read()
    if ret:
        frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        rgb_frame = frame.copy()
        face_locations = face_recognition.face_locations(rgb_frame)
        face_encodings = face_recognition.face_encodings(rgb_frame, face_locations)

        # 加载已保存的人脸编码和文件名
        known_face_encodings = []
        known_face_names = []
        for file in os.listdir("facecomparison"):
            image = face_recognition.load_image_file(f"facecomparison/{file}")
            encoding = face_recognition.face_encodings(image)[0]
            known_face_encodings.append(encoding)
            known_face_names.append(file)

        # 标记人脸并显示信息
        for (top, right, bottom, left), face_encoding in zip(face_locations, face_encodings):
            matches = face_recognition.compare_faces(known_face_encodings, face_encoding)
            if True in matches:
                first_match_index = matches.index(True)
                text_label.config(text=f"识别到人脸，人脸属于：{known_face_names[first_match_index]}")
            else:
                cv2.rectangle(frame, (left, top), (right, bottom), (255, 0, 0), 2)  # 使用蓝色线条画框
                cv2.putText(frame, "新的人脸", (left + 10, top + 20), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 1)
                text_label.config(text="人脸不存在，请先录入人脸")

        # 更新画布
        image = Image.fromarray(frame)
        image = ImageTk.PhotoImage(image)
        camera_frame.configure(image=image)
        camera_frame.image = image
    else:
        text_label.config(text="无法从摄像头读取帧")

注：这段代码是一个函数，当按钮被点击时，它会执行这个函数。这个函数的作用是识别摄像头捕获的实时帧中的人脸，并与已保存的人脸编码进行比较，以确定是否已存在。如果人脸存在，它会标记并显示该人脸的名称；如果人脸不存在，它会标记新的人脸并提示用户先录入人脸。

1.9.点击关闭程序的按钮

def close_program():
#关闭 Tkinter 应用程序
    root.quit()
#释放摄像头（cap）资源
    cap.release()

注：当用户点击关闭程序的按钮时，这两个操作会确保 Tkinter 应用程序和摄像头资源都能被正确地关闭和释放，从而避免资源泄漏和潜在的系统问题。

1.10.创建按钮

button1 = tk.Button(root, text="录入人脸", command=capture_face, width=10, height=2)
button1.place(x=460, y=50, width=100, height=100)

button2 = tk.Button(root, text="识别人脸", command=recognize_face, width=10, height=2)
button2.place(x=460, y=200, width=100, height=100)

button3 = tk.Button(root, text="结束程序", command=close_program, width=10, height=2)
button3.place(x=460, y=350, width=100, height=100)

注：这三行代码分别创建了三个按钮，并设置了它们的位置、大小和功能，当用户点击这些按钮时，会触发相应的函数执行。

1.11.更新摄像头的画面

# 更新摄像头画面的函数
def update_image():
    ret, frame = cap.read()
    if ret:
        frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        face_locations = face_recognition.face_locations(frame)
        for (top, right, bottom, left) in face_locations:
            cv2.rectangle(frame, (left, top), (right, bottom), (0, 255, 0), 2)  # 使用绿色线条画框
        image = Image.fromarray(frame)
        image = ImageTk.PhotoImage(image)
        camera_frame.configure(image=image)
        camera_frame.image = image
    root.after(10, update_image)

# 开始更新画面
update_image()

# 主循环
root.mainloop()

# 释放摄像头
cap.release()

注：这段代码的作用是在 Tkinter 窗口（root）中创建一个循环，用于从摄像头捕获实时帧，并在窗口中显示这些帧。这个循环会在每次捕获新帧后立即更新显示的图像。
运行结果：
在这里插入图片描述

2.视频流人脸识别

2.1.导入资源包

import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk
import cv2
import os
import subprocess
from pathlib import Path

注：导入了所需的模块，这些模块将用于创建一个图形用户界面 (GUI) 应用程序，该应用程序可以处理图像文件、使用摄像头、执行命令行操作等。
cv2：这是 OpenCV 模块，用于处理图像和视频，包括摄像头捕捉、图像处理、特征检测等。os：这是 Python 的标准库，用于操作文件和目录，例如创建目录、删除文件、获取文件路径等。
pathlib：这是 Python 的标准库，用于处理文件和目录路径，提供了一个面向对象的接口，可以更方便地处理路径。

2.2.创建界面窗口

# 初始化窗口
win = tk.Tk()
win.title('视频流人脸识别')
win.geometry('600x600')
#创建了一个字体对象 title_font，用于设置标题的字体、大小和样式。title_font = ("Verdana", 20, 'italic')

注：这段代码创建了一个名为 “视频流人脸识别” 的窗口，窗口的初始大小为 600x600 像素，并准备了一个斜体字体的对象，用于后续设置窗口标题的字体。

2.3.创建视频播放框架

# 视频播放框架
video_frame = tk.Frame(win, width=300, height=300, bg='black')
video_frame.pack()
#将 video_frame 框架放置在窗口中

注：这段代码创建了一个视频播放框架，并将其放置在窗口中，设置其大小为 300x300 像素，背景颜色为黑色。这个框架可以用来显示摄像头捕捉的实时帧或视频文件。

在视频播放框架 video_frame 中创建一个画布

# 视频播放的Canvas
canvas = tk.Canvas(video_frame, width=900, height=900)
canvas.pack(side=tk.TOP, anchor=tk.CENTER)

注：这段代码创建了一个画布，并将其放置在视频播放框架中，设置其大小为 900x900 像素。这个画布可以用来显示摄像头捕捉的实时帧或视频文件。

2.5. 加载人脸识别预训练的模型

# 加载人脸识别的预训练模型
face_cascade=cv2.CascadeClassifier(cv2.data.haarcascades+'haarcascade_frontalface_default.xml')

注：这段代码创建了一个名为 face_cascade 的级联分类器对象，用于检测图像或视频帧中的人脸。OpenCV 提供了许多预训练的级联分类器，包括正面人脸检测、眼睛检测等，这些分类器可以提高检测的准确性和效率。

2.6.人脸检测

# 人脸检测函数
def detect_faces(frame):
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)
    for (x, y, w, h) in faces:
        cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 0, 0), 2)
    return frame, faces

注：这个函数通过级联分类器在输入图像中检测人脸，并在图像上标记出这些人脸，以便进一步的处理或显示。
1.3：是尺度缩放因子，用于调整检测窗口大小。
5：是邻域内像素的最低匹配数，用于确定检测到的候选框是否真正是人脸。

2.7.在循环外部创建全局的PhotoImage对象

# 在循环外部创建全局的PhotoImage对象
imgtk = None

注：在 Tkinter 中，PhotoImage 是一个用于在 Tkinter 控件中显示图像的类。当您创建一个 PhotoImage 对象时，它会占用一些内存来存储图像数据。如果您在循环中创建多个 PhotoImage 对象，并且循环会多次迭代，那么每次迭代都会创建一个新的对象，这将导致内存占用逐渐增加。为了避免这种情况，您可以创建一个全局的 PhotoImage 对象，并在循环中使用它。这样做的好处是，无论循环迭代多少次，都只会有一个 PhotoImage 对象在内存中。

2.8.定义播放视频的函数

# 播放视频的函数
def play_video():
    global imgtk
    video_path = filedialog.askopenfilename(title='选择视频', filetypes=[('视频文件', '*.mp4')])
    if video_path:
        cap = cv2.VideoCapture(video_path)
        while cap.isOpened():
            ret, frame = cap.read()
            if ret:
                frame, faces = detect_faces(frame)
                display_frame(frame)
            else:
                break
        cap.release()
#在循环后释放视频文件资源

注：这个函数允许用户选择一个视频文件，并播放该视频。在播放过程中，它将视频帧显示在窗口中，并使用人脸检测算法检测帧中的人脸。

2.9.在 Tkinter 窗口的画布上显示图像帧。

#定义了一个函数 display_frame，它接受一个名为 frame 的参数，该参数是一个表示图像的 NumPy 数组。
def display_frame(frame):
    global imgtk
    if imgtk:
        canvas.delete(imgtk)
        imgtk = None
    frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
    img = Image.fromarray(frame)
    imgtk = ImageTk.PhotoImage(image=img)
#在画布上创建图像
    canvas.create_image(0, 0, anchor=tk.NW, image=imgtk)
#更新image属性
    canvas.image = imgtk
#更新窗口状态
    win.update_idletasks()
    win.update()

注：这个函数负责将处理后的图像帧转换为 Tkinter 可以显示的格式，并在画布上显示这些帧。

2.10.让用户选择要查看的人脸图片，并在图像上显示这些图片

def view_faces():
    directory = 'C:/Users/HUAWEI/Desktop/机器学习的人脸识别/机器学习的人脸识别/动态人脸识别/视频流人脸识别/保存图片'
    [os.path.join(directory, f) for f in os.listdir(directory) if f.endswith('.jpg')]
    face_paths = filedialog.askopenfilenames(title='查看人脸', initialdir=directory, filetypes=[('图片文件', '*.jpg')])
    if face_paths:
        for face_path in face_paths:
            img = cv2.imread(face_path)
            if img is not None:
                cv2.imshow('Face', img)
                cv2.waitKey(0)
                cv2.destroyAllWindows()
            else:
                print(f"无法加载图片: {face_path}")

注：这行代码检查用户是否选择了图片文件。如果选择了，它将遍历用户选择的图片文件，并使用 cv2.imread() 函数尝试读取每个图片文件。如果成功读取，它将使用 cv2.imshow() 函数在窗口中显示图片，并使用 cv2.waitKey(0) 函数等待用户按键，然后使用 cv2.destroyAllWindows() 函数关闭所有打开的 OpenCV 窗口。如果无法加载图片，它会打印一个错误消息。

2.11.返回到主界面

def return_to_system():
    subprocess.Popen(["python", "rlsb.py"])
    win.destroy()
#调用 win.destroy() 方法来关闭当前的 Tkinter 窗口。

注：这个函数的作用是在当前 Tkinter 窗口中执行 rlsb.py 脚本，并在脚本执行完毕后关闭窗口。这通常用于将控制权返回到操作系统或另一个应用程序。
subprocess.Popen([“python”, “rlsb.py”])：这行代码使用 subprocess.Popen() 函数启动一个新的进程，该进程将执行 rlsb.py 脚本。subprocess.Popen() 函数用于执行外部命令和程序，参数 [“python”, “rlsb.py”] 指定使用 Python 解释器执行 rlsb.py 脚本。

2.12.创建按钮

# 创建播放视频按钮，并放置在窗口的右侧
button1 = tk.Button(win, text="选择视频", command=play_video, width=10, height=2)
button1.place(x=150, y=500, width=100, height=50)


# 创建返回程序按钮，并放置在窗口的右侧
button2 = tk.Button(win, text="返回程序", command=return_to_system, width=10, height=2)
button2.place(x=400, y=500, width=100, height=50)

注：这两行代码分别创建了两个按钮，并设置了它们的位置、大小和功能。当用户点击这些按钮时，会触发相应的函数执行。

2.13.更新窗口以确保按钮大小被计算

# 更新窗口以确保按钮大小被计算
win.update_idletasks()

注：这行代码的作用是更新 Tkinter 窗口，以确保按钮的大小被正确计算。在 Tkinter 中，按钮的大小是通过其 place 或 pack 方法设置的，但这些方法并不会立即更新按钮的实际大小。update_idletasks() 方法用于在布局管理器（如 pack 或 grid）计算所有控件的最终位置和大小后更新窗口。

2.14.事件循环

# 进入Tkinter事件循环
win.mainloop()

注：这行代码确保了 Tkinter 窗口和所有绑定的事件处理函数能够正常工作，并且用户可以与应用程序进行交互。它是 Tkinter 应用程序中不可或缺的一部分。
运行结果：
在这里插入图片描述