自学记录鸿蒙API 13:实现人脸比对Core Vision Face Comparator

完成了文本识别和人脸检测的项目后,我发现人脸比对是一个更有趣的一个小技术玩意儿。我决定整一整,也就是对HarmonyOS Next最新版本API 13中的Core Vision Face Comparator API的学习,这项技术能够对人脸进行高精度比对,并给出相似度评分,判断是否为同一人。于是,我决定基于这个API开发一个简单的人脸比对小工具。


开始我的开发之旅

应用场景的思考

学习之前,我花了一些时间思考人脸比对技术的实际应用场景,例如:

  • 照片分类管理:基于相似度对图库中的照片进行智能分类,方便用户快速整理。
  • 身份认证:在人脸识别基础上,进一步验证是否为同一人。
  • 个性化服务:识别用户身份后,推荐个性化内容。
  • 社交互动:通过比对相似度寻找“脸型相近”的朋友,促进社交联系。
  • 家庭管理:比如家长在家庭监控中,快速识别视频中是否为家庭成员。

有了这些场景的启发,我更坚定了学习这项技术的决心。


第一步:理解Face Comparator API的核心功能

核心功能

Face Comparator API 提供了以下核心功能:

  • 高精度人脸比对:输入两张图片,分析其中的人脸,给出是否为同一人的判断。
  • 相似度评分:提供0到1的相似度评分,帮助开发者精确控制比对结果。
  • 高性能端侧计算:比对算法在设备端执行,无需上传到云端,确保用户隐私。
  • 便捷扩展性:支持与其他视觉服务如人脸检测、活体检测的无缝集成。

应用场景

人脸比对的应用场景非常广泛,包括但不限于:

  • 安全场景:如支付验证、门禁识别。
  • 社交平台:为用户推荐相似的照片或好友。
  • 相册管理:快速整理相似人像照片。
  • 证件核验:比如在远程认证场景中比对身份证照片与自拍照片。

第二步:项目初始化与配置

初始化与权限配置

在使用Face Comparator API前,我们需要确保项目的权限配置正确:

{
  "module": {
    "abilities": [
      {
        "name": "FaceComparatorAbility",
        "permissions": [
          "ohos.permission.INTERNET",
          "ohos.permission.READ_MEDIA",
          "ohos.permission.WRITE_MEDIA"
        ]
      }
    ]
  }
}

以上权限确保应用可以访问图库和网络资源。

在配置完成后,我会继续检查日志以确认权限被正确调用,确保服务能够初始化。


第三步:实现人脸比对功能

初始化Face Comparator服务

初始化服务是开发的第一步,以下代码展示了如何实现服务的初始化与释放:

import faceComparator from '@kit.CoreVisionKit';

async function initializeFaceComparator() {
    try {
        const isInitialized = await faceComparator.init();
        if (isInitialized) {
            console.info('人脸比对服务初始化成功');
        } else {
            console.error('人脸比对服务初始化失败');
        }
    } catch (error) {
        console.error('初始化过程中发生错误:', error);
    }
}

async function releaseFaceComparator() {
    try {
        await faceComparator.release();
        console.info('人脸比对服务已释放');
    } catch (error) {
        console.error('释放过程中发生错误:', error);
    }
}

initializeFaceComparator();

这一过程非常关键,因为初始化成功与否直接决定了后续比对操作的可靠性。服务的释放同样重要,可以避免资源浪费。

加载图片并比对人脸

人脸比对需要两张包含人脸的图片,以下代码展示了如何从图库加载图片并调用比对功能:

async function compareFaces(imageUri1: string, imageUri2: string) {
    try {
        const pixelMap1 = await loadPixelMap(imageUri1);
        const pixelMap2 = await loadPixelMap(imageUri2);

        const visionInfo1 = { pixelMap: pixelMap1 };
        const visionInfo2 = { pixelMap: pixelMap2 };

        const result = await faceComparator.compareFaces(visionInfo1, visionInfo2);
        console.info(`是否为同一人: ${result.isSamePerson}`);
        console.info(`相似度: ${(result.similarity * 100).toFixed(2)}%`);

        // 清理资源
        pixelMap1.release();
        pixelMap2.release();
    } catch (error) {
        console.error('人脸比对失败:', error);
    }
}

async function loadPixelMap(imageUri: string) {
    // 假设有工具库可以加载图像
    return await someImageLibrary.loadPixelMap(imageUri);
}

关于加载图像可以看我之前的文章~,或者查一下API,本身并不难。

错误处理

在开发过程中,遇到的常见错误包括:

  • 图片中缺少人脸
  • 图片格式不支持
  • 比对超时

这些问题可以通过增强日志和用户提示来解决。例如,提供清晰的错误信息并指导用户上传合适的图片。


第四步:构建用户界面

以下代码展示了一个简单的人脸比对应用界面,支持图片选择与结果展示:

import { View, Text, Button, Image } from '@ohos.arkui';

export default View.create({
    build() {
        return (
            {
                type: "flex",
                flexDirection: "column",
                children: [
                    {
                        type: Text,
                        content: "人脸比对应用",
                        style: { height: "50vp", fontSize: "20vp", textAlign: "center" },
                    },
                    {
                        type: Button,
                        content: "选择图片1",
                        style: { height: "50vp", marginTop: "20vp" },
                        onClick: this.onSelectImage1,
                    },
                    {
                        type: Button,
                        content: "选择图片2",
                        style: { height: "50vp", marginTop: "10vp" },
                        onClick: this.onSelectImage2,
                    },
                    {
                        type: Button,
                        content: "开始比对",
                        style: { height: "50vp", marginTop: "10vp" },
                        onClick: this.onCompareFaces,
                    },
                ],
            }
        );
    },

    onSelectImage1() {
        // 模拟选择图片1
        this.imageUri1 = '/data/media/sample_image1.jpg';
        console.info('图片1已选择:', this.imageUri1);
    },

    onSelectImage2() {
        // 模拟选择图片2
        this.imageUri2 = '/data/media/sample_image2.jpg';
        console.info('图片2已选择:', this.imageUri2);
    },

    async onCompareFaces() {
        try {
            const pixelMap1 = await loadPixelMap(this.imageUri1);
            const pixelMap2 = await loadPixelMap(this.imageUri2);

            const visionInfo1 = { pixelMap: pixelMap1 };
            const visionInfo2 = { pixelMap: pixelMap2 };

            const result = await faceComparator.compareFaces(visionInfo1, visionInfo2);
            console.info(`是否为同一人: ${result.isSamePerson}`);
            console.info(`相似度: ${(result.similarity * 100).toFixed(2)}%`);

            // 清理资源
            pixelMap1.release();
            pixelMap2.release();
        } catch (error) {
            console.error('人脸比对失败:', error);
        }
    },
});

第五步:性能优化与功能扩展

性能优化

通过调整参数可以优化比对性能,例如限制图片分辨率,减少不必要的计算。

const configuration = { enableHighPrecision: false };
const result = await faceComparator.compareFaces(visionInfo1, visionInfo2, configuration);

在实际应用中,我还建议对图片进行预处理,例如裁剪人脸区域或调整图片大小,以进一步提高比对效率。

功能扩展

  • 实时比对:结合相机模块,实时分析两张图片是否为同一人。
  • 结果可视化:在界面上展示比对结果和置信度。
  • 批量比对:支持一次比对多张照片,快速分类图库。
  • 增强互动性:结合语音助手实现语音指令触发比对功能。
  • 隐私保护:在比对结果中对敏感信息进行模糊处理,确保数据安全。

最后的小总结

整完了这个API,我发现还真是挺有意思的。毕竟目前这个算是比较新的AI API,可以去做很多新鲜的事,当然这不仅是一项技术创新,更是一种赋能开发者的方式,让我们能够轻松构建智能化、人性化的应用。

未来,我计划将这一技术融入更复杂的场景,如照片管理和个性化服务。此外,还可以探索如何将人脸比对与其他AI能力结合,开发更加智能的综合解决方案。如果你也对人脸比对感兴趣,不妨从简单的比对功能开始,逐步实现自己的创意!

当然如果你也在这一领域研究,不妨关注我,我们一起进步~!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/944984.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024/12/29 黄冈师范学院计算机学院网络工程《路由期末复习作业一》

一、选择题 1.某公司为其一些远程小站点预留了网段 172.29.100.0/26,每一个站点有10个IP设备接到网络,下面那个VLSM掩码能够为该需求提供最小数量的主机数目 ( ) A./27 B./28 C./29 D./30 -首先审题我们需要搞清楚站点与网…

redis cluster集群

华子目录 什么是redis集群redis cluster的体系架构什么是数据sharding?什么是hash tag集群中删除或新增节点,数据如何迁移?redis集群如何使用gossip通信?定义meet信息ping消息pong消息fail消息(不是用gossip协议实现的&#xff0…

PrimeVue菜单模块(Menu),看api的重要性

以下是对PrimeVue菜单模块(Menu)的API属性的中文详解: 一、整体概述 PrimeVue的菜单(Menu)是一个支持动态和静态定位的导航/命令组件,其API通过定义一些辅助的属性(props)、事件等&…

STM32中断详解

STM32中断详解 NVIC 中断系统中断向量表相关寄存器中断优先级中断配置 外部中断实验EXTI框图外部中断/事件线映射中断步骤初始化代码实现 定时器中断通用定时器相关功能标号1:时钟源标号 2:控制器标号 3:时基单元 代码实现 NVIC 中断系统 STM…

从零开始开发纯血鸿蒙应用之逻辑封装

从零开始开发纯血鸿蒙应用 一、前言二、逻辑封装的原则三、实现 FileUtil1、统一的存放位置2、文件的增删改查2.1、文件创建与文件保存2.2、文件读取2.2.1、读取内部文件2.2.2、读取外部文件 3、文件删除 四、总结 一、前言 应用的动态,借助 UI 响应完成&#xff0…

《机器学习》——线性回归模型

文章目录 线性回归模型简介一元线性回归模型多元线性回归模型误差项分析一元线性模型实例完整代码 多元线性模型实例完整代码 线性回归模型简介 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 相关关系&…

【深度学习环境】NVIDIA Driver、Cuda和Pytorch(centos9机器,要用到显示器)

文章目录 一 、Anaconda install二、 NIVIDIA driver install三、 Cuda install四、Pytorch install 一 、Anaconda install Step 1 Go to the official website: https://www.anaconda.com/download Input your email and submit. Step 2 Select your version, and click i…

在HTML中使用Vue如何使用嵌套循环把集合中的对象集合中的对象元素取出来(我的意思是集合中还有一个集合那种)

在 Vue.js 中处理嵌套集合(即集合中的对象包含另一个集合)时,使用多重 v-for 指令来遍历这些层次结构。每个 v-for 指令可以用于迭代一个特定级别的数据集,并且可以在模板中嵌套多个 v-for 来访问更深层次的数据。 例如&#xff…

ip归属地是什么意思?ip归属地是实时定位吗

在数字化时代,IP地址作为网络设备的唯一标识符,不仅关乎设备间的通信,还涉及到用户的网络身份与位置信息。其中,IP归属地作为IP地址的地理位置信息,备受用户关注。本文将详细解析IP归属地的含义,并探讨其是…

基于BP训练深度学习模型(用于回归)以及验证误差值

用原生Python训练了一个BP网络,适合没有pytorch等环境的电脑,并用训练的模型对原始数据进行了预测,拿来估测比较误差值了,可以直接拿去用(需根据个人数据来调训练次数、学习效率),代码在文章末。…

C#冒泡排序

一、冒泡排序基本原理 冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。 以一个简单的整数数…

折腾日记:如何让吃灰笔记本发挥余热——搭建一个相册服务

背景 之前写过,我在家里用了一台旧的工作站笔记本做了服务器,连上一个绿联的5位硬盘盒实现简单的网盘功能,然而,还是觉的不太理想,比如使用filebrowser虽然可以备份文件和图片,当使用手机使用网页&#xf…

从0入门自主空中机器人-2-1【无人机硬件框架】

关于本课程: 本次课程是一套面向对自主空中机器人感兴趣的学生、爱好者、相关从业人员的免费课程,包含了从硬件组装、机载电脑环境设置、代码部署、实机实验等全套详细流程,带你从0开始,组装属于自己的自主无人机,并让…

剑指Offer|LCR 013. 二维区域和检索 - 矩阵不可变

LCR 013. 二维区域和检索 - 矩阵不可变 给定一个二维矩阵 matrix,以下类型的多个请求: 计算其子矩形范围内元素的总和,该子矩阵的左上角为 (row1, col1) ,右下角为 (row2, col2) 。 实现 NumMatrix 类: NumMatrix(…

接口Mock技术介绍

相信学习过程序设计的读者朋友们,一定对“桩(Stub)”这个概念并不陌生。它是指用来替换一部分功能的程序代码段。桩程序代码段可以用来模拟已有程序的某些功或者是将实现的系统代码的一种临时替代方法。插桩方法被广泛应用于开发和测试工作中…

深入解析C#异步编程:await 关键字背后的实现原理

在C#中,async 和 await 关键字用于编写异步代码。本文将详细介绍 await 的实现原理,包括状态机的生成、回调函数的注册和触发等关键步骤。 1. 异步方法的基本概念 在C#中,async 关键字标记一个方法为异步方法,而 await 关键字用于…

【机器学习】SVM支持向量机(一)

介绍 支持向量机(Support Vector Machine, SVM)是一种监督学习模型,广泛应用于分类和回归分析。SVM 的核心思想是通过找到一个最优的超平面来划分不同类别的数据点,并且尽可能地最大化离该超平面最近的数据点(支持向量…

Unity功能模块一对话系统(1)前置准备

也许你也曾被游戏中的对话系统深深吸引,那些精心设计的对白、鲜活的角色配音、甚至是简单的文字对话,往往能让玩家产生强烈的代入感和情感共鸣。如果你正在开发一款游戏,或者计划为你的项目加入一个引人入胜的对话系统,那么 Unity…

upload-labs关卡记录10

白名单,可以看到已经进行了限制,只能上传这三种后缀的文件,先试一试MIME绕过: 果然不行:观察到是post型,试一试00绕过:没找到路径,绕过失败。 看源码吧: $is_upload f…

专业140+总分410+南京大学851信号与系统考研经验南大电子信息通信集成电路,真题,大纲。参考书。

本人本科中等211,离保送本校差一点,考研前纠结本校还是追求更高目标,和家人聊了自己的想法,感谢父母对我的支持,坚定报考南大的目标,最终专业851信号与系统140,总分410顺利被南京大学录取&#…