瑞芯微RV1126——人脸识别框架分析

项目核心是在Linux平台上利用摄像头采集人脸,并进行人脸识别。这个项目使用的是FFMPEG+OPENCV+虹软框架完成。

  • FFMPEG的主要工作是负责采集摄像头的数据并把摄像头数据发送给opencv。

  • Opencv的主要工作则是把摄像头数据转换成矩阵数据。

  • 虹软的主要功能则是利用Opencv的数据进行数据检测和识别并且和人脸数据库进行比较,如果识别成功则显示这个人的姓名,并把数据显示出来。

1.虹软人脸识别

(1).初始化所有的固件,如虹软SDK的激活、sqlite3人脸数据库的初始化并存放到map

init_asfort_device函数是激活虹软SDK
init_face_data函数是把人脸识别库查询出来并存放到Map,Map的key是人脸的名称,Value是人脸的特征(特征是blob数据)

(2).初始化工作线程,这三个线程分别是视频采集线程、虹软识别线程、显示线程。这三个线程的关系如下图:

视频采集线程(read_camera_thread):利用FFMPEG去进行采集摄像头的数据,并把摄像头的YUV存放到缓存队列里面,这里的缓存队列使用的是AVFifoBuffer进行存储(操作的API是av_fifo_generic_write写入YUV数据)。

虹软识别线程(process_asfort_recognize_thread):从AVFifoBuffer队列里面取出YUV数据(操作的API是av_fifo_generic_read读取YUV数据)并利用OPENCV框架进行转换,转换完成之后,利用虹软人脸识别API进行识别操作。识别完成之后,则把识别结果存放到显示队列(putMatQueue)里面

视频显示线程(show_opencv_thread):从opencv_queue队列取出每一帧数据(getMatQueue操作)处理过后的数据,显示到播放器里面。

**重点:**这个项目重点在于多线程和队列的操作,一般一个大型的项目都需要用到多线程的操作。因为使用多线程能够充分利用CPU资源,并快速响应。这个项目使用了三个线程去处理,分别是视频采集线程、 虹软识别线程、 视频显示线程。而线程之间的通信则利用队列进行通信。

2.Rockx Face人脸识别流程

1.目前本项目用rockx_face框架进行人脸识别

本项目的流程是先初始化rv1126的输入设备节点还有HDR设备功能(HDR功能是因为我的设备需要开启HDR才能够正常显示,这个看具体的设备),还有VO设备节点(设备输出节点)。

1.1.VI设备的初始化:

VI_CHN_ATTRS vi_chn_attr;
vi_chn_attr.pcVideoNode = pDeviceName;
vi_chn_attr.u32Bufcnt = u32Bufcnt;
vi_chn_attr.u32Width =u32width;
vi_chn_attr.u32Height = u32Height;
vi_chn_attr.enPixFmt = IMAGE TYPE NV12;
vi_chn_attr.enBufType =VI_CHN_BUF_TYPE_MMAP;
vi_chn_attr.enWorkMode =VI_WORK_MODE_NORMAL;
ret =RK_MPI_VI_SetchnAttr(s32CamId, l,&vi_chn_attr);
ret |= RK_MPI_VI_Enablechn(s32camId, 1);
if(ret){
	printf("ERROR: create VI[o] error! ret=d\n",ret);
    return 0;
}

上述代码是VI设备的初始化操作,这里涉及的参数包括pcVideoNode(设备节点)、u32Width(长度)、u32Height(高度)、enPixFmt(像素类型)、enBufType(VI捕获视频缓冲区计数)、enWorkMode(VI通道工作模式)。

1.2.HDR设备的初始化:

rk_aiq_working_mode_t hdr mode = RK_AIQ_WORKING_MODE_NORMAL;
SAMPLE_COMM_ISP_Init(hdr_mode, RK_FALSE);
SAMPLE_COMM_ISP_Run();
SAMPLE_COMM_ISP_SetFrameRate(25);

if(poutPath){
    g_output_file = fopen(poutPath,"w");
    if(!g_output_file){
        printf("ERROR: open file:&s fail,exit\n", poutPath);
        return 0;
    }
}

上述代码则是启动HDR功能的流程代码,这里直接调用SAMPLE_COMM_ISP_Run API进行HDR功能的开启。

1.3. VO设备的初始化

VO_CHN_ATTR_S stVoAttr ={0};stVoAttr.pcDevNode ="/dev/dri/card";stVoAttr.emPlaneType = VO_PLANE_OVERLAY;stVoAttr.enImgType = IMAGE_TYPE_NV12;stVoAttr.u16Zpos = 0;stVoAttr.stImgRect.s32X = 0;stVoAttr.stImgRect.s32Y = 0;stVoAttr.stImgRect.u32Width = disp width;stVoAttr.stImgRect.u32Height = disp height;stVoAttr.stDispRect.s32X = 0;stVoAttr.stDispRect.s32Y = 0;stVoAttr.stDispRect.u32Width = disp width;stVoAttr.stDispRect.u32Height = disp height;ret = RK MPI Vo Createchn(0,&stVoAttr);if(ret){    printf("Create vo[0] failed! ret=%d\n", ret);    return -1;}

上述代码是VO设备的初始化,这里涉及的参数包括:pcDevNode(输出设备节点)、emPlaneType(视频输出图层类型)、enImgType(视频输出类型)、stImgRect(视频输入图像格式)、stDispRect(输出图层尺寸参数)。

2.初始化完成之后,则开启两个线程进行开发,分别是rockx_rga_vi_test_thread线程、rockx_process_vo_thread线程。

rockx_rga_vi_test_thread线程主要功能是,从rv1126摄像头数据拿到原始数据(NV12)数据,并利用rockx框架进行人脸检测、人脸识别、实时画框等操作。并把处理过后的原始数据存放到队列rockx_queue里面。

rockx_process_vo_thread线程的主要功能是,阻塞rockx_queue队列操作,等待数据的到来。当rockx_queue有数据来的时候,则把处理过后的数据传送给VO设备。

具体的看流程图:

3.YOLOV3目标识别说明

1.加载YOLOV3的文件,并把标签名称存放到容器里面

std::ifstream ifs(yolov3_model_file.c_str());
    if (!ifs.is_open())
    {
        std::cerr << "File " + yolov3_model_file + " not found";
        return -1;
    }
    std::string line;
    while (std::getline(ifs, line))
    {
        classes.push_back(line);
}

2.初始化工作线程,这三个线程分别是视频采集线程、yolov3识别线程、显示线程。这三个线程的关系如下图:

**视频采集线程(read_camera_thread):**利用FFMPEG去进行采集摄像头的数据,并把摄像头的YUV存放到缓存队列里面,这里的缓存队列使用的是AVFifoBuffer进行存储(操作的API是av_fifo_generic_write写入YUV数据)。

**Yolov3识别线程(process_avframe_dnn_thread):**从AVFifoBuffer队列里面取出YUV数据(操作的API是av_fifo_generic_read读取YUV数据)并利用OPENCV框架进行转换,转换完成之后,利用Opencv DNN API进行YOLOV3识别操作(具体的YOLOV3识别步骤非常复杂,后面会慢慢讲到)。识别完成之后,则把识别结果存放到显示队列(putMatQueue)里面.

**视频显示线程(show_opencv_thread):**从opencv_queue队列取出每一帧数据(getMatQueue操作)处理过后的数据,显示到播放器里面。

重点:这个项目重点在于多线程和队列的操作,一般一个大型的项目都需要用到多线程的操作。因为使用多线程能够充分利用CPU资源,并快速响应。这个项目使用了三个线程去处理,分别是视频采集线程、 YOLOV3识别线程、 视频显示线程。而线程之间的通信则利用队列进行通信。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/639552.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

K8s 二进制部署---下篇(多master节点 负载均衡 高可用)

一 master02 节点部署 master01192.168.11.5kube-apiserver&#xff0c;kube-controller-manager&#xff0c;kube-scheduler&#xff0c;etcdmaster02192.168.11.12kube-apiserver&#xff0c;kube-controller-manager&#xff0c;kube-scheduler&#xff0c;etcdnode01192.1…

WebGL渲染引擎优化方向——渲染帧率的优化

作者&#xff1a;caven chen 对此内容感兴趣还可以看前文&#xff1a; WebGL渲染引擎优化方向——加载性能优化 前言 WebGL 是一种强大的图形渲染技术&#xff0c;可以在浏览器中快速渲染复杂的 3D 场景。但是&#xff0c;由于 WebGL 的高性能和高质量要求&#xff0c;如果…

白嫖免费图床!CloudFlare R2太香了!

1 为啥要折腾搭建一个专属图床&#xff1f; 技术大佬写博客都用 md 格式&#xff0c;要在多平台发布&#xff0c;图片就得有外链后续如博客迁移&#xff0c;国内博客网站如掘金&#xff0c;简书&#xff0c;语雀等都做了防盗链&#xff0c;图片无法迁移 2 为啥选择CloudFlare…

记录一个写SpringBoot中Hive数据可以正常提取但无法存到MySQL的bug

【背景】 我正在用SpringBoot框架写一个数据治理项目&#xff0c;目前所处阶段是将hive和hdfs中的元数据提取出来&#xff0c;存储到MySQL中&#xff0c;我的hive和hdfs上的数据存储在三台Linux服务器上&#xff08;hadoop102-104&#xff09;&#xff0c;MySQL在我本地Window…

运行vue2项目基本过程

目录 步骤1 步骤2 步骤3 补充&#xff1a; 解决方法&#xff1a; node-scss安装失败解决办法 步骤1 安装npm 步骤2 切换淘宝镜像 #最新地址 淘宝 NPM 镜像站喊你切换新域名啦! npm config set registry https://registry.npmmirror.com 步骤3 安装vue-cli npm install…

【Python进阶】主流电商平台数据分析||数据采集返回商品详情主题链接主图SKU数据

Python是一种高级编程语言&#xff0c;广泛应用于软件开发、数据分析、人工智能、科学计算等领域。在软件开发方面&#xff0c;Python在网站开发、网络编程、桌面软件开发等方面有着广泛的应用。在数据分析和人工智能领域&#xff0c;Python的各种库如NumPy、Pandas、Matplotli…

小程序开发的基本用法

一:基本组件 1.view和scroll-view view等同于div,view写在小程序显示和div一样的效果. srcoll-view scroll-x/scroll-y是div能移动的.但是小程序没有显示大的划的. 且scroll-view才能实现这个,要这个组件且要属性,内部基本结构才能实现. view没有属性实现. 2.swiper和swi…

温故而知新-秒杀项目篇【面试复习】

温故而知新-秒杀项目篇【面试复习】 前言版权推荐温故而知新-论坛项目篇【面试】秒杀项目中注册模块怎么实现的&#xff1f;秒杀项目中登录模块怎么实现的&#xff1f;秒杀项目中显示登录用户信息怎么实现的&#xff1f;SessionStorage是什么?为什么不用session而用token什么是…

初识C语言——第二十五天

函数的嵌套调用和链式访问 函数不可以嵌套定义&#xff0c;但可以嵌套调用 链式访问&#xff1a;把一个函数的返回值作为另外一个函数的参数 #define _CRT_SECURE_NO_WARNINGS 1 #include <stdio.h>//写一个函数&#xff0c;每调用一次这个函数&#xff0c;就会 将num…

数据结构之时间复杂度和空间复杂度的相关计算

找往期文章包括但不限于本期文章中不懂的知识点&#xff1a; 个人主页&#xff1a;我要学编程(ಥ_ಥ)-CSDN博客 所属专栏&#xff1a;数据结构&#xff08;Java版&#xff09; 目录 时间复杂度 概念 大O的渐进表示法 相关练习 例1&#xff1a; 例2&#xff1a; 例3&am…

可转债日内自动T+0交易,行情推送+策略触发+交易接口

说明 目前这个项目已编译打包,下载即可测试,直接生成多平台可执行文件&#xff0c;详见运行方法。行情部分与策略弱相关&#xff0c;拆分解耦单独作为一个项目。行情项目请移步GitHub - freevolunteer/hangqing: A股行情订阅工具&#xff0c;支持股票/可转债level2/level2数据&…

MySQL主从复制(三):主从延迟

主备流程图&#xff1a; 谈到主备的复制能力&#xff0c;要关注的是上图中的两个黑色箭头。 一个箭头代表了客户端写入主库&#xff0c;另一个箭头代表的是sql_thread执行中转日志&#xff08;relay log&#xff09;。如果用箭头的粗细来代表并行度的话&#xff0c;那么真实情…

svg中path的直线命令使用

path路径 <path>元素是SVG基本形状中最强大的一个。可以使用它来创建线条&#xff0c;曲线&#xff0c;弧形等等。 另外&#xff0c;path只需要设定很少的点&#xff0c;就可以创建平滑流畅的线条&#xff08;比如曲线&#xff09;。虽然polygon元素也可以实现类似的效…

UPPAAL使用方法

UPPAAL使用方法 由于刚开始学习时间自动机及其使用方法&#xff0c;对UPPAAL使用不太熟悉&#xff0c;网上能找到的教程很少&#xff0c;摸索了很久终于成功实现一个小例子&#xff0c;所以记录一下详细教程。 这里用到的例子参考【UPPAAL学习笔记】1&#xff1a;基本使用示例…

linux-配置服务器之间 ssh免密登录

前言 在管理多台Linux服务器时,为了方便操作和自动化任务,实现服务器之间的SSH免密登录是非常有必要的。SSH免密登录可以避免每次远程连接时输入密码,大大提高效率。本文将详细介绍SSH免密登录的原理和实现步骤。 一、原理解释 SSH免密登录的实现依赖于SSH密钥对,主要是利用…

2.行为参数的演变过程

2.行为参数的演变过程 ​ 行为参数化是软件开发模式&#xff0c;可以处理频繁变更的需求。它让你把一个代码块准备好但不执行&#xff0c;以后可以被其他部分调用&#xff0c;也可以作为参数传递给另一个方法&#xff0c;推迟执行。这样&#xff0c;方法的行为就基于参数化的代…

O2OA(翱途)开发平台数据统计如何配置?

O2OA提供的数据管理中心&#xff0c;可以让用户通过配置的形式完成对数据的汇总&#xff0c;统计和数据分组展现&#xff0c;查询和搜索数据形成列表数据展现。也支持用户配置独立的数据表来适应特殊的业务的数据存储需求。本文主要介绍如何在O2OA中开发和配置统计。 一、先决…

03-ArcGIS For JavaScript结合ThreeJS功能

ArcGIS For JavaScript结合ThreeJS功能 概述three.js中功能实现externalRenderers&#xff08;4.28及以下版本&#xff09;RenderNode&#xff08;4.29版本&#xff09; 概述 ArcGIS For Javacript提供了一些对象可以支持加载webgl上下文信息&#xff0c;这里包括webgl编程的代…

汽车IVI中控开发入门及进阶(二十):显示技术之LCDC

TFT LCD=Thin Film Transistor Liquid Crystal Display LCDC=LCD Controller 薄膜晶体管液晶显示器(TFT LCD)控制器在驱动现代显示技术的功能和性能方面起着关键作用。它们充当屏幕后面的大脑,仔细处理数字信号,并将其转化为精确的命令,决定每个像素的行为,决定它们的…

Linux中gcc/g++的基本使用

目录 gcc/g的使用gcc/g是如何生成可执行文件的预处理编译汇编链接 库.o文件是如何与库链接的&#xff1f; debug版本和release版本 gcc/g的使用 在windows中&#xff0c;我们在VS中编写好了代码之后就可以直接在VS中对源码进行编译等操作后运行 而在Linux下&#xff0c;我们可…