使用超低功耗TinyML模型检测聋哑人士的手势语言

论文标题:Detecting Gesture Language for Deaf and Mute People Using Ultra-Low-Power TinyML Model

作者信息:

  • Basel A. Dabwan,来自也门Albaydha的Albaydha University的信息系统系。
  • Mukti E. Jadhav,来自印度Buldhana区Chikhali的Shri Shivaji Science & Art College的计算机科学系。
  • Omar A. Ismil,来自沙特阿拉伯Najran University的信息系统系。
  • Eman A. Hassan,来自沙特阿拉伯Najran University的计算机科学系。
  • Enaam A. Farah,来自沙特阿拉伯Najran University的计算机科学系。
  • Ashraf A. Mohammad,来自沙特阿拉伯Najran University的信息系统系预备部。
  • Yahya A. Ali,来自沙特阿拉伯Najran University的信息系统系。

论文出处:2024 International Conference on Data Science and Network Security (ICDSNS)


摘要: 手语是聋人交流的一种方式,通过手势和身体动作来传递信息。它包括手形、动作、方向和面部表情等元素,每个手势不仅代表一个词,还传达细微的语调。许多聋人面临口头交流的挑战,影响他们的文化技能。因此,开发一个手语翻译系统,特别是手语识别(SLR系统)对于他们的生活具有重要意义,它在连接聋人和听力正常人群方面发挥着重要作用,是人机交互研究中的关键领域。为了解决这一问题,我们使用了TinyML模型,该模型支持在微控制器上进行本地数据处理,而不依赖云服务。这项技术支持在资源和功耗受限的情况下,对机器学习模型进行推理,包括深度学习模型。我们的方法涉及使用代表ASL字母的数据集来训练TinyML模型,包括24类英文手语字母(不包括J和Z,因为它们涉及运动)。训练数据集包括27,455个实例,测试数据集为7,172个实例。我们将80%的数据集分配给训练目的,剩余的20%用于测试。结果非常令人鼓舞,达到了98%的准确率。这一成功强调了我们的模型在自动识别美国手语手势方面的潜力,从而改善了听力受损人群的交流和可访问性。

**关键词:**聋哑人、人工神经网络、深度学习、手势、图像处理、TinyML模型

引言: 手势对于有听力或言语障碍的个体来说,在促进交流方面发挥着至关重要的作用,为他们提供了一种替代的互动方式。它们是一种通用的交流工具,跨越语言障碍,在不同的文化背景和紧急情况下都非常宝贵。然而,由于手部动作的复杂性,掌握手语面临挑战,容易被混淆。因此,迫切需要一个能够自动识别手语的自动化系统来增强可访问性。

相关工作: Tiny Machine Learning(TinyML)正在推动智能制造业、医疗保健和自动驾驶等各个物联网领域的实质性进步。通过在通常在毫瓦级运行的超低功耗设备上本地运行深度学习任务,TinyML支持实时数据分析和解释。这种能力在延迟、隐私和成本效率方面提供了显著的优势。TinyML的一个关键目标是通过减少计算需求和数据消耗来优化深度学习系统的效率,从而促进边缘AI和物联网市场的增长。

提出模型: 我们的方法涉及一个系统化的过程。最初,我们收集了训练数据。随后,我们进行了数据清洗和准备,以便训练。接下来,我们将数据分为训练集和测试集。最后,我们采用了一种称为TinyML的专用模型进行手势分类。

结果与讨论: 将模型投入实践取得了显著的成功。它达到了98%的准确率,证明了其有效性。与预训练模型相比,我们自己的模型在手语检测方面取得了更好的性能。

结论: 为了增强交流可访问性,我们创建了将手语(许多聋哑人的主要交流方式)转换为普遍可理解格式的模型。这些模型是使用数据集构建并用现有的TinyML模型训练的,旨在通过促进他们的需求和愿望的清晰表达,为残疾人赋能。值得注意的是,这些模型之一达到了98%的准确率,突出了其巨大潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/889814.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HFSS 教程之材料添加

在用HFSS做仿真时,会用到多种材料,其材料库中的材料是有限的,有时仿真对象零件所用的材料并不包含在其材料库中,这时就需要新加材料。HSS自带的材料库,我们称之为系统材料库,新加的材料不能存入系统材料库中…

Kubernetes:Seccomp、AppArmor、SELinux Pod 安全性标准和准入

在云原生环境中,为确保容器化应用的安全运行,Kubernetes 利用了 Linux 内核的三大安全机制:Seccomp、AppArmor 和 SELinux,并引入了 Pod 安全性标准与准入控制来增强 Pod 的安全性。 Seccomp、AppArmor、SELinux 简介 Seccomp、…

前端vue的样式

sass/scss 语法说明 less sass stylus 都是 css 预处理器,语法上稍有差异,作用一样 都是让 css,增强能力,具备变量,函数.. 的能力 sass的语法两种语法 .sass 和 .scss .sass 和 .stylus 语法很像 (了解)要求省略 {} …

php的echo和print输出语句⑥

在 PHP 中有两个基本的输出方式&#xff1a; echo 和 print。 echo 和 print 区别: echo : 可以输出一个或多个字符串 print : 只允许输出一个字符串。 提示&#xff1a;echo 输出的速度比 print 快&#xff0c; echo 没有返回值&#xff0c;print有返回值1。 <?php …

java包和内部类1-cnblog

java包和内部类1 1 类名冲突 没有包的存在&#xff0c;管理类是一个很麻烦的问题&#xff0c;这个时候需要类包处理 2 完整类路径 在平时经常使用的String&#xff0c;并不是它的完整名称 一个完整的类名需要包名和类名的组合&#xff0c;每个类都属于一个类包&#xff0c…

02复写零

复写零 我们先进行异地复写&#xff1a;代码如下 public class Test {public static void main(String[] args) {int []array {1,0,2,3,0,4};duplicateZeros(array);}public static void duplicateZeros(int[] arr) {int [] elemnew int[arr.length];for(int cur0,dest0;des…

【动手学电机驱动】 TI InstaSPIN-FOC(1)电机驱动和控制测试平台

【动手学电机驱动】 TI InstaSPIN-FOC&#xff08;1&#xff09;电机驱动和控制测试平台 1. 本系列的资源需求1.1 电机驱动控制概况1.2 InstaSPIN-FOC 电机控制方案1.3 资源需求 2. 软件安装2.1 安装 CCS2.2 安装 MotorWare2.3 安装 ControlSUITE&#xff08;可选&#xff09; …

neo4j部署保姆级教程

由于公司是基于大数据架构的&#xff0c;让部署neo4j数据库&#xff0c;之前没有接触过&#xff0c;然后紧急学了一下&#xff0c;并且从网上找了一些教程&#xff0c;决定还是记录下来&#xff0c;后续有时间了会在出一篇使用教程 环境准备&#xff08;root用户&#xff09; …

Spring Boot课程问答:技术难题专家解答

摘要 随着信息互联网信息的飞速发展&#xff0c;无纸化作业变成了一种趋势&#xff0c;针对这个问题开发一个专门适应师生交流形式的网站。本文介绍了课程答疑系统的开发全过程。通过分析企业对于课程答疑系统的需求&#xff0c;创建了一个计算机管理课程答疑系统的方案。文章介…

Windows docker 部署MiGPT+ 本地Ollama

1. 下载 MiGPT https://github.com/idootop/mi-gpt https://github.com/idootop/mi-gpt/releases/tag/v4.2.0 2. 运行 Ollama qwen模型 3.配置Mi GPT .env .migpt.js 运行docker 运行 需要上网 docker run -d --env-file D:\LLM\mi-gpt-4.2.0\.env -v D:\LLM\mi-gpt-4.2.0…

Oracle登录报错-ORA-01017: invalid username/password;logon denied

接上文&#xff1a;Oracle创建用户报错-ORA-65096: invalid common user or role name 我以为 按照上文在PDB里创建了用户&#xff0c;我以为就可以用PLSQL远程连接了&#xff0c;远程服务器上也安装了对应版本的Oracle客户端&#xff0c;但是我想多了&#xff0c;客户只是新建…

保姆级教程 | VMD输出局部结构及利用TkConsole实现旋转

背景 由于课题需要,现需要展示lammps模拟轨迹中的局部结构(主要是想可视化这里的结果:保姆级教程 | 输出分子动力学轨迹文件输出特定原子范围内的化学环境),因为ovito效果有点笨笨的,所以我这里选用VMD软件为例进行操作,效果图(超级好看夸夸): (说明:主要的分子构…

2024最新分别用sklearn和NumPy设计k-近邻法对鸢尾花数据集进行分类(包含详细注解与可视化结果)

本文章代码实现以下功能&#xff1a; 利用sklearn设计实现k-近邻法。 利用NumPy设计实现k-近邻法。 将设计的k-近邻法对鸢尾花数据集进行分类&#xff0c;通过准确率来验证所设计算法的正确性&#xff0c;并将分类结果可视化。 评估k取不同值时算法的精度&#xff0c;并通过…

HarmonyOS第一课 04 应用程序框架基础-习题分析

判断题 1.在基于Stage模型开发的应用项目中都存在一个app.json5配置文件、以及一个或多个module.json5配置文件。T 正确(True) 错误(False) 这个答案是T - AppScope > app.json5&#xff1a;app.json5配置文件&#xff0c;用于声明应用的全局配置信息&#xff0c;比如应用…

【红外传感器】STM32C8T6标准库使用红外对管

好好学习&#xff0c;天天向上 前言一、了解红外二、标准库的代码1.infrared.c2.infrared.h3.main.c4 现象 总结 前言 红外线&#xff1a;频率介于微波与可见光之间的电磁波。 参考如下 【STM32】标准库与HAL库对照学习教程外设篇–红外避障传感器 光电红外传感器详解&#…

SpringCloud Alibaba-01 入门简介

1.Spring Cloud Alibaba 是由阿里巴巴结合自身丰富的微服务实践而推出的微服务开发的一站式解决方案。它是 Spring Cloud 生态中的第二代实现&#xff0c;提供了包括服务注册与发现、分布式配置管理、服务限流降级、消息驱动能力、阿里云对象存储、分布式任务调度等在内的多种功…

C语言-数据结构 折半查找

在折半查找中&#xff0c;刚开始学可能会在下标处产生困惑&#xff0c;例如奇数个长度的数组怎么处理&#xff0c;偶数个长度的数组怎么处理&#xff0c;不需要修改代码吗&#xff1f;并且下标我从1开始算和0开始算影响代码吗&#xff1f;其实都可以用一样的代码&#xff0c;产…

Java项目-----图形验证码登陆实现

原理: 验证码在前端显示,但是是在后端生成, 将生成的验证码存入redis,待登录时,前端提交验证码,与后端生成的验证码比较. 详细解释: 图形验证码的原理(如下图代码).前端发起获取验证码的请求后, 1 后端接收请求,生成一个键key(随机的键) 然后生成一个验证码作为map的valu…

蒙特卡罗方法 - 不同的峰值之间的混合挑战篇

序言 蒙特卡罗方法&#xff0c;也称为统计模拟法或统计试验法&#xff0c;是一种以概率统计理论为基础的数值模拟方法。自 20 20 20世纪 40 40 40年代中期提出以来&#xff0c;它因能灵活处理复杂计算问题而广泛应用于多个领域&#xff0c;如金融工程学、宏观经济学和计算物理…

Transformer 模型和 BERT 模型:概述

语言模型发展历程Language modeling history 多年来&#xff0c;语言建模一直在不断发展。过去十年的最新突破&#xff0c;包括使用神经网络来表示文本&#xff0c;比如2013年的Word2vec和N元语法&#xff0c;2014年开发的序列到序列模型&#xff0c;如RNN和LSTM帮助提高机器学…