紫光展锐M6780丨一语即达,“声”临其境

在前面四期,紫光展锐针对M6780的显示技术进行了系列揭秘。虽名为“智能显示芯片”,但M6780的魅力远不止于超高清智能显示,更有智能语音交互功能,助力打造数字世界的交互新体验。

智能语音技术是一种基于人工智能和语音识别技术的创新领域,它使得智能终端能够理解和处理用户的语音指令及交流。在智能家居和物联网领域,随着智能家居设备的普及和用户对便捷交互的需求增加,智能语音技术成为人们控制设备、查询信息、实现家居数字化的主要方式之一。

紫光展锐M6780从用户角度出发,在智能语音技术领域进行技术创新,带来了全面的体验升级!

图片

完整端侧智能语音解决方案-让交互“更智能”

语音助手如今已是智能终端的标配,M6780作为紫光展锐首款智能显示芯片集成了完整端侧智能语音方案。通过紫光展锐自研的多麦克风阵列分离降噪、智能语音唤醒识别、端侧命令词识别等技术,让芯片可以听得清、听得懂、能执行。

阵列分离降噪技术可以实现对外界干扰噪声和回声的抑制消除,让设备“听得清”;智能语音唤醒识别技术,确保设备“听得懂”。该方案(详见图二)完全集成在端侧,相对于云端唤醒识别算法,交互延迟更低,无需云端计算资源节省成本,且无隐私风险。

图片

多麦克风阵列分离降噪技术

在日常生活中,当电视正在播放电视节目,如果用户想语音控制电视,在嘈杂环境下设备如何才能够听清用户指令?这便需要回声消除技术——针对电视多扬声器、大音量的特性,紫光展锐研发出多通道立体声回声消除技术和自适应残留回声抑制技术,共同保证双工交互场景的成功率。

图片

针对家居场景中,噪声类型多、混响大、拾音距离远信噪比差的问题。紫光展锐将盲源分离和波束形成技术深度结合,实现了两者算法短板的互补,兼容了二者的优势。即使在多干扰的嘈杂环境也可以保障用户流畅交互。

M6780搭载了完整的声学前端阵列分离技术,能够解决噪声、回声和混响对用户交互体验的影响。经专业实验室测试,紫光展锐自研的声学前端系统使得噪声场景下唤醒率提升平均在25%左右,特别是低信噪比场景下,唤醒率提升明显。在回声场景下,唤醒率平均提升90%左右,达到了业界先进水平。

双级唤醒技术

语音唤醒作为语音交互的门户,需要24小时不间断运行(always on),需要保证高唤醒率、低误唤醒率,同时要求具有较低的计算和内存开销,以满足低功耗、低成本需求。为实现高性能、低功耗,展锐采用两级唤醒策略:

第一级唤醒模型为超轻量级,参数量仅为50k左右,部署在协处理器。当开启语音唤醒功能,一级唤醒处于always on状态,实时监测音频流中是否包含唤醒词。这个阶段只需要非常低的计算资源,因此在长时间运行的过程中能够有效地减少功耗,同时也能保证一个较高的召回率水平。

第二级模型建模粒度更细,计算量也更大,部署在主处理器,只有在一级唤醒网络检测成功后才会触发。该级唤醒能够压制从一级唤醒过来的几乎所有虚警,只有该级唤醒词识别成功后才会触发后续的语音响应。两级唤醒策略可以合理地使用SoC资源,在资源消耗和唤醒性能之间达到一个较好的平衡。

端侧命令词识别技术

唤醒只是语音交互的第一步,紧随而至的控制指令识别才是交互需求的目的。语音识别控制作为语音交互的核心诉求,需要满足低延迟、高准确率等,否则易降低用户使用语音助手的意愿。

紫光展锐M6780支持电视常用热词识别,即使在无网络的情况下,也可以实现对设备基本操作的控制。命令词识别过程中通常面临集内互为相近词的误识问题,例如“上一频道”和“下一频道”,这对于准确率的优化提升非常不利,而该问题对用户体验影响非常关键。因此紫光展锐在模型的区分性训练和解码优化策略上都针对性地提出了多种创新方案,在保证识别率的同时,集内相近词误识降低了48%。

同时,紫光展锐设计了“一语即达”one-shot方案(唤醒词和命令词一起说,不需要等待中间唤醒反馈),实现了更自然的人机交互方式。为了更贴合用户实际使用电视的习惯,我们也增加了设备“延时聆听”功能,用户仅需一次唤醒,在一定时间内实现多次交互控制的需求。

图片

噪声场景实验室唤醒性能对比图

图片

回声场景实验室唤醒性能对比图

紫光展锐M6780智能语音方案,在听音室客观条件下安静场景唤醒率98%、带噪场景综合唤醒率90%以上,虚警控制在1次/24h以下。命令词识别也实现了安静场景96%、带噪场景90%的识别率的高性能。在于不同竞品的对比测试中,M6780方案综合唤醒率排名位于前列,达到业界领先水平。M6780智能语音系统凭借优异的前后端音频算法以及软硬件实现,让语音交互“更智能”。

作为世界领先的平台型芯片设计企业,紫光展锐坚持以技术创新为核心,全力提升产品、技术能力,强化公司核心竞争力,推动公司跨越式发展,为产业和社会创造价值,用科技之光照亮幸福生活。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/373218.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

阅读笔记——《RapidFuzz: Accelerating fuzzing via Generative Adversarial Networks》

【参考文献】Ye A, Wang L, Zhao L, et al. Rapidfuzz: Accelerating fuzzing via generative adversarial networks[J]. Neurocomputing, 2021, 460: 195-204.【注】本文仅为作者个人学习笔记,如有冒犯,请联系作者删除。 目录 摘要 一、介绍 二、相关…

LangChain 82 LangGraph 从入门到精通四

LangChain系列文章 LangChain 60 深入理解LangChain 表达式语言23 multiple chains链透传参数 LangChain Expression Language (LCEL)LangChain 61 深入理解LangChain 表达式语言24 multiple chains链透传参数 LangChain Expression Language (LCEL)LangChain 62 深入理解Lang…

大数据可视化/算法推荐/情感分析——基于Django电影评论数据可视化分析推荐系统(完整系统源码+数据库+详细文档+论文+部署教程)

文章目录 大数据可视化/算法推荐/情感分析——基于Django电影评论数据情感分析可视化分析推荐系统源码资料获取方式在文章末尾 一、 选题背景二、研究目的三、开发技术介绍1、Django框架2、LDA3、机器学习推荐算法4、大数据爬虫5、大数据Echarts可视化 四、系统设计思想五、部分…

【数据结构】排序之冒泡排序和快速排序

简单不先于复杂,而是在复杂之后。 文章目录 1. 交换排序1.1 冒泡排序1.2 快速排序1.3 快速排序优化1.4 快速排序非递归 1. 交换排序 基本思想:所谓交换,就是根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,交换…

Python __file__属性:查看模块的源文件路径

除可以查看模块的帮助信息之外,还可以直接阅读模块的源代码来掌握模块功能,提升 Python 编程能力。 不管学习哪种编程语言,认真阅读那些优秀的框架、库的源代码都是非常好的学习方法。 通过模块的 __file__ 属性即可查看到指定模块的源文件…

如何基于 ESP 系列产品进行 BLE OTA 测试?

软件 esp-iot-solution\examples\bluetooth\ble_ota 例程BLE OTA 组件库:espressif/ble_ota 默认组件库支持 ESP32、ESP32C3、ESP32H2、ESP32S3 系列产品的测试。 硬件 ESP board 用于 BLE OTA 测试的手机 APP 安卓版本:esp-ble-ota-android IOS 版本…

第三篇:SQL数据模型、通用语法和语法分类

一,SQL数据模型 (一)关系型数据库(RDBMS) 1.概念 (百度百科)指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便于用户理解,关系型数据库这…

如何在Linux中安装新版的Python软件

一、引言 Python是目前世界上最为流行的编程语言,其在人工智能领域表现尤为出色。通常,我们为了测试github上面的一些项目,比如:chat-on-wechat, 我们就可以在vps上的Linux系统中安装Python,从而实现各种人…

Kafka零拷贝技术与传统数据复制次数比较

读Kafka技术书遇到困惑: "对比传统的数据复制和“零拷贝技术”这两种方案。假设有10个消费者,传统复制方式的数据复制次数是41040次,而“零拷贝技术”只需110 11次(一次表示从磁盘复制到页面缓存,另外10次表示10个消费者各自…

基于若依的ruoyi-nbcio流程管理系统自定义业务实现一种简单的动态任务标题需求

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址:RuoYi-Nbcio后台管理系统 更多nbcio-boot功能请看演示系统 gitee源代码地址 后端代码: https://gitee.com/nbacheng/n…

代码随想录day18--二叉树的应用6

LeetCode530.二叉搜索树的最小绝对差值 题目描述: 给你一个二叉搜索树的根节点 root ,返回 树中任意两不同节点值之间的最小差值 。 差值是一个正数,其数值等于两值之差的绝对值。 示例 1: 输入:root [4,2,6,1,3] …

WPF控件-ItemsControl

介绍 ItemsControl是用于展示一组项的控件。我们常见的列表&#xff08;ListBox&#xff09;、数据表格&#xff08;DataGrid&#xff09;等都是继承自ItemsControl。可用于自定义样式展示各种批量的数据集合。 常见使用示例&#xff1a; <ItemsControl ItemsSource"…

客户端会话技术-Cookie

一、会话技术 1.1 概述 会话&#xff1a;一次会话中包含多次**请求和响应** 一次会话&#xff1a;浏览器第一次给服务器资源发送请求&#xff0c;此时会话建立&#xff0c;直到有一方断开为止 会话的功能&#xff1a;在一次会话的范围内的多次请求间&#xff0c;共享数据 …

用 Delphi 程序调用 Python 代码画曲线图 -- 数据来自 Delphi 程序

接本博客上一篇文章&#xff0c;使用 Python 的 matplotlib 库画曲线。 上次是为了实现调用该库&#xff0c;数据是直接写死在 Python 代码里面的。代码是这一行&#xff1a; squares [1, 4, 9, 16, 25]; 既然是 Delphi 调用 Python 的库&#xff0c;数据应该是 Delphi 的程…

微信小程序的图片色彩分析,窃取网络图片的主色调

1、安装 Mini App Color Thief 包 包括下载包&#xff0c;简单使用都有&#xff0c;之前写了&#xff0c;这里就不写了 网址&#xff1a;微信小程序的图片色彩分析&#xff0c;窃取主色调&#xff0c;调色板-CSDN博客 2、 问题和解决方案 问题&#xff1a;由于我们的窃取图片的…

【大数据】Flink 中的 Slot、Task、Subtask、并行度

Flink 中的 Slot、Task、Subtask、并行度 1.并行度2.Task 与线程3.算子链与 slot 共享资源组4.Task slots 与系统资源5.总结 我们在使用 Flink 时&#xff0c;经常会听到 task&#xff0c;slot&#xff0c;线程 以及 并行度 这几个概念&#xff0c;对于初学者来说&#xff0c;这…

CAN总线接口–协议

8.2 CAN总线接口–协议 这一节我们将详细地了解CAN总线的协议以深入地掌握CAN总线应用和设计。目前CAN总线的标准化被分割成6个部分&#xff0c;即ISO 11898-1~6&#xff0c; 这个6个部分分别对CAN总线的链路层和物理层、高速物理介质附属层、低速物理介质附属层、时间触发的CA…

第八届:世界3D渲染挑战赛《无尽阶梯》正式开启

全世界的3D艺术创作者们引颈期盼的盛事“全球3D渲染艺术大奖赛”已迈入第八个年头。本届比赛的主题为“无尽的阶梯”&#xff0c;参赛者们可通过挑战赛展现自身的创造力&#xff0c;比赛在行业内拥有极高的知名度&#xff0c;含金量十足&#xff0c;参赛这可通过这里提高自己在…

给ChatGPT喂词,模仿风格

例如给出下面一段话&#xff1a; 翻译成中文&#xff1a; 下面图片是ChatGPT回复的&#xff1a; 下面的两张图是提示1和提示2在Midjourney里面生成的图&#xff0c;从图片上看整体画风出来的图片效果还是不错的&#xff1a; 章节视频 下载地址 请到到百度网盘自由观看 链接&a…

业务拓展利器!跨境电商如何选对代理IP?IPIDEA 一键连接全球商机!

文章目录 一、跨境电商发展与海外代理IP的重要性1.1 跨境电商的发展现状1.2 海外代理IP在跨境电商中的重要性 二、选对代理IP品牌的关键因素三、IPIDEA海外IP代理的优势3.1 IPIDEA的优势3.2 IPIDEA提供的代理类型 四、使用IPIDEA爬虫实战五、总结 一、跨境电商发展与海外代理IP…