音素与视素（Viseme）

音素与视素（Viseme）

article2024/12/28 10:47:30/文章来源:https://blog.csdn.net/yuanlulu/article/details/137891803

什么是视素（视位）

音素(Phoneme)，是人类语言中能够区别意义的最小声音单位。视素(Viseme)，是指与某一音素相对应的嘴、舌头、下腭等可视发音器官所处的状态。Viseme是MPEG-4 标准提出来的概念。

有时Viseme也翻译为视位。下面会混用这两个翻译方法，但意义一样。

视素如何做动画

既然视素就是发音时嘴巴等部位的状态，如果能获取语音的音素序列，则可得对应的视素序列，按照一定的速度变换嘴巴、下巴的动作就可以实现语音的同步动画。

视素知多少

音素的数量虽多，但是由于很多因素的发音动作类似，他们对应的视素完全可以复用，所以整体上视素的数量远小于音素的种类。

由于不同的语言发音不同，视素也就不同。

国际音标视素

MPEG-4 把国际音标的发音分为 15 个静态视位。考虑到各种语言的发音特点和不同的音位组成，各国学者对不同语言的发音口形作了很多研究，现今多限于静态视位。如 Bothe 将德语发音口形分为 12 个静态视位、Le Goff 将法语发音口形分为 19 个静态视位、Ezzat 将英语发音口形分为 16 个静态视位、Lande 将意大利语发音口形分为 23 个静态视位等等。
在这里插入图片描述

汉语的视素

汉语由声母和韵母组成。其中声母都是辅音，韵母有的是元音，有的是元音和辅音的组合。
从音位的角度来考虑，汉语音位有 32 个，包括 22 个辅音音位和 10 个元音音位；从汉语发音的基
本组成单位来考虑，可以分为 21 个声母和 38 个韵母，其中韵母又可分为单韵母和复合韵母。

不同的人根据需要，对声母和韵母的归类不尽相同。对应的视素个数也就不同。

分类1

参考资料里《汉语语音视位的研究王志明蔡莲红》将汉语分为为 28 个基本的静态
视位。
在这里插入图片描述

分类2

《基于语音驱动的表情动画设计与实现-郭梦婷》里将汉语音素分为13类
在这里插入图片描述

分类3：微软的分类

根据微软：将音素映射到视素 ID 的描述，微软将视素分为22个（这22个视素考虑了各国语言的需要，并不是只针对中文）：
在这里插入图片描述

在微软：SSML 音标页面上，微软提供了汉语音素和视素的对应关系：

分类4

根据游戏中口型动画合成系统的描述，只识别元音，使用5个非静音视位也可以满足简单的动画场景

在这里插入图片描述

分类5

《博士论文：真实感汉语可视语音合成关键技术研究-赵晖》里使用聚类方法来对汉语音素进行聚类，声母和韵母分别聚为5类。

在这里插入图片描述
作者总结的部分口型

总结

汉语的视素分类有很多种分法，可多可少。

参考资料

汉语语音视位的研究王志明蔡莲红

语音生成口型与表情技术的演进与未来

游戏中口型动画合成系统

什么是视素(Viseme)？该如何表示？

微软：将音素映射到视素 ID
微软：SSML 音标

《基于语音驱动的表情动画设计与实现-郭梦婷》

博士论文：真实感汉语可视语音合成关键技术研究-赵晖

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/554424.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

JavaEE初阶Day 10：多线程（8）

JavaEE初阶Day 10：多线程（8）

目录 Day 10：多线程（8）单例模式阻塞队列1. 生产者消费者模型1.1 生产者消费者模型解耦合1.2 生产者消费者模型削峰填谷 2. 生产者消费者代码3. 阻塞队列实现 Day 10：多线程（8） 单例模式单例模式&#xf…

阅读更多...

springboot中mongodb连接池配置-源码分析

springboot中mongodb连接池配置-源码分析

yml下spring.data.mongodb 以前mysql等在spring.xxx下配置，现在springboot新版本（小编3.2.3）在spring.data.xxx下了，如下所示，mongodb的配置在spring.data.mongodb下： 连接池相关参数配置-源码分析拼接在…

阅读更多...

vue3 删除对象中的属性，可以使用js里的delete，但需注意ts定义对象类型！

vue3 删除对象中的属性，可以使用js里的delete，但需注意ts定义对象类型！

如上如，当使用delete 删除stateData中的属性时， 报错，意思为 TypeScript 错误“‘delete’ 运算符的操作数必须是可选的什么原因呢？是因为我偷懒缺少了ts定义类型方法一： （不推荐） delete …

阅读更多...

【网络安全 | 信息收集】JS文件信息收集工具LinkFinder安装使用教程

【网络安全 | 信息收集】JS文件信息收集工具LinkFinder安装使用教程

文章目录前言安装教程使用教程前言 JavaScript文件可能会泄露敏感信息，如注释中的机密信息、内部IP地址，以及包含未授权访问或其他漏洞的URL。手动检查这些信息效率低下，而该工具——LinkFinder，可用于自动收集JavaScript文件中…

阅读更多...

Windows10系统中忘记MySQL数据库root权限登录密码

Windows10系统中忘记MySQL数据库root权限登录密码

本文档所使用的MySQL版本为MySQL5.7>> mysqld_safe --skip-grant-tables&mysql -u root mysql在命令行中使用上面的命令登录MySQL，其中--skip-grant-tables允许用户跳过权限表进行无密码登录 >> UPDATE user SET authentication_stringPASSWORD(&q…

阅读更多...

2024 年 Web 前端开发趋势

2024 年 Web 前端开发趋势

希腊哲学家赫拉克利特认为，变化是生命中唯一不变的东西。这句话适用于我们的个人生活、行业和职业领域。尤其是前端开发领域，新技术、开发趋势、库和框架不断涌现，变化并不陌生。最近发生的一些事件正在改变开发人员构建网站和 Web 应用的方…

阅读更多...

buuctf之ciscn_2019_c_1

buuctf之ciscn_2019_c_1

ciscn_2019_c_1 一、查看属性二、静态分析三、动态分析四、思路五、exp 一、查看属性首先还是必要的查看属性环节： 可以知道该文件是一个x86架构下的64位小端ELF文件，开启了栈不可执行（NX） 执行一下，先有一个选择&…

阅读更多...

容联云QCon全球软件大会分享：大模型引领“营销服”创新实践

容联云QCon全球软件大会分享：大模型引领“营销服”创新实践

近日，QCon 全球软件开发大会正式召开。容联云大模型产品负责人唐兴才受邀出席，并分享营销服场景中，大模型的创新应用与实践。唐兴才指出，在大模型浪潮的推动下，营销服场景正经历着前所未有的变革。面对激烈的市场竞争…

阅读更多...

LineVul: 基于Transformer的行号级漏洞预测

LineVul: 基于Transformer的行号级漏洞预测

文中提出一种基于Transformer的行号级漏洞预测方法 LineVul，以解决最先进的 IVDetect 方法的若干局限性。该方法通过对包含 188k C/C 函数的大规模真实数据集进行实证评估，LineVul 实现了：（1）函数级预测的 F1-measure …

阅读更多...

sublime text的json快捷键

sublime text的json快捷键

系统 macos 配置 sublime Text->Settings->Key Bindings 效果可以看到，按：shiftcommandp，会出现快捷键窗口，打pretty，会出现Format JSON，最右侧显示⌘J，说明只需要macos的⌘和J同时按…

阅读更多...

ASP.NET医院手麻信息系统源码 .NET6.0+VUE

ASP.NET医院手麻信息系统源码 .NET6.0+VUE

目录麻醉记录单复苏记录单麻醉文书手术麻醉信息 1、体征监控记录 2、麻醉用药信息 3、手术事件登记 4、手术状态变更 5、麻醉医师交接 6、其他辅助操作手麻信息系统是以服务围术期临床业务工作的开展为核心，通过与床边监护设备以及医院H…

阅读更多...

物流单打印模板怎么设置，物流发货单打印软件操作教程

物流单打印模板怎么设置，物流发货单打印软件操作教程

物流单打印模板怎么设置，物流发货单打印软件操作教程一、前言以下软件操作教程以，佳易王物流货运单管理系统软件为例说明软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载佳易王物流单管理系统软件直接在空白单上打印可以在卷纸…

阅读更多...

AI论文速读 | 2024[VLDB]TFB：全面与公正的时间序列预测方法基准测试研究

AI论文速读 | 2024[VLDB]TFB：全面与公正的时间序列预测方法基准测试研究

论文标题：TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods 作者：Xiangfei Qiu ; Jilin Hu（胡吉林） ; Lekui Zhou ; Xingjian Wu ; Junyang Du ; Buang Zhang ; Chenjuan Guo（郭…

阅读更多...

mybatisPlus数据字段填充

mybatisPlus数据字段填充

这里用到的时实体类User import com.baomidou.mybatisplus.annotation.FieldFill; import com.baomidou.mybatisplus.annotation.TableField; import com.baomidou.mybatisplus.annotation.TableLogic; import com.baomidou.mybatisplus.annotation.TableName; import lombok.…

阅读更多...

如何在ubuntu上使用clash

如何在ubuntu上使用clash

下载CLASH软件修改配置文件解压之后，将.env文件中的URL改为自己订阅的URL，然后再执行start.sh脚本最后按照提示，将clash.sh添加到环境变量如何修改端口在start.sh中更改祝大家在ubuntu上玩得开心

阅读更多...

多高的学历才能轻松找到工作？这个热点有点扯吧~

多高的学历才能轻松找到工作？这个热点有点扯吧~

先来唠唠昨天刷脉脉的时候，热榜第一的内容吸引了我：多高的学历才能轻松找到工作？ 现在这行情，不管多高得学历都很难说能轻松找到工作吧~ 评论区也有不少小伙伴发表自己的见解，比如： 学历固然是非常重要…

阅读更多...

C++ 小项目 - 通讯录管理系统

C++ 小项目 - 通讯录管理系统

C 小项目系列教程： 通讯录管理系统 ➡️➡️➡️本教程参考自黑马程序员 C 视频课程其中的 Markdown 文档，仅用于自己学习，源码发布在 Contact-Management。文章目录 1. 系统需求2. 创建项目3. 菜单4. 主要功能4.1 添加联系人4.2 显示联系…

阅读更多...

关于主干布线，你应该知道什么

关于主干布线，你应该知道什么

所有大型建筑都需要复杂的通信网络才能有效运行。这需要多个不同的通信室和电缆将这些房间连接在一起。在这里，骨干布线是任何建筑物通信系统的重要组成部分，可以发挥作用。那么，什么是骨干布线？它是做什么用的？它究…

阅读更多...

Monaco Editor系列（四）版本对比、自定义右键菜单、光标滚动

Monaco Editor系列（四）版本对比、自定义右键菜单、光标滚动

前言：亲爱的小伙伴们，又见面了！上一篇文章我们一起学习了 Monaco Editor 的几个功能，设置内容、多文件编辑、自定义主题；下面让我们继续Monaco Editor的旅程吧！ 前情提要： 上一篇文章我介绍了M…

阅读更多...

Facebook隐私保护：用户数据安全的关键挑战

Facebook隐私保护：用户数据安全的关键挑战

在数字化时代，数据已成为最宝贵的资源之一。社交媒体平台如Facebook为用户提供了便捷的交流和信息分享工具，但同时也面临着如何保护用户数据安全和隐私的挑战。本文将深入探讨Facebook在数据安全方面面临的关键挑战，以及其如何应对这些挑战&a…

阅读更多...

最新文章