音素与视素(Viseme)

什么是视素(视位)

音素(Phoneme),是人类语言中能够区别意义的最小声音单位。视素(Viseme),是指与某一音素相对应的嘴、舌头、下腭等可视发音器官所处的状态。Viseme是MPEG-4 标准提出来的概念。

有时Viseme也翻译为视位。下面会混用这两个翻译方法,但意义一样。

视素如何做动画

既然视素就是发音时嘴巴等部位的状态,如果能获取语音的音素序列,则可得对应的视素序列,按照一定的速度变换嘴巴、下巴的动作就可以实现语音的同步动画。

视素知多少

音素的数量虽多,但是由于很多因素的发音动作类似,他们对应的视素完全可以复用,所以整体上视素的数量远小于音素的种类。

由于不同的语言发音不同,视素也就不同。

国际音标视素

MPEG-4 把国际音标的发音分为 15 个静态视位。考虑到各种语言的发音特点和不同的音位组成,各国学者对不同语言的发音口形作了很多研究,现今多限于静态视位。如 Bothe 将德语发音口形分为 12 个静态视位、Le Goff 将法语发音口形分为 19 个静态视位、Ezzat 将英语发音口形分为 16 个静态视位、Lande 将意大利语发音口形分为 23 个静态视位等等。
在这里插入图片描述

汉语的视素

汉语由声母和韵母组成。其中声母都是辅音,韵母有的是元音,有的是元音和辅音的组合。
从音位的角度来考虑,汉语音位有 32 个,包括 22 个辅音音位和 10 个元音音位;从汉语发音的基
本组成单位来考虑,可以分为 21 个声母和 38 个韵母,其中韵母又可分为单韵母和复合韵母。

不同的人根据需要,对声母和韵母的归类不尽相同。对应的视素个数也就不同。

分类1

参考资料里《汉语语音视位的研究 王志明 蔡莲红》将汉语分为为 28 个基本的静态
视位。
在这里插入图片描述
在这里插入图片描述

分类2

《基于语音驱动的表情动画设计与实现-郭梦婷》里将汉语音素分为13类
在这里插入图片描述
在这里插入图片描述

分类3:微软的分类

根据微软:将音素映射到视素 ID 的描述,微软将视素分为22个(这22个视素考虑了各国语言的需要,并不是只针对中文):
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在微软:SSML 音标页面上,微软提供了汉语音素和视素的对应关系:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

分类4

根据游戏中口型动画合成系统的描述,只识别元音,使用5个非静音视位也可以满足简单的动画场景

在这里插入图片描述

分类5

《博士论文:真实感汉语可视语音合成关键技术研究-赵晖》里使用聚类方法来对汉语音素进行聚类,声母和韵母分别聚为5类。

在这里插入图片描述
作者总结的部分口型
在这里插入图片描述
在这里插入图片描述

总结

汉语的视素分类有很多种分法,可多可少。

参考资料

汉语语音视位的研究 王志明 蔡莲红

语音生成口型与表情技术的演进与未来

游戏中口型动画合成系统

什么是视素(Viseme)?该如何表示?

微软:将音素映射到视素 ID
微软:SSML 音标

《基于语音驱动的表情动画设计与实现-郭梦婷》

博士论文:真实感汉语可视语音合成关键技术研究-赵晖

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/554424.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JavaEE初阶Day 10:多线程(8)

目录 Day 10:多线程(8)单例模式阻塞队列1. 生产者消费者模型1.1 生产者消费者模型解耦合1.2 生产者消费者模型削峰填谷 2. 生产者消费者代码3. 阻塞队列实现 Day 10:多线程(8) 单例模式 单例模式&#xf…

springboot中mongodb连接池配置-源码分析

yml下spring.data.mongodb 以前mysql等在spring.xxx下配置,现在springboot新版本(小编3.2.3)在spring.data.xxx下了,如下所示,mongodb的配置在spring.data.mongodb下: 连接池相关参数配置-源码分析 拼接在…

vue3 删除对象中的属性,可以使用js里的delete,但需注意ts定义对象类型!

如上如,当使用delete 删除stateData中的属性时, 报错,意思为 TypeScript 错误“‘delete’ 运算符的操作数必须是可选的 什么原因呢?是因为我偷懒 缺少了ts定义类型 方法一: (不推荐) delete …

【网络安全 | 信息收集】JS文件信息收集工具LinkFinder安装使用教程

文章目录 前言安装教程使用教程 前言 JavaScript文件可能会泄露敏感信息,如注释中的机密信息、内部IP地址,以及包含未授权访问或其他漏洞的URL。手动检查这些信息效率低下,而该工具——LinkFinder,可用于自动收集JavaScript文件中…

Windows10系统中忘记MySQL数据库root权限登录密码

本文档所使用的MySQL版本为MySQL5.7>> mysqld_safe --skip-grant-tables&mysql -u root mysql在命令行中使用上面的命令登录MySQL,其中--skip-grant-tables允许用户跳过权限表进行无密码登录 >> UPDATE user SET authentication_stringPASSWORD(&q…

2024 年 Web 前端开发趋势

希腊哲学家赫拉克利特认为,变化是生命中唯一不变的东西。这句话适用于我们的个人生活、行业和职业领域。 尤其是前端开发领域,新技术、开发趋势、库和框架不断涌现,变化并不陌生。最近发生的一些事件正在改变开发人员构建网站和 Web 应用的方…

buuctf之ciscn_2019_c_1

ciscn_2019_c_1 一、查看属性二、静态分析三、动态分析四、思路五、exp 一、查看属性 首先还是必要的查看属性环节: 可以知道该文件是一个x86架构下的64位小端ELF文件,开启了栈不可执行(NX) 执行一下,先有一个选择&…

容联云QCon全球软件大会分享:大模型引领“营销服”创新实践

近日,QCon 全球软件开发大会正式召开。容联云大模型产品负责人唐兴才受邀出席,并分享营销服场景中,大模型的创新应用与实践。 唐兴才指出,在大模型浪潮的推动下,营销服场景正经历着前所未有的变革。面对激烈的市场竞争…

LineVul: 基于Transformer的行号级漏洞预测

文中提出一种基于Transformer的行号级漏洞预测方法 LineVul,以解决最先进的 IVDetect 方法的若干局限性。该方法通过对包含 188k C/C 函数的大规模真实数据集进行实证评估,LineVul 实现了:(1)函数级预测的 F1-measure …

sublime text的json快捷键

系统 macos 配置 sublime Text->Settings->Key Bindings 效果 可以看到,按:shiftcommandp,会出现快捷键窗口,打pretty,会出现Format JSON,最右侧显示⌘J,说明只需要macos的⌘和J同时按…

ASP.NET医院手麻信息系统源码 .NET6.0+VUE

目录 麻醉记录单 复苏记录单 麻醉文书 手术麻醉信息 1、 体征监控记录 2、 麻醉用药信息 3、 手术事件登记 4、 手术状态变更 5、 麻醉医师交接 6、 其他辅助操作 手麻信息系统是以服务围术期临床业务工作的开展为核心,通过与床边监护设备以及医院H…

物流单打印模板怎么设置,物流发货单打印软件操作教程

物流单打印模板怎么设置,物流发货单打印软件操作教程 一、前言 以下软件操作教程以,佳易王物流货运单管理系统软件为例说明 软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 佳易王物流单管理系统软件直接在空白单上打印可以在卷纸…

AI论文速读 | 2024[VLDB]TFB:全面与公正的时间序列预测方法基准测试研究

论文标题:TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods 作者:Xiangfei Qiu ; Jilin Hu(胡吉林) ; Lekui Zhou ; Xingjian Wu ; Junyang Du ; Buang Zhang ; Chenjuan Guo(郭…

mybatisPlus数据字段填充

这里用到的时实体类User import com.baomidou.mybatisplus.annotation.FieldFill; import com.baomidou.mybatisplus.annotation.TableField; import com.baomidou.mybatisplus.annotation.TableLogic; import com.baomidou.mybatisplus.annotation.TableName; import lombok.…

如何在ubuntu上使用clash

下载CLASH软件 修改配置文件 解压之后,将.env文件中的URL改为自己订阅的URL,然后再执行start.sh脚本 最后按照提示,将clash.sh添加到环境变量 如何修改端口 在start.sh中更改 祝大家在ubuntu上玩得开心

多高的学历才能轻松找到工作?这个热点有点扯吧~

先来唠唠 昨天刷脉脉的时候,热榜第一的内容吸引了我:多高的学历才能轻松找到工作? 现在这行情,不管多高得学历都很难说能轻松找到工作吧~ 评论区也有不少小伙伴发表自己的见解,比如: 学历固然是非常重要…

C++ 小项目 - 通讯录管理系统

C 小项目系列教程: 通讯录管理系统 ➡️➡️➡️本教程参考自 黑马程序员 C 视频课程 其中的 Markdown 文档,仅用于自己学习,源码发布在 Contact-Management。 文章目录 1. 系统需求2. 创建项目3. 菜单4. 主要功能4.1 添加联系人4.2 显示联系…

关于主干布线,你应该知道什么

所有大型建筑都需要复杂的通信网络才能有效运行。这需要多个不同的通信室和电缆将这些房间连接在一起。在这里,骨干布线是任何建筑物通信系统的重要组成部分,可以发挥作用。 那么,什么是骨干布线?它是做什么用的?它究…

Monaco Editor系列(四)版本对比、自定义右键菜单、光标滚动

前言:亲爱的小伙伴们,又见面了!上一篇文章我们一起学习了 Monaco Editor 的几个功能,设置内容、多文件编辑、自定义主题;下面让我们继续Monaco Editor的旅程吧! 前情提要: 上一篇文章我介绍了M…

Facebook隐私保护:用户数据安全的关键挑战

在数字化时代,数据已成为最宝贵的资源之一。社交媒体平台如Facebook为用户提供了便捷的交流和信息分享工具,但同时也面临着如何保护用户数据安全和隐私的挑战。本文将深入探讨Facebook在数据安全方面面临的关键挑战,以及其如何应对这些挑战&a…