汉语语音基本特性

发音的生理基础和过程

人的发音生理机构如图 2.3.1所示,发音时由肺部收缩送出一股直流空气,经气管流至喉头声门处(声门即声带开口处),在发声之初,声门处的声带肌肉收缩,声带并拢间隙小于 1mm,这股直流空气冲过很小的缝隙,使声带得到横向和纵向的速度,此时,声带向两边运动,缝隙增大(成年男性开到最大时,截面积约为 20mm),声门处压力下降,弹性恢复力将声带拉回平衡位置并继续趋向闭合,即声带产生振动,而且具有一定的振动周期,如图 2.3.2所示。

在这里插入图片描述
一般把声门以上,经咽喉、口腔(舌、、腭、小舌)的这一管道称为主声道,成年男子的主声道长度约 17cm,而经小舌和鼻腔的这一管道称为鼻道。此外,经肺、支气管和气管的管道称为次声门系统。由声带振动激发声道中空气发生振动,并从口和鼻两处向外辐射产生声音。声道的口、鼻两个管道中,从鼻咽部到鼻孔的分支称为鼻道分支,只有在发鼻音时才打开,从声门到唇是主声道,它被舌面隆起点隔开,近视可看出咽腔(后腔)、小管、口腔(前腔)等几部分,当发一语音时,声道肌肉(包括舌面)运动到一个特定的部位,构成·一定声道的位形,形成该语音的特定音色。

语音按其激励形式的不同大致可以分成三类。当气流通过声门时,如果声带的张力刚好使声带产生张弛振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音(Voiced Speech)或称有声语音。如果声带不振动,而声道在某处收缩,迫使气流以高速通过这一收缩部分而产生湍流就产生清音(Unvoiced Speech)或摩擦音,或称无声语音。如果声道在完全闭合的情况下突然释放就产生爆破音(Plosive Speech)。

人的声道和鼻道都是非均匀的声道管,声道管的谐振频率称为共振峰频率,或简称为共振峰。它与发音器官的确切位置有很大的关系,即共振峰和声道的形状与大小有关。表2.3.1给出了普通话7个韵母的共振峰频率。从表中可以看到,各韵母音色上的差异可用前3个共振峰(F1,F2,F3)来表示,F1主要分布在290Hz-1kHz范围内,F2分布在500Hz-2.5kHz范围内,而F3分布在2.5kHz-4kHz范围内。
在这里插入图片描述
语音信号随时间而变化的谱特性可以利用语图仪(Spectrograph)用图形显示,此图有时也称为语谱图,是一种三维图形,纵轴对应于频率,横轴对应于时间,图像的黑白度正比于语音信号的能量

图2.3.3所示为普通话语音的语谱图。在汉语里,最小的语音单位是音素,是从音色的角度分出来的。一个音素单独存在或几个音素结合起来构成的单位叫音节。音节就是说话时自然的发音单位,可以从听觉上把它们分开。在物理上,以发音器官肌肉紧张度的增减为依据,每一次肌肉紧张度的增而变减就造成一个音节。汉语一般是一字一音节,少数例外的两音节一字和两字一音节(如“花儿”等)。

在这里插入图片描述

汉语语音基本特性

汉语的音节由声母、韵母和声调组成。一个音节起头的辅音是声母,声母后边都分是韵母:全音节的音高变化是声调(也称字调)。这是我国传统分类方法。而国际上流行的科学分类法是清音和浊音,清音在发音时声带不振动,类似于宽带噪声源的输出气流高速冲过某处收缩的声道而产生湍流得到的音:当气流通过声门时使声带发生振动产生准局期脉冲,这些空气脉冲激励声道而得到的音就是浊音,而这个准周期称为基音周期(Pitch).

元音是发音时气流不受阻碍,发音器官均衡地紧张,是气流较弱的音:辅音则反之,在发音时气流要经过不同的阻碍,且发音器官中阻碍部分较紧张,是气流较强的音。

口音是指发音时气流不流经鼻腔的音。鼻音在发音时,气流较弱,经过鼻腔。

元音和辅音

汉语语音的基础是汉语拼音,由10个元音和22个辅音组成,共21个声母和38个韵母。汉语的10个元音见表2.4.1。
在这里插入图片描述
不同的元音是由不同的口腔形状造成的,口腔形状实际上是指唇舌状态,可从三方面来分析:①口腔的开闭和舌头的升降;②舌头部位的前后:③唇的状态。由于口腔的开闭,舌头的高低前后,唇的平展圆敛等不同程度的变化,造成了不同式样的共鸣器,于是形成了各种元音特有的音色。表2.4.1已说明了10个元音的分类和状态特性。

汉语语音中的 22个辅音见表2.4.2。表中同时也示出了其发音部位和发音方法,般可根据其发音部位和发音方法来命名它,例如[b]为双唇不送气清塞音,[z]为不送气舌尖前清塞音。

在这里插入图片描述

声母和韵母

按照我国传统音素分类方法,汉语的一个字节可以看成由声母和韵母拼合而成。一般声母仅包含一个辅音音素,而韵母则由一个元音或几个元音或元音和辅音组合面成,有时又把声母和韵母称为子音和母音。

声母共21个(不含零声母),上述辅音表中除[ng]以外的21个辅音即声母,表 2.4.3列出声母及其读音。
在这里插入图片描述
韵母包括单韵母、复韵母和带声韵母共39个,带声韵母是指用声母[n]或[ng]收音的韵母,由于[n]、[ng]是纯鼻音,所以又称为鼻尾音韵母。韵母表见表 2.4.4,在表 2.4.4中未列人由元音[er]、i、i及[e]等组成的4个韵母。此外,在声母表中未列人半元音[w]与[y]。
在这里插入图片描述

“声母-韵母”和“元音-辅音”的关系

声母和韵母、元音和辅音是完全不同的两个概念,声母、韵母是以在音节中的位置而论的,元音、辅音是以发音方式而定的。但两者又是有联系的,声母一般都是辅音,但辅音不全是声母;所有的元音都是韵母,还有一部分韵母由元音加辅音构成,如图 2.4.1所示。例如[an]、[ang]、[en]、[eng]、[ong]等用鼻辅音作韵尾
在这里插入图片描述

参考资料

《实用语音识别基础—王炳锡》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/508127.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode-热题100:48. 旋转图像

题目描述 给定一个 n n 的二维矩阵 matrix 表示一个图像。请你将图像顺时针旋转 90 度。 你必须在 原地 旋转图像,这意味着你需要直接修改输入的二维矩阵。请不要 使用另一个矩阵来旋转图像。 示例 1: 输入: matrix [[1,2,3],[4,5,6],…

1236. 递增三元组:做题笔记

目录 暴力 代码 二分 代码 前缀和 代码 推荐视频讲解 暴力 这道题说的是有三个元素数量相同的数组,想知道有多少个三元组满足:三个数分别来自 A B C数组且呈现递增。 我想的是既然要求递增,那就先把数组数据都排一下序,…

行车记录打不开?别慌,数据恢复有高招!

行车记录打不开,这恐怕是许多车主都曾经遭遇过的烦恼。在驾驶途中,行车记录仪本应是记录美好瞬间、保障行车安全的重要工具,但一旦它出现打不开的情况,所有的期待与信赖便瞬间化为乌有。面对这种情况,我们该如何应对&a…

HQL,SQL刷题,尚硅谷(初级)

目录 相关表数据: 题目及思路解析: 多表连接 1、课程编号为"01"且课程分数小于60,按分数降序排列的学生信息 2、查询所有课程成绩在70分以上 的学生的姓名、课程名称和分数,按分数升序排列 3、查询该学生不同课程的成绩…

python_绘图_多条折线图绘制_显示与隐藏

1. 需求 给定一个二维数组 100行, 5列, 每一列绘制一条折线, 横轴为行索引, 纵轴为对应位置的值, 绘制在一个子图里面, 使用python plot, 使用随机颜色进行区别添加显示和隐藏按钮, 可以对每条折线进行显示和隐藏 2. 代码 import numpy as np import matplotlib.pyplot as p…

软件心学格物致知篇(5)愿望清单上篇

愿望清单 前言 最近发现愿望清单是一个很有意思的词,结合自己的一些过往经验得到一点点启发。 我发现在众多领域都有东西想伪装成它。 比如一些企业的企业战略,比如客户提出的一些软件需求,比如一些系统的架构设计指标,比如一…

C语言动态内存讲解+通讯录2.0

文章目录 前文malloc和freecallocrealloc枚举常量的简单说明及使用 通讯录2.0动态开辟通讯录,满了就扩容保存数据和载入数据 通讯录2.0演示推荐好用的软件 前文 本文主要介绍动态开辟的几个函数,以及改进之前的通讯录。 我们局部变量等是在栈区上开辟空间的,而我们动态开辟的空…

Learning Discriminative Representations for Skeleton Based Action Recognition

标题:基于骨架的动作识别的学习判别性表示 原文链接:Learning Discriminative Representations for Skeleton Based Action Recognition (thecvf.com) 源码链接:https://github.com/zhysora/FR-Head 发表:CVPR 摘要 最近&…

【论文复现|智能算法改进】动态透镜成像学习人工兔优化算法及应用

目录 1.算法原理2.改进点3.结果展示4.参考文献 1.算法原理 【智能算法】人工兔优化算法(ARO)原理及实现 2.改进点 非线性递减能量因子: A ( t ) ( A max ⁡ − A min ⁡ ) ( 1 − sin ⁡ ( ( t T ) n π 2 ) (1) \begin{aligned}A\left…

李宏毅深度强化学习导论——当奖励是稀疏的

引言 这是李宏毅强化学习的笔记,主要介绍如何处理稀疏奖励问题。 稀疏奖励 当我们拿Actor和环境互动后可以得到很多奖励,整理之后可以得到分数 A A A,然后可以训练Actor。 但RL中有时会出现多数情况下奖励为零,此时我们不知道动…

Verilog基础【二】

3.1 Verilog 连续赋值 关键词:assign, 全加器 连续赋值语句是 Verilog 数据流建模的基本语句,用于对 wire 型变量进行赋值。: assign LHS_target RHS_expression ;LHS(left hand side)…

卷积层+多个输入通道

卷积层多输入输出通道 在深度学习中,卷积神经网络(CNN)通常用于处理具有多个输入通道的数据。当输入数据具有多个通道(例如彩色图像的RGB通道)时,卷积操作可以同时在每个通道上进行,并将各通道的…

软件测试-进阶篇

目录 测试的分类1 按测试对象划分1.1 界面测试1.2 可靠性测试1.3 容错性测试1.4 文档测试1.5 兼容性测试1.6 易用性测试1.7 安装卸载测试1.8 安装测试1.9 性能测试1.10 内存泄漏测试 2 按是否查看代码划分2.1 黑盒测试(Black-box Testing)2.2 白盒测试&a…

新闻管理系统(源码+文档)

新闻管理系统(小程序、ios、安卓都可部署) 文件包含内容程序简要说明含有功能项目截图客户端新闻详情新闻首页分类退出登录个人中心拨打客服热线注册界面个人资料新闻评论成功 管理端用户管理分类管理新闻管理 文件包含内容 1、搭建视频 2、流程图 3、开…

windows下部署llama.cpp

下载cmake 下载地址 解压,设置Path环境变量D:\CMake\bin 打开cmd输入cmake -version 安装mingw powershell下执行 Set-ExecutionPolicy RemoteSigned -Scope CurrentUser iex "& {$(irm get.scoop.sh)} -RunAsAdmin" scoop bucket add extras s…

Android获取本地文件目录

一、实现效果 一个简单的demo。点击按钮&#xff0c;获取本地文件目录&#xff0c;可以选择图片&#xff0c;展示选取的对应图片和展示存储路径。如图所示&#xff1a; 二、实现方式 1. 权限 AndroidManifest.xml文件里面添加权限 <uses-permission android:name"a…

【御控物联】JavaScript JSON结构转换(12):对象To数组——键值互换属性重组

文章目录 一、JSON结构转换是什么&#xff1f;二、核心构件之转换映射三、案例之《JSON对象 To JSON数组》四、代码实现五、在线转换工具六、技术资料 一、JSON结构转换是什么&#xff1f; JSON结构转换指的是将一个JSON对象或JSON数组按照一定规则进行重组、筛选、映射或转换…

牛客2024年愚人节比赛(A-K)

比赛链接 毕竟是娱乐场&#xff0c;放平心态打吧。。。 只有A一个考了数学期望&#xff0c;其他的基本都是acmer特有的脑筋急转弯&#xff0c;看个乐呵即可。 A 我是欧皇&#xff0c;赚到盆满钵满&#xff01; 思路&#xff1a; 我们有 p 1 p_1 p1​ 的概率直接拿到一件实…

Oracle Solaris 11.3开工失败问题处理记录

1、故障现像 起初是我这有套RAC有点问题&#xff0c;我想重启1个节点&#xff0c;结果发现重启后该节点的IP能PING通&#xff0c;但SSH连不上去&#xff0c;对应的RAC服务也没有自动启动。 操作系统是solaris 11.3。由于该IP对应的主机是LDOM&#xff0c;于是我去主域上telnet…

html基础:颜色的 5 种表示方法(最全!)

你好&#xff0c;我是云桃桃。一个希望帮助更多朋友快速入门 WEB 前端的程序媛&#xff0c;大专生&#xff0c;2年时间从1800到月入过万&#xff0c;工作5年买房。 分享成长心得。 HTML 颜色在网页设计中扮演着重要角色&#xff0c;给网页增加颜色可以增强用户体验&#xff0c;…