发音的生理基础和过程
人的发音生理机构如图 2.3.1所示,发音时由肺部收缩送出一股直流空气,经气管流至喉头声门处(声门即声带开口处),在发声之初,声门处的声带肌肉收缩,声带并拢间隙小于 1mm,这股直流空气冲过很小的缝隙,使声带得到横向和纵向的速度,此时,声带向两边运动,缝隙增大(成年男性开到最大时,截面积约为 20mm),声门处压力下降,弹性恢复力将声带拉回平衡位置并继续趋向闭合,即声带产生振动,而且具有一定的振动周期,如图 2.3.2所示。
一般把声门以上,经咽喉、口腔(舌、、腭、小舌)的这一管道称为主声道,成年男子的主声道长度约 17cm,而经小舌和鼻腔的这一管道称为鼻道。此外,经肺、支气管和气管的管道称为次声门系统。由声带振动激发声道中空气发生振动,并从口和鼻两处向外辐射产生声音。声道的口、鼻两个管道中,从鼻咽部到鼻孔的分支称为鼻道分支,只有在发鼻音时才打开,从声门到唇是主声道,它被舌面隆起点隔开,近视可看出咽腔(后腔)、小管、口腔(前腔)等几部分,当发一语音时,声道肌肉(包括舌面)运动到一个特定的部位,构成·一定声道的位形,形成该语音的特定音色。
语音按其激励形式的不同大致可以分成三类。当气流通过声门时,如果声带的张力刚好使声带产生张弛振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音(Voiced Speech)或称有声语音。如果声带不振动,而声道在某处收缩,迫使气流以高速通过这一收缩部分而产生湍流就产生清音(Unvoiced Speech)或摩擦音,或称无声语音。如果声道在完全闭合的情况下突然释放就产生爆破音(Plosive Speech)。
人的声道和鼻道都是非均匀的声道管,声道管的谐振频率称为共振峰频率,或简称为共振峰。它与发音器官的确切位置有很大的关系,即共振峰和声道的形状与大小有关。表2.3.1给出了普通话7个韵母的共振峰频率。从表中可以看到,各韵母音色上的差异可用前3个共振峰(F1,F2,F3)来表示,F1主要分布在290Hz-1kHz范围内,F2分布在500Hz-2.5kHz范围内,而F3分布在2.5kHz-4kHz范围内。
语音信号随时间而变化的谱特性可以利用语图仪(Spectrograph)用图形显示,此图有时也称为语谱图,是一种三维图形,纵轴对应于频率,横轴对应于时间,图像的黑白度正比于语音信号的能量。
图2.3.3所示为普通话语音的语谱图。在汉语里,最小的语音单位是音素,是从音色的角度分出来的。一个音素单独存在或几个音素结合起来构成的单位叫音节。音节就是说话时自然的发音单位,可以从听觉上把它们分开。在物理上,以发音器官肌肉紧张度的增减为依据,每一次肌肉紧张度的增而变减就造成一个音节。汉语一般是一字一音节,少数例外的两音节一字和两字一音节(如“花儿”等)。
汉语语音基本特性
汉语的音节由声母、韵母和声调组成。一个音节起头的辅音是声母,声母后边都分是韵母:全音节的音高变化是声调(也称字调)。这是我国传统分类方法。而国际上流行的科学分类法是清音和浊音,清音在发音时声带不振动,类似于宽带噪声源的输出气流高速冲过某处收缩的声道而产生湍流得到的音:当气流通过声门时使声带发生振动产生准局期脉冲,这些空气脉冲激励声道而得到的音就是浊音,而这个准周期称为基音周期(Pitch).
元音是发音时气流不受阻碍,发音器官均衡地紧张,是气流较弱的音:辅音则反之,在发音时气流要经过不同的阻碍,且发音器官中阻碍部分较紧张,是气流较强的音。
口音是指发音时气流不流经鼻腔的音。鼻音在发音时,气流较弱,经过鼻腔。
元音和辅音
汉语语音的基础是汉语拼音,由10个元音和22个辅音组成,共21个声母和38个韵母。汉语的10个元音见表2.4.1。
不同的元音是由不同的口腔形状造成的,口腔形状实际上是指唇舌状态,可从三方面来分析:①口腔的开闭和舌头的升降;②舌头部位的前后:③唇的状态。由于口腔的开闭,舌头的高低前后,唇的平展圆敛等不同程度的变化,造成了不同式样的共鸣器,于是形成了各种元音特有的音色。表2.4.1已说明了10个元音的分类和状态特性。
汉语语音中的 22个辅音见表2.4.2。表中同时也示出了其发音部位和发音方法,般可根据其发音部位和发音方法来命名它,例如[b]为双唇不送气清塞音,[z]为不送气舌尖前清塞音。
声母和韵母
按照我国传统音素分类方法,汉语的一个字节可以看成由声母和韵母拼合而成。一般声母仅包含一个辅音音素,而韵母则由一个元音或几个元音或元音和辅音组合面成,有时又把声母和韵母称为子音和母音。
声母共21个(不含零声母),上述辅音表中除[ng]以外的21个辅音即声母,表 2.4.3列出声母及其读音。
韵母包括单韵母、复韵母和带声韵母共39个,带声韵母是指用声母[n]或[ng]收音的韵母,由于[n]、[ng]是纯鼻音,所以又称为鼻尾音韵母。韵母表见表 2.4.4,在表 2.4.4中未列人由元音[er]、i、i及[e]等组成的4个韵母。此外,在声母表中未列人半元音[w]与[y]。
“声母-韵母”和“元音-辅音”的关系
声母和韵母、元音和辅音是完全不同的两个概念,声母、韵母是以在音节中的位置而论的,元音、辅音是以发音方式而定的。但两者又是有联系的,声母一般都是辅音,但辅音不全是声母;所有的元音都是韵母,还有一部分韵母由元音加辅音构成,如图 2.4.1所示。例如[an]、[ang]、[en]、[eng]、[ong]等用鼻辅音作韵尾
参考资料
《实用语音识别基础—王炳锡》