语音学知识在语音识别中的应用:案例分析

被引:3
作者
曹剑芬
李爱军
胡方
张利刚
机构
[1] 天津大学计算机科学与技术学院
[2] 中国社会科学院语言研究所 北京100732
[3] 中国社会科学院语言研究所
[4] 天津300072
关键词
计算机; 自动语音识别; 语音学知识; 感知; 声调; 基频; 声谱图; 共振峰;
D O I
10.16511/j.cnki.qhdxxb.2008.s1.026
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
计算机自动语音识别中的热门话题之一就是怎样利用语音学的知识来提高识别的正确率。在早期的数字语音识别中,2与8经常容易混淆,曾经被视为一个难题。该文试图通过对这个具体案例的分析,探讨语音学特征知识在识别中的应用问题。采用声学和生理实验以及感知实验相结合的方法,探讨了2与8的区别性语音学特征及其在二者识别中的作用。结果表明:2与8的最大差异是声调,在缺乏声调信息的情况下,第3共振峰(F3)的差异是决定性的区别特征,而它们的第1(F1)和第2共振峰(F2)非常近似,在识别上没有太大作用。早期的自动识别恰恰忽略了声调这个最最显著的区别特征;而在自然语流中、尤其是非正式的语体中,有些2发音时舌尖运动不够到位,因而导致它与8的第3共振峰差异不十分明显,这些是识别中二者常常混淆的主要原因。由此可见,在自动语音识别中,加强对语音学特征知识的了解是个迫在眉睫的任务,在系统中充分地综合利用这些区别性特征信息,是提高识别率的有效途径。
引用
收藏
页码:748 / 753
页数:6
相关论文
共 1 条
[1]   基于段长分布的HMM语音识别模型 [J].
王作英 ;
肖熙 .
电子学报, 2004, (01) :46-49