汉语连续语音识别中上下文相关的声韵母建模

被引:20
作者
李净
郑方
张继勇
吴文虎
机构
[1] 清华大学计算机科学与技术系智能技术与系统国家重点实验室
关键词
语音识别; 决策树; 上下文相关; 声韵母;
D O I
10.16511/j.cnki.qhdxxb.2004.01.016
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。
引用
收藏
页码:61 / 64
页数:4
相关论文
共 2 条
[1]   汉语语音听写机技术的研究与实现 [J].
郑方 ;
牟晓隆 ;
徐明星 ;
武健 ;
宋战江 .
软件学报, 1999, (04) :101-109
[2]  
现代语音基础知识[M]. - 人民教育出版社 , 曹剑芬 著, 1990