汉语连续语音识别中上下文相关的声韵母建模

被引：20

作者：

李净

郑方

张继勇

吴文虎

机构：

[1] 清华大学计算机科学与技术系智能技术与系统国家重点实验室

来源：

清华大学学报(自然科学版) | 2004年 / 01期

关键词：

语音识别; 决策树; 上下文相关; 声韵母;

D O I：

10.16511/j.cnki.qhdxxb.2004.01.016

中图分类号：

TN912.3 [语音信号处理];

学科分类号：

0711 ;

摘要：

声学建模是汉语连续语音识别中的关键步骤之一。根据汉语语音的特点,采用扩展声韵母(XIF)作为识别基元,并针对XIF基元设计了相应的问题集,利用基于决策树的状态共享策略建立上下文相关声韵模型(Tri-XIF)。将Tri-XIF模型与上下文相关音素模型(Tri-phone)、上下文无关音节模型进行了对比。提出了几种方法用于改善标注、改进问题集和降低模型规模。实验结果表明,Tri-XIF模型与Tri-phone模型、音节模型相比,识别性能有了很大提高,其音节误识率分别降低了24.53%和41.65%。采用了所提出的优化策略后,模型规模降低20%以上,而性能下降很少。

引用

页码：61 / 64

页数：4