汉语连续语音识别中不同基元声学模型的复合

被引:7
作者
张辉
杜利民
机构
[1] 中国科学院声学研究所语音交互技术实验室
关键词
语音识别; 声学模型复合; 声学模型选择; 错误率;
D O I
暂无
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。
引用
收藏
页码:2045 / 2049
页数:5
相关论文
共 1 条
[1]   汉语连续语音识别中上下文相关的声韵母建模 [J].
李净 ;
郑方 ;
张继勇 ;
吴文虎 .
清华大学学报(自然科学版), 2004, (01) :61-64