基于环境特征的语音识别置信度研究

被引:14
作者
国玉晶
刘刚
刘健
郭军
机构
[1] 北京邮电大学信息与通信工程学院模式识别与智能系统实验室
关键词
语音识别; 置信度; 后验概率; 环境特征;
D O I
10.16511/j.cnki.qhdxxb.2009.s1.026
中图分类号
TP391.42 [];
学科分类号
摘要
传统的语音识别置信度方法基于各种静态特征进行分类判决,而忽略了词与周围环境之间的关系所携带的信息。为了进一步提高置信度特征的分类性能,该文提出了上下文环境、动态环境、句全局环境共3类5种环境特征,从空间与时间角度较全面地描述了词与环境之间的关系。实验结果表明:静态特征与环境特征联合分类的性能与只用静态特征相比有不同程度的提高,其中,静态环境与环境特征的二元联合最高有5.02%的相对改进,三元联合最高有6.11%的相对改进,说明环境特征确实是一种有价值的置信度特征,并且这几类环境特征之间存在一定的独立性。
引用
收藏
页码:1388 / 1392
页数:5
相关论文
共 1 条
[1]
Finding consensus in speech recognition: word error minimization and other applications of confusion networks [J].
Mangu, L ;
Brill, E ;
Stolcke, A .
COMPUTER SPEECH AND LANGUAGE, 2000, 14 (04) :373-400