基于发音特征的音/视频双流语音识别模型

被引:1
作者
宋培岩
蒋冬梅
王风娜
机构
[1] 西北工业大学计算机学院
关键词
动态贝叶斯网络; 发音特征; 音/视频; 语音识别;
D O I
暂无
中图分类号
TP391.42 [];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
构建了一种基于发音特征的音/视频双流动态贝叶斯网络(dynamic Bayesian network,DBN)语音识别模型,定义了各节点的条件概率关系,以及发音特征之间的异步约束关系,最后在音/视频连接数字语音数据库上进行了语音识别实验,并与音频单流、视频单流DBN模型比较了在不同信噪比情况下的识别效果。结果表明,在低信噪比情况下,基于发音特征的音/视频双流语音识别模型表现出最好的识别性能,而且随着噪声的增加,其识别率下降的趋势比较平缓,表明该模型对噪声具有很强的鲁棒性,更适用于低信噪比环境下的语音识别。
引用
收藏
页码:2481 / 2483
页数:3
相关论文
共 2 条
[1]   基于动态贝叶斯网络的语音识别及音素切分研究 [J].
孙阿利 ;
蒋冬梅 ;
吕国云 ;
Hichem Sahli ;
Werner Verhelst .
计算机应用研究, 2007, (10) :104-106+127
[2]   基于动态贝叶斯网络的音视频双模态说话人识别 [J].
吴志勇 ;
蔡莲红 .
计算机研究与发展, 2006, (03) :470-475