基于SDC特征和GMM-UBM模型的自动语种识别

被引:17
作者
姜洪臣
郑榕
张树武
徐波
机构
[1] 中国科学院自动化研究所
关键词
计算机应用; 中文信息处理; SDC特征; GMM-UBM模型; 贝叶斯自适应; 自动语种识别;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
本文提出了一种基于SDC特征和GMM-UBM模型的自动语种识别方法。SDC特征由许多语音帧的一阶差分谱连接扩展而成,与传统的MFCC特征相比,包含了更多的时序特征信息。UBM模型反映了所有待识别语种的特征分布特性,借助贝叶斯自适应算法可以快速得到每个语种的模型。与传统的GMM方法相比,该方法的训练和识别的速度更快。该方法对OGI电话语音库中11个语种进行了测试,其10秒、30秒和45秒句子的最佳识别正确率分别为72.38%、82.62%和85.23%,识别速度约为0.03倍实时。
引用
收藏
页码:49 / 53
页数:5
相关论文
共 5 条
[1]  
Approaches to Lan-guage Identification Using Gaussian Mixture Modeland Shifted Delta Cepstral Features. P.A.Torres-Carrasquillo et al. Proceed-ings of ICSLP . 2002
[2]  
Methods to ImproveGaussian Mixture Model Based Language IdentificationSystem. E.Wong,and S.Sridharan. Proceedings of ICSLP . 2002
[3]  
NIST 2003Language Recognition Evaluation. Alvin F Martin,and Mark A Przybockl. Proceedingsof Eurospeech . 2003
[4]  
The OGI Multilanguage Telephone Speech Corpus. Y.K.Muthusamy,R.A.Cole,and B.T.Qshika. Proceedings of ICSLP . 1992
[5]  
Speaker Verification Using Adapted Gaussian MixtureModels. D.A.Reynolds,T.F.Quatieri,and R.B.Dunn. Digital Signal Processing . 2000