基于声音多特征贝叶斯网络融合的话者识别研究

被引:27
作者
朱坚民 [1 ]
张雷 [1 ]
翟东婷 [1 ]
雷静桃 [2 ]
机构
[1] 上海理工大学机械工程学院
[2] 上海大学机电工程与自动化学院
关键词
MFCC特征; 1/3倍频程特征; 贝叶斯网络; 后验概率; 话者识别; 融合;
D O I
10.19650/j.cnki.cjsi.2013.09.020
中图分类号
TN912.34 [语音识别与设备];
学科分类号
081002 [信号与信息处理];
摘要
针对基于语音单一特征提取方法所存在的话者识别准确率较低的问题,提出将话者语音中反映人耳听觉感知特性的MFCC特征和接近心理声学临界频带的1/3倍频程(1/3 octave)特征作为话者声音的特征参数,设计话者识别的贝叶斯网络,融合2种声音特征参数,通过贝叶斯网络推理实现话者识别。贝叶斯网络通过学习过程确定已注册话者各声音特征的条件概率。进行话者识别时,贝叶斯网络利用贝叶斯定理及条件独立性假设融合待识别话者声音的MFCC特征和1/3倍频程特征,计算每个已注册话者对输入语音特征矢量的后验概率,根据后验概率的大小实现待识别话者的推断。话者识别实验结果表明:提出的基于声音多特征贝叶斯网络融合的话者识别方法可行有效,识别正确率达到100%。
引用
收藏
页码:2058 / 2067
页数:10
相关论文
共 24 条
[1]
基于GM模型进行舰船纵摇参数预测 [J].
杨丽丽 .
国外电子测量技术, 2013, 32 (03) :55-57+62
[2]
声源辨识个体差异研究 [J].
任玉凤 ;
陈克安 ;
张冰瑞 .
国外电子测量技术, 2013, 32 (03) :71-74+79
[3]
折线电容滤波算法在鼾声识别中的研究与应用 [J].
薛雷 ;
何星剑 ;
高微微 .
电子测量技术, 2013, 36 (02) :6-10
[4]
均匀设计与灰色理论应用于视觉系统误差分析 [J].
唐巍 ;
叶东 ;
袁峰 ;
陈刚 .
仪器仪表学报, 2013, 34 (02) :371-378
[5]
电力测功机转矩影响因素模糊灰色关联分析 [J].
张志刚 ;
张桂香 ;
刘腾 ;
钱承 ;
邓元望 .
电子测量与仪器学报, 2012, 26 (08) :693-698
[6]
基于灰关联分析和模糊隶属度匹配的球形水果自动识别方法 [J].
朱坚民 ;
雷静桃 ;
翟东婷 ;
黄之文 .
仪器仪表学报, 2012, 33 (08) :1826-1836
[7]
基于自适应SPI总线的列车PIS系统研究 [J].
林锥 ;
王立德 ;
周洁琼 ;
刘力源 .
电子测量与仪器学报, 2012, 26 (04) :312-319
[8]
基于树型贝叶斯网络的场景分类引擎训练算法 [J].
王中锋 ;
王志海 ;
解文杰 .
仪器仪表学报, 2012, 33 (04) :863-869
[9]
电子耳蜗声调信息的电刺激编码的改进研究 [J].
宫琴 ;
刘京雷 ;
关添 .
仪器仪表学报, 2012, 33 (02) :271-278
[10]
改进的基于邻接树的贝叶斯网络推理算法 [J].
胡春玲 ;
胡学钢 ;
姚宏亮 .
模式识别与人工智能, 2011, 24 (06) :846-855