基于K-L散度模型聚类的快速说话人辨识方法

被引:4
作者
王欢良 [1 ,2 ]
韩纪庆 [1 ]
郑贵滨 [1 ]
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 青岛科技大学信息科学与技术学院
关键词
K-L散度; 模型聚类; 置信度; 说话人辨识; 网络环境;
D O I
10.16451/j.cnki.issn1003-6059.2010.06.002
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
在网络应用环境下,需要处理的音频数据和注册说话人急剧增加,传统说话人辨识方法难以满足实时性要求.文中提出采用K-L散度的说话人模型聚类方法,从而构造一个分级辨识模型,提高辨识效率.研究利用类辨识信息估计置信度的方法,可尽早有效排除集外说话人.实验结果显示,文中方法可使辨识速度平均提高3.2倍,而闭集辨识错误率平均只有0.9%的增加.采用类辨识置信度进一步提高开集辨识速度,并且在保持集内错误率不变的情况下,使集外错误率相对下降5.1%.
引用
收藏
页码:856 / 861
页数:6
相关论文
共 3 条