基于聚类统计与文本无关的说话人识别研究

被引:8
作者
邓浩江
王守觉
邢藏菊
李倩
机构
[1] 中国科学院半导体研究所人工神经网络实验室
关键词
说话人识别; 与文本无关; 聚类; 倒谱;
D O I
暂无
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
从语音信号特征矢量的空间映射出发,在二元分裂算法的基础上提出了一种分裂合并的聚类算法,并用于与文本无关的说话人识别研究,初步建立了基于聚类统计的开放系统。该系统用说话人语音信号在特征空间的分布中心建立参考模板,用聚类统计中心代替待识语音段的特征矢量进行模式匹配计算,系统规模的越大,节省的计算量就越多。在小规模说话人辨认系统的实验研究中,研究了特征矢量的加权、语音段的时长以及α因子的选择对系统性能的影响。
引用
收藏
页码:77 / 80
页数:4
相关论文
共 9 条
  • [1] Ambiguity reduction in speaker identification by the relaxation, labeling process. PhamT. andWagnerM. Pattern Recognition . 1999
  • [2] Speaker verification-Identifying people by their voices. DoddingtonG R. Proceedings of the IEEE . 1985
  • [3] Cepstral analysis technique for automatic speaker verification. S. Furui. IEEE Trans. Acoust., Speech, Signal Process . 1981
  • [4] Experimental evaluation of features for robust speaker identification. ReynoldsD A. IEEE Trans.Speech andAudioProc . 1994
  • [5] A CombinedApproach toText-DependentSpeakerIdentification:,Comparison withPureNeuralNetApproaches. LiangQ H.,ZhuM L. Journal ofCircuits,Systems, andComputers . 1998
  • [6] Speaker identification through use of features selected using genetic algorithm. HaydarA,DemireklerM andYurtsevenM K. Electronics Letters . 1980
  • [7] A two-level classifier for text-independent speaker identification. HadjitodorovS,BoyanovB,andDalakchievaN. Space Communications . 1997
  • [8] Linde,Y.,Buzo,A.,Gray,R.M. IEEE Transactions on Communications . 1980
  • [9] Speaker identification based on the use of robust cepstral features obtained from pole-zero tranfer functions. ZilovicM S andRamachandranR P. IEEE Trans.Speech andAudioProc . 1998