基于修正MFCC参数汉语耳语音的话者识别

被引:26
作者
林玮
杨莉莉
徐柏龄
机构
[1] 南京大学声学研究所
关键词
耳语音; 话者识别; MFCC参数; 隐马尔可夫模型;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
0711 ;
摘要
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率.
引用
收藏
页码:54 / 62
页数:9
相关论文
共 4 条
[1]   汉语耳语音库的建立与听觉实验研究 [J].
杨莉莉 ;
李燕 ;
徐柏龄 .
南京大学学报(自然科学版), 2005, (03) :311-317
[2]   基于熵函数的耳语音声韵分割法 [J].
栗学丽 ;
丁慧 ;
徐柏龄 .
声学学报, 2005, (01) :69-75
[3]   混响声场中语音识别方法研究 [J].
栗学丽 ;
徐柏龄 .
南京大学学报(自然科学版), 2003, (04) :525-531
[4]   鲁棒性话者辨识中的一种改进的马尔科夫模型 [J].
刘鸣 ;
戴蓓倩 ;
李辉 ;
陆伟 ;
李霄寒 .
电子学报, 2002, (01) :46-48