基于频域能量分布分析的自适应元音帧提取算法

被引:8
作者
钱博
李燕萍
唐振民
徐利敏
机构
[1] 南京理工大学模式识别与智能系统实验室
关键词
元音帧提取; 频域分析; 自适应; MEL标度频谱;
D O I
暂无
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
本文提出了一种基于频域能量分布分析的自适应元音帧提取算法.该方法采用MEL标度映射各频率分量,通过分析低频、高频能量的分布关系判定元音帧并计算出该帧的短时能量、短时平均过零率的值指导时域帧提取的方案.为了适应连续语音检测过程中响度大小的不断变化,文中选择了按概率抽样进行频域分析修正时域阈值的方式.这种方式利用较少抽样帧的变换分析指导时域检测,相对于全面变换分析降低了运算量,达到了实时检测的要求,同时提高了整体检测性能.实验表明,该方法总体运算量低,同时对发声过程中的音量变化有一定的自适应性.实验中,针对单字音元音帧的正确提取率达到了97%以上,平均丢帧率为3.95%;针对连续语音的正确提取率也达到了90%以上.
引用
收藏
页码:279 / 282
页数:4
相关论文
共 4 条
[1]   一种基于支持向量机的含噪语音的清/浊/静音分类的新方法 [J].
齐峰岩 ;
鲍长春 .
电子学报, 2006, (04) :605-611
[2]   为连续语音识别用的单词音节神经网络建模的研究 [J].
王守觉 ;
徐春燕 ;
潘晓霞 ;
安冬 ;
陈旭 ;
曹文明 .
电子学报, 2005, (10) :157-159
[3]   基于熵函数的耳语音声韵分割法 [J].
栗学丽 ;
丁慧 ;
徐柏龄 .
声学学报, 2005, (01) :69-75
[4]  
Chinese Spoken Language Processing..Xin Luo;Qian-Jie Fu;.IEEE Signal Processing Society.2004,