基于频域能量分布分析的自适应元音帧提取算法

被引：8

作者：

钱博

李燕萍

唐振民

徐利敏

机构：

[1] 南京理工大学模式识别与智能系统实验室

来源：

电子学报 | 2007年 / 02期

关键词：

元音帧提取; 频域分析; 自适应; MEL标度频谱;

D O I：

暂无

中图分类号：

TN912.3 [语音信号处理];

学科分类号：

0711 ;

摘要：

本文提出了一种基于频域能量分布分析的自适应元音帧提取算法.该方法采用MEL标度映射各频率分量,通过分析低频、高频能量的分布关系判定元音帧并计算出该帧的短时能量、短时平均过零率的值指导时域帧提取的方案.为了适应连续语音检测过程中响度大小的不断变化,文中选择了按概率抽样进行频域分析修正时域阈值的方式.这种方式利用较少抽样帧的变换分析指导时域检测,相对于全面变换分析降低了运算量,达到了实时检测的要求,同时提高了整体检测性能.实验表明,该方法总体运算量低,同时对发声过程中的音量变化有一定的自适应性.实验中,针对单字音元音帧的正确提取率达到了97%以上,平均丢帧率为3.95%;针对连续语音的正确提取率也达到了90%以上.

引用

页码：279 / 282

页数：4

共 4 条

[1] 一种基于支持向量机的含噪语音的清/浊/静音分类的新方法 [J].