基于短时能量的语音端点检测算法研究

被引:49
作者
张仁志
崔慧娟
机构
[1] 清华大学电子工程系微波与数字通信国家重点实验室
[2] 清华大学电子工程系微波与数字通信国家重点实验室 北京
[3] 北京
关键词
端点检测; 短时能量; 边沿检测滤波; 三态转换判决机制;
D O I
10.16311/j.audioe.2005.07.015
中图分类号
TN912 [电声技术和语音信号处理];
学科分类号
081002 ;
摘要
研究了噪声环境下,利用短时能量为特征进行语音端点检测的问题。在采用短时全带能量为特征的基础上,提出的算法将短时高频能量作为辅助特征,同时使用了最优边沿检测滤波以及双门限-三态转换判决机制,从而保证了算法在噪声环境下的端点检测准确性和对信号绝对幅度变化的稳健性。实验结果表明,与传统的能量阈值法以及G.729中使用的VAD算法相比,提出的算法在噪声环境下具有更好的性能,是一个简单、高效和稳健的语音端点检测算法。
引用
收藏
页码:52 / 54+59 +59
页数:4
相关论文
共 1 条
[1]  
语音信号数字处理.[M].杨行峻;迟惠生等编著;.电子工业出版社.1995,