学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于频域能量分布分析的自适应元音帧提取算法
被引:8
作者
:
钱博
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学模式识别与智能系统实验室
钱博
李燕萍
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学模式识别与智能系统实验室
李燕萍
唐振民
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学模式识别与智能系统实验室
唐振民
徐利敏
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学模式识别与智能系统实验室
徐利敏
机构
:
[1]
南京理工大学模式识别与智能系统实验室
来源
:
电子学报
|
2007年
/ 02期
关键词
:
元音帧提取;
频域分析;
自适应;
MEL标度频谱;
D O I
:
暂无
中图分类号
:
TN912.3 [语音信号处理];
学科分类号
:
0711 ;
摘要
:
本文提出了一种基于频域能量分布分析的自适应元音帧提取算法.该方法采用MEL标度映射各频率分量,通过分析低频、高频能量的分布关系判定元音帧并计算出该帧的短时能量、短时平均过零率的值指导时域帧提取的方案.为了适应连续语音检测过程中响度大小的不断变化,文中选择了按概率抽样进行频域分析修正时域阈值的方式.这种方式利用较少抽样帧的变换分析指导时域检测,相对于全面变换分析降低了运算量,达到了实时检测的要求,同时提高了整体检测性能.实验表明,该方法总体运算量低,同时对发声过程中的音量变化有一定的自适应性.实验中,针对单字音元音帧的正确提取率达到了97%以上,平均丢帧率为3.95%;针对连续语音的正确提取率也达到了90%以上.
引用
收藏
页码:279 / 282
页数:4
相关论文
共 4 条
[1]
一种基于支持向量机的含噪语音的清/浊/静音分类的新方法
[J].
齐峰岩
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学电子信息与控制工程学院
齐峰岩
;
鲍长春
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学电子信息与控制工程学院
鲍长春
.
电子学报,
2006,
(04)
:605
-611
[2]
为连续语音识别用的单词音节神经网络建模的研究
[J].
论文数:
引用数:
h-index:
机构:
王守觉
;
徐春燕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
徐春燕
;
潘晓霞
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
潘晓霞
;
安冬
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
安冬
;
论文数:
引用数:
h-index:
机构:
陈旭
;
曹文明
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
曹文明
.
电子学报,
2005,
(10)
:157
-159
[3]
基于熵函数的耳语音声韵分割法
[J].
栗学丽
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学声学所近代声学国家重点实验室
栗学丽
;
丁慧
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学声学所近代声学国家重点实验室
丁慧
;
徐柏龄
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学声学所近代声学国家重点实验室
徐柏龄
.
声学学报,
2005,
(01)
:69
-75
[4]
Chinese Spoken Language Processing..Xin Luo;Qian-Jie Fu;.IEEE Signal Processing Society.2004,
←
1
→
共 4 条
[1]
一种基于支持向量机的含噪语音的清/浊/静音分类的新方法
[J].
齐峰岩
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学电子信息与控制工程学院
齐峰岩
;
鲍长春
论文数:
0
引用数:
0
h-index:
0
机构:
北京工业大学电子信息与控制工程学院
鲍长春
.
电子学报,
2006,
(04)
:605
-611
[2]
为连续语音识别用的单词音节神经网络建模的研究
[J].
论文数:
引用数:
h-index:
机构:
王守觉
;
徐春燕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
徐春燕
;
潘晓霞
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
潘晓霞
;
安冬
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
安冬
;
论文数:
引用数:
h-index:
机构:
陈旭
;
曹文明
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院半导体研究所
曹文明
.
电子学报,
2005,
(10)
:157
-159
[3]
基于熵函数的耳语音声韵分割法
[J].
栗学丽
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学声学所近代声学国家重点实验室
栗学丽
;
丁慧
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学声学所近代声学国家重点实验室
丁慧
;
徐柏龄
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学声学所近代声学国家重点实验室
徐柏龄
.
声学学报,
2005,
(01)
:69
-75
[4]
Chinese Spoken Language Processing..Xin Luo;Qian-Jie Fu;.IEEE Signal Processing Society.2004,
←
1
→