基于多窗谱的心理声学语音增强

被引:13
作者
吴红卫
吴镇扬
赵力
机构
[1] 东南大学信息科学与工程学院
关键词
噪声; 噪音; 多窗谱; 信噪比; 信号噪声比; 心理声学; 偏移量; 语音段; 加权规则; 预估计; 纯净语音; 含噪语音; 语音增强; 语声信号处理; 估计方差;
D O I
10.15949/j.cnki.0371-0025.2007.03.013
中图分类号
O428 [];
学科分类号
070206 ; 082403 ;
摘要
与传统的周期谱图相比,多窗谱具有更小的估计方差。从含噪语音的多窗谱对噪声及噪声与含噪语音之比(NNSR)进行估计,用基于NNSR的幅度谱减实现用于计算人耳掩蔽阈值的预增强语音,用集成了人耳掩蔽阈值的心理声学加权规则实现最终的增强语音。考虑到多窗谱的特点对掩蔽偏移量进行了修正,修正后的重建语音,其客观测量指标修正巴克谱测度比修正前有一定的改进。再对心理声学加权规则作最大值小于1的限制,则输入信噪比越大(0 dB以上),分段信噪比和总体信噪比提高得越多。非正式试听表明重建语音失真较小,背景噪声大大降低,且没有音乐噪声。
引用
收藏
页码:275 / 281
页数:7
相关论文
共 3 条
[1]   基于听觉掩蔽效应和Bark子波变换的语音增强 [J].
陶智 ;
赵鹤鸣 ;
龚呈卉 .
声学学报, 2005, (04) :367-372
[2]   基于噪声被掩蔽概率的优化语音增强方法 [J].
卜凡亮 ;
王为民 ;
戴启军 ;
陈砚圃 .
电子与信息学报, 2005, (05) :753-756
[3]   非平稳环境下基于人耳听觉掩蔽特性的语音增强 [J].
刘海滨 ;
吴镇扬 ;
赵力 ;
曾毓敏 .
信号处理, 2003, (04) :303-307