基于卷积非负矩阵分解的语音转换方法

被引:24
作者
孙健 [1 ]
张雄伟 [2 ]
曹铁勇 [2 ]
杨吉斌 [2 ]
孙新建 [1 ]
机构
[1] 解放军理工大学通信工程学院
[2] 解放军理工大学指挥自动化学院
关键词
语音转换; 卷积非负矩阵分解; 时频基;
D O I
10.16337/j.1004-9037.2013.02.006
中图分类号
TN912.3 [语音信号处理];
学科分类号
081002 [信号与信息处理];
摘要
为了在语音转换过程中充分考虑语音的帧间相关性,提出了一种基于卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可较好地保存语音信号中的个人特征信息及帧间相关性。利用这一特性,在训练阶段,通过卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的时频基。在转换阶段,通过时频基替换实现对源说话人语音的转换。相对于传统方法,本方法能够更好地保存和转换语音帧间相关性。实验仿真及主、客观评价结果表明,与基于高斯混合模型、状态空间模型的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。
引用
收藏
页码:141 / 148
页数:8
相关论文
共 3 条
[1]
基于状态空间模型的子频带语音转换算法 [J].
徐宁 ;
杨震 ;
张玲华 .
电子学报, 2010, 38 (03) :646-653
[2]
语音转换分析及相似度改进 [J].
双志伟 ;
张世磊 ;
秦勇 .
清华大学学报(自然科学版), 2009, 49(S1) (自然科学版) :1408-1412
[3]
基于隐马尔可夫模型和高斯混合模型结合的声音转换方法 [J].
岳振军 ;
邹翔 ;
王浩 .
数据采集与处理, 2009, 24 (03) :285-289