基于卷积非负矩阵分解的语音转换方法

被引：24

作者：

孙健 ^{[1
]}

张雄伟 ^{[2
]}

曹铁勇 ^{[2
]}

杨吉斌 ^{[2
]}

孙新建 ^{[1
]}

机构：

[1] 解放军理工大学通信工程学院

[2] 解放军理工大学指挥自动化学院

来源：

数据采集与处理 | 2013年 / 28卷 / 02期

关键词：

语音转换; 卷积非负矩阵分解; 时频基;

D O I：

10.16337/j.1004-9037.2013.02.006

中图分类号：

TN912.3 [语音信号处理];

学科分类号：

081002 [信号与信息处理];

摘要：

为了在语音转换过程中充分考虑语音的帧间相关性,提出了一种基于卷积非负矩阵分解的语音转换方法。卷积非负矩阵分解得到的时频基可较好地保存语音信号中的个人特征信息及帧间相关性。利用这一特性,在训练阶段,通过卷积非负矩阵分解从训练数据中提取源说话人和目标说话人相匹配的时频基。在转换阶段,通过时频基替换实现对源说话人语音的转换。相对于传统方法,本方法能够更好地保存和转换语音帧间相关性。实验仿真及主、客观评价结果表明,与基于高斯混合模型、状态空间模型的语音转换方法相比,该方法具有更好的转换语音质量和转换相似度。

引用

页码：141 / 148

页数：8