共 1 条
基于目标逼近特征和双向联想贮存器的情感语音基频转换
被引:7
作者:
凌震华
高丽
戴礼荣
机构:
[1] 中国科学技术大学信息科学技术学院
关键词:
情感语音合成;
定量目标逼近;
高斯双向联想贮存器;
基频转换;
D O I:
暂无
中图分类号:
TN912.33 [语音合成];
学科分类号:
081002 [信号与信息处理];
摘要:
提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(q TA)特征作为语音音节层的基频描述,并用高斯双向联想贮存器(GBAM)实现中性合成语音音节层q TA参数向目标情感语音音节层q TA参数的转换.在模型训练阶段,首先基于中性语料库和统计参数语音合成方法构建中性语音合成系统;然后利用少量情感录音数据,将从情感语音文本对应的中性合成语音中提取的q TA参数作为源数据,将情感录音中提取的q TA参数作为目标数据,进行GBAM转换模型的训练.在情感语音合成阶段,利用训练得到的GABM模型,实现中性合成语音基频特征向目标情感的转换.实验结果表明,该方法在目标情感数据较少的情况下可以取得比最大似然线性回归(MLLR)模型自适应方法更好的情感表现力.
引用
收藏
页码:670 / 674
页数:5
相关论文

