大规模语音语料库及其在TTS中应用的几个问题

被引:11
作者
章森
刘磊
刁麓弘
机构
[1] 北京工业大学信息与计算科学实验室
关键词
语音语料库; 集合运算; 文语转换; 最小包容; 信息检索;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
首先介绍了大规模语音语料库以及基于大规模语音语料库的文语转换技术的研究现状,接着介绍了一个大规模连续汉语语音语料库的实例Slib的结构和内容;在此基础上,讨论了面向大规模语音语料库的索引技术,提出了语料库检索中的集合运算和最小包容问题,证明了最小包容问题是NP完全的,给出了求解该问题的贪婪算法以及算法的近似比;最后,讨论了基于集合运算的大规模语音语料库的检索技术在文语转换系统中的应用,特别是在基本语言单位实例的选取问题上实现了一种基于最小包容的优化方法,对提高文语转换系统的自然度有实用价值.
引用
收藏
页码:687 / 696
页数:10
相关论文
共 4 条
  • [1] 汉语普通话语音合成语料库TH-CoSS的建设和分析
    蔡莲红
    崔丹丹
    蔡锐
    [J]. 中文信息学报, 2007, (02) : 94 - 99
  • [2] 基于新闻联播语料库的语音合成系统[A]. 汤胜良,张士礼,张志平,吴玺宏,迟惠生.第八届全国人机语音通讯学术会议论文集[C]. 2005
  • [3] 连续汉语语音识别语料库的设计[A]. 王天庆,李爱军.第六届全国现代语音学学术会议论文集(下)[C]. 2003
  • [4] Fluent speech prosody: Framework and modeling[J] . Chiu-yu Tseng,Shao-huang Pin,Yehlin Lee,Hsin-min Wang,Yong-cheng Chen.Speech Communication . 2005 (3)