基于视频三音子的双模态语料自动选取算法

被引:2
作者
赵晖
林成龙
唐朝京
机构
[1] 国防科技大学电子科学与工程学院
关键词
可视语音合成; 双模态语料; 视频三音子; 评估函数;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模态语料库相比,该语料库在覆盖率等指标上有较大改进,为实现具有真实感的可视语音合成奠定基础。
引用
收藏
页码:1 / 3
页数:3
相关论文
共 5 条
[1]   基于向量空间模型的文本聚类算法 [J].
姚清耘 ;
刘功申 ;
李翔 .
计算机工程, 2008, (18) :39-41+44
[2]   基于句子级的唇读语料库及其切分算法 [J].
洪晓鹏 ;
姚鸿勋 ;
徐铭辉 .
计算机工程与应用, 2005, (03) :174-177+190
[3]   基于三音子模型的语料自动选择算法 [J].
吴华 ;
徐波 ;
黄泰翼 .
软件学报, 2000, (02) :271-276
[4]   汉语听觉视觉双模态数据库CAVSR1.0 [J].
徐彦君 ;
杜利民 ;
李国强 ;
张欣 ;
周治 .
声学学报, 2000, (01) :42-49
[5]   汉语连续语音数据库的语料设计 [J].
祖漪清 .
声学学报, 1999, (03) :236-247