基于三音子模型的语料自动选择算法

被引:11
作者
吴华
徐波
黄泰翼
机构
[1] 中国科学院自动化研究所模式识别国家重点实验室!北京
关键词
语音识别; 模型训练; 三音子; 类三音子;
D O I
10.13328/j.cnki.jos.2000.02.018
中图分类号
TN912 [电声技术和语音信号处理];
学科分类号
081002 ;
摘要
在语音识别中 ,如何经济地挑选语音训练语料 ,使其覆盖尽可能多的语音现象是一个非常重要的问题 .传统的语音训练语料采用手工挑选后再进行检验和补充的方法 ,此方法难以保证所选语料语音现象的覆盖率 .该文提出了一种自动地从大规模语料库中挑选语料的搜索算法 ,此算法不但能使所选语料覆盖几乎所有语音现象 ,而且能保证训练语料中三音子和类三音子有足够的样本个数 ,使训练数据不过于稀疏 ,为训练正确而可靠的语音模型打下了坚实的基础 .
引用
收藏
页码:271 / 276
页数:6
相关论文
共 1 条
[1]  
智能计算机接口与应用进展[M]. - 清华大学出版社 , 吴泉源, 1995