汉语语音听写机技术的研究与实现

被引:5
作者
郑方
牟晓隆
徐明星
武健
宋战江
机构
[1] 清华大学计算机科学与技术系语音实验室
关键词
连续语音识别,汉语语音听写机,搜索策略,基于统计知识的帧同步搜索算法,差分状态驻留,特征变化量,词搜索树,双层搜索网络,汉语语音听写机引擎,语音命令;
D O I
10.13328/j.cnki.jos.1999.04.019
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
文章从声学基元和词法树两个方面对连续语音识别和汉语语音听写机中声学层面的搜索策略进行了分析,提出了基于统计知识的帧同步搜索算法和基于词法约束的词搜索树结构,构成了声学层面的双层搜索网络.算法中利用了统计知识,包括声学层面的差分状态驻留信息和特征变化量信息等.实验结果表明,基于知识的搜索策略使连续语音识别的性能提高了36.6%.文章还介绍了N-Gram统计语言模型的修正退化频度估计算法和搜索算法原理.通过对多年研究成果的分析,实现了一个汉语语音听写机的引擎,并在PC机上构建了两个系统:非特定人汉语语音听写机实用编辑器ST97和语音命令系统CMD97
引用
收藏
页码:101 / 109
页数:9
相关论文
empty
未找到相关数据