基于加权有限状态机的动态匹配词图生成算法

被引：4

作者：

郭宇弘

黎塔

肖业鸣

潘接林

颜永红

机构：

[1] 中国科学院语言声学与内容理解重点实验室

来源：

电子与信息学报 | 2014年 / 36卷 / 01期

关键词：

自动语音识别; 加权有限状态机; 词图生成; 关键词检索;

D O I：

暂无

中图分类号：

TN912.34 [语音识别与设备]; TP301.1 [自动机理论];

学科分类号：

0711 ; 081202 ;

摘要：

由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。

引用

页码：140 / 146

页数：7

共 4 条

[1] 关键词检测系统中基于音素网格的置信度计算 [J].

张鹏远 ;

韩疆 ;

颜永红 .

电子与信息学报, 2007, (09) :2063-2066

[2]

Finding consensus in speech recognition: word error minimization and other applications of confusion networks[J] . Lidia Mangu,Eric Brill,Andreas Stolcke.Computer Speech & Language . 2000 (4)

[3] An efficient search space representation for large vocabulary continuous speech recognition [J].

Demuynck, K ;

Duchateau, J ;

Van Compernolle, D ;

Wambacq, P .

SPEECH COMMUNICATION, 2000, 30 (01) :37-53

[4] A word graph algorithm for large vocabulary continuous speech recognition [J].

Ortmanns, S ;

Ney, H ;

Aubert, X .

COMPUTER SPEECH AND LANGUAGE, 1997, 11 (01) :43-72

← 1 →