高性能汉语数码语音识别算法

被引:20
作者
李虎生
刘加
刘润生
机构
[1] 清华大学电子工程系!北京
关键词
汉语; 数码语音识别;
D O I
10.16511/j.cnki.qhdxxb.2000.01.010
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% .
引用
收藏
页码:32 / 34+56 +56
页数:4
相关论文
共 3 条
[1]  
语音信号数字处理.[M].杨行峻;迟惠生等编著;.电子工业出版社.1995,
[2]   用共振峰轨迹提高汉语数码语音识别性能 [J].
李虎生 ;
杨明杰 ;
刘润生 .
清华大学学报(自然科学版), 1999, (09) :69-71
[3]   汉语数码语音识别:发展现状、难点分析与方法比较 [J].
顾良 ;
刘润生 .
电路与系统学报, 1997, (04) :32-39