基于语速调整和音位属性后验概率的音素识别

被引:5
作者
许友亮
张连海
张文林
李永彬
机构
[1] 信息工程大学信息工程学院
关键词
语速调整; 音位属性检测; 隐马尔可夫模型; 自动语音识别;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
摘要
基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算法。该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,减小速率因素对模型训练的影响;另外,通过计算音位属性的后验概率向量间夹角,得到测试集的语速,相比采用训练模型的语速检测方法减轻了系统负担。本文将语速调整算法应用于音位属性的提取,并对音位属性特征进行非线性变换,最后采用隐马尔科夫模型进行建模,实验表明:经过语速调整后,音素的平均持续帧数较为恒定,动态变化范围减小,使得音素识别率提升了1.3%。
引用
收藏
页码:295 / 300
页数:6
相关论文
共 2 条
[1]   采用特征分类直方图均衡化的鲁棒性语音识别 [J].
姜莹 ;
俞一彪 .
信号处理, 2011, (06) :896-900
[2]   Detection of phonological features in continuous speech using neural networks [J].
King, S ;
Taylor, P .
COMPUTER SPEECH AND LANGUAGE, 2000, 14 (04) :333-353