语音识别中说话人自适应技术的研究与实现

被引:0
作者
崔双喜
机构
[1] 燕山大学
关键词
语音识别; 说话人自适应; 最大后验概率; 特征语音; 综合自适应;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
虽然非特定人语音识别系统达到了令人满意的性能,但在实际应用时,由于说话人的改变通常会使系统性能显著下降。当遇到特殊口音的说话人时,系统的误识率甚至更大。语音识别要走向实用,就必须克服这个鲁棒性问题。因此,说话人自适应技术的意义非常重要。 本文从说话人自适应技术入手讨论了语音自适应的各种方法。通过对说话人引起的声学差异的讨论,我们分析和实现了两种说话人自适应方法:最大后验概率(Maximum a Posteriori, MAP)方法和特征语音(Eigenvoice, EV)方法。实验证明这两种自适应方法对说话人自适应有很好的效果。 在此基础上本文提出了一种适合强健语音的综合自适应方法。它是在MAP方法中引入一个EV模块,这种新方法成功地结合了MAP和EV两种方法的优点,弥补它们的的缺点。EV方法(属于快速说话人自适应方法)在自适应数据很少时性能优于MAP方法,但随着数据的增加,由于很强的约束强加于它的模型假设,其性能难于改善;而MAP方法给出了结合先验知识和自适应数据的最优解,有良好的渐进性,但自适应数据较少时性能较差。 最后,本文通过对汉语数字的识别实验实现了这三种说话人自适应技术。从识别实验中可以看出,在自适应数据较少时,EV方法识别效果较好,而随着自适应数据的增加,MAP方法显示了其优越性。而我们提出的结合这两种方法的综合自适应方法,即使在自适应数据比较少的情况下也取得了很好的效果,这种新方法能够有效的克服说话人差异对识别系统的影响,适合强健语音识别系统的要求。
引用
收藏
页数:85
共 12 条
[1]
语音识别技术的研究及基本实现 [D]. 
雷静 .
武汉理工大学,
2002
[2]
汉语数码语音识别自适应算法 [J].
李虎生 ;
杨明杰 ;
刘润生 .
电路与系统学报, 1999, (02) :1-6
[3]
基于有限状态径向基函数网络的汉语语音识别研究 [J].
李苇营 ;
易克初 ;
吴文虎 ;
方棣棠 .
电子学报, 1996, (01)
[4]
基于连续高斯混合密度HMM的汉语全音节语音识别研究 [J].
国立新 ;
莫福源 ;
李昌立 .
声学学报, 1995, (05)
[5]
神经网络与HMM构成的混合网络在语音识别中应用的研究 [J].
李苇营 ;
易克初 ;
胡征 .
电子学报, 1994, (10)
[6]
全音节汉语语音识别系统的声学模型研究 [J].
关存太 ;
陈永彬 ;
吴伯修 .
声学学报, 1994, (05)
[7]
听觉模型用于语音识别以及与一般方法的比较 [J].
高雨青 ;
黄泰翼 ;
陈韶岩 .
电子学报, 1993, (10) :1-6
[8]
汉语孤立字全音节实时识别系统 [J].
陈韬 ;
李昌立 ;
莫福源 .
声学学报, 1993, (03) :161-171
[9]
认人的限定主题的连续汉语语音识别系统的研究 [J].
林道发 ;
杨家沅 ;
罗万伯 ;
王跟东 .
声学学报, 1992, (06) :468-472
[10]
用图样匹配法在计算机上自动识别语音 [J].
俞铁城 .
物理学报, 1977, (05) :389-396