本论文主要对说话人识别系统中特征提取及预处理中端点检测两部分进行了研究,在特征提取方面,对多参数组合特征进行了性能分析,在端点检测方面,提出了一种基于扩展谱相减与非语音段概率(SAP)软门限的带噪语音端点检测方法。并对说话人实时识别系统进行了DSP实现,该系统已经初步应用到入户门语音控制门锁中。
在对目前存在的单一主流特征进行研究的基础上,本文通过二次特征提取,对LPCC和MFCC及二者的动态特征参数进行了特征组合,应用于说话人识别,并对各多参数组合特征进行了评价,通过计算机仿真实验,说明应用多参数组合特征有利于改善识别效果。
针对传统的端点检测方法在低信噪比时的不足,本文提出了一种基于扩展谱相减与SAP软门限的带噪语音端点检测方法,该方法不需要语音激活检测,在语音段也能估计背景噪声,通过与短时能量方法的对比实验,验证了本文方法在低信噪比时的有效性。
针对说话人识别系统的实际应用,采用不同特征参数及识别准则对说话人识别系统进行了DSP实时实现,共对四种方法进行计算机仿真实验和系统实际测试,分别得到应用各方法情况下系统的识别率、存储量及运行时间,通过分析实验结果,综合考虑系统的识别率和程序复杂度要求,最终选择应用LPCC+MFCC+ΔMFCC加权组合特征及最小失真距离准则,并将其应用到语音控制门锁。