基于DTW的语音识别和说话人识别的特征选择

被引：33

作者：

刘敬伟 ^{[1
]}

徐美芝 ^{[2
]}

郑忠国 ^{[3
]}

程乾生 ^{[3
]}

机构：

[1] 清华大学电子工程系

[2] 清华大学数学科学系

[3] 北京大学数学科学学院

来源：

模式识别与人工智能 | 2005年 / 18卷 / 01期

关键词：

特征选择; 相似矩阵; 动态时间规正; (l-r)优化算法;

D O I：

暂无

中图分类号：

TN912.34 [语音识别与设备];

学科分类号：

081002 [信号与信息处理];

摘要：

研究了基于动态时间规正(DTW)和图论方法的语音识别和说话人识别的特征子集选择问题,提出了基于DTW距离的有向图方法(DTWDAG)。此方法推广了基于欧氏距离的相似矩阵聚类方法,将图论聚类方法改进为语音和说话人特征选择的代价函数。并将此代价函数与(l-r)优化算法结合应用于孤立数字的特定人的语音识别和文本有关的说话人辩认的特征选择,实验结果表明,DTWDAG方法能够较好反映语音识别和说话人识别的特征子集的重要性。

引用

页码：50 / 54

页数：5