音频自动分类中的特征分析和抽取

被引:13
作者
白亮
老松杨
陈剑赟
吴玲达
机构
[1] 国防科技大学多媒体研发中心
关键词
特征分析和抽取; 基于内容的音频分类; 支持向量机;
D O I
暂无
中图分类号
TN912.3 [语音信号处理];
学科分类号
0711 ;
摘要
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频"流"特征—High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.
引用
收藏
页码:159 / 164
页数:6
相关论文
共 2 条
[1]   语音/音乐自动分类中的特征分析 [J].
卢坚 ;
陈毅松 ;
孙正兴 ;
张福炎 .
计算机辅助设计与图形学学报, 2002, (03) :233-237
[2]   SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297