共 2 条
音频自动分类中的特征分析和抽取
被引:13
作者:
白亮
老松杨
陈剑赟
吴玲达
机构:
[1] 国防科技大学多媒体研发中心
来源:
关键词:
特征分析和抽取;
基于内容的音频分类;
支持向量机;
D O I:
暂无
中图分类号:
TN912.3 [语音信号处理];
学科分类号:
0711 ;
摘要:
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频"流"特征—High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.
引用
收藏
页码:159 / 164
页数:6
相关论文