音频自动分类中的特征分析和抽取

被引：13

作者：

白亮

老松杨

陈剑赟

吴玲达

机构：

[1] 国防科技大学多媒体研发中心

来源：

小型微型计算机系统 | 2005年 / 11期

关键词：

特征分析和抽取; 基于内容的音频分类; 支持向量机;

D O I：

暂无

中图分类号：

TN912.3 [语音信号处理];

学科分类号：

0711 ;

摘要：

音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频"流"特征—High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.

引用

页码：159 / 164

页数：6