语音/音乐自动分类中的特征分析

被引:25
作者
卢坚
陈毅松
孙正兴
张福炎
机构
[1] 南京大学计算机科学与技术系
[2] 南京大学软件新技术国家重点实验室
关键词
特征分析; 基于内容的音频分类; 隐马尔可夫模型(HMM); MFCC;
D O I
暂无
中图分类号
TN912.1 [电声学];
学科分类号
摘要
综合分析了语音和音乐的区别性特征 ,包括音调、亮度、谐度等感觉特征与 MFCC(Mel- Frequency CepstralCoefficients)系数等 ,提出一种 left- right DHMM(Discrete Hidden Markov Model)的分类器 ,以极大似然作为判别规则 ,用于语音、音乐以及它们的混合声音的分类 ,并且考察了上述特征集合在该分类器中的分类性能 .实验结果表明 ,文中提出的音频特征有效、合理 ,分类性能较好
引用
收藏
页码:233 / 237
页数:5
相关论文
共 3 条
[1]  
Generalized mel frequency cepstral coefficients for large-vocabulary speakerindependent continuous speech recognition. Rivarol Vergin,Douglas O’ Shaughnessay. IEEE Transactions on Speech and Audio Processing . 1999
[2]  
Fundamentals of Speech Recognition. L Rabiner,B H Juang. . 1993
[3]  
Content -based classification and retrieval of audio using the nearest feature line method. Stan Z Li. IEEE Transactions on Speech and Audio Processing . 2000