一种最大分类间隔SVDD的多类文本分类算法

被引:6
作者
罗琦
机构
[1] 中国西南电子技术研究所
关键词
信息检索; 文本挖掘; 文本分类; 支持向量数据描述; 多类分类器;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文本分类是信息检索和文本挖掘的关键技术之一。提出了一种基于支持向量数据描述(SVDD)的多类文本分类算法,用支持向量描述训练求得包围各类样本的最小超球体,并使得分类间隔最大化,在测试阶段,引入基于核空间k-近邻平均距离的判别准则,判断样本所属类别。实验结果表明,该方法具有很好的泛化能力和很好的时间性能。
引用
收藏
页码:496 / 499
页数:4
相关论文
共 6 条
[1]
支持向量机.[M].邓乃扬; 田英杰; 著.科学出版社.2009,
[2]
A new maximal-margin spherical-structured multi-class support vector machine [J].
Hao, Pei-Yi ;
Chiang, Jung-Hsien ;
Lin, Yen-Hsiu .
APPLIED INTELLIGENCE, 2009, 30 (02) :98-111
[3]
The combination of text classifiers using reliability indicators [J].
Bennett, PN ;
Dumais, ST ;
Horvitz, E .
INFORMATION RETRIEVAL, 2005, 8 (01) :67-100
[4]
Support vector data description [J].
Tax, DMJ ;
Duin, RPW .
MACHINE LEARNING, 2004, 54 (01) :45-66
[5]
Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47
[6]
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11