SVM文本分类中一种新的特征提取方法

被引:16
作者
姜鹤
陈丽亚
机构
[1] 上海交通大学电子信息与电气工程学院
关键词
文本分类; 特征提取; 支持向量机; 资源受限;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
随着互联网的迅速发展,面向重要网络媒体海量发布信息实现智能分类,对于网络信息监管、舆论引导工作有着深远的意义。文中针对在文本分类中的特征选取问题,描述了一种基于法矢量权重的特征评价和选取方法。将此方法与SVM学习算法进行结合,在路透社标准文本测试集上进行了对比评估。实验结果显示,此特征选取方法相对于传统的特征选取方法可以产生更优的分类性能。此特征提取方法提供一种有效的途径,在基本保持分类器性能的前提下显著地减少特征空间的维数,进而提升系统的资源利用效率。
引用
收藏
页码:17 / 19+23 +23
页数:4
相关论文
共 5 条
[1]   基于特征有序对量化表示的文本分类方法 [J].
任纪生 ;
王作英 .
清华大学学报(自然科学版), 2006, (04) :527-529+533
[2]   文本分类中的特征选取 [J].
刘丽珍 ;
宋瀚涛 .
计算机工程, 2004, (04) :14-15+175
[3]   自动文本分类中的智能处理技术 [J].
孙晋文 ;
肖建国 .
计算机科学, 2003, (08) :18-20
[4]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[5]   文本自动分类中的词权重与分类算法 [J].
刁倩 ;
王永成 ;
张惠惠 ;
何骥 .
中文信息学报, 2000, (03) :25-29