SVM文本分类中一种新的特征提取方法

被引：16

作者：

姜鹤

陈丽亚

机构：

[1] 上海交通大学电子信息与电气工程学院

来源：

计算机技术与发展 | 2010年 / 20卷 / 03期

关键词：

文本分类; 特征提取; 支持向量机; 资源受限;

D O I：

暂无

中图分类号：

TP181 [自动推理、机器学习];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

随着互联网的迅速发展,面向重要网络媒体海量发布信息实现智能分类,对于网络信息监管、舆论引导工作有着深远的意义。文中针对在文本分类中的特征选取问题,描述了一种基于法矢量权重的特征评价和选取方法。将此方法与SVM学习算法进行结合,在路透社标准文本测试集上进行了对比评估。实验结果显示,此特征选取方法相对于传统的特征选取方法可以产生更优的分类性能。此特征提取方法提供一种有效的途径,在基本保持分类器性能的前提下显著地减少特征空间的维数,进而提升系统的资源利用效率。

引用

页码：17 / 19+23 +23

页数：4

共 5 条

[1] 基于特征有序对量化表示的文本分类方法 [J].