文本分类中的特征选择方法

被引:11
作者
程泽凯
陆小艺
机构
[1] 安徽工业大学计算机学院
[2] 广西师范大学计算机科学学院 安徽马鞍山
[3] 广西师范大学计算机科学学院
[4] 广西桂林
关键词
文本分类; 特征选择; 评估函数;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本分类是数据挖掘的一个重要的研究方向,用机器学习方法进行特征选择对文本分类起关键作用。结合的工作,本文从文本的特征表示、特征选择等方面加以阐述,综合了已有和最新的各种基于评估函数的特征选择的方法,评价了它们的优缺点和适用范围。
引用
收藏
页码:220 / 224
页数:5
相关论文
共 5 条
[1]   文本分类中的特征抽取 [J].
秦进 ;
陈笑蓉 ;
汪维家 ;
陆汝占 .
计算机应用, 2003, (02) :45-46
[2]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101
[3]   特征选择和提取要素的分析及其评价 [J].
范劲松 ;
方廷健 ;
不详 .
计算机工程与应用 , 2001, (13) :95-99
[4]   VSM中词权重的信息熵算法 [J].
刁倩 ;
王永成 ;
张惠惠 ;
何骥 .
情报学报, 2000, (04) :354-358
[5]  
知识发现[M]. 清华大学出版社 , 史忠植著, 2002