基尼指数在文本特征选择中的应用研究

被引:5
作者
林永民 [1 ]
朱卫东 [2 ]
机构
[1] 河北理工大学经济管理学院
[2] 北京交通大学计算机与信息技术学院
关键词
文本分类; 特征选择; 基尼指数; 特征评估函数;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
使用基尼指数原理进行了文本特征选择的研究,构造了基于基尼指数的适合于文本特征选择的评估函数。结合fkNN和SVM两种不同的分类方法,在两个不同的语料集上,与其他著名的文本特征选择方法进行比较和分析实验,结果显示它的性能与现有的特征选择方法不相上下,但在算法时间复杂上获得了良好的性能。
引用
收藏
页码:2584 / 2586+2590 +2590
页数:4
相关论文
共 5 条
[1]   文本分类中基于基尼指数的特征选择算法研究 [J].
尚文倩 ;
黄厚宽 ;
刘玉玲 ;
林永民 ;
瞿有利 ;
董红斌 .
计算机研究与发展 , 2006, (10) :1688-1694
[2]   中文文本分类中的特征选择研究 [J].
周茜 ;
赵明生 ;
扈旻 .
中文信息学报, 2004, (03) :17-23
[3]   向量空间法中单词权重函数的分析和构造 [J].
陆玉昌 ;
鲁明羽 ;
李凡 ;
周立柱 .
计算机研究与发展, 2002, (10) :1205-1210
[4]  
陈涛,谢阳群.文本分类中的特征降维方法综述[J].情报学报,2005(06)
[5]  
赵晖.支持向量机分类方法及其在文本分类中的应用研究[D].大连理工大学,2006