文本分类中特征选择方法研究

被引:3
作者
王维娜
康耀红
伍小芹
机构
[1] 海南大学信息科学技术学院
基金
海南省自然科学基金;
关键词
文本分类; 特征选择; 互信息; 信息增益; x2统计; 期望交叉熵;
D O I
10.13274/j.cnki.hdzj.2008.12.033
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
对四种特征选择方法:互信息、信息增益、x2统计和期望交叉熵作了简要的介绍,并且结合KNN分类算法,使用查全率、查准率、宏平均和微平均对四种特征选择方法分别进行评估,提出并讨论了互信息修正的两种方法。
引用
收藏
页码:29 / 31
页数:3
相关论文
共 2 条
[1]   文本分类中的特征选取 [J].
刘丽珍 ;
宋瀚涛 .
计算机工程, 2004, (04) :14-15+175
[2]   文本分类中的特征抽取 [J].
秦进 ;
陈笑蓉 ;
汪维家 ;
陆汝占 .
计算机应用, 2003, (02) :45-46