共 2 条
文本分类中特征选择方法研究
被引:3
作者:
王维娜
康耀红
伍小芹
机构:
[1] 海南大学信息科学技术学院
来源:
基金:
海南省自然科学基金;
关键词:
文本分类;
特征选择;
互信息;
信息增益;
x2统计;
期望交叉熵;
D O I:
10.13274/j.cnki.hdzj.2008.12.033
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
对四种特征选择方法:互信息、信息增益、x2统计和期望交叉熵作了简要的介绍,并且结合KNN分类算法,使用查全率、查准率、宏平均和微平均对四种特征选择方法分别进行评估,提出并讨论了互信息修正的两种方法。
引用
收藏
页码:29 / 31
页数:3
相关论文