基于改进的互信息特征选择的文本分类

被引:4
作者
伍建军
康耀红
机构
[1] 海南大学信息科学技术学院
关键词
特征选择; 互信息; K-近邻法; 文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
使用传统的互信息评估函数进行特征选择方法,得到的分类精度并不高。提出了一种考虑词频作用的互信息评估函数,并采用了K-近邻算法进行文本分类测试,通过分析测试结果,使用改进的互信息评估函数进行特征选择,提高了文本分类的精度。
引用
收藏
页码:172 / 173
页数:2
相关论文
共 2 条
[1]   使用KNN算法的文本分类 [J].
张宁 ;
贾自艳 ;
史忠植 .
计算机工程, 2005, (08) :171-172+185
[2]   中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32