一种组合型中文文本分类特征选择方法

被引:8
作者
刘海峰 [1 ]
王元元 [1 ]
刘守生 [2 ]
机构
[1] 中国人民解放军理工大学指挥自动化学院
[2] 中国人民解放军理工大学理学院
关键词
特征选择; 文本分类; 特征权重; 互信息;
D O I
10.16088/j.issn.1001-6600.2007.04.026
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
根据基于频数分布和基于互信息的特征选择模式的特点,将传统的tf-idf因子以及基于互信息的特征选择方法分别进行了改进,并在此基础上提出了一种新的组合型特征选择方法。试验结果表明,该算法提高了文本分类的准确率。
引用
收藏
页码:208 / 211
页数:4
相关论文
共 12 条