共 3 条
基于TFIDF的文本特征选择方法
被引:31
作者:
柴玉梅
王宇
机构:
[1] 郑州大学信息工程学院
来源:
关键词:
文本分类;
特征选择;
术语频率;
逆文档频率;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
本文在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于术语频率和逆文档频率的特征选择方法TDF。采用KNN和NaiveBayes两种分类算法对该方法进行了测试。实验结果表明,TDF方法较其他几种方法有较好的分类精度。
引用
收藏
页码:24 / 26
页数:3
相关论文