用于文本挖掘的特征选择方法TFIDF及其改进

被引:24
作者
景丽萍
黄厚宽
石洪波
机构
[1] 北方交通大学计算机科学与技术学院
[2] 北方交通大学计算机科学与技术学院 北京
[3] 北京
关键词
文本挖掘; TFIDF; 评估函数; 空间矢量模型; 特征选择;
D O I
10.16088/j.issn.1001-6600.2003.01.030
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
文章使用TFIDF特征选择方法对数据源进行预处理,建立了空间矢量模型,为文本分类提供了便利的数据结构.通过分类结果测试该特征选择方法的精确度.根据实验结果分析TFIDF的优缺点,并提出改进的方法.
引用
收藏
页码:142 / 145
页数:4
相关论文
共 1 条
[1]  
A vector space model for automatic indexing. Salton G,Wong A,Yang C S. Communications of the ACM . 1975