TFIDF算法研究综述

被引:198
作者
施聪莺
徐朝军
杨晓江
机构
[1] 南京师范大学教育技术系
关键词
TFIDF; 文本分类; VSM;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本分类中特征项权重的赋予对于分类效果有较大的影响,TFIDF算法是权重计算的重要算法之一。在回顾TFIDF算法发展历史的基础上,考察了其固有缺陷,总结诸多学者对其的改进方法,并对TFIDF算法新的应用领域进行了概括,并通过实验验证相关改进算法,为读者更好地应用TFIDF算法提供参考。
引用
收藏
页码:167 / 170+180 +180
页数:5
相关论文
共 13 条