基于TFIDF的特征选择方法

被引:22
作者
王美方
刘培玉
朱振方
机构
[1] 山东师范大学信息科学与工程学院
关键词
特征选择; 术语频率; 逆文档频率; 文本分类; 评价函数;
D O I
10.16208/j.issn1000-7024.2007.23.071
中图分类号
TP393.01 [];
学科分类号
摘要
在文本分类系统中,特征选择方法是一种有效的降维方法。在分析了几种常用的特征选择评价函数之后,将权值计算函数应用于特征选择,并基于改进的TFIDF方法提出了一种新的评价函数,它将类别信息引入到特征项中,提取出与类别相关的特征项,弥补了TFIDF的缺陷。实验证明该方法简单可行,有助于提高所选特征子集的有效性。
引用
收藏
页码:5795 / 5796+5799 +5799
页数:3
相关论文
共 8 条