学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
用于文本挖掘的特征选择方法TFIDF及其改进
被引:24
作者
:
景丽萍
论文数:
0
引用数:
0
h-index:
0
机构:
北方交通大学计算机科学与技术学院
景丽萍
黄厚宽
论文数:
0
引用数:
0
h-index:
0
机构:
北方交通大学计算机科学与技术学院
黄厚宽
石洪波
论文数:
0
引用数:
0
h-index:
0
机构:
北方交通大学计算机科学与技术学院
石洪波
机构
:
[1]
北方交通大学计算机科学与技术学院
[2]
北方交通大学计算机科学与技术学院 北京
[3]
北京
来源
:
广西师范大学学报(自然科学版)
|
2003年
/ 01期
关键词
:
文本挖掘;
TFIDF;
评估函数;
空间矢量模型;
特征选择;
D O I
:
10.16088/j.issn.1001-6600.2003.01.030
中图分类号
:
TP311.13 [];
学科分类号
:
1201 ;
摘要
:
文章使用TFIDF特征选择方法对数据源进行预处理,建立了空间矢量模型,为文本分类提供了便利的数据结构.通过分类结果测试该特征选择方法的精确度.根据实验结果分析TFIDF的优缺点,并提出改进的方法.
引用
收藏
页码:142 / 145
页数:4
相关论文
共 1 条
[1]
A vector space model for automatic indexing. Salton G,Wong A,Yang C S. Communications of the ACM . 1975
←
1
→
共 1 条
[1]
A vector space model for automatic indexing. Salton G,Wong A,Yang C S. Communications of the ACM . 1975
←
1
→