学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于TFIDF的特征选择方法
被引:22
作者
:
论文数:
引用数:
h-index:
机构:
王美方
论文数:
引用数:
h-index:
机构:
刘培玉
论文数:
引用数:
h-index:
机构:
朱振方
机构
:
[1]
山东师范大学信息科学与工程学院
来源
:
计算机工程与设计
|
2007年
/ 23期
关键词
:
特征选择;
术语频率;
逆文档频率;
文本分类;
评价函数;
D O I
:
10.16208/j.issn1000-7024.2007.23.071
中图分类号
:
TP393.01 [];
学科分类号
:
摘要
:
在文本分类系统中,特征选择方法是一种有效的降维方法。在分析了几种常用的特征选择评价函数之后,将权值计算函数应用于特征选择,并基于改进的TFIDF方法提出了一种新的评价函数,它将类别信息引入到特征项中,提取出与类别相关的特征项,弥补了TFIDF的缺陷。实验证明该方法简单可行,有助于提高所选特征子集的有效性。
引用
收藏
页码:5795 / 5796+5799 +5799
页数:3
相关论文
共 8 条
[1]
自动文本分类特征选择方法研究
张海龙
论文数:
0
引用数:
0
h-index:
0
机构:
中国农业大学信息与电气工程学院
张海龙
论文数:
引用数:
h-index:
机构:
王莲芝
[J].
计算机工程与设计,
2006,
(20)
: 3838
-
3841
[2]
基于文本分类TFIDF方法的改进与应用
张玉芳
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
重庆大学计算机学院
张玉芳
彭时名
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
重庆大学计算机学院
彭时名
论文数:
引用数:
h-index:
机构:
吕佳
[J].
计算机工程,
2006,
(19)
: 76
-
78
[3]
基于TFIDF的文本特征选择方法
论文数:
引用数:
h-index:
机构:
柴玉梅
论文数:
引用数:
h-index:
机构:
王宇
[J].
微计算机信息,
2006,
(24)
: 24
-
26
[4]
文本分类中一种新的特征选择方法
王秀娟
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程学院
王秀娟
郭军
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程学院
郭军
论文数:
引用数:
h-index:
机构:
郑康锋
[J].
计算机应用,
2005,
(03)
: 661
-
663
[5]
一种新的基于统计的自动文本分类方法
论文数:
引用数:
h-index:
机构:
刘斌
论文数:
引用数:
h-index:
机构:
黄铁军
程军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
程军
论文数:
引用数:
h-index:
机构:
高文
[J].
中文信息学报,
2002,
(06)
: 18
-
24
[6]
WWW上的信息挖掘技术及实现
论文数:
引用数:
h-index:
机构:
邹涛
论文数:
引用数:
h-index:
机构:
王继成
朱华宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机科学与技术系
朱华宇
金翔宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机科学与技术系
金翔宇
张福炎
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机科学与技术系
张福炎
[J].
计算机研究与发展,
1999,
(08)
: 124
-
129
[7]
知识发现[M]. - 清华大学出版社 , 史忠植著, 2002
[8]
An Evaluation of Statistical Approaches to Text Categorization
Yiming Yang
论文数:
0
引用数:
0
h-index:
0
Yiming Yang
[J].
Information Retrieval,
1999,
1
(1-2):
: 69
-
90
←
1
→
共 8 条
[1]
自动文本分类特征选择方法研究
张海龙
论文数:
0
引用数:
0
h-index:
0
机构:
中国农业大学信息与电气工程学院
张海龙
论文数:
引用数:
h-index:
机构:
王莲芝
[J].
计算机工程与设计,
2006,
(20)
: 3838
-
3841
[2]
基于文本分类TFIDF方法的改进与应用
张玉芳
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
重庆大学计算机学院
张玉芳
彭时名
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
重庆大学计算机学院
彭时名
论文数:
引用数:
h-index:
机构:
吕佳
[J].
计算机工程,
2006,
(19)
: 76
-
78
[3]
基于TFIDF的文本特征选择方法
论文数:
引用数:
h-index:
机构:
柴玉梅
论文数:
引用数:
h-index:
机构:
王宇
[J].
微计算机信息,
2006,
(24)
: 24
-
26
[4]
文本分类中一种新的特征选择方法
王秀娟
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程学院
王秀娟
郭军
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程学院
郭军
论文数:
引用数:
h-index:
机构:
郑康锋
[J].
计算机应用,
2005,
(03)
: 661
-
663
[5]
一种新的基于统计的自动文本分类方法
论文数:
引用数:
h-index:
机构:
刘斌
论文数:
引用数:
h-index:
机构:
黄铁军
程军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
程军
论文数:
引用数:
h-index:
机构:
高文
[J].
中文信息学报,
2002,
(06)
: 18
-
24
[6]
WWW上的信息挖掘技术及实现
论文数:
引用数:
h-index:
机构:
邹涛
论文数:
引用数:
h-index:
机构:
王继成
朱华宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机科学与技术系
朱华宇
金翔宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机科学与技术系
金翔宇
张福炎
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机科学与技术系
张福炎
[J].
计算机研究与发展,
1999,
(08)
: 124
-
129
[7]
知识发现[M]. - 清华大学出版社 , 史忠植著, 2002
[8]
An Evaluation of Statistical Approaches to Text Categorization
Yiming Yang
论文数:
0
引用数:
0
h-index:
0
Yiming Yang
[J].
Information Retrieval,
1999,
1
(1-2):
: 69
-
90
←
1
→