学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种改进的文本分类特征选择方法
被引:20
作者
:
论文数:
引用数:
h-index:
机构:
黄秀丽
论文数:
引用数:
h-index:
机构:
王蔚
机构
:
[1]
南京师范大学教育科学学院机器学习与认知实验室
来源
:
计算机工程与应用
|
2009年
/ 36期
关键词
:
文本分类;
特征选择;
信息增益;
D O I
:
暂无
中图分类号
:
TP181 [自动推理、机器学习];
学科分类号
:
140502
[人工智能]
;
摘要
:
文本分类中特征空间的高维问题是文本分类的主要障碍之一。特征选择(Feature Selection)是一种有效的特征降维方法。现有的特征选择函数主要有文档频率(DF),信息增益(IG),互信息(MI)等。基于特征的基本约束条件以及高性能特征选择方法的设计步骤,提出了一种改进的特征选择方法SIG。该特征选择方法在保证分类效果的同时,提高了对中低频特征的偏向。在语料集Reuters-21578上的实验证明,该方法能够获得较好的分类效果,同时有效提高了对具有强分类能力的中低频特征的利用。
引用
收藏
页码:129 / 130+240 +240
页数:3
相关论文
共 1 条
[1]
基于区分类别能力的高性能特征选择方法
[J].
论文数:
引用数:
h-index:
机构:
徐燕
;
论文数:
引用数:
h-index:
机构:
李锦涛
;
论文数:
引用数:
h-index:
机构:
王斌
;
孙春明
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
孙春明
.
软件学报,
2008,
(01)
:82
-89
←
1
→
共 1 条
[1]
基于区分类别能力的高性能特征选择方法
[J].
论文数:
引用数:
h-index:
机构:
徐燕
;
论文数:
引用数:
h-index:
机构:
李锦涛
;
论文数:
引用数:
h-index:
机构:
王斌
;
孙春明
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
孙春明
.
软件学报,
2008,
(01)
:82
-89
←
1
→