学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于CHI值特征选取和覆盖的文本分类方法
被引:11
作者
:
闫屹
论文数:
0
引用数:
0
h-index:
0
机构:
安徽大学计算机学院
闫屹
论文数:
引用数:
h-index:
机构:
张燕平
耿筱媛
论文数:
0
引用数:
0
h-index:
0
机构:
安徽大学计算机学院
耿筱媛
机构
:
[1]
安徽大学计算机学院
来源
:
计算机技术与发展
|
2008年
/ 05期
关键词
:
文本处理;
覆盖算法;
文本分类;
D O I
:
暂无
中图分类号
:
TP301.6 [算法理论];
学科分类号
:
080201
[机械制造及其自动化]
;
摘要
:
利用CHI值特征选取和前向神经网络的覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。该方法利用CHI值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将CHI值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验,并在不同的维数上与SVM算法、朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM算法和朴素贝叶斯方法相比较,覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。
引用
收藏
页码:79 / 81+85 +85
页数:4
相关论文
共 2 条
[1]
文本分类中的特征选取
[J].
论文数:
引用数:
h-index:
机构:
刘丽珍
;
论文数:
引用数:
h-index:
机构:
宋瀚涛
.
计算机工程,
2004,
(04)
:14
-15+175
[2]
多层前向网络的交叉覆盖设计算法
[J].
张铃
论文数:
0
引用数:
0
h-index:
0
机构:
安徽大学人工智能研究所!合肥清华大学智能技术与系统国家重点实验室,北京,清华大学计算机科学与技术系!北京清华大学智能技术与系统国家重点实验室,北京,安徽大学人工智能研究所!合肥
张铃
;
论文数:
引用数:
h-index:
机构:
张钹
;
殷海风
论文数:
0
引用数:
0
h-index:
0
机构:
安徽大学人工智能研究所!合肥清华大学智能技术与系统国家重点实验室,北京,清华大学计算机科学与技术系!北京清华大学智能技术与系统国家重点实验室,北京,安徽大学人工智能研究所!合肥
殷海风
.
软件学报,
1999,
(07)
:737
-742
←
1
→
共 2 条
[1]
文本分类中的特征选取
[J].
论文数:
引用数:
h-index:
机构:
刘丽珍
;
论文数:
引用数:
h-index:
机构:
宋瀚涛
.
计算机工程,
2004,
(04)
:14
-15+175
[2]
多层前向网络的交叉覆盖设计算法
[J].
张铃
论文数:
0
引用数:
0
h-index:
0
机构:
安徽大学人工智能研究所!合肥清华大学智能技术与系统国家重点实验室,北京,清华大学计算机科学与技术系!北京清华大学智能技术与系统国家重点实验室,北京,安徽大学人工智能研究所!合肥
张铃
;
论文数:
引用数:
h-index:
机构:
张钹
;
殷海风
论文数:
0
引用数:
0
h-index:
0
机构:
安徽大学人工智能研究所!合肥清华大学智能技术与系统国家重点实验室,北京,清华大学计算机科学与技术系!北京清华大学智能技术与系统国家重点实验室,北京,安徽大学人工智能研究所!合肥
殷海风
.
软件学报,
1999,
(07)
:737
-742
←
1
→