基于交叉覆盖算法的文本分类

被引：6

作者：

王倩倩

段震

张燕平

机构：

[1] 安徽大学计算智能与信号处理重点实验室

来源：

计算机技术与发展 | 2007年 / 06期

基金：

安徽省自然科学基金;

关键词：

文本分类; x2统计量; 交叉覆盖算法;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

分类是文本信息搜索和挖掘的核心内容,被广泛应用于搜索引擎的设计以及数据挖掘的研究中。首先对文本进行分词,对分词的结果采用x2统计量的方法提取特征,再使用前向神经网络的交叉覆盖算法作为分类器进行文本分类。实验表明,x2统计量可大规模降低特征维数,在此基础上结合交叉覆盖算法的优秀分类能力,可在特征维数较低的情况下获得一个性能较好的文本分类器。

引用

收藏

页码：113 / 115

页数：3

相关论文

共 6 条

[1]

文本分类中的特征选取 [J].

刘丽珍 ;

宋瀚涛 .

计算机工程, 2004, (04) :14-15+175

[2]

前向神经网络交叉覆盖算法的一种改进 [J].

吴涛 ;

张燕平 ;

张铃 .

微机发展, 2003, (03) :50-52

[3]

多层前向网络的交叉覆盖设计算法 [J].

张铃 ;

张钹 ;

殷海风 .

软件学报, 1999, (07) :737-742

[4]

M-P神经元模型的几何意义及其应用 [J].

张铃 ;

张钹 .

软件学报, 1998, (05)

[5]

文本分类器准确性评估方法.[J].程泽凯;林士敏;.情报学报.2004, 05

[6]

文本分类中的特征降维方法综述.[J].陈涛;谢阳群;.情报学报.2005, 06