基于交叉覆盖算法的文本分类

被引:6
作者
王倩倩
段震
张燕平
机构
[1] 安徽大学计算智能与信号处理重点实验室
基金
安徽省自然科学基金;
关键词
文本分类; x2统计量; 交叉覆盖算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
分类是文本信息搜索和挖掘的核心内容,被广泛应用于搜索引擎的设计以及数据挖掘的研究中。首先对文本进行分词,对分词的结果采用x2统计量的方法提取特征,再使用前向神经网络的交叉覆盖算法作为分类器进行文本分类。实验表明,x2统计量可大规模降低特征维数,在此基础上结合交叉覆盖算法的优秀分类能力,可在特征维数较低的情况下获得一个性能较好的文本分类器。
引用
收藏
页码:113 / 115
页数:3
相关论文
共 6 条
[1]
文本分类中的特征选取 [J].
刘丽珍 ;
宋瀚涛 .
计算机工程, 2004, (04) :14-15+175
[2]
前向神经网络交叉覆盖算法的一种改进 [J].
吴涛 ;
张燕平 ;
张铃 .
微机发展, 2003, (03) :50-52
[3]
多层前向网络的交叉覆盖设计算法 [J].
张铃 ;
张钹 ;
殷海风 .
软件学报, 1999, (07) :737-742
[4]
M-P神经元模型的几何意义及其应用 [J].
张铃 ;
张钹 .
软件学报, 1998, (05)
[5]
文本分类器准确性评估方法.[J].程泽凯;林士敏;.情报学报.2004, 05
[6]
文本分类中的特征降维方法综述.[J].陈涛;谢阳群;.情报学报.2005, 06