基于CHI值特征选取和覆盖的文本分类方法

被引:11
作者
闫屹
张燕平
耿筱媛
机构
[1] 安徽大学计算机学院
关键词
文本处理; 覆盖算法; 文本分类;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
利用CHI值特征选取和前向神经网络的覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。该方法利用CHI值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将CHI值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验,并在不同的维数上与SVM算法、朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM算法和朴素贝叶斯方法相比较,覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。
引用
收藏
页码:79 / 81+85 +85
页数:4
相关论文
共 2 条
[1]
文本分类中的特征选取 [J].
刘丽珍 ;
宋瀚涛 .
计算机工程, 2004, (04) :14-15+175
[2]
多层前向网络的交叉覆盖设计算法 [J].
张铃 ;
张钹 ;
殷海风 .
软件学报, 1999, (07) :737-742