基于演化超网络的中文文本分类方法

被引:10
作者
王进 [1 ,2 ]
金理雄 [1 ]
孙开伟 [1 ]
机构
[1] 重庆邮电大学计算机科学与技术学院
[2] 计算智能重庆市重点实验室
基金
教育部留学回国人员科研启动基金;
关键词
文本分类; 中文信息处理; 智能系统; 模式识别; 演化超网络;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
为了提高中文文本的分类效果,提出了一种基于演化超网络的中文文本分类方法.采用中国科学院计算技术研究所的汉语词法分析系统对中文文本进行分词,保留文本中的名词、动词和形容词作为特征;以χ2统计方法进行特征选择;利用布尔权重计算特征权值.经处理后的特征向量作为系统的训练集和测试集数据.运用超边替代策略训练超网络分类模型,并实现对测试集特征向量的分类.对不同阶数设定下的演化超网络模型进行了性能分析,并将其与传统的KNN和SVM算法进行了比较.结果表明,本方法对复旦大学语料和搜狐语料可获得87.2%和72.5%的宏识别率、86.9%和70.5%的宏召回率、87.0%和71.5%的宏F1,接近或优于KNN和SVM分类方法.所提出的方法是一种有效的中文文本分类手段.
引用
收藏
页码:196 / 201
页数:6
相关论文
共 6 条
[1]   基于赋权粗糙隶属度的文本情感分类方法 [J].
王素格 ;
李德玉 ;
魏英杰 .
计算机研究与发展, 2011, 48 (05) :855-861
[2]   基于阻塞先验知识的文本层次分类模型 [J].
李文 ;
苗夺谦 ;
卫志华 ;
王炜立 .
模式识别与人工智能, 2010, 23 (04) :456-463
[3]   一种采用聚类技术改进的KNN文本分类方法 [J].
张孝飞 ;
黄河燕 .
模式识别与人工智能, 2009, 22 (06) :936-940
[4]   Why-Oriented End-User Debugging of Naive Bayes Text Classification [J].
Kulesza, Todd ;
Stumpf, Simone ;
Wong, Weng-Keen ;
Burnett, Margaret M. ;
Perona, Stephen ;
Ko, Amy J. ;
Oberst, Ian .
ACM TRANSACTIONS ON INTERACTIVE INTELLIGENT SYSTEMS, 2011, 1 (01)
[5]  
One-against-one fuzzy support vector machine classifier: An approach to text categorization[J] . Tai-Yue Wang,Huei-Min Chiang.Expert Systems With Applications . 2009 (6)
[6]  
Associative and Parallel Processors[J] . Kenneth J. Thurber,Leon D. Wald.ACM Computing Surveys (CSUR) . 1975 (4)