用于中文文本分类的基于类别区分词的特征选择方法

被引:9
作者
周奇年
张振浩
徐登彩
机构
[1] 浙江理工大学信息学院
关键词
文本分类; 特征选择; 类别区分词; 信息增益; 互信息; 期望交叉熵;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
特征选择是中文文本分类过程中的一个重要过程,特征项选择的优劣直接影响文本分类的准确率。在分析几种特征选择方法的基础上,提出一种类别区分词的特征选择方法。实验结果表明,类别区分词的特征选择方法的分类效率高于传统方法,从而验证了该方法的有效性。
引用
收藏
页码:193 / 195
页数:3
相关论文
共 9 条
[1]  
互联网中文文本分类的研究与应用.[D].陈冲.北京邮电大学.2011, 09
[2]  
文本分类中特征选择算法的分析与研究.[D].张彪.中国科学技术大学.2010, 01
[3]   文本分类中互信息特征选择方法的研究 [J].
范小丽 ;
刘晓霞 .
计算机工程与应用 , 2010, (34) :123-125
[4]   一种改进的文本分类特征选择方法 [J].
黄秀丽 ;
王蔚 .
计算机工程与应用, 2009, 45 (36) :129-130+240
[5]   中文文本分类的两步特征选择法 [J].
陈集 ;
樊兴华 ;
王鹏 .
计算机辅助工程, 2008, (03) :76-80
[6]   文本分类中词语权重计算方法的改进与应用 [J].
熊忠阳 ;
黎刚 ;
陈小莉 ;
陈伟 .
计算机工程与应用, 2008, (05) :187-189
[7]   文本分类中一种新的特征选择方法 [J].
王秀娟 ;
郭军 ;
郑康锋 .
计算机应用, 2005, (03) :661-663
[8]   中文文本分类中的特征选择研究 [J].
周茜 ;
赵明生 ;
扈旻 .
中文信息学报, 2004, (03) :17-23
[9]  
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11