文本分类中的特征提取方法的研究

被引：3

作者：

姚学礼

机构：

[1] 河南省政法管理干部学院

来源：

光盘技术 | 2009年 / 06期

关键词：

文本分类; 特征提取; 方法;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

文本的特征提取是文本分类过程中的一个重要环节,它的好坏将直接影响文本分类的准确率。该文介绍了词条的统计方法(CHI)、词条与类别的互信息(MI)、信息增益(IG)、词条的期望交叉熵(CE)等文本特征提取方法,并对其取词策略进行了改进。

引用

收藏

页码：15 / 16

页数：2

相关论文

共 2 条

[1]

文本分类中的特征抽取 [J].

秦进 ;

陈笑蓉 ;

汪维家 ;

陆汝占 .

计算机应用, 2003, (02) :45-46

[2]

独立于语种的文本分类方法 [J].

黄萱菁 ;

吴立德 ;

石崎洋之 ;

徐国伟 .

中文信息学报, 2000, (06) :1-7