文本分类中的特征降维方法研究

被引:32
作者
张玉芳
万斌候
熊忠阳
机构
[1] 重庆大学计算机学院
关键词
文本分类; 特征降维; 集中度; 分散度; 评估函数;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
特征降维是文本分类过程中的一个重要环节,为了提高特征降维的准确率,选出能有效区分文本类别的特征词,提高文本分类的效果,提出了结合文本类间集中度、文本类内分散度和词频类间集中度的特征降维方法。当获取特征词在文本集上的整体评价时,提出了一种新的全局评估函数,用最大值与次大值之差作为最终的评价函数值。实验比较了该方法与传统的特征降维方法,结果表明该方法在中文文本分类中具有较好的降维效果。
引用
收藏
页码:2541 / 2543
页数:3
相关论文
共 7 条