文本分类特征降维研究综述

被引:17
作者
奉国和 [1 ]
郑伟 [2 ]
机构
[1] 华南师范大学经济管理学院信息管理系
[2] 河北北方学院理学院
关键词
文本分类; 特征降维; 特征选择; 特征抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
特征降维是文本分类的关键技术之一,包括特征选择与特征抽取两类,其中特征选择按特征子集获取范围、特征子集搜索策略、特征子集评价策略等方式进行不同划分。归纳出当前特征选择与特征抽取所用的常用方法,分析各种方法的原理、指出每种方法的优势与不足,总结出相应改进算法。
引用
收藏
页码:109 / 113
页数:5
相关论文
共 19 条
[1]   潜在语义索引中特征优化技术的研究 [J].
季铎 ;
郑伟 ;
蔡东风 .
中文信息学报, 2009, (02) :69-76
[2]   广义的势支撑特征选择方法GPSFM [J].
皋军 ;
王士同 ;
邓赵红 .
计算机研究与发展, 2009, (01) :41-51
[3]   二值文本分类中基于Bayes推理的特征选择方法 [J].
闫鹏 ;
郑雪峰 ;
李明祥 ;
陈松华 .
计算机科学, 2008, (07) :173-176
[4]   基于区分类别能力的高性能特征选择方法 [J].
徐燕 ;
李锦涛 ;
王斌 ;
孙春明 .
软件学报, 2008, (01) :82-89
[5]   基尼指数在文本特征选择中的应用研究 [J].
林永民 ;
朱卫东 .
计算机应用, 2007, (10) :2584-2586+2590
[6]   一种改进的基于条件互信息的特征选择算法 [J].
王卫玲 ;
刘培玉 ;
初建崇 .
计算机应用, 2007, (02) :433-435
[7]   基于改进的互信息特征选择的文本分类 [J].
伍建军 ;
康耀红 .
计算机应用, 2006, (S2) :172-173
[8]   文本分类中基于基尼指数的特征选择算法研究 [J].
尚文倩 ;
黄厚宽 ;
刘玉玲 ;
林永民 ;
瞿有利 ;
董红斌 .
计算机研究与发展 , 2006, (10) :1688-1694
[9]   基于潜在语义索引和遗传算法的文本特征提取方法 [J].
郝占刚 ;
王正欧 .
情报科学, 2006, (01) :104-107
[10]   基于类别特征域的文本分类特征选择方法 [J].
赵世奇 ;
张宇 ;
刘挺 ;
陈毅恒 ;
黄永光 ;
李生 .
中文信息学报, 2005, (06) :23-29