基于方差的CHI特征选择方法

被引:30
作者
邱云飞 [1 ,2 ]
王威 [1 ]
刘大有 [2 ]
邵良杉 [1 ]
机构
[1] 辽宁工程技术大学软件学院
[2] 吉林大学计算机科学与技术学院
关键词
文本分类; 特征选择; 卡方统计量; 方差;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
通过分析特征词与类别间的相关性,在原有的卡方特征选择的方法上增加三个调节参数,使选出的特征词集中分布在某一类,且在某一类中尽可能地均匀分布,并使特征词在某一类中出现的次数尽可能地多。通过实验对比改进前后的卡方特征选择方法,基于方差的卡方统计(Var-CHI)方法使得查全率和查准率都得到了明显的提高。
引用
收藏
页码:1304 / 1306
页数:3
相关论文
共 9 条
[1]  
文本分类中的关键技术研究.[D].张俊丽.华中师范大学.2008, 09
[2]  
文本分类中特征选择方法的研究.[D].余俊英.江西师范大学.2007, 04
[3]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90
[4]   在线特征选择的目标跟踪 [J].
杨恢先 ;
杨心力 ;
曾金芳 ;
于洪 .
计算机应用研究, 2010, 27 (03) :1180-1182
[5]   聚类分析中特征选择的研究 [J].
周宇 ;
覃征 .
计算机应用研究, 2006, (05) :55-57+62
[6]   基于K-均值聚类的无监督的特征选择方法 [J].
张莉 ;
孙钢 ;
郭军 .
计算机应用研究, 2005, (03) :23-24+42
[7]   文本分类中结合评估函数的TEF-WA权值调整技术 [J].
唐焕玲 ;
孙建涛 ;
陆玉昌 .
计算机研究与发展, 2005, (01) :47-53
[8]   一种改进的文本网页分类特征选择方法 [J].
李粤 ;
李星 ;
刘辉 ;
许静芳 .
计算机应用, 2004, (07) :119-121
[9]  
文本分类及其相关技术研究.[D].李荣陆.复旦大学.2005, 07