基于Log似然比的特征选择算法

被引:4
作者
林森
唐发根
机构
[1] 北京航空航天大学计算机学院
关键词
文本分类; 向量空间模型; 特征选择;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对基于向量空间模型文本分类系统中特征选择算法存在的问题,提出一种基于Log似然比的特征选择算法,引进Log似然比统计量,在考虑稀有事件对分类结果产生正面影响的同时,较好地控制其对分类产生的负面影响。采用KNN分类方法,将Log似然比特征选择算法与典型特征算法进行比较,实验结果表明,该算法能够获得良好的性能。
引用
收藏
页码:56 / 58+61 +61
页数:4
相关论文
共 2 条
[1]   中文文本分类中的特征选择研究 [J].
寇苏玲 ;
蔡庆生 .
计算机仿真, 2007, (03) :289-291
[2]   An Evaluation of Statistical Approaches to Text Categorization [J].
Yiming Yang .
Information Retrieval, 1999, 1 (1-2) :69-90