文本分类中基于位置和类别信息的一种特征降维方法

被引:8
作者
刘海峰 [1 ]
王元元 [1 ]
张学仁 [2 ]
姚泽清 [2 ]
机构
[1] 解放军理工大学指挥自动化学院
[2] 解放军理工大学理学院
关键词
文本分类; 特征选择; 特征降维; 位置加权; 类别分布;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
从文本特征项所处的位置角度提出了特征项基于位置的降维方法;同时结合特征的类别分布进行了二次特征降维。这种基于位置和类别相结合的特征降维方法在最大程度减少信息损失的条件下,实现了特征维数的有效压缩。实验表明,该方法有较高的文本分类效率。
引用
收藏
页码:2292 / 2294
页数:3
相关论文
共 9 条
[1]   基于Web的文本检索位置加权模型研究 [J].
刘海峰 ;
王倩 ;
王元元 .
情报科学, 2007, (03) :451-455
[2]   基于分类的VSM模式下文本检索研究 [J].
刘海峰 ;
王元元 ;
王倩 .
情报科学, 2006, (11) :1700-1703
[3]   基于向量模型的文本检索若干问题研究 [J].
刘海峰 ;
王元元 .
情报杂志 , 2006, (10) :57-59+62
[4]   基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[5]   基于类别空间模型的文本分类系统的设计与实现 [J].
黄冉 ;
郭嵩山 .
计算机应用研究, 2005, (08) :60-63
[6]   自动文本分类中权值公式的改进 [J].
寇莎莎 ;
魏振军 .
计算机工程与设计, 2005, (06) :1616-1618
[7]  
文本分类中的特征降维方法综述.[J].陈涛;谢阳群;.情报学报.2005, 06
[8]  
Web概念挖掘中标引源加权方案初探.[J].侯汉清;章成志;郑红;.情报学报.2005, 01
[9]  
情报语言学基础.[M].张琪玉著;.武汉大学出版社.1997,