基于正交分解的文本分类模型

被引:3
作者
熊忠阳
李智星
张玉芳
江帆
机构
[1] 重庆大学计算机学院
关键词
文本分类; 正交分解; 向量空间模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对文本分类领域中向量空间模型维数过高和空间扭曲的问题,提出一种基于正交分解的新模型。借用物理学中力的正交分解,将高维的文本向量映射到低维的以类别为坐标轴的空间中,解决了高维的向量和扭曲的空间这2个问题。实验表明,与向量空间模型相比,新模型下分类速度有较大提高,精度也有所增加。
引用
收藏
页码:227 / 229
页数:3
相关论文
共 6 条
[1]   基于改进向量空间模型的邮件分类 [J].
廖玲 ;
文敦伟 .
计算机与数字工程, 2007, (04) :190-193+8
[2]   基于VSM的文档信息检索改进 [J].
焦玉英 ;
宋晓晴 .
情报理论与实践, 2007, (01) :97-99+104
[3]   基于潜在语义的多类文本分类模型研究 [J].
叶浩 ;
王明文 ;
曾雪强 .
清华大学学报(自然科学版), 2005, (S1) :1818-1822
[4]   使用最大熵模型进行中文文本分类 [J].
李荣陆 ;
王建会 ;
陈晓云 ;
陶晓鹏 ;
胡运发 .
计算机研究与发展, 2005, (01) :94-101
[5]  
文本分类器准确性评估方法.[J].程泽凯;林士敏;.情报学报.2004, 05
[6]  
基于决策树和K最近邻算法的文本分类研究.[D].王煜.天津大学.2006, 05