一种四维向量空间模型的Web新闻文本分类方法

被引:5
作者
魏程 [1 ]
刘鲁 [1 ]
翟铭 [2 ]
机构
[1] 北京航空航天大学经济管理学院
[2] 北京航空航天大学自动化及电气工程学院
关键词
文本挖掘; 文本分类; 向量空间模型; 四维向量空间模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本分类研究逐渐成为网络文本挖掘的研究热点,针对中文文本进行自动分类的研究也在逐渐升温。针对新闻文本的特殊性,在文本分类中经典的向量空间模型的基础上,提出了一套改进的四维向量空间模型及自适应追踪策略,进而提高了新闻文本分类的效果。实验结果表明,算法可以使传统空间向量模型的分类性能由81.5%提高至92.49%,证明算法是有效的。
引用
收藏
页码:58 / 62
页数:5
相关论文
共 6 条