一种基于向量空间模型的改进文本分类算法

被引:14
作者
牛玲
机构
[1] 亳州师范高等专科学校
关键词
向量空间模型; 文本分类; 信息检索; 潜在语义索引; 核潜在语义索引;
D O I
暂无
中图分类号
G354 [情报检索];
学科分类号
120502 [情报学];
摘要
探讨了基于向量空间模型的文本分类技术,通过规范化向量空间模型术语,论述了向量空间模型中TD-IDF向量化文档的不足;提出基于位置等因素的权重改进算法;借助扩展的潜在语义索引算法KLSC和辅助主题词表来消除模型很难处理一词多义、一义多词的现象;根据用户个性化的服务需求,给出了个性化服务的意见。
引用
收藏
页码:63 / 64+67 +67
页数:3
相关论文
共 2 条
[1]
基于潜在语义的多类文本分类模型研究[J] 叶浩;王明文;曾雪强 清华大学学报(自然科学版) 2005, S1
[2]
一个基于向量空间模型的中文文本自动分类系统 [J].
朱华宇 ;
孙正兴 ;
张福炎 .
计算机工程, 2001, (02) :15-17+63