基于改进VSM的大规模真实文档自动分类系统的研究和实现

被引:10
作者
蒋晓冬
金宇晖
强庆华
机构
[1] 南京大学计算机科学与技术系
关键词
VSM,自动分类,文档重心,全文检索;
D O I
暂无
中图分类号
G354.43 [书目情报检索系统];
学科分类号
071102 [系统分析与集成];
摘要
随着Internet和光盘等大容量存储技术的迅速发展,如何迅速、有效地从大量信息中找到所需的信息已成为一个迫切需要解决的问题。文档自动分类系统就是将文档自动归到一个或几个文档类别中去,这一技术的发展将在信息检索、邮件分类、电子会议、信息过滤等许多环境中得到广泛应用。本次首次对传统的文档内容表示方法VSM(向量空间模型)作出改进,并针对系统特点提出了具体的分类算法。目前,本系统已初步实施完成并应用于江苏省“九五”重点攻关课题──“Internet数字图书馆”之中,取得了良好的效果。
引用
收藏
页数:4
相关论文
empty
未找到相关数据