基于Rough集潜在语义索引的Web文档分类

被引:21
作者
何明
冯博琴
傅向华
机构
[1] 西安交通大学计算机科学与技术系,西安交通大学计算机科学与技术系,西安交通大学计算机科学与技术系西安,西安,西安
关键词
粗糙集; 潜在语义索引; Web文档分类; 信息过滤; 信息检索;
D O I
暂无
中图分类号
TP393 [计算机网络];
学科分类号
081206 [计算机网络与安全];
摘要
Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约简算法生成分类 规则,最后利用多知识库进行文档分类。通过试验比较,该方法具有较好的分类效果。
引用
收藏
页码:3 / 5
页数:3
相关论文
共 1 条
[1]
Rough集理论与知识获取.[M].王国胤编著;.西安交通大学出版社.2001,