基于模糊相似度的科技文献软聚类算法

被引：6

作者：

孟海涛

陈笑蓉

机构：

[1] 贵州大学计算机系

来源：

贵州大学学报(自然科学版) | 2007年 / 02期

关键词：

科技文献; 特征提取; 相似度; 软聚类;

D O I：

10.15958/j.cnki.gdxbzrb.2007.02.017

中图分类号：

TP301.6 [算法理论];

学科分类号：

摘要：

本文提出了一种新的文档软聚类算法。将关键字通过文档的题名、摘要进行映射扩展,并对关键字的出现位置进行加权构造文本向量空间。利用模糊最大支撑树聚类过程中类间和类内相似度变化的规律自动识别最佳聚类数K及硬聚类簇。以硬聚类簇为核心将聚类相似度减小到下相似度进行扩展,从而形成相应软聚类。实验表明该算法能够有效地降低特征维数、提高软聚类精度和速度。

引用

页码：175 / 178

页数：4

共 6 条

[1] 基于最大最小距离法的多中心聚类算法 [J].