基于模糊相似度的科技文献软聚类算法

被引:6
作者
孟海涛
陈笑蓉
机构
[1] 贵州大学计算机系
关键词
科技文献; 特征提取; 相似度; 软聚类;
D O I
10.15958/j.cnki.gdxbzrb.2007.02.017
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
本文提出了一种新的文档软聚类算法。将关键字通过文档的题名、摘要进行映射扩展,并对关键字的出现位置进行加权构造文本向量空间。利用模糊最大支撑树聚类过程中类间和类内相似度变化的规律自动识别最佳聚类数K及硬聚类簇。以硬聚类簇为核心将聚类相似度减小到下相似度进行扩展,从而形成相应软聚类。实验表明该算法能够有效地降低特征维数、提高软聚类精度和速度。
引用
收藏
页码:175 / 178
页数:4
相关论文
共 6 条
[1]   基于最大最小距离法的多中心聚类算法 [J].
周涓 ;
熊忠阳 ;
张玉芳 ;
任芳 .
计算机应用, 2006, (06) :1425-1427
[2]   科学文献的模糊聚类算法 [J].
林春燕 ;
朱东华 .
计算机应用, 2004, (11) :66-67+70
[3]   高维特征空间中文本聚类研究 [J].
姜宁 ;
宫秀军 ;
史忠植 .
计算机工程与应用, 2002, (10) :63-67
[4]   一种新的高效软聚类方法: [J].
裴继红,范九伦,谢维信 .
电子学报, 1998, (02) :83-86
[5]  
基于粗糙集加权的文本分类方法研究[J]. 胡清华,谢宗霞,于达仁.情报学报. 2005 (01)
[6]  
XML文档自动聚类研究[J]. 潘有能.情报学报. 2006 (02)