一种改进的孤立点消除及网络文本聚类算法

被引：2

作者：

罗姗姗

杜庆治

杨秋萍

龙华

机构：

[1] 昆明理工大学信息工程与自动化学院

来源：

云南师范大学学报(自然科学版) | 2012年 / 32卷 / 01期

关键词：

层次聚类; CURE; 孤立点;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

通过对CURE(Clustering Using Representatives)的研究,在此基础上,针对网络话题文本内容广泛、孤立点较多的特点,增加对孤立点的预处理过程,提出一种适用于网络话题文本聚类的层次聚类算法。该算法能降低算法对孤立点的敏感度,同时提高聚类效率,通过实验证明改进后的算法更适合运用在网络话题文本的快速聚类中。

引用

收藏

页码：48 / 51

页数：4

相关论文

共 5 条

[1] 一种挖掘负关联规则的有效方法 [J].

张雅芬 ;

王新 .

云南民族大学学报(自然科学版), 2011, 20 (04) :301-304

[2] 基于改进CURE聚类算法的无监督异常检测方法 [J].

周亚建 ;

徐晨 ;

李继国 .

通信学报, 2010, 31 (07) :18-23+32

[3] 基于K-means的文本聚类算法 [J].

毛嘉莉 .

计算机系统应用, 2009, 18 (10) :85-87

[4] 一种基于参考点和密度的快速聚类算法 [J].

马帅 ;

王腾蛟 ;

唐世渭 ;

杨冬青 ;

高军 .

软件学报, 2003, (06) :1089-1095

[5]

数据仓库和数据挖掘.[M].苏新宁[等]编著;.清华大学出版社.2006,