聚类分析研究的挑战性问题

被引:6
作者
蒋盛益 [1 ]
王连喜 [2 ]
机构
[1] 广东外语外贸大学思科信息学院
[2] 不详
基金
广东省科技计划;
关键词
聚类分析; 无监督学习; 数据挖掘;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
聚类的目的是帮助人们发现和认识未知世界,为现实生活中的学习积累知识.聚类分析一直是广大学者重点关注的无监督学习内容,也是许多交叉学科用来探索数据中潜在规律的重要分析工具.通过简单梳理聚类分析的研究成果,在理解聚类分析基本框架的基础上对当前聚类算法在处理多样化数据类型的能力、处理超高维数据的能力、处理不均衡数据的能力、算法的可拓展能力、效果评价的指标选择问题等方面出现的挑战性问题进行了论述,并分析了未来有待重点解决的一些问题.这些工作将为后续聚类分析和数据挖掘的深入研究提供有价值的参考.
引用
收藏
页码:32 / 38
页数:7
相关论文
共 21 条
[1]   面向不平衡数据的特征加权聚类算法 [J].
蒋盛益 ;
苗邦 ;
王连喜 .
小型微型计算机系统, 2013, 34 (08) :1809-1812
[2]   一种基于类别区分互补性的特征选择 [J].
王连喜 ;
蒋盛益 .
小型微型计算机系统, 2013, 34 (08) :1798-1802
[3]   一种基于图论的加权聚类融合算法 [J].
谢岳山 ;
樊晓平 ;
廖志芳 ;
尹红练 ;
罗浩 .
计算机应用研究, 2013, 30 (04) :1015-1016+1034
[4]   适用于大规模文本处理的动态密度聚类算法 [J].
李霞 ;
蒋盛益 ;
张倩生 ;
朱靖 .
北京大学学报(自然科学版), 2013, 49 (01) :133-139
[5]   聚类分析研究中的若干问题 [J].
王骏 ;
王士同 ;
邓赵红 .
控制与决策, 2012, 27 (03) :321-328
[6]   基于最小包含球的大数据集快速谱聚类算法 [J].
钱鹏江 ;
王士同 ;
邓赵红 ;
徐华 .
电子学报, 2010, 38 (09) :2035-2041
[7]   基于混合距离学习的双指数模糊C均值算法 [J].
王骏 ;
王士同 .
软件学报, 2010, 21 (08) :1878-1888
[8]   Chameleon算法的改进 [J].
蒋盛益 ;
庞观松 ;
张黎莎 .
小型微型计算机系统, 2010, 31 (08) :1643-1646
[9]   高维数据聚类方法综述 [J].
贺玲 ;
蔡益朝 ;
杨征 .
计算机应用研究, 2010, 27 (01) :23-26+31
[10]   基于语义的高维数据聚类技术 [J].
刘铭 ;
王晓龙 ;
刘远超 .
电子学报, 2009, 37 (05) :925-929