基于局部和全局信息的改进聚类算法

被引:3
作者
许小龙 [1 ]
王士同 [1 ]
梅向东 [2 ]
机构
[1] 江南大学数字媒体学院
[2] 赞奇科技发展有限公司
关键词
K-means算法; 谱聚类; 离散度矩阵; 特征分解; UCI数据集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
传统K-means算法在随机选取初始聚类中心时,容易导致结果不稳定,谱聚类算法直接在相似矩阵上进行分割,对结果的准确性影响较大,而局部和全局正则化聚类算法未考虑数据空间分布对结果的影响。为此,引入离散度矩阵对局部和全局正则化聚类算法进行改进。改进算法考虑数据的分布信息,通过在局部信息目标函数中引入离散度矩阵,结合全局信息的目标函数,将目标函数最小化问题转换为分解稀疏矩阵特征的问题。在UCI机器学习数据集和公共数据挖掘数据集上的实验结果表明,与K-means及标准谱聚类算法相比,该算法的预测精度更高。
引用
收藏
页码:165 / 171
页数:7
相关论文
共 5 条
[1]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[2]  
Enhanced soft subspace clustering integrating within-cluster and between-cluster information[J] . Zhaohong Deng,Kup-Sze Choi,Fu-Lai Chung,Shitong Wang.Pattern Recognition . 2009 (3)
[3]   Semi-Supervised Learning on Riemannian Manifolds [J].
Mikhail Belkin ;
Partha Niyogi .
Machine Learning, 2004, 56 :209-239
[4]   Laplacian eigenmaps for dimensionality reduction and data representation [J].
Belkin, M ;
Niyogi, P .
NEURAL COMPUTATION, 2003, 15 (06) :1373-1396
[5]   LOCAL LEARNING ALGORITHMS [J].
BOTTOU, L ;
VAPNIK, V .
NEURAL COMPUTATION, 1992, 4 (06) :888-900