基于样本空间分布密度的改进次胜者受罚竞争学习算法

被引:5
作者
谢娟英 [1 ,2 ]
郭文娟 [1 ]
谢维信 [2 ,3 ]
高新波 [2 ]
机构
[1] 陕西师范大学计算机科学学院
[2] 西安电子科技大学电子工程学院
[3] 深圳大学信息工程学院
基金
中央高校基本科研业务费专项资金资助;
关键词
聚类; 次胜者受罚竞争学习算法; 样本密度; 聚类数目; 聚类中心;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
针对传统次胜者受罚竞争学习(RPCL)算法忽略数据集几何结构对节点权值调整的影响,以及魏立梅等提出的新RPCL算法(魏立梅,谢维信.聚类分析中竞争学习的一种新算法.电子科学学刊,2000,22(1):13-18)引入密度来对节点的权值进行调整时,密度定义的主观性,提出基于样本空间分布密度的改进RPCL算法。该算法根据数据集样本自然分布定义样本密度,将此密度引入RPCL节点权值调整;使用UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集对算法进行实验测试,对算法确定数据集类簇数目的准确率、运行时间、聚类误差平方和、聚类结果的Rand指数、Jaccard系数以及Adjust Rand index参数进行分析比较。各项实验结果显示:所提算法优于原始RPCL算法和魏立梅算法,具有更好的聚类效果,对噪声数据有很强的抗干扰性能。所提算法不仅能根据样本的自然分布确定数据集的合理类簇数目,而且能确定合适的类簇中心,提高聚类的准确性,使聚类结果尽可能快地收敛到全局最优解。
引用
收藏
页码:638 / 642
页数:5
相关论文
共 15 条
[1]   聚类分析中竞争学习的一种新算法 [J].
魏立梅 ;
谢维信 .
电子科学学刊, 2000, (01) :13-18
[2]  
Information theoretic measuresfor clusterings comparison:Is a correction for chance necessary?. VINH N X,EPPS J,NAILEY J. Proceedings of the 26th International Conference on Ma-chine Learning . 2009
[3]  
Rival penalized competitive learning for clustering analysis, RBF net and curve detection. Xu Lei , Adam Krzyzak, Erkki Oja. IEEE Transactions on Neural Networks . 1993
[4]  
A simple and fast algorithm for K-medoids clustering. Park H.S,Jun C.H. Expert Systems With Applications . 2009
[5]   简单有效的确定聚类数目算法 [J].
张忠平 ;
王爱杰 ;
柴旭光 .
计算机工程与应用, 2009, 45 (15) :166-168
[6]   聚类有效性评价综述 [J].
杨燕 ;
靳蕃 ;
KAMEL Mohamed .
计算机应用研究, 2008, (06) :1630-1632+1638
[7]   聚类分析中类数估计方法的实验比较 [J].
王开军 ;
李健 ;
张军英 ;
过立新 .
计算机工程, 2008, (09) :198-199+202
[8]  
数据挖掘[M]. 机械工业出版社 , (加)JiaweiHan,(加)MichelineKamber著, 2001
[9]   用改进的RPCL算法提取聚类的最佳数目 [J].
李昕 ;
郑宇 ;
江芳泽 .
上海大学学报(自然科学版), 1999, (05) :409-413
[10]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61