基于孤立点和初始质心选择的k均值算法的改进与应用

被引:6
作者
顾洪博
苏冬娜
机构
[1] 大庆石油学院计算机与信息技术学院
基金
黑龙江省自然科学基金;
关键词
k均值算法; 孤立点; 初始质心; 距离;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
针对聚类中广泛应用的经典k均值算法随机选择初始质心和易受孤立点影响的不足,给出了二次改进的k均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行改进,并做了改进前后的对比实验。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择质心的影响也有所降低。
引用
收藏
页码:45 / 49
页数:5
相关论文
共 6 条
[1]
一种改进的k-means聚类算法在入侵检测中的应用 [J].
尹珧人 ;
王德广 .
科学技术与工程, 2008, (16) :4701-4705
[2]
一种改进的K-means聚类算法 [J].
连凤娜 ;
吴锦林 ;
唐琦 .
电脑与信息技术, 2008, (01) :38-40
[3]
聚类分析中若干关键技术的研究 [D]. 
杨小兵 .
浙江大学,
2005
[4]
Advanced Data Clustering Methods of Mining Web Documents.[J].Samuel Sambasivam;Nick Theodosopoulos.Issues in Informing Science and Information Technology (IISIT).2006,
[5]
SLOM: a new measure for local spatial outliers [J].
Chawla, S ;
Sun, P .
KNOWLEDGE AND INFORMATION SYSTEMS, 2006, 9 (04) :412-429
[6]
模式识别.[M].[美]J.P.MarquesdeSa著;吴逸飞译;.清华大学出版社.2002,