大数据处理中混合型聚类算法的研究与实现

被引:31
作者
陈晓
赵晶玲
机构
[1] 北京邮电大学计算机学院
关键词
大数据; 数据挖掘; 聚类算法; 划分算法; 层次算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着信息技术的飞速发展,大数据时代已经来临,对数据的分析与处理成为目前研究的重点,数据挖掘技术更是成为了重中之重,被广泛研究与应用。文章在研究聚类算法的基础上,具体研究了基于划分的聚类算法以及自下而上的基于层次的聚类算法,通过将两种算法优化后再进行融合提出了一种混合型聚类算法。该算法能够避免划分算法中随机选取初始聚类中心的问题,使用基于划分的聚类算法对数据集进行初始化,然后对处理后的数据集进行自下而上的基于层次的聚类分析,最终能够得到理想的分析结果。该算法能够综合两类传统聚类算法的优点,摒除不足之处,做到优势互补,在不损失准确性的基础上提高了算法的运行效率。最后通过R语言工具进行实验仿真,证实了文中提出的混合型聚类算法的有效性以及可行性。
引用
收藏
页码:45 / 49
页数:5
相关论文
共 7 条
  • [1] 数字指纹生成方案及关键算法研究
    刘文龙
    李晖
    金东勋
    [J]. 信息网络安全, 2015, (02) : 66 - 70
  • [2] 一种可信虚拟平台构建方法的研究和改进
    李海威
    范博
    李文锋
    [J]. 信息网络安全, 2015, (01) : 1 - 5
  • [3] 融合多特征的中文关键词提取方法
    潘丽敏
    吴军华
    林萌
    罗森林
    [J]. 信息网络安全, 2014, (08) : 40 - 44
  • [4] 快速最小生成树Sollin求解算法
    张毅
    顾逸圣
    王伟
    [J]. 信息网络安全, 2014, (07) : 87 - 91
  • [5] 基于R语言的数据挖掘在水环境管理中的应用
    肖凯
    魏菲
    彭昌水
    [J]. 长江科学院院报, 2012, 29 (09) : 91 - 94
  • [6] 基于初始聚类中心优化的K-均值算法
    王赛芳
    戴芳
    王万斌
    张晓宇
    [J]. 计算机工程与科学, 2010, 32 (10) : 105 - 107+116
  • [7] 一种改进的k-means聚类算法(英文)
    夏士雄
    李文超
    周勇
    张磊
    牛强
    [J]. Journal of Southeast University(English Edition), 2007, (03) : 435 - 438