基于结构相似度的大规模社交网络聚类算法

被引:29
作者
陈季梦 [1 ]
陈佳俊 [2 ]
刘杰 [1 ]
黄亚楼 [2 ]
王嫄 [1 ]
冯霞 [3 ]
机构
[1] 南开大学计算机与控制工程学院
[2] 南开大学软件学院
[3] 中国民航大学民航信息技术科研基地
基金
天津市自然科学基金;
关键词
社交网络; 有向网络聚类; 并行算法; Map Reduce;
D O I
暂无
中图分类号
TP301.6 [算法理论]; TP393.02 [];
学科分类号
080201 [机械制造及其自动化];
摘要
针对社交网络的有向交互性和大规模特性,该文提出一种基于结构相似度的有向网络聚类算法(Dir SCAN),以及相应的分布式并行算法(PDir SCAN)。考虑社交网络中节点间的有向交互性,将行为结构相似的节点聚集起来,并进行节点功能分析。针对社交网络规模巨大的特点,提出Map Reduce框架下的分布式并行聚类算法,在确保聚类结果一致的前提下,提高处理性能。大量真实数据集上的实验结果表明,Dir SCAN比无向网络聚类算法(SCAN)在F1上可提高2.34%的性能,并行算法PDir SCAN比Dir SCAN运行速度提升1.67倍,能够有效处理大规模的有向网络聚类问题。
引用
收藏
页码:449 / 454
页数:6
相关论文
共 3 条
[1]
Detecting the overlapping and hierarchical community structure in complex networks.[J].Andrea Lancichinetti;Santo Fortunato;János Kertész.New Journal of Physics.2009, 3
[2]
MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1
[3]
基于随机游走和增量相关节点的动态网络社团挖掘算法 [J].
肖杰斌 ;
张绍武 .
电子与信息学报, 2013, 35 (04) :977-981