基于MapReduce并行架构的大数据社会网络社团挖掘方法

被引:9
作者
邓波 [1 ]
张玉超 [1 ]
金松昌 [2 ]
林旺群 [1 ]
机构
[1] 北京系统工程研究所
[2] 国防科学技术大学计算机学院
关键词
大数据社会网络; MapReduce; 社团; 信息压缩; 随机游走;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
随着社会网络数据规模的急剧上升,传统的社会网络社团挖掘方法无法有效应对大数据社会网络场景.基于MapReduce并行计算框架,提出了一种针对大数据社会网络的社团挖掘方法.借助于信息压缩理论模型,该方法首先对给定的社会网络进行二进制信息编码,然后按照信息描述长度理论并行计算社会网络中给定编码方案的信息描述长度,从而将社会网络社团并行挖掘问题转化为并行搜索社会网络中最小信息描述长度所对应的编码方案问题.通过采用并行随机迭代方式搜索大数据社会网络编码状态空间中的最佳编码方案,提出的大数据社会网络社团挖据方法具有自动发现最佳社团数量、算法复杂度低、计算精度高和高可扩展性等特点.与同类方法进行实验对比,从算法的计算精度和计算性能两方面验证了所提方法的有效性.
引用
收藏
页码:187 / 195
页数:9
相关论文
共 11 条
[1]   网络大数据:现状与展望 [J].
王元卓 ;
靳小龙 ;
程学旗 .
计算机学报, 2013, 36 (06) :1125-1138
[2]   大数据管理:概念、技术与挑战 [J].
孟小峰 ;
慈祥 .
计算机研究与发展, 2013, 50 (01) :146-169
[3]   大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考 [J].
李国杰 ;
程学旗 .
中国科学院院刊, 2012, 27 (06) :647-657
[4]   架构大数据:挑战、现状与展望 [J].
王珊 ;
王会举 ;
覃雄派 ;
周烜 .
计算机学报, 2011, 34 (10) :1741-1752
[5]   大数据分析——RDBMS与MapReduce的竞争与共生 [J].
覃雄派 ;
王会举 ;
杜小勇 ;
王珊 .
软件学报, 2012, 23 (01) :32-45
[6]   复杂网络聚类方法 [J].
杨博 ;
刘大有 ;
金弟 ;
马海宾 .
软件学报, 2009, 20 (01) :54-66
[7]   A general framework for relation graph clustering [J].
Long, Bo ;
Zhang, Zhongfei ;
Yu, Philip S. .
KNOWLEDGE AND INFORMATION SYSTEMS, 2010, 24 (03) :393-413
[8]   The map equation [J].
Rosvall, M. ;
Axelsson, D. ;
Bergstrom, C. T. .
EUROPEAN PHYSICAL JOURNAL-SPECIAL TOPICS, 2009, 178 (01) :13-23
[9]  
Clustering, community partition and disjoint spanning trees[J] . Cun-Quan Zhang,Yongbin Ou.ACM Transactions on Algorithms (TALG) . 2008 (3)
[10]   Detecting community structure in networks [J].
Newman, MEJ .
EUROPEAN PHYSICAL JOURNAL B, 2004, 38 (02) :321-330