基于六度分割理论和中心度识别微博网络的关键人物

被引:0
作者
李熙
机构
[1] 西华大学
关键词
六度分割; 中心度; 微博; 关键节点; 聚类; 关键指数;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
随着互联网信息和科技的演变,迎来了Web2.0时代,微博作为一种新兴的传播载体,迅速崛起,并受到人们的广泛关注。与传统媒体相比,其具有信息量大、信息传播速度快、即时性强等特点,这些特点使其成为了人们交流和传递信息的新平台,也给谣言散播提供了新渠道。面对每天产生过亿条的微博数据量,如何处理微博数据,如何及时有效的识别微博中的关键节点,这都是本文将要面对的挑战。本文分析了微博的基本功能,信息特点以及传播特点等等,在此基础上结合国内外现有的关于中心度和聚类分类的算法,着重于研究了识别微博网络中关键节点的技术,在时间与精确度的平衡处理下,提出了解决方法: (1)对微博的特点进行整理分析,结合中心度算法思想,给出了互动指数和影响指数,并将两种指数结合起来,最终提出了适用于微博的关键指数,用于识别微博网络中的关键人物。 (2)面对微博每天产生的海量数据,本文结合了六度分割理论的思想,采用SPLINE算法原理,对规模过大的节点集进行整理,移除与源节点最短路径大于5的节点,经过此步,得到了若干联系紧密的节点集。 (3)针对紧密联系的节点集,本文分析了层次聚类算法,采用基于模块度凝聚数据的CNM算法,对微博数据集进行聚类,将相似度较高的微博聚集在一起,划分数据集,形成若干更加重要的节点集。 (4)针对第三步所得重要节点集,提取出影响力节点的用户信息,对其使用关键节点的算法,有效识别出微博网络中的关键节点。 最后,验证提出的方法,本文使用了该方法进行算法编程,对NLPIR微博内容语料库进行微博网络关键节点的识别,针对实验结果,本文对其进行分析,表明本文的方法是可行的和实用的。
引用
收藏
页数:65
共 25 条
[1]
复杂网络关键节点识别技术研究 [D]. 
杨汀依 .
南京理工大学,
2011
[2]
基于SNA的网络核心及社团结构挖掘研究 [D]. 
马朝阳 .
大连交通大学,
2010
[3]
在线社会网络信任计算与挖掘分析中若干模型与算法研究 [D]. 
张宇 .
浙江大学,
2009
[4]
基于社区的关键节点挖掘算法 [J].
陆晓野 ;
陈玮 .
计算机系统应用, 2012, 21 (04) :250-253+197
[5]
利用重要度评价矩阵确定复杂网络关键节点 [J].
周漩 ;
张凤鸣 ;
李克武 ;
惠晓滨 ;
吴虎胜 .
物理学报, 2012, 61 (05) :1-7
[6]
基于社会网络中心性分析的微博信息传播研究——以Sina微博为例 [J].
平亮 ;
宗利永 .
图书情报知识, 2010, (06) :92-97
[7]
复杂网络中的社团结构算法综述 [J].
汪小帆 ;
刘亚冰 .
电子科技大学学报, 2009, (05) :537-543
[8]
基于网络权重的多社团网络结构划分算法 [J].
段晓东 ;
王存睿 ;
刘向东 ;
张庆灵 .
复杂系统与复杂性科学, 2009, 6 (03) :34-39
[9]
低维护开销的小世界P2P网络 [J].
王向辉 ;
张国印 ;
张闯 .
计算机科学, 2008, (11) :45-48+115
[10]
邮件社区划分和小世界网络 [J].
李军利 ;
赵红领 ;
范明 .
计算机应用, 2008, (S1) :146-149