一种改进的HITS算法在SNS类网站用户影响力评估系统中的应用

被引:0
作者
王菲
机构
[1] 吉林大学
关键词
SNS; HITS算法; Hub值修正; 用户影响力评估系统;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
互联网技术将人类发展带入了信息时代,这种变化也作用在了人们的社交网络之中。尤其近年来Web2.0产品的诞生,以Facebook等为代表的一批网络社交产品,将现实人际关系中的各种元素也都带到了网络当中,不同用户所拥有的影响力和网络资源直接反应了其中所蕴含的巨大的商业价值和传播潜力。如何有效的衡量不同用户所产生的实际影响力,进而挖掘其中的潜在价值就成为了一个急需解决的问题。 本文针对该问题提出了一种基于HITS(Hyperlink-Induced Topic Search)算法的SNS(Social Networking Services)类网站用户影响力评估方法。HITS算法是在Web数据挖掘中对网页权威度进行衡量的一种算法,我们将该算法引入到对SNS用户影响力的评估中来,并针对SNS类网站的自身特点提出了对HITS算法的几点改进,使之能够适应对用户影响力进行评价的需要。首先,引入了根据不同用户选取不同修正权值以对Hub值进行修正的改进方法,避免了关注数权重问题所带来的误差;其次,针对HITS算法未考虑内容权威度的缺陷,提出了引入内容权威度系数的改进方法,将内容对影响力的影响加入到算法当中;最后,根据SNS类网站的其他影响因素提出了网络封闭度的概念以及计算方案,进一步对所得的用户影响力指数进行修正。 本文在首先介绍了问题研究背景及意义以及本文的具体工作和文章结构;其次介绍了六度分隔理论以及SNS的基本概念、相关理论、发展现状以及目前主流的SNS服务形式和其各自特点。分析了SNS产品网络所具有的潜在数据挖掘价值,并以此为基础做了相应的改进工作;再次提出了对HITS算法的改进方案,并通过该算法实现对用户影响力的评估。在该部分,本文将用户在SNS类网站社交网络中的影响力分为三个部分考虑,即:用户结构权威度,用户内容权威度以及网络封闭度。用户结构权威度的量化是本文改进的重点,本文提出了根据用户不同类型给Hub值赋予不同的修正权重的方法,此外还给出了用户网络封闭度系数和内容权威度系数的概念,最终得到用户最终影响力的评价;继而根据以上改进的算法使用Java语言设计了一个简易的用户影响力评价系统。其中,该系统通过对新浪微博的用户群进行随机采样,收集了其用户的相关数据,并对其使用改进的HITS算法进行评估和排序;此外还采用新浪微博的用户的数据信息对该系统进行测试,并将所得到的用户影响力排序结果与对用户进行问卷调查产生的结果进行对比,验证了本文设计的对SNS类网站用户影响力进行评估的方法是有效的;最终对本文所进行的工作进行了一定的总结和展望。
引用
收藏
页数:55
共 13 条
[1]
Collaboration: How Leaders Avoid the Traps; Create Unity; and Reap Big Results.[J].Llorens; Juana.T + D.2009, 7
[2]
Knowledge transfer in intraorganizational networks: Effects of network position and absorptive capacity on business unit innovation and performance [J].
Tsai, WP .
ACADEMY OF MANAGEMENT JOURNAL, 2001, 44 (05) :996-1004
[3]
Authoritative sources in a hyperlinked environment [J].
Kleinberg, JM .
JOURNAL OF THE ACM, 1999, 46 (05) :604-632
[4]
社会网络与组织.[M].( ) 奇达夫; 蔡文彬; 著.中国人民大学出版社.2007,
[5]
传播学教程.[M].郭庆光著;.中国人民大学出版社.1999,
[6]
虚拟学习社区的社会网络分析 [J].
王陆 .
中国电化教育, 2009, (02) :5-11
[7]
浅析web2.0的应用与发展趋势 [J].
王伟 .
中国科技信息, 2008, (06) :118-119
[8]
基于PageRank和HITS的Web结构挖掘算法研究 [J].
刘栋 ;
刘希玉 ;
郝婷婷 .
山东科学, 2006, (04) :11-14
[9]
我国博客研究现状的实证分析 [J].
周海英 .
当代传播, 2006, (04) :55-57
[10]
同辈群体对学生社会化的积极影响 [J].
朱鸿彬 .
文教资料, 2005, (04)