基于社会网络分析的Blog社区发现

被引:0
作者
张浩
机构
[1] 上海交通大学
关键词
Blog; SNA; 社区发现; 主题挖掘;
D O I
暂无
年度学位
2008
学位类型
硕士
摘要
Blog网络是一个由复杂超文本所组成的巨大信息源,而且以很快的速度在不断的扩大。针对这样一个不断变化的信息源,如何利用和发现Blog网络中的有用信息变得越来越具有挑战性。在Blog发展的过程中产生和演化了大量的社区,这些社区是web中非常重要的组织结构,也包含了大量有用信息。Blog社区可以为用户提供有价值的、可靠的、及时的信息,并且代表着Blog网络中的社会活动。对Blog社区的深入研究有助于了解Blog的知识信息及其组织结构的发展状况。 本文对目前较为流行的一些Blog社区发现技术进行了分类和回顾,在此基础上提出了结合文本内容分析和社会网络分析的Blog社区发现方法。并且通过对比实验来和仅使用结构分析进行社区发现的方法进行比较,验证本文方法的可行性和有效性。本文着眼于提高社区挖掘的效率以及社区的质量,同时尝试进一步地挖掘社区中的信息。本文在使用社会网络分析理论,对链接结构特征进行分析的基础上,加入了Blog文章和评论内容分析的环节,使得找到的社区的凝聚性更强,稳定度更高。另外,将概率分布和统计的思想引入到社区的主题发现方法中,给出了利用主题词频率、文章时空分布以及评论反馈等统计结果和行为特征挖掘社区主题的方法。该方法既考虑了关键字的频率等文本内容,又充分利用了评论的内容与文章内容的联系以及人们发表文章的行为特征来挖掘社区中的有用信息。实验证明,本文给出的内容与结构分析相结合的社区发现方法在一定程度上提高了社区发现过程的执行效率和性能,并且所得到的Blog社区的质量较高。另外,本文给出的社区主题信息发掘方法,为进一步对Blog社区进行深入的研究和数据挖掘提供了基础和保证。
引用
收藏
页数:65
共 7 条
[1]
中文文献自动分类中的知识库构造及其仿人算法 [J].
刁倩 ;
张惠惠 ;
王永成 ;
何骥 .
情报学报, 2000, (03) :248-253
[2]
Mining the blogosphere..Hoyt C;.the HUB Magazine.2006, 01
[3]
Mining Blog Stories Using Community-based and Temporal Clustering..Qamra.A;Tseng.B;Chang.E.Y;.Proceedings of the 15th ACM International Conference on Information and Knowledge Management.2006,
[4]
Wiki社群的社会网络分析 [D]. 
周涛 .
华东师范大学,
2005
[5]
E-mail as spectroscopy: Automated discovery of community structure within organizations [J].
Tyler, JR ;
Wilkinson, DM ;
Huberman, BA .
INFORMATION SOCIETY, 2005, 21 (02) :133-141
[6]
Trawling the Web for emerging cyber-communities [J].
Kumar, Ravi ;
Raghavan, Prabhakar ;
Rajagopalan, Sridhar ;
Tomkins, Andrew .
Computer Networks, 1999, 31 (11) :1481-1493
[7]
Why we blog [J].
Nardi, BA ;
Schiano, DJ ;
Gumprecht, M ;
Swartz, L .
COMMUNICATIONS OF THE ACM, 2004, 47 (12) :41-46