基于微博的突发事件检测和信息传播建模

被引:0
作者
刘丰
机构
[1] 哈尔滨工业大学
关键词
微博客; 突发词检测; 突发事件; 信息传播模型;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
微博客自问世以来,以其实时性和便捷性受到用户的钟爱,成为网络应用中炙手可热的新宠,微博上聚集的大量用户及相对自由的言论信息又使得微博成为把握社会脉搏的有力工具。所以本文的研究基于微博平台,致力于发掘微博平台中的突发事件并在此基础上进行微博网络中信息传播方式的建模。本文的工作主要分为以下几个方面: 首先,获取基于微博研究的数据集。进行“人民微博”上的信息抽取工作,应用针对该微博平台页面信息结构设计的爬虫,对该平台的整体信息和热点信息分别进行抽取并存储,整体信息一次性抽取,内容包括微博信息,用户信息和用户关系信息等;热点信息实时抽取,内容包括热点微博信息,热点用户信息和热点关键词信息。 而后,检测微博中的突发事件。微博的简短性使得其对事件的描述中,事件的主题词以很高比例出现,并呈现与事件一致的受关注程度,所以本文突发事件的检测部分以事件主题词的检测为线索。首先选择微博语料适用的特征值和数据组织方法;而后构建时间窗内各词的特征轨迹,结合特征轨迹的时域和频域特征判定词的突发性,由于突发事件的主题词包括其人物、地点信息,这些词通常是未登录词但对事件的表达意义重大,所以在该过程进行新词发现;最后根据各突发词的在微博中的共现情况进行聚类,实现突发词与突发事件的对应,并利用已有微博信息提供突发事件的详细描述。 最后,构建微博用户网络的信息传播模型。在突发事件信息的基础上,结合微博中信息传播的途径和特点,构建了微博中信息传播的五元组模型,分析了模型各元素的影响因素和元素的表征方法,并在此基础上实现了微博网络中信息传播过程的模拟。这部分着重对微博网络中节点的信息传播能力进行分析,舆情监督过程通过控制信息传播能力强的节点可以有效控制信息的传播。 本文的突发事件检测工作能够较真实、及时的映射社会上的重大事件,对民众了解时事,有关部门提前预警都有一定的帮助;信息传播建模工作可以预测信息传播的过程及关键节点,为信息传播监督和控制工作提供参考。
引用
收藏
页数:66
共 21 条
[1]
计算机自然语言处理.[M].王晓龙;关毅等编著;.清华大学出版社.2005,
[2]
基于时间序列聚类和ARMA模型的检索量预测 [J].
孙承杰 ;
刘丰 ;
林磊 ;
刘秉权 .
华南理工大学学报(自然科学版), 2011, 39 (04) :21-25
[3]
面向网络论坛的突发话题发现 [J].
陈友 ;
程学旗 ;
杨森 .
中文信息学报, 2010, (03) :29-36
[4]
一个新的信息传播模型及其模拟 [J].
孙庆川 ;
山石 ;
兰田田 .
图书情报工作, 2010, (06) :52-56+79
[5]
基于小世界网络的电子商务信息传递优化研究 [J].
程霞 .
图书情报工作, 2010, 54 (04) :140-143+148
[6]
社会化网络的信息扩散研究 [J].
王萍 .
情报杂志 , 2009, (10) :39-42
[7]
改进贪婪算法在博客突发事件检测中的研究 [J].
王杰 ;
刚轶金 ;
李凤光 ;
吴伟巍 .
计算机工程与应用, 2008, 44 (34) :87-88+99
[8]
Blog研究 [J].
杨宇航 ;
赵铁军 ;
于浩 ;
郑德权 .
软件学报, 2008, (04) :912-924
[9]
一种基于新词发现的Web文本表示方法 [J].
吴春颖 ;
王士同 ;
蔡崇超 .
计算机应用, 2008, (03) :764-767
[10]
网络热点信息发现研究 [J].
曾依灵 ;
许洪波 .
通信学报, 2007, (12) :141-146