近年来,微博已然成为一种重要的交互媒体,已经在逐渐改变传统的信息传播方式。如今更是成为了信息交流、发布和展示的一个网络服务性平台,可以在任何条件下由任何人使用。它作为一种即时的信息交流工作,早已经融入并改变了我们的生活。我们享受微博给我们生活带来极大便利的同时,可能会忽略了微博同时也可能成为传播虚假信息的载体。由于网络的发达,微博信息传播的极其迅速,这也为虚假信息的传播提供了一个条件。所以,识别微博的虚假话题并阻止其继续传播非常重要。
本文以社会网络关系为基础,从微博数据的组织结构、用户情感计算以及信任网络构建三个方面分别进行数据的分析研究最终得到一个可以识别微博虚假话题的模型。
首先,结合微博的结构特征、传播特征和演化特征,着重研究微博数据的组织方法。分别以人物为主线、以会话为主线来组织数据,最后得出微博用户之间的社会交互关系和社会连接关系。
其次,以微博话题作为基础,对微博内容和评论内容进行分析处理,结合情感词汇本题库,得到相对应的用户情感倾向,并得出潜在的有影响力的人物的极性。
再次,设计人物基本信誉度算法并获取人物的基本信誉值;设计人物直接交互关系算法获取人物之间的直接交互信任值,设计人物间接交互关系算法获取人物之间的间接交互信任值,最后,综合考虑这些因素设计信任网络的构建算法,为信任推理提供可靠的证据理论。
最后,设计朴素贝叶斯的信任推理算法实现对有影响力人物的发现以及识别评论者及其评论文本对被评论文本的影响,最后构建多层朴素贝叶斯模型实现对微博中虚假话题的检测。