基于数据起源的网络社交媒体信息可信度评估

被引:0
作者
张婷
机构
[1] 山西大学
关键词
可信度评估; 数据起源; PROV; 社交媒体;
D O I
10.27284/d.cnki.gsxiu.2019.000195
年度学位
2019
学位类型
硕士
导师
摘要
随着社交媒体的快速发展以及用户对微信、微博、知乎等社交平台的普遍使用,使得信息得以高速的交换和传播,信息呈现出爆炸式增长。网络社交活动中,用户即是信息的创建者又是信息的接收者,由于用户的匿名身份,使得大量的虚假信息得以在网络上疯传,从而降低了社交网络信息质量,信息的真实性也遭到了质疑,而高质量的信息内容能够为用户乃至互联网提供具有高价值的知识资源,因此如何从海量的信息中识别可信度高的信息成为一个亟待解决的问题。数据起源可以帮助追踪数据的来源,有效的记录数据处理过程中产生的动态信息并评估数据质量以及可信度,使用户清晰地了解到信息的来龙去脉,并根据自己的需求决定是否采用该信息内容。本文以知乎信息为研究起点,采用数据起源方法从信息传播路径、用户以及媒介这三个角度对知乎信息以及其上下游信息的可信度进行评估,研究主要从以下几个方面展开:(1)本文首先对数据起源和信息可信度的基础理论进行了分析。对数据起源的模型,不同的社交媒体信息特点、各个平台的用户行为特征以及信息可信度的机制等内容进行了梳理和总结。(2)构建社交网络信息可信度评估框架,确定用户可信度评估指标和媒介权威性大小,根据选取的知乎信息跨平台传播的场景,选择合适的话题,构建数据起源的PROV模型,对传播过程所涉及的实体、活动、代理、时间等采用RDF对其进行描述,并对其进行存储及有效性验证。(3)抓取网络场景中知乎信息传播路径上所涉及的社交媒体平台、用户个人完整信息以及在网络活动中的行为数据,对指标实际值进行预处理,从用户信息的完整度、个人认证和成就、活跃度、交际广度四个指标计算出用户的可信度值。对社交媒体平台的权威性进行评估。(4)通过计算传播路径上用户节点的可信度和平台权威性数值,从而得出所选取的网络社交媒体信息的可信度值,并对计算出的结果进行分析。(5)对本文的研究工作进行总结,对未来研究进行了展望。本文研究成果为信息可信度评估以及改善平台信息质量的方法上提供一条新思路。
引用
收藏
页数:68
共 53 条
[21]
The influence of structural and message features on Web site credibility.[J].TraciHong.J. Am. Soc. Inf. Sci..2005, 1
[22]
Chucking the checklist: A contextual approach to teaching undergraduates web-site evaluation [J].
Meola, M .
PORTAL-LIBRARIES AND THE ACADEMY, 2004, 4 (03) :331-344
[24]
数据起源在多版本文档检索中的应用 [J].
陈悦 ;
董红斌 ;
谭成予 ;
梁意文 .
上海大学学报(自然科学版), 2018, 24 (05) :730-744
[25]
网络传播信息内容的可信度研究进展 [J].
吴连伟 ;
饶元 ;
樊笑冰 ;
杨浩 .
中文信息学报, 2018, (02) :1-11+21
[26]
面向知识发现的数据连续性保障机制研究 [J].
郝世博 ;
邓雨亭 .
情报资料工作, 2017, (06) :49-55
[27]
微博信息可信度评估的数据起源方法 [J].
张子良 ;
董红斌 ;
谭成予 ;
梁意文 .
计算机应用研究, 2018, 35 (11) :3330-3334
[28]
基于医疗健康大数据的安全起源模型与可信性验证算法 [J].
王凤英 ;
张方 ;
张伟 .
山东理工大学学报(自然科学版), 2017, 31 (06) :6-11
[29]
社交媒体信息可信度评估研究综述 [J].
王一华 .
现代情报, 2016, 36 (12) :164-169
[30]
数据起源研究进展 [J].
徐扬 ;
王申罡 .
情报理论与实践 , 2016, (07) :136-140+135