基于语义相似度的Web信息可信分析

被引:6
作者
王腾
朱青
王珊
机构
[1] 数据工程与知识工程教育部重点实验室(中国人民大学)
[2] 中国人民大学信息学院
关键词
事实陈述; 语义相似度; 可信判定; 可信度排序;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
互联网上的虚假事实陈述严重影响人们有效地获取信息,如何判定事实陈述是否可信成为一个亟待解决的问题.文中提出了一种针对事实陈述的可信判定模型MFSV.该模型针对事实陈述的特点,从互联网上搜集与待判定事实陈述相关的文本信息,度量其与对应事实陈述的语义相似度;同时,该模型考虑了相关文本信息在可信度上的差别,从受欢迎程度和重要程度两个方面度量了相关文本信息来源的可信度,并获取了相关文本信息的可信度排序;根据语义相似度以及可信度排序,衡量了相关文本信息对对应事实陈述可信判定所做出的贡献,并以此为基础实现了待判定事实陈述的可信判定.一系列的实验验证了该模型的合理性及可信判定的准确性.
引用
收藏
页码:1668 / 1681
页数:14
相关论文
共 4 条
[1]   Credibility-inspired ranking for blog post retrieval [J].
Wouter Weerkamp ;
Maarten de Rijke .
Information Retrieval, 2012, 15 :243-277
[2]  
LIBSVM[J] . Chih-Chung Chang,Chih-Jen Lin.ACM Transactions on Intelligent Systems and Technology (TIST) . 2011 (3)
[3]  
Don''t Follow Me: Spam Detection in Twitter .2 Alex Hai Wang. Proceedings of the2010International Conference on Security and Cryptography (SECRYPT) . 2010
[4]  
Augmenting web pages and search results to support credibility assessment .2 Schwarz J,Morris R M. Proceedings of the CHI2011Conference on Human Factors in Computing Systems . 2011