维基百科中争议性文章的发现方法研究

被引:1
作者
常天舒
林鸿飞
机构
[1] 大连理工大学信息检索实验室
基金
高等学校博士学科点专项科研基金; 教育部留学回国人员科研启动基金;
关键词
维基百科; 争议度排序; 社会网络分析;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
维基百科收录的文章和参与编辑的用户日益增多,其中不乏一些用户对同一条目持有不同的见解。该文旨在发现维基百科中的争议性文章,通过维基百科提供的历史信息,在传统的挖掘方法基础上,对具有特殊属性的用户角色进行总结并融合到排序模型中,探讨这类用户对争议性文章挖掘的作用。在16 745篇文章组成的数据集上进行了实验,除传统的PRF和NDCG评价外,该文给出了更直观的排序结果,与其他基准模型相比有较大的提升。
引用
收藏
页码:76 / 83
页数:8
相关论文
共 11 条
[1]  
What is Wikipedia[OL]. Wikipedia. http://wikipe-dia.jaylee.cn .
[2]  
Bipartite networks of Wikipedia’’s articles and authors:A meso-level approach. Jesus R,Schwartz M,Lehmann S. Proceedings of the5th International Symposium on Wikis and Open Collaboration . 2009
[3]  
Network analysis of collaboration structure inwikipedia. Brandes U,Kenis P,Lerner J, et al. WWW ’’09 . 2009
[4]  
He says, She says:Conflict and Coordination in Wikipedia. A. Kittur,,B. Suh,B. A. Pendleton et al. proceedings of the 25th SIGCHI conference on Human Factors in computing systems . 2007
[5]  
Anatomy of a flame: conflict and community building on the internet. Franco, V.,Piirto, R.,Hu, H.-Y.,Lewenstein, B.V.,Underwood, R.,Vidal, N.K. IEEE Technology and Society Magazine . 1995
[6]  
Visual analysis of controversy in user-generated encyclopedias. Brandes, Ulrik,Lerner, Jürgen. Information Visualization . 2008
[7]  
Identifying featured articles in Wikipedia:writing style matters. N Lipka,B Stein. Proceedings of International World Wide Web Conferences (WWW’’10) . 2010
[8]  
Size matters:word count as a measure of quality on Wikipedia. J E Blumenstock. Proceedings of International World Wide Web Conferences (WWW’’08) . 2008
[9]  
A content-driven reputation system for the Wikipedia. Adler,B T,L de Alfaro. WWW ‘07 . 2007
[10]  
Internet encyclopedias go head to head. J. Giles. Nature . 2005