问答社区中的问题与答案推荐机制研究与实现

被引:0
作者
曲明成
机构
[1] 浙江大学
关键词
问答社区; 问题推荐; 答案推荐; 主题建模; 链接分析;
D O I
暂无
年度学位
2010
学位类型
硕士
摘要
如今,用户交互式问答社区已成为网上信息获取和知识分享的重要媒介。诸如Yahoo! Answers、百度知道等问答社区网站每天发布有数以万计的问题。然而,随着问答社区数据量的增长,用户需要花更多的时间找到自己感兴趣的问题。由此,问题的提问者需要等待较长的时间才能得到该问题的答案。同时,问题候选答案数目的迅速增长、答案质量的层次不齐,也加重了提问用户选择最佳答案的负担。 本文针对问答社区中的问题推荐和答案推荐机制进行了深入的研究,旨在帮助提问用户和回答用户获取信息,从而增进问答社区中的知识分享行为。问题推荐将待解决问题推荐给对该问题感兴趣的用户,使该问题能尽快得到解答。本文认为,用户将根据自己的兴趣主题选择相应的问题进行回答,故问题的主题与回答用户的兴趣需有较高的相关度。基于此,本文提出了一种基于主题建模思想的问题推荐方法,充分利用问答社区中丰富的用户个性化信息,以概率潜在语义分析模型来表达问答社区中的用户兴趣分布,并以此计算问题推荐列表。答案推荐针对问题的候选答案作自动排序,从而使提问用户能更方便地选择最佳答案。本文认为,提问用户将根据答案质量及其与问题的相关程度选择最佳答案。由此本文提出了一种基于问题与答案间的相似性及用户权威度的答案推荐方法。该方法通过用户问答关系构建用户链接图,以此使用PageRank算法估计用户权威度。在计算相似度时,综合考虑了问题和答案内容的相似度以及提问用户与回答用户的相似度。 实验结果表明,本文提出的基于主题建模的问题推荐方法可有效挖掘用户兴趣,从而推荐待解决问题。答案推荐的实验结果则证明综合考虑问题和答案内容的相似度以及提问用户与回答用户相似度的有效性,及通过用户权威度衡量答案质量的可行性。
引用
收藏
页数:82
共 11 条
[1]
Link analysis ranking: algorithms; theory; and experiments.[J].Allan Borodin;Gareth O. Roberts;Jeffrey S. Rosenthal;Panayiotis Tsaparas.ACM Transactions on Internet Technology (TOIT).2005, 1
[2]
Latent semantic indexing: A probabilistic analysis [J].
Papadimitriou, CH ;
Raghavan, P ;
Tamaki, H ;
Vempala, S .
JOURNAL OF COMPUTER AND SYSTEM SCIENCES, 2000, 61 (02) :217-235
[3]
Text classification from labeled and unlabeled documents using EM [J].
Nigam, K ;
McCallum, AK ;
Thrun, S ;
Mitchell, T .
MACHINE LEARNING, 2000, 39 (2-3) :103-134
[4]
Authoritative sources in a hyperlinked environment [J].
Kleinberg, JM .
JOURNAL OF THE ACM, 1999, 46 (05) :604-632
[5]
The anatomy of a large-scale hypertextual Web search engine.[J].Sergey Brin;Lawrence Page.Computer Networks and ISDN Systems.1998, 1
[6]
An introduction to latent semantic analysis [J].
Landauer, TK ;
Foltz, PW ;
Laham, D .
DISCOURSE PROCESSES, 1998, 25 (2-3) :259-284
[7]
Social networks, learning, and flexibility: Sourcing scientific knowledge in new biotechnology firms [J].
Liebeskind, JP ;
Oliver, AL ;
Zucker, L ;
Brewer, M .
ORGANIZATION SCIENCE, 1996, 7 (04) :428-443
[8]
Maximum Likelihood from Incomplete Data via the EM Algorithm.[J].A. P. Dempster;N. M. Laird;D. B. Rubin.Journal of the Royal Statistical Society. Series.1977, 1
[9]
Web data mining..Liu B;.Springer.2007,
[10]
Finding High-Quality Content in Social Media..Agichtein E;Castillo C;Donato D;.First ACM International Conference on Web Search and Web Data Mining (WSDM ‘08).2008,