问答社区中回答质量的评价方法研究

被引:32
作者
孔维泽
刘奕群
张敏
马少平
机构
[1] 智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)清华大学计算机系
基金
高等学校博士学科点专项科研基金;
关键词
问答社区; 质量评价;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
问答社区已经成为网络信息获取的一种重要渠道,但其信息质量差异较大。该文研究了问答社区中回答质量的评价方法。具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据。针对百度知道的特点,文本提出的基于时序的特征、基于问题粒度的特征和基于百度知道社区用户的特征,从更多的角度对回答质量进行评价。利用分类学习的框架,该文综合了新设计的三方面特征和经典的文本特征、链接特征,对高质量和非高质量的回答进行分类。基于大规模问答语料的实验表明,在文本特征与链接特征的基础上,基于时序与基于问题粒度的特征能够有效地提高回答质量的评估效果。另外也发现,根据该文的回答质量评价框架做出的质量评分能够有效地预测最佳答案。
引用
收藏
页码:3 / 8
页数:6
相关论文
共 2 条
  • [1] LIBSVM: A Library for Support Vector Machines .2 Chih-Chung Chang,Chih-Jen Lin. http://www.csie.ntu.edu.tw/~cjlin/libsvm . 2001
  • [2] Internet-scale collection of human-reviewed data .2 Q.Su,D.Pavlov,J.Chow,W.Baker. Proceedings of the 16th international conference on World Wide Web . 2007