一种面向社区型问句检索的主题翻译模型

被引:7
作者
张伟男
张宇
刘挺
机构
[1] 哈尔滨工业大学计算机科学与技术学院社会计算与信息检索研究中心
基金
国家自然科学基金重点项目;
关键词
社区型问答; 问句检索; 主题模型; 翻译模型; LDA(Latent Dirichlet Allocation); 社会计算; 社交网络;
D O I
暂无
中图分类号
TP391.2 [翻译机];
学科分类号
摘要
基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型.
引用
收藏
页码:313 / 321
页数:9
相关论文
共 4 条
  • [1] Approaches to Exploring Category Information for Question Retrieval in Community Question-Answer Archives
    Cao, Xin
    Cong, Gao
    Cui, Bin
    Jensen, Christian S.
    Yuan, Quan
    [J]. ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2012, 30 (02)
  • [2] The WEKA data mining software[J] . Mark Hall,Eibe Frank,Geoffrey Holmes,Bernhard Pfahringer,Peter Reutemann,Ian H. Witten.ACM SIGKDD Explorations Newsletter . 2009 (1)
  • [3] Bilingual LSA-based adaptation for statistical machine translation[J] . Yik-Cheung Tam,Ian Lane,Tanja Schultz.Machine Translation . 2008 (4)
  • [4] A topicsimilarity model for hierarchical phrase-based translation .2 Xiao,X,Xiong,D,Zhang,M,Liu,Q,Lin,S. Proceedings of the50th Annual Meeting of the Association for Computational Linguistics: LongPapers . 2012