关联首尾段落与首尾语句的多特征融合段落相似度计算

被引:8
作者
蒋宗礼
赵洁
机构
[1] 北京工业大学计算机学院
关键词
自动问答系统; SiteQ算法; 语义相似度; 多特征融合;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
首尾段落和首尾语句对语义有着较大的贡献,应该作为判别段落相似度的主要因素。本文将其以恰当权重融入SiteQ算法,提出关联首尾段落和首尾语句的多特征融合段落相似度计算算法Topic-SiteQ。该算法采用多特征融合的算法计算首尾语句的语义相似度,并以一定的权值体现它们对段落相似度的贡献,同时提高首尾段落的评分值,并根据这次评分值进行推荐排序。实验表明,采用该算法,相关段落排序的MRR值提高了0.032,F测度值平均提高了1.4%,说明该算法的改进是有效的。
引用
收藏
页码:10 / 14+20 +20
页数:6
相关论文
共 12 条
[1]
融合句义结构模型的微博话题摘要算法 [J].
林萌 ;
罗森林 ;
贾丛飞 ;
韩磊 ;
原玉娇 ;
潘丽敏 .
浙江大学学报(工学版), 2015, 49 (12) :2316-2325
[2]
面向特定领域自动问答系统的语句相似度计算 [J].
李健 ;
郑诚 ;
代宁 .
合肥师范学院学报, 2015, 33 (06) :38-41
[3]
汉语句义结构模型及其验证 [J].
罗森林 ;
韩磊 ;
潘丽敏 ;
冯扬 ;
刘盈盈 .
北京理工大学学报, 2013, 33 (02) :166-171
[4]
基于语义加权距离的语义相似度改进算法 [J].
徐桂臣 ;
叶枫 .
情报杂志, 2012, 31 (02) :119-123
[5]
问答系统研究综述 [J].
毛先领 ;
李晓明 .
计算机科学与探索, 2012, (03) :193-207
[6]
汉语句子相似度计算在FAQ中的应用 [J].
裴婧 ;
包宏 .
计算机工程, 2009, 35 (17) :46-48
[7]
Research of Anti-Plagiarism Monitoring System Model [J].
SHEN YangYUAN ZhongshangLIU LuDONG Hui School of Information ManagementWuhan UniversityWuhan HubeiChina Computer CenterWuhan UniversityWuhan HubeiChina School of Mathematics and StatisticsWuhan UniversityWuhan HubeiChina .
WuhanUniversityJournalofNaturalSciences, 2007, (05) :937-940
[8]
基于问句相似度的中文FAQ问答系统 [J].
叶正 ;
林鸿飞 ;
杨志豪 .
计算机工程与应用 , 2007, (09) :161-163+248
[9]
基于语义依存的汉语句子相似度计算 [J].
李彬 ;
刘挺 ;
秦兵 ;
李生 .
计算机应用研究, 2003, (12) :15-17
[10]
段落检索系统及其应用的研究 [D]. 
林巍 .
哈尔滨工业大学,
2010