基于问句相似度的中文FAQ问答系统

被引:14
作者
叶正
林鸿飞
杨志豪
机构
[1] 大连理工大学计算机科学与工程系
关键词
问句相似度; 语义相似度; 常见问题集; 向量空间模型;
D O I
暂无
中图分类号
TP319 [专用应用软件];
学科分类号
081202 ; 0835 ;
摘要
常见问题(FAQ)问答系统是一种在已有的“问题—答案”对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的问答式检索系统。其关键问题是用户提出问句与FAQ库中问句进行相似度计算,找出FAQ库中最相近的问句,并返回事先存储好的问题答案。通过对常见问句特点的研究,给出一种基于分解的向量空间模型和语义概念的问句相似度计算方法,其主要思想是对一个问句向量进行分解,提取其三个关键部分:问点、主题词和疑问词,表示成三个分向量,然后对每个分向量计算基于《HIT-IRLab同义词词林(扩展版)》的语义相似度,通过线性加权就可以得出两个问句的语义相似度。试验表明,与传统的基于向量空间模型的TF-DF问句相似度计算方法相比,可以提高问句匹配的精度。
引用
收藏
页码:161 / 163+248 +248
页数:4
相关论文
共 3 条
[1]   问答式检索技术及评测研究综述 [J].
吴友政 ;
赵军 ;
段湘煜 ;
徐波 .
中文信息学报, 2005, (03) :1-13
[2]   基于自然语言理解的受限领域自动应答系统 [J].
余正涛 ;
樊孝忠 ;
康海燕 .
计算机工程, 2004, (18) :35-37
[3]   基于常问问题集的中文问答系统研究 [J].
秦兵 ;
刘挺 ;
王洋 ;
郑实福 ;
李生 .
哈尔滨工业大学学报, 2003, (10) :1179-1182