句子相似度计算理论及应用研究

被引:0
作者
薛慧芳
机构
[1] 西北大学
关键词
知网; 句子相似度计算; FAQ自动问答系统;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
在自然语言处理领域,汉语句子的相似度计算是一项基础而又重要的工作,它直接决定着相关领域的研究发展状况。比如在FAQ自动问答系统、信息检索、复述、基于实例的机器翻译等领域,句子相似度计算都是一个非常关键的问题,长期以来一直是人们研究的一个热点和难点。 为了研究汉语句子相似度计算,本文分别对汉语中的义原、词语、句子三个层次的相似度计算进行了研究。并且针对目前句子相似度计算方法的不足,提出了一种改进的计算方法,最后以FAQ自动问答系统为例,给出句子相似度计算的应用实例。 本文完成的主要工作包括: 1)义原相似度计算和词语相似度计算研究。由于义原相似度计算是词语相似度计算的基础,而词语相似度计算又是句子相似度计算的基础,所以,本文基于《知网》,对义原相似度计算、词语相似度计算分别做了详细研究。 2)提出了改进的句子相似度计算方法。在上述工作的前提下,本文对句子相似度计算进行了研究,并且对其进行了改进,提出了综合多种特征来计算句子相似度的方法。即综合句子的词形相似度、语义相似度、句法结构相似度三方面特征来计算句子相似度。并且,针对词形相似度计算以及语义相似度计算方法也进行了改进,力求最终的句子相似度计算结果更为准确。 3)以FAQ自动问答系统为例介绍句子相似度的应用情况。为了说明句子相似度计算的实际应用情况,本文对FAQ自动问答系统、以及句子相似度计算方法在其中的应用进行了介绍。
引用
收藏
页数:48
共 18 条
[1]
句子相似度计算模型的改进 [J].
杜刚 ;
王超 .
电脑知识与技术, 2008, 4 (36) :2817-2818+2826
[2]
句子相似度计算新方法及在问答系统中的应用 [J].
周法国 ;
杨炳儒 .
计算机工程与应用, 2008, (01) :165-167+178
[3]
汉语句子相似度计算方法比对之研究 [J].
赵巾帼 ;
徐德智 ;
罗庆云 .
福建电脑, 2007, (10) :51+68
[4]
基于HowNet语义相似度的FAQ研究 [J].
贾可亮 ;
樊孝忠 ;
张禹 .
计算机应用, 2007, (09) :2256-2257
[5]
一种基于遗传算法的权重的确定方法 [J].
刘志明 ;
吴明芬 ;
许勇 .
五邑大学学报(自然科学版), 2006, (03) :45-48
[6]
基于词类串的汉语句子结构相似度计算方法 [J].
王荣波 ;
池哲儒 .
中文信息学报, 2005, (01) :21-29
[7]
基于网络的中文问答系统及信息抽取算法研究 [J].
崔桓 ;
蔡东风 ;
苗雪雷 .
中文信息学报, 2004, (03) :24-31
[8]
语句相似度计算在主观题自动批改技术中的初步应用 [J].
高思丹 ;
袁春风 .
计算机工程与应用, 2004, (14) :132-135
[9]
基于互联网的中文问答系统 [J].
张永奎 ;
赵辄谦 ;
白丽君 ;
陈鑫卿 .
计算机工程, 2003, (15) :84-85+197
[10]
句子相似模型和最相似句子查找算法 [J].
吕学强 ;
任飞亮 ;
黄志丹 ;
姚天顺 ;
不详 .
东北大学学报 , 2003, (06) :531-534