基于本体的中文智能答疑系统研究与实现

被引:0
作者
宗裕朋
机构
[1] 上海交通大学
关键词
本体; 答疑系统; 语义相似度; 问题模式;
D O I
暂无
年度学位
2007
学位类型
硕士
摘要
随着互联网的普及,网上信息越来越丰富。但是,传统搜索引擎有许多不足之处,它返回的是许多相关的网页,而不是准确的答案。另外,它仅以关键词索引,没有触及到语义信息,因此很难真正理解用户的意图。而在问答(Question Answering,QA)系统中,用户可以使用自然语言进行提问,系统通过对问题分析和理解,直接返回给用户答案。因此问答系统更好地满足了用户的要求。可以说,QA系统是新一代的搜索引擎。近年来,本体(Ontology)受到人工智能领域的普遍关注,并得到了广泛应用。在受限领域QA中采用本体知识库,可以更好的表示知识之间的内在关系,知识的组织更加合理,减少冗余存储,也有利于进行基于语义的答案抽取。 本文在分析当前智能答疑系统的前提下,将本体技术引入智能答疑系统(Intelligent Question Answering System,IQAS),构建出一个针对银行个人业务的领域本体,将该本体作为语义理解的信息基础,这样就将在一定程度上改善现有QA中语义理解不足的问题。 本文的系统设计模型主要有两个核心模块和两个核心资源,核心模块分别为语法分析模块(Linguistic Analysis,LA)和语义相似度服务模块(Semantic Similarity Service,SSS)。首先LA将用户的问题经过分词、词性标注和问题模式匹配后得到查询语法块(Query Linguistic Block,QLB),并找出对应的问题模式,然后SSS再基于领域本体库和《知网》(Hownet)将查询语法块(QLB)映射成与领域本体库相关的本体语义块(Ontology Semantic Block,OSB)。核心资源分别为领域本体库和问题模式库。本文首先根据银行业务领域答疑系统的特点,构建出一个小型领域本体库。然后通过对常见问题的语法分析,建立了问题模式库。 对于QLB无法直接映射到OSB的情况,IQAS将计算原问题与一组候选问题的语义相似度,如果计算出的语义相似度高于阈值,则认为这两个问题是相似的,从而将候选问题的答案作为原问题的“替补”答案。针对语义相似度的计算,本文提出了一种基于上下文的计算本体内概念间语义相似度的算法,从概念的父代和子代两个角度进行计算。该算法充分考虑了概念所处的具体环境,充分利用了本体中概念的语义信息。 通过本文的研究表明,基于本体的智能答疑系统可以有效地利用领域本体的信息资源,在一定程度上解决了目前答疑系统对语义理解不足的问题,并且能够具有较高的准确率。
引用
收藏
页数:61
共 22 条
[1]
基于本体的上层概念间相似度计算的研究 [J].
李仲生 ;
王家琴 .
科学技术与工程, 2007, (10) :2396-2398+2411
[2]
本体中概念相似度的计算 [J].
郑丽萍 ;
李光耀 ;
梁永全 ;
沙静 .
计算机工程与应用 , 2006, (30) :25-27+61
[3]
基于语义的查询重新定义及其应用 [J].
徐彩娜 ;
徐建良 .
微计算机信息, 2006, (24) :230-232
[4]
特定领域本体的构造方法 [J].
杨明华 ;
钱乐秋 ;
赵文耘 ;
彭鑫 .
计算机工程, 2006, (11) :80-82
[5]
基于领域知网的中文智能答疑系统 [J].
李志辉 ;
周竹荣 .
四川理工学院学报(自然科学版), 2005, (04) :86-89
[6]
语义相似计算驱动领域自动问答 [J].
李良富 ;
樊孝忠 ;
李宏乔 .
北京理工大学学报, 2005, (11)
[7]
问答式检索技术及评测研究综述 [J].
吴友政 ;
赵军 ;
段湘煜 ;
徐波 .
中文信息学报, 2005, (03) :1-13
[8]
基于Ontology的领域知识构建技术综述 [J].
何海芸 ;
袁春风 .
计算机应用研究, 2005, (03) :14-18
[9]
银行领域汉语自动问答系统BAQS的研究与实现 [J].
樊孝忠 ;
李宏乔 ;
李良富 ;
叶江 .
北京理工大学学报, 2004, (06) :528-532
[10]
智能答疑系统中语义网的研究与应用 [J].
赵赟 ;
刘亚军 .
微机发展, 2003, (11) :35-36+40