计算机领域中文自动问答系统的研究

被引：0

作者：

张辉丽

机构：

[1] 天津大学

关键词：

常用问题库; 自然语言处理; 语义相似度; 自动分词;

D O I：

暂无

年度学位：

2006

学位类型：

硕士

导师：

孟昭鹏;

摘要：

随着互联网的迅速发展,网上信息越来越多。搜索引擎的发展在很大程度上方便了用户对信息的查询:用户只需输入关键词,搜索引擎就可快速地找到相关网页。但是日趋增多的网络信息,使得用户很难迅速从搜索引擎返回的大量信息中找到所需内容,因此,人们对网络信息的检索提出了更高的要求,希望能够通过搜索更快速、准确且详尽地获得自己需要的信息。自动问答系统正是为了满足人们这种愿望而发展起来的。自动问答系统综合运用了各种自然语言处理技术,涉及计算语言学、信息科学和人工智能等多门学科,是计算机应用研究的热点之一。它允许用户以自然语言输入问句,返回给用户一个简短而准确的答案,这样用户就可以通过自动问答系统方便、快速、准确地获得自己想要的信息。本文根据计算机领域的特点,设计并实现了一个面向计算机领域基于常用问题库的中文问答系统。本系统主要包括分词模块,问题理解、常用问题库三个部分。分词技术是自然语言理解的一个关键技术,分词结果的好坏直接影响着对用户问题的理解程度;问题理解是要掌握用户的提问意图,问题理解包括:问题的分类、关键词的提取和关键词扩展;常用问题库保存了用户常问的问题和相关的答案,对用户以自然语言输入的问题,系统能够自动地在常用问题库中寻找候选问题集,通过计算句子语义相似度,找到相似的问句,并将匹配问题的答案返回给用户。在本系统中,问题库中问题的大小,关系到整个系统的性能,因此,我们设计了良好的接口,可以方便地更新和维护FAQ库。最后本文还介绍了整个问答系统的实现和试验结果及其评价。

引用

页数：54

共 12 条

[1]

面向双语句对检索的汉语句子相似度计算.[A].车万翔;刘挺;秦兵;李生;.全国第七届计算语言学联合学术会议.2003,

[2]

基于层叠隐马模型的汉语词法分析 [J].