随着互联网的迅速发展,网上信息越来越多。搜索引擎的发展在很大程度上方便了用户对信息的查询:用户只需输入关键词,搜索引擎就可快速地找到相关网页。但是日趋增多的网络信息,使得用户很难迅速从搜索引擎返回的大量信息中找到所需内容,因此,人们对网络信息的检索提出了更高的要求,希望能够通过搜索更快速、准确且详尽地获得自己需要的信息。自动问答系统正是为了满足人们这种愿望而发展起来的。
自动问答系统综合运用了各种自然语言处理技术,涉及计算语言学、信息科学和人工智能等多门学科,是计算机应用研究的热点之一。它允许用户以自然语言输入问句,返回给用户一个简短而准确的答案,这样用户就可以通过自动问答系统方便、快速、准确地获得自己想要的信息。
本文根据计算机领域的特点,设计并实现了一个面向计算机领域基于常用问题库的中文问答系统。本系统主要包括分词模块,问题理解、常用问题库三个部分。分词技术是自然语言理解的一个关键技术,分词结果的好坏直接影响着对用户问题的理解程度;问题理解是要掌握用户的提问意图,问题理解包括:问题的分类、关键词的提取和关键词扩展;常用问题库保存了用户常问的问题和相关的答案,对用户以自然语言输入的问题,系统能够自动地在常用问题库中寻找候选问题集,通过计算句子语义相似度,找到相似的问句,并将匹配问题的答案返回给用户。在本系统中,问题库中问题的大小,关系到整个系统的性能,因此,我们设计了良好的接口,可以方便地更新和维护FAQ库。
最后本文还介绍了整个问答系统的实现和试验结果及其评价。