计算机领域中文自动问答系统的研究

被引:0
作者
张辉丽
机构
[1] 天津大学
关键词
常用问题库; 自然语言处理; 语义相似度; 自动分词;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
随着互联网的迅速发展,网上信息越来越多。搜索引擎的发展在很大程度上方便了用户对信息的查询:用户只需输入关键词,搜索引擎就可快速地找到相关网页。但是日趋增多的网络信息,使得用户很难迅速从搜索引擎返回的大量信息中找到所需内容,因此,人们对网络信息的检索提出了更高的要求,希望能够通过搜索更快速、准确且详尽地获得自己需要的信息。自动问答系统正是为了满足人们这种愿望而发展起来的。 自动问答系统综合运用了各种自然语言处理技术,涉及计算语言学、信息科学和人工智能等多门学科,是计算机应用研究的热点之一。它允许用户以自然语言输入问句,返回给用户一个简短而准确的答案,这样用户就可以通过自动问答系统方便、快速、准确地获得自己想要的信息。 本文根据计算机领域的特点,设计并实现了一个面向计算机领域基于常用问题库的中文问答系统。本系统主要包括分词模块,问题理解、常用问题库三个部分。分词技术是自然语言理解的一个关键技术,分词结果的好坏直接影响着对用户问题的理解程度;问题理解是要掌握用户的提问意图,问题理解包括:问题的分类、关键词的提取和关键词扩展;常用问题库保存了用户常问的问题和相关的答案,对用户以自然语言输入的问题,系统能够自动地在常用问题库中寻找候选问题集,通过计算句子语义相似度,找到相似的问句,并将匹配问题的答案返回给用户。在本系统中,问题库中问题的大小,关系到整个系统的性能,因此,我们设计了良好的接口,可以方便地更新和维护FAQ库。 最后本文还介绍了整个问答系统的实现和试验结果及其评价。
引用
收藏
页数:54
共 12 条
[1]
面向双语句对检索的汉语句子相似度计算.[A].车万翔;刘挺;秦兵;李生;.全国第七届计算语言学联合学术会议.2003,
[2]
基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429
[3]
基于语义依存的汉语句子相似度计算 [J].
李彬 ;
刘挺 ;
秦兵 ;
李生 .
计算机应用研究, 2003, (12) :15-17
[4]
基于常问问题集的中文问答系统研究 [J].
秦兵 ;
刘挺 ;
王洋 ;
郑实福 ;
李生 .
哈尔滨工业大学学报, 2003, (10) :1179-1182
[5]
自动问答综述 [J].
郑实福 ;
刘挺 ;
秦兵 ;
李生 .
中文信息学报, 2002, (06) :46-52
[6]
全二分最大匹配快速分词算法 [J].
李振星 ;
徐泽平 ;
唐卫清 ;
唐荣锡 .
计算机工程与应用, 2002, (11) :106-109
[7]
汉语知识词典及词汇内部语义描述研究 [J].
董振东 .
语言文字应用, 2000, (01) :29-31
[8]
并行分词方法的研究 [J].
吴胜远 .
计算机研究与发展, 1997, (07)
[9]
中文未登录名词短语的识别方法研究 [D]. 
王源媛 .
重庆大学,
2004
[10]
中文自动分词系统的研究 [D]. 
朱珣 .
华中师范大学,
2004