问答系统为人们提供了自然语言的人机交互方式,相对于传统的关键词方式搜索引擎来说,其具有显著的优势。在受限领域,基于问题库的问答系统在对问题答案的定位上,有更准确,快捷和高效的特点,在日常生活的各个领域,有着非常重要的应用前景,是当前研究的热点问题。本文围绕台球领域自动问答系统实现过程中的领域知识库构建、问题库的的收集和组织、相似问句的查找及答案提取等关键核心技术进行了一系列的研究和探讨,实质性工作和取得的主要成就如下:
1、对现有的自动分词方法进行分析,并根据限定领域的特点,选择适当的分词算法并进行适当的设计。
2、对词语间的语义相关度的计算方法和中文的句法进行了比较详细的研究,对本系统的进一步发展打下了比较坚实的基础。
3、对中文语句的相似度计算进行了深入的研究,对比了现有比较成熟的问句相似度算法的优缺点,并针对限定领域的特点,提出了一种针对台球领域的问句相似度计算方法,并将它应用到面向台球领域的自动问答系统中。
4、设计并实现了面向台球领域的自动问答系统。构建了领域知识库和领域问题库,采用本文所提出的基于关键词的倒排索引的问句相似度计算方法,进行问句相似度的计算,实现系统的自动问答。面向台球领域的自动问答系统的测试结果表明了此方法可行,有比较好的实用效果。