财经问答系统问句解析子系统

被引:0
作者
史佳慧
机构
[1] 哈尔滨工业大学
关键词
问答系统; 财经领域; 本体关系; 问句解析;
D O I
暂无
年度学位
2012
学位类型
硕士
摘要
近年来,伴随着关键字搜索产品的后继乏力,语义理解相关产品却不断推陈出新,甚至出现了某些使人惊艳的产品。这都使得用户对信息搜索产品有了更高的要求:更智能、更快捷、更专业、更准确。而这一切,都是建立在对用户的输入有着更明确、更深入理解的前提下的。所以,在信息搜索产品中,特别是在问答系统中,对用户输入的解析是十分重要的。 顾名思义,财经问答系统为关注于财经领域的、封闭领域的问答系统。而本体库作为一个结构化的知识存储库,在封闭领域内(本文中为财经领域),对固定的语义关系描述有着天然的优势。故,本文主要基于本体关系,对财经领域内的自然语言问句语义解析进行了研究。本子系统主要包括四个部分:配置文件信息的解析、前期准备、语义树绑定、查询指令翻译。配置文件信息的解析部分主要对系统中众多的问句解析所需的配置文件进行读取,并将其转换为后续前期准备、语义树绑定与指令翻译部分所需的配置信息。前期准备部分是将问句进行前期处理的部分。是将问句进行可解析化后,分词并提取词条信息,最后生成语义节点的过程。语义树绑定部分是将语义节点根据本体关系进行关联。经过这部分,用户输入的问句已经成为结构化的中间解析结果。查询指令翻译部分是将上个部分生成的解析结果翻译为针对不同数据源的查询指令,和对查询结果的操作指令。并将生成的所有指令交予财经问答系统的Coordinator子系统进行查询和后续操作。现在使用中的数据源有两个:本体库、财经机构版数据服务。其对应的查询指令分别为SParQL和特定格式的XML。 截止到成文时,回归测试集中约8500个财经相关问句。针对回归测试集,解析准确率可达到93.55%,解析的速度平均一个问句在26毫秒左右。外部上线后,针对全部用户的随机问句,解析准确率可达到80%以上。
引用
收藏
页数:102
共 26 条
[1]
语义网基础教程.[M].(美) 安东尼奥 (Antonio;G.) ; (美) 海尔梅莱恩 (Harmelen;F.) ; 著.机械工业出版社.2008,
[2]
本体理论在文献检索系统中的应用研究.[M].李景著;.北京图书馆出版社.2005,
[3]
自然语言处理综论.[M].(美)DanielJurafsky;(美)JamesH.Martin著;冯志伟;孙乐译;.电子工业出版社.2005,
[4]
世纪之交的知识工程与知识科学.[M].陈汝钤主编;.清华大学出版社.2001,
[5]
现代汉语疑问句研究.[M].邵敬敏著;.华东师范大学出版社.1996,
[6]
基于HNC和描述逻辑的问句语义块分析 [J].
程显毅 ;
朱倩 ;
韩飞 .
广西师范大学学报(自然科学版), 2010, 28 (03) :131-134
[7]
语义网初探 [J].
李瑛 .
电脑开发与应用, 2010, 23 (03) :54-56
[8]
基于语义网规则语言的推理机制框架设计 [J].
陈布伟 ;
李冠宇 ;
张俊 ;
李佳燕 .
计算机工程与设计, 2010, 31 (04) :847-849+853
[9]
语义网的技术及其应用 [J].
孔为民 ;
涂中群 .
农业图书情报学刊, 2010, 22 (01) :54-56
[10]
图书信息领域中文问句浅层语义分析技术 [J].
郭涛 ;
郭浩 .
太原理工大学学报, 2009, 40 (04) :356-360