面向图书馆关联数据的自动问答技术研究

被引:23
作者
欧石燕
唐振贵
机构
[1] 南京大学信息管理学院
关键词
自动问答; 关联数据; RDF数据集; SPARQL查询; 语义标注; 本体;
D O I
10.13530/j.cnki.jlis.150030
中图分类号
G254 [文献标引与编目];
学科分类号
摘要
早期针对语义网的自动问答主要是面向单一RDF数据集,随着网络上相互关联数据集的急速增加,迫切需要将自动问答扩展到多个RDF数据集,但同时在语义标注、答案整合方面也带来了更大的难度与挑战。本文提出了一种面向图书馆关联数据的自动问答新方法,通过将自然语言提问转换为结构化的SPARQL查询,从图书馆领域相互关联的五个RDF数据集中提取特定答案。该方法的创新点在于,将问句分为涉及一个数据集的简单句和涉及多个数据集的复杂句分别进行处理,又将简单句分为查询属性和查询实例两种类别分别制定SPARQL查询构建规则,将复杂句分解成若干个简单句进行处理,有利于SPARQL查询的构建和答案的整合。通过实验测评,100个问句的回答精确率达到91%,表明这是一种行之有效的问答方法,对于促进关联数据在图书馆中的应用具有重要意义。
引用
收藏
页码:44 / 60
页数:17
相关论文
共 11 条
[1]   本体与关联数据驱动的图书馆信息资源语义整合方法及其测评 [J].
欧石燕 ;
胡珊 ;
张帅 .
图书情报工作, 2014, 58 (02) :5-13
[3]   中文问句与RDF三元组映射方法研究 [J].
许德山 ;
张智雄 ;
赵妍 .
图书情报工作 , 2011, (06) :45-48+113
[4]  
PowerAqua: Supporting users in querying and exploring the Semantic Web[J] . Vanessa Lopez,Miriam Fern&aacute,ndez,Enrico Motta,Nico Stieler.Semantic Web . 2012 (3)
[5]  
Is Question Answering fit for the Semantic Web?: A survey[J] . Vanessa Lopez,Victoria Uren,Marta Sabou,Enrico Motta.Semantic Web . 2011 (2)
[6]  
Addressing ontology-based question answering with collections of user queries[J] . óscar Ferrández,Rubén Izquierdo,Sergio Ferrández,José Luis Vicedo.Information Processing and Management . 2008 (2)
[7]  
AquaLog: An ontology-driven question answering system for organizational semantic intranets[J] . Vanessa Lopez,Victoria Uren,Enrico Motta,Michele Pasin.Web Semantics: Science, Services and Agents on the World Wide Web . 2007 (2)
[8]  
Towards portable natural language interfaces to knowledge bases – The case of the ORAKEL system[J] . Data & Knowledge Engineering . 2007 (2)
[9]  
Natural language interfaces to databases – an introduction[J] . I. Androutsopoulos,G.D. Ritchie,P. Thanisch.Natural Language Engineering . 1995 (1)
[10]  
http://www.datatang.com/data/42306 .