自动化构建的中文知识图谱系统

被引:18
作者
鄂世嘉
林培裕
向阳
机构
[1] 同济大学电子与信息工程学院
关键词
知识图谱; 网络爬虫; 三元组文件; 知识库; 图数据库;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为解决当前中文知识图谱构建的准确率低、耗时长且需要大量人工参与的问题,提出一种端到端基于中文百科数据的完整中文知识图谱自动化构建解决方案,并在此基础上开发实现了面向用户的中文知识图谱系统。在此方案中,通过自定义的网络爬虫,原始百科数据的词条属性以及相关的文本信息会不间断地被抓取到本地系统中,并以带扩展属性的三元组形式保存。后端系统则自动通过图数据库Cayley以及MongoDB数据库系统,对三元组文件数据进行导入,转换为庞大的知识图谱系统,从而在前端为用户提供丰富的基于知识图谱的应用服务。通过与其他知识图谱系统的比较,该方案在构建时间上明显减少,并且知识图谱中的实体及关系数量总规模高于YAGO、知网(HowNet)和中文概念词典等中文知识图谱系统至少50%。
引用
收藏
页码:992 / 996+1001 +1001
页数:6
相关论文
共 4 条
[1]  
Building Watson: An Overview of the DeepQA Project[J] . Ferrucci,David,Brown,Eric,Chu-Carroll,Jennifer,Fan,James,Gondek,David,Kalyanpur,Aditya A,Lally,Adam,Murdock,J William,Nyberg,Eric,Prager,John,Schlaefer,Nico,Welty,Chris.AI Magazine . 2010 (3)
[2]   DBpedia - A crystallization point for the Web of Data [J].
Bizer, Christian ;
Lehmann, Jens ;
Kobilarov, Georgi ;
Auer, Soeren ;
Becker, Christian ;
Cyganiak, Richard ;
Hellmann, Sebastian .
JOURNAL OF WEB SEMANTICS, 2009, 7 (03) :154-165
[3]  
YAGO: A Large Ontology from Wikipedia and WordNet[J] . Fabian M. Suchanek,Gjergji Kasneci,Gerhard Weikum.Web Semantics: Science, Services and Agents on the World Wide Web . 2008 (3)
[4]  
CYC[J] . Douglas B. Lenat.Communications of the ACM . 1995 (11)