特定领域实体属性关系抽取方法研究

被引:0
作者
尚琪
机构
[1] 昆明理工大学
关键词
实体关系抽取; Distant Supervision; 卷积神经网络; 实体属性; 多特征;
D O I
暂无
年度学位
2017
学位类型
硕士
导师
摘要
实体关系抽取是信息抽取的重要部分,它能够识别出实体之间的语义关系,作为语义网的基础,实体关系抽取被广泛应用在自动问答系统,信息检索,机器翻译等领域。关系抽取还是构建知识图谱的重要基础,随着万维网转变成语义网,知识图谱的构建变得尤为重要。领域实体间的属性关系是构建知识图谱的重要组成部分之一。对特定领域而言,领域实体属性关系对表达实体之间的语义关系有着重要的意义。本文主要针对中文领域的实体属性关系抽取,作了以下工作:(1)基于Distant Supervision(距离监督)的领域实体属性关系抽取方法,基于领域知识库和相关文本集来获取实体属性关系。关系类型为:景点-实例-属性值。针对旅游领域中的“景点”这个类型,抽取出与“景点”这个类型相关属性,如门票价格、面积等等。距离监督就是通过将知识库映射到文本集中实现关系抽取的过程,即如果一个实体对出现在知识库中,则将文本集中包含这两个实体的句子全部抽取出来,从这些句子中提取特征,训练分类器。本文首先构建一个小型的中文旅游领域知识库,在知识库中预先定义好属性关系和关系实例,并用这个知识库对应地从百度百科或维基百科网页上爬取得到的文本集。本文使用多种特征以提高分类器的性能,提高分类的性能。(2)基于卷积神经网络的领域实体属性关系抽取方法研究。本文提出基于卷积神经网络对领域实体属性关系进行抽取,其中属性关系类型为实例-属性、属性-属性值、实例-属性值。利用卷积神经网络的自动学习表征领域实体属性关系的句法特征、层级特征以及实体所在句子的文本特征,形成特征向量,加入到卷积神经网络中,训练实体属性关系分类模型。实验结果表明,所提出的方法能有效提高实体属性关系抽取性能。
引用
收藏
页数:70
共 20 条
[1]
Construction of semantic bootstrapping models for relation extraction.[J].Chunyun Zhang;Weiran Xu;Zhanyu Ma;Sheng Gao;Qun Li;Jun Guo.Knowledge-Based Systems.2015,
[2]
Application of Deep Belief Networks for Natural Language Understanding [J].
Sarikaya, Ruhi ;
Hinton, Geoffrey E. ;
Deoras, Anoop .
IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2014, 22 (04) :778-784
[3]
Multiple kernel learning in protein–protein interaction extraction from biomedical literature.[J].Zhihao Yang;Nan Tang;Xiao Zhang;Hongfei Lin;Yanpeng Li;Zhiwei Yang.Artificial Intelligence In Medicine.2010, 3
[4]
A fast learning algorithm for deep belief nets [J].
Hinton, Geoffrey E. ;
Osindero, Simon ;
Teh, Yee-Whye .
NEURAL COMPUTATION, 2006, 18 (07) :1527-1554
[5]
Artificial neural networks (the multilayer perceptron)—a review of applications in the atmospheric sciences.[J].M.W Gardner;S.R Dorling.Atmospheric Environment.1998, 14
[6]
开放领域的中文实体无监督关系抽取 [D]. 
孙勇亮 .
华东师范大学,
2014
[7]
基于Bootstrapping的领域知识自动抽取技术的研究 [D]. 
康琪 .
山东大学,
2012
[8]
无监督的中文实体关系抽取研究 [D]. 
王晶 .
华东师范大学,
2012
[9]
基于特征向量的实体间语义关系抽取研究 [D]. 
毛小丽 .
重庆大学,
2011
[10]
基于种子自扩展的命名实体关系抽取方法的研究 [D]. 
徐超 .
华中师范大学,
2006