本体概念及概念间关系抽取方法研究

被引:0
作者
汤青
机构
[1] 北京信息科技大学
关键词
本体概念; 本体关系抽取; 分类关系; 非分类关系; 关系标签;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
随着互联网上数据的爆炸式增长,如何将互联网上内容丰富、形式多样的海量数据转化为知识并将其有效地组织和管理成为信息技术的新课题。本体作为其他应用学科发展的基础,它的相关技术如本体概念、本体关系抽取等研究便具有重要的理论意义和实际应用价值。 本体概念是本体的基本元素,本体概念的质量对后续本体研究起着至关重要的影响。本体关系主要分为分类关系和非分类关系,分类关系是本体的基本骨架,非分类关系是本体的主要枝干。故本文针对本体概念抽取、本体分类关系抽取以及本体非分类关系抽取三方面开展研究,主要研究工作如下: (1)尽可能多的抽取多字词本体术语,以保证本体构建的质量。分析本体术语的生成方式、内在结构特征以及外在分布特征,提出了一种基于部件扩展的本体术语抽取方法。首先,利用部件的领域聚合性和词性特征,采用领域词频比较的方法抽取部件;然后,考虑术语长度、术语词性构成以及术语内部结合度等因素,设计合理的扩展规则对部件扩展以形成候选术语;最后,利用上下文关联信息、语境信息从候选术语集中筛选出本体术语。该方法在IT领域实验数据集上测试,实验结果准确率为0.835,召回率为0.87,准确率相比baseline方法要高出2.5个百分点。实验结果表明该方法是有效的,对本体学习、本体构建具有积极意义。 (2)上下位关系抽取技术可以实现本体概念扩充,它作为本体研究的基础技术,在一定程度上降低了创建和维护本体的成本,对本体技术的发展具有重要意义。以匹配“是一个”模式的句子作为研究对象,提出了一种基于句法分析与规则匹配相结合的上下位关系抽取方法。针对结构复杂的句子中下位概念抽取困难的问题,借助句法分析的结果,给出了下位概念中心词的获取方法;结合中心词位置信息和概念边界信息,设计了合适的下位概念抽取规则。实验结果准确率为0.836,召回率为0.84,证实了方法的有效性。 (3)非分类关系抽取研究作为本体学习的主要任务,推动着以本体为基础的相关应用技术的发展。为了提高领域关系抽取的准确率,提出了一种新颖的非监督领域专有关系抽取方法。该方法利用概念间分布上的粘合度和语义相似度信息,抽取具有相关关系的概念对;根据领域关系标签与领域概念在分布上的共振现象,利用动词前后缀信息和语义特征,提出了基于共振原理和聚类思想的领域动词抽取方法;以领域动词作为关系标签,采用关联规则挖掘方法为概念对分配关系标签;关系标签分配时,引入了同义词词林,以降低数据稀疏问题带来的不利影响。实验结果准确率为52.5%,在一定程度上,证明了方法的有效性。
引用
收藏
页数:62
共 31 条
[1]
面向中文文本本体学习概念抽取的研究 [D]. 
关键 .
吉林大学,
2010
[2]
本体学习中概念和关系抽取方法研究 [D]. 
杨芬 .
重庆大学,
2010
[3]
Ontology构建中概念间关系的研究 [D]. 
贾黎莉 .
中国农业科学院,
2007
[4]
领域本体的构建方法与应用研究.[M].李景; 孟宪学; 苏晓鹭; 著.中国农业科学技术出版社.2009,
[5]
Refining non-taxonomic relation labels with external structured data to support ontology learning [J].
Weichselbraun, Albert ;
Wohlgenannt, Gerhard ;
Scharl, Arno .
DATA & KNOWLEDGE ENGINEERING, 2010, 69 (08) :763-778
[6]
A delimiter‐based general approach for Chinese term extraction.[J].YuhangYang;QinLu;TiejunZhao.J. Am. Soc. Inf. Sci..2009, 1
[7]
The Ontolingua Server: A tool for collaborative ontology construction [J].
Farquhar, A ;
Fikes, R ;
Rice, J .
INTERNATIONAL JOURNAL OF HUMAN-COMPUTER STUDIES, 1997, 46 (06) :707-727
[8]
WordNet..Fellbaum C;.Springer.2010,
[9]
基于种子扩充的专业术语识别方法研究 [J].
王卫民 ;
贺冬春 ;
符建辉 .
计算机应用研究, 2012, 29 (11) :4105-4107
[10]
基于NNV关联规则的非分类关系提取方法及其应用研究 [J].
王红 ;
高斯婷 ;
潘振杰 ;
肖志伟 .
计算机应用研究, 2012, 29 (10) :3665-3668