基于本体的电子产品实体关系抽取研究

被引:0
作者
朱姗
机构
[1] 西安电子科技大学
关键词
关系抽取; 本体; SVM; GATE;
D O I
暂无
年度学位
2011
学位类型
硕士
导师
摘要
随着因特网和信息产业的快速发展,越来越多的信息出现在人们面前,许多新兴的信息处理技术也应运而生。作为其中基础研究项目的关系抽取技术自然成为研究的热点之一。关系抽取在信息检索、专家系统、垂直搜索等领域有着广泛应用,对其研究具有深远意义。 本文首先分析比较了关系抽取的各种技术,并着重研究了机器学习方法中的支持向量机(SVM)算法。研究发现传统的关系抽取技术,例如SVM等,对简单关系抽取的效果很好,但因其不具有语义识别能力,所以对复杂关系的抽取存在一定困难。针对这一问题本文在人工智能领域的本体方向找到了解决方案。在对本体进行了系统研究,对本体建模元素、构建方法深入分析后,本文结合电子产品特征提出了一种适用于关系抽取系统的领域本体建设方法,并选取电子产品中的笔记本电脑领域作为代表进行具体实现。在此基础上为解决上述问题,本文提出一种基于融合模式的关系抽取方法。该方法利用机器学习领域中的支持向量机(SVM)算法进行单一关系抽取,再使用本体对单一关系排错后,将其融合为关系网,最后利用本体的推理功能对关系进行再挖掘,使其形成更为复杂的关系网,用于由近距离依赖结构的关系,推理出远距离依赖结构的关系。这种模式继承了SVM和本体的优点,解决了复杂关系抽取问题。 本文最后针对提出模型进行了具体实现。由于选取的本体领域的特殊性,本文自组织语料库,对实现系统进行验证。经分析调整后,取得了很好的准确率和召回率。
引用
收藏
页数:78
共 24 条
[1]
一种电子产品领域命名实体识别方法研究 [D]. 
邹涛 .
西安电子科技大学,
2010
[2]
本体论在网络信息检索中的应用研究 [D]. 
李学庆 .
辽宁师范大学,
2008
[3]
基于动态粒度思想的实体关系识别方法研究 [D]. 
顾雪峰 .
山西大学,
2006
[4]
基于GATE的中文信息抽取系统的开发和实现 [D]. 
李飒 .
中国科学院研究生院(文献情报中心),
2006
[5]
中文信息抽取原理及应用.[M].程显毅; 朱倩; 王进; 编著.科学出版社.2010,
[6]
支持向量机理论及工程应用实例.[M].白鹏等; 编著.西安电子科技大学出版社.2008,
[7]
数据挖掘导论.[M].(美)Pang-NingTan;(美)MichaelSteinbach;(美)VipinKumar著;范明;范宏建等译;.人民邮电出版社.2006,
[8]
支持向量机导论.[M].(英)NelloCristianini;(英)JohnShawe-Taylor著;李国正等译;.电子工业出版社.2004,
[9]
中文实体关系抽取研究 [J].
牟晋娟 ;
包宏 .
计算机工程与设计, 2009, 30 (15) :3587-3590
[10]
关系抽取方法研究 [J].
杨建明 .
电子技术, 2009, 46 (04) :36-41