中文领域本体构建方法研究

被引:0
作者
王雪
机构
[1] 华中科技大学
关键词
本体构建; 关系抽取; 层次聚类; 模板匹配方法; 关联规则;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
随着领域本体的作用受到越来越多的领域的认可,本体技术在知识管理和语义网中扮演着愈加重要的角色,但是领域本体真正被运用到实际应用领域还有几个问题需要克服。其中一个关键问题就是概念、关系识别,尤其在大型复杂的应用领域,概念及关系的识别变得更加耗时耗力,而且由于不同的人对概念的理解不同使得对概念的定义引起一定的争议。为了减少本体构建的耗费,各界提出了领域本体自动、半自动构建,主要是利用机器学习技术、统计方法或是自然语言处理技术从相关的数据源中自动、半自动的进行概念、关系抽取,从而完成领域本体的自动、半自动构建。 通过参考相关叙词表和领域文档,提出一种运用相关技术进行概念、概念间关系抽取来完成航空领域本体的半自动构建机制。实现自动化本体构建的关键技术包括概念的抽取、概念间等级关系及非等级关系的抽取方法在文中都有涉及。概念的获取,主要参考相关的叙词表获得核心概念集合。关于概念间等级关系的获取,主要基于现有领域相关叙词表的分类体系作为基础,参考叙词表并利用改进的层次聚类算法提取概念间的等级关系,对原有等级分类体系进行丰富扩充。概念间非等级关系的获取,采用关联规则和模板相结合的方法提取非等级关系,利用支持度、置信度等度量,对经过分词、文档向量提取的文档获取相关概念,利用汉语句法特点和制定好的规则模板,获取概念关系。这样不单减少统计方法缺乏语义逻辑的不足,也降低了概念间语义关系过分依赖语言处理的弊端。 最后通过Jena的API对提取的概念关系进行本体结构化等各项操作生成OWL本体,并使用斯坦福大学的Protégé工具进行OWL本体的可视化管理。
引用
收藏
页数:62
共 20 条
[1]
基于Web的通用本体学习研究 [D]. 
刘柏嵩 .
浙江大学,
2007
[2]
Learning domain ontologies from document warehouses and dedicated web sites [J].
Navigli, R ;
Velardi, P .
COMPUTATIONAL LINGUISTICS, 2004, 30 (02) :151-179
[3]
Learning to match ontologies on the Semantic Web [J].
Doan, A ;
Madhavan, J ;
Dhamankar, R ;
Domingos, P ;
Halevy, A .
VLDB JOURNAL, 2003, 12 (04) :303-319
[4]
Toward principles for the design of ontologies used for knowledge sharing?.[J].Thomas R. Gruber.International Journal of Human - Computer Studies.1995, 5
[5]
Knowledge Acquisition Via Incremental Conceptual Clustering.[J].Douglas H. Fisher.Machine Learning.1987, 2
[6]
Java中的正则表达式与模式匹配研究 [J].
武兴睿 .
科技传播, 2011, (15) :180+186
[7]
基于统计的句法分析方法研究 [J].
王继曾 ;
任浩征 ;
罗恒 ;
刘宽 .
计算机工程与设计, 2006, (12) :2207-2210
[8]
关键词抽取方法的研究 [J].
郑家恒 ;
卢娇丽 .
计算机工程, 2005, (18) :194-196
[9]
中文本体的自动获取与评估算法分析 [J].
董慧 ;
余传明 ;
不详 .
情报理论与实践 , 2005, (04) :415-418
[10]
基于多策略的专业领域术语抽取器的设计 [J].
杜波 ;
田怀凤 ;
王立 ;
陆汝占 .
计算机工程, 2005, (14) :159-160