基于非结构中文数据源的本体学习

被引:0
作者
陈绍琛
机构
[1] 哈尔滨工程大学
关键词
本体; 中文本体学习; 语境模式; 概念获取; 领域概念间关系获取;
D O I
暂无
年度学位
2009
学位类型
硕士
导师
摘要
近年来,本体在信息检索和语义网等领域中发挥着越来越重要的作用。但是手工构造本体却是一项繁琐的工作。如何从大量中文文献中自动或半自动地获得本体,成为本体在中文环境下推广、应用的一个重要课题。 本体学习是指利用人工智能、自然语言处理等众多学科技术来实现本体的半自动构建。本体学习任务主要包括本体所包含的各个元素的自动或半自动获取,例如概念获取以及概念间关系的获取等。 本文在借鉴国内外现有本体学习理论、方法的基础上,结合中文自然语言的研究成果,针对特定领域的中文文本文档,对领域本体概念获取和概念间关系的获取展开了研究。在概念的获取方面,本文提出以一种多策略中文本体概念获取方法,综合统计、中文分词等技术半自动地提取领域概念,并以领域一致度、领域相关度等统计方法筛选提取的概念。在提取概念关系方面,本文重点研究以语境模式的方法提取概念间关系。本文对语境模式进行了较深入的研究,提出单句模式、多句模式和段模式三种不同的语境模式。另外,对语境模式的半自动生成作初步的研究,并提出了若干算法。最后,本文实现了一个中文本体学习系统用以试验本文提出的方法的可行性。
引用
收藏
页数:71
共 16 条
[1]
基于Web的本体学习研究 [D]. 
傅魁 .
武汉理工大学,
2007
[2]
本体学习研究综述 [J].
杜小勇 ;
李曼 ;
王珊 .
软件学报, 2006, (09) :1837-1847
[3]
种子概念方法及其在基于文本的本体学习中的应用 [J].
梁健 ;
吴丹 .
图书情报工作, 2006, (09) :18-21
[4]
基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94
[5]
基于Web挖掘的领域本体自动学习 [J].
方卫东 ;
袁华 ;
刘卫红 .
清华大学学报(自然科学版), 2005, (自然科学版) :1729-1733
[6]
基于多策略的专业领域术语抽取器的设计 [J].
杜波 ;
田怀凤 ;
王立 ;
陆汝占 .
计算机工程, 2005, (14) :159-160
[7]
基于互信息的中文术语抽取系统 [J].
张锋 ;
许云 ;
侯艳 ;
樊孝忠 .
计算机应用研究, 2005, (05) :72-73+77
[8]
基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429
[9]
本体论研究综述 [J].
李善平 ;
尹奇韡 ;
胡玉杰 ;
郭鸣 ;
付相君 .
计算机研究与发展, 2004, (07) :1041-1052
[10]
基于N-最短路径方法的中文词语粗分模型 [J].
张华平 ;
刘群 .
中文信息学报, 2002, (05) :1-7