从Web中提取中文本体非分类关系的方法

被引:17
作者
王岁花
赵爱玲
马巍巍
机构
[1] 河南师范大学计算机与信息技术学院
关键词
本体学习; 非分类关系; 领域本体; Web挖掘; 统计分析;
D O I
10.16208/j.issn1000-7024.2010.02.009
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为了有效地学习本体中的非分类关系以协助知识工程师构建领域本体,提出了一种在中文领域本体学习环境中自动获取概念之间非分类关系的方法,该方法以Web为数据源来提取候选关系并计算信息分布的统计特征,把动词作为发现非分类关系的中心点,把领域相关的动词作为种子来检索领域相关概念并用来标记相应的关系。该方法的学习结果是一个多级分类关系和非分类关系组成的语义体系。最后,通过对"癌"本体相应关系的提取及其性能分析,表明了该方法的学习结果和性能。
引用
收藏
页码:451 / 454
页数:4
相关论文
共 4 条
[1]
基于“角色”和“关系”的时间Ontology构建 [J].
王晓东 ;
张小红 ;
王靖 ;
胡伟强 .
河南师范大学学报(自然科学版), 2008, (01) :29-31+39
[2]
一种混合的文本信息检索模型研究 [J].
周竹荣 ;
黄果 ;
周亭 .
计算机工程与设计, 2007, (11) :2671-2673+2710
[3]
本体学习研究综述 [J].
杜小勇 ;
李曼 ;
王珊 .
软件学报, 2006, (09) :1837-1847
[4]
信息处理用现代汉语词类标记集规范.[J]..语言文字应用.2001, 03