基于Web挖掘的领域本体自动学习

被引:31
作者
方卫东
袁华
刘卫红
机构
[1] 华南理工大学计算机科学与工程学院
[2] 华南理工大学计算机科学与工程学院 广州510640
关键词
机器学习; Web挖掘; 自然语言处理; 本体; 分布语义; 主题签名; 上下文签名;
D O I
10.16511/j.cnki.qhdxxb.2005.s1.001
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为获取领域本体并量化概念关系的可信度,提出了一种基于W eb挖掘的学习模型。通过可扩展的模式集和分布语义模型获取本体主干,使用关联规则发现概念间的一般关系,对候选本体进行修剪和合并。模式可信度、概念语义距离与关联特征决定了概念间关系的可信度。通过“文本分析本体获取文本扩充”的迭代过程,优化模型参数和阈值。该模型解决了现有本体学习方法对词典或核心本体的依赖性、以及不能对关系进行可信度量化的问题。实验证明了所提出模型的有效性。
引用
收藏
页码:1729 / 1733
页数:5
相关论文
共 1 条
  • [1] Enriching very large ontologies using the WWW .2 Agirre E,Ansa O,Hovy E,et al. Proc 1st Workshop on Ontology Learning OL’ 2000 . 2000