基于Web信息使用改进的无监督关系抽取方法构建交通本体

被引:10
作者
马超
机构
[1] 复旦大学计算机科学技术学院
关键词
关系抽取; 本体; 无监督学习; 样例概念关系对权重;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
领域本体是对领域概念及其关系的一种高效合理的展现形式.在构建领域本体过程中,常常遇到的问题就是尽管本体概念完备但概念间关系复杂多样导致人工标记关系代价过高.使用无监督学习的关系抽取算法对包含丰富的领域概念的web信息进行抽取解决了这一问题.然而,传统的无监督学习的算法没有考虑到"单样例多概念对"的问题,导致最终抽取的概念关系不完整.本文利用交通领域的Web信息构建本体,将样例概念关系对权重引入传统的无监督学习方法 Kmeans中,解决了此项问题并通过实验证明该算法取得了良好的效果.
引用
收藏
页码:273 / 276
页数:4
相关论文
共 2 条
[1]
Exploring syntactic structured features over parse trees for relation extraction using kernel methods.[J].Min Zhang;GuoDong Zhou;Aiti Aw.Information Processing and Management.2007, 2
[2]
交通大辞典.[M].《交通大辞典》编委会; 编.上海交通大学出版社.2005,