一种基于Bootstrapping的本体学习方法

被引:7
作者
张俊 [1 ]
高志强 [1 ]
徐惠 [2 ]
蔡施彦 [1 ]
戴云徽 [3 ]
机构
[1] 东南大学计算机科学与工程学院
[2] 东南大学软件学院
[3] 南京理工大学经济管理学院
关键词
信息抽取; 本体学习; 自扩展;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
提出了一种基于自扩展的本体学习方法用于获取领域术语.该方法只需提供少量种子术语和一个未标注语料库作为输入,由种子术语开始学习抽取模式,再由学习到的模式发现新的术语,进一步由新发现的术语学习新的抽取模式,如此循环迭代.实验结果表明,该算法能够产生较高质量的领域术语集合和抽取模式集合,这样的集合可用于相关领域的信息抽取.
引用
收藏
页码:56 / 58
页数:3
相关论文
共 1 条
[1]
An empirical study of automated dictionary construction for information extraction in three domains.[J].Ellen Riloff.Artificial Intelligence.1996, 1