基于种子自扩展的命名实体关系抽取方法

被引:24
作者
何婷婷
徐超
李晶
赵君喆
机构
[1] 华中师范大学计算机科学与技术系
关键词
命名实体; 关系抽取; 自学习;
D O I
暂无
中图分类号
TP182 [专家系统、知识工程];
学科分类号
1111 ;
摘要
命名实体间关系的抽取是信息抽取中的一个重要研究问题,该文提出了一种从大量的文本集合中自动抽取命名实体间关系的方法,找出了所有出现在同一句子内、词语之间的距离在一定范围之内的命名实体对,把它们的上下文转化成向量。手工选取少量具有抽取关系的命名实体对,把它们作为初始关系的种子集合,通过自学习,关系种子集合不断扩展。通过计算命名实体对和关系种子之间的上下文相似度来得到所要抽取的命名实体对。通过扩展关系种子集合的方法,抽取的召回率和准确率都得到了提高。该方法在对《人民日报》语料库的测试中,取得了加权平均值F-Score为0.813的效果。
引用
收藏
页码:183 / 184+193 +193
页数:3
相关论文
共 2 条
[1]  
统计自然语言处理基础.[M].(美)ChristopherD.Manning;(德)HinrichSchutze著;苑春法等译;.电子工业出版社.2005,
[2]   基于向量空间模型中义项词语的无导词义消歧 [J].
鲁松 ;
白硕 ;
黄雄 .
软件学报, 2002, (06) :1082-1089