利用中文在线资源的远程监督人物关系抽取

被引:13
作者
潘云
布勒布丽汗·伊沙巴依
杨静
尹敏
机构
[1] 华东师范大学计算机科学技术系
关键词
人物关系抽取; 远程监督; 人物关系知识库; 标签传播算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
人物关系抽取是信息抽取研究中的一个重要领域,针对需要预先定义人物关系类型的不足,提出一种利用中文在线资源的远程监督人物关系抽取方法.该方法首先利用Web上已经通过半人工化方式形成的在线百科网站自动构建知识库,以获取尽可能全面且准确的关系类型及其人物关系实例.接着提取语料库中所有共现的人名对以及上下文特征,并将人名对与知识库中关系实例相互匹配,得到标记关系的人名对集合和未标记的人名对集合.最后,引入标签传播算法实现未标记人名对的关系匹配.在Sogou C、sohu和baidu语料库上进行实验,结果表明该方法能够充分利用在线百科中丰富的关系类型,并且都可获得近70%的准确率.
引用
收藏
页码:701 / 706
页数:6
相关论文
共 4 条
[1]   一种基于Web的大规模人物社会关系提取方法 [J].
姚从磊 ;
邸楠 .
模式识别与人工智能, 2007, 20 (06) :740-744
[2]  
新闻网页中人物实体关系提取技术研究.[D].邹永强.国防科学技术大学.2011, 07
[3]  
无监督关系抽取方法研究.[D].张志田.哈尔滨工业大学.2007, 03
[4]  
Research on relation extraction of person entity in new s w ebpage..Zhou Yong-qiang;.National University of Defense Technology.2011,