基于远程监督的多因子人物关系抽取模型

被引:10
作者
黄杨琛 [1 ]
贾焰 [1 ]
甘亮 [1 ]
徐菁 [1 ]
黄九鸣 [1 ]
赫中翮 [2 ]
机构
[1] 国防科技大学计算机学院
[2] 湖南星汉数智科技有限公司知识图谱研发部
关键词
关系抽取; 人物关系; 远程监督; 机器学习; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对远程监督的基本假设过强容易引入噪声数据的问题,提出了一种可以对远程监督自动生成的训练数据去噪的人物实体关系抽取模型。在训练数据生成阶段,通过多示例学习的思想和基于TF-IDF的关系指示词发现的方法对远程监督产生的数据进行去噪处理,使训练数据达到人工标注质量。在模型分类器中,提出采用词法特征和句法特征相结合的多因子特征作为关系特征向量用于分类器的学习。在大规模真实数据集上的实验结果表明,所提模型结果优于同类型的关系抽取方法。
引用
收藏
页码:103 / 112
页数:10
相关论文
共 10 条
[1]   远程监督人物关系抽取中的去噪研究 [J].
黄蓓静 ;
贺樑 ;
杨静 .
计算机应用与软件, 2017, 34 (07) :11-18+31
[2]   基于标签传播和主动学习的人物社会关系抽取 [J].
刘锦文 ;
许静 ;
张利萍 ;
芮伟康 .
计算机工程, 2017, 43 (02) :234-240
[3]   实体关系抽取研究综述 [J].
刘绍毓 ;
李弼程 ;
郭志刚 ;
王波 ;
陈刚 .
信息工程大学学报, 2016, 17 (05) :541-547
[4]   无指导的中文开放式实体关系抽取 [J].
秦兵 ;
刘安安 ;
刘挺 .
计算机研究与发展, 2015, 52 (05) :1029-1035
[5]   利用中文在线资源的远程监督人物关系抽取 [J].
潘云 ;
布勒布丽汗·伊沙巴依 ;
杨静 ;
尹敏 .
小型微型计算机系统, 2015, 36 (04) :701-706
[6]   基于句法语义特征的中文实体关系抽取 [J].
郭喜跃 ;
何婷婷 ;
胡小华 ;
陈前军 .
中文信息学报, 2014, (06) :183-189
[7]   基于句法结构特征分析及分类技术的答案提取算法 [J].
胡宝顺 ;
王大玲 ;
于戈 ;
马婷 .
计算机学报, 2008, (04) :662-676
[8]   实体关系自动抽取 [J].
车万翔 ;
刘挺 ;
李生 .
中文信息学报, 2005, (02) :1-6
[9]  
实体关系自动抽取技术的比较研究[D]. 宁海燕.哈尔滨工业大学. 2010
[10]  
Constructing biological knowledge bases by extracting information from text sources .2 Craven M,Kumlien J. ISMB 1999 . 1999