基于文献的地质实体关系抽取方法研究

被引:11
作者
吕鹏飞 [1 ,2 ]
王春宁 [1 ]
朱月琴 [3 ,4 ]
机构
[1] 中国地质图书馆
[2] 中国科学院大学
[3] 中国地质调查局发展研究中心
[4] 国土资源部地质信息技术重点实验室
基金
国家重点研发计划;
关键词
文献; 关系抽取; 统计语言模型; Bootstrapping;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
实体关系抽取是信息抽取的一项重要内容,通过实体关系的抽取能够发现文本中的有价值信息。本文在分析和比较了有监督、无监督、弱监督以及开放式等关系抽取方法的原理和特点的基础上,建立了基于文献的地质实体关系抽取模型:采用统计语言模型作为关系抽取方式、采用Bootstrapping算法作为关系扩展方式。最后据此进行了关联关系发现和关系扩展发现实验。
引用
收藏
页码:167 / 172
页数:6
相关论文
共 7 条
[1]
无指导的中文开放式实体关系抽取 [J].
秦兵 ;
刘安安 ;
刘挺 .
计算机研究与发展, 2015, 52 (05) :1029-1035
[2]
基于Bootstrapping的因特网流量分类方法 [J].
刘珍 ;
王若愚 ;
刘琼 .
北京邮电大学学报 , 2014, (05) :66-70+79
[3]
基于机器学习的实体关系抽取方法 [J].
刘方驰 ;
钟志农 ;
雷霖 ;
吴烨 .
兵工自动化, 2013, 32 (09) :57-62
[4]
当前自然语言处理发展的几个特点 [J].
冯志伟 .
暨南大学华文学院学报, 2006, (01) :34-40
[5]
典型关系抽取系统的技术方法解析[J] 徐健;张智雄; 数字图书馆论坛 2008,
[6]
无监督的中文实体关系抽取研究 [D]. 
王晶 .
华东师范大学,
2012
[7]
数学之美[M] 吴军 人民邮电出版社 2014,