开放信息抽取技术的现状研究

被引:3
作者
刘振 [1 ,2 ,3 ]
张智雄 [1 ]
机构
[1] 中国科学院文献情报中心
[2] 徐州工程学院
[3] 中国科学院大学
关键词
开放信息抽取; 无监督抽取; 关系短语; 论元抽取; 语义角色标注; 开放语言学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
如何高效地自动理解网络上出现的海量文本信息,日益成为了个严峻的考验。美国华盛顿大学图灵中心提出的开放信息抽取,是一个有效的解决方法。它具有领域的独立性,无监督抽取,对大量文本的可伸缩性等特点。该论文首先介绍了开放信息抽取系统的主要功能,然后详细论述了三个主要的开放信息抽取系统的特点、组成部分以及优缺点,接着分析了开放信息抽取系统的改进方法和发展趋势。最后对未来进行展望。
引用
收藏
页码:145 / 148+186 +186
页数:5
相关论文
共 8 条
[1]  
Open information extraction:The second generation. Etzioni O,Fader A,Christensen J, et al. Proceedings of the Twenty-Second international joint conference on Artificial Intelligence . 2011
[2]  
Wanderlust:Extracting Semantic Relations from Natural Language Text Using Dependency Grammar Patterns. Alan Akbik,Jurgen Bro. 1st Workshop on Semantic Search at 18th.WWWW Conference . 2009
[3]  
Open Language Learning for Information Extraction. Mausam,Michael Schmitz,Robert Bart,Stephen Soderland,Oren Etzioni. https://homes.cs.washington.edu/-mausam/papers/emnlp12a.pdf .
[4]  
KRAKEN:N-ary Facts in Open Information Extraction. Alan Akbik,Alexander Lser. http://www.aclweb.org/anthology/W/W12/W12-30.pdf#page=62 .
[5]  
Open Information Extraction Using Wikipedia. F Wu,Weld D S. . 2010
[6]  
Open Information Extraction Using Wikipedia. Fei Wu,Daniel S Weld. Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics . 2010
[7]  
Identifying Relations for Open Information Extraction. Anthony Fader,Stephen Soderland,Oren Etzioni. Proceedings of the Conference of Empirical Methods in Natural Language Processing . 2011
[8]  
Open Information Extraction from the Web. Michele Banko,Michael J Cafarella,Stephen Soderl,Matt Broadhead,Oren Etzioni. Proceedings of Conference on Arti_cial Intelligence . 2007