学术文献引文上下文自动识别研究

被引:20
作者
雷声伟 [1 ]
陈海华 [1 ]
黄永 [1 ]
陆伟 [1 ,2 ]
机构
[1] 武汉大学信息管理学院
[2] 武汉大学信息检索与知识挖掘研究所
关键词
引文上下文; 引文内容分析; 支持向量机; 条件随机场; 隐式上下文;
D O I
10.13266/j.issn.0252-3116.2016.17.012
中图分类号
G350 [情报学];
学科分类号
1205 ;
摘要
[目的 /意义]引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法 /过程]梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果 /结论]实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。
引用
收藏
页码:78 / 87
页数:10
相关论文
共 9 条
[1]   面向引用关系的引文内容标注框架研究 [J].
陆伟 ;
孟睿 ;
刘兴帮 .
中国图书馆学报, 2014, 40 (06) :93-104
[2]   引文上下文在文献内容分析中的信息价值研究 [J].
刘洋 ;
崔雷 .
图书情报工作 , 2014, (06) :101-104
[3]   基于序列标注模型的分层式依存句法分析方法 [J].
鉴萍 ;
宗成庆 .
中文信息学报, 2010, 24 (06) :14-22
[4]  
基于引文上下文分析的文献检索技术研究[D]. 张金松.大连海事大学 2013
[5]  
文本分类中文本表示模型和特征选择算法研究[D]. 杨杰明.吉林大学 2013
[6]  
基于引用内容的引文评价分析[A]. 刘盛博,丁堃.第九届中国科技政策与管理学术年会论文集[C]. 2013
[7]  
Towards multi-paper summarization using reference information. NANBA H,OKUMURA M. International Joint Conference on . 1999
[8]  
Identifying non-explicit citing sentences for citation-based summarization. Qazvinian, V,Radev, D. R. Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics . 2010
[9]  
http://opennlp.apache.org/to download Open NLP . 2016