基于层次注意力网络模型的学术文本结构功能识别

被引:19
作者
秦成磊
章成志
机构
[1] 南京理工大学经济管理学院
关键词
学术文本结构功能识别; 层次注意力网络; IMRaD; 领域适应性分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
【目的】针对当前学术文本章节功能识别存在诸多不足的现状,提出使用层次注意力网络模型提升学术文本章节功能识别的效果。【方法】首先,构建能够捕获章节结构信息的不同粒度的层次注意力网络模型,对比分析使用不同文本特征向量的传统机器学习模型、Bert模型与层次注意力网络模型在PLoS的4种期刊规范数据集上的学术文本结构功能的识别结果以获取最佳模型;随后,使用最佳模型识别Atmospheric Chemistry and Physics(ACP,IF 5.6)期刊中章节标题命名缺乏规范且人工标注结构功能一致性较低的章节的结构功能,并提出使用参考文献分布相似、动词线索词分布相似评估识别结果;最后,对所构建的层次注意力网络模型的领域适应性进行分析。【结果】以Bi-LSTM+Attention为编码器的句子级层次注意力网络模型识别效果优于其他模型,Macro-F1值为0.866 1;存在领域适应问题,在差异较大的领域中模型识别性能下降明显,Macro-F1值最低为0.455 4。【局限】不能识别具有混合结构的章节的功能;模型中未考虑文章结构之间的逻辑关系。【结论】句子级层次注意力网络模型能够较好地识别章节的结构功能,引入学术文本结构信息能够丰富和拓展基于学术论文全文本相关研究的研究内容与范围。
引用
收藏
页码:26 / 42
页数:17
相关论文
共 16 条
[1]   多层次融合的学术文本结构功能识别研究 [J].
王佳敏 ;
陆伟 ;
刘家伟 ;
程齐凯 .
图书情报工作, 2019, 63 (13) :95-104
[2]   不同特征下的学术文本结构功能自动识别研究 [J].
王东波 ;
高瑞卿 ;
叶文豪 ;
周鑫 ;
朱丹浩 .
情报学报, 2018, (10) :997-1008
[3]   学术文本的结构功能识别——基于段落的识别 [J].
黄永 ;
陆伟 ;
程齐凯 ;
桂思思 .
情报学报, 2016, (05) :530-538
[4]   学术文本的结构功能识别——基于章节内容的识别 [J].
黄永 ;
陆伟 ;
程齐凯 .
情报学报, 2016, (03) :293-300
[5]   学术文本的结构功能识别——功能框架及基于章节标题的识别 [J].
陆伟 ;
黄永 ;
程齐凯 .
情报学报, 2014, (09) :979-985
[6]   The invariant distribution of references in scientific articles [J].
Bertin, Marc ;
Atanassova, Iana ;
Gingras, Yves ;
Lariviere, Vincent .
JOURNAL OF THE ASSOCIATION FOR INFORMATION SCIENCE AND TECHNOLOGY, 2016, 67 (01) :164-177
[7]   Where are citations located in the body of scientific articles? A study of the distributions of citation locations [J].
Hu, Zhigang ;
Chen, Chaomei ;
Liu, Zeyuan .
JOURNAL OF INFORMETRICS, 2013, 7 (04) :887-896
[8]   Interpreting TF-IDF term weights as making relevance decisions [J].
Wu, Ho Chung ;
Luk, Robert Wing Pong ;
Wong, Kam Fai ;
Kwok, Kui Lam .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2008, 26 (03)
[9]  
Zone analysis in biology articles as a basis for information extraction[J] . Yoko Mizuta,Anna Korhonen,Tony Mullen,Nigel Collier. International Journal of Medical Informatics . 2005 (6)
[10]  
Rhetorical structure of biochemistry research articles[J] . Budsaba Kanoksilapatham. English for Specific Purposes . 2004 (3)