学术文本词汇功能识别——基于BERT向量化表示的关键词自动分类研究

被引:52
作者
陆伟 [1 ,2 ]
李鹏程 [1 ,2 ]
张国标 [1 ,2 ]
程齐凯 [1 ,2 ]
机构
[1] 武汉大学信息管理学院
[2] 武汉大学信息检索与知识挖掘研究所
关键词
学术文本; 关键词; 语义功能识别; 深度学习;
D O I
暂无
中图分类号
G254.1 [分类法]; TP391.1 [文字信息处理];
学科分类号
1205 ; 120501 ; 081203 ; 0835 ;
摘要
关键词作为学术文本中映射全文主题内容的词汇或术语,能够为知识精准检索和文本大规模计算提供重要的底层语义标签。当前学术文本中的关键词存在使用意图不明、语义功能模糊及上下文信息缺失等问题。为此,本文提出了一种基于有监督学习的神经网络方法,对关键词所承载的语义功能进行分类,实现对学术文本中研究问题和研究方法的识别。本文以计算机等领域为期10年的学术期刊论文为训练语料,利用BERT及LSTM方法构建分类模型,实验结果显示,本文所提出的方法较传统更优,其整体准确率、召回率和F1值分别达到0.83、0.87和0.85。
引用
收藏
页码:1320 / 1329
页数:10
相关论文
共 14 条
[1]   基于深度学习的文本中细粒度知识元抽取方法研究 [J].
余丽 ;
钱力 ;
付常雷 ;
赵华茗 .
数据分析与知识发现, 2019, (01) :38-45
[2]   理论术语抽取的深度学习模型及自训练算法研究 [J].
赵洪 ;
王芳 .
情报学报, 2018, (09) :923-938
[3]   命名实体识别研究综述 [J].
刘浏 ;
王东波 .
情报学报, 2018, 37 (03) :329-340
[5]   科技论文的研究设计指纹自动识别方法构建与实现 [J].
钱力 ;
张晓林 ;
王茜 .
图书情报工作, 2018, 62 (02) :135-143
[6]   基于词汇功能识别的科研文献分析系统设计与实现 [J].
李信 ;
程齐凯 ;
刘兴帮 .
图书情报工作, 2017, (01) :109-116
[7]   基于条件随机场的学术期刊中理论的自动识别方法 [J].
陈锋 ;
翟羽佳 ;
王芳 .
图书情报工作, 2016, 60 (02) :122-128
[8]   针对中文学术文献的情报方法术语抽取 [J].
化柏林 .
现代图书情报技术, 2013, (06) :68-75
[9]   知识元语义链接模型研究 [J].
温有奎 ;
焦玉英 .
图书情报工作 , 2010, (12) :27-31
[10]   基于最大熵分类器的语义角色标注 [J].
刘挺 ;
车万翔 ;
李生 .
软件学报, 2007, (03) :565-573