基于深度学习的渔业领域命名实体识别

被引:24
作者
孙娟娟
于红
冯艳红
彭松
程名
卢晓黎
董婉婷
崔榛
机构
[1] 大连海洋大学信息工程学院辽宁省海洋信息技术重点实验室
关键词
字向量; LSTM模型; CRF模型; 实体识别;
D O I
10.16535/j.cnki.dlhyxb.2018.02.020
中图分类号
TP181 [自动推理、机器学习]; TP391.1 [文字信息处理];
学科分类号
摘要
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。
引用
收藏
页码:265 / 269
页数:5
相关论文
共 10 条
[1]  
分布式表示与组合模型在中文自然语言处理中的应用.[D].温潇.东南大学.2016, 03
[2]  
基于规则和条件随机场的中文命名实体识别方法研究.[D].程志刚.华中师范大学.2015, 02
[3]  
基于维基百科的渔业知识库构建研究.[D].王兰.上海海洋大学.2014, 03
[4]  
基于规则的命名实体识别研究.[D].周昆.合肥工业大学.2010, 04
[5]   基于Bi-LSTM的医疗事件识别研究 [J].
侯伟涛 ;
姬东鸿 .
计算机应用研究, 2018, 35 (07) :1974-1977
[6]   基于CNN和LSTM混合模型的中文词性标注 [J].
谢逸 ;
饶文碧 ;
段鹏飞 ;
陈振东 .
武汉大学学报(理学版), 2017, 63 (03) :246-250
[7]   基于词向量和条件随机场的领域术语识别方法 [J].
冯艳红 ;
于红 ;
孙庚 ;
赵禹锦 .
计算机应用, 2016, 36 (11) :3146-3151
[8]   基于WEB的水产养殖病害诊断专家系统 [J].
阎笑彤 ;
徐翔 ;
郭显久 ;
孙凯乐 .
大连海洋大学学报, 2016, 31 (02) :225-230
[9]   基于深度神经网络的有色金属领域实体识别 [J].
毛存礼 ;
余正涛 ;
沈韬 ;
高盛祥 ;
郭剑毅 ;
线岩团 .
计算机研究与发展, 2015, 52 (11) :2451-2459
[10]   基于信息熵和词频分布变化的术语抽取研究 [J].
李丽双 ;
王意文 ;
黄德根 .
中文信息学报, 2015, (01) :82-87