基于BiLSTM-CRF的商情实体识别模型

被引:39
作者
张应成 [1 ]
杨洋 [2 ]
蒋瑞 [3 ,4 ]
全兵 [5 ]
张利君 [3 ]
任晓雷 [6 ]
机构
[1] 四川大学计算机学院
[2] 四川省计算机研究院
[3] 成都瑞贝英特信息技术有限公司
[4] 四川智仟科技有限公司
[5] 中移(苏州)软件技术有限公司
[6] 四川黑马数码科技有限公司
关键词
条件随机场; 双向长短时记忆网络; 语言模型; 命名实体识别; 深度学习;
D O I
10.19678/j.issn.1000-3428.0052810
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
摘要
结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的前向、后向文本特征,并通过CRF提取出双向本文特征中相应的实体。实验结果表明,与传统机器学习算法CRF相比,该模型3类实体的精确率、召回率和F1值平均提升15.21%、12.06%和13.70%。
引用
收藏
页码:308 / 314
页数:7
相关论文
共 5 条
[1]  
Minimal Gated Unit for Recurrent Neural Networks[J]. Guo-Bing Zhou,Jianxin Wu,Chen-Lin Zhang,Zhi-Hua Zhou.International Journal of Automation and Computing. 2016(03)
[2]   大数据分析的无限深度神经网络方法 [J].
张蕾 ;
章毅 .
计算机研究与发展, 2016, (01) :68-79
[3]   Modeling and solving the mixed capacitated general routing problem [J].
Bosco, Adamo ;
Lagana, Demetrio ;
Musmanno, Roberto ;
Vocaturo, Francesca .
OPTIMIZATION LETTERS, 2013, 7 (07) :1451-1469
[4]  
Framewise phoneme classification with bidirectional LSTM and other neural network architectures[J] . Alex Graves,Jürgen Schmidhuber.Neural Networks . 2005 (5)
[5]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780