基于BERT模型的司法文书实体识别方法

被引:46
作者
陈剑
何涛
闻英友
马林涛
机构
[1] 东北大学计算机科学与工程学院/东软研究院
基金
国家重点研发计划; 中央高校基本科研业务费专项资金资助;
关键词
深度学习; 预训练模型; 双向长短时记忆网络; 条件随机场; 命名实体识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
采用手工分析案件卷宗,容易产生案件实体遗漏现象及提取特征效率低下问题.为此,使用基于双向训练Transformer的编码器表征预训练模型.在手工标注的语料库中微调模型参数,再由长短时记忆网络与条件随机场对前一层输出的语义编码进行解码,完成实体抽取.该预训练模型具有巨大的参数量、强大的特征提取能力和实体的多维语义表征等优势,可有效提升实体抽取效果.实验结果表明,本文提出的模型能实现89%以上的实体提取准确度,显著优于传统的循环神经网络和卷积神经网络模型.
引用
收藏
页码:1382 / 1387
页数:6
相关论文
共 5 条
[1]
知识图谱数据管理研究综述 [J].
王鑫 ;
邹磊 ;
王朝坤 ;
彭鹏 ;
冯志勇 .
软件学报, 2019, 30 (07) :2139-2174
[2]
基于BLSTM的命名实体识别方法 [J].
冯艳红 ;
于红 ;
孙庚 ;
孙娟娟 .
计算机科学, 2018, 45 (02) :261-268
[3]
基于句法语义特征的中文实体关系抽取 [J].
甘丽新 ;
万常选 ;
刘德喜 ;
钟青 ;
江腾蛟 .
计算机研究与发展, 2016, (02) :284-302
[4]
基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[5]
基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报, 2006, (02) :87-94