面向文本命名实体识别的深层网络模型

被引:10
作者
李慧林 [1 ]
柴玉梅 [1 ]
孙穆祯 [2 ]
机构
[1] 郑州大学信息工程学院
[2] 华中科技大学公共管理学院
关键词
命名实体识别; 神经网络; 条件随机场; 数据挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本命名实体识别是信息抽取和预测的基本与关键任务,提出基于深层网络模型的命名实体识别方法,构建多种学习模型.首先对文本进行清洗并规范化,生成基本结构和表示方法,结合边界特征构建深层条件随机场模型,选择最优特征集训练.将文本表示为词向量形式,以向量作为深层神经网络的输入进行模型的训练,提出了基于块表示的BR-BiRNN、BR-BiLSTM-CRF命名实体识别深层网络模型,在I2B2 2006年和2014年评测数据集及妇产科真实医疗文本上实验,结果均比传统的SVM、HM M、CRF的F值高.
引用
收藏
页码:50 / 57
页数:8
相关论文
共 6 条
[1]   融合迁移学习的中文命名实体识别 [J].
王红斌 ;
沈强 ;
线岩团 .
小型微型计算机系统, 2017, 38 (02) :346-351
[2]   中文电子病历命名实体和实体关系语料库构建 [J].
杨锦锋 ;
关毅 ;
何彬 ;
曲春燕 ;
于秋滨 ;
刘雅欣 ;
赵永杰 .
软件学报, 2016, 27 (11) :2725-2746
[3]   基于词表示方法的生物医学命名实体识别 [J].
李丽双 ;
何红磊 ;
刘珊珊 ;
黄德根 .
小型微型计算机系统, 2016, 37 (02) :302-307
[4]  
Hidden Markov model using Dirichlet process for de-identification.[J].Tao Chen;Richard M. Cullen;Marshall Godwin.Journal of Biomedical Informatics.2015, S
[5]  
Automatic de-identification of electronic medical records using token-level and character-level conditional random fields.[J].Zengjian Liu;Yangxin Chen;Buzhou Tang;Xiaolong Wang;Qingcai Chen;Haodi Li;Jingfeng Wang;Qiwen Deng;Suisong Zhu.Journal of Biomedical Informatics.2015, S
[6]   De-identification of health records using Anonym: Effectiveness and robustness across datasets [J].
Zuccon, Guido ;
Kotzur, Daniel ;
Nguyen, Anthony ;
Bergheim, Anton .
ARTIFICIAL INTELLIGENCE IN MEDICINE, 2014, 61 (03) :145-151