基于Bert-BiLSTM-CRF的中医文本命名实体识别

被引:11
作者
屈倩倩
阚红星
机构
[1] 安徽中医药大学医药信息工程学院
关键词
命名实体识别; Bert; BiLSTM; CRF;
D O I
10.14022/j.issn1674-6236.2021.19.008
中图分类号
R2-03 [中医现代化研究]; TP391.1 [文字信息处理];
学科分类号
100602 ;
摘要
命名实体识别是中医智能化发展的基石。针对中医文本数据挖掘中实体识别困难的问题,构建了基于Bert-BiLSTM-CRF的命名实体识别模型。通过Bert模型在字向量的构建过程中融入注意力机制,利用BiLSTM进行特征提取,并将特征输入CRF模型之中完成最终的训练。实验选取《伤寒论》作为训练集以及测试集,划分症状、疾病名称、方剂、中药名、时间5类实体。测试集上的结果表明,该模型的准确率为96.94%,召回率为93.14%,F值为95%,命名实体识别精度较高,可以将该模型用于实际问题中。
引用
收藏
页码:40 / 43+48 +48
页数:5
相关论文
共 16 条