基于有向图模型的旅游领域命名实体识别

被引:17
作者
崔丽平 [1 ,2 ,3 ]
古丽拉阿东别克 [1 ,2 ,3 ]
王智悦 [1 ]
机构
[1] 新疆大学信息科学与工程学院
[2] 新疆多语种信息技术重点实验室
[3] 国家语言资源监测与研究少数民族语言中心哈萨克和柯尔克孜语文基地
关键词
知识图谱; 命名实体识别; 卷积神经网络; 图神经网络; 条件随机场;
D O I
10.19678/j.issn.1000-3428.0060062
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
旅游领域命名实体识别是旅游知识图谱构建过程中的关键步骤,与通用领域的实体相比,旅游文本的实体具有长度长、一词多义、嵌套严重的特点,导致命名实体识别准确率低。提出一种融合词典信息的有向图神经网络(L-CGNN)模型,用于旅游领域中的命名实体识别。将预训练词向量通过卷积神经网络提取丰富的字特征,利用词典构造句子的有向图,以生成邻接矩阵并融合字词信息,通过将包含局部特征的词向量和邻接矩阵输入图神经网络(GNN)中,提取全局语义信息,并引入条件随机场(CRF)得到最优的标签序列。实验结果表明,相比Lattice LSTM、ID-CNN+CRF、CRF等模型,L-CGNN模型在旅游和简历数据集上具有较高的识别准确率,其F1值分别达到86.86%和95.02%。
引用
收藏
页码:306 / 313
页数:8
相关论文
共 12 条
[1]
Deep learning with word embeddings improves biomedical named entity recognition [J].
Habibi, Maryam ;
Weber, Leon ;
Neves, Mariana ;
Wiegandt, David Luis ;
Leser, Ulf .
BIOINFORMATICS, 2017, 33 (14) :I37-I48
[2]
tmChem: a high performance approach for chemical named entity recognition and normalization [J].
Leaman, Robert ;
Wei, Chih-Hsuan ;
Lu, Zhiyong .
JOURNAL OF CHEMINFORMATICS, 2015, 7
[3]
Gated Graph Sequence Neural Networks..[J].Yujia Li;Daniel Tarlow;Marc Brockschmidt;Richard S. Zemel.CoRR.2015,
[4]
Hungarian named entity recognition with a maximum entropy approach [J].
Varga, Daniel ;
Simon, Eszter .
ACTA CYBERNETICA, 2007, 18 (02) :293-301
[5]
Framewise phoneme classification with bidirectional LSTM and other neural network architectures [J].
Graves, A ;
Schmidhuber, J .
NEURAL NETWORKS, 2005, 18 (5-6) :602-610
[6]
Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[7]
基于笔画ELMo和多任务学习的中文电子病历命名实体识别研究 [J].
罗凌 ;
杨志豪 ;
宋雅文 ;
李楠 ;
林鸿飞 .
计算机学报, 2020, 43 (10) :1943-1957
[8]
用于社交媒体的中文命名实体识别 [J].
李源 ;
马磊 ;
邵党国 ;
袁梅宇 ;
张名芳 .
中文信息学报, 2020, (08) :61-69
[9]
基于卷积神经网络的中文景点识别研究 [J].
刘小安 ;
彭涛 .
计算机工程与应用 , 2020, (04) :140-145
[10]
先秦古汉语典籍中的人名自动识别研究 [J].
汤亚芬 .
现代图书情报技术 , 2013, (Z1) :63-68