融合BERT-WWM和指针网络的旅游知识图谱构建研究

被引:22
作者
徐春
李胜楠
机构
[1] 新疆财经大学信息管理学院
关键词
BERT-WWM; 指针网络; 旅游知识图谱; 关系重叠; 实体关系联合抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; F592 [中国旅游事业];
学科分类号
020205 [产业经济学]; 120506 [数字人文];
摘要
针对旅游信息呈现出散乱、无序和关联性不强的问题,提出一种融合BERT-WWM(BERT with whole word masking)和指针网络的实体关系联合抽取模型构建旅游知识图谱。借助BERT-WWM预训练语言模型从爬取的旅游评论中获得含有先验语义知识的句子编码。针对传统的实体关系抽取方法存在错误传播、实体冗余、交互缺失等问题,以及旅游评论中的实体关系存在一词多义、关系重叠等特征,提出直接对三元组建模,利用句子编码抽取头实体,根据关系类别抽取尾实体,并建立级联结构和指针网络解码输出三元组。基于Neo4j图数据库存储三元组构建旅游知识图谱。实验在建立的旅游数据集上进行,融合BERT-WWM与指针网络的实体关系联合抽取模型的准确率、召回率和F1值分别为93.42%、86.59%和89.88%,与现有模型相比三项指标均显示出优越性,验证了该方法进行实体关系联合抽取的有效性。构建的旅游知识图谱实现了旅游景区信息的整合与存储,对进一步促进旅游业发展具有一定的实际参考意义。
引用
收藏
页码:280 / 288
页数:9
相关论文
共 17 条
[1]
面向山西旅游的知识图谱构建方法研究 [D]. 
张诺 .
山西大学,
2021
[2]
以事件为中心的旅游知识图谱的构建与应用.[D].吴杰.北京邮电大学.2021, 01
[3]
智慧旅游知识图谱的自动化构建研究及应用.[D].陈荣祯.北京邮电大学.2021, 01
[4]
面向旅游服务的智能标注及知识图谱构建系统 [D]. 
曹明辉 .
北京邮电大学,
2020
[5]
内蒙古自治区旅游领域知识库构建及应用研究 [D]. 
韩凌洁 .
内蒙古大学,
2019
[6]
面向旅游的蒙汉双语知识图谱的研究与构建 [D]. 
耿雪来 .
内蒙古大学,
2019
[7]
Pre-Training with Whole Word Masking for Chinese BERT..[J].Yiming Cui;Wanxiang Che;Ting Liu 0001;Bing Qin 0001;Ziqing Yang;Shijin Wang;Guoping Hu.CoRR.2019,
[9]
结合BERT和BiSRU-AT的中文文本情感分类 [J].
黄泽民 ;
吴晓鸰 ;
吴迎岗 ;
凌捷 .
计算机工程与科学, 2021, 43 (09) :1668-1675
[10]
基于信息融合标注的实体及关系联合抽取方法 [J].
马建红 ;
魏字默 ;
陈亚萌 .
计算机应用与软件, 2021, 38 (07) :159-166