基于网络文本迁移学习的旅游知识图谱构建

被引:3
作者
高嘉良 [1 ,2 ]
陆锋 [1 ,2 ,3 ,4 ]
彭澎 [1 ]
徐阳 [1 ,2 ]
机构
[1] 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
[2] 中国科学院大学资源与环境学院
[3] 政务大数据应用省部共建协同创新中心
[4] 江苏省地理信息资源开发与利用协同创新中心
关键词
知识图谱; 旅游管理; 网络文本挖掘; 迁移学习;
D O I
10.13203/j.whugis20220120
中图分类号
F590 [旅游经济理论与方法]; TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
在线旅游服务模式和海量网络文本的出现为旅游产业规划和用户出游推荐提供了新的信息支撑。然而实时更新的网络文本语义模糊、信噪比低,难以利用,由此,提出了一种基于领域本体和迁移学习的旅游知识图谱构建方法。首先,基于行业规范定义了旅游景点特征体系,建立了以旅游景点为核心的旅游知识图谱,支持景点语义特征的全方位刻画;然后,通过迁移学习方法将预训练语言模型改造为定制化知识抽取器,从网络文本中获取知识三元组,并融合游客足迹、兴趣点语义等信息将分散的相关信息整合为系统性的旅游景点知识图谱。知识抽取实验结果表明,相较于常用的LDA(latent Dirichlet allocation)模型,定制化知识抽取器获取的景点语义知识,其精度与完整性分别提升了50.7%和670%。所构建的旅游景点知识图谱可全面表达现实中的旅游场景,支撑不同尺度下游客行为与市场需求的深入解析,为旅游目的地可持续发展规划提供决策支持。
引用
收藏
页码:1191 / 1200+1219 +1219
页数:11
相关论文
共 23 条