基于词嵌入的地理知识库实体类别对齐方法研究

被引:3
作者
徐召华 [1 ]
诸云强 [2 ,3 ]
宋佳 [2 ,3 ]
孙凯 [2 ,4 ]
王曙 [2 ]
机构
[1] 山东理工大学建筑工程学院
[2] 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
[3] 江苏省地理信息资源开发与利用协同创新中心
[4] 中国科学院大学
基金
国家自然科学基金重点项目;
关键词
地理知识库; 语义异构; 地理实体; 实体类别; 类别对齐; 词嵌入; 词向量; 地理语料; 相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
地理知识库是地理实体及其相互间关系的集合,对于智能搜索、问答、推荐等知识服务有重要的支撑作用。然而,已有的地理知识库由于来源、形式、构建者等的不同,在实体地名、空间位置、类别等方面存在"同义异形"和"同形异义"的语义异构现象,影响了地理知识库间的知识融合与共享。语义对齐是解决语义异构的一种有效方法,其中实体类别对齐是语义对齐的基础,对于提高实体地名和空间位置的对齐精度具有重要作用。现有的实体类别对齐方法主要采用传统的字符相似度和结构相似度等来度量类别的相似度,无法捕捉实体类别深层次的语义相关性,从而影响了类别对齐的精确性。因此,本文提出了一种基于词嵌入的地理实体类别对齐方法,采用词嵌入模型从语料中学习实体类别的语义信息,并通过词向量来表达,以此弥补现有方法存在的缺失,进而提升实体对齐精度。进一步地,通过通用语料与地理信息语料的融合,本文实现了词嵌入模型所用语料在地理语义方面的增强,从而更精准地度量地理实体类别间的相关性。不同地理知识库实体类别对齐的实验表明,本文提出的方法能够有效捕捉地理实体类别的深层次语义信息,其实体类别对齐的调和平均值(F1)可达0.9568,有效提高了实体类别的对齐精度。
引用
收藏
页码:1372 / 1381
页数:10
相关论文
共 21 条
  • [1] 融合语义和结构信息的知识图谱实体对齐
    苏佳林
    王元卓
    靳小龙
    李曼玲
    程学旗
    [J]. 山西大学学报(自然科学版), 2019, 42 (01) : 23 - 30
  • [2] 地理实体分类与编码体系的构建
    闾国年
    俞肇元
    周良辰
    兰馨
    [J]. 现代测绘, 2019, 42 (01) : 1 - 6
  • [3] 一种基于词义和词频的向量空间模型改进方法
    邓晓衡
    杨子荣
    关培源
    [J]. 计算机应用研究, 2019, 36 (05) : 1390 - 1395
  • [4] 基于距离类别的多源兴趣点融合算法
    徐爽
    张谦
    李琰
    刘嘉勇
    [J]. 计算机应用, 2018, 38 (05) : 1334 - 1338
  • [5] 基于改进的Jaccard系数文档相似度计算方法
    俞婷婷
    徐彭娜
    江育娥
    林劼
    [J]. 计算机系统应用, 2017, 26 (12) : 137 - 142
  • [6] 一种面向中文本体模式的本体对齐框架
    王汀
    高迎
    刘经纬
    [J]. 数据分析与知识发现, 2017, (02) : 47 - 57
  • [7] 基于改进编辑距离的字符串相似度求解算法
    姜华
    韩安琪
    王美佳
    王峥
    吴雲玲
    [J]. 计算机工程, 2014, 40 (01) : 222 - 227
  • [8] 基于Jaccard距离与概念聚类的多模型估计
    于永彦
    [J]. 计算机工程, 2012, 38 (10) : 22 - 26
  • [9] 维基百科研究综述
    赵飞
    周涛
    张良
    马鸣卉
    刘金虎
    余飞
    查一龙
    李睿琪
    [J]. 电子科技大学学报, 2010, (03) : 321 - 334
  • [10] 地球系统科学数据共享研究与实践
    诸云强
    孙九林
    廖顺宝
    杨雅萍
    朱华忠
    王卷乐
    冯敏
    宋佳
    杜佳
    [J]. 地球信息科学学报, 2010, 12 (01) : 1 - 8