基于通用知识库的地理实体开放关系过滤方法

被引:6
作者
高嘉良 [1 ,2 ]
余丽 [3 ]
仇培元 [1 ]
陆锋 [1 ,2 ,4 ]
机构
[1] 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
[2] 中国科学院大学
[3] 中国科学院文献情报中心
[4] 江苏省地理信息资源开发与利用协同创新中心
基金
国家自然科学基金重点项目;
关键词
文本数据; 地理实体关系抽取; 地理知识图谱构建; 通用知识库; 开放关系抽取; 地理信息质量评价; 信息过滤;
D O I
暂无
中图分类号
P208 [测绘数据库与信息系统]; TP391.1 [文字信息处理];
学科分类号
070503 ; 081603 ; 0818 ; 081802 ;
摘要
文本数据为地理知识服务提供了海量资源。面向文本数据的地理实体关系抽取是地理知识图谱构建的核心技术,直接影响地理知识推理与服务的质量。由于文本数据不可避免地含有噪声,从文本中抽取的地理实体关系需要质量评价和信息过滤。本文提出一种基于通用知识库的地理实体关系过滤方法,针对已抽取的地理实体关系从中筛选出高质量的结果:先利用"本体知识"、"事实知识"和"同义词知识"构建地理关系知识库,作为信息过滤的参照数据;再基于分布式向量表示模型度量已抽取的地理实体关系与参照数据之间的语义相似性,以提高地理知识图谱的丰度与鲜度。实验结果表明,相比业界流行的"Stanford OpenIE"工具,本文所提出的方法可将置信度区间[0, 0.2]和[0.8, 1]的MSE(Mean Square Error)从59.27%降至3.94%,AUC(Area Under the ROC Curve)从0.51提升至0.89。
引用
收藏
页码:1392 / 1401
页数:10
相关论文
共 12 条
  • [1] 论地理知识图谱
    陆锋
    余丽
    仇培元
    [J]. 地球信息科学学报, 2017, 19 (06) : 723 - 734
  • [2] 知识图谱技术综述
    徐增林
    盛泳潘
    贺丽荣
    王雅芳
    [J]. 电子科技大学学报, 2016, 45 (04) : 589 - 606
  • [3] 网络文本蕴涵地理信息抽取:研究进展与展望
    余丽
    陆锋
    张恒才
    [J]. 地球信息科学学报, 2015, 17 (02) : 127 - 134
  • [4] 微博信息可信度分析研究综述
    蒋盛益
    陈东沂
    庞观松
    吴美玲
    王连喜
    [J]. 图书情报工作, 2013, (12) : 136 - 142
  • [5] A Credibility Analysis System for Assessing Information on Twitter
    Alrubaian, Majed
    Al-Qurishi, Muhammad
    Hassan, Mohammad Mehedi
    Alamri, Atif
    [J]. IEEE TRANSACTIONS ON DEPENDABLE AND SECURE COMPUTING, 2018, 15 (04) : 661 - 674
  • [6] Exploring inter-country connection in mass media: A case study of China[J] . Yihong Yuan,Yu Liu,Guixing Wei.Computers, Environment and Urban Systems . 2017
  • [7] A Survey on Truth Discovery[J] . Yaliang Li,Jing Gao,Chuishi Meng,Qi Li,Lu Su,Bo Zhao,Wei Fan,Jiawei Han.ACM SIGKDD Explorations Newsletter . 2016 (2)
  • [8] Vague cognitive regions in geography and geographic information science
    Montello, Daniel R.
    Friedman, Alinda
    Phillips, Daniel W.
    [J]. INTERNATIONAL JOURNAL OF GEOGRAPHICAL INFORMATION SCIENCE, 2014, 28 (09) : 1802 - 1820
  • [9] Link prediction in complex networks: A survey[J] . Linyuan Lü,Tao Zhou.Physica A: Statistical Mechanics and its Applications . 2010 (6)
  • [10] The design and implementation of SPIRIT: a spatially aware search engine for information retrieval on the Internet[J] . Ross S. Purves,Paul Clough,Christopher B. Jones,Avi Arampatzis,Benedicte Bucher,David Finch,Gaihua Fu,Hideo Joho,Awase Khirni Syed,Subodh Vaid,Bisheng Yang.International Journal of Geographical Information Science . 2007 (7)