共 18 条
顾及通名语义的汉语地名相似度匹配算法
被引:34
作者:
程钢
[1
,2
,3
]
卢小平
[1
]
机构:
[1] 河南理工大学矿山空间信息技术国家测绘地理信息局重点实验室
[2] 河南理工大学测绘与国土信息工程学院
[3] 信息工程大学测绘与科学技术博士后流动站
来源:
关键词:
通名;
语义;
本体;
复合相似度;
地名匹配;
D O I:
10.13485/j.cnki.11-2089.2014.0060
中图分类号:
P208 [测绘数据库与信息系统];
TP391.1 [文字信息处理];
学科分类号:
070503 ;
081603 ;
0818 ;
081802 ;
081203 ;
0835 ;
摘要:
地名匹配是地理信息检索、多源地理空间数据集成及更新中的关键技术问题。本文根据规范汉语地名构词特点,依据地名通名与地名类型的关系,建立规范地名通名语义知识库,并将由其提供的地名语义作为地名相似度匹配的重要指标。针对基于字面和空间数据的地名匹配方法存在的不足,面向规范地名提出一种综合了地名专名字面相似度和地名通名语义相似度两种因素的复合相似度匹配算法模型。该模型模拟人的认知习惯,根据通名语义相似度程度,通过单调函数关系动态设置专名和通名相似度各自的权重值,利用动态加权方法求得复合地名相似度指标。在上述模型基础上,本文提出汉语地名匹配策略和流程,利用通名蕴含的语义增强汉语地名匹配算法的理论基础和完备性,提高了地名匹配算法准确率。试验结果表明该模型符合认知习惯,验证了该方法的合理性和有效性。
引用
收藏
页码:404 / 410+418
+418
页数:8
相关论文