一种基于规则的模糊中文地址分词匹配方法

被引:47
作者
程昌秀
于滨
机构
[1] 中国科学院地理科学与资源研究所
关键词
地理编码; 模糊地址; 规则库; 地址分词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在研究分析地址模型的基础上,建立了存储标准地址数据集的标准地址库和自定义的地址匹配规则库,提出了一种基于规则的模糊中文地址编码方法。该方法在依据标准地址库分词的同时,也沿着自定义的地址匹配规则进行推理,从而缩小了下次分词所用到的目标数据集,提高了系统执行效率。另外,通过借助构建的规则树与歧义栈,提高了文中定义的两类模糊地址匹配的成功率。最后,基于该算法建立了一个地理编码原型系统,并利用经济普查项目中的相关数据对算法的可用性进行了验证。
引用
收藏
页码:26 / 29
页数:4
相关论文
共 7 条
[1]  
城市地理编码方法的探索与实践.[A].张铁燕;翁敬农;黄坚;.中国地理信息系统协会第九届年会.2005,
[2]  
基于分词的地址匹配技术.[A].孙亚夫;陈文斌;.中国地理信息系统协会第四次会员代表大会暨第十一届年会.2007,
[3]   在大城市实现有线电视用户地址标准化的设想 [J].
高巍 .
广播与电视技术, 2007, (10) :99-102
[4]   基于城市地址编码技术的探讨 [J].
张作华 ;
孙凌宇 .
井冈山师范学院学报, 2005, (03) :42-45
[5]   城市地理编码系统应用与研究 [J].
陈细谦 ;
迟忠先 ;
金妮 .
计算机工程, 2004, (23) :50-52
[6]   国内地理编码数据库系统开发与研究 [J].
王凌云 ;
李琦 ;
江洲 ;
不详 .
计算机工程与应用 , 2004, (21) :167-168+212
[7]   北京市地理编码数据库的研究 [J].
李军 ;
李琦 ;
毛东军 ;
郭玲玲 ;
不详 .
计算机工程与应用 , 2004, (02) :1-3+6