地理编码系统中地名地址分词算法研究

被引:18
作者
张林曼
吴升
机构
[1] 福州大学福建省空间信息工程研究中心,空间数据挖掘与信息共享教育部重点实验室
关键词
GIS; 地理编码; 中文分词; 地名;
D O I
10.16251/j.cnki.1009-2307.2010.02.057
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
对中文分词有关技术进行分析和研究,结合地理编码的特点,设计了基于双字哈希和数组的三层组合分词词典数据结构,以及逐次增字的最大正向分词算法。并通过构建和遍历地名通名词典,识别地名地址中未登录词。测试表明,本文算法速度和效果较好,解决了地理信息系统中中文分词的相关问题。
引用
收藏
页码:46 / 48
页数:3
相关论文
共 9 条
  • [1] 我国地理信息标准化政策研究
    蒋景曈
    刘若梅
    姜作勤
    曾澜
    陈倬
    [J]. 测绘科学, 2008, (01) : 21 - 24+245
  • [2] 一种中文分词词典新机制——四字哈希机制
    张培颖
    李村合
    [J]. 微型电脑应用, 2006, (10) : 35 - 36+55+66
  • [3] 汉语自动分词的研究现状与困难
    张春霞
    郝天永
    [J]. 系统仿真学报, 2005, (01) : 138 - 143+147
  • [4] 汉语自动分词研究展望
    文庭孝
    邱均平
    侯经川
    [J]. 现代图书情报技术, 2004, (07) : 6 - 10
  • [5] 一种中文分词词典新机制——双字哈希机制
    李庆虎
    陈玉健
    孙家广
    [J]. 中文信息学报, 2003, (04) : 13 - 18
  • [6] 地理编码(Geocoding)的应用研究
    江洲
    李琦
    不详
    [J]. 地理与地理信息科学 , 2003, (03) : 22 - 25
  • [7] 自动分词技术及其在信息检索中应用的研究
    黄崑
    符绍宏
    [J]. 现代图书情报技术, 2001, (03) : 26 - 29
  • [8] 基于Hash结构的机械统计分词系统[D]. 杨彦.中南大学. 2005
  • [9] British Standard 7666 as a framework for geocoding land and property information the UK[J] . M. Morad.Computers, Environment and Urban Systems . 2002 (5)