共 9 条
地址要素识别机制的地名地址分词算法
被引:25
作者:
赵阳阳
王亮
仇阿根
机构:
[1] 中国测绘科学研究院
来源:
关键词:
中文分词;
地名地址分词;
未登录词识别;
分词词典;
D O I:
10.16251/j.cnki.1009-2307.2013.05.012
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。
引用
收藏
页码:74 / 76
页数:3
相关论文