基于条件随机场的中文地址要素识别方法

被引:19
作者
蒋文明
张雪英
李伯秋
机构
[1] 不详
[2] 南京师范大学虚拟地理环境教育部重点实验室
[3] 不详
关键词
地址编码; 中文地址要素; 自然语言处理; 条件随机场;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
由于中文地址命名的不规范性和汉语语言特点,中文地址要素识别成为地址编码的关键技术。传统的特征字匹配和字典匹配方法,难以解决地址要素命名的多样性问题。借鉴自然语言处理技术,通过构建地址要素标注集,设计了基于条件随机场的中文地址要素识别方法。实验证明,与基于特征字的规则方法相比,基于条件随机场的方法能够在较大程度上提高识别效果。由于条件随机场模型具有较好的泛化能力,该方法具有更强的通用性,特别适宜于大规模地址数据的批量解析和大众化位置服务中地址编码的快速处理。
引用
收藏
页码:129 / 131
页数:3
相关论文
共 7 条
  • [1] 基于小规模尾字特征的中文命名实体识别研究
    冯元勇
    孙乐
    张大鲲
    李文波
    [J]. 电子学报, 2008, (09) : 1833 - 1838
  • [2] 地理信息系统地址编码技术标准化研究
    江洲
    李小林
    刘碧松
    [J]. 世界标准化与质量管理, 2007, (05) : 22 - 25
  • [3] 基于层叠条件随机场模型的中文机构名自动识别
    周俊生
    戴新宇
    尹存燕
    陈家骏
    [J]. 电子学报, 2006, (05) : 804 - 809
  • [4] 北京市地理编码数据库的研究
    李军
    李琦
    毛东军
    郭玲玲
    不详
    [J]. 计算机工程与应用 , 2004, (02) : 1 - 3+6
  • [5] 地理编码(Geocoding)的应用研究
    江洲
    李琦
    不详
    [J]. 地理与地理信息科学 , 2003, (03) : 22 - 25
  • [6] 中国古今地理通名汇释[M]. 黄山书社 , 崔恒昇编著, 2003
  • [7] From Text to Geographic Coordinates:The Current State of Geocoding .2 Goldberg D. W. URISA Journal . 2007