深度学习的中文地址切分算法

被引:7
作者
李一 [1 ,2 ]
刘纪平 [2 ]
罗安 [2 ]
机构
[1] 兰州交通大学
[2] 中国测绘科学研究院
关键词
中文分词; Bigram二分法; 深度学习; 地址要素;
D O I
10.16251/j.cnki.1009-2307.2018.10.017
中图分类号
TP391.1 [文字信息处理]; TP181 [自动推理、机器学习];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
针对传统分词对词典依赖过高的问题,该文提出了一种基于深度学习的中文地址要素的切分与重组算法。首先利用二元语法(Bigram)二分法将地址切分,然后用网络兴趣点(POI)数据地址集作为样本,采用基于深度学习的方法对地址要素进行特征匹配与要素重组,最终实现以地址要素为单元的中文地址自动切分。本文采用上万条网络采集的POI地址数据作为实验样本,实验结果表明,该算法不仅降低了对词典的依赖,同时也对地名地址的切分正确率有较大提升。
引用
收藏
页码:107 / 111
页数:5
相关论文
共 16 条
[1]  
基于统计规则的中文分词研究.[D].兰冲.西安电子科技大学.2011, 07
[2]  
面向自然语言处理的深度学习研究.[J].奚雪峰;周国栋;.自动化学报.2016, 10
[3]   基于深度学习的网页分类算法研究 [J].
陈芊希 ;
范磊 .
微型电脑应用, 2016, 32 (02) :25-28
[4]   一种基于Bigram二级哈希的中文索引结构 [J].
孙德才 ;
王晓霞 .
电子设计工程, 2014, (12) :1-4
[5]   基于表示学习的中文分词算法探索 [J].
来斯惟 ;
徐立恒 ;
陈玉博 ;
刘康 ;
赵军 .
中文信息学报 , 2013, (05) :8-14
[6]   地址要素识别机制的地名地址分词算法 [J].
赵阳阳 ;
王亮 ;
仇阿根 .
测绘科学, 2013, 38 (05) :74-76
[7]   一种基于规则的模糊中文地址分词匹配方法 [J].
程昌秀 ;
于滨 .
地理与地理信息科学, 2011, 27 (03) :26-29
[8]   词典与统计相结合的中文分词算法研究 [J].
李宏波 .
武汉理工大学学报(信息与管理工程版), 2010, 32 (06) :907-909+913
[9]   基于双层哈希表的中文分词算法优化 [J].
习明 ;
王增辉 ;
庄怡 .
软件导刊, 2010, 9 (10) :54-55
[10]   基于规则的中文地址要素解析方法 [J].
张雪英 ;
闾国年 ;
李伯秋 ;
陈文君 .
地球信息科学学报, 2010, (01) :9-16