学术探索
学术期刊
文章热点
数据分析
智能智评
立即登录
统计决策树下的城市地址集中文分词
被引:11
作者
:
应申
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学资源与环境科学学院
深圳市数字城市工程研究中心
国土资源部城市土地资源监测与仿真重点实验室
武汉大学资源与环境科学学院
应申
[
1
,
2
,
3
]
李威阳
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学资源与环境科学学院
武汉大学资源与环境科学学院
李威阳
[
1
]
贺彪
论文数:
0
引用数:
0
h-index:
0
机构:
深圳大学建筑与城市规划学院
深圳市数字城市工程研究中心
国土资源部城市土地资源监测与仿真重点实验室
武汉大学资源与环境科学学院
贺彪
[
4
,
2
,
3
]
王维
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学资源与环境科学学院
武汉大学资源与环境科学学院
王维
[
1
]
万远
论文数:
0
引用数:
0
h-index:
0
机构:
湖北师范大学城市与环境学院
武汉大学资源与环境科学学院
万远
[
5
]
机构
:
[1]
武汉大学资源与环境科学学院
[2]
深圳市数字城市工程研究中心
[3]
国土资源部城市土地资源监测与仿真重点实验室
[4]
深圳大学建筑与城市规划学院
[5]
湖北师范大学城市与环境学院
来源
:
武汉大学学报(信息科学版)
|
2019年
/ 44卷
/ 02期
基金
:
国家重点研发计划;
关键词
:
中文地址分词;
决策树;
地址要素;
地址集;
D O I
:
10.13203/j.whugis20170072
中图分类号
:
P208 [测绘数据库与信息系统];
学科分类号
:
070503 ;
081603 ;
0818 ;
081802 ;
摘要
:
不同于常规的需要依赖城市地址词典或规则库的地址分词模型,提出不依赖地址词典、基于海量地址数据挖掘的分词方法。该方法结合统计规律计算地址要素在地址数据集中的分布特征,挖掘地址数据中分词的后缀点和落差点,根据后缀点和落差点的相对位置关系构建统计决策树提取地址要素;并采用深圳市建筑物地址普查数据进行验证,形成对当前地址地名词典的有益补充。
引用
收藏
页码:302 / 309
页数:8
相关论文
共 11 条
[1]
基于条件随机场的中文地名识别方法
邬伦
论文数:
0
引用数:
0
h-index:
0
机构:
不详
邬伦
刘磊
论文数:
0
引用数:
0
h-index:
0
机构:
不详
刘磊
李浩然
论文数:
0
引用数:
0
h-index:
0
机构:
不详
李浩然
高勇
论文数:
0
引用数:
0
h-index:
0
机构:
不详
高勇
[J].
武汉大学学报(信息科学版) ,
2017,
(02)
: 150
-
156
[2]
国内主流在线地理编码服务质量评价
田沁
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
田沁
巩玥
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
巩玥
亢孟军
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
亢孟军
孟社宁
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学资源与环境科学学院
不详
孟社宁
杜清运
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
杜清运
[J].
武汉大学学报(信息科学版) ,
2016,
(10)
: 1351
-
1358
[3]
地址要素识别机制的地名地址分词算法
赵阳阳
论文数:
0
引用数:
0
h-index:
0
机构:
中国测绘科学研究院
赵阳阳
王亮
论文数:
0
引用数:
0
h-index:
0
机构:
中国测绘科学研究院
王亮
仇阿根
论文数:
0
引用数:
0
h-index:
0
机构:
中国测绘科学研究院
仇阿根
[J].
测绘科学,
2013,
38
(05)
: 74
-
76
[4]
一种基于规则的模糊中文地址分词匹配方法
论文数:
引用数:
h-index:
机构:
程昌秀
论文数:
引用数:
h-index:
机构:
于滨
[J].
地理与地理信息科学,
2011,
27
(03)
: 26
-
29
[5]
词典与统计相结合的中文分词算法研究
李宏波
论文数:
0
引用数:
0
h-index:
0
机构:
武汉理工大学计算机科学与技术学院
李宏波
[J].
武汉理工大学学报(信息与管理工程版),
2010,
32
(06)
: 907
-
909+913
[6]
中文文本的地名解析方法研究
唐旭日
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
唐旭日
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
陈小荷
张雪英
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学文学院
不详
张雪英
[J].
武汉大学学报(信息科学版) ,
2010,
(08)
: 930
-
935+982
[7]
北京市地理编码数据库的研究
李军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
李军
李琦
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
李琦
毛东军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
毛东军
郭玲玲
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
郭玲玲
不详
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
不详
[J].
计算机工程与应用 ,
2004,
(02)
: 1
-
3+6
[8]
基于语义分析的地址匹配研究[D]. 臧英斐.重庆交通大学. 2015
[9]
面向中文地址的分词引擎设计及实现[D]. 陈建英.中国科学院大学(工程管理与信息技术学院). 2015
[10]
基于规则的中文地址分词与匹配方法[D]. 谭侃侃.山东科技大学. 2011
←
1
2
→
共 11 条
[1]
基于条件随机场的中文地名识别方法
邬伦
论文数:
0
引用数:
0
h-index:
0
机构:
不详
邬伦
刘磊
论文数:
0
引用数:
0
h-index:
0
机构:
不详
刘磊
李浩然
论文数:
0
引用数:
0
h-index:
0
机构:
不详
李浩然
高勇
论文数:
0
引用数:
0
h-index:
0
机构:
不详
高勇
[J].
武汉大学学报(信息科学版) ,
2017,
(02)
: 150
-
156
[2]
国内主流在线地理编码服务质量评价
田沁
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
田沁
巩玥
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
巩玥
亢孟军
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
亢孟军
孟社宁
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学资源与环境科学学院
不详
孟社宁
杜清运
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
杜清运
[J].
武汉大学学报(信息科学版) ,
2016,
(10)
: 1351
-
1358
[3]
地址要素识别机制的地名地址分词算法
赵阳阳
论文数:
0
引用数:
0
h-index:
0
机构:
中国测绘科学研究院
赵阳阳
王亮
论文数:
0
引用数:
0
h-index:
0
机构:
中国测绘科学研究院
王亮
仇阿根
论文数:
0
引用数:
0
h-index:
0
机构:
中国测绘科学研究院
仇阿根
[J].
测绘科学,
2013,
38
(05)
: 74
-
76
[4]
一种基于规则的模糊中文地址分词匹配方法
论文数:
引用数:
h-index:
机构:
程昌秀
论文数:
引用数:
h-index:
机构:
于滨
[J].
地理与地理信息科学,
2011,
27
(03)
: 26
-
29
[5]
词典与统计相结合的中文分词算法研究
李宏波
论文数:
0
引用数:
0
h-index:
0
机构:
武汉理工大学计算机科学与技术学院
李宏波
[J].
武汉理工大学学报(信息与管理工程版),
2010,
32
(06)
: 907
-
909+913
[6]
中文文本的地名解析方法研究
唐旭日
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
唐旭日
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
陈小荷
张雪英
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学文学院
不详
张雪英
[J].
武汉大学学报(信息科学版) ,
2010,
(08)
: 930
-
935+982
[7]
北京市地理编码数据库的研究
李军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
李军
李琦
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
李琦
毛东军
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
毛东军
郭玲玲
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
郭玲玲
不详
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学数字地球工作室
不详
[J].
计算机工程与应用 ,
2004,
(02)
: 1
-
3+6
[8]
基于语义分析的地址匹配研究[D]. 臧英斐.重庆交通大学. 2015
[9]
面向中文地址的分词引擎设计及实现[D]. 陈建英.中国科学院大学(工程管理与信息技术学院). 2015
[10]
基于规则的中文地址分词与匹配方法[D]. 谭侃侃.山东科技大学. 2011
←
1
2
→