学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于有限状态机的中文地址标准化方法
被引:29
作者
:
论文数:
引用数:
h-index:
机构:
罗明
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
黄海量
[
1
,
2
]
机构
:
[1]
上海财经大学信息管理与工程学院
[2]
上海财经大学上海市金融信息技术研究重点实验室
来源
:
计算机应用研究
|
2016年
/ 33卷
/ 12期
关键词
:
中文地址;
地址编码;
地址标准化;
地址分级模型;
地址匹配;
有限状态机;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
由于中文的内涵多义性和形式多样性的特点,使中文地址长期以来存在着难以标准化的问题,对进一步开展地址定位、区域网格分析和社情、舆情定位等工作都造成了较大的障碍。针对这个问题提出了基于地址分级模型和有限状态机驱动的新方法,并通过软件开发对这种方法的地址识别率和匹配准确率进行了验证,实验结果显示该方法对中文地址能够达到96%左右的识别率,匹配准确率也达到了85%左右,并且还能实现标准地址库的自动化更新。因此,采取该方法能够有效地解决中文地址标准化困难的问题,具有显著的实用性和研究参考价值。
引用
收藏
页码:3691 / 3695
页数:5
相关论文
共 13 条
[1]
基于分词的地址匹配技术.[A].孙亚夫;陈文斌;.中国地理信息系统协会第四次会员代表大会暨第十一届年会.2007,
[2]
地址树模型的中文地址提取方法
[J].
论文数:
引用数:
h-index:
机构:
亢孟军
;
论文数:
引用数:
h-index:
机构:
杜清运
;
论文数:
引用数:
h-index:
机构:
王明军
.
测绘学报,
2015,
44
(01)
:99
-107
[3]
基于哈希和双数组trie树的多层次地址匹配算法
[J].
论文数:
引用数:
h-index:
机构:
徐聪
;
论文数:
引用数:
h-index:
机构:
张丰
;
论文数:
引用数:
h-index:
机构:
杜震洪
;
论文数:
引用数:
h-index:
机构:
张逸然
;
论文数:
引用数:
h-index:
机构:
陈明
;
论文数:
引用数:
h-index:
机构:
刘仁义
.
浙江大学学报(理学版),
2014,
41
(02)
:217
-222
[4]
Semantic Role Labeling of Chinese Nominal Predicates with Dependency-Driven Constituent Parse Tree Structure
[J].
论文数:
引用数:
h-index:
机构:
Wang, Hong-Ling
;
论文数:
引用数:
h-index:
机构:
Zhou, Guo-Dong
.
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY,
2013,
28
(06)
:1117
-1126
[5]
自然语言理解的中文地址匹配算法
[J].
宋子辉
论文数:
0
引用数:
0
h-index:
0
机构:
遥感国家重点实验室中国科学院遥感与数字地球应用研究所
宋子辉
.
遥感学报,
2013,
17
(04)
:788
-801
[6]
基于有限状态机和Trie数的分级地址模型
[J].
论文数:
引用数:
h-index:
机构:
张倩
;
论文数:
引用数:
h-index:
机构:
郭嗣琮
.
计算机应用,
2013,
33
(03)
:854
-857
[7]
面向全国经济普查需求的专家系统地理编码方法
[J].
论文数:
引用数:
h-index:
机构:
于滨
;
程昌秀
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院地理科学与资源研究所
中南大学信息物理工程学院
程昌秀
;
论文数:
引用数:
h-index:
机构:
左廷英
.
计算机应用研究,
2010,
27
(08)
:2976
-2979
[8]
基于分级地名库的中文地理编码
[J].
论文数:
引用数:
h-index:
机构:
孙存群
;
论文数:
引用数:
h-index:
机构:
周顺平
;
论文数:
引用数:
h-index:
机构:
杨林
.
计算机应用,
2010,
30
(07)
:1953
-1955+1958
[9]
地址编码关键技术——地址数据内容规范研究
[J].
佟文会
论文数:
0
引用数:
0
h-index:
0
机构:
中国标准化研究院
佟文会
;
江洲
论文数:
0
引用数:
0
h-index:
0
机构:
中国标准化研究院
江洲
;
李小林
论文数:
0
引用数:
0
h-index:
0
机构:
中国标准化研究院
李小林
.
标准科学,
2009,
(11)
:39
-42
[10]
基于Hash结构的逆向最大匹配分词算法的改进
[J].
论文数:
引用数:
h-index:
机构:
丁振国
;
张卓
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学计算机学院
张卓
;
黎靖
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学计算机学院
黎靖
.
计算机工程与设计,
2008,
(12)
:3208
-3211+3265
←
1
2
→
共 13 条
[1]
基于分词的地址匹配技术.[A].孙亚夫;陈文斌;.中国地理信息系统协会第四次会员代表大会暨第十一届年会.2007,
[2]
地址树模型的中文地址提取方法
[J].
论文数:
引用数:
h-index:
机构:
亢孟军
;
论文数:
引用数:
h-index:
机构:
杜清运
;
论文数:
引用数:
h-index:
机构:
王明军
.
测绘学报,
2015,
44
(01)
:99
-107
[3]
基于哈希和双数组trie树的多层次地址匹配算法
[J].
论文数:
引用数:
h-index:
机构:
徐聪
;
论文数:
引用数:
h-index:
机构:
张丰
;
论文数:
引用数:
h-index:
机构:
杜震洪
;
论文数:
引用数:
h-index:
机构:
张逸然
;
论文数:
引用数:
h-index:
机构:
陈明
;
论文数:
引用数:
h-index:
机构:
刘仁义
.
浙江大学学报(理学版),
2014,
41
(02)
:217
-222
[4]
Semantic Role Labeling of Chinese Nominal Predicates with Dependency-Driven Constituent Parse Tree Structure
[J].
论文数:
引用数:
h-index:
机构:
Wang, Hong-Ling
;
论文数:
引用数:
h-index:
机构:
Zhou, Guo-Dong
.
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY,
2013,
28
(06)
:1117
-1126
[5]
自然语言理解的中文地址匹配算法
[J].
宋子辉
论文数:
0
引用数:
0
h-index:
0
机构:
遥感国家重点实验室中国科学院遥感与数字地球应用研究所
宋子辉
.
遥感学报,
2013,
17
(04)
:788
-801
[6]
基于有限状态机和Trie数的分级地址模型
[J].
论文数:
引用数:
h-index:
机构:
张倩
;
论文数:
引用数:
h-index:
机构:
郭嗣琮
.
计算机应用,
2013,
33
(03)
:854
-857
[7]
面向全国经济普查需求的专家系统地理编码方法
[J].
论文数:
引用数:
h-index:
机构:
于滨
;
程昌秀
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院地理科学与资源研究所
中南大学信息物理工程学院
程昌秀
;
论文数:
引用数:
h-index:
机构:
左廷英
.
计算机应用研究,
2010,
27
(08)
:2976
-2979
[8]
基于分级地名库的中文地理编码
[J].
论文数:
引用数:
h-index:
机构:
孙存群
;
论文数:
引用数:
h-index:
机构:
周顺平
;
论文数:
引用数:
h-index:
机构:
杨林
.
计算机应用,
2010,
30
(07)
:1953
-1955+1958
[9]
地址编码关键技术——地址数据内容规范研究
[J].
佟文会
论文数:
0
引用数:
0
h-index:
0
机构:
中国标准化研究院
佟文会
;
江洲
论文数:
0
引用数:
0
h-index:
0
机构:
中国标准化研究院
江洲
;
李小林
论文数:
0
引用数:
0
h-index:
0
机构:
中国标准化研究院
李小林
.
标准科学,
2009,
(11)
:39
-42
[10]
基于Hash结构的逆向最大匹配分词算法的改进
[J].
论文数:
引用数:
h-index:
机构:
丁振国
;
张卓
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学计算机学院
张卓
;
黎靖
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学计算机学院
黎靖
.
计算机工程与设计,
2008,
(12)
:3208
-3211+3265
←
1
2
→